OSCAR开源产业大会 | 专访联通软研院王晓峰:开源治理的“道术法器”

通信行业作为建设数字中国的中坚力量,始终站在新兴技术的一线。在开源技术盛行的当下,通信行业积极投入开源生态建设,但同时也面临开源软件选型、开源安全漏洞修复、开源生态建设等痛点问题。

中国联通作为央企国家队、通信行业的排头兵,在开源技术的研究与开发上已深入多年。目前,中国联通内核技术全部基于社区主流的开源技术,开源技术组件涉及300余种,沉淀了大量的开源技术经验。

中国联通软件研究院(以下简称“联通软研院”)作为中国联通IT技术研发的核心力量,承担了中国联通BSS、MSS、DSS以及联通云PaaS能力的研发、生产与运营,在服务中国联通大IT建设历程中,也走过了从开源软件使用、到自研再到开源治理的道路。

在今年的 OSCAR 开源产业大会中,我们也有幸邀请到了中国联通软件研究院的专家与大家深入探讨开源治理的话题。王晓峰是中国联通软件研究院公共平台与架构研发事业部副总经理,负责中国联通数字化研发平台、数字化底座联通云PaaS、中间件、数据库、信创及企业架构规划,以及中国联通IT系统架构建设及运营。

在会前,我们特别采访了王晓峰老师,为大家剧透他即将在 OSCAR 2022 开源产业大会上带来的精彩演讲。

访谈者:薛凌峰 科技云报道记者受访者:王晓峰 中国联通软件研究院,公共平台与架构研发事业部副总经理

1、能否介绍一下中国联通使用开源技术的情况?
自联通软研院成立以来,从CB1.0到CB2.0上线,从启动云化架构到全面云原生架构,经历了7年多的时间,持续构建平台化、生态化、全栈云平台——联通云,支撑中国联通1300多个生产业务系统。中国联通始终坚持“自主+开源+商用”原则,成立技术团队,坚持开源技术的研究与开发。中国联通内核技术全部基于社区主流的开源技术,技术组件应用广,涉及300余种,开源组件占比最大,例如:K8s、Ceph、Contiv、Istio、Redis、Kafka等。在开源技术不能满足需求的时候,联通软研院也会自主研发一些内核的技术,服务于IT生产建设。

联通软研院在大量引入开源软件的过程中,为中国联通IT建设确确实实带来很多技术红利,解决了很多技术难题,节约了大量成本。

2、联通软研院为什么会进行开源治理?
联通软研院在使用开源软件过程中,存在各个系统开源软件使用不一、复杂多样,在某些领域存在较大比例的同质性产品,同一技术软件版本众多等问题。另外,多数开源软件缺少专业团队提供运维支撑,而且从集中系统发生的多起故障原因分析发现,由开源软件直接或间接引发的故障占比较高。为此,为避免联通软研院各事业部、中心及分院项目团队使用开源软件因技术、管理、运维、安全等问题所导致的各项风险,从2021年开始,联通软研院启动了开源治理的工作,以实现中国联通大IT系统一体化建设、集中管控和可持续发展目标。

3、联通软件研究院遇到过哪些开源风险?
首先,由于之前对开源软件使用缺少有效管控,联通软研院遇到的最大问题是运维和技术风险突出。开源软件的使用与管理分散在各个项目团队,运维投入大,对于开源软件随选随用的碎片化使用方式,难以形成技术和研发合力,不满足核心技术自主掌控的能力要求。其次,内部引入的开源软件难以统计,管理难度大,传统的软件管理方式也已经不适应开源软件的管理和使用要求。

最后,在联通内部生产系统已形成规模化使用的开源软件(例如MeSOS、CentOS)面临社区停更、新技术转型、生产系统改造等各种风险。

4、针对以上开源风险,中国联通采用了哪些开源治理的方法?
为解决在引入开源软件后面临的各种风险,联通软研院围绕“道术法器”构建了一套解决方案体系:所谓“道”,即我们的治理愿景,是通过一系列工作,最终实现提质降本、助力安全生产的统一技术栈治理目标。

所谓“术”,是我们采用自上而下、自下而上两套路径来推动全院的治理工作落地。自上而下是指,从数字化部到院领导高层,对于开源治理的工作高度重视,多次研讨开源治理、供应链安全等平台级战略。自下而上是指,通过适当的管理手段,各产品线对开源软件的风险意识较强,能够在生产活动中主动规避开源软件风险、合理、合规的使用,为产品带来价值。

所谓“法”,是我们组建了统一技术栈运营团队,成立了技术专家团队、运保支撑团队、产品研发及支撑团队、安全团队、法务团队,并建立了一套相对完善的、适用于联通软研院的治理流程,并通过管理办法打通治理流程、盘活各个团队。

所谓“器”,是我们构建了企业级的开源治理平台、院级的软件物料清单,引入了证书以及安全的检测能力等等,通过基础能力的建设,助力治理工作的有效实施落地。

5、在开源软件技术选型中,您认为有哪些重要的考量因素?
联通软研院承担了全集团的众多关键系统,系统的稳定性成为联通向客户提供优质服务的重要因素。因此,在开源软件技术选型阶段,我们建议结合开源软件自身状态考虑以下几种因素:首先,需要考虑开源软件当前版本及版本间的兼容性、开源及商业支持情况、已知的问题以及有无解决方案、开源软件的功能性能及稳定性是否满足应用需求、与已使用同类产品的对比、纳入运营支撑体系的API、生产案例及应用效果等。

其次,需要考虑企业内部现有人员对该开源技术的掌握程度,例如:是否具备部署和功能使用,配置优化、源代码的掌握情况,能否二次开发、按需改造等。

最后,需要考虑企业内部现有人员对技术的支撑能力及规模。

6、您认为开源治理的挑战有哪些?对此,中国联通是如何应对的?
企业开源治理的痛点主要有以下三点:第一,企业在开源软件或组件出现漏洞时,无法快速定位到漏洞组件的影响范围,并及时止损,禁止漏洞组件下载。

针对此类问题,中国联通会从两个角度入手应对:一是,针对不同的生产区域安全需求,设置相应的网络隔离及安全策略,保障生产及办公区域的网络安全,同时禁止非法用户访问内部网络,保证开源软件不被攻击。二是,安全管理部门一旦发现漏洞,会在联通内部及时发布漏洞信息及相关补丁,督促全院各项目团队、个人自主排查并完成服务端及客户端的漏洞整改工作。

第二,企业不清楚各个项目中使用了多少开源软件和开源组件。

针对此类问题,从去年开始,联通软研院就开启了开源治理工作,并对全院IT系统技术栈(含自主、开源、商用)使用情况,进来了多轮调研与梳理,形成联通软研院IT系统技术栈清单,发布技术栈短名单,为联通软研院开源治理提供基础数据。

考虑到各项目团队自主上报的软件可能存在遗漏,在项目全生命周期关键环节,联通软研院有效规范开源软件使用、技术支撑与运维支撑,避免各项目组因随意使用开源软件、开源组件为业务系统带来未知的风险。

在项目立项阶段,加强对项目的技术架构评审。在开发阶段,通过代码依赖扫描工具,掌握各代码工程引入的开源软件或开源组件。在上线实施阶段,由支撑团队支撑项目进行软件的安装部署与调优,进一步确定各项目团队对开源软件的使用情况。

第三,企业存量系统引入了大量的开源软件。

针对此类问题,考虑到生产系统的稳定性及改造成本,联通软研院明确了高风险技术栈“应替尽替”,中低风险技术栈“能替快替”治理原则,并结合各项目的实际情况,为项目团队提供相应的解决方案,并由各项目团队制定整改计划,确保生产系统的安全平稳过渡。

7、作为央企国家队,中国联通在采用开源技术的过程中,和其他企业有什么不同?
中国联通在开源技术引进、软件使用等方面,和业界各友商差不多,也是先以商业组件为主,后来逐步采用开源软件,再后来逐步引入大量开源软件,并从开源软件中获得了不少红利。与其他企业不同的是,中国联通采取集约化IT集中建设,业务系统全国集中,全国各省分子公司共用一套系统,因此对系统架构设计合理性、业务承载能力要求非常高,对开源软件的功能、性能要求也就非常高。

为满足大IT系统建设需求,对引入的核心开源软件,中国联通自有人员须具备二次研发与自主掌控的能力,并对开源软件缺失的一些企业特性能力进行补齐增强。

为此,中国联通组织自有人员学习研究开源软件源码,结合系统需求进行二次开发与性能优化,补齐开源软件缺失的一些企业特性,补强开源软件相关性能,同时将新增企业特性回馈开源社区。在此期间,中国联通从中培养了一批开源技术人才,目前对生产系统在用的核心开源软件具备了自主掌控、自主维护与支撑的能力。

同样,为弥补自身的短板,开拓视野,中国联通与华为、阿里、百度、中电子、易华录、Alluxio等成立联合创新实验室,实现平台化多边合作,信创产业协同推进。同时,积极加入开源社区,包括:CNCF社区、OpenGauss欧拉社区、Mesosphere社区、OpenAnolis龙晰社区、Alluxio社区,也积极向开源社区贡献代码。

作为央企国家队,中国联通在IT系统建设与运营过程中,坚决贯彻落实党中央十九届五中全会“科技创新、自立自强”要求,超前布局、坚定不移,自主+合作、开源+商用相结合,坚持核心能力自主掌控,深耕开源软件底层代码,从实践中不断沉淀总结、自强卓越、开放合作,是央企数字化转型的最佳实践。

8、中国联通在开源治理工作上取得了哪些工作成果?
首先,在联通软研院内部建立开源治理组织保障机制,包括决策团队、专家团队、运营团队、专业团队、法务团队及安全团队,为开源软件治理工作奠定基础。其次,完成全院IT系统技术栈使用情况摸底调研与梳理,形成联通软研院IT系统技术栈清单,发布了统一技术栈治理管理办法及短名单,发布统一架构治理规范、软件应用规范,为软研院统一架构治理、开源软件引入与退出、使用与协作提供内部法理依据。

再次,完成开源治理软件管理平台建设,实现全院IT系统技术栈“一点管理”、“一点看全”。建立统一技术栈运营治理机制,对统一技术栈治理情况及问题进行定期通报。

通过上述工作,联通软研院目前已经对9大类36个软件进行集约化、专业化的支撑能力。对于更多的开源软件,联通软研院秉持自主掌控、开放合作的态度,积极寻求外部合作伙伴,补齐补强相关开源软件的技术支撑能力。

9、结合中国联通开源治理的过程,有哪些经验或方法论可以分享?
开源是一把双刃剑,用得好可以很好地服务生产,用得不好会影响生产系统的运行安全。要想用好开源软件,必先进行开源治理。开源治理是一个系统化工程,不单是通过某一项技术或者一个简单流程就可以快速有效完成。从中国联通治理实践上来看,做好开源治理工作需从以下几个方面入手:

第一,组建治理团队。企业要有相应的开源治理及运营管理团队。

第二,制定制度规范。从项目的全生命周期关注开源治理,建立配套的开源软件管理制度及架构治理规范,对开源软件的引入、使用、更新、退出的全流程管理提出明确规定,形成完备的规范模式,统一管理。

第三,规划治理目标。开源治理工作要结合系统实际情况,而非一刀切或一蹴而就,对新建系统及存量系统要区别对待,制定不同的治理目标。

第四,深耕开源技术。企业想用好开源技术,还需要对开源技术进行深入研究分析,了解开源技术自身状态、开源技术生命力、开源技术如何与现有技术结合、现有人员对开源技术的掌握程度及支撑能力等等。

最后,开源文化建设。要倡导企业开源文化建设,开源取之于开源组织,回报于开源组织,企业通过交流、互动、开放代码等方式建设开源文化,也会更好进行开源治理。

10、中国联通和中国信通院(可信开源)都建立了哪些合作?
中国联通与中国信通院保持着长期的合作关系,积极参与中国信通院标准的制定与评审,加强联通研发过程标准化的建设与管理,双方主要合作内容包括:在产业共建方面,中国联通作为软件供应链安全实验室(3S-LAB)、数据库应用创新实验室、零信任实验室的重要成员,积极参与行业平台建设与推广。

在产业研究方面,中国联通积极参加企业数字化转型IOMM-TEL伙伴(推进)计划、企业级DevOps赋能(共促)计划、数字化治理方阵、产业白皮书及数据安全生产运营等。

在标准制定方面,中国联通在DevOps、AIOps、大数据、人工智能等领域,协同中国信通院完成相关标准制定。

在评估认证方面,中国联通还通过了中国信通院组织的IOMM数字化成熟度、可信云、微服务、服务网格、容器解决方案、可信云安全、开源治理能力成熟度、AIOps能力成熟度模型、数据管理能力成熟度评估模型、DevOps能力成熟度模型等各种能力成熟度评估认证。

据悉,在今年的 OSCAR 2022 开源产业大会“通信开源论坛”上,王晓峰老师还将为大家带来主题演讲《中国联通统一技术栈治理经验分享》。他将结合中国联通IT系统建设历程中开源软件使用的现状及痛点,分享中国联通统一技术栈的治理经验。在采访的最后,王晓峰老师也向广大开源爱好者发出邀请:千行百业,可信开源,欢迎大家参加“2022 OSCAR源产业大会”,共话开源,推动开源技术在千行百业的融合发展!

 

为您推荐