【专访阿里云】云智融合转型期,国产服务器操作系统路在何方? 原创
编者按:近日,由开放原子开源基金会指导,龙蜥社区主办,阿里云、浪潮信息、Arm、Intel、中兴通讯、统信软件等 24 家理事单位共同承办的,主题为“云智融合·共筑未来”的 2023 龙蜥操作系统大会圆满结束。大会期间,InfoQ 采访了龙蜥社区理事长单位阿里云基础软件部产品总监张鹏程与阿里云操作系统专家贾正华,探讨了阿里云与龙蜥社区作为国产服务器操作系统的核心阵容之一,如何借助云智融合机遇推动国产力量发展,未来将有哪些长远规划等主题。本文转载自 InfoQ,以下为采访全文:
纵观当下 IT 产业局面,云与 AI 已经成为产业升级的两大公认核心驱动力,尤其是生成式 AI 快速席卷整个行业后,将云计算与 AI 技术融合来激发业务创新的理念也很快得到了普遍认可。服务器操作系统作为云和 AI 的底层基础设施关键软件,在这场变革中所扮演的角色是非常重要的。云服务厂商与 AI 应用开发者都对服务器操作系统提出了很多新的需求,这些需求推动操作系统领域技术不断推进,使整个服务器操作系统行业逐渐步入 2.0 时代。
在云智融合转型趋势引领服务器操作系统迭代升级的时期,近年来发展势头欣欣向荣的国产服务器操作系统社区该如何应对?怎样把握时机,解决挑战,突破用户固有认知,从而实现快速崛起,并为云智融合时代构筑行业所需的软件基础平台?在近日召开的首届龙蜥操作系统大会期间,InfoQ 采访了龙蜥社区理事长单位阿里云基础软件部产品总监张鹏程与阿里云操作系统专家贾正华,探讨了阿里云与龙蜥社区作为国产服务器操作系统的核心阵容之一,如何借助云智融合机遇推动国产力量发展,未来将有哪些长远规划等主题。
从 Alibaba Cloud Linux 到 Anolis OS,龙蜥社区的起源与现状
早在 2009 年,阿里云已经开始自行研发服务器操作系统用于内部业务。经过多年研发和实践,阿里云的内部操作系统逐渐走向成熟,而云端用户也开始对这款操作系统有了一定需求,因此 2017 年,阿里云将其正式开源,向阿里云用户开放使用,这就是 Alibaba Cloud Linux(简称 ALinux)。
2020 年,面对国产化生态发展的大趋势,阿里云联合多家理事单位共同建设了龙蜥社区,龙蜥社区的建立恰逢其时的在 CentOS 停服过程中发挥了关键作用。根据中国信息通信研究院面向用户群体的调研显示,龙蜥操作系统位列用户意愿迁移系统之首,比例超过半数达到 53%。龙蜥社区初期阿里云将 ALinux 操作系统积累的技术和经验大量投入龙蜥社区,使龙蜥社区在 2021 年初就发布了社区的第一代操作系统,名为 Anolis OS。Anolis OS 是一款主要面向多样化场景需求,能够为社区成员提供基础平台,能够满足云智融合需求的新型操作系统。相比之下,ALinux 以服务阿里云和阿里云用户为目标,主要负责释放阿里云上软硬件协同优势和服务能力,而 Anolis OS 则是龙蜥社区内开源项目的载体,承载着社区内多样化技术创新的孵化任务。
当然,ALinux 与 Anolis OS 是互相学习、共同进步发展的。ALinux 的许多技术创新,经过实践认可与成熟后会经由阿里云贡献到龙蜥社区,而龙蜥社区各成员为 Anolis OS 所做的各种改进和功能,ALinux 也会选择吸收,为自身注入新的活力。
ALinux 与龙蜥社区和 Anolis OS 的关系,代表了国产服务器操作系统的一条非常典型的发展路径:拥有较强技术实力的厂商在自身实践中开发出水平较高的操作系统并开源,之后牵头发起新的系统生态社区,并将自有系统的成熟技术注入社区形成原动力,吸引和聚合产业力量共同投入社区的开源项目,助力社区生态走向繁荣。这条路径的优势在于,阿里云这样的厂商在过往的实践中积累了大量生产经验,尤其在淘宝双十一这样的超大流量场景中对自有系统做了充分历练,其运维稳定性、可靠性、安全性都可以满足极高的要求。这些高水平的技术成果输出到新成立的开源服务器操作系统社区后,后者就能够站在很高的平台上起步,大大缩减了新品生态早期发展的周期,也更容易吸引不同领域的佼佼者加入社区作出贡献。
正是因为有了来自 ALinux 输出的,较为充足的技术储备,Anolis OS 在短时间内就具备了足够的能力应对服务器操作系统领域的转型挑战。随着云计算与 AI 融合的脚步临近,龙蜥社区开始运筹帷幄,努力将 Anolis OS 打造为引领变革的先锋力量。
云智融合,云计算产业的第三次浪潮
在云计算技术诞生初期,很多行业中很早就开始在互联网上面向公众提供服务的企业自然而然地开始使用云服务,他们的需求造就了云计算产业的第一次浪潮,这一阶段云计算的行业增长主要是由互联网企业带动的。随着云计算技术逐渐成熟,一批传统企业也开始基于信息技术发展成果开始了对企业的信息化升级过程,开启数字化转型,并引发了云计算产业的第二次浪潮。而今天,生成式 AI 技术的飞速发展又对云计算行业起到了极大的推动作用,使行业即将迎来第三次大跨越。
从服务器操作系统的角度来看,云计算的发展过程中,操作系统一直扮演着向下释放底层硬件能力,向上支撑更多软件和业务生态的角色。如今,随着生成式 AI 技术的崛起,服务器操作系统需要向上更好地支撑 AI 应用发挥作用,向下则需要更好地利用超大规模的计算能力来为 AI 提供资源。而在面向开发者和用户的角度上,服务器操作系统也要帮助他们更好地利用云端 AI 能力。
但是,生成式 AI 技术对算力资源的庞大需求和需求增长的高速度,意味着服务器操作系统要面对一项前所未有的挑战,那就是操作系统需要很好地应对通用计算与异构计算共存的硬件局面,同时能够充分适应异构计算能力高速增长和多样化发展的状态,为大幅膨胀的算力资源做好优化适配工作。另一方面,生成式 AI 所需要的庞大数据量,结合超大的算力规模,都对操作系统的安全性、稳定性提出了极高的要求。
在这样的背景下,龙蜥社区恰恰有着非常大的天生优势。由于 Anolis OS 的起步动力源自 ALinux,而后者又是经过阿里云多年的大规模云端服务经历磨炼而成,Anolis OS 就天然具备了解决超大规模算力资源挑战的能力,无论是软件优化工作还是安全、稳定性保障都得心应手。另外 ALinux 当前正在构建 AI 优化容器镜像为用户提供开箱即用的 AI 运行环境,以解决当前 AI 场景下客户面临的南北向生态兼容性问题和性能优化诉求,未来也会将其中打磨的镜像发布平台、性能优化技术、生态兼容能力贡献到龙蜥社区。在此基础上,龙蜥社区的理事单位与社区成员又为 Anolis OS 贡献了大量核心技术,使 Anolis OS 从一开始就集成了许多 AI 软件栈能力。例如,英特尔公司作为龙蜥社区理事单位,就帮助 Anolis OS 很早适配了英特尔第四代可扩展至强处理器的 AMX 加速引擎特性,大大提升了上层 AI 应用的推理性能。
凭借这些优势,Anolis OS 就成为服务器操作系统领域最容易适应云智融合转型的系统品牌之一,龙蜥社区也成为服务器操作系统步入 2.0 时代后,社区活跃度与创新能力均排在行业前列的系统生态。
对于国产服务器操作系统产业来说,龙蜥社区牢牢把握住云智融合这一历史机遇,也为国产生态步入世界前列打下了良好基础。虽然与国外相比,国产操作系统生态普遍起步晚、能力弱、技术不足,但龙蜥社区今天正在迎头赶上,充分利用来自各行业的优秀技术成果来提升水平,助力国产系统向着全球领先的地位不断迈进。当然,龙蜥社区能够形成这样的健康发展模式,其公平、开放、包容的社区氛围同样是非常重要的。在这种氛围下,龙蜥社区也为未来的长期发展描绘了一幅多彩画卷。
基于公平开放原则,龙蜥社区走上发展快车道
今天的龙蜥社区拥有 24 家理事单位,来自芯片、服务器组件、操作系统、云服务等各个领域,而所有理事单位的话语权都是平等公正的。每一家理事单位都可以站在自身视角上提出产业发展需求,并在一个透明的平台下公开讨论,经过这样的持续讨论,龙蜥社区就有了统一、具有延续性的发展路线。与此同时,社区也在不断扩大合作伙伴规模,吸纳更多成员加入社区。很多社区伙伴还会基于 Anolis OS 推出自己的操作系统衍生版本,到目前为止已经有 12 个版本面世。这些版本保持了对龙蜥生态的兼容性,同时各自有自己擅长的行业和场景。衍生版之间也会形成良性竞争关系,使社区在健康的状态下脚踏实地向前进步。
面向开发者,龙蜥社区与很多高校有着密切合作,会频繁组织各领域的 MeetUp 活动,并同头部厂商联合发起技术培训计划,龙蜥社区内部还提供了诸如龙蜥实验室这样的基础设施环境。所有这些方面的投入,都是为了让高校、产业单位乃至个人的开发者群体能够使用龙蜥社区系统,参与系统演进过程,将这些有贡献能力的群体凝聚起来。
龙蜥社区的技术委员会与运营委员会则形成了一套稳定的治理框架,对重点运营决策、产品决策、生态决策发起定期开放讨论,确保在最兼顾所有成员利益的前提下达成一致。这一治理机制中,顶层是社区理事会,中层是多个领域的委员会,分别负责社区的重大决策讨论与细分领域的技术方向讨论。由于治理框架整体高度透明,加之社区对外部引入的企业成员持高度开放态度,龙蜥社区就能够保障每一位成员的利益,尽可能建立社区成员的广泛共识。
虽然阿里云是龙蜥社区的发起单位,但阿里云自身在社区 24 家理事单位中也只有一票投票权。这样以来,即便社区最终决策与阿里云的最初期望有所偏差或冲突,社区成员也能获得对伙伴利益最大化的决策,避免一家独大的状况产生。
展望未来,龙蜥社区将始终坚持三个大方向。首先是解决国内服务器操作系统的供应链安全问题,为国内构建更加健壮的操作系统供应链,不断提升社区生态的健壮性。其次是进一步加强自主替代方向的研发和技术落地,推动自主替代进程早日完成目标。最后一点,龙蜥社区将深刻把握云智融合带来的机遇,凭借云智融合场景开发的创新技术帮助用户构建差异化竞争力。
龙蜥社区与国际化接轨的动作也从未停止。一方面,社区对国内外的合作伙伴与社区成员一视同仁,不会对国外企业的加入持歧视态度;另一方面,社区成员也会积极参与国际上游社区的技术演进过程,在这些社区中争取更多话语权和影响力。
目前,龙蜥社区虽然建立只有短短数年,但已经获得了广泛的用户,建立起了比较成熟的生态环境,社区开发者群体规模增速高达 110%,社区创新力和活跃度国内首屈一指,成立近 60 个特别兴趣小组,拉取请求数月均 5000 余次。社区每两年发布一个社区版本,合作伙伴的衍生版本则服务了超过 80 万用户。
当下,龙蜥社区已经驶上了发展的快车道,又恰逢云智融合的东风,社区前景被广泛看好。龙蜥社区的成功也为国产服务器操作系统的发展作出了表率,证明国产系统即便起步落后,也能凭借开放、公平、合作共赢的生态环境迅速追赶上来,成为全球产业的后起之秀。随着服务器操作系统进入 2.0 时代,我们将见证国产品牌与国际一流水平同台竞技,并为更多行业的云智融合产业升级提供坚实的平台支撑。
—— 完 ——