基础设施|阿里马涛:重新定义云时代的开源操作系统|人物志


基础设施|阿里马涛:重新定义云时代的开源操作系统|人物志
文章插图
作者 | Just
随着云计算的发展,以及Linux平台的不断发展和生态系统的不断完善,越来越多的企业、云服务提供商都将Linux作为其数据中心的首选操作系统。
不过,作为云基础设施的底座,针对云上产品和环境进行定制、优化的需求大幅增长。基于此,阿里巴巴操作系统团队开发了 Alibaba Cloud Linux,以连接阿里云各类产品与客户应用,更好发挥云端的能力。
在近日的“长沙1024程序员节”期间,CSDN 「人物志」栏目采访了阿里云研究员、基础软件部操作系统团队负责人马涛,他介绍了在5G、云计算等技术的冲击下,云操作系统面临的挑战和机遇。
马涛也是阿里巴巴集团内核团队创始人之一。他曾先后在ORACLE,阿里巴巴负责Linux以及操作系统内核相关的研发工作,已在Linux内核主线有超过300个提交,同时对分布式文件系统,分布式存储等领域有多年深入研究。
以下为采访内容,由CSDN整理:
CSDN:随着5G、云计算等新技术的发展,新硬件架构层出不穷,这对底层的操作系统提出了哪些挑战?阿里的开源云操作系统在技术上要如何做出调整以适应这种变化?
马涛:
首先云计算是规模经济,所以云基础设施的固定成本十分庞大。而当这些基础设施建成后,进行进一步扩张所需要的边际成本则相对较小,所以随着云服务提供者规模的扩大,其平均成本将会呈现迅速下降的趋势。
在如此大规模部署的情况下,稳定性就显得至关重要,再加上云上业务的复杂性和系统的高负载,这都对操作系统的稳定性提出了更高的要求。在阿里云我们有上百万规模的部署,所有对稳定性的挑战是非常巨大的。
另外,随着云计算规模的扩大,每一点的优化和性能的提升都会带来可观的经济收益。但云架构中单单某一层优化很难有可观的性能收益,这需要从硬件平台到系统软件,再到应用层全栈协同。
而这里操作系统恰恰处于中间的最为关键的点,它向下抽象物理IT资源,并利用抽象的资源向上支持应用。所以如何优化云计算操作系统提供全栈的集成和优化能力,这就成为了云操作系统的新机会,也是云平台的核心竞争力。
CSDN:像华为等巨头也入局并提出了新的操作系统,那么,阿里在开源操作系统上做出的调整与其他巨头有什么不同?
马涛:
随着智能化对云计算能力需求的增长和IT产业的变革,推动了多CPU架构的快速演进,我认为将来任何一朵云都不会运行在单一的计算架构之上。所以这需要操作系统能够发展开放的硬件生态,完善的支持跨平台架构,同时,每一个硬件平台的迭代和能力的演进在不断加速,但传统的一些操作系统发行版的版本升级速度偏慢,没有办法把新硬件平台的能力及时带给云上丰富的应用。
大家经常会发现,一个硬件的特性可能已经存在1-2年甚至更长的时间,一些集成了这些特性的操作系统从才会姗姗来迟,这让应用无法及时的利用这些硬件的红利,让云平台的资源被浪费,让新硬件迭代的速度也大大降低。所以我们希望能够通过云平台的操作系统让客户更快的体验到各种各样的新硬件带来的技术红利。
从这一点上来说,我们做操作系统和Intel这些硬件厂商做操作系统的诉求是不一样的,他们更看重的是自己的硬件生态,比如CPU。而我们则需要考虑云客户的需求如何得到更好的快速满足。
CSDN:你们在开源操作系统上的下一个着力点是什么?
马涛:
第一,资源粒度会更加细致。相较于传统的虚拟机时代的业务类型,云原生应用对于资源的需求类型有了变化,从传统机器虚拟化的资源即虚拟机形态,到虚拟OS的资源(即容器形态),再到虚拟运行时的资源(比如类似于函数计算形态的FaaS),应用对于资源的抽象层级要求更高以及粒度要求更细。
第二,弹性速度需要更快。云原生业务天然伴随着对快速弹性的需求以及短时运行等特征,要求云基础设施能够在短时间内,快速地提供资源,并且能够承受资源频繁的创建、销毁所带来的压力。
第三,性能要求更高。在云原生场景中,用户更专注于应用逻辑,更多的系统技术栈则下沉到基础设施,同时系统服务边界在上移。这样就给底层系统更多的施展空间,因为原有一些分层边界可以被打破,可以融合和垂直优化。
基础设施|阿里马涛:重新定义云时代的开源操作系统|人物志】第四,安全隔离更强。随着云原生加速朝着Serverless计算架构演进,应用与基础设施彻底解耦合,用户只需关心自己的应用,而云原生系统不断下移。容器作为云原生的支撑技术,区别于之前的虚拟机计算架构,Serverless计算架构中云上的多租户安全成了一个全新的挑战。