浪潮云海|刷新OpenStack最大规模集群纪录,智算中心操作系统有了新标杆


浪潮云海|刷新OpenStack最大规模集群纪录,智算中心操作系统有了新标杆
文章插图
2020年初,一场以新基建之名的数字基础设施建设热潮,让国人为之兴奋。所谓“新基建”也称为新型基础设施,主要是指融合了云计算、大数据、人工智能等新兴数字技术的城市基础设施,2020年4月中央明确“新基建”范围,包括5G建设、大数据中心、人工智能等七大领域。新基建之所以重要,还在于它承担了推动传统基础设施向新型基础设施转型的历史重任,这在十三五与十四五之交具有格外重要的意义。
针对新基建以及大数据中心等具体的数字基础设施,浪潮作为国内老牌技术厂商以及全球第二大服务器厂商,在2020年4月提出了“智算中心”的概念,为大规模数据中心的演进指明了方向。如果说大规模数据中心强调的是算力、性能、可靠性等,那么智算中心更多强调的是算力的集约化,包括各种异构计算的整合以及云、大数据、人工智能等平台的协同打通。开放标准、集约高效、普适普惠,是智算中心的基本特征。
从大规模数据中心到智算中心,其核心“操作系统”又将迎来怎样的变化?2020年11月25日,浪潮在2020云海创新论坛(IIF2020)上发布了智算中心操作系统,向外界展示了对智算中心操作系统的构想及落地实践——云海OS完成了全球最大规模OpenStack单一集群1000节点的云数智融合实践。
浪潮云海|刷新OpenStack最大规模集群纪录,智算中心操作系统有了新标杆
文章插图
(浪潮信息副总裁张东)
潮信息副总裁张东表示,浪潮云海OS以开源开放技术为基础、以新时期用户需求为出发点,不断进化成为开放、融合、敏捷、智能的操作系统,满足新基建时代智算中心的要求,奠定了政企数字化转型“云数智”融合的基础,是智算中心的中枢。
浪潮云海OS经历了从虚拟化管理到云数据中心操作系统的演变,如今又进化为智算中心操作系统,而其底座仍然是开源技术及工业标准硬件,从而满足开放标准、普适普惠、集约高效的要求。
突破OpenStack大规模单一集群在11月25日举办的浪潮云海创新论坛2020上,浪潮云海发布了全球最大规模OpenStack单一集群达1000节点的云数智融合实践。浪潮云海在2019年就完成了单一集群500节点的测试,是当时基于OpenStack Rocky版本的全球最大规模单一集群实践。本次1000节点大规模测试,在规模、场景、性能等方面进行了全面突破,完成了从500节点到1000节点的升级,还刷新了今年4月云海OS所取得的SPEC Cloud?IaaS?测试纪录,实现了量变到质变的跃迁。
浪潮云海|刷新OpenStack最大规模集群纪录,智算中心操作系统有了新标杆
文章插图
中国信通院全程参与了两次集群的测试。中国信通院云大所副所长栗蔚表示,OpenStack是当前主流的云架构开源项目,逐渐成为高速发展企业和成熟企业基础IT架构的首选解决方案之一。OpenStack在小规模部署时,其性能和稳定性较为稳定,开源特性和良好的社区支持也为小规模部署提供了技术参考。随着企业探索的不断深入,大规模应用的需求越发迫切,OpenStack大规模云集群有待突破。
作为全球顶级的开源项目之一,OpenStack已经走过了十年的历程,成为私有云的产业事实标准以及部分公有云的“底座”,是当前全球部署最为广泛的开源云软件。截止2020年,OpenStack发布了22个版本,社区里有超过40个项目,全球有超过1000万的基于OpenStack的计算核心,在全球187个国家和地区有数十万成员。今年10月,OpenStack基金会演进成为Open Infrastructure Foundation开源基础设施基金会,凸显了融合人工智能、5G、大数据、边缘计算等新型工作负载的定位。
一方面,OpenStack可以纳管和支持融合的工作负载越来越多;另一方面,由于开源技术和复杂组件带来的局限性,导致当达到一定规模时,系统的运维难度陡增、并发性能降低,而通过对系统的合理优化方能满足大规模节点部署的应用场景,保证系统的正常稳定运行,这就是浪潮云海OpenStack大规模单一集群测试的意义所在。
更大、更全、更高浪潮在多年云平台建设的探索中发现,大型用户的云平台实践普遍面临大规模的挑战。随着内外部用户数量的增长,单一应用和服务的规模变得愈发庞大,需要同时部署数百甚至数千台虚拟机。如果使用多个小规模集群构建云平台,应用和服务的跨集群部署、管理、升级会变得异常困难甚至无法实现,因此对单一集群的规模产生了强烈的需求。
浪潮云海|刷新OpenStack最大规模集群纪录,智算中心操作系统有了新标杆
文章插图
针对大型用户对大规模云平台单一集群的需求,浪潮云海团队在中国信通院的见证下开展了OpenStack大规模单一集群的测试。浪潮云计算与大数据产品线首席架构师亓开元表示,从2019年的OpenStack单一集群500节点到今年的1000节点,不仅仅是更大规模的单一集群,今年还加入了大数据和人工智能,测试集群支撑的业务更全,整体系统达到的更高性能。