架构|西部数据以创新存储架构推动数据生态蓬勃发展

过去的十年间,移动互联网蓬勃发展,云计算、大数据及人工智能等新型应用不断涌现,这不止提高了对计算能力的要求,也促使由Facebook等互联网科技巨头发起的OCP(开放计算项目)在此期间诞生且飞速发展。开放计算项目秉持着分享创新和专利开源理念,以发展面向下一代数据中心的服务器、存储等创新硬件,逐渐成为业界的重要潮流之一。
架构|西部数据以创新存储架构推动数据生态蓬勃发展】根据市场调研机构IDC的统计和预测,OCP基础设施的市场规模将在未来5年内保持16.6%的年复合增长率,并在2024年达到338亿美元。届时符合OCP标准的服务器在全球服务器中所占的比例,也将从2020年的18%提升至24%。
存储能力作为开放计算项目持续推进发展的过程中不可忽视的一部分,与计算能力有着密不可分的关系。从数据的深度挖掘和分析,到其商业价值的最终实现,都是以存储为前提的。因此,开放计算的持续进步,在对基础计算单元服务器不断进行创新的同时,也对存储架构提出新挑战。
这种挑战来自多个维度:首先是数据的快速增长带来的容量挑战。根据预测,仅2024年一年产生的数据就有143ZB,但即便数据增长如此快速,但最终也只有不到2%的数据被存储下来,即大概1.6到1.9ZB;其次是人工智能等通过计算支持基于数据的预测和决策的应用,带来了快速访问数据需求;然后是成本负担的加重,因为很难以较低的成本实现同种介质既满足快数据又满足大数据的需求;在最后则是开放计算背景下的节能挑战。
在7月27日北京举行的第三届开放计算中国社区技术峰会(OCPChinaDay)上,西部数据公司副总裁兼中国区业务总经理刘钢表示:“用户在数据中心领域对于存储方面亟需满足的需求是大容量、快速访问、降低成本和降低能耗。但是,很难有一个存储介质或是存储设备,能够同时满足这四个方面的需求。这在一定程度上体现出了体现出了硬盘和基于闪存的固态盘协同发展的必然性,也说明了市场需要创新的数据存储基础架构,以实现各方面、各种存储场景的需求。”
架构|西部数据以创新存储架构推动数据生态蓬勃发展
文章插图
在西部数据看来,不同类型的数据有着不同的使用频率和场景,需要不同的数据处理方式,自然也需要不同的存储解决方案,于是乎,就有了西部数据针对数据存储的需求提出的创新存储架构:分层存储。例如极热存储适用于内存、持续低延时的应用,热存储适用于低延时、高IOPS、高带宽的应用如HPC,温存储适用于有较高性能IOPS和带宽要求的应用如AI训练,冷存储适用于多次读取和高容量需求的存储备份等应用,极冷存储适用于大块写入的长期数据归档。针对这些不同的存储解决方案使用不同的存储产品,便可在兼顾性能与成本的同时,满足用户多元、快速变化的需求,进而优化数据中心的存储架构,达到最佳的存储效果,并帮助企业实现更低的TCO(总体拥有成本)。
架构|西部数据以创新存储架构推动数据生态蓬勃发展
文章插图
以IDC行业为例,如今的数据中心使用的最大容量硬盘大概在18TB的CMR和20TB的SMR,这两种盘分别应对冷数据和极冷数据的存储。但去年同一时期,数据中心大容量硬盘普遍是14TB。单盘容量密度提高带来的是整体数据中心的部署及运营成本的降低。在配置不变的前提下,14TB到18TB的提升,即可实现减少22%服务器的部署和21%每TB的功耗,并最终带来17%的TCO降低。
但硬盘容量的增加也会带来新的问题。那就是当磁盘碟片密度增加时,由于碟片之间、磁头与碟片之间的距离更近,硬盘会更容易受到服务器内部的噪声、振动等外界干扰的影响,造成非常大的性能变化。另一方面,硬盘密度的增加会使服务器风扇功率、频率和速度也随之上升,反过来又加剧了对硬盘的干扰。根据西部数据的监测结果,声波产生的声压对硬盘的影响占比约80%,远超其他结构性振动带来的20%的影响。对此,西部数据专为声学主导环境开发了新工具:西部数据Vibro-Acoustic工具,用于准确监测声压的变化以及它对于硬盘性能带来的影响,来保证部署高密度存储设备的时候能够让存储和整体设备保持高性能。
架构|西部数据以创新存储架构推动数据生态蓬勃发展
文章插图
当然,在践行存储架构改革的道路上,西部数据也不是孤身一人,携手浪潮与西部数据联合推出的分布式存储解决方案,基于西部数据Ultrastar DC HC550 CMR HDD 18T硬盘和浪潮NF5466M5服务器,部署快速、运维方便,有助于减少分布式存储相关异常情况造成的损失,而基于西部数据HDD的腾讯云对象存储解决方案,通过将腾讯的无目录层次结构、无数据格式限制、可容纳海量数据的分布式存储服务TencentCOS,以及腾讯应用场景优化的高密度存储服务器与西部数据16T/18T企业级硬盘的有机结合,实现了存储桶空间无容量上限扩展,并大幅提高了TencentCOS的使用效率、可靠性与安全性,同时实现了成本最优。西部数据一直在与第三方的软件公司进行分布式存储相关的开发和生态系统的构建。