cpu|只有阿里腾讯才懂的芯片秘密

cpu|只有阿里腾讯才懂的芯片秘密
文章插图
作者| 宇多田
出品| 虎嗅科技组
封面来自视觉中国

就在昨天,中国内存厂商长鑫存储(便是睿力集成),其悄然变更的股东信息引发了一些媒体和产业骚动。

因为在新增的19位股东中,“阿里巴巴”“腾讯”这两个名字极为引人瞩目。

cpu|只有阿里腾讯才懂的芯片秘密
文章插图

图片来自企名片

合肥长鑫,这家成立于2016年,但注册资金高达485.7亿人民币的“创业公司”,是目前大陆唯一一家拥有Dram内存自主生产能力的芯片厂,背负着众多期望。而毫不意外,这个作为服务器“三大物理硬件”之一的内存芯片类型,对云计算巨头有多重要,自然不必多说。

易失性存储器 Dram,与NAND闪存同为存储产业最为流行的芯片类型,是一个全球规模约为900亿美元的市场(数据来自TrendForce)。这个数字看起来虽然并不庞大,但几乎被三星、海力士以及美光三巨头瓜分完毕。

因此,从供需稳定来看,正是由于真正Dram制造厂在国内的稀缺性等原因,让管理着庞大服务器机群的云计算厂商,需要提高对N种采购备选方案的掌控力。

作为超大数据中心的运营者,云厂商们都是Dram芯片的巨大消耗者。举个例子,亚马逊曾在2019年因三星Dram产品在设计层面存在底层缺陷而取消订单,对后者当季营业利润打击很大。

另一方面,权威市场分析机构Digitime整合业内消息来源认为,2022年云服务器和数据中心应用将成为Dram芯片市场主要增长动力,恢复大量出货势头,预计整体市场需求将增长15-20%;此外,美光在2022第一财季的数据重心业务增幅高达70%,主要贡献来自Dram与SSD产品。

而消息人士告诉虎嗅,业内预计从2022年第二季度开始,数据中心需求才能更加明显。

cpu|只有阿里腾讯才懂的芯片秘密
文章插图


云巨头的硬件掌控力野心

另一边,毋庸置疑,与CPU、GPU及各类加速器一样,存储芯片对服务器架构创新与性能的颠覆同样具有极其重要的影响。

对于云厂商,巨大的计算并行处理量与神经网络规模巨幅增长,必然要求处理器更快从内存获取数据(这一点在文章《干掉英伟达?》里曾多次提及)。但宁畅信息技术专家告诉虎嗅,当前计算机是冯诺依曼架构,计算数据必须放在Dram内才可计算。所以,程序的大小决定了内存的大小。

“因此,单个程序和数据占用内存空间不断增加,导致内存容量持续扩张。为保持性能不下降,内存速率需与计算核数量同步增加。但实际已经快做不到了。”

去年,IEEE研究员兼3D存储芯片专家Joungho Kim也曾喊话,内存与处理器之间的性能差距比任何时候都要大,冯诺依曼架构现在应该叫“冯诺依曼瓶颈”。

因此,更多内存技术创新,在近年来,便围绕“怎样减少数据在芯片间的移动”展开了。

在阿里云开发者社区,数据专家曾详细科普过HBM(高带宽内存)、HBC(混合存储立方)等新型服务器内存。这一技术路径的思路比较直接好懂——让内存尽可能靠近CPU或GPU。

更具体一点,就是将处理器与内存堆叠成一个3D矩阵,然后凿在服务器主板上。

它的最大优势,理论上,便是可以在极低频率与能耗下带来大带宽。

这一技术路径反应在产品上,便是2021年8月三星发布的内存处理芯片——HBM2-PIM。三星技术专家用一种叫做硅穿孔(TSV)的互联线把Dram垂直连在一起,放在逻辑芯片上(下图)。

通俗一点讲,就是让一堆Dram簇拥着计算单元,齐心协力做跟AI任务相关的神经网络计算。

cpu|只有阿里腾讯才懂的芯片秘密
文章插图

3D堆叠PIM-HBM

这一技术在2021年曾引起过存储产业内的轰动,但还尚停留在实验阶段。不过,头部存储企业已纷纷闻风而动。譬如,美光悄然为一种3D Dram技术提交了专利申请,而半导体材料巨头应用材料也迅速发布了一套3D Dram材料工程方案。

正如,EEtimes所说,这可能需要好几年,但 Dram 很可能会追随NAND的脚步,走向3D。

而阿里前段时间也曾发布过基于Dram 的3D 堆叠存算一体芯片,相关论文还被ISSCC 2022收录。当然,此为研究,并未投产,但这也是一个非常重要的信号。