G大禹智芯王昕溥:从DPU看DS 智芯( 二 )


之前我分享的例子,在当时对业界产生了一定的影响。最直接的影响是专用设备开始退出互联网公司的IDC市场,转向专注于服务银行和企事业单位,并且在2019年进行软件服务转型。OpenSSL库的patch被社区所接受,变成专用的加密算法offload接口,芯片厂商也继续丰富和增加它的性能,现在已经不是专门的芯片和板卡,而是被集成在CPU里面,逐渐变得通用化。
为此,对于专用领域芯片,我们认为有几个未来的发展方向:

  • 一是从实际需求出发,由场景使用方的客户提出定制需求,芯片等硬件厂商按照客户需求定义、设计和生产芯片,加快芯片商业化落地的速度;作为客户来说,只要能够符合需求,就一定会投入使用,这对硬件研发来讲是一个很大的保证。
  • 二是重视软件,发展生态。从正面说,因为我们进行了大量的软件开发工作,才能够将硬件使用起来。从反面来讲,没有软件研发能力,即使已经有了成功案例,仍然可能没办法使用一些专用的芯片或者硬件。
  • 三是现在做专用领域芯片都会面临的问题,是适用面定义宽窄之间的选择。以FPGA为例,互联网公司曾经设有大规模团队做FPGA优化AI算法,但市面推出新的GPU后,团队就被解散了,这也是专用领域芯片面临的一个典型问题:因为应用领域比较窄,可能技术红利期短,可能整体的效益少,也可能还赶不上研发投入,最后没有实现大规模应用。
对DPU的一些思考【 G大禹智芯王昕溥:从DPU看DS 智芯
G大禹智芯王昕溥:从DPU看DS 智芯
文章插图

而说了以上几点后,接下来我讲一下大禹智芯为什么要做DPU。DPU是非常新的东西, 它是专注于对流动数据进行处理的芯片。大禹智芯成立于去年6月份,当初下决心做DPU的时候,听说和了解DPU的人还很少。作为云计算出身的团队,我们是国内最早尝试DPU产品的一批人,DPU厂商定义芯片的时候都跟我们进行了很多的探讨。但当我们拿到产品后发现使用效果远未达到预期甚至不可用,主要原因就是上面定义的软件架构是硬件公司想象出来的客户需求,不是我们想要的。
鉴于上述过往的经历,大禹智芯选择从使用者的角度,从上到下定义DPU产品,缺少什么环节就补足什么环节,缺少软件就做软件,缺少硬件就做板卡,如果没有合适的芯片就定义合适的芯片。因此,在我们自研芯片还没有出来之前就推出了两代的自研DPU产品,通过这两代产品为芯片定义积累场景和经验,同时为不同场景用户的使用创造和提供价值。
另外,DPU的关键还在于软件。作为硬件,它对软件的依赖要超过很多硬件产品。DPU不同于如网卡的硬件,后者驱动对上就能用,上层的事情都被驱动和协议栈操作系统屏蔽掉。而DPU会承载用户大量的业务需求,如云计算方面的网络虚拟化、存储虚拟化、对服务器的管理和安全管控等任务,所以DPU对软件要求很高。
另外,得益于芯片产业上下游的发展和提升,DSA芯片的门槛在降低,专用领域的芯片设计难度相比通用芯片较低。把芯片定义准确,再依靠上下游力量,相关技术公司是完全有能力研发出一款成功的专用领域芯片。
从市场需求来看,互联网上的带宽每六个月翻一番,远远快于摩尔定律CPU每18个月翻一番的速度,而且现在摩尔定律也不能跟上这个速度,市场亟需DPU这种负责处理流动的数据让网络加速的产品,DPU也可以理解为应时代所需而出现的创新型硬件。
我们认为,DPU将会扮演更重要的角色,像CPU和GPU一样是开创时代的创新型硬件,并长久地发展下去。DPU不仅局限在大规模云计算和数据中心,云计算也不是DPU唯一的场景,未来的5G和边缘计算领域也同样重要,和云计算一起并列的三大场景,DPU一定会有更多的市场机会。
在最后,针对于十年前的案例,我做一些补充。当年在找芯片硬件厂商合作前,市面上有一款专用的现成产品可以满足业务场景的需求。但是因为价格太高,无法大规模采购,才选择了合作定义新的芯片。这是一个产品满足需求,但最终却没有进入市场的例子。
而之前跟芯片厂商合作的QAT在这两年也不再被互联网大厂所使用,不是因为QAT性能满足不了需求,而是因为需求已经消失。在过去的Web端时代,浏览器产生很多新建请求,尤其是新建请求握手时会有大量算法需求。但在如今的移动端时代,手机APP仅需维持一两个长连接,无需太多新建请求。而新版的SSL协议,算法要求也有很大变化,对RSA非对称加密没那么多需求, CPU就可以满足对应需求。这时候QAT发挥的作用就大大降低。