在数据中心领域AMD究竟如何加速?( 三 )


随着云计算、虚拟化技术的兴起与普及 , 用户对于存放在公共数据中心内的数据的安全与隐私等问题自然产生了更高的要求 。
VMware从vSphere 版本7.0U1开始 , 就全面支持AMD安全加密虚拟化(SEV-ES) , 成为第一个由AMD EPYC处理器提供全面SEV-ES支持的虚拟机监视器 。 客户可以充分利用SEV-ES的优势而无需再对其应用程序进行更改 , 从而简化了安全功能的实施 。
面向未来的“3D Chiplets“架构
微架构对处理器性能发挥至关重要 。 Milan系列处理器使用Zen 3微架构 , 相比于Zen 2微架构 , Zen 3在L1缓存、分支预测以及执行引擎等环节进行了改进和增强 , 使得IPC(Instruction Per Clock , 每时钟周期指令)的性能提升了19% 。
除了Zen 3微架构的改进之外 , 第三代EPYC处理器依旧采用“Chiplet”的方式来组成满足不同性能需求市场的处理器型号 。
从处理器参数上看 , 似乎与第二代EPYC处理器区别不大 , 比如最高64核心128线程 , 每Chiplet共享的32 MB L3缓存 , 依旧使用7nm(CCD)/14nm(IOD)制程工艺等等 。
尤其从物理外观上看 , Milan(第三代EPYC)处理器与Rome(第二代EPYC)区别不大 , 甚至使用相同的处理器插槽 , 原本使用Rome处理器的服务器只需要升级BIOS就可以更换使用Milan处理器 。
但在Milan处理器内存上 , 却有多项改进 , 最大的改进就是每Chiplet中共享L3缓存方面 , 也就是说在现有Zen3 CCD的基础上(32M L3) , 在空间上继续堆叠一个64M L3并通过TSV连接在一起 , 从而实现3倍的三级缓存提升 。
在Computex 2021大会上、苏姿丰博士的压轴话题就是AMD将Cliplets封装技术与芯片堆叠技术相结合 , 为未来高性能计算产品创造出的3D Cliplets架构 。
在数据中心领域AMD究竟如何加速?
本文插图
这种方法 , 通过硅通孔技术 , 能够提供的互连密度是2D Cliplets的200多倍 , 是其他堆叠方案的15倍以上 , 晶片与晶片之间的接口采用的是铜到铜的直接结合 , 没有任何形式的焊接凸点 。
与此同时 , 这个方法改善了热设计 , 晶体管密度和互连间距 , 并且单位信号的能耗只有微凸点3D法的三分之一 , 真正成为了先进和灵活的Active-on-Active硅堆叠技术 。
在数据中心领域AMD究竟如何加速?
本文插图
更大的缓存意味着更好的性能 , 比如在某些高性能场景下 , 较大指令会占据高达8MB的共享L3缓存 , 如果是在Rome处理器上运行 , 每个核心用于数据实际处理的L3缓存则只有8MB , 而使用Milan处理器 , 则可高达24MB , 三倍可用的共享L3缓存 。
这也就是为什么从Rome到Milan , 处理器核心数不变 , 但性能却增强的一个主要原因 。