一文看懂AMD的Zen 3内核芯片

我们已经很长时间没有看到一个新CPU性能较之上一代能有明显的提升的状况出现 , 而AMD的Ryzen 5000系列产品以及他们的新Zen 3内核就做到了这一点 。
虽然我们只有很短的时间来使用功能全面的Ryzen 5950系统 , 但这就足够给我们留下了深刻的印象 。 Linux Mint 20的启动速度是如此之快以至于引人注目 , 这实际上是我们日常主要系统花费时间的一小部分 。 其中大部分取决于PCIe4 SSD , 但CPU不得不在输入数据时对其进行处理 。
在系统上花了几分钟的时间后 , 我们在技嘉X570 Aorus Master主板上搭配了AMD Ryzen 9 5950X、三星980 Pro PCIe4 SSD和16GB GSkill Trident Z Royal DDR4-3600内存 , 该系统在所有内核上均以1.25V的电压在4.5GHz频率运行 。
考虑到所有这些 , 在我们看来 , 有一件事也很突出 , 该系统速度非常快 。 由于它是目前市场上最高端的游戏PC , 因此您希望它能发布出最好的数字 , 并且对网络的简要了解表明它确实符合SemiAccurate的早期主张 , 即“ AMD应该在现在一切上取胜 , 而英特尔没有回应” 。 唯一真正的问题是它如何到达那里 , 这是一个漫长的故事 。
一文看懂AMD的Zen 3内核芯片文章插图
Ryzen 5000 Chiplet布局如果您查看Ryzen 5000 CPU的高级框图 , 它们看起来就像基于Zen 2的Ryzen 3000 。 他们有一个或两个CCD , 但是基于经过改进的7纳米制程(在Intel语言中为+或++)和一个cIOD 。 该cIOD与R3K产品线中的cIOD完全相同 , 而这颗来自Global Foundries 12nm的芯片面积为125平方毫、拥有20.9亿个晶体管 , 整个die几乎没有任何改变 。
在CCD方面 , 几乎所有方面都发生了变化 , 但现在我们将重点关注在die本身上 。 这些变化需要一个新的封装 , 其接线方式不同 , 但仅此而已 。 每个CCD为80.7平方毫米 , 包含41.5亿个晶体管 。 这意味着单个CCD封装的总硅面积为205.7平方毫米 , 两个CCD SKU的总硅面积为286.4平方毫米 。 更令人印象深刻的是 , AMD能够提高DDR4-4000支持的内存速度 , 而无需更改包含内存控制器的cIOD 。 对于基于Milan的服务器产品 , 这具有一些非常有趣的含义 , 但这又是另一回事了 。
更多缓存:
深入研究CCD , 我们会看到一些差异出现 , 特别是在核心组织层面 。 Zen 2 / Rome CCD逻辑上细分为两个4C CCX , 每个CCX具有16MB的L3缓存 。 这两个高速缓存片和核心群集没有直接连接 , 要使核心4与核心5进行通信 , 它必须离开裸片 , 转到cOID , 然后返回同一CCD上的另一个CCX 。 这是巨大的功耗浪费 , 还增加了延迟 , 而且通常不是一个好主意 。 您唯一能说的好事是 , 任何两个CCX之间的延迟都相当一致 。
一文看懂AMD的Zen 3内核芯片文章插图
Zen 2 vs Zen 3 的CCX安排???????????Zen 3 / Milan通过将CCX升级为具有32MB可直接访问的L3缓存的8C来解决此问题 。 每个L3高速缓存块都经过地址切片(address sliced) , 但转到另一个CCD仍意味着需要进行一些封装和cIOD traversals , 并且链接的负载远小于Zen 2设备上的负载 。 借助少量的OS调度程序支持或软件优化 , 这将带来整体性能显著提高 。 不利的一面在于 , 较大的L3意味着延迟从16MB Zen 2 L3中的39个周期增加到Ryzen 5000中的46个周期 。 总体而言 , 最坏的情况稍差一些 , 但平均性能和实际性能要好得多 。
一文看懂AMD的Zen 3内核芯片文章插图
Zen 3的缓存层次结构在L1和L2缓存上 , Zen 3与上一代相比没有太大变化 。 L1 I $和D $仍然分别为32K , 而L2仍为512K , 这三个延迟均保持不变 。 L3则是高速缓存的“受害者” , 因此仅当从L2撤出东西时才填充它 , 但它具有阴影标签 , 因此其他内核可以从同一裸片上的L2中拉出而无需掉头到内存控制器 。
一文看懂AMD的Zen 3内核芯片文章插图
从核心开始 , 带宽也得到了改善 , 该核心现在可以每个周期执行三个负载或两个存储 , 除非它是一个256b操作 , 分别最大为2和1 。 内存路径始终为32B /周期 , 但L3写入内存的方式仅为16B /周期 。 除此之外 , 从上表中可以看到 , 一切变化不大 。 一切都相同或更好 , 并且在实际工作负载中显示出了好处 。
进入核心:
Zen 3核心是全新的 , 其整数管道(Integer pipes)从7扩展到10 , FP从4扩展到6 , 并且据称可以更好地利用一切 。 AMD将新内核的目标描述为性能 , 延迟和效率的提升 , 但净能耗没有增加 。 据了解 。 其IPC增长了19% , 每瓦性能提高了24% , 所有这些似乎都表明AMD达到了目标 。