处理器|原来不只是高带宽,PCIe4.0应用场景测试与分析

_原题为 原来不只是高带宽 , PCIe4.0应用场景测试与分析
自从AMD发布第三代锐龙台式机处理器后 , PCIe4.0就经常出现在了玩家们的视野中 , 那么PCIe4.0到底有何作用 , 能给我们哪些实际提升呢?
PCIe4.0是什么?
PCIe规范即是PCI-Express规范 , 一般可以翻译为周边设备高速连接标准 , 其由PCI-SIG组织进行制定 , 目前成员中有着诸多IT业界顶级公司 。 PCIe规范是在2003年提出的PC连接标准 , PCIe通道包含两个数据通道 , 从而更好的保证数据接收和发送的效率 , 每个设备拥有独立分配的带宽 , 不占用总带宽 。 而PCIe规范一直以来也是PC上的主流传输连接标准 。
我们目前使用最广泛PCIe3.0标准其实已经是10年前(2010年)制定的标准 , 而部分设备还在用到的PCIe2.0标准 , 则是在更早的2006年制定的 。 PCIe 2.0采用8b/10b的编码方式 , 拥有2.5GT/s的信号速率 , PCIe3.0的编码方式修改为128b/130b , 信号速率增长到8GT/s , 而PCIe4.0则再次翻倍 , 达到了16GT/s 。 所以在带宽方面 , ×16带宽时 , PCIe3.0为32GB/s , 而PCIe4.0则翻倍为64GB/s 。

处理器|原来不只是高带宽,PCIe4.0应用场景测试与分析
文章图片
带宽越大 , 吞吐量也就越大 , 这意味着相同时间通过的数据量也就越大 。 就好比马路越宽 , 能够同时通过的车辆就越多一样 。 反映到PCIe带宽上来说 , 也就是PCIe4.0在×8的带宽下 , 就能达到PCIe3.0在×16时的带宽 , 高带宽为设备间的传输与沟通提供了更大的帮助 。 那么这样的提升具体表现在哪里呢?
平台对比凸显PCIe4.0高带宽优势
我们都知道 , 消费级桌面处理器的CPU直连PCIe通道非常有限 , 以目前主流的处理器来看 , Intel十代酷睿旗舰i9 10900K目前只有16条直出PCIe通道 , AMD第三代锐龙旗舰如锐龙9 3900X则有20条直出PCIe通道 。 直出通道的数量决定了与处理器高速互联的设备数 。
在Intel平台 , 当这个直连处理器的PCIe×16插槽只插一块显卡时 , 可以达到PCIe3.0×16全速 , 但如果使用双显卡SLI或CFX时 , 就只能使用8+8通道 , 而三个PCIe设备连接时则只能分配为8+4+4 , 在有限的PCIe通道数下 , 多设备连接速度会有所降低 , 多个高性能PCIe设备连接时无法发挥全部的性能 。
在Intel目前的消费级平台上(如Z390、Z490) , 绝大多数情况下 , 直连处理器的就是主板上的第一根PCIe3.0×16插槽 , 而NVMe等存储设备 , 使用的都是主板芯片组提供的PCIe通道 , 不是直连处理器的PCIe通道 , 在Intel平台中 , 主板芯片组和CPU通信采用的是DMI总线(基于PCIe总线打造) , 带宽和PCIe3.0×4一样为8GB/s 。 也就是说虽然主板最高能提供24条PCIe通道 , 但由于和处理器的通信带宽只有PCIe3.0×4 , 所以对于各种高速传输的设备同时运行时 , 受带宽限制并不能真正达到全速 。

处理器|原来不只是高带宽,PCIe4.0应用场景测试与分析
文章图片
AMD第三代锐龙平台不但提供了PCIe4.0 , 同时还多提供4条用于NVMe的通道
在AMD第三代锐龙平台中 , 首先处理器就提供了20条PCIe4.0通道 , 对应在B550和X570主板上 , 则可以直接划分为用于显卡的PCIe4.0×16直连和用于NVMe的PCIe4.0×4直连 , 在单条NVMe的情况下 , 存储不必为了跑满速而去抢占显卡的通道 。 同时 , AMD第三代锐龙处理器和主板(B550/X570)芯片组的通信带宽同样也升级到了PCIe4.0×4 , 可以提供16GB/s的带宽 , 能更好的满足多个高速设备同时工作时的带宽需求 。
实测分析PCIe4.0高带宽具体表现
在去年AMD第三代锐龙处理器推出时 , 宣布支持PCIe4.0之后 , AMD自家的RX 5700/5700XT首先在消费级平台实现了显卡对PCIe4.0的支持 , 随着NVIDIA RTX 30系列显卡的推出 , 目前市面上的主流显卡已经全部实现了对PCIe4.0的支持 。 而目前PCIe4.0的应用 , 主要也集中在显卡和NVMe SSD上 。

处理器|原来不只是高带宽,PCIe4.0应用场景测试与分析
文章图片
使用Intel酷睿i9 10900K平台 , RTX 3080在3DMark的PCIe带宽测试中成绩为12.93 GB/s

处理器|原来不只是高带宽,PCIe4.0应用场景测试与分析
文章图片
使用AMD锐龙9 3900X平台 , RTX 3080在3DMark的PCIe带宽测试中成绩为26.17 GB/s
我们使用NVIDIA RTX 3080进行了PCIe 4.0的测试 , 并使用第三代锐龙处理器+X570主板和十代酷睿+Z490主板进行了对比测试 。 从3DMark的PCIe带宽测试来看 , RTX 3080在支持PCIe 4.0的第三代锐龙处理器+X570主板上的带宽测试达到26.17GB/s , 而在仅支持PCIe3.0的十代酷睿+Z490主板上则只有12.93GB/s的带宽 , 可以很明显的看到PCIe4.0的两倍于PCIe 3.0的带宽 。
在这一代旗舰显卡上 , PCIe4.0的高带宽虽然在测试中很明显 , 但在日常应用中 , 因为多方面的原因 , 还无法吃满PCIe4.0的全部带宽性能 , 所以就目前来看 , 其对显卡的性能影响还很小 , 但这并不意味着PCIe4.0的高带宽无用 , 因为未来显卡的性能和带宽需求肯定是越来越高 , 带宽对旗舰显卡的性能影响也会逐渐显现出来 。分页标题
而对玩家们影响最大 , 也是目前有着最直观的感受的 , 那就是存储方面带来的性能上的直接提升 。 所以我们也进行了存储方面的PCIe4.0测试 。
测试平台:
处理器:AMD锐龙7 3900X
内存:技嘉AORUS DDR4 3200 8GB×2
主板:技嘉B550 AORUS MASTER
硬盘:技嘉PCIe Gen4 1TB NVMe SSD
在这个测试中我们选择了技嘉B550 AORUS MASTER搭配技嘉PCIe Gen4 1TB NVMe SSD的PCIe4.0测试组合 。

处理器|原来不只是高带宽,PCIe4.0应用场景测试与分析
文章图片
技嘉B550 AORUS MASTER按照旗舰级的X570主板规格来打造 , 配备了16相直出式数字供电 , 每一相供电电流高达70A , 这个规格已经超过了市面上大多数X570主板 , 就算是搭配AMD锐龙9 3950X这样105W TDP的旗舰级处理器使用 , 也是轻而易举 , 将来升级Zen3也毫无压力 。 存储部分的设计是技嘉B550 AORUS MASTER一大卖点 。 按照官方规格来看 , B550原本可以提供由第三代锐龙直出的一个PCIe 4.0 ×4 M.2插槽 , 而技嘉B550 AORUS MASTER提供了3个PCIe 4.0 ×4 M.2插槽 , 都来自第三代锐龙处理器 , 其中两个则是分自显卡的PCIe 4.0 ×16通道 。 如此一来 , 技嘉B550 AORUS MASTER就可以支持3个PCIe 4.0固态硬盘组建RAID0系统 , 提供超过12000MB/s的读写速度(大约是单个高端PCIe 3.0×4固态硬盘速度的4倍) , 这对于要求极高素材导入速度的专业设计应用来讲实用价值非常高 。 此外 , 技嘉B550 AORUS MASTER还配备了6层PCIe 4.0专用2盎司铜PCB , 能够充分保证信号传输的稳定性 。

处理器|原来不只是高带宽,PCIe4.0应用场景测试与分析
文章图片
从测试来看 , 单块PCIe 4.0固态硬盘在技嘉B550 AORUS MASTER上的连续读取速度已经达到了5GB/s左右 , 连续写入速度也超过了4GB/s , 这个成绩已经远超PCIe 3.0顶级固态硬盘非常多了 。

处理器|原来不只是高带宽,PCIe4.0应用场景测试与分析
文章图片
由于这块主板可以将处理器的PCIe4.0通道划分至NVMe , 从而在B550主板上实现3个PCIe4.0的M.2接口 , 所以我们也利用这个特性进行了PCIe4.0的RAID0测试 。 从测试结果来看 , 主板上3个PCIe 4.0 ×4 M.2插槽组建RAID0系统 , 连续读写均可突破12000MB/s , 这个性能表现可以说是非常恐怖了 。
那么这样的性能表现具体能在哪些方面为我们带来直观的感受呢?第三代锐龙处理器在多线程性能方面的表现非常强劲 , 已经成为目前专业创意工作者的首选平台 , 高性能的处理器搭配读写更快的PCIe4.0 NVMe SSD , 可以极大的加快工程素材的拷贝和载入时间 , 明显改善使用体验和工作效率 。
为什么这么说呢?以视频拍摄剪辑为例 , 随着佳能EOS R5的发布 , 8K RAW格式视频已经正式宣布进入消费级市场 , 8K RAW格式下 , 几秒钟的视频素材就已经达到按GB计算的容量 , 这给素材的拷贝和载入都提出了更大的要求 。 虽然8K视频并不是目前的主流 , 但是以松下S1H和索尼A7S3为代表的视频机所拍摄的6K和4K视频工程需求已经越来越突出 , 大型工程中 , 这样的素材量级依旧给拷贝和剪辑载入提出了更高的要求 , 在这种时候 , 使用PCIe4.0 NVMe能够极大的减少素材的相互拷贝和载入时间 , 更方便 , 更好的完成以前要用多块机械硬盘阵列才能完成的事情 , 极大的简化工作流程 , 提高工作效率 。
那么在显卡方面 , 除了刚刚说到的未来旗舰显卡的带宽需求更高 , 那么有没有更实际的意义呢?这就要结合多方面来说了 。 刚刚我们已经提到过消费级处理器的PCIe通道数有比较大的限制 , 所以在有限的通道数下 , 单通道的带宽更高就能更好的节省通道数 。 随着目前主流显卡已经全面切换到PCIe4.0 , 这就更加有实际意义 。
我们都知道PCIe4.0只需要PCIe3.0一半的通道数即可实现相同的带宽 , 所以在未来 , 主流设备都切换到PCIe4.0之后 , 通道的分配就更加方便 , 例如入门和中端显卡 , 可以不需要再用×16的通道 , 因为它们对带宽的需求相对较低 , 而使用×8的通道即可实现以往PCIe3.0×16的带宽 , 也不会对性能有所影响 , 从而留出更多的通道数给其他设备使用 。 对于存储系统来说 , PCIe4.0×2即可实现以往PCIe3.0×4的带宽 , 对于不追求性能入门级NVMe来说 , 只需要用到更少的通道数即可满足产品定位的需求 , 从而实现更大容量的配备 , 也不失为一种灵活的解决方案 。
总结:高带宽更灵活 , AMD锐龙平台搭配PCIe4.0更高效
【处理器|原来不只是高带宽,PCIe4.0应用场景测试与分析】AMD第三代锐龙处理器将PCIe4.0带入了消费级市场 , 随着一年时间的市场培养 , PCIe4.0的NVMe SSD从刚上市时性能高/价格高的状态 , 如今价格方面也已经达到了和旗舰PCIe3.0 NVMe SSD接近的程度 , 众多存储品牌也发布了更多的PCIe4.0 NVMe SSD产品 。 借助PCIe4.0的高带宽 , 采用PCIe4.0的SSD也在速度上进一步实现了突破 , 三星刚发布的旗舰NVMe SSD 980Pro甚至能够达到7000MB/s , 非常恐怖 , 也让我们看到了更多高速存储的应用环境 。 随着NVIDIA RTX 30系列显卡的推出 , 目前市面上的主流显卡已经全部实现了对PCIe4.0的支持 , 这将进一步推动PCIe4.0的发展 , 更好的发挥其高带宽的优势 。 可以说支持PCIe4.0已经是目前的主流趋势 , 在这种情况下 , 能够支持PCIe4.0的AMD B550/570平台就成为了更加战未来且合理的选择 。分页标题