原来不只是高带宽,PCIe4.0应用场景测试与分析

自从AMD发布第三代锐龙台式机处理器后 , PCIe4.0就经常出现在了玩家们的视野中 , 那么PCIe4.0到底有何作用 , 能给我们哪些实际提升呢?
PCIe4.0是什么?
PCIe规范即是PCI-Express规范 , 一般可以翻译为周边设备高速连接标准 , 其由PCI-SIG组织进行制定 , 目前成员中有着诸多IT业界顶级公司 。 PCIe规范是在2003年提出的PC连接标准 , PCIe通道包含两个数据通道 , 从而更好的保证数据接收和发送的效率 , 每个设备拥有独立分配的带宽 , 不占用总带宽 。 而PCIe规范一直以来也是PC上的主流传输连接标准 。
我们目前使用最广泛PCIe3.0标准其实已经是10年前(2010年)制定的标准 , 而部分设备还在用到的PCIe2.0标准 , 则是在更早的2006年制定的 。 PCIe 2.0采用8b/10b的编码方式 , 拥有2.5GT/s的信号速率 , PCIe3.0的编码方式修改为128b/130b , 信号速率增长到8GT/s , 而PCIe4.0则再次翻倍 , 达到了16GT/s 。 所以在带宽方面 , ×16带宽时 , PCIe3.0为32GB/s , 而PCIe4.0则翻倍为64GB/s 。
原来不只是高带宽,PCIe4.0应用场景测试与分析文章插图
带宽越大 , 吞吐量也就越大 , 这意味着相同时间通过的数据量也就越大 。 就好比马路越宽 , 能够同时通过的车辆就越多一样 。 反映到PCIe带宽上来说 , 也就是PCIe4.0在×8的带宽下 , 就能达到PCIe3.0在×16时的带宽 , 高带宽为设备间的传输与沟通提供了更大的帮助 。 那么这样的提升具体表现在哪里呢?
平台对比凸显PCIe4.0高带宽优势
我们都知道 , 消费级桌面处理器的CPU直连PCIe通道非常有限 , 以目前主流的处理器来看 , Intel十代酷睿旗舰i9 10900K目前只有16条直出PCIe通道 , AMD第三代锐龙旗舰如锐龙9 3900X则有20条直出PCIe通道 。 直出通道的数量决定了与处理器高速互联的设备数 。
在Intel平台 , 当这个直连处理器的PCIe×16插槽只插一块显卡时 , 可以达到PCIe3.0×16全速 , 但如果使用双显卡SLI或CFX时 , 就只能使用8+8通道 , 而三个PCIe设备连接时则只能分配为8+4+4 , 在有限的PCIe通道数下 , 多设备连接速度会有所降低 , 多个高性能PCIe设备连接时无法发挥全部的性能 。
在Intel目前的消费级平台上(如Z390、Z490) , 绝大多数情况下 , 直连处理器的就是主板上的第一根PCIe3.0×16插槽 , 而NVMe等存储设备 , 使用的都是主板芯片组提供的PCIe通道 , 不是直连处理器的PCIe通道 , 在Intel平台中 , 主板芯片组和CPU通信采用的是DMI总线(基于PCIe总线打造) , 带宽和PCIe3.0×4一样为8GB/s 。 也就是说虽然主板最高能提供24条PCIe通道 , 但由于和处理器的通信带宽只有PCIe3.0×4 , 所以对于各种高速传输的设备同时运行时 , 受带宽限制并不能真正达到全速 。
原来不只是高带宽,PCIe4.0应用场景测试与分析文章插图
AMD第三代锐龙平台不但提供了PCIe4.0 , 同时还多提供4条用于NVMe的通道
在AMD第三代锐龙平台中 , 首先处理器就提供了20条PCIe4.0通道 , 对应在B550和X570主板上 , 则可以直接划分为用于显卡的PCIe4.0×16直连和用于NVMe的PCIe4.0×4直连 , 在单条NVMe的情况下 , 存储不必为了跑满速而去抢占显卡的通道 。 同时 , AMD第三代锐龙处理器和主板(B550/X570)芯片组的通信带宽同样也升级到了PCIe4.0×4 , 可以提供16GB/s的带宽 , 能更好的满足多个高速设备同时工作时的带宽需求 。
【原来不只是高带宽,PCIe4.0应用场景测试与分析】实测分析PCIe4.0高带宽具体表现
在去年AMD第三代锐龙处理器推出时 , 宣布支持PCIe4.0之后 , AMD自家的RX 5700/5700XT首先在消费级平台实现了显卡对PCIe4.0的支持 , 随着NVIDIA RTX 30系列显卡的推出 , 目前市面上的主流显卡已经全部实现了对PCIe4.0的支持 。 而目前PCIe4.0的应用 , 主要也集中在显卡和NVMe SSD上 。
原来不只是高带宽,PCIe4.0应用场景测试与分析文章插图
使用Intel酷睿i9 10900K平台 , RTX 3080在3DMark的PCIe带宽测试中成绩为12.93 GB/s
原来不只是高带宽,PCIe4.0应用场景测试与分析文章插图
使用AMD锐龙9 3900X平台 , RTX 3080在3DMark的PCIe带宽测试中成绩为26.17 GB/s
我们使用NVIDIA RTX 3080进行了PCIe 4.0的测试 , 并使用第三代锐龙处理器+X570主板和十代酷睿+Z490主板进行了对比测试 。 从3DMark的PCIe带宽测试来看 , RTX 3080在支持PCIe 4.0的第三代锐龙处理器+X570主板上的带宽测试达到26.17GB/s , 而在仅支持PCIe3.0的十代酷睿+Z490主板上则只有12.93GB/s的带宽 , 可以很明显的看到PCIe4.0的两倍于PCIe 3.0的带宽 。