满血PCIe 4.0:三星980PRO固态硬盘评测

PCIe 4.0进入个人电脑已有一年半 , 而而直到现在 , 它的带宽优势才首次被三星980PRO充分发挥出来 。 本次PCEVA评测的是三星980PRO的1TB版本 , 也是目前的最大型号 , 2TB版本会在稍晚些时候上市 。
满血PCIe 4.0:三星980PRO固态硬盘评测文章插图
首个满血PCIe 4.0 SSD
所谓满血状态 , 主要分两个部分:一是顺序读写速度用满PCIe 4.0带宽极限;二是能够在高队列深度下充分发挥4K随机读写能力 。 三星980PRO堪称是首个满血状态的PCIe 4.0固态硬盘 。
满血PCIe 4.0:三星980PRO固态硬盘评测文章插图
首先来看顺序读写带宽 , 他主要受到外部PCIe接口以及内部闪存接口的共同制约 。
早期的PCIe 4.0固态硬盘(群联PS5016-E16方案)只能提供5000MB/s的顺序读取速度 , 这是因为主控使用800MT闪存接口 , 800 x 8通道再除以经验倍率(通常在1.25到1.35之间) , 最终可提供的带宽介于 4740MB/s到5120 MB/s之间 。 E16受限于闪存接口速率 , 无法更充分地利用PCIe 4.0的带宽 。 而三星980Pro使用1200MT闪存接口 , 理论带宽在7111MB/s到7680MB/s之间 。
满血PCIe 4.0:三星980PRO固态硬盘评测文章插图
通常来说 , PCIe 4.0的理论带宽为8GB/s 。 但实际上8GB/s只是物理层的电气传输能力 , 由于128b/130b编码的影响 , 会损失大约1.538%的带宽 , 所以PCIe 4.0 x4实际可用带宽为:7.88GB/s 。
满血PCIe 4.0:三星980PRO固态硬盘评测文章插图
此外还有更多的额外开销 。 数据以TLP信息包传输 , 其中包括了事物层添加的Header和ECRC纠错码、数据链路层添加的Sequence Number和LCRC纠错码等等 。 而一个TLP包所能承载的有效数据量是有限的 。
满血PCIe 4.0:三星980PRO固态硬盘评测文章插图
这部分有效数据(Payload)理论上最长可以达到4096字节 , 不过通常它会受到设备以及主板支持的共同限制 , 多数情况下被限制在256字节 。 按照下图中的情况 , 我们可以计算一下数据包的效率是:256/(256+4+2+12+4+4)=90.8% 。
满血PCIe 4.0:三星980PRO固态硬盘评测文章插图
用7.88GB/s乘以90.8% , 结果是7.15GB/s , 也就是说 , 三星980Pro的7000MB/s已经非常接近PCIe 4.0 x4的带宽上限 。 三星尚未宣布980PRO 2TB版本的性能指标 , 我们拭目以待 。
接下来看高队列深度下的4K随机读写IOPS , 它主要受到主控硬件支持以及闪存访问延迟两个因素的影响 。
在SATA时代 , 受AHCI协议的影响 , 4K随机读写IOPS通常在100K以内 , 也就是10万IOPS 。
满血PCIe 4.0:三星980PRO固态硬盘评测文章插图
NVMe协议针对闪存等新型非易失性存储介质进行了大量优化 , 理论上可支持最多65535个队列 , 每个队列支持65536长度 , 但实际上主控并不能支持这么多 。 好消息是技术在进步 , 从近几代三星NVMe主控的发展可以看到 , Elpis已经能够支持128个队列 。 不过我们目前没有其他主控的队列支持数据 , 无法进行更多的比较 。
满血PCIe 4.0:三星980PRO固态硬盘评测文章插图
除了主控 , 闪存自身存取延迟也是一个重要影响因素 。 980PRO使用的三星第六代V-NAND闪存相比上代产品的存取延迟降低10%以上 , 同时功耗也降低了15% , 从而可以更快、更高效地应对数据存取 。
满血PCIe 4.0:三星980PRO固态硬盘评测文章插图
硬件拆解部分
980PRO使用了三星全新设计的ELPIS主控 , 支持128个队列 , 每队列可包含64000个命令 , 共计超过800万个命令 , 为4K随机读写效能的提升奠定了坚实的基础 。 另外 , ELPIS还采用了三星自家8nm工艺制造 , 相比同类主控的12nm工艺更为先进 , 在功耗控制上也会具备一定优势 。
满血PCIe 4.0:三星980PRO固态硬盘评测文章插图
DRAM缓存特写:三星LPDDR4(编号K4F8E3D4HF-BGCH) , 容量1GB 。 三星是当前少有的集主控、DRAM、NAND设计制造能力于一身的企业 , 使用LPDDR4作为DRAM缓存有助于降低整体功耗 , 减少发热 。
满血PCIe 4.0:三星980PRO固态硬盘评测文章插图
NAND闪存特写:三星第六代V-NAND 3D TLC(编号K9DUGY8J5C-DCK0) , 1xx层堆叠相比上代9x层提升40% , 读写延迟降低10% , 功耗降低15% 。 关于这代闪存的具体堆叠层数一直是一个谜 , 三星官网上将其标为1xx层(即100多个层) , 所以我们采用这一写法 。