性能新星 Inno3D RTX 3070冰龙超级版评测( 二 )


性能新星 Inno3D RTX 3070冰龙超级版评测文章插图
HDMI 2.1支持8K
NVIDIA Ampere架构下的3070
映众GeForce RTX 3080冰龙超级版采用了NVIDIA Ampere架构 , 在对显卡进行测试之前 , 我们首先来了解一下30系显卡的架构问题 , 比较一下相对于上一代20系显卡的提升 。
性能新星 Inno3D RTX 3070冰龙超级版评测文章插图
第一代RTX架构 Turing下的2070
性能新星 Inno3D RTX 3070冰龙超级版评测文章插图
第二代RTX架构 Ampere下的3070
相较于初代的Turing RTX架构 , NVIDIAAmpere架构在算力上有着成倍的增长 , 这一点在RTX 3070中依旧有体现 , 每个时钟执行2次着色器运算 , 而Turing为1次 , RTX 3070的着色器性能达到20.3 TFLOPS单精度性能 , 而Turing为7.9 TFLOPS 。
NVIDIAAmpere架构翻倍了光线与三角形的相交吞吐量 , RT Core达到39.7 RTTFLOPS , 而Turing为23.8 RT TFLOPS 。
全新的Tensor Core可自动识别并消除不太重要的DNN权重 , 处理稀疏网络的速率是Turing的两倍 , 算力高达162.6 TensorTFLOPS , 而Turing为60.3 TensorTFLOPS 。
性能新星 Inno3D RTX 3070冰龙超级版评测文章插图
RTX 3070的GPU核心拥有174亿个晶体管 , 392平方毫米的面积 , 基于三星的8nm NVIDIA定制工艺 , 另外在RTX 3070中我们都知道仍然采用了GDDR6显存 , 不过不同于RTX 3080的Micron , RTX 3070采用了三星的GDDR6显存 。
我们在发布会中经常听到性能翻倍的说法 , 其实是因为本次NVIDIAAmpere的SM在Turing基础上增加了一倍的FP32运算单元 , 这就使得每个SM的FP32运算单元数量提高了一倍 , 同时吞吐量也就变为了一倍 。
而通常我们计算显卡的CUDA数量 , 并不是把SM中的所有单元加起来计数 , 而是只统计FP32单元的数量 , 所以这样一来 , SM中的【FP32 : INT32】 从 1:1 变为 2:1 。
RTX 3070共有5888个CUDA , 其实它只有2944个INT32单元 , 但由于内部的FP32数量翻了一倍 , 所以最终实现了5888这个惊人的数字 。
而这样粗暴的提升CUDA数量对于游戏有帮助吗?答案是有 , 不仅有提升还很大 。 其实通常在游戏中浮点运算相比整数计算要常用的多 , 图形、算法以及各种计算操作中着色器工作负载通常需要混合使用FP32算数指令 , 而FP32的加速也有助于光线追踪降噪着色器 。
3D MARK理论性能测试
首先介绍一下测试平台 , 为了保证此次评测能够发挥Inno3D GeForce RTX 3070冰龙超级版显卡的最佳性能 , 主板和CPU采用了目前桌面旗舰级配置 , 具体如下 。
性能新星 Inno3D RTX 3070冰龙超级版评测文章插图
在测试成绩上 , 基准测试采用3DMARK , 游戏性能测试使用游戏自带Benchmark , 同时为了减小误差 , 每项测试成绩均测试3遍取平均值 。
性能新星 Inno3D RTX 3070冰龙超级版评测文章插图
GPU-Z参数
首先看一下GPU-Z的参数 , Inno3D GeForce RTX 3070冰龙超级版采用了GA104核心 , 三星8nm , 芯片面积392平方毫米 , 相比RTX 3080的628小了236平方毫米 , 拥有5888个CUDA , 频率为1500-1785MHz , 而公版为1725MHz , 从非公的基本参数来说 , 属于超公版的水平 。 显存方面与20系显卡相同 , 采用了8GB GDDR6显存 , 位宽为256bit , 显存带宽达到了448GB/s , 光栅单元和纹理单元分别为96和184 。
下面先进行的是用来衡量显卡DX11理论性能的3DMARKFS套装:FS,FSE,FSU三者分别对应显卡在1080P、2K、4K的理论性能 , 取显卡分数实际测试结果如下:
性能新星 Inno3D RTX 3070冰龙超级版评测文章插图
3D MARK FS套装测试
在针对显卡DX11性能的3DMARK FS套装测试中 , 映众RTX 3070冰龙超级版相较RTX 2080Ti互有胜负 , 赢面更大一些;但是相比RTX 2070的提升非常大 , 在FS中分数高48% , 在FSE中分数高55% , 在FSU中分数高62% 。
而映众RTX3070冰龙超级版与公版RTX 3070的差值比较稳定 , 均在3%左右 。
性能新星 Inno3D RTX 3070冰龙超级版评测文章插图
3D MARK TS套装测试
在针对DX12环境下的Time Spy和Time Spy Extreme测试中 , 映众RTX3070冰龙超级版成绩全部领先RTX 2080Ti , 如果说在DX11环境下领先不多 , 在DX12环境下新架构的优势就凸显出来了 。
映众RTX3070冰龙超级版相比RTX 2070的TS分数高58% , TSE中分数高66% 。 而相比公版RTX 3070的领先幅度为4%左右 。
性能新星 Inno3D RTX 3070冰龙超级版评测文章插图