次世代大作标配 光线追踪DLSS深度剖析

随着RTX 30系显卡的发布 , 人们在关心性能的同时 , 一些软性技术的应用和更新更受到玩家的青睐 , 如游戏中的光追表现和DLSS效果 。 这两种技术可以说有着划时代意义 , 光线追踪可以让我们在游戏中获得更为真实的光线效果 , 让游戏画面不断趋近于真实 , 同时还可以节省大量游戏开发者的时间 , 而DLSS效果则可以在不降低画质的情况下让帧数暴涨 。
次世代大作标配 光线追踪DLSS深度剖析文章插图
技嘉AORUS GeForce RTX 3080 XTREME 10G显卡
在新的GeForce RTX 30系显卡中 , NVIDIA更新了RT Core和Tensor Core , 并且新增了大量支持这两项技术的游戏 , 今天笔者简单为大家简单说明并进行几款游戏的实测展示 。
次世代大作标配 光线追踪DLSS深度剖析文章插图
首先介绍一下测试平台 , 为了能完全发挥技嘉AORUS RTX 3080 XTREME 10G显卡的性能 , 我们选择了目前桌面旗舰级CPU和主板i9-10900k和Z490主板 。
01RT Core及光线追踪详解
次世代大作标配 光线追踪DLSS深度剖析文章插图
光线追踪的演变经历了约半个世纪
其实 , 光线追踪的概念在很早就已经被人所提出了 。 光线追踪技术其实就是将光源产生的光线所产生的折射 , 反射等光线变化和对阴影产生的反应通过计算准确的反映到画面之中 , 为人们带来百分之百的光影效果 。
次世代大作标配 光线追踪DLSS深度剖析文章插图
光追工作原理示意
在此次的NVIDIAAmpere架构中 , NVIDIA官方宣布为第二代RT Core , 它和第一代有什么不同呢 。 首先要知道RT Core的工作原理是 , 着色器发出光线追踪的请求 , 交给RT Core来处理 , 它将进行两种测试 , 分别为边界交叉测试(Box Intersection testing)和三角形交叉测试(Triangle Intersectiontesting) 。 基于BVH算法来判断 , 如果是方形 , 那么就返回缩小范围继续测试 , 如果是三角形 , 则反馈结果进行渲染 。
相较于初代的Turing RTX架构 , NVIDIAAmpere架构在算力上有着成倍的增长 , 同时新的架构翻倍了光线与三角形的相交吞吐量 , RT Core达到58 RTTFLOPS , 而Turing为34RT TFLOPS 。
而光线追踪最耗时的正是求交计算 , 因此 , 要提升光线追踪性能 , 主要是对两种求交(BVH/三角形求交)进行加速 。
次世代大作标配 光线追踪DLSS深度剖析文章插图
RT Core的变化
在Turing的RT Core中 , 可以每个周期完成5次BVH遍历、4次BVH求交以及一次三角形求交 , 在第二代RT Core 里 , NVIDIA增加了一个新的三角形位置插值模块以及一个的额外的三角形求交模块 , 这样做的目的是为了提升诸如运动模糊特效时候的光线追踪性能 。
02《轩辕剑7》光线追踪演示
关于概念性的东西我们就说这么多 , 相信玩家更想看到的还是光追的实际效果 , 首先我们来测试一下近期上线的国产游戏《轩辕剑7》 。
次世代大作标配 光线追踪DLSS深度剖析文章插图
次世代大作标配 光线追踪DLSS深度剖析文章插图
《轩辕剑7》RTX开关对比(点击图片查看大图)
在《轩辕剑7》中 , 我们以序章的街道场景来做对比 , 第一张图为打开光追后的效果 , 光线追踪的效果显而易见 。 打开光追后街道的灯光、阴影以及太阳光在水面的反射都有很大改善 , 而游戏整体的色调也由冷变暖 , 更富有生活气息 。
次世代大作标配 光线追踪DLSS深度剖析文章插图
次世代大作标配 光线追踪DLSS深度剖析文章插图
《轩辕剑7》RTX开关对比(点击图片查看大图)
第二组对比我们选择了太史府门前 , 通过对比不难发现 , 打开光追后的效果影响了游戏整体的气氛 , 第一张的灯光氛围营造出了回家温馨的感觉 , 而第二张画面阴暗感觉马上会有什么不好的事发生 , 虽然比较符合游戏背景 , 但整体观感略差 。
03Tensor Core及DLSS详解
我们都知道光线追踪在游戏内会耗费巨大的计算资源 , 这也导致了它在20系显卡中由于算力的因素 , 玩家反响并不大 。 而在全新的NVIDIA Ampere架构中不但引入了第二代RT Core , 还有第三代Tensor Core 。
NVIDIA自Volta架构开始 , 在GPU中增加了针对深度学习加速设计的矩阵运算单元 , 并称之为Tensor Core(张量计算核心) 。
次世代大作标配 光线追踪DLSS深度剖析文章插图