显卡|N卡又出黑科技:光追效率提升20%,这代显卡就能用上


显卡|N卡又出黑科技:光追效率提升20%,这代显卡就能用上

文章图片


显卡|N卡又出黑科技:光追效率提升20%,这代显卡就能用上

文章图片


尽管从RTX 20开始 , NVIDIA就在GPU中引入了物理光追单元 , 但是即使在性能更好的RTX 30系列显卡上 , 光线追踪依然是一个让人头疼的游戏技术 。 尽管光线追踪能提升游戏画面的真实度 , 但不可否认的是 , 这项技术的确要消耗太多的显卡资源 , 往往一个游戏开启光线追踪效果后 , 整体的帧数下滑甚至能接近50% 。 所以这项技术至今还没能成为主流 , 也是有其原因的 , 至少AMD和NVIDIA都不敢说自己的显卡能在4K高画质游戏中打开光追后 , 还能非常流畅的运行 , 哪怕是发烧级产品 。

所以现在对图形核心公司以及游戏开发人员来说 , 如何提升光线追踪的效率是非常关键的一环 。 当然从硬件角度而言 , 如果AMD和NVIDIA继续堆叠物理光追单元 , 以及改善自己的引擎 , 那自然是一个可行的方案 , 但是这就意味着显卡最终的成本会继续攀升 , 甚至达到一个用户无法接受的价格(当然现在显卡的价格也没法接受……) , 所以大家更多是想在底层做一些优化和改进 , 这样更方便性能的提升 , 也不需要花更多的成本 。
NVIDIA的科研人员一直在研究提高GPU 光线追踪性能的技术 。 最近有人发现NVIDIA发表了一篇论文 , 这其中将GPU Subwarp Interleaving视为一项潜力巨大的技术 , 这项技术可以将实时光线追踪的性能提升高达20% 。 当然现在我们还不好说这个技术的具体中文名称 , 如果强行翻译的话 , 比较合适的是“GPU子曲线交错” , 不过这个还要等NVIDIA给出一个准确的技术名词才行 。

这项技术其实就是更改GPU底层执行模式的一种方法 , 因为现在GPU渲染图像的时候 , 在设计方法上就受到光线追踪的各种限制 , GPU现在使用的是SIMD的执行模式 , 相同的渲染会被打包成一组并行执行 , 每组其实就是GPU工作时的最小执行单元 , NVIDIA将其称为“warp” 。 而GPU通过对warp的调动来隐藏渲染停顿 , 不过在实时的光线追踪运算中 , 这种可能会出现问题从而导致性能的损失 , 而“GPU Subwarp Interleaving”则是解决当前光线追踪效率不够的一个方法 。
GPU Subwarp Interleaving这项技术如何提升光追效率呢?NVIDIA的描述是:“当一个长延迟操作停止一个warp , 并且GPU的warp调度器找不到一个活动的warp来切换时 , 一个subwarp调度器可以将当前的warp切换到另一个不同的subwarp 。 ”这个说法相当拗口 , 估计只有对GPU运行机制比较了解的人 , 才能准确理解这个含义 。 不过简单来说 , 就是N卡在调动warp的时候 , GPU会更加灵活和快速 , 提升GPU的工作效率以此来提升光线追踪的性能 。

不过这种底层运作模式的改动 , 势必要涉及到架构的细微调整 。 在NVIDIA的实验中 , 更改一些底层架构的图灵显卡 , 光追性能有明显的提升 , 平均达到6.3%的提升 , 最高则能超过20%的提升 。 不过很显然这只是用图灵显卡来做测试 , 而实际上因为NVIDIA的图灵GPU比较古老 , 所以未来即使这项技术上线的时候 , 也不会支持图灵显卡 , 包括GTX 10系列和RTX 20系列实际上都不会支持GPU Subwarp Interleaving这项加强光追性能的技术 。

【显卡|N卡又出黑科技:光追效率提升20%,这代显卡就能用上】目前来看 , 这项技术会用在安培架构以及NVIDIA下一代显卡架构上 , 也就是RTX 30以及RTX 40显卡 。 虽然这项技术最近才正式披露 , 但按照惯例 , NVIDIA应该是已经研究了很久 , 所以理论上 , 安培的架构改进应该已经可以适应这项技术 , 至于下一代的RTX 40显卡更是没有问题 。 或许以后RTX 30显卡的用户 , 只需要更新一个驱动 , 就能获得更强的光追性能 。