AMD|AMD旗舰7900XT,15360核RDNA3架构,对标NV旗舰4090


AMD|AMD旗舰7900XT,15360核RDNA3架构,对标NV旗舰4090
文章图片
AMD|AMD旗舰7900XT,15360核RDNA3架构,对标NV旗舰4090

下一代AMD RDNA 3架构的Radeon RX 7900 XT和英伟达代号Ada Lovelace的GeForce RTX 4090显卡的规格再次详细说明
AMD RDNA 3架构的Navi 31核心和Ada Lovelace架构的AD102核心有望带来巨大的性能提升 , 也成为有史以来最耗电的芯片 。 虽然英伟达的目标是采用Ada Lovelace架构的整体方法 , 但AMD利用完整的MCM多芯片封装设计 , 该设计已经在CDNA 2驱动的MI200系列“Aldebaran”的发布中处于领先地位 。 AMD现在为消费端和游戏显卡使用相同的MCM技术 。 我们来谈谈得到的最新规格:
AMD Radeon RX 7900 XT
AMD Navi 31核心是旗舰RDNA 3 片 , 为下一代Radeon RX 7900 XT显卡提供动力 。 AMD将在下一代RDNA 3显卡上放弃CU(计算单元)以支持WGP(工作组处理器) 。 由于Navi 31 是MCM(多芯片封装)显卡 , 它具有两个关键IP , 一个基于台积电5nm工艺的GCD(图形核心芯片)和一个基于台积电6nm工艺节点的MCD(多缓存芯片) 。 早些时候有消息称AMD已经开发出Navi 31芯片
【AMD|AMD旗舰7900XT,15360核RDNA3架构,对标NV旗舰4090】Navi 31核心配置具有两个GCD(图形核心芯片)和一个 MCD(多缓存芯片)每个GCD有3 个着色器引擎(总共6个) , 每个着色器引擎有2个着色器阵列(每个SE2个/每个GCD6个/总共12个)每个着色器阵列由5个WGP(每个SE10个/每个GCD30个/总共60个)组成 , 每个 WGP具有8个SIMD32单元和32个ALU(每个SA 40个SIMD32/每个SE 80个/每个GCD240 个/总共480个)这些SIMD32单元组合起来构成每个GCD 7680个内核和总共15360个内核
性能方面 , 预计具有2.4-2.5 GHz频率 , 使理论性能约为75 TFLOPs(FP32) 。 与Radeon RX 6900 XT显卡相比 , 这是226%的性能提升
Navi 31(RDNA3)MCD通过下一代无限织物互连连接到双GCD , 并具有256-512 MB的 无限缓存 。 每个显卡还具有4个内存连接链接(32 位) 。 对于256位总线接口 , 总共有8个32位内存控制器 。 该卡配备高达32GB的GDDR6显存 , 以18 Gbps的速度运行 , 并提供576GB/s的带宽 。 AMD在RDNA 3产品线中使用3D无限缓存技术 , 该技术在显卡上的垂直堆栈中集成新缓存 , 类似于Vermeer-X芯片3级缓存堆叠在CCD上的方式
英伟达在Ada Lovelace显卡上使用台积电的N5(5nm)工艺节点 。 这也包括AD102产品 , 它是一个完全单体设计 。 关于特定GPU配置的最新推文中 , AD102核心的频率高达2.5GHz(平均提升2.3GHz) 。 Ada Lovelace'AD102'的显卡频率可能是2.3GHz或更高 , 作为基线和之前的规格 , 以确定性能应该在哪里

英伟达AD102“ADA显卡”似乎有18432个初步规格(可能会改变)的CUDA核心 , 安装在 144个SM单元内 。 这几乎是安培中核心的两倍 , 而安培已经是图灵的一大进步 。 2.3-2.5 GHz的频率为我们提供高达85到92TFLOP的计算性能(FP32) 。 这是现有RTX 3090 FP32性能的两倍多 , 后者包含36TFLOP的FP32计算能力
150%的性能提升看起来很大 , 但英伟达在这一代的FP32数量上已经有了安培的大幅提升 。GA102核心(RTX3090)提供36 TFLOPs , 而TU102核心(RTX2080Ti)提供13TFLOPs 。 这比 FP32 Flops增加了150%以上 , 但RTX 3090的实际游戏性能提升平均比RTX2080Ti快50-60% 。 所以如今的Flop并不等于显卡游戏性能 。 此外 , 我们不知道2.3-2.5 GHz是平均提升还是峰值提升 , 前者意味着AD102可能具有更高的计算潜力

除此之外 , 因为嗲GeForce RTX 40旗舰将保留384位总线接口 , 类似于RTX 3090 。 英伟达不会转向新显存标准 。 该卡配备24GB显存 , 单面16Gb DRAM或双面8Gb DRAM模块
英伟达Ada Lovelace为下一代GeForce RTX 40显卡提供动力 , 这些显卡与AMD的RDNA 3 架构Radeon RX 7000系列显卡正面竞争 。 关于英伟达使用MCM仍有一些猜测 。 主要针对数据中心和人工智能领域的Hopper GPU即将推出 , 采用MCM架构 。 英伟达不会在Ada Lovelace显卡上使用MCM设计 , 因此他们会保留传统的单片设计