GPU|苹果M1 Max GPU解析:低耗高能的秘密并不复杂


GPU|苹果M1 Max GPU解析:低耗高能的秘密并不复杂
文章图片

GPU|苹果M1 Max GPU解析:低耗高能的秘密并不复杂
文章图片

GPU|苹果M1 Max GPU解析:低耗高能的秘密并不复杂
文章图片

GPU|苹果M1 Max GPU解析:低耗高能的秘密并不复杂
文章图片

GPU|苹果M1 Max GPU解析:低耗高能的秘密并不复杂
文章图片

GPU|苹果M1 Max GPU解析:低耗高能的秘密并不复杂

2021年10月19日凌晨 , 苹果召开了可能是他们2021年的最后一场新品发布会 , 正式推出了包括AirPods 3 , MacBook Pro 14和MacBook Pro 16在内的一系列新品 。
而在此次的新品中 , 最受关注的毫无疑问就是两个不同尺寸的全新MacBook Pro了 。 毕竟 , 此次其既升级了miniLED背光的1600nit超高亮XDR 120Hz屏幕、带来全面改进的键盘结构 , 增加了大量实用接口的同时 , 还首次配备了快充 , 同时在续航能力上也几乎实现了翻倍 。
当然 , 最为重要的是 , 随着新款MacBook Pro的发布 , 苹果方面也彻底完成了旗下MacBook产品线的自研芯片替换进程 。 而全新MacBook Pro上所使用的M1 Pro和M1 Max两款“大号”PC芯片 , 自然也就成为了此次发布会最大的亮点 。
M1 Pro和M1 Max , 你知道它们有多强吗
自从去年苹果推出划时代的M1芯片后 , 几乎所有业内人士都很明白 , 这意味着其几乎一定会将自研PC芯片扩展到高性能工作站 , 甚至是服务器产品线 。 而早在10月19日这场发布会之前 , 关于“M1X”或者“M2”的传言也早已满天飞 。
然而大家都没有想到的是 , 苹果的新款PC芯片在命名上完全脱离了以往的规则 , 而是采取了更接近自家消费级产品的风格 。 不止如此 , 它们甚至还不只是一款 , 而是总共包含了两个型号、五种不同细分配置的“家族” 。
首先是定位“相对较低”的M1 Pro , 其采用了8大核+2小核的CPU设计 , 晶体管数量为337亿个 , 配有320KB L1指令缓存、192KB L1数据缓存 , 并提供了高达28MB的超大L2缓存设计 。 此外 , 内存控制器规格为四通道LPDDR5-6400 , 内存位宽总共256bit , 内存带宽高达204.8GB/s 。 与此同时 , M1 Pro还集成了一个ProRes视频处理加速单元、一个16核心的AI加速处理单元(算力11Tops) , 以及一个最大16核心、浮点性能5.2TFlops的GPU单元 。
除此之外 , 苹果此次还推出了定位更高的M1 Max 。 它的CPU部分与M1 Pro基本一致 , 也是8大2小的10核心设计、320KB+192KB的L1缓存 , 以及28MB的超大L2缓存 。 但是与M1 Pro相比 , M1 Max的内存子系统、视频处理加速单元 , 以及GPU单元规格全部翻倍 , 这意味着它最大支持64GB、带宽高达409.6GB/s的LPDDR5内存 , 具备能够同时处理7条8K分辨率视频流 , 且功耗极低的视频加速处理单元 , 并且其32核GPU的总算力也达到了惊人的10.4TFlops 。
这样的是一个什么概念呢?用苹果自己的话来说 , 这代表着M1 Pro或M1 Max的CPU可以仅用30%的功耗 , 就达到相当于市面上x86架构八核笔记本电脑处理器的同等性能 。 而根据我们三易生活查阅到的数据显示 , MacBook Pro 16上M1 Max芯片的内存带宽 , 已经达到了当前最顶级家用台式机处理器锐龙线程撕裂者PRO 3995WX(八通道DDR4-3200内存)的两倍 。
深入探究苹果新GPU设计 , 它的诀窍其实并不复杂
【GPU|苹果M1 Max GPU解析:低耗高能的秘密并不复杂】当然 , 如果你还想了解更多有关新款MacBook Pro的配置信息和功能特点 , 那么推荐大家可以去翻看我们三易生活今天早些时候发布的《新款MacBook Pro“炸场” , 苹果自研芯片再度傲视全行业》一文 , 其中会有更加详细的产品解析 。
而接下来我们要讲的 , 可能是到目前为止还没有其他媒体分析过的一件事 , 那就是此次M1 Pro与M1 Max的GPU设计 , 以及它们背后所体现出来的产品设计思路 。
首先 , 让我们来看看M1 Pro和M1 Max的GPU性能数据 。 根据目前的公开信息显示 , M1 Pro的16核GPU单精度浮点算力为5.2TFlops , 整个SoC的功耗约为65W;而M1 Max的32核GPU单精度浮点算力为10.4TFlops , 整个SoC的功耗为100W 。
以M1 Max为例 , 10.4TFlops的GPU单精度浮点算力意味着什么呢?这意味着它的理论性能已经超过了桌面版Geforce RTX2080S(10.14TFlops)、移动版Geforce RTX3080 Max-Q(9.585TFlops) , 或是PS5集成的Oberon GPU(10.28TFlops)的水准 。