科技俱乐部|再次证明了旗舰手机的价值,ARM的新架构( 二 )


其实不是 , 其实不如说它之所以同频进步不大、之所以能效提升甚微 , 或许这完全是ARM故意将其设计成这样的结果 。
科技俱乐部|再次证明了旗舰手机的价值,ARM的新架构
文章图片
比如说在Cortex-A78架构内部 , ARM其实对整个计算架构进行了较大幅度的加强 。 包括加倍了分支预测器的性能、将宏运算(Mops)的调度带宽增加了20%、加倍了整数处理单元的带宽 , 将加载AGU单元的数量增加了50% , 加倍了L1数据缓存和L2缓存的读写带宽等等 。
科技俱乐部|再次证明了旗舰手机的价值,ARM的新架构
文章图片
但是与此同时 , ARM又对Cortex做了一些“减法” 。 包括将L1缓存的最小可配置大小从64KB缩减到了32KB , 缩减了乱序执行的窗口和寄存器的大小 , 将L2缓存的TLB(转译后备缓冲器)从1280页减少到1024页等等 。 虽然ARM对外宣称 , 这是“为了减少内核面积 , 以很小的性能牺牲换来更高的单位效率” 。 但从我们此前分析的同频性能提升幅度便不难看出 , ARM有意控制了Cortex-A78架构的性能与成本 。
科技俱乐部|再次证明了旗舰手机的价值,ARM的新架构
文章图片
那么他们为什么要这样做呢?原因很简单 , 因为在发布A78架构的同时 , ARM还首次同步推出了定位更高的“超大核设计”——Cortex-X1 。
科技俱乐部|再次证明了旗舰手机的价值,ARM的新架构
文章图片
与Cortex-A78相比 , Cortex-X1基本上可以看作是前者的“解除封印”版 。 比如它没有为了缩减成本 , 而在设计上搞出诸多缩水 , 不仅如此 , 作为ARM首次针对移动计算推出的全新旗舰核心设计 , Cortex-X1还很明显从苹果的A系列和三星的“猫鼬”大核心当中吸取了一些经验 。 例如它可以配置到最高8MB的三级缓存 , 具备4条128bit的NEON多媒体指令单元(但受限于指令集兼容性 , 无法实现合并为256bit或512bit的模式) , 具备超大的224条乱序执行窗口 , 更大的缓存提取带宽 , 更多的操作缓存、更强的调度能力等等 。
科技俱乐部|再次证明了旗舰手机的价值,ARM的新架构
文章图片
简而言之 , 在不更换基础设计、不修改软件支持能力的基础上 , Cortex-X1可以视作是高成本的“完全版”Cortex-A78 , 它舍弃了一部分节能方面的理念 , 专注于性能提升 。 根据ARM方面出具的数据显示 , 与当前的Cortex-A78相比 , Cortex-X1的整数运算能力提升了23% , AI学习能力更是直接涨了一倍 。
公版超大核乱入战场 , 非旗舰手机或成最大输家
其实 , 经常关注各类主控跑分的朋友应该都知道 , 长久以来 , 苹果A系列与三星Exynos的旗舰手机芯片方案都牢牢霸占着移动芯片单核性能的榜首 。 这其中最大的原因 , 就是它们都有采用规格远超同期ARM公版大核心的自研“超大核”设计 。
科技俱乐部|再次证明了旗舰手机的价值,ARM的新架构
文章图片
除了联发科天玑1000 , 其他三家旗舰芯片都是“大中小”核心设计
平心而论 , “超大核”对于智能手机实际使用中的性能帮助其实未必有大家想象的那么大 。 比如三星的Exynos990在大型游戏中的性能表现 , 就要远逊色于采用公版A77大核方案的高通骁龙865 , 但是毕竟“大中小”的核心设计本身 , 确实是当前旗舰手机芯片的主流方案 。 既然如此 , 那与其让手机厂商们自己把一套大核心架构“魔改”出大核和中核两种设计 , 由ARM自己来主动推出新的大核(X1)与中核(A78)方案 , 岂不是既省事又省时间 , 还能再多赚一道钱吗 。
科技俱乐部|再次证明了旗舰手机的价值,ARM的新架构