|ARM推出针对5nm设计的CPU、GPU核心


ARM面向7nm工艺的Cortex-A77架构在使用两年之后 , ARM公司在5月26日晚间 , 正式推出适用于5nm工艺的新一代Cortex-A78架构 , 同时带来Mali-G78 GPU、Mali-G68 GPU和Cortex-X新架构核心 。

|ARM推出针对5nm设计的CPU、GPU核心
本文插图
Cortex-A78架构
Cortex-A78架构性能提升20% , 功耗降低50% 。 根据ARM的说法 , Cortex-A78架构性能(IPC)提升7% , 功耗降低4% , 内核小5% , 四核簇面积的缩小15% 。 Cortex-A78架构就是两年前曝光的Hercules(大力神)处理器 , 是Austin微架构CPU的第三代产品 , 已经发展出Cortex-A76、Cortex-A77及Cortex-A78三代 。

|ARM推出针对5nm设计的CPU、GPU核心
本文插图
虽然Cortex-A78的微架构变化不大 , 但如果结合更先进的5nm工艺 , 会让整体的性能提升非常明显 。 ARM的说法是每核心在相同的1W功耗下 , 7nm工艺制造的Cortex-A77频率可达2.6GHz , 而5nm工艺的Cortex-A78频率提高至3.0GHz , 同功耗下性能提升约20% 。

|ARM推出针对5nm设计的CPU、GPU核心
本文插图
相同性能下 , 5nm工艺生产的2.1GHz Cortex-A78功耗比7nm工艺2.3GHz的Cortex-A77降低50% , 有助于提高5G手机的续航 。 但ARM这种对比方式属于取巧 , 并不能直观的表现性能、功耗的对比;统一计算要么在相同性能下的能耗对比 , 或者相同频率下性能、功耗的提升比例 , 这种取巧间接说明了Cortex-A78性能提升可能没有官方宣传的高 。
Cortex-A78主要面向2021年的智能手机等产品 , 但按照以往的状况 , ARM要在2021年普及Cortex-A78还是有难度的 , 而且ARM也没提到哪些公司使用Cortex-A78核心 。
Mali-G78 GPU
ARM带来新的旗舰级Mali-G78 GPU和次旗舰级Mali-G76 GPU 。 2019年采用全新Valhall图形架构的Mali-G77得到众多旗舰SoC使用 , Mali-G78就是Mali-G77的升级版 , 首次支持24个核心 , 比Mali-G77的16个增加一半 。
ARM称综合架构、工艺等各方面的改进 , Mali-G78的性能提升幅度比Mali-G77多25% , 同等工艺条件下可提升15% ,并提升10%的能效、15%机器学习性能 。
除了扩大规模 , ARM对Mali-G78的架构进行升级改进 , 官方重点强调从整个GPU实现异步时钟域 , 也就是将原本只有一个的全局时钟域改为新两级结构 , 实现上层共享GPU模块与实际着色器核心频率分离 。 使GPU的核心可以再不用的频率上工作 , 而不需要与其他部分同频 。 ARM这种改进解决几何输出与计算、纹理、引擎之间的不平衡问题 , 还能让GPU运行在不同电压上 , 从而降低功耗、提高能效 。
另外 , Mali-G78彻底重写FMA(融合乘加)引擎 , 包括新的乘法架构、新的加法架构、FP32/FP16浮点 , 可以节省30%的功耗 。

|ARM推出针对5nm设计的CPU、GPU核心
本文插图
Mali-G68是ARM首款次旗舰级GPU , 定位于Mali-G70系列、Mali-G50系列中间 , 架构、特性完全沿袭Mali-G78 , 唯一区别就是最多只能支持6个核心 。 也就是配置1-6个核心就叫Mali-G68 , 配置7-24个核心就叫你Mali-G78 。
Cortex-X1架构
Cortex-A78架构没有盲目追求性能提升 , 但ARM准备另一个全新Cortex-X1架构 , 新架构允许客户中自定义 , 让ARM合作伙伴可以打造自己的Cortex架构CPU , 满足特定用途需求 。 ARM第一款Cortex-X1架构的峰值性能将比Cortex-A77提高30% , 比Cortex-A78也提升了22% , 机器学习性能更是提升100% 。

|ARM推出针对5nm设计的CPU、GPU核心分页标题
本文插图
Cortex-X1的授权费肯定比Cortex-A系列更贵 。 近年来除了苹果之外 , 高通、三星都放弃自研ARM架构核心回归公版架构 , ARM推出Cortex-X1是一种调整 , 相当于一个官方预改进版 , 高通、华为、三星等客户可以定制不同的特性 。
【|ARM推出针对5nm设计的CPU、GPU核心】Cortex-X1充当超大核 , 更灵活的搭配1+3+4三簇核心 。 高通、海思都设计三簇核心 , 不再像之前4+4大小核搭配 , 而是变成2+2+4或者1+3+4 。 Cortex-X1的问世实际代表ARM官方认可多核簇丛配置 。 Cortex-X1可跟Cortex-A78、Cortex-A55核心搭配起来 , 一种典型的组合就是1个Cortex-X1超大核、3个Cortex-A78大核 , 再加上4个Cortex-A55低功耗小核 , 搭配1MB L2、8MB L3 , 组成一套DynamIQ集群 。