车东西 最强国产自动驾驶芯片出炉!两颗就能玩转L3级自动驾驶( 二 )


蔚来和上汽分别是国内最强的新造车和传统车企 , 芯动能背后是国家集成电路产业投资基金和屏幕巨头京东方 , SK则是韩国电信巨头 。
黑芝麻的股东背景同样豪华 , 尤其是蔚来和上汽的入局 , 也让华山二号芯片的量产落地充满了看点 。
二、如何做到高算力?自研AI加速器和ISP是关键自动驾驶系统非常依赖神经网络 , 对芯片的AI算力要求极高 。
各大芯片玩家们则纷纷推出了整合有CPU、GPU、ISP、DSP等多个处理器的SoC芯片来予以对应——黑芝麻的华山二号芯片就是一颗整合了20多个核心的SoC 。
在SoC内部 , 不同芯片企业也选择了不同的技术路径 。
比如英伟达Xavier内部使用了自家极强的GPU来增强AI算力 , 赛灵思的MPSoC内部则整合了自己擅长的FPGA , 特斯拉FSD芯片则靠自研的NPU加速 。
在单记章看来 , GPU加速确实性能很强 , 但问题是GPU相比专用的AI加速器还是太通用了 , 它可以适配各类神经网络是一个优势 , 但问题是功耗大成本高 。
FPGA的优点是硬件可编程 , 可以适配不同算法 。 但是对车企和Tier1的软件工程师来说 , 还需要掌握硬件编程语言 , 用起来太复杂 。
最终 , 黑芝麻选择了跟特斯拉一样的NPU路线 , 在SoC里面集成了一个名为DynamAINN引擎的NPU来进行AI加速 。
这个NPU内部最多可搭载4个3D卷积MAC阵列、1个2DGEMM阵列 , 以及1个EDP运算单元和5个DSP , 支持4/8/16位多种运算精度 , 工作频率为1.2GHz 。
这么多的计算单元 , 既保证了大算力 , 同时又能够适配不同的神经网络 , 并进行压缩和稀疏性加速 , 从而让A1000最高可以实现70TOPS的AI算力 , 以及超过80%的硬件利用率 。
车东西 最强国产自动驾驶芯片出炉!两颗就能玩转L3级自动驾驶
文章图片
▲A1000芯片的AI加速引擎
自动驾驶系统对摄像头的依赖极强 , 视频画面又是进行AI计算的基础 。 对于一款自动驾驶芯片来说 , 能够对图像进行优质的前端处理至关重要 。
这方面 , 基于单记章等核心成员在图像处理芯片领域的积累 , 黑芝麻在A1000这颗SoC内还集成了自研的高性能ISP , 以保证让汽车看的更清 。
单记章告诉车东西 , 得益于高性能ISP , A1000可以最多接入12路高清摄像头的画面 , (最高甚至可以达到4K分辨率) 。 再加上高达30Gbps的高带宽 , 让其可以每秒处理12亿像素 。
此外 , A1000还支持HDR处理 , 通过讲长曝光和短曝光的图像进行拟合 , 来让汽车在黑暗、逆光等不利环境下也能看的清楚 。
车东西 最强国产自动驾驶芯片出炉!两颗就能玩转L3级自动驾驶
文章图片
▲A1000支持HDR技术
【车东西 最强国产自动驾驶芯片出炉!两颗就能玩转L3级自动驾驶】一款自动驾驶芯片想要大规模量产 , 高算力只是第一步 , 适配性、安全性和经济性也是重要指标 。
单记章介绍称 , A1000不仅支持毫米波雷达、超声波雷达、摄像头、IMU、GPS等常见传感器 , 并且还可接入高等级自动驾驶常用的激光雷达、V2X等数据 。
该芯片从研发之初就严格遵循了车规标准 , 满足AEC-Q100G2、ISO26262ASIL-B的要求 。
在A1000内部 , 专门部署了一个安全核心 , 在其他核心失效时来保证基础功能 。 同时在实现L3及以上级别自动驾驶时候 , 多颗A1000芯片互为冗余 , 则可以达到ASILD级认证 。
经济性上 , A1000选择了目前汽车芯片主流的16nm工艺 , 并通过巧妙的设计 , 将SoC封装尺寸降低至90平方毫米 。
作为对比 , 特斯拉采用的是三星14nm工艺 , 尺寸为260平方毫米 。 英特尔家Mobileye的最新产品EyeQ5则采用了7nm工艺 。
较成熟的工艺以及较小的封装面积 , 让A1000拥有了不错的成本优势 。 再加上强大的AI算力、较低的功耗和广泛的传感器适配性 , 让这款芯片真正具备了大规模前装量产的潜力 。