ARM中国发布“周易”Z2 AIPU处理器:性能翻倍、最多32核心


ARM在中国的分支“安谋中国”此前虽然陷入了尴尬的人事动乱 , 但在技术和产品层面 , ARM中国还是很有两把刷子的 , 这几年也结出了累累硕果 。
今天 , ARM中国正式发布了“周易”Z2 AIPU , 一颗针对深度学习而自主研发的创新性AI专用处理器(AI Processing Unit) 。
它的单核算力最高可达4TOPS(每秒4万亿次计算) , 相比上代“周易”Z1 AIPU提升了一倍 , 同时可扩展至最多32个核心 , 从而能在单个SoC中实现128TOPS的强大算力 。
2018年11月 , ARM中国发布了名为“周易”的人工智能平台 , “周易”Z1 AIPU也是ARM中国合资公司成立后第一款正式对外发布的本土研发IP产品 。
该平台得到了很多中国客户的信赖 , 多家厂商等已经完成相关产品研发和流片 , 比如全志科技的R329 AI语音专用芯片 。
ARM中国发布“周易”Z2 AIPU处理器:性能翻倍、最多32核心
本文插图
“周易”Z2 AIPU延用了此前的架构 , 并在微架构上进行优化 , 芯片面积减少30% , 运行部分神经网络模型时 , 相同算力配置下的性能提升可达100% , 效率翻了一番 。
内存子系统也进行了优化 , 并升级了高级带宽节省技术(ABST) , 除了上代已有的权重压缩(weight compression) , 还新增加了feature map压缩技术 。
它提供三种配置 , 分别是:4TOPS算力的Z2-1104、2TOPS算力的Z2-1002、1TOPS算力的Z2-0901 。 目前 , LAC版本开发已完成 , 所有配置的EAC版本将在年底前向中国客户提供 。
“周易”Z2 AIPU主要面向中高端安防、智能座舱和ADAS、边缘服务器等应用场景 , 客户芯片预计2021年面世 。
ARM中国发布“周易”Z2 AIPU处理器:性能翻倍、最多32核心
本文插图
“周易”AIPU针对人工智能计算定义了一套新的适用于AI算法的指令集 , 通过指令驱动向量处理单元、固定AI算法处理单元 , 从而完成各种复杂网络的组合的操作 , 支持各种AI计算 , 并具有很好的安全性 。
它既有完全的可编程性 , 同时又有固定AI算力单元的高效率性 , 构成了相对平衡的平台型AI解决方案 , 还有仿真器、编译器、调试器等全套开发工具 , 支持ARM NN、安卓NN等流行接口 , TensorFlow、ONNX等主流AI框架 , 以及合作伙伴的自有OS、Runtime框架 。
ARM中国发布“周易”Z2 AIPU处理器:性能翻倍、最多32核心
本文插图
【ARM中国发布“周易”Z2 AIPU处理器:性能翻倍、最多32核心】