“算法+算力”下半场将至——「全球AI芯片·城市智能峰会」万字( 三 )

----“算法+算力”下半场将至——「全球AI芯片·城市智能峰会」万字长文回顾//----

  赛灵思人工智能研发高级总监 单羿

  上午场第三位登台演讲的是赛灵思人工智能研发高级总监、原深鉴科技联合创始人兼CTO单羿 , 他的演讲主题是《基于FPGA定制计算构建AI系统》 。

  单羿认为 , 当前面对大量应用需求和海量非结构化数据时 , 需要的不是一个通用的处理器架构 , 而是针对不同领域的专用计算架构(DSA , domain specific architecture) , 去适配不同的应用和数据结构 , “定制计算”由此而来 , 它也是解决现在智能社会多样需求的一个重要手段 。

  他解释称 , 芯片研发周期和实现量产的时间较长 , 往往在面世后跟不上新兴的网络架构和算力要求 , 容易造成成本浪费 , 此时FPGA的硬件可编程性可以有效发挥作用 。 FPGA硬件可以反复擦写 , 降低了一次性投片的成本 , 同时也提高了面向市场的响应能力 。

  FPGA在面对AI需求时 , 存在对于算力、不同场景等多方面的挑战 。 对此 , 单羿称AI应用包括多种前处理和后处理的需求 , FPGA能够结合其深度学习的能力 , 加速这些需求 , 从而构建端到端的优化系统 。 在水平方向上 , 赛灵思能够提供多种加速库来满足各种应用需求 。 在垂直方向上 , 赛灵思既能为客户提供针对FPGA友好的参考算法 , 也能为客户在保证精度的情况下提供模型优化工具及服务 。

  当被问到赛灵思的FPGA芯片和海思3559A、3519有何不同 , 单羿则表示最大的区别在于FPGA本身 , 赛灵思是可编程的硬件芯片 , 而海思的是已经配套出来的ASIC 。 尽管后者同样可以进行一定程度的编程 , 但当模型发生较大变化时 , 他们为AI准备的功能效率可能会降低得比较快 , 赛灵思可以在硬件上进一步优化 , 使它快速适应新出现的应用需求 。

  《AI芯片——智慧城市的核心引擎》


“算法+算力”下半场将至——「全球AI芯片·城市智能峰会」万字

----“算法+算力”下半场将至——「全球AI芯片·城市智能峰会」万字长文回顾//----

  比特大陆AI产品线总裁 阮沈勇

  紧接着 , 比特大陆AI产品线总裁阮沈勇以主题为《AI芯片——智慧城市的核心引擎》的精彩演讲延续了大会的热烈气氛 。

  阮沈勇首先回顾了人工智能的历程 , 以及比特大陆AI算丰芯片的历程 。 紧接着 , 针对全球互联网每年产生10的15次方图片和视频流 , 全球安防摄像头每年产生大于10的17次方图片和视频流 , 人工智能算力需求暴涨 , 通用GPU芯片没办法满足算力暴涨的需求 , 需要专用TPU芯片代替通用GPU芯片 , 因为TPU芯片比GPU芯片性能数量级提升 , 成本和功耗数量级下降 。

  阮沈勇介绍了上个月在福州发布的比特大陆第三代AI芯片BM1684 , 这是国产自研TPU架构的AI芯片 , 是为智慧城市服务的一颗芯片 , 成为智慧城市的核心引擎 。 BM1684芯片算力强 , 支持2.2T的FP32算力 , 17.6T的INT8算力 , 卷积加速模式下 , 支持35.2T的INT8的算力;路数多 , 支持960fps的H264/H265的解码 , 480帧/秒图片编解码;强安全 , 支持可信区域、安全启动和加密算法;易扩展 , 支持16个PCIe3.0通道 , 2个千兆以太接口 , 16G的DRAM memory size , 客户可以很方便的开发算法 , 不需要为外部存储容量担心 。 基于BM1684芯片产品的性能是英伟达GPU P4的3倍 。