Imagination刘国军:用“GPU+AI加速器”破局AI算力需求|GTIC2020( 三 )


NNA IP可以多网络运行 , 也就是说一个核可同时运行多个网络 , 同一个网络也可以切分到不同的核上去运行 , 这样就可以预测计算的时间 。 Imagination有一个离线工具 , 来对特定应用作分配和调度 。
根据各类实验结果 , Imagination的Tensor Tiling技术(ITT)平均可以降低90%的带宽 。
目前 , Imagination正在为ITT技术申请专利 , 这项技术也被应用于4系列NNA IP 。
ITT技术可以通过对计算任务进行tiling , 充分利用片上存储 , 提升数据处理效率 , 并节省访问外部存储的带宽 。 利用本地数据的依赖性 , ITT技术可将中间数据保存在片上存储器中 , 最大限度地减少将数据传输至外部存储器 , 从而将带宽降低多达90% 。 作为一种可扩展的算法 , ITT在拥有大量输入数据的网络上具有显著优势 。
在Imagination的解决方案里 , GPU承担计算任务 , 同时承担渲染的任务;NNA承担神经网络计算任务 。
GPU的渲染能力基于Imagination已经出货多年的专利技术——硬件虚拟化 。
借助硬件虚拟化技术 , 一个GPU可以承担多个屏的计算渲染任务 , 支持多个操作系统 。 同时 , 多个GPU之间有物理隔离 , 不会相互干扰 。
这样就实现了结合GPU的灵活性和NNA的效率 , 再加上memory , 形成一个异构的计算平台 。
这个异构计算平台具备非常灵活的任务分配和配置功能 , 上面是两个GPU , 下面是NNA , 中间有内部的总线 。 这是一种非常有效的算力配置方法 , 能满足从ADAS到自动驾驶的功能需求 。
Imagination刘国军:用“GPU+AI加速器”破局AI算力需求|GTIC2020文章插图
同时 , Imagination提供统一的API , 可以给开发者提供统一的接口去支持各种不同的网络 。 对工作量和网络类型的适配 , 都可以由统一的API支持 。 另外 , GPU IP和NNA IP支持同一个开发工具 , 这方便了广大开发者的使用 。
以上是刘国军演讲内容的完整整理 。 除刘国军外 , 在本届GTIC 2020 AI芯片创新峰会期间 , 清华大学微纳电子系尹首一教授 , 比特大陆、地平线、燧原科技、黑芝麻智能、壁仞科技、光子算数、知存科技、亿智电子、豪微科技等芯片创企 , 全球FPGA领先玩家赛灵思 , 知名IP供应商安谋中国 , 全球EDA巨头Cadence , 以及北极光创投、中芯聚源等知名投资机构 , 分别分享了对AI芯片产业的观察与思考 。 如感兴趣更多嘉宾演讲的核心干货 , 欢迎关注芯东西后续推送内容 。
Imagination刘国军:用“GPU+AI加速器”破局AI算力需求|GTIC2020文章插图