物联网迈向低碳化,MIT团队开发出一次训练、多平台部署的AI系统( 二 )


“一个通用的 OFA 网络 , 支持在大量不同的结构设置下通过截取 OFA 网络的不同部分来进行高效推理” , HAN Lab 博士生蔡涵说 。 根据论文 , 一个 OFA 网络可包含超过 10 的 19 次方个结构设置 , 几乎覆盖了所有需要的平台 。
那么成本以外 , 准确性如何?
结果显示 , 这种方法在移动设备上提供了目前最优的 ImageNet 精度(图 3) 。
蔡涵表示:“从计算资源的角度 , NAS 方法的总计算资源是随着部署场景数量的增加而线性增长的 。 当有多个部署场景的时候 , OFA 会比 NAS 方法高效得多 。 具体上 , 在 40 个部署场景的情况下 , OFA 的总计算资源消耗是 ProxylessNAS 的 1/16 , MnasNet 的 1/1300” 。
物联网迈向低碳化,MIT团队开发出一次训练、多平台部署的AI系统
本文插图
图 3:OFA 网络只需 595M MACs 即可实现 80.0% ImageNet top-1 准确率 。
从准确率的角度 , OFA 中的子网在经过微调后可以达到比单独从头训练更好的准确率 。 在 ImageNet 上 , OFA 在大量的硬件平台和效率约束下都达到了明显好于 EfficientNet 和 MobileNetV3 的性能(图 2) 。 在 ImageNet 的 Mobile Vision 条件下(< 600M MACs) , OFA 达到了最新的 80.0% SOTA 准确率 。 OFA 网络在第三届和第四届低功耗计算机视觉比赛(Low-Power Computer Vision Challenge)中都取得了第一 。
现在 , 该研究论文已被 ICLR 2020 大会收录 , 并在 github 上开源了训练代码以及 50 个用于各种硬件平台的 ImageNet 预训练模型 , 包括了在 600M MACs 约束下达到 80.0%ImageNet 准确率的模型、预训练的 OFA 网络 。
接下来 , 团队将继续拓展 OFA 在不同应用下的效率提升 , 让 AI 轻量化 , 既能运行在云端平台也能运行在边缘设备上 。