『懂懂笔记』让计算机看懂世界:格灵深瞳与华为Atlas AI的故事( 二 )
一般来讲 , 高效的机器视觉系统取决于四个关键因素:一是核心算法 , 二是自动化大规模训练模式 , 三是智能数据挖掘和标注 , 四是基于硬件平台的计算优化 。
本文插图
如上图 , 在传统的算法开发模式中 , 工程师把大量的时间都放在处理参数等这些基础工作上 , 而真正能发挥其价值的时间占比很少 。 同时 , 机器的GPU利用率低 , 硬件无法充分发挥其效能 。 形成了对人才价值和机器价值的双重浪费 。
再看改进后的开发模式 , 通过设计与开发工具 , 帮助更好的收集和处理数据 , 工程师把数据、框架、计算资源都管理起来 , 使得训练的效率、资源的使用效率都非常高 , 工程师的时间都用要高价值的工作内容上 。
“通过虚拟化的环境 , 系统把运算资源、存储资源运用得更为高效 , 让算法工程师的工作变得简单而极致 。 ” 邓亚峰总结到 。
从前后两种开发模式对比来看 , 差别就在于一套大规模训练平台 。 “大部分公司没必要重新造轮子 。 ”在邓亚峰看来 , 打造一个高效的大规模训练平台就相当于那个“轮子” , 把算法工程师从大量的低端重复性工作中拯救出来 。
本文插图
那么又如构建一个通用又高效的轮子呢?格灵深瞳用了“数据并行+模型并行”的方式 。 简单来讲就是把数据和模型分配到不同的机器上去运行 , 通过巧妙的分割、设计 , 使得不同机器间数据交换量比较少 , 平行拓展计算资源 , 从而实现非常高的训练效率 。
这恰好就是深瞳大脑的设计思路:构建从“数据->标注->算法->训练->产品->数据”的一个正循环 , 在这个训练框架里可以支持上百卡的集群训练、支持上亿类别任务训练、支持多达上百层以及数十亿参数的深度学习模型 。 “终极目标是工程师做完这个框架 , 标注好数据 , 系统就会算出一个完美的结果 。 ”邓亚峰表示 。
找对那个“关键先生” 前面讲过 , 高效的机器视觉系统有四个关键因素 , 其中前三个都是与框架相关的 , 是靠内部工程师的智慧来解决 , 而第四个则是如何借助外力 , 选择最好的“伙伴” , 邓亚峰认为这一点极其重要:“如何选择平台 , 把计算做到极到 , 这跟效率和成本都是密切相关的 。 ”
华为Atlas、海思NNIE、Movidius、TPU、NPU……对于工程师而言 , 当前市场上的选择比较多 。 邓亚峰给出几个重要的考量标准:性价比如何?开发成本如何?能否提供一整套完整的接口和框架?生态的持续性如何?
在他看来 , 平台的完整性和生态的可持续性非常重要 。 首先 , 多平台开发和维护成本很高 。 如果一个平台不具备云、端、侧完整的能力 , 那么工程师就需要开发多平台、维护多平台 。 增加一个新平台 , 不仅资金成本增加 , 关键是时间成本可能是企业不能承受的 。 所以 , 选择具备云、端、侧完整能力的平台可以减少很多不必要的重复工作 。 其次 , 要选择一个立足于长远发展的生态 。 如果生态没有保障 , 那么可能很多前期的投入就会全部作废 , 这是更可怕的事情 。
本文插图
正是基于这样的思考 , 格灵深瞳选择了鲲鹏处理器+Atlas 300加速卡 , 结合自创的业界领先的全目标(人脸、人体、车辆、非机动车)结构化算法 , 搭建了自己的平台 , 通过系统调度、推理流水线优化、内存优化 , 最终实现单卡支持48路视频结构化 , 64路人脸识别 。 单机可以提供实现384路极致高密视频实时分析 。 这其中Atlas 300 AI加速卡是一个“关键先生” , 基于昇腾310和910 AI处理器的Atlas 300 AI加速卡提供多种数据精度 , 适用于人工智能训练和推理场景 。
- 笔记本硬盘升级改造计划,三星原厂闪存加持的康佳K520 SSD怎么样
- 【小谦笔记】修复诸多崩溃问题,安卓11迎来开发者预览2.1版本
- 「数评时代」大家可以来抄了,如何打造顶级笔记本?华硕ROG双屏旗舰给出作业
- 「」宏碁传奇14笔记本预售 价格太疯狂啦
- 原呵呵▲ZephyrusDuo15笔记本电脑:双屏炫酷,华硕ROG
- 超能网:技嘉推出新AORUSu002FAERO系列笔记本:分别针对高端电竞和专业创作市场
- 「微型计算机」打造“小钢炮”别只顾机箱主板!SFX电源应该这样选
- 【Windows Aero】技嘉推出新AORUSu002FAERO系列笔记本:分别针对高端电竞和专业创作市场
- #笔记本天空#昨天发了那么多游戏本 也就这款有点意思
- 『华硕』华硕ROG ZephyrusDuo15笔记本电脑:双屏炫酷