中国青年网|再到落地应用,百度开启视觉”软硬结合“时代,从模型开源、到SDK开放

_本文原题为:从模型开源、到SDK开放 , 再到落地应用 , 百度开启视觉”软硬结合“时代
9月15日 , 百度世界2020大会于线上正式召开 , 作为百度每年面向行业、媒体、合作伙伴和广大用户的最高级别的行业盛事 。 本次大会以“万物智能”为主题 , 吸引了众多行业专家、技术大咖、开发者及科技爱好者的关注 。
本次大会中 , 百度不仅交出了一份份令人满意的人工智能最新产品、技术、落地成绩单 , 发布了多项AI革命性新品;更是向外界展示了一年来百度各个业务线所取得的巨大成果 , 例如百度移动生态、百度大脑最新技术产品获得巨大突破;百度智能云在城市、能源、工业制造等领域持续落地;小度发布“破圈战略”智能硬件新品;Apollo自动驾驶再取佳绩......
【中国青年网|再到落地应用,百度开启视觉”软硬结合“时代,从模型开源、到SDK开放】其中 , 计算机视觉作为AI技术的重要部分 , 在此次大会百度大脑分论坛上 , 也成为了百度重点分享的内容 。 百度视觉技术部总监丁二锐表示 , 伴随着云化概念的深入 , 硬件的计算能力从云到移动端、到边缘 , 算力以三个数量级的比例在下降 。 所以 , 百度重点建设并开源了模型小型化技术 , 在有限计算资源的情况下保持算法效果不降 。 同时 , 这次还向算法开发者开源了多个性能卓越的视觉模型 , 向应用开发者开放了多种视频生成SDK 。
为模型“健康瘦身”PaddleSlim助力Slim系列模型发布
2019年 , 百度推出了PaddleSlim , 提供量化、蒸馏、剪枝、网络结构搜索等压缩和设计策略 , 同时多种策略可快速配置组合使用 , 帮助深度学习开发者解决了设备上内存紧张、功耗限制、算力有限等难题 。
对于业务用户来说 , PaddleSlim提供完整的模型压缩和设计解决方案 , 目前已用于图像分类、检测、分割等各种类型的视觉场景 。 而对于模型压缩算法研究者或开发者来说 , PaddleSlim提供各种压缩和设计策略的底层辅助接口 , 方便用户复现、调研和使用最新论文方法 。
在此次分论坛上 , 丁二锐除了分享了PaddleSlim的强大能力之外 , 还为用户及开发者带来了一条重磅消息——Slim系列模型开源 。 目前 , Slim系列模型不仅包括分类和检测等效果出众的基础模型 , 还包括业界最小的开源人脸识别和文字识别等模型 。 在人脸识别方向 , Slim系列模型可以在效果不降的情况下 , 计算量只有其他开源模型的1/7 。 在文字识别上 , 最新的模型大小仅仅只有3.1M 。
值得特别提及的是 , CVPR的低功耗计算视觉比赛(CVPR2020LOW-POWERCOMPUTERVISIONCHALLENGE)也刚刚宣布了结果 , 百度联合清华大学在竞争最激烈的Real-timeImageClassificationUsingPixel4CPU赛道中击败众多强劲对手取得冠军 。 本次发布的开源分类模型中就包含了此次比赛的冠军模型 。
中国青年网|再到落地应用,百度开启视觉”软硬结合“时代,从模型开源、到SDK开放
文章图片
用技术赋予每个人独特形象业界首发多个人物生成SDK
除了在端边算法上的不断优化及模型压缩解决方案的不断完善 , 本次分论坛上 , 丁二锐还带来了百度AI视觉领域的全新产品:业界首发终端2D虚拟真人SDK、业界首发二次元人像转换SDK和业界首发端云一体虚拟形象构建及应用解决方案 。
中国青年网|再到落地应用,百度开启视觉”软硬结合“时代,从模型开源、到SDK开放
文章图片
终端2D数字虚拟真人SDK , 基于3D人脸建模、唇形预测、图像融合、GAN视频生成等技术 , 可实现基于5分钟视频素材的低成本形象建模 , 支持终端的实时对话视频生成及表情和肢体动作驱动 。 可以大大降低客户的购买及部署成本 , 同时解决网络依赖延迟的性能等问题;二次元人像转换SDK , 基于人脸分割、关键点检测、GAN视频生成、模型压缩等技术 , 支持肤色自定义调节、人像多种风格切换;而虚拟卡通人端云一体方案 , 具备秒级的形象生成、并可通过视觉和语音驱动 , 可以赋予每个人独特形象 。 这些人物生成SDK , 构成了全面的能力生态 , 可以为虚拟主播、智能化视频生产提供完善的解决方案 。