中国青年网|再到落地应用，百度开启视觉”软硬结合“时代，从模型开源、到SDK开放：从模型开源、到SDK开放

_本文原题为：从模型开源、到SDK开放，再到落地应用，百度开启视觉”软硬结合“时代
9月15日，百度世界2020大会于线上正式召开，作为百度每年面向行业、媒体、合作伙伴和广大用户的最高级别的行业盛事。本次大会以“万物智能”为主题，吸引了众多行业专家、技术大咖、开发者及科技爱好者的关注。
本次大会中，百度不仅交出了一份份令人满意的人工智能最新产品、技术、落地成绩单，发布了多项AI革命性新品；更是向外界展示了一年来百度各个业务线所取得的巨大成果，例如百度移动生态、百度大脑最新技术产品获得巨大突破；百度智能云在城市、能源、工业制造等领域持续落地；小度发布“破圈战略”智能硬件新品；Apollo自动驾驶再取佳绩......
【中国青年网|再到落地应用，百度开启视觉”软硬结合“时代，从模型开源、到SDK开放】其中，计算机视觉作为AI技术的重要部分，在此次大会百度大脑分论坛上，也成为了百度重点分享的内容。百度视觉技术部总监丁二锐表示，伴随着云化概念的深入，硬件的计算能力从云到移动端、到边缘，算力以三个数量级的比例在下降。所以，百度重点建设并开源了模型小型化技术，在有限计算资源的情况下保持算法效果不降。同时，这次还向算法开发者开源了多个性能卓越的视觉模型，向应用开发者开放了多种视频生成SDK 。
为模型“健康瘦身”PaddleSlim助力Slim系列模型发布
2019年，百度推出了PaddleSlim ，提供量化、蒸馏、剪枝、网络结构搜索等压缩和设计策略，同时多种策略可快速配置组合使用，帮助深度学习开发者解决了设备上内存紧张、功耗限制、算力有限等难题。
对于业务用户来说， PaddleSlim提供完整的模型压缩和设计解决方案，目前已用于图像分类、检测、分割等各种类型的视觉场景。而对于模型压缩算法研究者或开发者来说， PaddleSlim提供各种压缩和设计策略的底层辅助接口，方便用户复现、调研和使用最新论文方法。
在此次分论坛上，丁二锐除了分享了PaddleSlim的强大能力之外，还为用户及开发者带来了一条重磅消息——Slim系列模型开源。目前， Slim系列模型不仅包括分类和检测等效果出众的基础模型，还包括业界最小的开源人脸识别和文字识别等模型。在人脸识别方向， Slim系列模型可以在效果不降的情况下，计算量只有其他开源模型的1/7 。在文字识别上，最新的模型大小仅仅只有3.1M 。
值得特别提及的是， CVPR的低功耗计算视觉比赛（CVPR2020LOW-POWERCOMPUTERVISIONCHALLENGE）也刚刚宣布了结果，百度联合清华大学在竞争最激烈的Real-timeImageClassificationUsingPixel4CPU赛道中击败众多强劲对手取得冠军。本次发布的开源分类模型中就包含了此次比赛的冠军模型。

文章图片
用技术赋予每个人独特形象业界首发多个人物生成SDK
除了在端边算法上的不断优化及模型压缩解决方案的不断完善，本次分论坛上，丁二锐还带来了百度AI视觉领域的全新产品：业界首发终端2D虚拟真人SDK、业界首发二次元人像转换SDK和业界首发端云一体虚拟形象构建及应用解决方案。

文章图片
终端2D数字虚拟真人SDK ，基于3D人脸建模、唇形预测、图像融合、GAN视频生成等技术，可实现基于5分钟视频素材的低成本形象建模，支持终端的实时对话视频生成及表情和肢体动作驱动。可以大大降低客户的购买及部署成本，同时解决网络依赖延迟的性能等问题；二次元人像转换SDK ，基于人脸分割、关键点检测、GAN视频生成、模型压缩等技术，支持肤色自定义调节、人像多种风格切换；而虚拟卡通人端云一体方案，具备秒级的形象生成、并可通过视觉和语音驱动，可以赋予每个人独特形象。这些人物生成SDK ，构成了全面的能力生态，可以为虚拟主播、智能化视频生产提供完善的解决方案。