阿里巴巴集团:3万字详细版 介绍阿里巴巴达摩院15个实验室研究领域和科研成果( 四 )


德州大学达拉斯分校博士 。 拥有50篇会议和期刊论文 。 研究领域包括声纹识别、语种识别、音频检测、语音识别、机器翻译、自然语言理解、推荐系统等 。 曾任Facebook和SRI的研究科学家 。
阿里巴巴集团:3万字详细版 介绍阿里巴巴达摩院15个实验室研究领域和科研成果
本文插图
王雯
王雯 达摩院语音实验室资深技术专家
普渡大学计算工程博士 。 在IEEE/ACL会议和期刊上发表了100篇以上的论文 。 研究领域包括自然语言理解、自然语言处理、机器翻译、深度学习、语言模型、语音识别等 。 曾任SRI资深研究科学家 。
机器智能 视觉实验室 致力于研发与运用图像和视频的分析和理解、三维视觉等技术 , 构建以图像视频为媒介的产品和应用 , 提升商业效率或创造商业新机会 , 广泛应用于新零售、新媒体、新制造等领域 。
研究方向

  • 图像理解与分析
研发图像分类、目标检测、特征表示学习、关键点提取、大规模向量搜索引擎等基础技术 , 解决商品图像 , 通用图像 , 人脸人体 , 文本图像的识别、搜索、分析等问题 。
  • 视频理解与挖掘
研发视觉跟踪、视频标签、视频生成等基础技术 , 解决在海量视频中进行高效和稳定的视频审核、搜索和编辑等问题 。
  • 图文理解
研发图文互搜、图文共搜、价格预估等跨媒体内容理解的核心技术 , 解决跨媒体内容理解与分析等问题 。
  • 三维视觉
研发硬件扫描、点云处理、纹理映射、三维分类/检测/特征表达等基础技术 , 解决小物体、人体及人部件在特定场景的三维模型生成、识别、搜索等问题 。
  • 线下智能
研发摄像头网络、传感器融合、行人跟踪与重识别、人体姿态估计、物体检测与识别等基础技术 , 解决人的身份识别、人的全域追踪、动作序列分析、商品定位和识别、人货绑定等问题 。
产品及应用
  • 拍立淘和图像搜索云产品研发了业界领先的图像搜索与识别技术 , 并应用于多种场景 。 每天有超过1700万人通过淘宝和天猫使用拍立淘的以图搜图功能 。 基于阿里云平台 , 研发了图像搜索云产品 , 为具有海量图像搜索需求的客户(如电商、相册、图库类网站)提供完整的以图搜图解决方案 。 目前已经有若干海外和国内用户 , 比如澳洲和新西兰领先的时尚和运动零售商THE ICONIC 。 了解更多
  • 三维智能制造通过三维视觉技术 , 提供行业个性化定制方案 , 打通消费者、品牌商和工厂的链路通道 。 目前在鞋履产业 , 通过高效精确的三维扫描和搜索匹配算法 , 实现精准鞋款推荐、精准营销;并通过制造端楦体自动生成、智能推理等技术降低个性化定制的成本 , 实现精准制造 。 了解更多
  • 媒体AI解决方案通过多媒体数据的审核、标签、内容生成、版权保护等多维度的媒体AI技术 , 提升传统媒体行业能效并节省成本 。 已与中央电视台、东方卫视、央视网、新华社等国内传媒巨头建立合作 。
  • 新零售场景人货场数字化使用摄像头等传感器和视觉技术改造原有门店或者构建全新无人店 , 实现店铺内对人的追踪和空间定位、货架商品SKU识别及货架陈列合规的检查、人货关联等功能 , 从而推动商场、超市、酒店等的人货场数字化 , 并在此基础上做进一步的商业分析 。 该方案已经被用于盒马门店 。
研究团队
阿里巴巴集团:3万字详细版 介绍阿里巴巴达摩院15个实验室研究领域和科研成果
本文插图
任小枫
任小枫 达摩院视觉智能实验室负责人
华盛顿大学计算机科学与工程系客座教授 , 拥有加州大学伯克利分校博士学位 。 加入阿里巴巴之前 , 曾担任亚马逊资深主任科学家 , 负责Amazon Go计算机视觉算法的研发 。 相关论文被引用10,000次以上 , 是CVPR和ICCV会议的领域主席 。