「阿里巴巴」3万字详细版 纵览阿里巴巴达摩院15个实验室研究领域和科研成果( 六 )


机器智能 语言技术实验室致力于实现人与机器之间用自然语言进行有效沟通的各种理论和方法 。 包含自然语言处理核心技术 , 如分词、词性、句法、语义等多语言基础模块 , 以及情感分析、信息提取、机器翻译和机器阅读理解等技术的研究 , 已经在客服、资讯、司法、医疗等场景有广泛的应用 。
研究方向

  • 基础技术
研究词法、句法、多语言、知识表示和推理等基础技术 , 全面支持阿里经济体自然语言技术和应用需求 , 每日调用达到8000多亿次 。
  • 语义计算
研究自然语言理解和语义分析等技术 , 应用于智能问答、文本摘要、文本复述/推理等问题 。
  • 应用技术
研究情感分析、文本分类、(基于语意的)信息检索、推荐算法、文本生成、事件提取等技术 , 应用于电商 , 通讯 , 司法 , 资讯等场景 。
  • 机器翻译
研究文本机器翻译技术和多模态机器翻译(语音翻译 , 图像翻译)等技术 。 支持中、英、俄、西班牙、泰、印尼等20余种语言 , 45余种语言方向 , 日均调用量超7亿次 。
产品及应用
  • AliReader针对用户问题 , 依靠算法分析相关非结构化文本(文档、描述、网页等) , 并从文本中获取答案 , 在客服、资讯、培训等场景有着广泛的应用 。
  • AliTranx通过机器翻译、跨语言检索、小语种词法分析等技术能力 , 解决买卖家之间的语言障碍 。
  • AliNLP自然语言技术平台 。 包括全方位的NLP基础技术 , 如文本数据收集与处理技术 , 多语言的词汇、句法、语义、篇章级分析技术 , 文本分布式表示技术 , 以及情感分析、文本反垃圾、问答等垂直技术 , 每日服务调用6000余亿次 。
  • 司法大脑 结合达摩院在文本生成、知识图谱、信息提取、深度神经网络、信息检索等方向上的技术能力 , 全面梳理法律知识、总结证据标准、提炼审判规则、解构案件和法规 , 形成司法知识图谱 , 助力法官实时预判 , 提供参考裁判文书 。
  • 病历质检系统 利用NLP技术及医疗知识图谱对病历质量进行深度把关 , 促进病历的电子化和书写规范化 , 提高医疗效果、降低医疗风险 , 释放医务人员的人力 , 让他们能够专注于管理、教育与医学培训 。
研究团队
司罗
司罗 达摩院语言技术实验室负责人
卡内基梅隆大学博士 。 曾任普渡大学计算机系终身教授 。 曾获美国国家科学基金会成就奖、雅虎、谷歌研究奖等 , 发表过150余篇学术论文 。 先后担任ACM信息系统 , ACM 交互信息系统和信息处理与管理编委会副主编 。
黄非
黄非 达摩院语言技术实验室研究员
卡内基梅隆大学博士 。 在顶级会议和期刊发表文章近30篇 , 曾担任ACL、NLPCC等领域主席、IJCAI资深程序委员 。 曾在Facebook、IBM Watson等从事NLP相关工作 。 现负责组建国际化翻译创新团队 。
葛妮瑜
葛妮瑜 达摩院语言技术实验室研究员
布朗大学计算语言学博士 。 研究领域包括句法、语义和语用的数学模型;在机器翻译方面 , 从事阿拉伯、汉、英、法、西、德、意、葡、俄等语种工作 。 曾任职IBM研究院 , 从事自然语言处理和机器翻译工作 。
陈博兴
陈博兴 达摩院语言技术实验室资深算法专家
中国科学院博士 。 曾是新加坡信息与通信研究所、加拿大国家研究委员会研究员 。 发表50多篇会议和期刊论文 , 曾获MT Summit 2013最佳论文奖 。 研究领域包括机器翻译、自然语言处理和机器学习等 。
骆卫华