傻大方


首页 > 人文 >

团队|微信AI再夺冠!斩获WMT2020国际机器翻译大赛中英方向第一名



按关键词阅读:

_原题为 微信AI再夺冠!斩获WMT2020国际机器翻译大赛中英方向第一名
作为全球学术界最具权威的机器翻译比赛 , 近日 , WMT2020国际机器翻译大赛的榜单停止提交结果并发布排名 , 其中腾讯微信AI团队在「中文-英文」翻译任务上夺得冠军 。
团队|微信AI再夺冠!斩获WMT2020国际机器翻译大赛中英方向第一名
文章图片

提交结果BLEU评分第一 , 微信AI斩获中英翻译方向冠军
WMT 是机器翻译领域的国际顶级评测比赛之一 , 自2006年创办至今 , WMT已经成功举办15届 。 大赛每年都吸引了众多来自全球的企业、科研机构和高校所组成的顶尖团队 , 包括微软、Facebook、百度、金山、日本情报通信研究机构(NICT) 。
在赛制上 , 组委会根据中英、英中、中日等不同翻译任务提供测试集 , 参赛者在线提交机器翻译结果 , 组委会将根据在国际上具有广泛认可度的BLEU自动评估指标对参赛者提交的机器译文和标准答案进行拟合计算 , 拟合程度高者排在前面 。 其中「中文-英文」翻译任务是大赛历年来竞争最激烈的领域 , 也是最大的看点之一 , 在历届冠军中 , 微软、腾讯翻译君、搜狗都榜上有名 。
此次大赛竞争激烈 , 各参赛方共计提交近300次数据 , 最终微信AI团队经过多次角逐脱颖而出 , 成功占据自动评估指标的榜首 , 斩获桂冠 。 值得一提的是 , BLEU评分前两名的机器译文均由微信AI团队提交 。 同时 , 今年微信AI仅使用了官方提供的数据(也就是受限资源) , 超过了所有使用受限资源和无限资源的系统 。
团队|微信AI再夺冠!斩获WMT2020国际机器翻译大赛中英方向第一名
文章图片

两种结构、三种训练方法 , 微信AI打造翻译领先技术
在国际上斩获佳绩与认可 , 离不开微信AI团队在人工智能领域持续不断的深耕和产品体验的持续打磨 。 自2017年以来 , 基于业界最前沿的神经网络机器翻译技术 , 微信AI团队进行了持续迭代 , 引入了最前沿的机器翻译算法 , 不断创新算法和架构 , 提升翻译能力 。
在本次大赛上 , 微信翻译在技术上以更深和更宽的Transformer结构(包括Self-attention和Average-attention)和 自研的Deep Transition结构(DTMT)为基础 , 用融合领域内知识的数据增强方法迭代生成高质量的伪数据 , 并利用Self-Bleu的组合剪枝策略集成模型并利用集成模型的知识蒸馏单模型 , 除了常规的交叉熵训练 , 还采用三种改进的训练方法来缓解偏差问题 , 包括改进的Scheduled Sampling训练方法、针对目标端输入的抗噪训练和更稳定的最小化贝叶斯风险训练 。
目前 , 微信翻译已成为一个日翻译数十亿字符的大型多语言机器翻译引擎 , 支持多语种间的双向翻译 , 在翻译质量上均达到业界领先水平 。 服务场景已涵盖微信对话翻译、朋友圈翻译、微信扫一扫等 , 同时还为腾讯小微、微信对话开放平台、微信读书、QQ邮箱等提供翻译服务支持 , 后续会陆续运用于更多的场景 。
团队|微信AI再夺冠!斩获WMT2020国际机器翻译大赛中英方向第一名
文章图片

(微信对话翻译场景)
基础研究与技术开源 , 微信持续深耕人工智能
除了在智能翻译领域取得优秀成绩外 , 微信AI团队在其他领域也建树颇多 。 不仅在2018、2019蝉联DSTC冠军 , 还在2019年获得RACE中高考题榜单第一名、DROP数学推理榜单第一名和QuAC多轮交互推理榜单第一名 , 凸显了微信AI团队在对话和推理方面的技术实力 。
在自然语言处理领域顶级会议ACL 2019中 , 由中科院计算所和微信AI等团队合作的文章“Bridging the Gap between Training and Inference for Neural Machine Translation” , 获得了最佳长论文奖项(Best Long Paper) , 这也是中国大陆第一篇获此奖项的文章 。 随后 , 在ACL 2020中 , 微信AI团队亦有7篇论文入选 , 覆盖机器翻译、信息抽取、对话系统等领域研究成果 。 两年来 , 微信AI团队已有16篇论文入选ACL 。
基于深度学习研发的微信智聆语音识别技术 , 每天处理超过4亿条语音 , 语音识别正确率达到97% , 并在微信语音输入、语音转文字、王者荣耀、QQ音乐等产品中提供了技术支持 。 而专注智能对话和NLP的微信智言 , 则以腾讯小微开放能力为核心 , 为除了家居硬件、PaaS、行业云和AI Bot等领域提供技术支持 , 让人与机器以最自然、最便捷的方式交流沟通 。
在技术开源方面 , 微信AI开发自研并开源了Transformer推理引擎 , 这也是腾讯对外开源的第100个项目 。 该推理引擎在CPU/GPU两种硬件平台上都可以获得最佳性能表现 , 速度快于pytorch/tensorflow和目前主流Transformers加速方案 , 且更适合NLP任务特点 , 无需图层次预处理 , 支持变长输入序列输入 。 TurboTransfromers在腾讯内部的游戏、内容生态、广告与金融等领域获得了广泛使用和认可 。
【团队|微信AI再夺冠!斩获WMT2020国际机器翻译大赛中英方向第一名】在未来 , 微信AI将持续加大对人工智能领域的学习与投入 , 积极将技术升级运用在产品之中 , 并创新整合新型能力 , 基于微信平台生态带来覆盖更广的应用场景和更智能的产品体验 , 为12亿微信用户提供更优质的智能服务 。分页标题


    来源:(网络)

    【】网址:/a/2020/0709/1594271625.html

    标题:团队|微信AI再夺冠!斩获WMT2020国际机器翻译大赛中英方向第一名


    上一篇:港股挖掘机|海通恒信(01905)累计新增借款占上年末净资产45.86%

    下一篇:冲锋舟|冲锋舟翻了怎么办?看蓝朋友如何做到乘风破浪


    人文

    国际社会|捷克一辆旅客列车同货运列车相撞 致1死35伤

    阅读(49)

    海外网7月15日电 据《多伦多星报》15日报道 , 捷克官员称 , 当地时间14日晚上9点30分 , 一辆旅客列车在捷克首都布拉格附近同一辆货运列车相撞 , 旅客列车驾驶员在事故中死亡 , 35名乘客受伤 。 当时旅客列车上约有100人 , 伤者已被直升机送往医院治疗...

    人文

    DeFi|去中心化金融(DeFi)市场投资逻辑?

    阅读(45)

    前一阵子的大年夜热项目----去中间化交易所路印也在前段时光创出了将近3倍的┞非幅。这些敏捷窜起的项目都是DeFi的细分范畴,这使得不少投资者都关怀它们的大年夜热是不是预示着下一波的高潮就是DeFi?如不雅下一波的高潮是DeFi,那么投资者如今是不是还有机...

    人文

    诈骗|钱这么好赚,你为啥自己不干?

    阅读(47)

    近期,北京通州公安分局台湖派出所接辖区居民徐先生报警称,其在网上被他人以刷单的名义骗走2万余元。经了解,当天下午16时许,徐先生在某刷单微信群里接到一份刷单任务,让徐先生下载某购物app,并使用群里提供的账号进行登录,随后指示徐先生将购物车中的三...