大数据文摘:“细节狂魔”搞定方言文言文,谷歌翻译被碾压!全球首个翻译引擎进化归来
大数据文摘出品
作者:刘俊寰
最近 , 一款在线机器翻译软件在日本大火 。
这款翻译软件名叫DeepL , 大火的原因正是因为它工作太负责了 , 翻译得太过准确 , 在日本引起了热议 。
从日本网友的民间测评来看 , 不仅日语方言翻译效果杠杠的 , 连文言文也被拿下 , 要知道 , 这可是连谷歌翻译都无法做到的事 。
文章图片
但是有多精确呢?作为一个严谨的科技软件 , 当然还是要用数据来说话 , DeepL官方也公开了日英互译和中英互译的盲测结果 , 如下图所示 , 可以看出 , DeepL简直就是碾压级的存在嘛:
文章图片
盲测就是在专业译员评审们不知道哪个翻译版本是由哪个网站翻译的情况下 , 对翻译文本进行评估 , 这也一直是DeepL的测试方式之一 。
DeepL由于极好的准确性 , 也同样引爆了Reddit , 有网友指出 , DeepL不是像谷歌翻译那样从字词上进行翻译 , 从Textractor的设置上可以看到 , DeepL还支持用以前的翻译作为上下文对翻译结果进行改善 。
也有不少网友直呼“DeepL牛逼”!
文章图片
3年前 , DeepL刚出现在大众视野的时候就已经吸引到了不少目光 , DeepL首席执行官GereonFrahling曾表示 , DeepL的目标不止于翻译任务 , 神经网络将从理解文本开始 , 开启更多可能 。
至于更多可能是如何被开发出来的 , 文摘菌做了一次小小的测评 , 然后再一起来围观DeepL的发家史 , 小板凳已经放好 , 欢迎就坐~
方言、文言文、学术论文 , 机器翻译神仙打架!
不管是民间测评还是DeepL官方的盲测结果 , 都暗示着DeepL可能是目前准确率最高的机器翻译 , 到底成色怎样 , 还是要亲自动手试试才知道 。
既然本次更新也包含了简体中文 , 抱着一点点的怀疑和一点点的好奇 , 文摘菌也对DeepL进行了一次简单的测评 , 和目前主流的谷歌翻译、微软翻译、百度翻译、有道翻译进行了比较 。
本次测评分为三轮 , 第一轮方言 , 第二轮文言文 , 第三轮学术论文 。 好 , 现在我们有请五位选手入场 。
第一轮 , 我们来看看方言 。
大家都知道 , 中国方言文化博大精深 , 要是不能正确译出方言 , 那这个准确率还是要打上问号的 。
我们选择了东北话十级题目:“我嘞个去 , 你长得也太磕碜了” 。 本题有两个得分点 , 一个是“我嘞个去” , 一个是“磕碜” 。 让我们来看看五位选手的表现 。
在第一个得分点上 , 谷歌翻译成了“I'llgothere” , 微软和百度认为这是“I'llgo”的意思 , 有道则给出“Idon'tknow”的答案 , DeepL表现很好 , 正确翻译成了带有惊讶语气的“ohmygod” 。
在第二个得分点上 , 五位选手都给出了不同的答案 , 谷歌“shy”、微软“snobful”、百度“shabby”、有道“bad” , DeepL“ugly” 。
从得分点上看 , 百度在第二题表现尚可 , 有道…勉强过关吧 , 谷歌和微软则全军覆没 。 我们来欣赏一下DeepL的满分试卷:
这才第一题 , 不要担心 , 还有翻身的机会 。 接下来我们来看看文言文 , 既然DeepL都能翻译古日文 , 要是不能翻译古汉语可就不对了 。
第二轮 , 文言文 。
文言文部分我们以著名唐代诗人张九龄《望月远怀》中的名句“海上生明月 , 天涯共此时”为考题 , 这句诗的意思是 , 在辽阔无边的大海上升起一轮明月 , 使人想起了远在天涯海角的亲友 , 他此时此刻也该是望着同一轮明月吧 。
本题的得分点是看看各位选手能否用英文把整句诗的意境表达出来 。 好了 , 中文版的标准答案已经公布 , 那么五位选手的表现如何呢?
- 「百度」百度发布直播搜索大数据:疫情下电商及知识类直播增速明显
- 「科技小数据」消费信贷的客户呈现出年轻化的趋势,新消费崛起
- 中国新闻网■中国LAMOST发布最新巡天数据集 光谱总数达1448万条
- 罗永浩直播带货破亿,超7600万次商品点击,老罗直播数据完整版报告来了!
- 『未央网』4月正式上线,10家韩国金融及监管机构联合推出开放金融数据库
- 「TalkingData」打造智能化的小微企业信用评估体系?,如何用数据+算法
- #cnBeta#重大失误?NASA全面向AWS云端迁移数据 却忽略了访问成本
- 真的会有报复性消费吗?猎豹移动机器人大数据告诉你
- [光明网]大数据“复学码”助师生安全复学
- 【砍柴网】华云数据亮相第四届智慧医疗创新大赛湖南赛区 分享借云助力智慧医疗加速变革