阿里巴巴|里程碑式的突破!阿里达摩院创造世界纪录,果然没让马云失望


阿里巴巴|里程碑式的突破!阿里达摩院创造世界纪录,果然没让马云失望
文章图片
阿里巴巴|里程碑式的突破!阿里达摩院创造世界纪录,果然没让马云失望
文章图片
阿里巴巴|里程碑式的突破!阿里达摩院创造世界纪录,果然没让马云失望
文章图片
近日 , 阿里云官网透露:阿里巴巴达摩院以81.26%的准确率创造世界纪录 , 这意味着AI在“读图会意”上首次超越人类基准(80.83%) , 取得了里程碑式的突破 。
这意味着阿里巴巴达摩院在AI技术领域再度取得令人瞩目的成绩 , 果然没有让马云失望 。
作为计算机科学的一个分支 , 随着人工智理论、技术的不断成熟以及应用领域的不断扩大 , 最近几年AI技术取得了相当不错的发展 。 2017年“人工智能”一度成为中国媒体十大流行语之一 。
毫无疑问 , 人工智能的不断发展 , 使得AI技术的各大分支都取得了相当不错的成绩 。 如机器人领域、自动驾驶技术等行业都在AI技术的加持下获得进步 。
遗憾的是 , 虽然近年来AI技术始终保持高速发展 , 但是在视觉问答(VQA)方面 , AI却始终没有超越人类水平 。
由于自然语言技术与计算机视觉的交融相当困难 , 所以视觉问答成为AI领域难度最高的技术 。 简单点说 , 在AI领域视觉问答属于相当难啃的“硬骨头” 。
即便如此 , AI技术想要得到进一步发展 , 挑战视觉问答是迟早的事 。 此次阿里巴巴达摩院上市的AI“读图会意”首次超越人类 , 不仅突破了AI领域最高难度的挑战 , 也为多模态研究领域进行新突破树立了信心 。
或许说到这里 , 不少读者只能感受到阿里巴巴达摩院有多么厉害 , 对于视觉问答这一抽象概念并未有太深刻的理解 。 接下来笔者简单举例 。
以一张电影照片为例 , 视觉问答主要是根据所给的图片生成正确的自然语言答案 。 简单点说 , 视觉问题需要通过对照片关键信息的提取之后根据常识给出相应的答案 。
听上去似乎很简单 , 但是在首届VQA挑战赛上 , AI最高挑战率仅为55% 。 如今阿里巴巴达摩院将这一数字提升至81.26% , 超越人类80.83%的基准线可谓是一项创举 。
那么 , 阿里巴巴在VQA领域取得81.26%的准确率意义何在?
【阿里巴巴|里程碑式的突破!阿里达摩院创造世界纪录,果然没让马云失望】除了笔者前文说到的创造世界纪录这一表面成绩之外 , 其实对于整个AI领域的发展而言也具备重要影响 , 意味着AI迈进认知智能 。
业内人士表示 , 随着人工智能的不断发展 , VQA技术拥有相当广阔的应用场景 , 未来消费者日常的图文阅读、智能驾驶甚至是医疗问诊都能够看到VQA的身影 。
所以 , 阿里巴巴保证VQA领域超80%的准确率进一步方面了用户的生活 。
如今 , 从阿里巴巴相关平台来看 , VQA已经取得了大范围的落地应用 。 比如 , 在淘宝天猫店铺中 , 不少商家就启用了VQA的视觉问答功能 。
试想一下 , 在网络或者实体店中看到一套喜欢的衣服或者包包 , 拍照之后即可通过VQA功能在淘宝店铺进行精准识别查找 , 是不是相当方便 。
如今 , VQA功能得到进一步发展 , 可以达到普通人看图问答的水平 , 一旦进一步得到推广普及 , 将使得消费者的日常生活更便利 。
文/Dong 审核/子扬 校正/知秋