八卦君说事:计算机视觉还远未得到解决:令人困惑的现象

机器视觉一直是人工智能热潮中最成功的故事之一 , 使从自动医疗扫描到自动驾驶汽车的一切成为可能 。 尽管全视算法的准确性已经得到了极大的提高 , 但这些系统仍然会被人类可以毫不费力地破译的图像所迷惑 。
八卦君说事:计算机视觉还远未得到解决:令人困惑的现象
文章图片
图1
如图一 , 这些图都不是特别混乱的 , 你可以看到锤子 , 烤箱手套 , 虽然顶部中间的图像有点难以辨认 , 但不需要很长时间就能看出它是一张椅子 。 与此同时 , 一种先进的机器视觉算法可能只能识别其中的一两个物体 , 这对我们的汽车驾驶系统来说是一个巨大的挑战 。
但这正是这些图像被制作出来的原因 。 它们是由麻省理工学院(MIT)和IBM的科学家们为测试人工智能视觉极限而编制的数据集ObjectNet的一部分 。 “我们创建这个数据集是为了告诉人们 , 物体识别问题仍然是一个难题 , ”研究科学家BorisKatz表示 , “我们需要更好、更智能的算法 。 ”
计算机视觉科学家们相信 , 更好的数据会构建更好的算法 , ObjectNet数据集将对此有所帮助 。 ObjectNet数据集包含了5万张从奇怪的角度或令人惊讶的环境中观察到的物体的图片(比如沙发上倒放的茶壶或浴室里背朝上的餐椅) , 其思想是用于测试和评估不同算法的能力 。
八卦君说事:计算机视觉还远未得到解决:令人困惑的现象
文章图片
【八卦君说事:计算机视觉还远未得到解决:令人困惑的现象】这类图像很难被计算机处理 , 因为它们不会出现在训练数据中 , 而且这些系统对真实世界中的物体如何工作的了解是非常有限的 。 人工智能系统不能轻易地在不同的角度、在不同的灯光下将它们以前见过的物品中推断出来 。
事实确实如此 , 当ObjectNet的创建者在他们的图片上测试一些流行的机器视觉系统时 , 他们发现它们的准确率下降了40%到45% 。
你可能会说 , 因为这些图片是为了愚弄人工智能而设计的 , 所以这并不是一场真正公平的对决 。 但在我们信任这些系统之前 , 我认为最好先了解它们的弱点 。 如果我们想知道算法在现实世界中的表现如何 , 我们应该用人类的眼睛看得到的东西来测试它们 , 这些图像是它们以前从未见过的 , 这样才能看出这些系统的表现具体如何 。
八卦君说事:计算机视觉还远未得到解决:令人困惑的现象
文章图片
人工智能工程师多年来一直在研究这个问题 , 然而 , 计算机视觉系统的脆弱性是众所周知的 。 他们以前甚至发布过类似的数据集来训练这些系统 , 比如这个由自然产生的令人困惑的图像(而不是ObjectNet的图片 , 它们是故意摆出来的)汇编而成的数据集 。 提高人工智能视觉系统的性能也不是不可能的 , 这需要时间、努力和训练 。 人工智能系统就像人类大脑一样 , 长时间去观察某样东西是变得擅长它的第一步 。