【产业气象站】错觉:AI如何通过数据挖掘误导我们|周末读书( 二 )


另外 , 线索有时通俗易懂 , 有时却晦涩难解 。 例如 , 线索是“把它打进去 , 你就输了比赛” , 对只是资料库的计算机来说 , 很难得出以下正确问题:“什么是(台球)母球?”
还有一个难解的线索是:“翻译时 , 这支大联盟棒球队的名字会重复一次 。 ”正确问题为:“什么是洛杉矶天使队?”(WhatistheLosAngelesangels?)
2005年 , 15名IBM(国际商用机器公司)的工程师合作设计了一款能与《危险边缘》最佳玩家同台对擂的计算机 , 取名“沃森” , 以纪念IBM的首任CEO(首席执行官)托马斯·J·沃森 。 沃森在1914年接手IBM时 , IBM还只是一家仅有1300名员工、年收入不足500万美元的小公司 , 到了1956年他去世的时候 , IBM已经发展成为一家有7.25万名员工、年收入9亿美元的公司 。
“沃森”程序存储了相当于2亿页纸的内容 , 每秒可处理相当于100万本书的信息 。 除了拥有海量内存和高速处理能力外 , “沃森”还能理解自然语言 , 使用合成语音进行交流 。 与罗列相关文档或网站的搜索引擎不同 , “沃森”可按照程序并根据线索得出具体答案 。
“沃森”运用数百个软件程序 , 先识别线索中的关键字和词组 , 再与海量数据库中的关键字和词组相匹配 , 最后得出合理答案 。 按照编好的程序 , 如果线索是某个名字(如亚伯拉罕·林肯) , “沃森”就会写出以“谁是……”开头的问题;如果线索为某一事件 , 它就会写出以“什么是……”开头的问题 。 单个软件程序与某个答案的一致性越高 , “沃森”就越能确定此为正确答案 。
该程序能轻而易举地得出与“美国第16任总统”这么直白的线索对应的问题 , 但要处理有多重含义的词语时就有些困难了 , 比如 , 线索是“把它打进去 , 你就输了比赛”之类的问题 。 但是 , “沃森”不会感到紧张 , 也绝不会遗忘 。
2008年 , “沃森”做好了参加《危险边缘》的准备 , 但还有些问题需要协商 。 IBM团队担心该节目的工作人员会使用包含双关语和具有双重含义的线索 , 给“沃森”下圈套 。 这一担心也恰好揭示了人类与计算机的巨大差异 。 人类可以根据语境理解词义 , 所以能理解双关语、笑话、谜语和讽刺批评 。 而目前的计算机 , 充其量只能检查出数据库中是否含有双关语、笑话、谜语或讽刺批评 。
对此 , 节目工作人员同意随机抽取以往编写但未使用的线索 。 而节目工作人员也担心 , 如果“沃森”一得到答案就可以发出电子信号 , 会比必须通过摁按钮来答题的参赛者更有优势 。 对此 , IBM团队同意给“沃森”装根电子手指来摁按钮 , 但它还是比人类快 , 这也让“沃森”占据决定性优势 。 摁按钮快算是聪明的体现吗?如果“沃森”的反应速度降为与人类的一致 , 比赛结果又会如何?
接下来 , 在2011年的人机大战中 , “沃森”与《危险边缘》的两名前冠军肯·詹宁斯和布拉德·鲁特展开了两轮比赛 。 首轮比赛“终极危险边缘”的线索是:它最大的机场以第二次世界大战的英雄命名 , 它的第二大机场以第二次世界大战的战役命名 。
两名前冠军给出的问题为:“芝加哥是什么?”而“沃森”给出的问题是:“多伦多是什么?????”显然 , “沃森”识别出了“最大的机场”、“第二次世界大战的英雄”和“第二次世界大战的战役”这些词组 , 然后在其数据库中查找相同主题 , 但没能理解线索的第二部分(“它的第二大”)指的是该市的第二大机场 。 “沃森”给问题添加了多个问号 , 因为它计算出的这一答案的正确概率仅为14% 。
【【产业气象站】错觉:AI如何通过数据挖掘误导我们|周末读书】尽管如此 , “沃森”还是以77147美元轻松获胜 , 詹宁斯和鲁特的赛果分别为24000美元和21600美元 。 “沃森”夺得了100万美元的冠军奖金(IBM将其捐赠给了慈善机构) , 詹宁斯和鲁特也各自将奖金的一半捐赠给了慈善机构 。 “沃森”在《危险边缘》的取胜是一次价值数百万美元的宣传良机 。 在获得艳惊四座的胜利后 , IBM宣称 , 相比在《危险边缘》中与主持人亚历克斯·特雷贝克较量 , “沃森”的问答技能将运用于更重要的领域 。 IBM一直将“沃森”应用于医疗、银行、技术支持以及其他能利用庞大的数据库来解决具体问题的领域 。