AI最近十年在游戏中与人类对战,不断赢得比赛是多少都有点胜之不武的

AI最近十年在游戏中与人类对战,不断赢得比赛是多少都有点胜之不武的,因为过往AI算是利用“电子化的优势战胜人类肉身”的味道 。
我们先看看过往AI都是怎么赢的,自从 AI 算法在最近 10 年有了突飞猛进后 。
最早战胜人类的 AI 是 AlhpaGo,是在围棋中获胜;
接着就是 AI 在一系列卡牌、扑克、麻将类游戏上的获胜 。其中,AI 在德州扑克的胜利是一个里程碑,因为这款游戏里包含了隐藏信息和欺诈策略 。
这就和围棋里信息全部透明仅仅是计算量大,有本质的不同 。这里面典型的 AI 包括 Deep Stack 和 Libratus 。
其次,就是 AI 在即时战略类游戏上的胜利 。比如 2019 年,AlphaStar 在星际争霸上胜过人类顶级高手;还有 2019 年,OpenAI Five 在 Dota 2 上战胜人类顶级高手;以及 2020 年 12 月,JueWu 在王者荣耀上的胜利 。
已经有了如此多先例后,在一款赛车游戏中 AI 再次战胜人类,表面上看,确实没必要再次成头条了 。但实际却不是这样的 。
因为此前 AI 战胜人类,多少有一点“利用电子化的优势战胜人类肉身”的味道 。而这一次在赛车游戏中的胜利,是尽量去除了这部分优势后的胜利 。
什么叫“利用电子化的优势战胜肉身”呢?最典型的就是靠耐久度、反应速度、操作线程取得胜利 。
比如说,在李世石和 AlphaGo 的大战里,李世石在棋局上集中精力 6 小时后会感觉疲倦,以后的水平可能就不如棋局刚开始的 1 小时 。如果时间继续拉长到 20 小时,双方在耐久度上的差距还会进一步扩大,毕竟计算机不会累 。
这一点咱们都可以理解,也能接受它会出现在人和 AI 对弈的过程中 。而另外两点——“反应速度+操作线程”,恐怕就多少让人觉得有不公平的地方了 。
比如说,在 2019 年的《星际争霸2》中,AI 选手 AlphaStar 把两位在 2018 年 WCS 巡回赛上排名前十的选手 MaNa 和 TLO 打到毫无还手之力,MaNa 更是被打出了 10 :1 的悬殊比分而惨败 。
赛后 MaNa 接受采访时,其实不是很服气 。因为他很多次失败,都是被 AI 以追猎者这种骚扰性质的兵击败的 。
但和人类对手的骚扰不同,AI 使用的是三股不同方向来袭的追猎者 。人类一般无法同时控制这么多股骚扰部队,还能同时兼顾自己的生产和防守 。
在游戏里,该点击什么位置、在哪儿建造建筑物、框选作战单位等等动作,AI都是按照计算好的结果,一次准确到位,不需要进行多次微调 。但是人类不行啊 。
尽管人类选手可能脑子里已经有了策略,但手和眼却未必来得及操作,而 AI 都是一步到位 。
虽然工程师也对 AI 的 APM 做了限制 。解释一下,APM 就是指每分钟的动作次数,你可以简单理解为操作鼠标和键盘的次数 。尽管 AI 的 APM 值已经被限制在 280 了,但那也远比人类的 390 高效准确的多 。
可 AI 的这种高效,并不是智能的一部分,只能算是执行上的超越,类似于计算器算根号 2 等于多少,就是比人算的快 。
于是,在此前的很多即时战略类游戏中,即便 AI 获胜,也并没有在战术上有什么新意 。它们使用的都是从人类选手那里学来的战术,只不过是在执行中占尽了优势而已 。
赛车游戏更是这样 。如果一款赛车游戏足够真实,那它应该能模拟真实的物理规律 。
比如说,对于屏幕里赛车的运动状态,玩家能根据轮胎对赛道的位置、侧滑量、进弯出弯路线,拆解出 N 个细微操作,时时刻刻都能找到一个完美的油门开度,让车辆速度达到轮胎最大抓地力 。
索尼的《GT 赛车 Sport》就是这样一款以拟真出名的游戏 。如果 AI 也把参数事无巨细的抓取下来,就能在每个操作细节上做到完美,找到游戏世界里一款赛车在特定跑道上的极限完成时间 。
如果是这样的话,人类选手当然会直接失败,因为人类不可能在每个细节都表现的完美 。
【AI最近十年在游戏中与人类对战,不断赢得比赛是多少都有点胜之不武的】

AI最近十年在游戏中与人类对战,不断赢得比赛是多少都有点胜之不武的

文章插图
AI最近十年在游戏中与人类对战,不断赢得比赛是多少都有点胜之不武的

文章插图
AI最近十年在游戏中与人类对战,不断赢得比赛是多少都有点胜之不武的

文章插图