【DOTA之后新里程碑】DeepMind强化学习重大突破:AI在多人射击游(14)

,它学会了以非常高的标准玩CTF。最重要的是,学会的智能体策略对地图的大小、队友的数量以及团队中的其他参与者都具有

稳健性



下面演示了FTW智能体互相竞争的室外程序环境游戏,以及人类和智能体竞争的室内程序环境的游戏。



【DOTA之后新里程碑】DeepMind强化学习重大突破:AI在多人射击游

图:交互式CTF游戏浏览器,分别有室内和室外的程序生成环境。室外地图游戏是FTW智能体相互之间的竞赛,而室内地图上的游戏则是人类与FTW智能体之间的竞赛(见图标)。