AlphaGo原来是这样运行的,一文详解多智能体强化学习( 八 )
4. 总结
多智能体强化学习(MARL)是结合了强化学习和多智能体学习这两个领域的重要研究方向 , 关注的是多个智能体的序贯决策问题 。 本篇文章主要基于智能体之间的关系类型 , 包括完全合作式、完全竞争式和混合关系式 , 对多智能体强化学习的理论和算法展开介绍 , 并在应用方面列举了一些相关的研究工作 。 在未来 , 对 MARL 方面的研究(包括理论层面和应用层面)仍然需要解决较多的问题 , 包括理论体系的补充和完善、方法的可复现性、模型参数的训练和计算量、模型的安全性和鲁棒性等 [15] 。
