AlphaStar曾在《星际争霸2》中玩到了大师级别 , 而且每一个游戏中的种族都能排到欧洲地区前0.15% 。
最初 , AlphaStar是通过研究人类玩家的录像进行训练 , 然后通过DeepMind内部的AlphaStar联赛和其他AI虚拟玩家进行对战训练 。
在每次联赛循环中 , 都会有新的参赛者从原来的分支中诞生出来 , AI系统将通过这些虚拟参赛者的游戏结果中加强学习来更新代理参数 , 这也是DeepMind所使用的一种“关系性深度强化学习”的策略方法 。
当然AlphaStar的决策是非常复杂的 , 总的来说是动态多智能体训练过程的结果 。
据悉 , 最强的AlphaStar版本 , 其一周的训练量(游戏加速) , 就相当于人类200年的练习量 。
当然如果人类玩家想要战胜AlphaStar也不是不可能的 , 就是不要地图全开 。 如果在地图全开情况下估计基本上是没人能玩得过AlphaStar 。
我们是造福人类的大玩家最后提一下DeepMind对他们自己的描述:
We're a team of scientists engineers ethicists and more committed to solving intelligence to advance science and benefit humanity.
这就是一群试图解析智慧 , 造福人类的大玩家!
好了 , 本期的“最科技 , 大玩家”就介绍到这里 , 喜欢的朋友点个赞哦 , 也欢迎关注我!
- 彗星|史前人类的崛起之路
- 太阳系|825亿公里外!如果外星人飞船来到太阳系,这里最有可能发现它
- 科学家|科学家预言:“未来人类将培育出所有人体器官。”
- 外星人|外星人一定是“人”吗?他们的存在形式或超乎想象!
- 科学家|中国跨越式发展!“人造粮食”研发大获成功,有望解决粮食危机?
- 高通骁龙|LG 48英寸OLED电视降价,已不足9000,很多人拿来当显示器用
- 亚马孙热带雨林|“地球之肺”亚马逊雨林,为什么是人类禁区?到底有多恐怖?
- 太空|王亚平近照出现浮肿引发争议,真的是伙食太好了吗?真相让人心疼
- 3g|这6个多条件函数都不掌握,还敢称Excel达人?
- 科学家|宇宙中五个让人不能深思的问题,越想越觉得不可思议