√ 两张表让您了解AlphaGo Zero(阿尔法零)

昨天DeepMind发布了万众瞩目的新论文;不巧一早有事外出,下午回来后赶紧补功课:首先把附加福利83张相关棋谱放到围棋宝典App的云棋谱库里,然后就开始学习各大媒体对它的报道。

1、AlphaGo族谱

版本时间战胜等级分Fan2015-10樊麾3100+Lee2016-03李世石3600+Master2017-01顶尖s5000-Ke2017-05柯洁5000-Zero2017-10自我5000+

(以上等级分为约略,根据论文原图目测)

版本Ke是我加的,虽然其实也是Master,但经过几个月肯定比年初的Master高一些。

趋势:水平越来越高、硬件越来越省(上表自Master开始均只有4个TPU,Lee要48个TPU,Fan是176个GPU)、学习时间越来越短(Zero从零开始到超越Master只用了40天,而Master是花了几个月)。

TPU者,张量处理器也;为深度学习量身定制的芯片,效率更高;预期普及时间:2025年。

Zero并不与AlphaGo从围棋界隐退矛盾:所谓“技术仍继续,就是不比赛”。

AlphaGo的目标远大,比如解决科技难题、医学难题,经济、军事。。。说不定还能解决哲学难题。

2、Zero出关记

Zero英文意思是:零。除了围棋最基本规则(棋盘的几何学定义、轮流落子规则、终局输赢计算、打劫等),它就是一张白纸。放弃参考任何人类棋谱,完全自我学习。

自学小时成就0渣渣3战5渣 + 贪吃蛇,以提子、填子为乐19学会死活、实利与外势等概念70表现得训练有素,富于变化,已达super-human水准(不知怎么译,但比职业顶尖低)3×24超越Lee21×24追上Master40×24超越Master

注意:学习时间很短,是由于TPU运行得太猖狂。Nature微博的说法:“几天训练完成了近500万盘棋”。要知道1天只有86400秒。职业棋士一生平均有1000局正式比赛么?

一个犀利的说法是:如果击败李世石的版本Lee算是与人类围棋几千年发展顶峰的标尺的话,那么Zero用了3天就做到了。

略感欣慰的是:Zero40天演化出的着法,有不少与人类非常相似,从侧面证明了人类对围棋技术的追求很有价值。

那么它是围棋上帝么?肯定不是。即使将来有一个AI能让Zero九子,它也不是,因为存在它自己和自己下的悖论。

3、Zero的原理

/dog /dog /dog

4、Zero棋谱

围棋宝典APP(安卓版和iOS)的云棋谱库均收录了相关棋谱共83张。下载(文末二维码)打开就能看到。

棋谱肯定看不懂,不过欣赏一下总是可以的;依次欣赏这83谱,就相当于观赏了围棋技术发展史,不过,是一部AI的围棋发展史。

下边是AlphaGo Zero最初自学时的一谱:

√ 两张表让您了解AlphaGo Zero(阿尔法零)

完全是刚见到棋盘的初学者的样子,满天星、撒豆兵。有点像初中物理讲的电子云。

√ 两张表让您了解AlphaGo Zero(阿尔法零)

至541手终局,双方都很兢兢业业的填子、提子,对于“对方可能不会提自己的子”,似乎双方都充满期望和热情,毫不衰减。

此阶段对局发布了20局。

Zero追上并超越Lee的棋谱,20局。

Zero之后继续双手互搏的棋谱,20局。

Zero追上并超越Master的棋谱,20局。

还有3谱各阶段有代表性的棋谱。

围棋宝典,助您涨棋。

内置数百专辑、数千名局、数万习题。

300万部手机的共同选择,各市场累计下载次数1300万+。



√ 两张表让您了解AlphaGo Zero(阿尔法零)

苹果安卓均可长按二维码下载