√ 两张表让您了解AlphaGo Zero（阿尔法零）昨天一早外出

昨天DeepMind发布了万众瞩目的新论文；不巧一早有事外出，下午回来后赶紧补功课：首先把附加福利83张相关棋谱放到围棋宝典App的云棋谱库里，然后就开始学习各大媒体对它的报道。

1、AlphaGo族谱

版本时间战胜等级分Fan2015-10樊麾3100+Lee2016-03李世石3600+Master2017-01顶尖s5000-Ke2017-05柯洁5000-Zero2017-10自我5000+

（以上等级分为约略，根据论文原图目测）

版本Ke是我加的，虽然其实也是Master，但经过几个月肯定比年初的Master高一些。

趋势：水平越来越高、硬件越来越省（上表自Master开始均只有4个TPU，Lee要48个TPU，Fan是176个GPU）、学习时间越来越短（Zero从零开始到超越Master只用了40天，而Master是花了几个月）。

TPU者，张量处理器也；为深度学习量身定制的芯片，效率更高；预期普及时间：2025年。

Zero并不与AlphaGo从围棋界隐退矛盾：所谓“技术仍继续，就是不比赛”。

AlphaGo的目标远大，比如解决科技难题、医学难题，经济、军事。。。说不定还能解决哲学难题。

2、Zero出关记

Zero英文意思是：零。除了围棋最基本规则（棋盘的几何学定义、轮流落子规则、终局输赢计算、打劫等），它就是一张白纸。放弃参考任何人类棋谱，完全自我学习。

自学小时成就0渣渣3战5渣 + 贪吃蛇，以提子、填子为乐19学会死活、实利与外势等概念70表现得训练有素，富于变化，已达super-human水准(不知怎么译，但比职业顶尖低)3×24超越Lee21×24追上Master40×24超越Master

注意：学习时间很短，是由于TPU运行得太猖狂。Nature微博的说法：“几天训练完成了近500万盘棋”。要知道1天只有86400秒。职业棋士一生平均有1000局正式比赛么？

一个犀利的说法是：如果击败李世石的版本Lee算是与人类围棋几千年发展顶峰的标尺的话，那么Zero用了3天就做到了。

略感欣慰的是：Zero40天演化出的着法，有不少与人类非常相似，从侧面证明了人类对围棋技术的追求很有价值。

那么它是围棋上帝么？肯定不是。即使将来有一个AI能让Zero九子，它也不是，因为存在它自己和自己下的悖论。

3、Zero的原理

/dog /dog /dog

4、Zero棋谱

围棋宝典APP（安卓版和iOS）的云棋谱库均收录了相关棋谱共83张。下载（文末二维码）打开就能看到。

棋谱肯定看不懂，不过欣赏一下总是可以的；依次欣赏这83谱，就相当于观赏了围棋技术发展史，不过，是一部AI的围棋发展史。

下边是AlphaGo Zero最初自学时的一谱：

完全是刚见到棋盘的初学者的样子，满天星、撒豆兵。有点像初中物理讲的电子云。

至541手终局，双方都很兢兢业业的填子、提子，对于“对方可能不会提自己的子”，似乎双方都充满期望和热情，毫不衰减。

此阶段对局发布了20局。

Zero追上并超越Lee的棋谱，20局。

Zero之后继续双手互搏的棋谱，20局。

Zero追上并超越Master的棋谱，20局。

还有3谱各阶段有代表性的棋谱。

围棋宝典，助您涨棋。

内置数百专辑、数千名局、数万习题。

300万部手机的共同选择，各市场累计下载次数1300万+。

↑苹果、安卓均可长按二维码下载↑