新浪网

一位职业棋手眼中的AlphaGo的实力

弈客围棋

关注

确定不再关注此人吗

一位职业棋手眼中的AlphaGo的实力

这一篇不知道是什么时候写的,今天偶然在关西棋院里面看到的。第二季人机大战马上就要打响,虽然日媒相当不给力,但是自己就做一点力所能及的事情吧。

胜间史朗七段分了4个环节写,我就分上下两部分来看看胜间史朗七段对AlphaGo的看法。不过这篇文章有一点时间了,对第二季人机大战的内容是没有提及,不过从第一季的人机大战里选出了一些经典案例,我们也可以温故而知新。

原文网址:http://kansaikiin.jp/alphago/

作者:关西棋院棋士,胜间史朗 七段

序言

由谷歌开发的围棋AI“AlphaGo”,击败了围棋的顶尖棋手李世石,这新闻轰动了世界。

AlphaGo它是怎么进行思考的。然后它又是怎么超过人类的,现在是不是已经高过我们了?

从我这个职业棋手的视角,给大家做一个清晰明了的解释。

第一章 什么是深度学习

AlphaGo获胜的一大要因是采用了深度学习的思考方式,如果知道了什么是深度学习的话,就更理解AlphaGo的实力了。

首先我举个例子来解释什么是深度学习。

为了能更好的理解深度学习的结构,我就拿网上的翻译软件举例。

比如翻译“I Love You”的时候,如果很机械的翻译成日语就是「私愛してるあなた」(日语是主宾谓,所以这里就翻成“我你爱”),对此做一个统计。网上的数据说,在「私」后面跟着的助词有60%的概率会显示「は」(翻译就是“我……(怎么样)”)。而后面跟着的助词有30%的概率会显示「が」(翻译就是“我会……(怎么样)”),就像这样,深度学习将会把对统计的结果进行分类,就好比围棋里面的定式那样。

同样的,接在「あなた」(你)后面是「を」(把你)或者「に」(对你)或是「が」(你……(怎么样)),深度学习也会对此进行分类。然后深度学习就会自己明白,“I”对应的是「私は」(我……(怎么样)),“You”就对应「あなたが」(你……(怎么样)),像这样会预测翻译的结果。

然后我们进入第二层思考方式。

像前面那样,经过第一层思考之后,翻译的内容就是「私は愛してるあなたが」(日语是主宾谓,所以这里就翻成“我(怎么样)你(怎么样)爱着”)。然后再去进行统计,网上显示,在「私は」(我……(怎么样))之后跟「あなたを」(把你)的概率是55%,然后「あなたに」是40%。经过多次同样的检索,翻译成比如「私はあなたを」(我会把你……),或者「私はあなたに」(我会对你……)等等,会再次对翻译的结果进行分类。

于是我们把翻译再进了一步,将「私愛してるあなた」(我你爱)翻译成了「私はあなたに愛してる」(我对你的爱),然后将分类的内容更进一步。

最后,再次对“I Love You”的翻译内容进行一个概率的统计,其中10%的情况会出现私はあなたに愛してる」(我对你的爱),90%的概率会出现「私はあなたを愛してる」(我爱你),经过层层推导之后,将概率最高的结果作为深度学习的最佳答案,然后把这个答案呈现给了我们。

也就是说,深度学习就是把“I Love You”首先对每一个单词进行翻译,然后经过多次分组,让自己数据库里的内容变多,这样它就有了学习的过程。

从第一层思考,再到第二层,第三层思考,一个又一个阶层的思考就是“深度(Deep)学习(Learning)”,并在一起就是“深度学习(Deep Learning)”了。

下面我们从围棋的角度来谈谈深度学习。

第二章 AlphaGo的思考方式

前面我们把“I Love You”的翻译作为例子,AlphaGo也同样采取了这样的手段。为了方便让各位明白,我就用压长定式进行举例。

一位职业棋手眼中的AlphaGo的实力

图1

图1就是压长定式,但在AlphaGo眼里这并不是压长定式,而是经过自己的统计和概率的判断进行推到,将这个形状作为一个局部进行了一个分类。

也就是说,只要黑1压一个之后,有60%的概率白2会选择扳一手。或者白2也有在A位长一个的选项,但是经过数据库的检索,白棋下在2位的出现率比较高,所以白2选择了扳。

但是白2是不是好棋,AlphaGo其实也不知道。至于AlphaGo凭什么只要统计和检索就可以获胜的原因,我在后面会说。

同样黑3也是,虽然黑棋也有在B位连扳的选项,但是白2扳之后有70%的概率会选择在黑3位长一个。之后也采用同样的办法,假如会下成到黑7这样的一个棋型。

在这个过程形成的变化图也会进行分类,然后做出选择,这个思考方式和翻译“I Love You”是一样的。

可能各位会误认为AlphaGo的思考方式只是在定式上面,下面的图2可能会对AlphaGo的思考方式更加清晰一些。

一位职业棋手眼中的AlphaGo的实力

图2

像图2一样,在双方的目数都比较确定的情况下,黑棋有50%的概率会下在黑1。这样的话,白棋会有80%的概率下在白2。就这样根据统计和概率下到白6。

更进一步的说,在黑1之后,有70%的概率会下到白6,也就是说,将进行到白6的变化作为一个类别进行学习。

然后我们把前面的压长定式加进来。

一位职业棋手眼中的AlphaGo的实力

图3

比如图3把前面的压长定式加了进了,在左边黑棋的模样之后,采用统计和概率进行推导,然后对黑1到白6的过程进行检索。

局面中,对各种变化图进行检索,假如黑下在A位之后黑棋有盘面10目的优势。然后采用同样的思考方式,选择出现概率最高的进展,以及将易于检索的一手棋作为下一手。

虽然这在我们人类的角度上来说,可以说是第一感的计算。但是对擅长统计分析的电脑来说,它们可能在做最高精确度的第一感的计算。

这是我们理解AlphaGo实力的一个很重要的要点,但这并不能说明,AlphaGo下出的每一手棋都是最好的。

我在第三章会讲解,我理解的AlphaGo的实力。

一位职业棋手眼中的AlphaGo的实力

进入第4期会津病院杯女流立葵杯八强的棋手们(图片摘自网络)

弈客围棋原创整理

更多精彩赛事直播,棋文弈事,尽在弈客围棋,下载弈客APP,和热爱围棋的棋友对弈手谈!

http://www.yikeweiqi.com/

发布于:云南

特别声明:以上文章内容仅代表作者本人观点,不代表 新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发布后的30日内与 新浪网联系。
加载中...