新浪网

胡耀宇:白58手一扑!DeepZenGo晕菜了!

弈客围棋

关注

确定不再关注此人吗

本文来自微信号:“耀宇围棋”,作者胡耀宇

胡耀宇:白58手一扑!DeepZenGo晕菜了!

昨天,梦百合杯世界赛32强战,日本围棋人工智能DeepZenGo(以下简称Zen)执黑半目负于中国等级分排名第49位的选手王昊洋,爆出了冷门。Zen在本局中有两处地方突然跟不会下棋一样的送死损实地损劫材,让人不能理解:

胡耀宇:白58手一扑!DeepZenGo晕菜了!

图1:实战进行至此,是黑取外势,白取实地的局面。黑1在右边连片是超级大场,黑棋右边阵势和左边外势遥相呼应,非常生动,虽然局势尚早,但是这种格局是zen相对比较擅长的。但接下来,zen突然毫无缘由的下了一串大损的交换......

胡耀宇:白58手一扑!DeepZenGo晕菜了!

图2:黑1至白14,黑棋在左上的一串交换,不仅白白损失了实地,还损失了许多宝贵的劫才!交换完这一串后,最后黑15还是回到右边连片。这有点像足球比赛中先往自家大门踢进一个,然后再接着比赛。

当然,人工智能在对局中出现这样无谓损失的交换并不罕见,但通常都会在赢定的情况下通过“剪枝”来简化局面,或者在输定的情况下抱着对手“叫吃看不见”这样孩童般天真的想法时才会出现。

今天这盘棋,在局势还远远未定局的情况下,zen为什么突然会这样“疯狂”呢?真让人百思不得其解......

胡耀宇:白58手一扑!DeepZenGo晕菜了!

图3:加藤先生局后说:“zen下着下着突然发现在左边的死活对杀判断上出现误判,混乱之际,从而突然跑到左上角下了一大堆损棋!”

那zen在左边的对杀中到底是哪里出了问题?出了问题后为何会跑到左上去下那么损的棋?下面我们来分析一下这两个问题:

胡耀宇:白58手一扑!DeepZenGo晕菜了!

先来聊一下zen的决策思考机制,按照我的理解来比喻一下:zen的每一步棋背后都有两位长老帮他做决策,一位长老叫做“策略网络”。因为围棋的变化太多,不可能被穷尽,zen虽然计算力惊人,但是也不可能把每一步棋都深度计算,那样它肯定会累死的。所以他让“策略网络”这位长老来负责“直觉”这一块的任务,当一个局面出现时,“策略网络”在短时间内迅速把盘面上那么多可选的点中以一种人类直觉的方式筛选出几个点,这样就可以使zen思考的效率大大提高。当“策略网络”这位长老筛选出几个点推荐给zen的时候,另一位长老登场了。

这位长老叫做“价值网络”。当zen收到“策略网络”推荐的几个点后,就把这几个点交给“价值网络”,价值网络再对这几个点进行深度的计算和判断,这相当于人类的理性计算。当“价值网络”通过理性深入的计算后,确认“策略网络”的推荐的点没有问题后,就把最终方案给zen看,zen一般都会选择第一推荐点。这个运行机制其实和我们人类下棋时的思考方式很像。我们思考的时候,也是先凭感觉经验大概觉得要下这几个点,然后再深入计算来理性确认。直觉(策略网络)保证了计算的效率;深度计算(价值网络)验证了直觉的正确性和可行性。

胡耀宇:白58手一扑!DeepZenGo晕菜了!

图4:这盘棋,zen前面在两位长老的辅助下,一直有条不紊的顺利工作着,直到白58手扑的出现!我觉得,白58扑之后,zen的直觉(策略网络)不仅推荐了黑A提,而且还把黑A提放到了“推荐榜前几名”中。当策略网络得意得把这步棋推荐给价值网络(深度计算)后,价值网络一计算,发现这步棋不对啊,不仅上不了推荐榜,而且还是胜率超低的一手棋啊!两位长老这下“打起来了”,那到底谁是对的呢?

胡耀宇:白58手一扑!DeepZenGo晕菜了!

图5:黑1提,白2一冲,黑3只有粘上,白4再一小尖,黑收气,以下至白8,黑棋慢一气被杀。前图的白58扑跟黑1提交换白白便宜了一口气!这就是王昊洋白58扑的用意!所以,“价值网络”这位长老的判断是对的。由于黑1这步自杀似的一手上了推荐榜前几名,而且排名太靠前!“价值网络“不得不花巨大的资源对这步棋进行验证,并说服”策略网络“,这步棋真的不能上榜,在这个内部斗争的过程中,大量的计算资源被耗费!导致zen的计算资源大减!

而这个时候,zen又必须要落子了(zen每步棋都在很快时间内下的),可左边的对杀两位长老还没争明白呢!左上又是zen需要解决的地方(局部对杀是zen思考最紧急的地方),但这时候zen的“脑力”已不足,只好在没有成算的情况下在左上行棋,结果就下成了图2实战的样子。

胡耀宇:白58手一扑!DeepZenGo晕菜了!

图6:问题还在延续,左边白58扑的这个局部一直都没有定型解消,当白136尖的时候,zen的两位长老再次出现了冲突!导致zen在左上又下出了一步超级损棋,终于将自己陷入绝境。

胡耀宇:白58手一扑!DeepZenGo晕菜了!

图7:黑167送死,这步棋太损了!本来由于白棋气紧,黑A位接上是先手,现在这一交换,黑A位接顿时变成了后手。黑棋明显亏损,局势已经不可挽回。

胡耀宇:白58手一扑!DeepZenGo晕菜了!

如果把围棋AI计算力的资源比作人类的体力,算法比作代步工具的话。排名前三的AI比赛长跑,新版阿尔法狗不仅体力超好,关键还有个滑板车代步节省体力;相比之下,绝艺和zen都还得靠跑步,不过绝艺至少还有充沛的体力,而只使用了4gpu的zen则相当于两样都没有。

虽然zen的资源最少,但加藤先生的的敬业精神让我钦佩!这张图片我特别珍藏!图中加藤先生的工作状态,以及他胸前一直佩戴着的开幕式28号抽签号码牌,让我感受到他半辈子花在围棋,花在zen身上的热情!祝福加藤先生和他的zen!

弈客围棋原创整理

更多精彩赛事直播,棋文弈事,尽在弈客围棋,下载弈客APP,和热爱围棋的棋友对弈手谈!

http://www.yikeweiqi.com/

发布于:云南

特别声明:以上文章内容仅代表作者本人观点,不代表 新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发布后的30日内与 新浪网联系。
加载中...