新浪网

AlphaGo Zero后时代(1)——赢不了的职业棋手

弈客围棋

关注

确定不再关注此人吗

AlphaGo Zero后时代(1)——赢不了的职业棋手

美国电影《铁甲钢拳》中的机器人剧照

DeepMind关于AlphaGo Zero的视频和论文一发表,小编我是心事重重,彻夜未眠。

AlphaGo Zero对AlphaGo Master,近百分之90的胜率,实际上是围棋AI对人类棋手进一步的变相实力碾压,DeepMind公司已经不屑于再借用哪怕一丁点的人类围棋的经验来做人工智能的引导,也不愿再用顶尖人类棋手来做AlphaGo新版本的对手来做测试。实际上也是无法再用人类棋手来测试现在的Zero版本,之前的Master网上60局和乌镇的3局人机大战,让人类棋手已经失去了登台的意义。

不久的将来,围棋AI会否会像好莱坞大片《铁甲钢拳》中所描述的,因为机器人拳击赛的兴起,让人类职业拳击手全部失去了赖以生存的比赛舞台一样;已然倒下的多米诺骨牌,会不会让所有职业棋手的生计成为问题?

在被以AlphaGo为代表的,包括了日本的DeepZenGo,中国的绝艺,台湾的CGI等围棋AI全面碾压之后(DeepZenGo和绝艺现在对人类棋手的胜率超过百分之90),棋界内外早有人出来试图打圆场,主张职业棋手淡看胜负。他们的主张是:即便有一天无法与人工智能在棋盘上争胜,围棋文化的博大精深却不会因此受到影响,反而会借助技术发扬光大。话说得很漂亮,很可惜的是——这是一句充满阿Q精神的话。

AlphaGo Zero后时代(1)——赢不了的职业棋手

我年少时读过一个长相狰狞的外国老头,杰克韦尔奇写的一本著名的管理学图书,名字很恶俗——就叫《赢》。小时候,我们就本能的崇拜班级里跑得最快,跳得最高,最能打架的男同学了,长大了,我们喜欢看进球最多,投篮最准的球员打球。即使是虚拟无聊如王者荣耀这样的网络游戏,人类还是喜欢赢。赢的本能大概来自于人类的生物本能,人类就是那么地崇拜赢家。

同样地,对围棋而言:“赢棋”是吸引观众的首要砝码。中国围棋队总教练俞斌九段就说过一段名言:“围棋的美我觉得就在于胜负竞技,我们说这一招很美,是因为它导向了胜利。”离开了输赢,围棋之美也就成了一纸空言,空中楼阁。而再也赢不到,或者极为罕见地能赢一盘围棋AI的职业棋手们还能定义围棋的美吗?

虽然围棋这个游戏败给人工智能要比当年的深蓝战胜国际象棋棋王晚了近20年,但是围棋却和国际象棋的处境截然不同。

首先让我们了解一下当年的超级电脑深蓝(Deep Blue)。深蓝是美国IBM公司生产的一台超级国际象棋电脑,重1270公斤,有32个大脑(微处理器),每秒钟可以计算2亿步。并且"深蓝”输入了一百多年来优秀棋手的对局两百多万局。是不是给人有一种笨重的感觉?

而AlphaGo只是一个单纯的软件,AlphaGo Lee作为AlphaGo Zero的“前辈”,它需要48个TPU(神经网络训练专用芯片)支持,并在参考大量人类棋谱,自我对弈约3000万盘,训练大半年后,才在2016年3年月,AlphaGo Lee以4:1的击败韩国九段棋手李世石,引发人们关注。而AlphaGo Zero的最新版本 Zero仅需要4个TPU,零人类经验,其自我训练的时间仅为3天,自我对弈的棋局数量为490万盘。它就以100:0的战绩击败了“前辈”。是不是给人一种轻巧而进化的感觉?

我们再来对比战绩——1996年2月10日~2月17日,超级电脑深蓝首次挑战西洋棋世界冠军卡斯帕罗夫,以3败2和1胜的总比分落败。

请注意:国际象棋的第一次人机大战,卡斯帕罗夫完美地获得了胜利。这个历史意义和顶尖职业围棋棋手面对AlphaGo的比赛,每次都像是被砍瓜切菜一般的败北是不一样的。即使是李世石九段,下出“神之一手”获得人类棋手对AlphaGo的比赛中唯一获胜的一局。实际上,那并不妙手,而是一步没有用的坏棋。结果确实是赢了,但并不是人类在围棋的技术水准上击败了AlphaGo,而只是非常偶然地抓住了当时的AlphaGo Lee这个版本在算法上的漏洞。而对于这个漏洞,整个AlphaGo开发的核心团队事前其实上是心知肚明的。

AlphaGo Zero后时代(1)——赢不了的职业棋手

78“神之一手”

其后IBM的研究小组把深蓝加以改良,1997 年 5 月3 日~5月11日,在第二次人机大战中,深蓝首次在正常时限的比赛中击败了等级分排名世界第一的棋手。棋王加里·卡斯帕罗夫以 1胜2负3平的劣势输给了进化后的深蓝。

但是首先请注意:国际象棋是有和棋的!小编因为小时候经常在区体校集训,围棋队经常和象棋队,国际象棋队混在一起训练,所以久而久之,我也学会了下国际象棋,并且成了我广泛的兴趣爱好之一。(即使是今日,我把国际象棋的布局套路忘了个精光,仍能够轻易下赢Window系统自带的小游戏中国际象棋的最高水平。)而据我了解,国际象棋的比赛中,一旦有一方抱定了不想赢,只求和心思的话,除非双方有明显的实力差距,否则和棋的概率是非常高的。即使是加强版的深蓝,也没有可能在和卡斯帕罗夫的较量中百战百胜,这就使得胜负的悬念依旧存在,也可以说人类在国际象棋上虽然赢不了了,但是并不没有彻底的输掉。

AlphaGo Zero后时代(1)——赢不了的职业棋手

戴密斯·哈萨比斯(Demis Hassabis)在乌镇人工智能高峰论坛上发表演讲

AlphaGo Zero后时代(1)——赢不了的职业棋手

某位在乌镇峰会上(这哥们的名字是?我一直想知道,但是愣是没找到,请教大家)展示AlphaGo不同版本间棋力的增长幅度。

进化到Zero版本的AlphaGo和人类棋手的绝对实力差距被进一步拉大。在5月乌镇人机大会上,DeepMind在人工智能高峰论坛上表示:AlphaGo Master版本可以让AlphaGo Lee版本3个子时,我清楚地记得当时会场听众的反应——先是沉默,然后轰鸣。在公布了Master自战50局后,更有不止一位一流的职业棋手表示:恐怕Master可以让我2个。而昨晚——最新版本AlphaGo Zero对AlphaGo Master,有近百分之90胜率的消息一经发布,更是证明现在的AlphaGo Zero要让世界顶尖棋手2子,恐非妄言。事实上,我们都无需第3次人机让子棋大战来测试AlphaGo Zero是否真的能让柯洁2子,只需要DeepMind公开最新版本AlphaGo Zero或者AlphaGo Master版本让AlphaGo Lee版本3个子的数盘对局实录即可。

而国际象棋呢?——你让深蓝或者任何一个国际象棋AI试试让人类棋王一个皇后,或者一个象,又或者一个车试试?在国际象棋中,任何AI和人类棋王的实力差距,并不悬殊。这也是深蓝当年战胜棋王加里·卡斯帕罗夫,却对国际象棋这项运动赛事的发展和继续并无多大影响的关键原因所在。

而围棋呢?——我们看到的是一群再也赢不了,也和不了,被让2子还依然要输的棋王们。难道你还能说你对职业围棋赛事的继续和发展没有一丁点的危机感吗?

AlphaGo Zero后时代(1)——赢不了的职业棋手

柯洁九段(图片来自南方人物周刊)

还是柯洁最有先见之明。早在年初,柯洁在接受南方人物周刊采访时就说:“将来的事情怎么样,我说了不算,下不赢AI,是不是我们的联赛就没有人看了,赞助商就不愿意冠名了,这不由我管。”虽然这件事情不由柯洁管,但是我想,聪明如柯洁不可能不去想这个事情可能引发的连锁反应。

毕竟,泡一杯茶,坐在电脑前,就能随时随地欣赏真正顶级的围棋对弈——看AI下棋。那么,职业围棋生存的真正土壤——棋迷朋友们是不是还会继续饶有兴趣地看输得底掉的职业棋手下棋呢?

围棋圈的聪明脑袋们是不是应该去想想:AlphaGo Zero后时代的职业围棋市场化之路如何走?

后记:本文仅代表我个人观点。为了逻辑稍微严密一点,写的有点太啰嗦了,请耐心看完再喷,本人坐等万炮齐轰。其实我还言之未尽,应该还有下一篇《AlphaGo Zero后时代(2)——不再神秘的围棋,围棋文化的危机》。

(作者:王振飞)

发布于:云南

特别声明:以上文章内容仅代表作者本人观点,不代表 新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发布后的30日内与 新浪网联系。
加载中...