密码     立即注册 自动登录 找回密码     
关闭

官方新闻APP发布!

手机客户端
亲,只会在电脑上看新闻?赶紧下载我们官方手机APP【墨尔本头条】,每天五条权威信息,身边事,天下事,一手掌握。

查看 »

 

李世石神之一手如何逼机器失误?

2016-3-14 08:48| 发布者: admin| 查看: 2335| 评论: 0

摘要: 就在舆论普遍认为“人类代表”李世石将会继续败给阿尔法狗(AlphaGo)的时候,今天,围棋人机大战的第四局,李世石中盘发力,在第78手巧妙落子,出人意料地挽回了败局,将比分改写为“3:1”,虽然总体的胜负已无法逆 ...


就在舆论普遍认为“人类代表”李世石将会继续败给阿尔法狗(AlphaGo)的时候,今天,围棋人机大战的第四局,李世石中盘发力,在第78手巧妙落子,出人意料地挽回了败局,将比分改写为“3:1”,虽然总体的胜负已无法逆转,但李世石扳回一城的胜利对人类来说可谓意义非凡。

北京时间3月13日,李世石与谷歌围棋AlphaGo(阿尔法围棋)人机五局大战第四局,继续在韩国汉城钟路区四季酒店进行。李世石在前三局比赛中0-3落后,实际已经提前宣告失利。按照双方赛前的约定,随后两局对局照常举行。

3月15日12:00(韩国时间13:00),双方最后一局比赛将在同一场地如期开战。

比赛开局阶段,李世石始终落后于AlphaGo,一直在被吊打。然而,第78手的时候,局势峰回路转,李世石在苦思25分钟后下出了关键的一步,一招极其冷门的妙手。对于这一步棋,视频观战的职业棋手、中国围棋冠军古力评价为“神之一手”。

随后,AlphaGo应对适当,一连串的差手让棋面局势利好于李世石。在第97步,AlphaGo再次出现低级失误,所下黑子被李世石果断吃掉,此时李世石已基本锁定胜局。

此后AlphaGo四处搅局,李世石不为所动。

最终,经过长达4个多小时的鏖战之后,李世石下出第180手,连续三步占优,AlphaGo中盘弃子认输,首尝败绩,李世石终于在这场人机大战中赢回“尊严”之战。

终局时的棋盘

对于戏剧性的比赛结果,网络上出现了有多种观点看法,其中最有代表性的一种说法是“AlphaGo选择性放水“。甚至还有阴谋论表示,AlphaGo今天失利是因为被改代码。那么,AlphaGo放水的可能性有多大呢?

据雷锋网采访围棋界、科学界的专业人士,对于放水说法,他们都表示,“可能性为零”。至于李世石第78步的落子,完全可以称得上是载入史册的一次妙招!

业余围棋5段的高飞龙表示:李世石创造了历史,第78步棋没有一定水平看都看不懂,很高的职业水准才能想得到。

棋手鲍云对于李世石第78步下法给予了很高的评价:“配得上最高评价神之一手。”

AlphaGo程序在大优局面的情况下被李世石的妙手打懵了,导致在随后的20来步进入疯狗状态。

鲍云表示:“AlphaGo前半盘大优,不是放水的态度。至于AlphaGo第97步的表现可以用“疯狗病发作”来形容。78-97步,机器应该有足够的(时间来)缓冲调整计算出局面走势。97确实是很“丢狗”的一步,说明算法还是有极大的问题,抗击打能力不足,崩溃的太脆了”。

那么,AlphaGo为何会出现如此明显的异常表现?

根据谷歌DeepMind创始人、Alphago原论文第一作者之一的戴密斯·哈萨比斯(Demis Hassabis)在赛后发布会上说,“衷心祝贺李世石获胜,让我们看到他是多么伟大的棋手。看AlphaGo的统计,也知道形势的变化。李世石下得非常好,给AlphaGo制造了失误。我们也非常高兴,在韩国举行这个比赛,也是为了看看AlphaGo实力,测试极限、改善提高他,也需要李世石这样优秀的天才棋手。李世石今天下得非常精彩。”

随后,哈萨比斯还在推特上发布了总结,“李世石下出白78后,AlphaGo自我感觉良好,在程序的‘值网络’(用于评估电脑胜率)中,误以为胜率达到70%,在第79手犯了错,直到第87手才反应过来它错了。”



AlphaGo的开发者哈萨比斯发布的twitter

AlphaGo另一创造者大卫·席尔瓦(David Silver)指出,李世石的神之一手,点中计算机此前不为人知的漏洞。他说:“AlphaGo是自我对局来进行学习,这样有可能会存在缺陷。我们不是职业棋手,正需要进行这场比赛,希望能寻找到这样的缺陷,发现AlphaGo的极限。今天在棋盘中央就看到了,李世石下得非常漂亮,我们希望能促进AlphaGo的进步。期待周二的第五局比赛。”

专家表示,AlphaGo的弱点,可能是在极为复杂的局面,计算存在误区及盲点,当遇到无法想象的问题时,可能会按照人工智能的本能处理,做出奇奇怪怪的举动。

高飞龙猜测,很可能是蒙特卡洛算法本身的一个缺陷。“78步本身是盲点,(李世石)小概率的选点,很可能导致(AlphaGo)在正确率很高的算法上出现意外事件,导致出错。”如果这一猜测成立,人类将可能找到每盘打败阿尔法的策略。而谷歌公司,将需要很长的时间来修正这一“缺陷”问题。

在赛后的记者招待会上,李世石则谈到了AlphaGo的两个弱点:一个是AlphaGo执黑棋时似乎挣扎比较多,相较执白棋时更难赢。另一个是,当它遇到出其不意的招数时,有可能会导致失误,未必是失误,就是bug。

一直低调、板着脸的李世石走进发布会场听到在场记者的掌声与欢呼声时终于露出了笑容,说出的第一句话就是感谢:“谢谢大家,我第一次因为获胜受到如此祝贺。今天能赢,我非常开心。非常感谢大家,只赢了一盘,不需要这么隆重祝贺的。”

当被问到为何在78手使出“神之一手时”,李世石坦言,这是在当时那种情况下,他唯一能走的一步棋。

“因为我前面已经输了3场,所以我的压力没有这么大。这场胜利对我来说很重要,但如果没有大家的支持,我今天也赢不了。”李世石坦言,放下了胜负的包袱,轻装上阵确实对良好的发挥起了作用。

李世石同时向DeepMind询问,“这局执白获胜,下一局能否不猜先,让我执黑,这样获胜更有意义?”哈萨比斯和席尔瓦均表示同意。

此前有专业棋手称李世石仍过于保守,并未施展出擅长的狠辣棋风。今日的人机大战第四局战至中盘,压力大减的李世石乭终于勇敢反击,打入黑棋厮杀。当他苦思25分钟打出第78手后,观战棋手纷纷惊呼喝采,视之为极为勇悍的妙着。

今天的第四局比赛,李世石执白终于战胜“阿尔法围棋”,为人类也更为他自己赢得一局可以保留颜面的胜利。

那么最后的悬念来了,两天后的第五局比赛,是李世石再下一城还是AlphaGo 4:1 荣耀收官?



北京时间3月13日,谷歌阿尔法围棋与李世石的人机大战五番棋第四局在韩国首尔四季酒店战罢。李世石中盘击败阿尔法,扳回一局。虽然1比3的比分已经无法逆转,但本局的胜利对人类来说,意义重大。赛后李世石在工作人员的陪同下来到观战室,现场媒体蜂拥而至,并报以热烈的欢呼声和掌声迎接这位真正的胜负师的到来。

走进研究室李世石的第一句话是感谢,“谢谢大家,我第一次因为获胜受到如此祝贺。今天能赢,我非常开心。非常感谢大家,只赢了一盘,不需要这么隆重祝贺的。”

李世石还说:“我想起赛前曾经说过会以5比0,或者4:1赢得比赛,如果之前我真的赢了三场,那么今天哪怕失利一场,也会是巨大的伤害。但正因为我输了三场,如今赢回一场,这一场胜利对我如此弥足珍贵,我不会拿它跟任何东西交换。是你们的鼓励和支持让我赢得这场比赛,非常感谢。”

DeepMind创始人哈萨比斯对获胜后的李世石表示祝贺,他说:“衷心祝贺李世石获胜,让我们看到他是多么伟大的棋手。看AlphaGo的统计,也知道形势的变化。李世石下得非常好,给AlphaGo制造了失误。我们也非常高兴,在韩国举行这个比赛,也是为了看看AlphaGo实力,测试极限、改善提高他,也需要李世石这样优秀的天才棋手。李世石今天下得非常精彩。”

哈萨比斯还指出:“AlphaGo今天的失利是非常宝贵的,我们回去还要改善AlphaGo。最后非常衷心祝愿李世石获胜。非常期待周二最后一场比赛。”

谷歌DeepMind巩固学习小组负责人大卫席尔瓦在讲话中谈到:“衷心祝贺李世石九段,赢得漂亮。AlphaGo是自我对局来进行学习,这样有可能会存在缺陷。我们不是职业棋手,正需要进行这场比赛,希望能寻找到这样的缺陷,发现AlphaGo的极限。今天在棋盘中央就看到了,李世石下得非常漂亮,我们希望能促进AlphaGo的进步。期待周二的第五局比赛。”

韩语解说宋泰坤九段同样向李世石送来由衷的祝贺,他说:“祝贺李世石九段。李世石今天获胜,非常敬佩他,克服了压力,发挥出自己的水平,中腹走出了妙手。随着比赛进行,李世石逐渐了解了对手AlphaGo,期待后天第五局比赛更加精彩。”

英语解说麦克雷蒙九段:“祝贺李世石先生。非常有趣的比赛,李世石78手令人震惊,估计大多数对手都会感到惊讶,包括AlphaGo。李世石确实下得非常好。”

当被问及AlphaGo的失误时,哈萨比斯表示:“AlphaGo有的棋,从职业棋手角度来看可能并非瞬间直观的选点,感觉是恶手,但事后看反而可能是好手,当然也有可能是失误。因为AlphaGo是通过计算胜率来选择落点,处理方式和人不一样。今天AlphaGo输了,所以确实是有失误的。这也看得出李世石的表现非常强。我们举办比赛,就是希望通过李世石帮助寻找他的缺陷和测试极限。”

对于AlphaGo似乎不会下出差别很大的棋,而是根据对手实力来下棋,是否之前有设置评测对手实力?的提问,大卫席尔瓦给出这样的回答:“AlphaGo不会根据对手来下棋,只是通过计算来确定每步棋胜率是多少,选择最有可能获胜的落点。如果胜率低于一定程度就会弹出提示认输,通知黄士杰博士。AlphaGo认为对手总是会下出最强手,所以要增加自己最有可能的胜率。”

此前有韩国媒体报道称这样的人机大战对李世石本身就是不公平的,对此李世石认为:“我觉得AlphaGo确实有些弱点,但我还未发现。感觉他执黑可能会有些缺陷,这次也是稍微出现了失误,所以执黑时他会更积极。关于信息不对等,这并不是最重要的。主要还是我和AlphaGo的棋力对抗,他出现意外失误并不是关键。”

哈萨比斯随即补充道:“AlphaGo并不是针对李世石来训练的,是用所有人类的棋谱来训练,接着通过自我对局来学习,所以没有专门针对李世石。即使我们要针对李世石来培训AlphaGo,是需要成千上万棋谱的。”

当被问及三连败后是否影响心情时,李世石直言:“三连败肯定会受到冲击,压力很大。但每次比赛都是很享受的,我并未受到很大冲击,也很有信心。这局执白获胜,下一局能否不猜先,让我执黑,这样对我来说获胜更有意义。”

对于这样的问题哈萨比斯和大卫席尔瓦随即与李世石对视并点了点头:“可以啊,我认为没问题。”李世石对于这样的答案表示感谢。

还有记者对于李世石今天这步78的妙手充满好奇,对此李世石给出这样的回答:“当时局面非常危险,我想了很久,感觉这是我唯一的选点,非常感谢大家给我这么多赞扬。”

友情插件推广,完美枫枫wanmeiff友情插件推广,完美枫枫97yun友情插件推广,完美枫枫vcpic
回顶部