杭报集团主办
2016年3月10日 上一期  下一期 按日期查找
J12:特别报道 上一版  下一版
本版主要新闻
人类输了第一局
技术支持 : 北京方正阿帕比技术有限公司
杭州日报 都市快报 每日商报 都市周报 城报
萧山日报 余杭晨报 富阳日报
高级搜索
版面概览 | 版面导航 | 标题导航 返回主页
下一篇
字体:放大 缩小 默认
人类输了第一局
2016-03-10
“阿尔法围棋”之父德米什·哈萨比斯

人工智能超过人脑后会不会反过来控制人类?

“阿尔法围棋”之父自称四小时长谈说服霍金

人机大战首日·进化

去年10月,在击败欧洲围棋冠军樊麾时,“阿尔法围棋”记住了3000万张棋谱。而昨天,打败李世石的时候,它已经记住了1亿张棋谱。

深度学习、自我进化、拥有人类棋手般的直觉……“阿尔法围棋”到底有多牛?

“阿尔法围棋”是谁搞出来的?

“阿尔法围棋”是谷歌旗下“深度思维(DeepMind)”公司开发的人工智能围棋程序。2010年,“深度思维”公司成立于英国,主要研究学习玩电子游戏的人工神经网络。

短短两年时间,“深度思维”就攻克了7种电视游戏,并超过了人类神经反应极限。因此,该公司被亚马逊、脸书等多家知名网络公司看中。2014年1月,谷歌最终以约4亿英镑(约36.9亿元人民币)的价格收购了“深度思维”。其中,牵线搭桥的是“特斯拉”老板埃隆·马斯克。马斯克也是该公司最早的投资方之一。

“阿尔法围棋”之父有中国血统?

“深度思维”公司创始人、今年39岁的德米什·哈萨比斯,如今已是谷歌副总裁。他的父亲有着希腊和塞浦路斯血统,而母亲则出身自新加坡和中国人的家庭。

作为一位人工智能专家,哈萨比斯的兴趣爱好广泛。他本人是国际象棋高手,对围棋也非常感兴趣。1997年,超级电脑“深蓝”战胜国际象棋世界冠军卡斯帕罗夫。当时还在上大学的哈萨比斯就在想,有一天要为围棋写一个程序,并赢得冠军。

英国《卫报》说,哈萨比斯对于“阿尔法围棋”的骄傲之情,就像一个“好学生的家长”。他坦言,自己没有与“阿尔法围棋”对弈过,因为它的学习能力很强,自己完全不是它的对手。

它如何选择一招棋?

“阿尔法围棋”的核心是两种不同的深度神经网络——“策略网络”和“值网络”。这两种神经网络,也被称为“阿尔法围棋”的两个大脑。

“策略网络”负责挑选下一步棋该怎么走,“值网络”则通过现有棋局,预测谁可能会赢。它们“双剑合璧”,挑出明显比较好的走法。

谷歌公司说,“阿尔法围棋”落子,与人类高手符合度达57%。这里,相符合并不意味着正确,只是说人类可能会这么下棋。人类的走法,也可能是错的。

是不是每下一招

它都要回忆它知道的所有棋局?

人工智能下棋时,大多采用了一种名叫“蒙特卡洛树搜索”的算法。它是一种启发式的搜索策略,能够基于对搜索空间的随机抽样来扩大搜索树,从而分析围棋这类游戏中每一步棋应该怎么走才能够创造最好机会。“阿尔法围棋”也运用了这种算法。

假设拥有无限的计算能力,运用“蒙特卡洛树搜索”,“阿尔法围棋”理论上是可以回顾它记住的棋盘,然后计算怎么走才是最佳落子。但现实中,还没有一个人工智能能做到这一步。

“阿尔法围棋”聪明的地方就在于,它结合“深度学习”和“蒙特卡洛树搜索”,利用“深度学习”降低搜索树的复杂性。换句话说,通过反复训练,“阿尔法围棋”培出了如同人类棋手般的棋感。而这种“我觉得这样下会赢”的直觉,也是很多人类高手取胜的关键。

下了这一局

它的功力是不是又增长了?

没错。但有关“阿尔法围棋”的学习能力有没有上限,专家之间还有争论。

英国曼切斯特大学计算机教授凯文·柯伦认为,没有理由相信技术会有极限,特别是像“阿尔法围棋”所处的特定领域。

而来自南京大学计算机系的两位专家,周志华和俞扬都认为,上限是客观存在的。周志华说,“深度学习”是“阿尔法围棋”比人厉害的关键。当模型性能提升以后,差异会越来越少,到了一定程度后,必然无法继续上升。其上限取决于高质量样本(像李世石这样的高手)的数量。

俞扬则认为,上限不仅存在,而且已经和“阿尔法围棋”现有水平极其接近。从有关报道来看,谷歌已经在想办法避免它越学越差。这说明他们可能已经碰到了瓶颈。

它也会犯错吗?

去年10月,“阿尔法围棋”在与欧洲围棋冠军樊麾对弈时,第二局的31步,被认为是个失误。昨天,在与李世石对弈中,在人类棋手看来,“阿尔法围棋”也出现了失误,然而随后翻盘。

樊麾描述说,“阿尔法围棋”最可怕的地方,是没有人类弱点。“人总会有心态浮动,会紧张,和人下棋时,你能感受到对方的情绪,但电脑不一样,你感受不到他的情感,实际下起来会很难受。像当年的‘石佛’李昌镐,总是面无表情心如止水,但它比‘石佛’更石佛。”

击败樊麾后,很多围棋高手认为,“阿尔法围棋”还不足以挑战李世石。当时,它学习了3000万盘棋。经过将近半年的学习以及谷歌团队的调整,这个数量已经增长到1亿以上。

除了打败人类高手 “阿尔法围棋”还可能有哪些用途?

在这次比赛前,哈萨比斯就曾对外表示,无论孰胜孰负,最后胜利的都是“人类”。谷歌公司希望未来将技术运用于医疗保健领域。目前,他们已经成立相关团队,并与英国高校、医院合作。

哈萨比斯还谈到了樊麾。目前,樊麾在为“阿尔法围棋”提供咨询。在与“阿尔法围棋”对弈过程中,樊麾的排名在三四个月的时间里,从世界600名提升到了第300名。

哈萨比斯因此感到,这也许是今后“阿尔法围棋”能投入市场应用的一个目标,许多人可以通过这个程序提高自己的围棋水平。特别是在西方,并没有太多优秀的围棋选手,所以对于一个生活在西方的优秀的中级选手来说,如何变得更强是件很困难的事。

霍金曾说人工智能很危险

是谁让他转变了看法?

此前,史蒂芬·霍金、比尔·盖茨、伊隆·马斯克等科学人士都表达过对人工智能的担忧。他们担心,人工智能在未来被武器化。人工智能的发展,让机器可以迅速自我优化,其智能程度将超过人脑,从而脱离人类控制,反过来威胁人类。

在哈萨比斯看来,他并不认为人工智能会让人类生活变得危险。相反,他觉得人工智能很神奇。他谈到了自己与霍金的一次私人会面。两人预定了1个小时的会面,交谈甚欢,最后变成了4个小时。哈萨比斯说,那次私人会面后,霍金再也没有在媒体上发表过“关于人工智能的煽动性言论”。

是霍金转变了态度?“我认为,在我们讨论的最后,他感到非常肯定。他很有幽默感。在离开之前,我问他:‘那么你的看法是什么?’他说:‘我祝你好运,但好运别那么多。’”哈萨比斯微笑说,“我想,‘我会把这个当作一次胜利’。”综合新华社报道

下一篇
字体:放大 缩小 默认
[推荐好友] [打印本页] [收藏本文] [返回首页]