没有思维的电脑怎样像人一样下棋。北京时间2004年6月12日晚,中国首次人机对弈有了结果。国际特级大师诸宸再次败给了笔记本电脑“紫光之星”,加上8日已经输给“紫光之星”一盘,在两局的人机较量中,诸宸完败。
赖俊是清华大学的学生,在和棋后诸宸的比赛中,他有幸一直坐在诸宸对面———他负责操作“紫光之星”。他清楚地记得,当诸宸大势已去,在43手走了一步臭棋后,电脑突然跳出一个对话框:“这是一步坏棋,是悔棋还是继续?”因为是代替诸宸走棋,赖俊选择“继续”。“给人感觉很无厘头。”赖俊说。即便是在取胜关头还不忘幽默一把似乎只有电脑才会干出来。因为通过复杂的计算,电脑看到了人的思维没有触及到的几十步甚至几百万步之后,在数百万种的选择中已经确定了胜势。而人却无法精确预料到那么远,即便是再强的大师也无能为力。
“‘紫光之星’之所以强大,有赖于它的软硬件的强力组合。”清华紫光的邱聚兴表示。
“紫光之星”采用了世界领先的64位核心处理器,软件则是国际上最好的国际象棋软件弗力茨。据说在短时间内能精确算出胜率极高的第13步布局运算,相当于国际等级分高达2600分,超过诸宸约100分。
“还有一点很重要,关键是让机器像人一样思考。”计算机专家、清华大学的吴文虎教授认为。
超级计算机下棋的原理有两种,先是根据自身存储的棋谱库进行搜索,找出最佳方案;但如果找不到,它就会根据棋类规则自己思考,而这个思考速度是人类大脑所无法比拟的。
比如“深蓝”,它下棋的原理是:把所有的可能性化成树形图,计算每种可能的走法,把分数付给树形图的每个端点,分数越高局面越好。然后把分类回送到起始局面。得分最高的树杈对应着计算机的走法,而得分最低的树杈则对应对手的走法,程序确定了一步“好”棋后,一旦算出其他招儿法会导致较差的局面,就终止考虑这一招儿法。
曾经发明了“七星大师”中国象棋软件的赵德志认为,国际象棋每个局面平均有38 种合法招儿法,如果想完全彻底地解决则至少要分别生成和分析38 的40 次方个局面。如此巨大数量,人类目前可知的宇宙都不需要这么大的尺度去衡量。目前世界上最快的计算机也得花费许多世纪。因此显然计算机的棋力在很大程度上取决于它的搜索深度,正如棋谚所云,多算为胜。
怎样让电脑像大师一样思考。卡斯帕罗夫在和“深蓝”的对决中,曾由衷地说“‘深蓝’的许多妙手就像是上帝下的棋。”吴文虎教授评价说,电脑之所以强大,关键是让电脑模仿人的思考,给机器赋予大师的思维。
据介绍,心理学家们在研究和认识优秀棋手和普通棋手水平差异的时候发现,大师们在下盲棋时并不是他们脑中有生动形象的棋盘,而是通过诸如子力关系等抽象概念来记住局面。
心理学家还发现,大师们作为一个群体其平均智商和记忆力都和普通人群无任何明显差异,并且大师的信息处理方式和弱手属同一类型。一位象棋棋王看到一副残局,对于其各子所摆的位置可以过目不忘,但同样数目的棋子随机摆在棋盘上,这位棋王在记忆上并没有特别突出的表现。
这些实验结果表明大师的超人记忆力是象棋特指的,而不是一般性能力。高级棋手可以识别大量的子力组合,而这些组合可作为知觉枝干。大师在很短时间内可以记住4 或5 个枝干而不是4 或5 个棋子。而一个枝干一般包含3或4个棋子。这样就不难理解为什么大师对有意义局面的超群记忆能力了。因此,人类棋手的水平是建立在两种通过学习获得的高度发达的能力基础之上的,即模式识别能力和高速信息抽取能力。
可以设想,在设计“电脑棋手”的专家系统,如程式工程师教电脑下棋时,如果充分利用这样的概念,将“大师”的认知系统转化为一种思考模式,电脑也就很像一个大师了。
电脑的优势是它永远没有情感,永远不会沮丧。这更像一个心理素质过硬的冷面杀手。国际象棋特级大师叶江川在比赛现场评棋时说:“今天我不知道怎么来解说这台机器,我也判断不了这台机器怎么想的,今天好像有些不对等,因为人是有体力的,还有心理因素,还有荣辱感;而电脑统统没有。”
记忆容量和计算速度是超级电脑的绝招儿。“人的优势是一些不合理的走法根本不会考虑,只会思考有用的下法,而电脑却恰恰相反,什么都必须考虑。”叶江川说。
对于叶江川这样的高手来说,这些超级电脑在一秒钟内所考虑的绝大多数变化,都是非常滑稽可笑的。否则,“深蓝”根本不需要具备每秒钟解析两亿个局面的能力———如果足够强大,一步就可以致敌于死地。
“严格说,这不是一场‘公平’的比赛,诸宸也没有输给电脑,他是输给了一大帮超级棋手。”吴文虎开玩笑说。
因为,“紫光之星”拥有大量的储备棋谱。它输入了200多万盘棋谱,研究并输入了诸宸的所有对局,诸宸恐怕一辈子也下不了这么多,一天下一盘也才1万多盘。
国际象棋特级大师叶江川这样的棋手自称一般每走一步只能预测三四步。“超级电脑”的水准是对手下一步,它就能往前看到几十步的可能性。而国际象棋每一步都有几十步可能的连锁反应,形成扩张非常快速的复杂体系,这种“计算暴力”当然是超级棋手无法取胜的。
据介绍,1989年,超级计算机的思考速度还只是200万步/秒,如今这个数字就已经达到了600万步/秒。
比拼计算速度,人永远不是电脑的对手。人的长项是可以就某步棋在非常长时期内的质量进行判断。聪明的叶江川认为,如果诸宸在战术上顶住了“紫光之星”的战术进攻,在战略上就有机会战胜电脑。
关键是让电脑拥有学习能力。“要想使得电脑越来越强大,最可靠的还是让电脑拥有学习能力。”吴文虎说。
电脑的学习功能能使它从每盘棋的实战胜负中去不断修正内部程式,建立“去输存赢”的回馈系统,不断增强自己的“武功”。
在当年“深蓝”和卡斯帕罗夫的比赛中,卡斯帕罗夫对“深蓝”有了足够的了解后,他想到了一个高明的主意,他知道“深蓝”程序中带有一个收集了20世纪各位著名国际象棋大师所下的数千个棋局的数据库,电脑所有的分析数据都来自这些对局。如果他能够出新出奇的话,那么电脑就可能会找不到判断局面的依据,而出现错误。胸有成竹的卡斯帕罗夫采取了聪明的策略,他在后两局的较量中尽量走一些“模糊”的招儿法,让电脑无从计算。此招儿果然奏效,他最后连胜两局,赢得了人机大战的第一场胜利。
叶江川说,电脑的弱点之一,是它不了解人类犯错,把对手的每步棋都看做是精心设计的好棋,结果有时被误导而应对无招儿。那时人就可以战而胜之。
人为什么要跟电脑较劲?其实,人一直在和人自己较劲。因为电脑是人工智能的产物。也只有在和人的较量中,才会发现人的局限。叶江川的一番话很有哲学意味,他说:从棋的发展来看,即使有一天,电脑击败了人类棋手,棋也依然没有失去它的魅力,本身电脑就是人制造的,所以它依然没有失去对抗目的。“并且计算机不会体会到人类在下棋中体会到的乐趣,它仍然是一台机器”。
人机大战 电脑与人脑大比拼
2003年2月7日,首次得到国际象棋联合会授权的“人机大战”在纽约落幕。经过6轮角逐,国际象棋特级大师卡斯帕罗夫与电脑软件棋手“小深”各一胜一负四平,最终以同积3分握手言和。
近年来,“人机大战”越来越多,但人们对其的关注度并没有因为比赛的频繁出现而减退。正如我国国际象棋特级大师谢军所言,人们对国际象棋“人机大战”的关注早已超过了国际象棋本身。因为国际象棋素有“人类智慧试金石”的美誉,人们更多的是将“人机大战”看成是电脑与人脑的比拼。然而,令人遗憾的是,在这场从1996年开始的比拼中,人脑并没有占得上风。
1996年,卡斯帕罗夫与IBM公司研制的电脑棋手“深蓝”进行了第一次“人机大战”,在这次比赛中,卡斯帕罗夫获胜,但这只是迄今为止,“人机大战”中人脑唯一的一次胜利。随后,在1997年与“更深的蓝”进行的第二次“人机大战”中,卡斯帕罗夫在最后一场决胜局中失利,最终在总比分上败北。这一比赛结果如同一颗重磅炸弹,立即引发了各种争论。当然,争论的焦点并非国际象棋本身,而是随着计算机技术的发展,由人设计并操纵的电脑是否已胜过人脑?
此后,“人机大战”频繁出现。去年10月,现任国际象棋世界冠军克拉姆尼克在巴林与德国专家研制的电脑棋手“更弗里茨”进行了8局较量。遗憾的是,克拉姆尼克在前四局比赛两胜两和的情况下,最终却被电脑逼平。在最后的决胜局中,双方战成平局,但克拉姆尼克耗时1.5小时,而“更弗里茨”仅用了25分钟。
在6年前输给“更深的蓝”后,卡斯帕罗夫一直不服,找出种种理由为自己辩护。也许是上次的失利给卡斯帕罗夫太多的压力,在2月7日的比赛中,当在场的大部分专家都认为卡斯帕罗夫拥有最后取胜的机会时,他却接受了“小深”提出的求和要求。赛后,卡斯帕罗夫说:“我当然想取胜,但今天我的首要任务是不输棋。”显然,卡斯帕罗夫不能再承受失败的打击了。
不过,虽然平局多少也让卡斯帕罗夫挽回了一点面子,但此次没有分出最后胜负,也将使人脑与电脑究竟谁更厉害的争论暂时没有结果,人脑与电脑的比拼也将继续下去。卡斯帕罗夫与“小深”比赛之前,国际棋联主席伊柳姆日诺夫在接受媒体采访时曾表示,国际象棋“人机大战”应该成为传统赛事。
不过,虽然人们对“人机大战”的关注早就超越了国际象棋本身,但人脑与电脑的较量对国际象棋的发展却明显有促进作用。与卡斯帕罗夫对阵的“小深”,每秒钟能算350万步,这显然是人脑难以达到的。如今,电脑以其超强的“工作能力”成为每位棋手的必备品。伊柳姆日诺夫说:“世界上头号棋手与电脑较量,比比谁厉害,这对国际象棋项目的发展非常有利,也对提高电脑的技术很有促进。由于电脑的发展速度很快,如果把人机大战办成传统赛事,就会吸引更多的人关注国际象棋和电脑技术的发展。我们将会认真考虑这个问题。”本报记者陈建栋
人机大战背后的故事
——专访“阿尔法围棋”创始人戴密斯·哈萨比斯
人工智能“阿尔法围棋”与韩国围棋高手李世石的人机大战9日打响。39岁的“阿尔法围棋”创始人德米什·哈萨比斯此前在首尔接受了新华社记者的采访,讲述了这场人机大战背后的故事。
哈萨比斯说,此次“阿尔法围棋”的对弈选择了中国的规则。因为对电脑来说,中国的规则更为简便易行。而且他知道,中国也有许多高水平棋手,他们也希望“阿尔法围棋”能与高水平的棋手对弈,比如柯洁。
但是,此次人机大战是历史上第一次电脑挑战职业九段棋手,哈萨比斯表示,他们希望选择在顶尖水平已有十年甚至更久的李世石。也许更年轻的选手,也能有这个水平,但现在还不确定,因为他们还需要有十年顶尖水平去证明自己。“我们也知道,还有很多实力很强的选手,所以这次比赛之后,也许我们也会去中国、日本,与那里的高手切磋棋艺,”哈萨比斯说。
作为一位人工智能专家,哈萨比斯对围棋的浓厚兴趣促使他对“阿尔法围棋”进行研发。他告诉记者,早在20年前上大学时,他曾在剑桥的一个高水平围棋社团里学习围棋,并很快沉迷其中。但是因为忙于电脑方面的工作,他没有足够时间去练习,围棋技艺仅停留在业余一段水平。不过,这并不妨碍他喜欢围棋。
上大学时,哈萨比斯教会了他的合伙人下围棋。那时正值超级电脑“深蓝”战胜世界冠军卡斯帕罗夫。从那时起,哈萨比斯就在想有一天能为围棋写一个程序,并赢得冠军。
两年前,哈萨比斯终于等到合适的时机。他创建的“深度思维”公司开发了深度学习的程序。他们想让这项技术得到更广泛的应用,于是,哈萨比斯选择了围棋。他希望通过利用深度学习程序打造“阿尔法围棋”能战胜人类围棋大师。
哈萨比斯坦言,他没有与“阿尔法围棋”对弈过,因为它实在太强大了。“阿尔法围棋”的学习能力很强,自己完全不是它的对手。
在哈萨比斯看来,他并不认为人工智能会让人类生活变得危险。相反,他觉得人工智能很神奇。他谈到了欧洲围棋冠军樊麾。“阿尔法围棋”此前以5:0战胜了樊麾。目前,樊麾在为“阿尔法围棋”这个项目提供咨询。樊麾告诉他,在与“阿尔法围棋”对弈过程中,自己的排名在三四个月的时间里,从世界600名提升到了第300名。哈萨比斯因此感到,这也许是今后“阿尔法围棋”能投入市场应用的一个目标,许多人可以通过这个程序提高自己的围棋水平。特别是在西方,并没有太多优秀的围棋选手,所以对于一个生活在西方的优秀的中级选手来说,如何变得更强是件很困难的事。
哈萨比斯最后说,无论“阿尔法围棋”是否会战胜李世石,都不会削减围棋的魅力。围棋之所以受欢迎,取决于谁去下和怎么下。如果今后“阿尔法围棋”变得更加强大,也许还能够推动人类围棋的技艺水平上升到一个新的阶段。新华社记者姚琪琳