为了评估启发式搜索过程的质量,我想重复Elaine
Rich的定义[Ric83]:
人工智能是研究如何使计算机做出目前人们更好的事情。
几乎没有更适合的测试来决定计算机程序是否是智能的,因为在象棋,跳棋,步步高或者Go等游戏中直接比较计算机和人类。
1950年,Claude Shannon,Konrad Zuse和John von Neumann介绍了第一批国际象棋程序,但这些程序要么无法实施,要么需要花费大量时间来实施。仅仅几年之后,在1955年,亚瑟・塞缪尔(Arthur
Samuel)编写了一个程序来玩跳棋,并可以通过简单的学习过程改进自己的参数。为此,他使用了第一台可编程逻辑计算机IBM701。然而,与今天的国际象棋计算机相比,它可以访问大量的存档游戏,每个单独的移动都由专家评定。因此,该计划改进了其评估职能。为了进一步改进,塞缪尔的计划与自己对抗。他以简单的方式解决了信用分配问题。对于游戏中的每个个人位置,它通过功能比较评估B(s)具有通过α-β修剪计算的并且相应地改变B(s)。1961年,他的跳棋计划击败了美国第四好的跳棋选手。通过这项突破性的工作,塞缪尔肯定比他的时间早了将近30年。
只有在九十年代初,随着强化学习的出现,Gerald
Tersauro才建立了一个名为TD-Gammon的学习步步高计划,该计划在世界冠军级别上发挥作用(参见第10节)。
今天有几个国际象棋程序在大师级别上进行,有些国际象棋程序在商业上出售给PC。这一突破发生在1997年,因为IBM的Deep Blue以3.5比2.5的成绩击败了国际象棋世界冠军加里卡斯帕罗夫。Deep Blue平均可以通过alpha-beta修剪和启发式位置评估计算出12个半步。
迄今为止最强大的国际象棋电脑之一是Hydra,这是一家由阿拉伯联合酋长国的公司拥有的并行计算机。该软件由科学家Christian Donninger(奥地利)和Ulf Lorenz(德国)以及德国国际象棋大赛冠军Christopher Lutz开发。Hydra使用64个并行Xeon
1. 最新技术109
处理器具有约3 GHz的计算能力和1 GB的内存。对于位置评估功能,每个处理器具有FPGA(现场可编程门阵列)协处理器。因此,即使具有昂贵的评估功能,也可以每秒评估2亿个位置。
凭借这项技术,Hydra平均可以提前计算大约18个步骤。在特殊的危急情况下,搜索范围甚至可以扩展到40个半移动。很显然,这种视野甚至超出了大冠军所能做的范围,因为Hydra经常会让大冠军无法理解的动作,但最终会带来胜利。2005年,Hydra以5.5至0.5场比赛击败了排名第七的大师迈克尔・亚当斯。
Hydra几乎没有使用关于国际象棋的特殊教科书知识,而是使用相对一般的,众所周知的启发式方法和良好的手工编码位置评估进行alpha-beta搜索。特别是,Hydra无法学习。开发人员在游戏之间进行改进。因此,计算机仍然不必学习。Hydra也没有特殊的规划算法。Hydra在没有学习的情况下工作的事实是一个线索,尽管取得了许多进展,仍然需要进行机器学习的研究。如上所述,我们将在Sect中详细介绍这一点。10和Chap。8。
×
2009年,在掌上电脑上运行的Pocket
Fritz 4系统赢得了布宜诺斯艾利斯的Copa Mercosur国际象棋锦标赛,赢得了9场胜利和1场平局,对抗10位优秀的人类棋手,其中3位是大师。虽然没有太多关于软件内部结构的信息,但这种象棋机器代表了从原始计算能力走向更多智能的趋势。这台机器在大师级别上演,如果不是比Hydra更好的话。根据Pocket Fritz开发人员Stanislav Tsukrov [Wik10]的说法,Pocket Fritz及其国际象棋搜索引擎HIARCS 13每秒搜索的位置不到20,000个,比Hydra慢了大约10,000个。由此得出结论,HIARCS 13肯定使用更好的启发式方法来降低有效分支因子而不是Hydra,因此可以称之为比Hydra更智能。顺便说一句,HIARCS是一个简称高智能自动反应国际象棋系统。即使很快人类也没有机会对抗最好的国际象棋电脑,人工智能仍然面临许多挑战。举个例子吧。在这个有361个方格,181个白色和180个黑色宝石的方板上玩的日本老式游戏中,有效分支系数约为300.经过四次半动作后,已经有大约8 10 9
位置。所有已知的经典游戏树搜索过程都没有机会在这种复杂程度上对抗优秀的人类Go玩家。专家们一致认为,这里需要“真正的智能”系统。所有可能性的组合枚举是错误的方法。更需要的是能够识别板上模式,遵循长期发展并快速做出“直观”决策的流程。就像识别复杂图像中的物体一样,人类仍然领先于计算机程序。我们以高度并行的方式处理整个图像,而计算机一个接一个地处理数百万个像素,并且很难看到像素丰满度中必不可少的东西。“Go的众多面孔”节目可以识别1,100种不同的模式并且知道200种播放策略。