身体的智能:5.2如何实现发育机器人的设计
当谈到智能的时候,我们倾向于注重高层次的功能如问题解决,设计一个电脑程序,写份报告,发现一个数学证明,准备一个讲座或者进行一个科学实验,这些都可以被描述成抽象符号处理的行为。在传统的方式下,研究者直接处理这些技能,也就是说,直接在他们的电脑上编程建立些符号处理系统。因为我们在研究室(位于苏黎世的Rolf的人工智能研究室)寻求通过具身性方式来实现智能,我们在感知一运动处理方面做了很多工作,并且着重于所谓低层次的动力学机制,如四足或者两足机器人运动。这招致了研究团体不少的批评:“如果你们想研究步行或者跑步的话,那么你们在移动方面的研究本身还是有趣的,但是你们在研究认知!”大概因此,我们被认作“背叛者”,作为研究者却不务正业,从研究智能的崇高目标堕落到低层次工学研究目标,去创建那些只会移动的机器人。
但是等待我们的结果却是出乎意料的。还记得我们在第4章讨论具身性智能体的特性时,曾经指出过所谓智能体,实际上只是因为它们是物理系统,所以存在着吸引子状态吗?当我们和Fumiya lida开始研究机器狗Puppy时,我们忽然意识到看上去让实现运动变得非常困难(控制一个有很多关节的系统是非常复杂的控制任务)的复杂身体动力学机制实际上开启了通向符号化系统的途径!因为Puppy的复杂动力学机制有许多吸引子状态,而且这些状态是在一个完全连续的系统内,离散的可辨认的存在(参照插注4.1),吸引子状态本身就为低层次符号提供了一个扎实的基础。
所以,用比喻的方式说,“下降”到低水平竟是以具有牢固基础的方式,从原理上“上升”到符号处理的前提。换言之,我们并非武断地定义符号让机器人去尝
试并理解其意义。我们将把Puppy看成一种载体,用来展示我们是如何运用这种启示从研究感知一运动问题过渡到研究认知的。我们将会看到,这个讨论会带来被广泛争论的符号接地问题的解决方案,至少是一个有希望的途径。
当然,想法都不是突然冒出来的。几年来我们一直在和机器人模仿方面的泰斗、
东京大学的Yasuo Kuniyoshi进行交流,他一直致力于面向动态系统的方法,研究在连续动态系统中找寻符号的解决方法。因为我们一直致力于研究机器人的移动(如步行、奔跑、跳舞、飞翔和游泳),把动态系统的理论应用到我们的工作中就变得非常自然。一些研究者也在孜孜不倦地进行在动态系统中寻找离散符号的研究,他们的工作已经给我们带来了极大的鼓舞。(如Inamura等,2004;Ito和Tani,2004;
Hertzberg等,2002;Jaeger,1998;Kuniyoshi等,2004;Okada和Nakamura,2004)。
有趣的是在发育机器人学中,拟人机器人经常被使用。我们怀疑这和我们最终想在我们的机器人上实现人类水平的智能的事实有关。真正的问题一―这也是我们要在这本书中不断地提出的问题那就是我们能从拟人型机器人那里学到什么?第一,因为制造拟人机器人的巨大工程性挑战,必须开发一些新技术。小型化也是一个大研究领域,如驱动器技术、新型传感器技术(如精密的触觉和压力传感器),电池技术(或者泛言之电源供应),还有控制理论中的概念问题,例如,如何控制自由度很多的系统。因此,就技术上而言,有许多东西需要学习。
第二,通过实际着手构造机器人,我们很快地就会意识到什么是真正的困难。
例如,当我们制造拟人步行机器人并且观察他们的行为时,我们马上觉察到机器人走路的方式和人类非常不同。这提高了我们的洞察力,且使我们把注意力放在设计过程中基本的、不易被察觉的缺陷上。这些洞察给我们提供了新的研究方向。如我们可能考虑研究机器人的物质材料,使用人造肌肉而不是电动机,或者研究一下摆动腿的被动动态学而不是明确地对腿编程。
拟人机器人的一个很大的优势就是他们有和我们接近的形状和尺寸,我们不需要为了使他们工作而特意改变环境。他们可以使用一样的厨具,他们可以使用一样的工具来修理汽车、设备还有他们自己;他们可以玩扑克、高尔夫、乒乓球和下棋;
他们也可以乘坐地铁;他们可以敲打电脑键盘或者钢琴键盘;他们甚至可以开汽车还有割草机。在2002年的日本拟人机器人项目的学术发表中,展示了一个可以像人一样坐着并且操作反铲挖土机的机器人(图5.1)―Wabot――一个聪明的拟人机器人,20世纪80年代由东京的早稻田大学研制,可以以每秒15下的速度按键,演奏风琴,还可以阅读普通的乐谱。而最近的拟人机器人WF-4可以吹奏长笛!
(有关WF-4的描述,请看第11章。)当然,也可以给反铲挖土机构造一个控制系统,或者为产生风琴的声音做一个电路,但展示的意义在于其说明了在我们社会中机器人可以发挥的大致作用。
(a)
0
(b)
图5.1拟人机器人和为人而设立的环境交互。因为拟人机器人和人有着相似的形态,他们会很自然地和我们的世界交互
(a)拟人机器人驾驶反铲挖土机;(b)拟人机器人从冰箱中拿食物;
(c)拟人机器人为派对接待客人
但是,在使用拟人机器人的时候,也会有一个危险。因为他们与人类表面上的相似性,我们就会倾向于认为它们有人类才有的特性,如语言能力、痛觉还有愉悦、
激情等,或者责任感和忠诚感。记住David McFarl的警告,“人格化,不治之症”:
拟人的外表更加鼓励人类研究者去进一步人格化。实际上这已经被一些研究者(并非所有的研究者)尝试过,并且吸引了媒体的注意力,但是这也触发了对机器人实际能力的不适当的关注。
现阶段的拟人机器人令人印象深刻且表现出了高度的科技成果。但是,它们离取得人类水平的智能还差很远。就拿步行的例子来说:我们在第2章提到过,人们可以以许多不同的方式步行。这种令人不可置信的行为多样性至今没有被任何机器人尝试过,包括最先进机器人如东京大学的H-7,本田汽车公司的Asimo,索尼公司的QRIO,或者DB,一个80kg,有30个自由度,由Utah-Based机器人公司制造的机器人Sarcos。
尽管拟人机器人在发育机器人学中发挥着很大的作用,他们并不是唯一的工具。接下来的案例中,我们将用四足机器狗Puppy来展示我们如何在机器人达成一个发育过程。我们觉得这个例子很好地说明了动物、机器人或者人类怎样从与真实世界的交互中学习然后建立起体象(身体意象,body image)的。众所周知体象在认知的发育中起着非常重要的作用。我们将展示渐进地建立这一切的方法,从智能体的基本运动―它的低层次动力学机制―开始,在运动中区分吸引子状态(步态模式),创造一个体象,产生关于符号处理最初的印迹。当然实际上(事情经常如此)比我们在这里所描述的要复杂得多,不过基本的想法就是如此简单而又引人注目的。