身体的智能:5.9社会性交互
现在我们来看看关于发育的最后的,也是许多人认为最重要的方面社会性交互。但对这个题目的完整论述超出了本书的范围。因此我们只看一下社会性交互的几个方面,这几个方面全部都直接和智能体的感觉–运动过程有关―模仿、共同注意、支架和自然语言。巴黎Centre National de 1a Recherche Scientifique的Jacqueline Nadel 指出感觉一运动协调和社会性交互形成了两种不同的因果关系(Nadel,2002)。例如,一个孩子的尖叫会让妈妈很快出现,或者微笑也会引起交互中对方的微笑,但是这和知道如果我倾斜一个杯子,液体会泼出来完全不同。尖叫和倾斜杯子都有后果,但是它们完全不同的,在社会性交互中是另一个人有所反应;在感觉一运动协调中反应的是环境。
模仿,共同注意和支架
模仿是发育机器人学的一个重要方面。这里我们只讨论一部分问题;感兴趣的读者可以参考Dautenhahn和Nehaniv(2002),Kuniyoshi等(2003)和Yoshikawa等(2004),以获得更多详细资料。很多心理学教科书中都提到过,模仿是人类婴儿强有力的学习策略。如模仿发声使得小孩子最终掌握了自然语言。从长远观点来说,让机器人通过模仿人类或者其他机器人来学习,是比针对具体任务来对机器人编程要好得多的策略;我们只需要让机器人看要做什么(或者让它们看其他的机器人),这样它们就能掌握技能!虽然这里有个问题,如何发现其基础原理,从而让智能体模仿其他个体的行为。
从大量的关于模仿机器人的文献中我们可以推断出最大的困难在于智能体情境性的本质,也就是说它们必须通过自身的感觉一运动系统来解释它们的环境,如其他智能体的动作和意图。换句话说,模仿需要复杂的感知能力,而这恰恰是在讨论模仿时经常被忽视的因素。实验者为了减轻机器人的负担,经常向他们提示简单的动作或者有限的指令,并且在一个单调的背景前执行动作,简化把图像从背景中
分离中来的问题,以确保在机器人的视野中只有这个需模仿的动作在进行。我们必须小心,不要掉进计算机视觉研究者经历过的陷阱,也许机器人的具身化可以允许它超越图像分析,并且有助于简化感知和认识其他具身化智能体行为的任务。但无论如何这是另一个有待研究的问题。
神经科学中最近吸引人的事件之一是发现了对于复杂的模仿能力有一个可辨识的神经基础。“镜像神经元”(例子可见Gallese等,1996)的发现掀起了轩然大波,因为动物不管是进行一个动作还是观察另一个动物进行同样的动作时,该神经元都会被触发。这表明认知的概念和感觉–运动在大脑中是紧密相关的一―当执行一个动作或者只是观察另一个智能体的相同动作,大脑的同一区域会被激活。
镜像神经元的发现引起了在神经科学中的激烈争论,即感知能力需要运动技巧到何种程度。抓握住杯子的能力是可以感知到其他人同样动作的前提吗?这是一个微妙的问题。如果智能体要通过模仿来学习,它必须有适当的感知能力,它必须能够从其他智能体那里辨认出感兴趣的动作。但是如果这些辨认能力需要智能体已经可以执行动作的话,这就像是类似于“第22条军规”的问题了―为了模仿,智能体首先得感知这个动作,但是为了感知,智能体又得先有能力执行这个动作。
但是这个问题是可以解决的,只要我们把发育看成是一个循序渐进的过程,一个能力可以建立在另一个早已获得的能力的基础之上。例如,一个孩子可能可以松松垮垮不甚精确地伸手趋近,但这种对于胳膊的运动的不太精确的控制可以引导更精确的控制。所以从发育的观点来看,运动之间有很多相似之处;并不是一个全或无的事情:特别的行为,好比伸手趋近,并不是可能或者不可能,而是可以以或多或少的控制度来完成的。
模仿的另一个前提似乎就是分享的或者共同的注意,指导者和模仿者都必须注意同样的身体部分或者动作,否则学习者不知道要模仿什么。共同注意同样有很多种形式,也可以通过好几种方式获得。例如,指导者可以把一件物体拿到机器人的视野并前后移动物体。如果机器人装有动作检测器,它就会注意这个物体,就像我们在上一章中讨论的Cog例子一样。另一个可能性在于婴儿或者机器人顺着另一个人的视线,推断别人正在观察的事情,这也并非简单的任务,特别在动态变化环境中。虽然共同注意的机制通常是由系统的设计者预先编程的,但已经有许多从更基本的假设出发来获得共同注意的尝试,如在发育过程中通过学习来得到。接下来的就是Nagai和他的同事描述的过程的简化版本。首先,机器人只用视野中某个物体的视觉信息,学习注意这个物体。然后,还是这个物体,机器人慢慢地学习通过注视一个人的脸来观察这个人正在看着的物体。换句话来说,机器人学习怎么由视觉注意改换到共同注意,即机器人和另一个人都共同观察同一个物体。有兴趣的读者可以参见文献得到更多信息(Nagai等,2003)。
在第4章中我们讨论了支架,这是构造环境来帮助智能体执行或者学习如何执行任务的一种特殊方式。支架还有一层特别的社会学意义。照顾者常常提供给学习者“支架”来方便学习和发育。例如,父/母亲会在孩子刚开始学步的时候握住他的手。当孩子提高了走路技巧,支持就慢慢减少了,使得任务对于孩子来说更难了。
虽然有一些初步实验说明了这种支架对于发育的速度和质量真的有帮助,但关于测量支架帮助学习的程度的研究却很少。
为了概括我们的关于社会性交互的讨论,让我们现在接着讨论认知发育中的最后也许是最大的挑战―自然语言。
自然语言
交流处于社会性交互的中心。众所周知,自然语言交流对于人类发育是必不可少的,大部分我们知道的事情是从其他人那里听说的或者从书面材料中读到的。当研究其他物种比如老鼠的发育时,自然语言可以被忽略不计,但是在人类的发育中,必须对这个能力加以考虑。
在语言学术界只有很少有分量的实验把重点放在语言是如何从具身化系统中产生的这点上。如前面所提到的,其中之一是Luc Steel小组的基于因特网的萌芽实验,这是一个关于半具身化智能体(即装有可移动的摄像头,面对白板的智能体)获得词汇的实验。在这个白板上有各种不同的模式,如不同颜色、大小和排列方式的三角形、方形还有圆形。“谈话头部”实验是一种语言游戏,参加的智能体由这些摄像头组成,它们或者在同一个房间,或者在这个世界上的完全不同的地方,试图去猜测另一个智能体正在看什么。同时,智能体也可以创造一个新的词,如blatesh,或者它们可以使用一个已有的特殊排列,如在红色的圆圈上有一个黄色的三角形。如果所有的智能体都对一个词或者布局持相同意见的时候,这个语言游戏就被认为是成功的;否则的话就被认为是失败的。令人吃惊的是,经过几千次的交互之后,产生了词汇的收敛。虽然涉及很多细节,但是实验例示了类似于语言的东西是如何涌现的,而不是编程的。这个结果的迷人之处在于在智能体团体中词汇是完全自然涌现的,是一个自我组织过程的结果。到目前为止,实验只是和词汇打交道,但是Steel和他的小组正致力于下一步工作获得句子结构。想象一下这在未来会演变成怎样就很令人着迷,“谈话头部”能发现公用词汇、句子结构和语法,甚至创造它们自己的语言吗?这种语言又会是什么样子的呢?