身体的智能:4.7智能体设计原理5:感觉一运动协调
感觉–运动协调原理阐述感觉一运动协调会导致结构化的感觉刺激。
如我们在本章开始时解释的那样,具身性智能体的一个重要性质是它们在环境中移动时,感觉刺激会自动产生,这不是智能体本身所能改变的。但讨论廉价设计原理时,我们以利用角度传感器的信号进行多腿协调,完成移动的动物为例,解释了感觉刺激是怎样为某个特定目的利用的。另一个说法是动物抬腿其实不仅是为了步行,还是为了产生感觉刺激。而这也恰恰是感觉一运动协调的想法,即具身性智能体能通过与环境的某种交互产生有用的感觉刺激。
事实是知觉确实是很难的。还记得吗,真实世界不是理想的8乘8的棋盘,而是杂乱的,充满噪声的地方。请想象一下,一个智能体比如你自己徜徉在瑞士苏黎世中心的高档购物街Bahnhof Strasse上,出现在眼睛视网膜上的感觉刺激是连续的,高速变化着的。一方面,这是因为其他人,有轨电车和汽车是移动着的,而另一方面,是因为你自己也正在移动。当你移动时,你和其他在环境中的物体间的距离变化了,并且你和它们之间的相对方位也发生了变化。有时你从正面然后从侧面,其后从背后看见别人,或他们被其他人或物体遮住。此外,我们走进一家百货店,我们戴上或脱下太阳镜,开始下雨或黄昏天色渐黑时,光照条件也发生变化。令人惊奇的是,尽管有这些条件的变化,我们可以马上就轻而易举地认出一个朋友,一家商店或人群后的一间瑞士三角巧克力(toblerone)吧。
因此,在某种意义上,感觉刺激的各种变化并不是一个好消息,我们必须得考虑,怎样才能构造能处理所有这些变化的机器人?好消息是,和真实世界的交互能简化感觉刺激,使感觉刺激变得很容易理解。这种性质对感觉一运动协调的交互也成立。当你朝四周随机地而不是以感觉–运动协调的方式摇晃头部时,在你的视网膜上,在你的内耳(感知身体相对于地球引力取向的器官)中会产生许多感觉刺激,但是那种刺激可能并不是太有用。我们将马上对感觉–运动协调交互的意义进行更多的叙述,但目前只需将它们作为感觉刺激影响行动,而行动又转而影响到感觉刺激的交互来认识就足够了。感觉–运动协调的一个很简单的例子是对物体的注视。
它的技术用语是中央凹处理,也就是,移动头和眼使物体出现在中央凹陷――视网膜的高分辨率中心的过程。这是一个感觉一运动协调的过程,因为运动导致了感觉刺激,而这个感觉刺激转而影响并校正了头和眼的动作,结果是物体一直停留在视野的中心。
这里必须指出的是,感觉–运动协调总是就某个特定的目标或意图而言的。当我走过一张放着一个咖啡杯的桌子,但又不特别注视杯子时,那么我的行为就杯子而言并不是感觉一运动协调的。但是就步行而言,当然是感觉一运动协调的,为了合理地步行,我必须对感觉刺激做出反应。那时的感觉刺激来自脚底的触觉传感器,肌肉及肌腱的力觉传感器以及维持平衡所必需的内耳。
引起相关
感觉–运动协调变得特别有用是因为它能在同一感觉通道内或不同感觉通道间引起相关。当我通过中央凹处理看见在我桌上的咖啡杯,也就是通过把杯子停留在视野的中心时,在我的视网膜上的图像,至少在短时间内是安定的,作为结果而发生的感觉信号就容易被视觉系统处理。然后当我抓住杯子时,这又引起另一个通道的感觉刺激,如手指尖的触觉传感器及在我手臂上的本体感觉传感器(用来检测作用于肌肉或肌腱的力等内部刺激的传感器)。通过感觉一运动协调,从不同感觉通道获得的信号变得相互关联。当我抓住并举起杯子时,在手和手臂的触觉和本体感觉传感器以及视觉系统上会产生同步刺激。因为这些信号是相关的,所以处理起来更容易,也就是说这些信号不是一团复杂的相互独立的信号,而是一组同步的信号,从中能更简单地抽出有用的信息。但是最重要的是,这些协调形成了不同通道的结合,所以为学习的发生做好了准备,就如听上去那么简单,我们相信这些想法可以帮助我们走上揭开知觉奥秘的大道。感觉–运动协调的真正诱人之处并不限于此,它还揭示了具身性是怎样影响流入的感觉信号的,从而提示了脑应该进行哪些处理。当触觉传感器告诉我我已经抓住了一个杯子,而且我看见那个杯子是满满的,如果我打算拿起杯子的话我必须准备好支撑起它的重量,因为我“知道”本体感觉
传感器马上将被触发表示出杯子的沉重。换句话说,感觉–运动协调显示了身体和信息是怎样连接的。这是具身性的一个深刻的启示。你可以在Pfeifer和Scheier(1999)
的文献中发现更为完整的研究事例。O’Regan和Noe(2001)则提供了从心理学角度的考察。
请注意,在这种方式下,通过跨通道学习做出预测是可能的。例如,只需简单地看一眼那个杯子,我就能大致预测到当我抓着它时会是什么感觉。这种预测感觉刺激的能力是从神经科学得到的重要见地中的一个。也就是说,脑不仅作为一个“分析者”,还作为一个“预测者”。通常我们并不意识到我们在做出预测,但是假如杯子实际上比预测的要重得多时,我们才意识到我们确实对杯子的重量有一个预测。我们将在第5章讨论体象的概念时进一步探讨这个想法。
至此,智能体的身体会引起相关性的想法看起来很有道理,但无可否认的是,这个想法也是定性及直观的。为了科学的目的,我们必须“证明”这种想法确是如此。也就是说,我们必须用科学证据去支持我们的直觉。换句话说,我们应该能够用统计或信息理论的方法定量地证明它是否正确。具有创新精神的年轻意大利计算科学家,工程师,东京大学的Max Lungarella,荷兰社会学家Hertfordshire大学的Rene te Boekhorst,美国神经科学家及“神经机器人学者”,印第安纳大学的 Olaf Sporns和我(Rolf)已经证明了这点。即感觉–运动协调能导致感觉刺激相关,并且这些相关性为知觉和学习提供了基础。
感觉–运动协调的想法其实由来已久。我们从美国哲学家和心理学家John Dewey处引进了这个术语。John Dewey在他著名的具有争议的“心理学的反射弧”
(the reflex arc in psychology)(1896年)一文中引进了这个词。值得注意的是,在Jean Piaget的智能发育理论中,感觉–运动协调也具有极其重要的作用。它被用来表示一个特殊的发育阶段的特征(Piaget,1952)。Dewey认为知觉不应该被视为一个始于感觉刺激,经过内部处理,最后引起行动的过程。这是古典行为主义的输入―处理输出的观点。他更进一步建议:“我们并不从感觉刺激,而是从感觉–运动协调开始的…,在某种意义上,运动是主要的,感觉是次要的,身体、头及眼的肌肉运动决定了经历的质量”(Dewey,1896,McDermot,1981:127-128)。事实上,我们并不想主张运动是主要的,再一次借用动态系统的比喻来说,感觉和运动过程是相互耦合的,它们相互依存。想确定哪个是主要的,哪个是次要的无异于试图解决先有鸡还是先有蛋的难题。我们推测,Dewey在那时不明白的是为什么感觉–运动协调是如此的重要。我们提出,除了掌握对物体的操纵之外,就如我们刚刚讨论的那样,还需要来自信息原理的重要启示。
我们已经指出分类是最基础的认知能力之一。知觉分类以及动物和人类的一般知觉具有感觉一运动协调的所有特征。并且,当更仔细地考虑其他不同的活动如看、
抓、喝、写和听等活动时,我们马上就会认识到我们总是与感觉一运动协调有关。感觉一运动协调是从婴儿到成人的发育过程中,最重要的作用程序之一,它构成了许多种学习过程的基础。在下一章中,我们将回到这些要点上来。在那一章中我们将勾画出认知是如何以自底向上的方式从发育过程产生的。
通过操作环境识别物体
作为对感觉一运动协调的讨论作一个临时性的小结,让我们看一下一个来自机器人学的例子。意大利工程师及计算机科学家Giorgio Metta在MIT人工智能研究室工作于拟人机器人Cog的同时,对机器人识别环境中物体的研究发生了兴趣。
Cog由Rodney Brooks的研究室于20世纪90年代开发,由一个无腿的躯干,拥有视觉和听觉系统的头部及两个带手的手臂组成。通常,就计算机视觉而言,物体识别,特别是当环境中许多物体在一个杂乱的环境中堆在一起时,是一个艰巨的任务。
因为物体有可能涂了和背景相似的颜色,光照条件可能不是太好,或对比度比较糟糕。一个经常为人们采用的策略是,在看一个物体时移动头部。这些感觉一运动协调的动作导致了能从环境中获得信息的感觉刺激的产生。这个移动你的头部和眼睛,或机器人的“头部”和摄像头以支持知觉过程的策略也应用于所谓的主动视觉系统中。
为了取得进一步的进展,Metta给Cog编制了一个特殊的感觉一运动策略。这个策略超越了头–眼移动的范畴,Cog的程序让Cog实际上操作环境。Cog会拨弄在眼前的物体以观察物体是如何移动的。为了实现这种策略,只需追踪机器人手臂的运动(这种追踪仅需相对较小的计算量,容易实现),也就是说,机器人通过自己的视觉系统“看到”的只是它自己的手臂和手。使用一个运动检测算法,机器人就能连续地看到自己的手和手臂在空间的移动。如果机器人的移动引起了在它视野内的意外的运动传播,这就表示机器人正推着一个什么物体,即那个静止的物体也开始了移动。运动传播意味着,在机器人检测着的领域中,运动出乎意料地比手臂的单独运动大出许多。这种检测是很容易实现的,所以机器人立刻“知道”视野的那一部分包含了物体(见图4.4,图中显示了Metta在他的博士论文研究中开发的一个相似的机器人Babybot)。通过和环境的交互,即拨弄物体,这个机器人引起了感觉刺激,从而将移动着的手臂和物体及环境中的其他部分区分开来。这是感觉一运动协调的一个极好的范例。
当讨论涌现性设计时,我们曾提到,如果能证明用人工进化设计的智能体和某一设计原理相吻合的话,就能进一步证实那个原理的有效性。就如我们在第6章中将看到的那样,用人工进化设计的“推块者”也利用感觉一运动协调进行移动,而这种协调并没有预先被编制成系统的程序。
着海
图4A4通过与真实世界的交互产生感觉刺激:感觉–运动协调。Lira研究室的“Babybot”(Genova大学,意大利)正探索在它面前堆满东西的空间。直条图片显示了运动检测系统的输出
(a)因手臂正在移动,所以能看得很清楚,在这个时刻,不能通过运动检测系统看到苹果和在桌上其他物体;(b)Babybot触摸苹果,但是苹果还是没有移动,所以仍不能通过运动检测系统看到;(c)Babybot推动苹果引起运动,这样苹果变得可见,并被识别为物体。向苹果伸出手,触摸,推动苹果是感觉–运动协调的过程(Giorgio Metta和Paul Fitzpatrick的实验)