身体的智能:4.9智能体设计原理7:并行、松散耦合的过程
并行、松散耦合过程的原理阐述智能是从大量的并行过程中涌现的。这些并行
过程通常是通过具身性,特别是通过与环境间的具身性交互而达成协调的。
我们观察我们自身的方式以及我们通常对智能的概念化方式,是按照阶层化组织的思想来进行的。也就是说,存在一个“我”,感觉到外部世界的事物,将这个事物映射到内部表征(如在我桌上的咖啡杯),用这个表征来计划一个行动(从杯中饮用),最后执行行动(向杯子伸出手,抓住杯子,从杯中饮用)。这种观察行为的方式,也被称为感觉–思考–行动模型,已经被证实在真实世界中是不合适的。因为:(1)这是一个假定感觉刺激首先出现,并导致内部表征的单方向的模型;(2)由于实时条件的制约,这种作用方式实在不够迅速。请回忆一下我们关于感觉一运动协调和奔跑的讨论(追加论证请参见Pfeifer和Scheier,1999)。在20世纪80年代中期,MIT的Rodney Brooks提出了一种考察智能的替代方式以作为对这种思想的反应。即作为一批并行的、非同步的、仅松散耦合的过程。在这种观点下,智能行为在本质上,是从大量的这种过程中涌现的。如前所述,正是Brooks最终引发了人工智能向具身化的转变。在发表于1986年的,以“用于移动机器人的鲁棒分层控制系统”(–
个平淡无味标题)为题的论文中,Brooks展示了控制系统设计方法的一个完全代替方案,即著名的包容(subsumption)结构(Brooks,1986)。并行、松散耦合过程原理在本质上是阐明包容结构的一般化方式。就如在第2章中概述的那样,原著后来由更具争议性的“无推理的智能”和“无表征的智能”为题的两篇论文作了补充。这样的结构是否适用于高层次的智能还有待商椎。我们将在后面继续这个讨论。
松散耦合这个术语是相对于阶层化耦合过程的。在后者中,有一个控制程序(那个“我”)调用子程序(例如,知觉用子程序),然后调用程序(译者注:调用程序即控制程序)必须等待子程序(知觉行动)完成它的任务后,才能继续下去(进入行动计划阶段,接着行动阶段)。阶层化控制对应着非常强的耦合,也就是说,在调用和被调用程序间存在着非常紧密的控制机制。当然,在一个完全智能体中,存在着过程间强耦合,这仅仅因为系统是具身的,如两个关节,肩和肘由物理连杆(上臂)相连接,就是非常强的耦合。
松散耦合也指一个智能体的子系统间通过与环境的交互而产生的耦合,就如我们讨论过的昆虫步行的多腿协调一样。在昆虫的多腿协调中,凭借腿部关节中的角度传感器,与环境的交互使得各条腿的控制器之间产生耦合。耦合被称之为“松散”是因为总体协调是通过环境间接地,而不是直接通过神经系统实现的。抓咖啡杯时头部、眼睛、手臂以及手指的运动也是通过与环境的交互而耦合的,因此感觉一运动协调总是意味着某种组织结构。换个角度说,并行过程间存在松散的耦合。在这个例子里,并行过程是指与抓取任务有关的不同的感觉一运动过程:中央凹处理(注视物体)、伸手、触摸以及最后抓取过程。请注意,这些过程的协调并不需要太多的神经处理,因为协调通过环境发生。
在社会交互中,并行松散耦合过程也发挥着重大作用。有着小捣蛋鬼特征的社会交互机器人Kismet,是机器人研究者Cynthia Breazeal在MIT人工智能研究室工作期间开发的,它是本设计原理的一个很好的实例。Kismet实际上只有一个头部,但是通过驱动头部的不同部分,如转头、集中目光或发声,它能使一个观察者进入复杂的貌似真实的社会交互。这里我们不打算叙述Kismet功能的具体细节,而是提出疑问,我们能从Breazeal的实验中学到什么?然后提供我们从这个问题中得到的收获。
当观察Kismet与某人交互时,你会情不自禁地认为这个机器人具有高度的社会能力。它完全是由一组并行的相对简单的反射(过程)控制的。其中一个反射使注意力集中于突出的物体,即吸引机器人注意力的物体。这个突出的物体可能是刚出现在视野中的,或快速移动的,或特别明亮的物体。物体跟踪反射使得机器人可以用头和眼追随缓慢移动的物体。第三个反射实现了声音定位,并使机器人朝大噪音方向转动头部。还有一个习惯化反射,意味着如果机器人在一段时间里从事同样的行动的话,它就会变得“厌倦”。请注意我们使用的拟人化词汇,也请记得参考系:
Kismet实际上不厌倦(或它其实厌倦了?),但基于它与环境的交互,观察者可能认为Kismet厌倦了。尽管Kismet有着高度发达的行为,和我们的讨论有关的是存在多个相互独立运行的,但松散耦合的过程,也就是说,它们通过和环境的交互完成了协调。并且,我们简单的描述对Kismet并不公平,如有一个精致的情感模型(详细请见Breazeal,2002)决定着Kismet的脸部表情,但我们没有在这里描述。
现在,想象我正在和那个机器人说话,他正注视着我的脸。这时,侧面有一扇门伴随着噪声被打开,并且有一个人走进房间,机器人就会朝着那扇门转过头(声音定位),它会追随进人房间的那个人一会儿(追随缓慢移动的物体),然后变得厌倦(习惯化)。当我与Kismet重新开始谈话时,它会将它的头转回对着我(声音定位)并继续我们的交互。这种行为正是你对一个具有社会能力的个人所期待的:当有生人走进房间时,你转过头去,可能会短时间地追随那个人,然后转回头去回到你前面的活动中。Kismet了不起的是它证实了高度发达的算法或复杂的推理对完成这种行为来说并不是必不可少的。这留给我们一个关于人类本质的深奥的哲学问题:我们可能更多地由低层次的反射,而不是高层次的理性思维驱动。对有些人,特别是对那些笛卡儿哲学观点持有者来说,这个想法绝对是令人不安的。那些笛卡儿哲学观点持有者相信在身体和抽象思维之间有显著的区别,并且我们能理性地决定我们想做的事。另一些人可能会得到解脱,因为如果我们的社会能力确实是在很高程度上由反射控制的,而且这些反射是自动的,那么我们就不用考虑或担心它们,它们能自我管理。后者更多地和“禅”对世上生物体的看法有关。我们推测这就是为什么Rodney Brooks的术语“机器人编程之禅”成为对具身性有兴趣的人工智能研
究者之间一个口号的原因。