身体的智能:11.7能够产生面部表情和肢体语言的机器人
肢体语言、手势,特别是面部表情在交流中起着重要作用。正因为如此,识别脸和面部表情在智能机器人领域就成为很重要的研究主题。随着由Fumio Hara(我们在第7章中提到的形态功能机器一词的创始人)和他的学生Hiroshi Kobayas开始构造“面部机器人”,关于面部表情的机器人项目于1990初正式启动。“面部机器人”是一个有24个自由度的机器人头部,能够做出大量的面部表情,包括所谓的基本表情如高兴、悲伤、厌恶、生气、惊讶和害怕。面部机器人的表情基于20世纪80年代加州大学旧金山分校的心理学家Paul Ekman 和Walace pFriesen 开发的面部行为编码系统(FACS)。因为面部肌肉不能由神经系统分别支配控制,FACS使用了所谓的行为单元的概念,即肌肉组共同来产生一个表情。面部机器人一个很好的说明图例能够在Peter Menzel和Faithd”Aluisio 所著的《智能机器人》
(Robo Sapiens)的封面上找到。在早期,Hara和他的学生意识到机器人面部的材料特性对于实现真实的表情至关重要。在人类的面部表情中,除了脸部肌肉外,脸部组织本身就提供了很多潜在的机能。举例来说,要展现一个笑容,只需要很少二些行为单元,其余的可以由形态学计算来完成。把FACS系统作为设计基础是明智之举,因为它提供了如何控制机器人的指南,为了实现全套表情,人脸部许多必需的行为单元可以用机器人身上的驱动装置来实现。但要注意的是:行为单元之所以起作用是因为利用了面部组织的材料属性。因此,面部机器人是一个生态学平衡的很好的例子,不仅要考虑机器人的驱动器和控制器,还要考虑面部材料的特性。但是面部机器人不是一个完全智能体,它只是一个头部,没有身体,没有手臂或脚,它只是面部表情的一个研究案例。除了一个能够作面部表情的头部外,早稻田的“眼睛”机器人(是为了研究面部表情专门设计的)和Actoid 有一个用来打手势的躯干和手臂。在这两个例子中都对材料给予了充分的关注,Actroid使用了气
动人造肌肉,它的确增加了面部表情的真实性。Actroid还有另外一个在社交方面很重要的特性一―它(她)非常吸引人,这种特征在未来拟人机器技术中将扮演一个有趣的角色(参见图11.1(b))。
我们在第4章提到的社交沟通和面部表情机器人Kismet(Breazeal,2002)是一个长相奇怪,有点像宠物小狗的东西,它也只有一个脑袋。然而,除了一系列基础反射外,它还被赋予了人类情绪和表情的复杂模型。回忆第4章中列举的一些简单的反射,头会转向大的声音来源,并慢慢跟踪移动物体,当有东西进入它的“私人空间”时,它会缩起脑袋,当某项活动时间太长时它也会“厌烦”(习惯化)。这些主要是通过与环境交互来协调的,使得机器人很大程度上以类似于社会能力的方式行动。这是对并行、松散耦合过程的很好诠释。此外它能够表达生气、开心、惊讶等基本表情以及这些表情的混合,这使得它的面部表情库相对多样和真实。面部表情是更有说服力的,因为它们来自于机器人目前的社交交互,而且大家都知道从面部表情上识别情绪的能力是与背景极其相关的,即它取决于参与者当前的交互。
Kismet还利用了一个事实,就是与它做交互的人都是有社会背景的,他们能够识别出Kismet适当的表情,即使这种表情的表达方式相对比较粗糙(它脸部的自由度比人要少得多)。例如,如果突然有很大的响声,合适的表情将会是惊讶或者害怕。
从形态学计算的角度看,任务的某些方面被卸载到环境中去了,在这个例子里社会背景提供了所需的信息,因此展示合适表情的过程就被极大地简化了。
大部分人在与Kismet接触时,都会不经意地掉入人格化的陷阱。这就提出了一个严峻的问题,是否人类的社会行为主要是简单动作反射法则的结果,而不是复杂的认知过程。我们如何知晓在社会交互中人类做的要比Kismet更加高级或者复杂?正如我们前面已经提到的,行为可能由简单的反射控制的假设被
Simon Garrod关于在交谈中相互调整以及心理学家John Bargh关于“无法忍受的人类自动性”
(Bargh和Chartrand,1999)的思考所证实了,John Bargh提出我们的社会行为事实上由自动反射驱动而不是由我们想的或者我们愿意思考的东西驱动的。当然,反射并不能解释所有的人类行为,然而那些看上去非常真实、复杂也很社会化的机器人行为能够以非常简单的方式实现,这是令人惊奇的,对一些人来说也许是令人不安的。