身体的智能:4.10智能体设计原理8:价值
价值原理阐述智能化智能体具有一个价值系统,这个价值系统构成了对智能体是否有益进行判断的一组基本假设。
一方面价值原理非常重要,因为它涉及对智能体是否有益进行判断的基本事项,而这又导致了在特定情况下智能体将做什么或应该做什么的问题。另一方面,价值原理又非常不明确,无论在生物学和心理学,还是在机器人学和人工智能领域数量庞大的科学文献中,都没有关于如何探讨这个问题的一致看法。因此,我们不能提供一个令人满意的答案。与其他设计原理截然不同,我们所能做的只是提出一系列的讨论事项。价值问题当然是智能领域中有待探讨的问题之一。我们将在本章开始探讨,并在第5章和第6章中继续关注某些要点。
让我们首先讨论一下在设计和构造智能系统背景下的价值。价值原理认为智能化个体具有一个价值系统,这个价值系统构成了对智能体是否有益进行判断的一组基本假设。一旦作出了这些假设,至少在相当一段时间里,通常在智能体的存在期内,这些假设就不会再遭到质疑。比如当设计一个伴随机器人(见第11章)时,这样的假设是能使机器人执行它的任务并帮助它执行任务的所有事物,构成机器人的价值。伴随机器人的任务包括,给人们提供娱乐、提供咖啡、修理草坪、做家庭杂务、照料小孩或采购。因此,一组设计决策构成了价值系统:摄像机、麦克风、无线局域网、腿、手臂和手、步行机制,操纵物体的机制以及在某种特殊情况下做出行动决策的机制等。智能体越符合前面概述的设计原理,它就越能从它的设定中得到更多的价值(例如,如果它利用了人工肌肉的弹性,它可能会跑得更快)。但是,在这儿我们还必须注意参考系问题:对设计者来说,这些决定是显式的,但是一旦这些决定在机器人上得以实现,它的行为就将从所有的组分和机制的组合中涌现。
所以,价值存在于设计者而不是机器人的脑中。
让我们转向一个更具体的问题,给定一个特定的智能体,它怎么决定在某一个特殊情况下做什么呢?如果智能体像真菌吞噬者一样,既须自主亦须自足的话,这个问题将特别重要。真菌吞噬者为了能持续发挥功能,需要始终完成许多任务。通常,使用所谓的行动选择方法给定一个特殊情况,如孩子们从学校回到了家,在冰箱里没有冰淇淋或吸尘器出了毛病,这时机器人能采取许多行动,如买饼干点心,把吸尘器送到修理店及和小孩玩耍等。从这些选择项中,必须根据对当前情况的分析及对选择项的评价作出选择。这种方法经常用于真实世界。应用的目标是构造能工作的机器人。这实质上是一种实现设计者对最佳决策的感受的方法,但是,从这种方法中,我们能学到多少关于智能行为的东西呢?我们能了解在诸如家庭这样的
动态复杂环境中,以这种方式编程的机器人能在多大程度上发挥功能,但是这和诸如人类这样的生物系统是怎样作出决定之类的问题实际上没有很直接的关系。让我们用一个心理学上的例子来简短地说明一下这个要点。这个例子是著名的
“A非B错误”,最早是由Piaget 研究的。请想象一下一个实验者坐在一张桌子边,隔着桌子一个婴儿坐在他母亲的膝盖上。在桌上有两个洞,A和B,每个洞都用一个盖子盖着。实验者拿起一个玩具,在婴儿前晃动玩具,吸引他的注意力,然后把玩具放入A洞,接着重复数遍这个过程。在大多数情况下,婴儿会向A洞伸出手去,并揭开盖子。然后,再一次在婴儿的眼前晃动玩具后,将玩具放入B洞。
令人惊奇的是,婴儿仍会向A洞伸出手去。这个被称为“A非B错误”的效果被证实发生在7-12个月的婴儿身上。大多数文献试图用婴儿的认知过程去解释这种现象。相对照的是,Thelen和他的同事们(2001)假设这种行为是从动态系统中涌现的,而不是认知过程的结果。如果改变系统(婴儿的伸手趋近系统)的物理动态机理,婴儿就不会再犯那个错误。例如,当婴儿的位置从坐姿被换到直立,或放一些重物到婴儿臂上,婴儿就不再犯那个错误。这两个措施都会改变伸手趋近系统的物理动态机理。这可以被解释为通过实验中的不同试验,将婴儿视为动态系统的话,这个动态系统被“卡在”一个特定的吸引子上,除非系统的动态机理被改变,他不能从这个吸引子上逃离。年龄稍大后,实验者将玩具放进B洞的外部刺激足够改变吸引子,结果,婴儿就不再犯同样的错误了。这样,行动选择或认知决定过程的某些事物,很可能实际上是从动态系统中涌现的。
这和在试图解释生物智能体的动机的同时,如何对它们在复杂情况下的行为进行概念化的普遍性问题有着联系。这个普遍性问题在实质上是价值问题。我们不打算讨论太多的细节,因为有大量相关的科学文献说明,我们有很强的,把目标和决定过程归因于其他人(甚至动物或机器人)的倾向,这种倾向和笛卡儿的理念是一致的,我们得到一个目标,然后我们制订计划,付诸行动以达成目标。看起来目标更像是合理化的结果,用以给行为添加一些一致性的风味,而非行为的实际原因(关于这些论点的综述,请见McFarland和Bosser,1993;Pfeifer 和Scheier,1999;
或Montefiore和Noble的论文集,1989)。从具身性方法中得到的关键见解之一是,许多事物常常存在更简单的解释,而且并不需要给予智能体完善的目标阶层或决策过程。一个很有启发意义的例子是Kismet,它的行为在本质上是从许多反射过程中涌现的。此外,在“A非B”实验中,明白的决策行为是从一个动态系统,即婴儿的伸手趋近系统中涌现的。这些见解可能为设计人工智能体提供宝贵的直觉知识。
作为我们对价值原理所作的(无可否认,略显肤浅的)讨论的总结,让我们简单讨论一下时间系。到目前为止,我们所说的大多数讨论适用于“当今”观点,从这
个观点设计者决定什么对机器人完成任务是有价值的。在第5章中,我们将提供从发育观点考察价值的细节。一个悬而未决的深奥问题是为什么智能体应该从一开始就学习所有的东西。换句话说,学习是怎样和价值发生关系的?为什么不停地学越来越多的高度技能,而不是安于现状?第6章将讨论价值的进化观点,这个观点提出了以下难题:为什么在进化过程中生物变得更复杂,即增长的复杂性是如何和价值相联系的。