身体的智能：10.5记忆的具身化观点：把设计原理应用到智能系统中

高速ETC办理

6年前

身体的智能：10.5记忆的具身化观点：把设计原理应用到智能系统中

我们可能应该从方法谈起，我们本可以把章节按照一般记忆研究的结构来组织，它将包括以下几个章节――“生态学方法”、“重构记忆”以及“作为复杂动态系统的记忆”，另外一种是我们按照设计原理，以不同的方法“分割”这个领域。

我们选择了后面这种方法，因为全书当中都用了这种结构，而且在设计原理和现代具身化的人类记忆研究中也有高度的一致性。

在第4章中，我们提出了一个具身化智能体，只要它与环境相互作用就会产生感官刺激，而且在感官信息之间通常都有关联，这使得处理更加容易；事实上学习就是这样被激活的。有趣的是这种观点更多地与记忆在生态学上的观点相对应，后者是由认知心理学和记忆研究方面卓越的学者UIrich Neisser在1978年提出的，他提出的问题是人们每天怎么使用记忆。心理学家Arthur Glenberg，美国威斯康星大学（曼迪逊）具身化认知实验室（laboratory
for embodied cognition）的主任（实验室的名字本身就讲述了一个重要的故事），在他被多次引用的名为“记忆为何物（what memory is for）”的文章中主张：记忆并非为实验室的记忆任务中的学习单词表而进化，而是为行为、感觉和行动而服务（Glenberg，1997）。由于对具身化的重要性的认可不断增加，智能体的行为吸引了记忆研究者的兴趣。如Asher Koriat近期关于运动行为的论文，“对基于运动行为的记忆过程的兴趣已经被具身化认知和情境认知的概念激发了，这几年来已经得到不断推动，这还推动了一种概念框架，其中认

知过程可以看作是深深根植于人与世界的相互作用中的”（Koriat 和Pearlman-

Avnion，2003：435）。他们还认为：“在不同的心理学领域对具身化现象不断增长的兴趣……推动了到达认知理论前沿的步伐”。

在记忆具身化的概念中，与环境的相互作用占据了中心地位，这对于许多把记忆功能与有意识的回忆及重新检视过去的能力联系在一起的人来说也许是有违直觉的。然而许多研究者已经提出尽管有意识的回忆本身很有趣，但是它可能与那些无意识控制下的记忆现象相比罕见得多（例如，Bridgeman，2003；Karn和Zelinsky，1984）。无意识过程影响行为的事实在很久以前已经通过内隐记忆的研究被建立起来了，它证明了不管被实验者是不是能够辨识出他们以前读过的文章中的一段，他们都会在第二次阅读时更快地阅读以前读到过的文章。（例如，Jacoby和Dallas，1981）。当然，无意识下的记忆会影响行为的看法是临床心理学和精神病学中神经症的精神分析理论的本质，这是由心理学之父Sigmund Freud在20世纪早期明确归纳得出的。

三要素组成原理和完全智能体原理：生态学方法让我们简要看一下在记忆背景下的三要素组成原理和完全智能体原理。三要素组成原理告诉我们总是有三个部分需要考虑：任务和所需的行为（或者在考虑诸如记忆试验中人类被实验者的自然系统时，是我们正设法来解释的所观察到的行为）、

环境以及智能体本身。德国学者、公认的高级认知功能试验研究的奠基人Hermann
Ebbinghaus的实验室的传统是把实验性记忆研究聚焦在智能体的行为和准确控制环境影响的尝试上。与之相反，记忆研究的生态学方法―Neisser方法―一通过观察在真实世界的记忆功能，来研究智能体和环境的相互作用。实验室研究的目的有趣而重要，通过密切控制环境因素，能够发现没有掺杂其他影响因素的“纯粹的记忆功能”。然而这个目的要假设有这么一个“纯粹的记忆功能”，如果Ashby的记忆观点好比一个理论框架，那么这个假设至少是不明显的。而且正如我们所述，记忆是分割完全智能体行为的一种方式，而且在这种观点下记忆研究涉及寻找智能体行为之间的有趣联系以及随着所处环境的改变而发生行为变化的方式。

记忆研究的问题之一就是通过对自传体记忆和见证人证词的研究，得出记忆有很强的环境依赖。如证人对一个问题回答的准确性与他是否自愿回答问题或者需要回答得多详细关系密切（Fisher，1996）。从一个完全智能体的角度来看，记忆的环境依赖仅仅表示了把记忆作为一个物品存储和取回场所的概念比喻是不妥当的。根据很具影响的心理学家Fergus Craik所说，“显然系统中的某些东西必须根据经验而变化，但是这种变化可能要扩散传播到整个认知系统，这样的话系统就按照不同的方法与环境的各个方面相互作用，而不是像摄像机的片断那样被特定、分散地记录”（Craik，1983：356；Koriat和Goldsmith，1996）。

换句话说记忆能够通过个体行为的改变来表现自己，我们作为观察者可能想要通过引用Ashby关于记忆概念的想法来描述这些行为变化。生态学的方法通过研究人类在实验室以外的复杂的真实生活中（具有许多影响因素的真实世界中）的行为来关注作为整体的不同个体，研究他们怎么适应周围的环境。尽管生态学方法已经给出了一个更加现实的观点，但它本身不直接排斥仓库的比喻；可是它的确让仓库的观点更加难以维持。

完全智能体、感觉–运动协调、记忆的情境特性和作为重新分类的记忆这个讨论已经显示出了给定在真实世界环境中潜在影响被实验者行为的所有因素，在针对记忆的生态学方法中，很难产生科学上正确合理的、可重复的结果。

正是这一困难致使Baddeley对于Neisser的书《细观记忆》（Memory Observed）做说明，“它值得一读，但是恐怕书中告诉我们更多的是关于Neisser的热情和品味，而不是应该如何去研究人类记忆”（Baddeley，1997：2）。但也许所有这一切并没有遗失，设计原理可以帮我们提供一个关注的焦点。例如，当完全智能体有行为产生的时候都会产生感觉刺激，这种感觉刺激一般都彼此关联，而这种关联有很多用途。

举个例子，当我们无意中听到广播中播放的歌曲片断，但却不能想起整首歌曲时，重复哼唱听到的部分，剩余的将会自然浮现在我们脑海中。通常这种感觉运动协调的行为能够支持回忆功能。重现感觉–运动顺序中的一部分，就是活动声道肌肉来哼唱曲调中的某一片段，在环境中发出声波，对智能体产生了感觉刺激，你听见你自己的哼唱，这将帮助你回忆歌的其他部分。

如果我们与Glenberg讨论，我们当然要解释想起这首前面听到的歌曲的“目的”在哪里。就算不需要有目的，仅仅就是由电台中播放的一段音乐引起的一连串的行为。这个小例子举例说明了感觉一运动协调的原理，即通过感觉–运动协调的行为一―哼唱――引起的感觉刺激对于行为有很明确的影响。

因为记忆直接关系到感觉–运动协调，而不仅仅像内部存储那样，记忆要以特殊的方式与环境相互作用来激活记忆功能，可以说，这就是我们所谓的记忆的情境本质，它对于世界和现实环境交互有强依赖性。如我们前面指出的，通常记忆往往不是有意识的行为，不过由于大部分的运作都由系统环境的相互作用来完成，因此没什么需要储存记忆的。以作者之一的Josh为例，那时他正就读于苏黎世大学，当他走在苏黎世火车站的下坡路时突然间想起了他小时候在加拿大的一个情景，那时他要走过大楼前面一个非常相似的坡路去赴医生的预约一―这个情景他已经“忘记”很久了，其实真正说来环境也已经完全不同了，显然感觉–运动信号的顺序就这样唤起了特殊的记忆。或者拿Bovet的人造鼠的例子来说，尽管不是人类，它与红色墙壁的交互及对交互的利用对延迟报酬学习任务的成功来说是至关重要的。

让我们再详细描述一些关于记忆的感觉–运动协调的原理。在前面的章节，特

别是第5章里关于发展，我们阐述了感觉–运动协调对分类的重要性，而且我们使用了吸引子的概念来指明与类别相应的感觉–运动状态。心理学的研究已经为分类和记忆划了明确的分界线。在分类的文献中，如原形以及基于样本的模型这样的概念都被引入来解释当被实验者被要求把照片分类为“动物”、“水果”、“家具”时的反应方式。另一方面记忆研究与我们讨论的如长期记忆，短期记忆以及情境记忆等概念有关。似乎这些区别与实验范式而不是作用机制更有关系，此外可能这是在大脑中发生的两个独立的过程，或者更合适的说法是两种不同的观察人类行为的方式。

至少从一个完全智能体角度来看，这两个概念―一分类和记忆――事实上是很难区别的，因为真实世界中没有两件相同的事物，因此当我们认出一个人的时候我们总得做一个抽象（正如前面所说的），即使可能是同一个人，他或者她出现的方式，以及他或她引起的感觉刺激在每一次见到时都会不同。

想想从Rosenfield的《记忆的创造》（Unvention of Memorny）一书中引用的另外一段话：

“我们认出经历岁月变化的人们，我们认出放错地方的个人物品、我们曾去游玩过的地方的照片。我们能够识别出毕加索的名画以及与毕加索作品递真的册品。当我们把一幅从没看见过的作品认定为毕加索的作品或者是质品时，我们做的将不只是搜寻以前的印象。我们把它们归类为毕加索真品和质品，我们对画作的坚别或对人的识别是对分类的识别，而不是一件具体的东西。人们从不严格和从前的自己相同，而事物也从不是同一个样子（1988：163）。”一方面，Rosenfield的观察报告用来反对仓库比喻：如果我们只是拿出记忆中特定的物品，他们将永远找不到与我们现在所看见的相符的那个。因此记忆必须看成一种分类而不是简单的匹配。这与Gerald Edelman的观点一致，他将记忆作为一个把世界分类的能力来看待：“记忆是一种分类和相关联地引出一般性结论的强化能力，而不是储存特征或者物体属性的列表”（Edelman，1987：241）。这是行为特性的描述，并不暗示任何明确的机理。按照Edelman的看法，记忆是赋予完全系统的属性：“是整个感觉–运动系统及其重复性的行为和与导致了记忆响应的全局映射中的分类配对功能相协调的响应”（1987：266）（分类配对组（classification couples）是有关分类的特定神经结构）。这段话说明了这样的事实：我们面对的是感觉–运动过程中的完全智能体，这个过程能够展现我们叫做记忆的行为。同样，记忆与分类一样，它不是大脑中某个模块的活动，而是包含了整个智能体的行为。

这里还有一个非常重要的补充，即由Rosenfield间接提到的“事物从来不会以完全相同的面貌出现”。在第3章里，我们提到了Steven Grossberg的ART理论自适应共振理论。ART理论的一个重要特性就是随着每一次分类的进行，种类本

身以及对感觉刺激的解释发生了些许改变，要么现有的分类被调整来匹配当前感觉刺激，要么就是形成新的分类。虽然ART理论诠释了一个非具身的观点，但它说明了重分类的想法。Edelman重分类方法引人注目的地方在于它不仅是完全具身的，而且还考虑了关于感觉一运动协调和重分类的神经系统。因此可以看出当我们考虑包含认知的感觉一运动过程时，记忆和分类就变得无法区分了，它们并不是像分离的模块那样驻留在大脑中，而是看待同一过程（源自具身行为的过程）的不同方法。

多样性–顺应性、廉价设计以及生态学平衡：支架让我们再从我们的理论多样性–顺应性以及廉价设计和生态平衡的设计原理来简要看一些其他关于记忆研究的想法。回想一下，多样性–顺应性是关于充分利用生态位的理论。廉价设计告诉我们智能体一定会充分利用给予的生态位来优化资源，生态平衡是关于如何实现这些的，即要通过形态学计算。自然真实的具身智能体自身的形态学和固有的动力学机制提供了记忆功能，动作顺序并不需要内部储存，也就是说他们只要顺其自然就行了。还记得Josh的例子，就是下斜坡使他想起了童年的一段经历；不需要明确储存这段连续事件的所有细节，只是当他走的时候产生了一个相关的感觉刺激。从某种意义上来讲，这个任务已经被卸载到系统一环境的相互作用中去了，这就把内部存储的需求量降到最低。在这种情况下，物理具身化提供了记忆功能，因为身体动力学能为此得到利用。

在更加复杂的方式中，与环境相互作用能够得到应用，这种方式和支架系统的一般概念有关。人们支持记忆功能的有效方法是操纵和构建周围环境以有利于今后的相互作用（在第5章和第8章中曾详细提到过）。群体激发行为的相互作用，如在现实世界中累积的信息素痕迹或者安置的交通信号标志是构建环境的一种方法。支架在现代文明社会中随处可见：人们记便条，为约会写日记以及使用易可贴和PDA来帮助他们记忆。正如Andy Clark写道：“我们的大脑已经让世界变得聪明，以至于我们根本不需要开口！或者从另一个角度来看，正是人脑加上大量的外部支架最终形成我们称之为头脑的敏捷的、理性的推理机”（Clark，1997：180）。这种观点完全与记忆的生态学观点相一致。

另一个事实也能证明把记忆任务卸载到环境中这种观点的正确性，那就是识别通常要比回忆更容易一些。认出一个人要比想象出那人的模样容易得多，而且通常情况下判断一个条款是不是出现在曾经看到过的列表中要比回忆起列表中所有的条款更加容易。似乎这样看起来人类还是挺会“节约”的，也就是忘记不必要的细节，这些细节不用记住是因为它们已经存在于环境中了。回忆起Rodney Brooks富有挑战性的声明：“这个世界就是它自己最好的模型”（Brooks，1990：6），如果我们

把很多细节记在脑子里，那将很难追踪可能发生的改变，因为世界是不断变化的（人会更换服装、发型以及长出皱纹），这些信息将很快失去对于适应性行为的价值”。在Bovet的实验中，人造鼠总是通过利用伴随发生的红色墙壁把记忆加载到环境中，红色的墙壁能够用来联系被时间分割的两个关联事件：一方面是触觉暗示、转向、

红色墙壁，另一方面是报酬和红色墙壁。

有充分的铁事性证据证明记忆的感觉–运动本质，或者更通俗地说具身化本质和设计原理，能够很容易地被用来解释行为的变化。然而，实验室得出确切的实验结果将提供一个更强有力的证据。不幸的是，很少有实验表明能为记忆的具身性本质提供实验方面的支持。我们推断，与数以千计的非具身化观点的实验相比，证明记忆具身化的实验非常少的原因是实验方法上的困难，对于非具身化记忆的实验，仅仅需要一台电脑显示器，相比之下记忆具身化的实验将需要更高端的设备来捕捉记忆的感觉运动方面，如额外的传感器（触觉、力矩、关节角传感器）和如运动捕捉装置之类的记录设备。此外很难把当今的大脑图像处理技术整合到感觉一运动任务中，因为个体需要到处移动，而现在的设备需要被实验者呆在原地不动，如果实验任务是“单纯认知”的，则不需要移动，那么就能够进行直接的、标准步骤的实验。

参考系、并行与松散耦合过程以及元余性的原理：构建性记忆、动力学和吸引子根据至今为止我们在这章中所讨论的内容，显而易见，大脑，特别是神经可塑性发挥着重要作用，但我们故意将重点放在设计原理、与环境的相互作用、支架以及感觉一运动协调上。因为通常在面向神经系统的有关记忆的文献中只讨论大脑运作过程，而完全智能体却在很大程度上被忽略了。因此现在让我们短暂地把注意力放在有关记忆的大脑运作上。来自大脑科学的其他证据能够给研究中的过程带来启示。简要地看一下短期记忆和长期记忆的区别，这已经从神经系统科学（来自生理学和解剖学）中得到了明确的证据，两者在大脑水平上至少是部分不同的系统。正如前面指出的，Edelman很完美地绘制了基于分类行为，或者更确切地说重新分类行为的神经系统结构。在20世纪80年代，脑研究工作者Waler Freeman 在一系列对兔子味觉器官的经典观察中研究了关于这些动物鉴别气味能力的大脑基础机制（这些实验的总结可参见FreemanFreeman，1991），我们在第3章中已简单地提到过。

现在让我们更仔细地看一下这些实验，因为它们给出了一个关于记忆的有趣的观点。

Freeman从位于嗅球――脑部响应气味的地方――上方的兔子头骨表面大约60个不同的位置同时记录了脑电图（EEGs）。记录的脑电图反映了在电极接触部位下的数以千计的神经元组的活动。人们训练兔子用舔食或者咀嚼来表示闻到木屑的

① Babdcley 197：21）指出“识别要比回忆容易”的陈述太绝对，因为实际上比较的对象并不清楚；但是作为一般现象来说当然是正确的。

味道，当兔子反应时，脑电图就被记录下来。然后又训练它对于香蕉气味的反应，当有正确反应的时候，就记录第二份脑电图。最后再让它还原到只响应木屑的气味，然后记录第三张脑电图。

令Freeman大为惊讶的是，尽管兔子在第三阶段很准确地识别了木屑，但是脑电图却和它第一次接触到木屑时的完全不同！换句话说，接触香蕉的环节不知何故影响了神经系统，使得在第二次接触（第三阶段）到木屑时的动态记录不再和第一次接触时的吻合。从这个实验当中我们能够总结出气味的分类不仅仅在大脑动态水平上或者至少不在脑电图所测的区域表现出来。对于正在寻找的“香蕉”和“木屑”气味分类的不变性没有在脑电图的模式层面上找到，或者用这本书中的行话来说，只是没有在内部机制层面上找到，而是反映在完全智能体的行为响应上（这就是研究工作者们如何知道兔子在第一个地方闻到的是哪一种气味的）。这是另外一个参考系问题的例子，如果我们观察整个智能体的行为，我们发现在第一次实验和第三次实验时它对木屑做出相同（或相似）的反应，而如果我们只是观察脑部动态（脑电图），第一种情况和第三种情况是有明显区别的。

一般来说，许多研究工作者，包括Walter Freeman，Scott Kelso（《动态模式》

（Dynamic Patterns）的作者），Esther Thelen，Linda Smith（《对于认知和行为发展的一种动态系统的看法》（A Dynamic Systems Perspective on development of Cognition and Action）的作者）以及Kunihiko Kaneko和Ichiro Tsuda（《复杂系统：混沌和未知》（Complex Systems:Chaos and Beyond）的作者）都认为大脑好像一个动态系统而且已经提出了有关大脑动态的模型（我们在此提到的仅是其中一些突出的例子），也就是大脑的活动如何随时间变化。他们中的许多人提出记忆可能作为一个吸引子在大脑中存在（参见插注4.1）。然而我们还要注意，不应该孤立地看待大脑：感觉一运动过程在创造和影响吸引子状态和状态之间相互转换的方面起着至关重要的作用。

动态大脑理论研究方面的先锋代表之一Freeman曾提出特定的记忆可以看成是混沌的吸引子。混沌的吸引子是相位空间内的一个有界区域，但其轨迹是不可预测的。换言之，即使大脑进入了（混沌的）吸引子，大脑的模式仍然会在特定的范围内变化。Freeman推断“混沌是使大脑对外部世界作出柔性响应，并产生新的活动模式的基础”（1991：78）。生物体能够区分每一种味道，因为有一个混沌吸引子，只要当一个新的味道变得有意义（能被区分开来），一个新的吸引子就会被创建。在Freeman 的嗅球模型中，通过在不同吸引子（一个木屑吸引子和一个香蕉吸引子等）之间的跳跃来完成记忆。兔子大脑跳跃进入并停留的吸引子是由特定的气味决定的（且已经学会识别的）。回到木屑–香蕉的实验当中，由于模式的高度可变性，当出现两张属于同一个混沌吸引子的不同脑电图时，结论就不明显。许多在人工神经网络群体中的人们也提出把记忆看做是吸引子的状态（作为一个很好的总结，参见Amit，1989）。

把记忆理论化的这种方法也许有点投机，但直觉上还是十分吸引人的，只要它能够帮助研究者们发展出实验和理论概念的新想法，那么无论最后动态系统比喻对于理解大脑功能是否确切，它都是有实际价值的。为了结束大脑动态和记忆的讨论，必须提一下还有很多正规的令人激动的（但是有一些复杂的）数学研究仍在继续，正在进一步探索这种构架的可能性（如Kaneko和Tsuda，2001）。

我们能从研究记忆的动态系统方法中总结出很多结论。首先，工作在这一领域的大多数科学家可能会同意，要在基于人类记忆的大脑动态研究上有更深入的了解将需要许多基础性的研究。其次，就目前的工作来看，记忆不能被概括为被动存储的机构，而是包括了动态的过程。正是这样使得记忆（或更进一步，人类的行为）有如此巨大的适应性。再次，行为并没有储存在大脑中，而是当智能体与环境相互作用时涌现出来的。如果在这种交互中，产生的行为与早期类似的情境下的行为是可以类比的，我们就说系统已经记住了这个情境。因为“记忆”不是静坐在系统中，而是在与世界的相互作用中动态建立起来的，因此我们说记忆是构建性的。在与环境的交互作用中也存在着松散耦合，当嗅球中的神经元（它们通过与环境的交互作用松散地耦合着）接触到特殊气味时，它们会“相互协作”停留到特殊的混沌吸引子状态。最后，记忆的构建性本质是完全智能体观点和智能体情境特性的结果，是与情境认知相一致的观点（例如，Clancey，1997）。在情境认知的观点中，知识对于智能体并不是内在的，而是当智能体与真实世界交互作用时产生的（比起重建性记忆（reconstructive memory）来，我们更喜欢构建性记忆，因为前者暗示了有一些部分储存在某个地方，而现存记忆就是从那些部分上建立起来的，于是重建性记忆将和仓库的想法相一致，只是储存块变得较小）。

总结这一节，让我们把这些讨论与前面更多的神经网络的经典领域联系起来。

在20世纪八九十年代，建立了许多基于连接主义网络的记忆模型，并不断改进，特别是在心理学领域，这能从这篇1997年出版的，名为《连接主义心理学》

（Connectionist Psychology）的书中看出来，这是由两位英国著名的心理学家Richard Ellis和Glynn Humphreys撰写的；还有另外一本由JeffElman和他的同事写的《反思天赋》（Rethinking Innateness）中概括了对发展的连接主义观点。记得我们在第2章关于“人工智能的全景”的讨论中，引入了作为神经模型的特殊类型以及对观察心理学和生物学功能建模的流行方法的连接主义。因为在这些网络中的知识是储存在人造神经元之间的连接强度中，因此不能仅仅通过观察连接矩阵就指出具体编码进去的是什么知识，它是广泛分布的，而不是储存在某个特定地点中。要记住具身化智能体必须进行某种行为来产生感觉刺激。由于大部分的连接主义模型都是非具身的，当然不能展现行为，于是也就不能产生感觉刺激。因此，为了能够从中得到一些东西，实验人员必须提供给网络感觉刺激，这个感觉刺激必须悉心准备。相对于具身化的智能体能够通过与世界的交互作用自己产生出“好的”感觉刺激，而非

具身化系统必须给予正确的输入以获得有用的输出。连接主义模型是开发超越简单的仓库概念的记忆模型的起始点。然而尽管连接主义模型能够学习，但是通常是静止的，意味着没有内在的动力学机制，输入是给定的，信号通过网络来传播得到一定的输出，接着提供下一个输入。回忆第2章，我们注意到心理学模型和神经信息学模型有朝着动态模型发展的趋势。这也在一定程度上发生在连接主义的研究中：正如我们提到的，对于神经网络模型流行的扩展是脉动神经网络，其中脉动的时机和传播以及动作电位起到了重要的作用。只有把时机考虑进去才能出现有趣的动态特性。由Freeman，Kelso以及Kaneko和Tsuda等一些人发明的模型是高度动态的，但是还需要更多的研究来得到对动态神经系统工作机制的更好理解，特别是当它们为具身化智能体所使用的时候。

ETC注销；ETC充值；ETC客服；ETC扣费查询；

ETC发行合作