历史研究记录

身体的智能：4.1真实世界和虚拟世界

2018年12月9日高速ETC办理

身体的智能：4.1真实世界和虚拟世界

首先，本书是关于必须在真实世界中发挥作用的具身性智能体的。真实世界具有和虚拟或规范化世界截然不同的性质，而且为了长期发挥作用或生存，智能体必须能应付好现实世界。此外，不同于虚拟世界，真实世界以不同的方式给予智能体挑战。首先，因为真实世界的智能体是具身的，所以信息的采集总是花费时间：如果我想知道谁在隔壁房间，我必须要么去那儿查看，要么打电话给那个房间或找个人询问。

其次，智能体能获得的关于真实世界的信息总是很有限的：我们只能看到我们视觉范围内的东西，只能听到传入我们耳朵的声音，因此我们不可能获得完整的信息。而对于如国际象棋等规范化竞技游戏，情况就完全不同。在这种游戏中，如果假设游戏本身不包含棋手的策略，对棋子在棋盘上位置的认识就构成了游戏状态的全部信息。并且，真实世界中的完整信息到底意味着什么仍不清楚：这是不是暗示着每个智能体必须能认知宇宙中的每个原子的状态呢？这显然是个荒谬的想法。对部分真实世界的信息进行综合的一个方法是构成一个世界的抽象模型。例如，为了描述一个教室的特性，我们给出在这个教室里的学生数、教室的温度、照明条件以及投影仪的使用与否。这样的描述对大多数目的来说是绰绰有余的，但同时也消去了许多可利用的潜在信息，如学生们血液循环的情况，他们对于授课质量的想法。

第三，实际装置总是容易受干扰并发生故障。传感器也是实际装置，所以从传感器得到的信息当然也存在误差。从以上分析可以看出，关于真实世界的知识总是非常有限的，所以本质上具有不确定性，而且只在有限范围内是可预测的。如果你

的周围充满噪音，你就不可能听到正从后面向你驶来的车辆。这起因于你耳朵的局限：它们只传递音波的总和，所以你不可能检出车辆的声音。请注意，不论智能体的速度和传感器的精度如何，这个说法仍然成立；即使我们拥有超高分辨率的摄像头，如果周围突然变黑，传达的图像就会模糊不清，充满噪声。从真实世界收集到的信息具有不确定性，并且只具有有限的可预知性是对所有的智能体都适用的原理。

第四，真实世界是不能以被明确定义的离散状态来进行描述的：天气从不会只有好或坏两个状态，而是晴天、多云、多雾、雨天、起风或阴天，这些状态本身又包含了很多不同的程度。由于没有离散的状态，因此当现实世界处于某一个特定状态时，就没有被明确定义的行动可以被执行，如外面正在下雨，当然带上雨伞比较好，可是多云或正下着毛毛雨或晚些时候可能下雨时，该怎样呢？以国际象棋为代表的规范化世界却不会因缺乏明确定义的状态而引起问题。在国际象棋里，每个棋盘位置都可以被清楚地定义：一个棋子占着或没有占着某一个格子，这样对于每一个棋盘位置，都存在一个（下一步）可能移动的有限集合。棋手可从这个集合中进行选择。

第五，真实世界里的智能体总是得同时做好几件事情，动物必须吃喝，同时必须小心不被其他动物捕食，它们还必须建巢，保持清洁，呼吸，防止被传染，繁殖并照顾后代。同样，那些必须在真实世界中发挥功能的机器人也总有很多任务必须并行处理。例如，一台专为在办公室里给雇员提供咖啡服务而设计的机器人在提供咖啡的同时，还必须能一直保持发挥它的功能，充电，避免损坏或撞上东西，当然更不能伤害人类。与此相反，在国际象棋这样的规范化世界里，只需做一件事情：

为赢得棋局，一次移动一个棋子。

第六，因为真实世界有它自身的动态机理（dynamics），也就是说即使我们什么也不做，在外面的世界里还是有很多事情不断地发生，因此总是存在时间的压力。所以，不管它们愿不愿意，智能体不得不总是有所行动。在许多规范化环境里，只要需要，智能体可以花任意长的时间去决定一个行动。最后，和这点有关联的是，真实世界是一个非常复杂的动态系统，从根本上它是不可预测的。这是因为它的非线性本质以及对初始条件的敏感性所致（见插注4.1）（Herber Simon创造了有界合理性（bounded rationality）这个术语来表示在此种环境下必须做出的决定（Simon，1976，1969））。

继续展开前让我们小结一下，从真实世界中获取信息是需要时间的，而且获取的信息总是不完整，极易含有误差的；这些信息并不能简单明了地划分成离散状态；

工作于真实世界的智能体必须同时处理几项不同的事情；最后，真实世界不仅仅对智能体的行动做出反应，它往往改变它自己的意向。因此，真实世界充满了“混乱”和挑战。很清楚，工作于真实世界会给智能体带来一些制约，即有些事情是它所不

能做到的，如从环境中瞬时获取无噪声的信息。在下一节里，我们将描述这些制约是怎样给真实世界的智能体带来某些很难应付的限制，同时又提供了难得的机会的。这些限制和机会可以通过所有完全智能体共有的一组性质来描述。

插注4.1动态系统

关于动态系统的科学文献数量相当庞大。虽然在较高的层次上对其基本概念有一个大致相同的意见，但如果就细节考察一下就会发现，在想法上还是存在着相当大的分歧。

我们将把动态系统、混沌、非线性动态以及复杂系统这些术语作为近义词使用，来阐明这个范围极广的研究领域，当然事实上这些术语之间存在着足够大的区别。我们的意图是为本书所需的基本概念提供一个极短的、非正式的概述。虽然我们不打算引用实际的数学原理，但我们将利用来自动态系统理论的一些概念，因为这些概念会给我们思考具有物质具身性的智能体和智能体群带来非常直观的比喻。

一个真实世界的动态系统总是根据某些法则发生变化：四足机器小狗、人、经济系统、天气、摆动着的钟摆或猴子的社会群体都是真实世界动态系统的实例。动态系统可以用微分方程式（或它们的离散形式：差分方程式）来建立模型。动态系统的数学理论主要研究方程式中的变量是怎样随时间变化的，如小狗Puppy关节的角度就可以被用作一组微分方程式的变量来对机器狗的移动进行数学描述。为了保持简单明快的风格，本书将不使用微分方程式。

我们在此考察的动态系统都是非线性的，因为真实世界中有趣的系统都是很典型的非线性系统。非线性意味着我们不能再像对线性系统一样，将一个系统分给成若干个子系统，先解决各个子系统的问题，然后再合成各个子系统的解来给出完整的解决方法。在实际生活中，这个原理往往会惨遭失败：如果你同时听两首你喜爱的歌，你不可能体验到两倍的快乐（这个例子归功于Strogatz，1994）。同样，我们不可能不考虑小狗Puppy其他腿的影响而理解小狗的某条腿的运动。换句话说，一个系统必须作为一个整体来考虑（请参照完全智能体原理）。非线性系统的另一个重要的特性是对初始条件的敏感性：

如果同一个系统在相似的初始条件下运行两次的话，短时间后，系统就会处于完全不同的状态。这也和线性系统截然不同，从相似条件出发的两个线性系统的运行情况也会相似。天气是非线性系统一个极好的例子。微小的变化会有巨大的影响，正是这种非线性效果使得天气预报十分困难。

一个系统的位相空间是由系统的重要变量的可能值所构成的空间。如我们能选择小狗Puppy的关节角度作为它的重要变量，然后用关节角的时间变化来描述小狗运动的特性。假设每条腿有两个自由度，就会产生一个8自由度的位相空间：位相空间的每个点代表了8个关节的一组取值（另外一种选择是，只使用脚底的接触传感器，这是一种不同的，但较简单的定义状态空间的方式。我们可以得到一个4自由度的状态空间）。状态空间里的邻近点代表了关节角的相似值。当小狗Puppy奔跑时，关节角连续变化。这样，我们就认为这些变化和位相空间中点（在特定的时刻所有的关节角度的取值）的时间变化的方式是类似的。这个点在状态空间里的路线，也就是所有关节的时间变化，被称为系统的轨迹。

吸引子状态是位相空间中一个较理想的状态，如果系统处于吸引子的吸引范围内的话，它将自发地向吸引子移动。共有四种吸引子：点、周期、准周期和混沌。实际系统，如小狗Puppy，本质上就具有吸引子状态。我们应该认识到很重要的一点是，吸引子总是依存于它们被驱动的方式，同时也依存于周围的环境条件。

如果小狗Puppy奔跑并安定于某一个步态，短时间后（短于1s），关节角就会或多或少地产生重复。也就是说，轨迹将回到和以前大致相同的位置，即关节角的取值将和前一个循环时的取值很相近。这种循环现象被称为周期吸引子，或者因为现实世界中的角度不可能很精确的重复，又可被称为准周期吸引子。小狗Puppy的不同步态对应于不同的（准）周期吸引子，这可以用图4.2来说明。如果小狗Puppy摔倒了或停止了移动，那么它的关节角就不再随时间变化，在位相空间里的轨迹就停留在一个单点上。这就是为什么这些点被称之为点吸引子的原因。最后，如果轨迹在一个有界的区域内移动，且不可预知的话，那么这个区域就被称为混沌吸引子。随着时间的变化，系统趋于落进它们的吸引子群（趋向于某个吸引子的轨迹的总和被称之为吸引范围）。吸引子和我们关于认知出现的想法密切相关（参见第5章），它们是一些存在于连续系统里的离散可识别单元：

如虽然小狗Puppy的关节角随时间平滑地变化，但我们仍然能确切地分辨出小狗Puppy是在慢走、快跑或是处于静止状态。

另外还存在一个参考系的问题。你怎么知道这个系统正处在一个吸引子状态？而智能体又是怎么知道的？因此，你需要提供给系统进行测试的手段，例如，如果你对移动有兴趣的话，你可以使用传感器测试关节角（就如例子所给出的一样），或者你可以在脚底安上压力传感器。在这些测试的基础上，机器人（或研究者）能检测出它的吸引子状态，并可能改变它的驱动模式：也就是改变驱动的频率以及前后腿的位相差（如当前腿开始伸张时，后腿开始弯曲），变换动态机理，以使系统能迁移至别的吸引子状态，如从步行到奔跑。尽管吸引子的概念有很大的影响力，且具有直观的感染力，但吸引子状态间的迁移无疑同等重要。在需要产生一系列行为时，这种重要性就更能得到体现。

吸引子以及吸引子间的迁移，在某种意义上反映了系统（在本书中指智能体）自然的动态机理。如果某个智能体的驱动源是一个振动子（用以产生周期运动），则这个完全系统将依存于这个振动子的频率，安定于一个（准周期）吸引子状态。这个吸引子状态的周期产生于神经和实际系统的耦合，因此，有别于由振动子强制规定的（强制振动）周期。这种现象被称为相互卷吸，即合成频率代表了多个相关系统间的一种“妥协”（请参照第5章关于Sten Grillner七鳃鳗实验的讨论）。

我们向那些想进一步了解动态系统的数学基本原理的读者推荐 Strogatz（1994）的文献，如果对动态系统在认知科学方面的应用有兴趣的话，可以参照Port和Gelder（1995）和Beer（2003）的等文献。