微信搜索“高速商务通”,马上办理ETC
身体的智能:8.2普适技术:特性及原理
如刚才所述,被动物体(指既不能自主感知也不能自主行动的物体)能支持和帮助用户完成他们的任务,这就是支架的思想。在这节我们将探讨当人造物拥有更多智能体特性时会发生什么。在本书开始时,我们曾指出,智能和智能体特性都不是全有或全无的属性。因此,根据在第4章所讨论特性的出现程度,一个物体可能同一个完全智能体或多或少地相似。首先,让我们来看一下只能够感知但不能动作的物体。这事实上是最初的普适计算思想之一。作为第一步,把传感器安装到各个地方,如房间里(主要是用来做总体监视的摄像头和运动检测器)、地板上(如用来检测个人位置的压力传感器)、汽车里(为自动驾驶服务)、椅子上(判断是否空位)、床上(监控人是醒着、睡着、还是不动了),也可以安装在茶杯里(检测所盛液体的温度和液面高度)、移动电话中(确定它们是被怎样应用的)或衣服里(测量脉搏、血压或皮肤电阻等生理数据)等。用各种传感器增强环境和物体仍是这个领域内的主要研究课题之一。然而,尽管只具有感知能力的物体已十分有用,但是它还是有局限的。譬如说,如果发生了某些危险的情况,只能感知不能行动的技术所能做到的仅限于向人们告警,而不能够主动采取任何行动。用我们早些时候介绍过的术语来讲,这样的技术仅有有限的智能体特征。
但是普适计算不仅包括能够感知的人造物,而且也涵盖那些能自行动作的物体。现在已经开发出了能够根据一定温度和光照条件来自动调节百叶窗的大厦,在和前车间距过小的情况下能够自动刹车的汽车和能够根据在相机视野中央成像物体的距离自动调节焦距和曝光时间的相机。如我们在本书中一直强调的,人工智能的最根本发现之一是感觉和行动系统间紧密耦合的实质(见第5章)。在普适计算领域,这个认识正在缓慢渗透,但是还没有被广泛认可。
让我们来深入探讨一下这个思想。把传感器和(或)驱动器用于普适技术会带来许多有趣的可能性。比如,我们工程师在探索“如其所能的生命”即生命本质的过程中,不是仅着眼于用在人工智能中的标准机能如视觉、触觉、听觉、平衡感(用来保持平衡)和本体感觉,还会想到引入生物体内不存在的新型传感器,如红外传感器,电波传感器,激光测距传感器,GPS和电话信号传感器等。这同样适用于各种可能的驱动器。举例来说,电话需要一个传感器来检测电话信号,这通常需要
有某种天线和麦克风来采集用户的语音信号。虽然电话开始配有可以作为输入设备的摄像头,如用来传送通话者的图像,不过,电话并不一定需要图像。很显然,电话的驱动器包括把压力波物理地传递到环境中的扬声器,用在静振模式下的振动器和产生振铃音和按键音的噪音发生器。腿和轮子一般不需要,尽管可以想象能够走路的电话,但是其用途令人质疑。当然也不需要机械手,因为电话一般不会被用来抓取茶杯或其他的东西。通常电话靠人来移动,它不需要行走系统,也就是说,它是被人带来带去的。回顾多样性–顺应性,我们知道顺应意味着充分利用生态环境。
在这一点上,移动电话是个很好的范例。我们也知道智能体不必知道它正在利用环境。电话是通过挂上一个提钩来利用用户的,虽然这种思考方式不是太直观。其他还有些既有感知能力又有动作能力的物体,如汽车发动机的燃油喷射系统,它有检测燃油压缩浓度,温度和油门位置的传感器,并根据这些测量数据喷射油气混合物,这便是它的动作部分;洗衣机有检测衣物污浊程度,质地和重量的传感器,它的动作包括加热洗衣用水,洗涤剂剂量调整和选择洗衣方式如强洗或轻揉。这类具有自己感知和动作能力的系统可以被认为是嵌入式系统。他们也是无处不在的,估计这类产品的市场会远远大于以前提到过的个人电脑市场。普适计算走的更深远的一步是它不仅把嵌人在感知和动作系统中的微处理器用在家用电器,消费电子和汽车里,还把它们植入我们周围的一切,如房间、墙、地板、窗子、家具、衣服、鞋子以及像茶杯、钢笔、玩具、盘子、书籍、杂志等等我们所能想象到的东西。
既然我们在考虑具有智能体特征的普适技术,比如那些在环境中能够感知和行动的人造物,我们关注的这些技术将拥有在第4章曾讨论过的智能体特性。进而我们可以在这些技术上应用智能体原理。在下一节,我们将来探讨这些思想。
特性
在第4章我们讨论过,仅仅智能体是实际的具身系统这个事实就意味着它们遵从物理学法则(如它们会向下掉,它们的移动需要能量);它们通过运动,或一般通过和现实世界交互来产生感觉刺激;它们通过行动来影响环境;因为它们是复杂的动态系统,也会有吸引子(平衡)状态;它们进行形态计算。移动需要能量,感知也需要,只是需要得较少而已。与移动机器人不同,普适计算设备如可穿戴式设备、茶杯、个人电子助理(PDA)、智能房间、智能板和移动电话等,它们并不自主移动,但是借助于其他设备或者借助于其用户,许多确实能移动。如汽车导航设备借助于汽车而实现移动;移动电话,个人电子助理,智能鞋或智能T恤衫通过被人们携带或穿着而实现移动。正如我们已经看到的,通过充分利用环境来实现自身“目的”对于这种技术来说是一个聪明的办法。这里我们在“目的”上使用了引号,因为那些设备本身不知道自己为他人携带,其目的完全取决于设计者和用户。而且因为它们被用户移动,这些设备会产生感觉刺激,当然这取决于传感器的种类。一个头戴
式相机会记录下携带它的用户去过或看到过地方的图像;嵌在鞋子中的加速度计会根据用户是否在走路,跑步,坐在椅子上还是在车上产生不同的数据;汽车导航系统会根据目的地接收信号;移动电话从发射最强信号的网络中接收信号,也可能接收发自GPS卫星的信号,这取决于被其拥有者所携带到的地方。
如第4章所述,完全智能体的另一个特征是作为复杂的动态系统,它们有吸引子状态,根据特定程序和负荷状况,洗衣机有其自己的节律;正在震铃的手机可以看作正处于一个特别的吸引子状态。而作为人造物和人类联合系统的特征,新吸引子状态的涌现将更有趣。通过人们和人造物的交互,(人造物–人系统的)吸引子状态的数量及它们之间相互迁移的数量将会增加,因为人们有更多可能的行动。例如,移动电话允许用户拨号、通话(感觉行动耦合)和玩电子游戏,所有这些活动都可看作吸引子状态和状态之间的转化。这正是普适技术如何支撑用户环境的一个实例。
完全智能体的最后一个特性是它们进行形态计算。在研究人员正在思考的这类思想进行调查后,我们仍没在嵌入式设备中看到很多能够反映出任何类似形态计算的东西。摄像机可能是个例外,它的感光单元在靠近视野中央的地方更密集。这种配置的主要好处是在不牺牲或牺牲很少功能的情况下大大减少数据的数量。这是因为靠近边缘,只要用非常少的像素用来检测运动就够了。在继续之前,值得指出的是,当感觉和动作能力得到增强的时候,完全智能体的这些特性将会在未来的这些技术中体现得更明显。现在让我们继续讲述类智能体的普适技术原理。
设计原理
我们有很多理由认为普适计算是应用我们设计原理的很好领域。第一,按照定义,普适计算是有具身性的。因此,至少在某种程度上,可以应用这些原理。第二,这些系统可以看做是真实机器人的自然延伸或扩展,这也是我们把它们称为机器人设备的原因,它们有感觉和行动能力(至少是有限的),因此确实具有智能体特征。
第三,从工程的观点来看,虽然也许有些不相关,但是有许多关于这些设备智能的讨论,这需要对基本概念作一个澄清。称嵌入式设备有“智能”不但可能引起误解而且可能产生对这类技术不必要的恐惧,结果可能引发抵制从而阻碍进步。最后,我们觉得通过拓宽我们自己的思路,通过超越具身智能系统的观点(如不将思考局限于动物和机器人的其他形态),我们可以得到更多的关于生命或智能本质的见解。
同时,我们可能建立关于如何认识自身和我们周围世界的全新观点。这些我们将在最后一章讨论。
在我们概述普适计算中的设计问题时,曾谈到了三要素原理,那么现在让我们进一步在普适技术中应用那些设计原理吧。
感觉一运动协调原理
注意在普适技术设备中感觉和运动的关联非常有限,因为它们自主影响环境的
动作潜力是非常有限的。我们也看到分类、感知和概念形成对智能体和现实世界交互非常重要,它们都需要感觉–运动协调。我们第5章中讨论过,更高层认知是从基于感觉一运动协调的发展过程中涌现的,如果情况属实,那么将很难在那样的设备上实现更高层次的智能。我们在第4章和第5章中也看到感觉–运动协调能够降低对智能体计算能力的要求,因此实现能够实时对环境响应的更平衡的系统。如果普适技术中没有感觉一运动协调,我们会遇到更大的困难,因为我们将会面对杂乱无章的数据,使我们必须更多地依赖内部计算能力。举例来说,如果目标是靠识别人脸以决定是否允许其使用手机的话,那么这个手机一定要给出指示以简化这项任务,如要在光线良好的条件下持手机在脸的前方并且不许胡子长长等。
人们可以想象涉及视频采集的重要应用。如果你有过从佩戴式相机看连续图像的经历,你就会知道几乎不可能在观看时不感到错位,因为这些图像没有做过任何稳定处理。人们可以想象出依据VOR(前庭眼动反射(vestibular-ocular reflex)原理的图像稳定机制。VOR是眼睛反射性移动,它的主要功能是在头部快速移动过程中,通过和头部运动相反方向的眼睛移动来将视觉图像稳定在视网膜上。不用说,这需要感觉一运动协调。现代数码摄像机中存在的抖动抵消系统只能处理相对很小的干扰,比如在跑动的时候,抖动并不能像人和动物中那样完全消除。不管怎样,研究人员已经开始研究这个问题了。Koppel等(2005)提出了一个算法,它用视频流来推测相机的运动并且做运动补偿。虽然这种方法看上去很有前途,但是这个算法还没有用到其他信息(如加速度)来推测相机的运动。
一般来说,因为目标不是要实现自主的智能系统而是共生系统,所以缺少感觉运动关联并不成问题;我们只是要意识到它。也许感觉–运动协调原理可以给我们一个如何扩展整个人机系统智能的提示。可以想见的是,感觉–运动耦合不一定非要自主实现,普适计算智能体可以利用他们寄生于人类的这个事实。日本静冈大学的Yoichi Takebayashi研究小组正在研究怎样利用空手道训练中的加速度信息来进行教学(Takahata等,2004)。在他们的实验中,Takebayashi和他的学生们把加速度计装在空手道新学员身上,并把它们接到扬声器上,这样在他们训练的时候就能听到自己动作的加速度了。10个月后发现,这个过程实际上强化了学习,同时也增进了这项运动的趣味性。这是第一个展示了结合具身性和嵌入式设备可以增强人们能力的可能性的研究。例如,考虑一个由截肢者手臂的肌电(electromyographic(EMG))信号驱动的假手,就像东京大学Hiroshi Yokoi教授开发出来的那个一样。当使用者拿起瓶子的时候,假手的运动会产生视觉和触觉反馈,这个反馈可以用来产生更好的EMG控制信号。另外,“Yokoi假手”还可进行形态计算(见图8.2),由于这个手可以变形,腱有弹性且材料也能变形,非常粗略的EMG信号就足以使其抓起中等大小的任意形状的物体(Yokoi等,2003)。这样,尽管假手没有复杂的感觉–
运动耦合能力,但是人和假手的这个联合系统却有这样的能力。
图8.2电子人―Yokoi假手
Hiroshi Yokoi 和Alejandro Hermandez开发的假手,使用从手臂上得到的肌电信号控制利用身体测量提供反馈的实践能够使人们对通常无意识的人体功能施加附加的控制,如改变血压,预防偏头疼或癫痛,这于20世纪60年代在医药界兴起并已取得了相当的成功(Hatch和Riley,1985)。随着可穿戴式系统的出现及其测量和处理能力的提高,这种身体反馈便可以不局限于在诊所或在家里进行的治疗,而可以连续和永久地进行。连续监测身体过程对于掌握医疗状况如糖尿病,各种心脏病和高血压状况是非常关键的。能够随时随地进行连续测量和实时反馈将会增加自律程度,并因此改善数百万人的生活质量。这种技术对老年人和那些患有慢性病的人来说毫无疑问会是一个福音。但是,我们不希望制造一个总是需要身体功能监测的疑病症患者社会,所以我们一定要考虑和采取措施应对廉价,精确的嵌入式设备的更进一步流行和普及可能带来的社会变化。
冗余性原理
假设我们要测量和记录老人院入住者的关键功能数据。我们可以想象一件用于测脉搏或者测量糖尿病患者血糖的T恤衫。根据冗余性原理,采用功能部分重合的不同物理系统很重要。因此,除了测量脉搏,我们可能考虑安装一台摄像机用来分析运动或者用来监测晚间的行动。这样,如果脉搏测量系统不能正常工作(如装有测量仪器的T恤衫在睡前被脱掉了的情况下),还能利用摄像机系统。虽然可能不太精确,但也通过判定被监测者是否在移动来得到他们的一些状态信息。我们也可设想在床上安装压力传感器来检测他们的活动。这是关于冗余性原理的一个很好的范例。因为所有的传感器都基于不同的物理过程并输出不同类型的信号,但是它们之间仍有重合,因此其中一个传感器通道可以部分地从另一个传感器通道中预测
出来。如果床上的压力传感器没有记录到移动,那么相机的测量很可能也会是一样。
生态平衡
目前生态平衡原理只能很有限地应用到现在的普适技术中,因为正如我们早些时候谈到的那样,直到现在动作在这个领域还没有得到重视。我们提到过生态平衡包括两个部分。其一和传感器、驱动器和控制系统的复杂性相关;其二涉及把一项任务分配到形态、材料、控制和系统环境交互中的可能性。让我们来看一个例子。
尽管许多嵌入式系统的应用非常可行而且实用,如智能食品(给食品捆绑用来记录其温度变化过程和“冲击过程”的仪器),但是设计这些系统的工程师很可能还没有考虑过可以应用于这类问题的生态平衡原理。例如,智能食品没有驱动器,它们的形态也不影响感知能力,但是有可能并不需要这些特性就能完成使命。然而,我们可以想象出很多可以用形态学的思路或观点来增强普适技术能力的情形。试想有一个智能房间,其中在地板、墙壁和天花板上都按一特定方式布置了传感器。如果有人走进这个房间,通过地板上压力传感器动作的模式,我们便可知道他在哪里而不需要更多的计算。注意这是一个形态计算的例子。通过在环境(房间形态的一方面)中安置传感器来降低定位所需的运算负荷。作为对比,可以想象要是用一个监视摄像机来得到这些信息会是什么情况!
进一步想象这些位置信息可以用来控制门的开关和路标的变换。根据人在房间中的位置,相应房间部分的动作随之发生变化,在一定意义上,改变了由地板上压力传感器引起的刺激。尽管生态平衡原理的应用还没有像在机器人或昆虫中导出的光流原理那样普遍,但它确实为将来在普适技术中的应用指出了方向。
并行、松散耦合的过程
并行、松散耦合的过程怎样呢?根据Sakamura的观点,普适计算的一个根本思想就是会有非常多的智能体,多达几百万甚至几十亿而不仅仅是几百个或几千个。这也是许多业内人士认同的观点。如果你想一下可以用于几乎任何地方的射频标志,就会发现这个观点并不是不现实的,射频标志可以用来提示食品营养成分和过敏警示;可以用来标志酒的产地,饮用期限和搭配菜肴;可以用在儿童书籍中播放动画;可以用来标志轮胎的使用历史和要求的适合胎压等。最重要的是射频标志不需要有自己的电源。它利用射频标志阅读设备所发射出的无线电波来获得能量并发送回阅读设备所要求的信息。为了实现这个机制,射频标志芯片必须要装配天线。
射频标志可以做得非常小,Sakamura和他东京大学的合作者Noboru Koshizuka教授开发出了0.4×0.4mm2大小的射频标志芯片。如果你把50~100个这样的芯片放人一个小瓶中,看上去他们就像尘埃――有计算能力的尘埃。从多样性和顺应性的角度来看,射频标志是很有趣的。它们非常聪明地利用生态环境把电源转加到外部
世界,就像寄生物利用宿主来获取能量或实现移动一样。和条形码不同,射频标志可以被阅读设备更新。这样,从某种意义上来讲,它们具有一点行为多样性,到了下次,它们对阅读设备又会有不同的反应。
这些技术使庞大的并行处理成为可能,即使如此,很显然每个独立智能体之间(如射频标志之间)不可能是紧密耦合的,因为还没有哪种架构能够承受同步所有个体所需的额外通信负担。而且一旦我们拥有那么多的智能体,即使它们每个需要的能量很少,它们所需能量的总量也会成问题。它们利用和环境的交互以达到协调的程度很小(但也利用交互,例如,供应能量)。因此,没有道理把整个网络看成是一个单一个体,如一个动物、一个人或一个机器人,因为后者是通过具身性组成的一个物理有机整体。在普适计算网络中,耦合是相对松散的。例如,在射频标志的这个例子中,耦合是通过阅读设备和它们被应用(嵌入)的社会组织系统实现的。类似的结论也适用于移动电话、个人电子助理、温度测量模块、气流控制系统或其他的智能物体。如果像许多人喜欢思考和因特网类似的大脑智能一样来思考这类在大规模分布并行系统中可能出现的智能,那将很有趣。这两者的主要区别是构成因特网的每个独立个体都有很强的处理器,同时它们没有用于真实世界的传感器或驱动器。而且和潜在的普适计算网络相比,因特网的规模还是很小。十年后,Sakamura式的普适网络规模将会令人难以置信。当然,嵌入式设备可能会集成在因特网中,那样这两种系统将会相互支持强化。如果直觉告诉我们那样的普适网络有一定的智能,我们可能考虑在将来扩充设计原理来反映这些特征。