身体的智能:6.7基因调控网络及发育可塑性
设计者的偏好性源于预先规定的被进化对象的某种结构――具有长、宽、高的固体块,那么我们如何才能减少这种偏好性呢?我们可以再次从自然界获得灵感。
自然界中存在5×10-1.5×107种不同生物,它们存在着让人惊奇的形态差异。之所以具有如此多样性,一方面是因为和生物体相比,细胞非常微小,另一方面,细胞类型多种多样。构成生物体的实体(细胞)越小,其所受限制越少,只要有足够多的细胞,就可以构成几乎任何形状。但是仅有细胞数量是不够的,必须有不同的细胞类型。在人体内部有许多功能结构,每个器官(如肝、肾、眼睛、鼻子、大脑等)由许多不同类型组织构成,相应的每个组织又是由许多不同类型细胞构成。
众所周知,器官是由单细胞发育而来的一―由受精卵发育成一个成熟的器官。
这是由自然界系统中的一系列细胞分裂过程(导致了细胞数量的增加和细胞分化)实现的,进而导致不同类型细胞数量的增加,两者都在生物体内由基因调控网络控制。术语基因调控网络强调基因在隔绝时不起任何作用,但它们之间通过化学信息相互作用引导生长过程。在神经网络中,神经元是通过直接联系,如突触,来影响彼此的行为,与神经网络不同,在基因调控网络中联系是间接地通过由基因合成的蛋白质连接,这些蛋白质可以影响其他基因的活动。
这些观念给医学博士兼理论物理学家Peter Eggenberger Hotz带来了灵感,他是苏黎世人工智能实验室的一个很有创造力的思想家,他将他所掌握的生物细胞学知识和医学训练与正统的数学建模技术结合起来。他的“早期”想法之一是借助模仿基因调控网络功能在仿真环境中培育人工生物。他表明了由他的模型几乎可以生长得到任意形状(Eggenberger,1997,1999)。在吸收了Eggenberger思想精髓的基础上,Josh Bongard(作者之一)使用了相似的机制,对其进行了扩展并应用于虚拟创造物的生长。Bongard的智能体不仅仅具有形状,它们还可以移动并与周围的虚拟环境进行交互。Eggenberger-Bongard的方法和Sims的方法有相似之处,它们都由基本模块(building block)组成,并且都是在物理拟实仿真中测试表现型,但在人工进化系统的设计和生物体生长的方式方面具有本质区别。
其基本思想如下(有关细节请见Bongard和Pfeifer 于2001年,或者Bongard于2002年及2003年有关著作)。假定我们为某一特定任务而培育智能体,如推动一个大木块(所以昵称为“推块者”),基本思想总是一样的。算法每运行一轮,在其环境中执行木块推行任务的虚拟创造物种群都会进化得更好。智能体的适应度由
如下因素决定。首先,虚拟的受精卵――一个带有基因组的球状体,被注射入了少量虚拟化学成分。化学成分与基因组中的某些基因发生反应,使它们打开或者关闭。
当基因打开时,它们能产生不同的化学成分使其他基因打开或者关闭。但是,其中一些化学成分不仅影响其他基因,而且影响智能体的生长――化学成分可能导致初始球状体生长并分裂,或者改变连接两个球体的关节,或者导致在球体内部生长出神经元或者突触等。基本上,基因调控网络指导着智能体的发育,使其在虚拟环境中进行活动。重要的是,与Sims方法不同,该方法使环境可以影响智能体的生长。
当智能体生长并活动了一段时间后,就记录下它的适应度,例如,木块推行距离。
其后的选择、变异及交叉基本上与我们前面介绍的一样,图6.3(a)描述了一个典型进化推块者。
在Sims的研究中,基因型(其中存储了智能体的信息)和表现型(智能体本身)之间的联系要更直接。在Sims的基因组中,智能体的结构信息,如身体各部分的数量及大小,是明确描述的。但是在Bongard的推块者中,情形有所不同。基因只是影响智能体的生长,而其最终形式是从过程中涌现出来的。这与生物发育过程很大程度上是一致的,基因指导着细胞内部的动态过程,相应的影响生物体的生长。另一个生物相似性在于所有推块者的“细胞”包含了同样一份基因组,事实上,构成推块者躯体的球状体是对生物体细胞的简化模拟。
如前所述,如果按照此种方式仿真,环境将影响生物体的生长。在生物系统中,这种影响是众所周知的。例如,如果没有光照,视觉系统不会发育,骨头在零重力下不会生长。相似地,如果把推块者放到没有重力的仿真环境里,其进化也是不同的。这告诉我们,在生物体的发育过程中,重力始终发挥着作用。为了考虑环境的影响,Bongard扩展了他的模型,每当智能体触摸某物,或者其某一关节旋转时,就在身体的接触点或者旋转关节处,开始释放某种模拟的化学成分。这种化学成分如同系统内部其他基因产物一样,可以影响基因的活性。基因是否能进化并对这种化学成分作出反应,是自然涌现出来的,取决于人工进化的结果。在Bongard大多数实验里,他发现经过一段时间进化,个体逐渐对环境信号变得敏感。这说明,人工进化确实能利用环境,抓住环境给予的机会。
2000年夏天,Bongard正在苏黎世实验室工作。一个晴朗的下午,他打算和几位朋友小酌几杯。他刚刚实现了自己设计的系统,有些疲倦,在离开实验室前,启动了几个仿真程序,想看看会发生什么情况。苏黎世的下午美丽迷人,转眼到了晚上,由于某种原因,他们当天没有回到实验室。当Bongard第二天早上回来时,大吃一惊:在仿真环境里,有着奇怪身躯的创造物已可以推动和抓取物体;人工进化成功了!我(Rolf)记得他在办公室里一遍又一遍叫我过去看:我觉得这让人难以置信,并建议去叫我们隔壁部门的同事,进化生物学家Ernst Hafen和他的同事Michael Levine(当时正从加州大学伯克利分校来此访问)过来看。他们两个人都是果
(a)
()5.传感器,M:马达
ayHm f的-4-m
1A个自个
回
4M-00+网
A/s
M
M
a个由+a-fm
0Q00000
()1=0
Q000ooo
=1
000000
1=2
00Q000o
1=3
1=4
1=5
1=6
机器人运动
1=7
地面
图6.3移动的涌现:推块者
(a)真实的推块者;(b)推块者的尺缆式运动。一个细胞中的传感器,用S表示,连接到邻近细胞中的驱动器,用M表示。只要传感器S接触到地面,它就会激励驱动器M,从而来抬起包含S的细胞。
这种反射在整个躯体里传播开来,形成了移动行为;(c)这种运动模式使人联想到尺鼓的移动方式:
波沿着尺蟆的身体传播以使它向前运动
蝇培育及有关基因引导生物体发育方面的世界级专家,我们给他们看了仿真结果,对于能发生这种事情,给他们留下了深刻的印象。至此,Bongard利用他的发育系统,表明了可将基因调控网络用于人工创造物的进化。从那以后,Bongard在他的系统中做了不同种类的实验,但在所有情况下,和环境之间的交互都以某种方式塑造着智能体的发育,潜力是巨大的。或许正如Husbands 和Harvey所说:“设计已
经过时,进化的时代来临了。”
尽管它们的基本形式很简单――比生物进化或发育要简单得多,但由Bongard实现的机制已经制造了一大群有趣的智能体,得到了一些令人激动的结果。以下是一些观察结果:
1.在进化过程早期,生物体总是要比它们的后代小一些,进化“发现”为了推动一个大的木块,需要一个庞大的身躯以产生足够的推力。换句话说,进化必须为任务制造一个合适的形态。小的生物体将不适合工作,会在和更大形态的兄弟姐妹的竞争中失利。
2.进化不仅能使智能体推动物体,还能使它们行走。小型创造物倾向于包含简单的神经元,这些神经元和身体一起,产生了使它们整个身体运动的局部反射。事实上,它们显示了一个廉价设计的例子,没有中央神经元控制;个体“细胞”之间通过环境与其邻近细胞进行局部通信。这让我们想起了昆虫的行走行为,如第4章所述,通过与环境的交互,实现了多腿协调。有关这种进化机制的更多详细内容,请见图6.3。这种分布式控制结构导致了一种尺蟆式的移动模式,这种移动模式与神经一身体混合系统的吸引子状态是一致的,智能体的身体和大脑与环境交互,不断进化,随着时间的推移,形成一种稳定的模式,产生一些有用的行为(在此种情况下,是指移动行为)。这也是形态计算的例子,揭示了移动的形成是如何利用与环境的交互的。所以,人工进化实际上是“发现”了一种廉价的设计方法,它增强了这种设计原理的有效性,并且表明,对系统一环境间交互的利用不仅对生物进化,而且对人工进化也是很自然的。当然,这显然也是一个并行、松耦合过程原理的例3..随后,这些移动智能体产生了体形较大,但移动较少的后代,它们擅长从其所处的位置用它们长长的肢体推动木块,因此具有更高的适应度。但是,它们拥有和它们祖先类似的身体部件一―后代肢体包含的神经结构非常类似于它们的祖先。这是一个生物学上称为铺陈(exapation)的例子,即通过开发现有结构来获得某种新功能。在此情况下,生物的长肢体是已有的结构,其原有功能是移动(由进化决定的),新的功能是推动(也是由进化决定的)。因为这些智能体是由人工进化和个体发育共同创造的,在某种意义上,它们为这种任务环境,也就是为了能推动大木块达成了生态平衡。诚然,这并非高度复杂、很难实现的生态位,但在智能体上也不存在多余的脑质和完全无用的部件。另外,所有的智能体都能利用重力和摩擦力产生对木块的推力。
4.基因组的大小或者基因的数量,与成熟个体的大小及复杂度之间没有直接联系。例如,在某次程序运行时,一个非常小的需要依靠移动来推动木块的智能体会被一个只需凭借其更长肢体就可轻易推动木块的大型后代所取代。我们或许认为需要更多的基因来培育这种更大、更复杂的智能体,但是让我们大为惊讶的是,两
种情况下所需要的基因数量大体相同。一个同样让人惊讶的事实来自人类基因组工程(为了破解人类基因组之迷,全世界所做的努力),该工程在2003年宜布,基因数量实际上要比预计的少得多。当时的最权威估计是约100000个基因,但是目前最新的估计是人类基因组中有20000-25000个基因。现在看来,一个生物体的复杂度源于基因之间的相互作用,而不仅仅是它们的数量。因为发育由基因调控网络引导,而基因调控网络具有非常复杂和多样的行为,并且它的行为取决于基因间相互作用,所以即使是相对少量的基因也能产生巨大的复杂度。另外,因为这种动力学关系,在某个基因与智能体的某一部件之间不存在一对一对应的关系。
例如,红鳍东方(fugu rubripes)和人类基因数量相同,但是其复杂度低得多。
显然河豚没有我们灵活,因为是我们吃河豚而不是反过来《红鳍东方豚是一种日本美食,称为河豚,如果没有正确的烹饪,其毒素使人立即死亡,是等量氰化物威力的100倍)。另一个例子是小杆线虫,其基因数量也和人类大约相同,但是我们有大约1000亿个神经元,可怜的小杆线虫只有大约302个。最近的研究发现差异巨大的生物体有着类似的基因集合,但是不同物种间其基因的相互作用极不相同,于是,生物学家开始不仅关注单个基因,也关注基因网络。换句话说,目前的大量研究是为了找出哪些基因会调节其他哪些基因,而不仅仅是解释某个基因如何影响生物体的生长。
让我们重新考虑人类大脑,它有着1000亿个神经元,是宇宙中最复杂的结构。
神经系统科学家、诺贝尔奖获得者Gerald Edelman曾指出一个令人惊讶的事实,人类基因组远不足以编码如此复杂结构的大脑。换句话说,基因组的信息容量远不够编码所有神经元及其相互连接。那么大脑最初究竟是如何进化的呢?答案是,被编码的与其说是大脑结构,还不如说是其发育过程,这个过程可由基因调控网络建模(Edelman,1987)。
5.正如我们已经提到过的,一些推块者展现了功能特化现象,也就是它们的
“细胞”分化成不同的类型,但其包含相同种类的结构(如只有传感器;只有传感器和驱动器;传感器,神经元和驱动器都有;或者完全没有(相同的例子可参见图6.3)。一个推块者包含2-8个不同类型的“细胞”是非常典型的。与人类数以千计的细胞类型相比,8个细胞类型是无足轻重的,然而推块者却第一次显示了细胞分化过程。
6.有些推块者是按递阶结构组织的,就像人类有两只手,每只手都有类似的5个手指,一些推块者也有几个相似的“肢体”,如只有传感器的细胞,在它们的端部附着一个带传感器和驱动器的细胞等。在人手和推块者中,重复的结构并不完全一致,各手指互不相同,推块者的肢体也很少包含相同模式的“细胞”。下一步,当然是思考这是如何发生的。就推块者而言,至少看起来像是少数基因调控着大量其他基因。当这些基因被打开时,它们引起了巨大的变化,产生了如肢体一样的大
型结构。所以无论在身体何处,当这些“主调控基因”(master regulatory genes)被打开时,类似的肢体就开始生长。主调控基因或所谓同源异型基因(Hox基因)于1994年在生物组织中第一次被发现(Krumlauf,1994)。它们如何运作和进化,已逐渐成为热门研究课题,其预示着这种人工进化方法或许将来能帮助我们理解生物基因网络是如何进化的。
7.最后,值得注意的是不仅推块者身体的生长受环境影响,而且它们的大脑也同样受影响。这也是我们在生物体中可以见到的,正i几年前由 von Melchner等人(2000年)做的一系列激动人心的实验所描述的。实验显示如果一个白融(一种小型毛皮动物)的眼睛视觉神经被接到其听觉皮层,听觉皮层会逐渐发育出一般在视觉系统中才能发现的表征。von Melchner和他的同事由此得出结论,来自环境的视觉刺激改变了接收视觉输入的听觉皮层的生长方式。这不仅说明了神经系统极具可塑性,还说明它的发育受其与环境交互的影响。这个观点之所以重要,是因为它表明我们或许可以研究学习的进化。推块者的“大脑”随环境信号而改变的事实,允许我们以观察者的角度断言推块者在学习。