我的研究心得

(一)    三、机器人的智能




(一)    三、机器人的智能


a)        
机器人:


b)        
1.a.一种看上去像人的机器,能完成人的各种复杂行为(如走路和说话);以及一种类似的模拟机器,其缺乏人类感情的特点经常得到强调。


c)        
b.一种办事效率高、但感觉迟钝的人,总是自动、


d)        
机械地工作。


(二)   一种自动从事复杂但重复性的工作的机械装置。3.一种得到自动控制的机械装置。(《韦伯斯特大学词典》)


a)        
创造人工生命是古希腊人的梦想。他们研究了精巧复杂的类似动物和人的自动机械装置以及自动剧院,后者由重物落人沙子或谷物而产生能量并用线牵引产生活动,还有其他各种装有轮子的系统,其复杂程度令人吃惊。18世纪随着钟表行业的兴起,在欧洲生产了十分精致的自动机械装置。不仅绘画和雕像具有使人迷恋的魅力,移动雕像也引起广泛的注目――它们的功能涉及从展示奇迹到探索生命奥秘的广大范围。20世纪50年代,W・格雷


b)        
瓦特发明的简单的电子机械乌龟表明,一个简单的相互作用的机械系统可以在行为上表现得如有生命一般。


c)        
1917年,捷克作家卡雷尔卡佩克写的名叫《奥佩利》的短篇小说中首次出现了机器人这个词。1921年在布拉格、1922年在纽约上演了卡佩克的剧作《R・V・R》(《罗萨姆的宇宙机器人》),从


d)        
而使机器人一词广为流传。机器人这个词来自捷克词“Robo-


e)        
ta”,意思是义务劳动。座落在一个假想岛上的R・V・R工厂生产人造的人,他们具有金属的骨骼和外部结构,内部器官则由混合于大桶中的各种配料制成,旋转的轮子则为它们造出长达几英里的


f)         
神经纤维血管


g)        
下面是两种虚拟的机器人:利用人类改制出的机器人,如玛丽


h)        
雪莱的《弗兰肯斯坦》中的科学怪人,以及以人为模型的、由不同材料制成的机器人,它们一般有金属的头脑,但没有心脏,伊萨克


i)          
阿西莫夫的机器人就属于这一类。库蒂说:我由坚固的金属构成,有持续的意识,能轻易地忍受各种极端的环境。在这儿,令我们感兴趣的正是拥有人造大脑智能的自动机器人。


j)          
我们感兴趣的是能够看、听、通过触摸进行探索并有机智的表现行为的机器。它们若由非生物材料构成就更合人意了,它们可能不具备人的所有能力,不具备思考和感情反应的能力,但它们与人类大致相似。面且更有趣的是,它们应当在某些方面比人更高级。它们的某些感觉要超过人类,它们可以看见人类眼睛接受不到的、可见光谱之外的光线,并能感受磁场,虽然人类假定它们不具备心电感应的能力。


k)        
不列颠群岛的人工智能(Al)的先锋唐纳德米奇于1967年在美国首先成立了人工智能部。他预测在20世纪末将出现机器人公司、机器人将能做家务琐事,并进行睿智的谈话。不过在公元2000年的现在,这个目标比当初看上去显得还要遥远。不过,普遍应用于工业中和太空探索中的机器人非常高效,很大地满足了人们的期望。令人失望的是至今它们仍无法自行思维。


l)          
人工智能研究的一个有用的消极发现,是发现这种智能不甚成功。这个发现表明,针对不同的情形进行适当的观察和做出适当的反应太困难了――由此可见大脑在解决每日的异常困难的问题时是多么聪明。机器人欠缺大量常识性知识,这些知识我


m)      
们非常熟悉,又十分明显,以至于我们没有认识到它们对感觉和行为的重要性。对我们来说,茶杯当然应该放在碟子上,我们无须将这一事实告诉孩子,但必须向一台设定了程序的计算机清晰地提供这样的常识信息,否则它就没法执行命令,从人的观点来看这显得荒诞可笑。最令人吃惊的是发现物体是如此之难。看东西总是不费力的,似乎是件简单的事,因为它的过程是无意识的。人工智能研究表明,这个观点大错特错。这个发现非常重要,它帮助我们认识到大脑的精妙之处,并意识到它必须解决的问题之困难。


n)        
工业机器人在干组装汽车之类的活时是十分重要的。它们在


o)        
哲学意义上并不是十分有趣的,因为它们只是由计算机控制的东西,仅具备基本感觉,不能自己发挥想像。由于自动设备有商业价值,因此这些机器人将来可能会被发展得更有趣一些。在应用机器人探索太空时更是如此。由于空间距离遥远,通讯和控制会被耽误(月球为2秒,火星为11分钟),对于机器人空间探索来说,自动智能就显得格外重要。有趣的人工智能肯定会由于这些需要得以进一步演化发展,虽然这意味着我们的后代对它们的控制将会减弱。


p)        
令人注目的一个事实是,今天的机器人和生命有机体差别太大了。如果我们掌握的技能能够制造出与人相似的机器人,它们与人类仍会有差异。人类可以不断繁衍,通过无需技能的分娩这一良好方法就可以轻易地延续下去。这种不同点的存在对人类将很有益(正如起子无法与人类的手指的用途相比一样)。不过,如果机器人被设计用来代替人类,那么它们将与人类的大小和身形相同。


q)        
科技上的电子计算机的发展不同于生物大脑的进化。非常简单的低级动物的视力比最复杂的电脑视力还要强大。然而一台结构简单、只需100美元的电脑下象棋可以胜过我们中的许多人。计算机擅长于我们觉得困难的事情,而我们擅长于它们觉得困难、


r)         
甚至不可能办到的事。计算机具有无人能胜的速度和精确性,然而它们却没法看见物体或看清事物的本质。


s)        
更达观地看,计算机存在于一个智能起着举足轻重的作用的区域。虽然它们的硬件主要属于物理学科的研究领域(量子效应对集成电路板十分重要,尽管这看来似乎有点不可息议),但它们的工作原理或算法并不十分物理化。若没有物理系统的符号处理,数字计算机就失去了力量(不过这儿有个容易弄错的道理:对我们来说只是符号的东西,对机器来说却是直接的因果步骤。机器并不能读懂符号的含义。)。


t)         
区别两类差异十分大的计算机,即模拟计算机和数字计算机,是很重要的。它们对大脑的运行方式给出了两种不同的启示,从而提出了未来智能机器人的不同构想。


u)        
数字计算机以物理手段运作,完成逻辑任务,原则上它能执行任何用符号表示的逻辑或数学运算。实际上,尽管有着令人难以置信的高速运算速度,但它们可能还是太慢了。20世纪30年代亚兰图灵和阿伦兹邱奇分别独立地证明出,他们和约翰诺伊曼一起发明的数学计算机原则上可进行任何逻辑和数学运算。但实际存在的在速度之类方面的局限正是与人工智能关系重大的问题。这表明,数字计算不是可行之路,替代的方法是模拟处理。


v)        
模拟系统既经济又令人振奋,又快又简单,虽然它不是绝对精确的。它们特别适用于特殊的、对速度有要求但无须很高的精确度的运算任务。它们还可以在没有编定程序的情况下运行,因为模拟计算机可以在不经过具体运算步骤的情况下提供答案,它们可以避免计算。所以,严格地说,把它们称为计算机是用词不当的,它们其实是模拟信息处理器。也许我们可以称之为变换器,这衍生自字典对这个词的定义:变化,将贱金属变为金。在模拟变换器中,人们熟悉的例子有计算尺和标绘图。带有凸轮的机械装置或诸如漏电的电容器和非线性的放大器构成的闭合电路能


w)      
进行积分和微分以及其他简单的、不需运算的操作。


x)        
20世纪4050年代,人们普遍认为大脑是模拟的。随后,数字计算机不断增加的功率和灵活性说服了人们,令他们相信大脑是数字化的一一尽管说神经细胞的状态改变速度是十分缓慢的。同样,认为人脑甚至于在拿起一杯咖啡时也要进行复杂运算(尽管只是对简单的长除法进行运算),也是令人难以置信的。现在很明显了(如果有明显的事的话),大脑神经细胞不适宜进行数字处理。它们比晶体管慢百万倍,也不及晶体管可靠。但大脑中的神经细胞远多于哪怕是最大的数字计算机中的晶体管的数目。


y)        
人脑中有100亿种神经细胞,每个都与其他脑细胞有上千种联系,这大大超过当今的计算机,虽然当今的计算机随着集成电路块技术的提高,在几年内就有可能有所改变。


z)        
计算机能拥有人类一样的智能吗?它们会变得聪明而富于创造甚至有意识吗?亚兰图灵,人工智能的先锋和第二次世界大战中的密码破译者,在1950年提出了一个将人和计算机进行比较的方法。这个著名的图灵测试法是给一台计算机和一个人(藏在屏幕后面)相同的问题,请一个观察者(他必须能读懂来自两者的结果)来决定哪个是人,哪个是计算机。不同之处太明显了:计算机太擅长算术了,面我们则太擅长结构辨识了。图灵测试是对人、机的不同性能进行比较,它并没有比较各自的经历,也没有涉及任何有关意识的问题。而我们确实无从知道意识到底有什么作用。图灵测试过于侧重单一方面。同等级比较也许会更有用。有人认为将计算机和动物智力作比较是有启发意义的。有证明说,鸽子十分善于概括学习和在不同场景图片中挑选特征。


aa)    
图灵测试是一个思想的实验,但它可以被付诸实行,而且在人一机象棋锦标赛中确实已以一种有限的形式被进行了。结果证明,人和计算机在最高层次上是平等的,虽然他们采用的方法大相径庭。让一台计算机下象棋比让它认出棋盘上的棋子要容易。


bb)    
计算机象棋


cc)     
计算机象棋始于1950年。源于克劳德香农测量信息的想法。他采用了一种十分简便的方法来考虑信息,即在若于供选择的对象中进行选择,并用令人吃惊的术语来定义信息。定义的内容越不可能,它所传递的信息也就越多(将此推至极限,我们就可以知道,极端惊奇是不可信的。当真的面对一艘火星宇宙飞船时,我们应该怀疑他人的言辞或我们自己的感觉)。这是将信息或感知内容的不可能性与信息来源的可靠性相对立。事实上,如果人或计算机发出了根本不可能的信息,我们就会认为他们是不可信的或愚蠢的。


dd)    
克劳德香农没能成功地定义意义。一台计算机不需要知道棋子的位置的意义就能下象棋。在一场智力战斗中被一个对意义一无所知的头脑打败是不是有些恐怖?20世纪60年代计算机象棋通过估测位置和对之赋予一个棋数字来进行。就一着棋而言,甲方如果得正数,那么乙方得的负数对甲方面言就是好棋。甲方向最好的棋数字努力――不需要考虑前面下过的棋,也无需考虑下面要走的棋。只要在五步棋之后,就有可能有上亿万步可走。在这上亿万步中搜寻最优的走法,远不是最大,最快的计算机所能为的。大卫斯莱特和拉里阿特金于70年代设计的Chess 4.0这一程序成功地将搜寻限制在几百万种可能之内。随着计算机硬件运转速度的提高,计算机的表现越来越好,到1979年达到专家水平(2000),在1983年达到了大师水平(2200)。随后出现的深思1988年的一次锦标赛上击败了特级大师。为赢得比赛,计算机曾在一秒钟内搜寻了70万个位置,这比人脑快了成百上千倍。目前世界上最好的象棋机器深蓝就是在此基础上发展起来的。它可以在每秒钟内搜寻两亿个象棋位置。它的核心是一个由一百多万晶体管构成的特殊用途的集成电路块,可以在每秒钟内搜寻两亿个以上的位置。在下棋过程中,好几块这样的


ee)    
特殊集成电路块由一台IBMSP2高级计算机控制,这就使并行处理成为可能。然而,这种设备的实际设计是很难的,因为每个并行计算的结果都必须同步发生。这个设备能够对关键行棋步骤进行更加深入的探究。因此,它就像人一样,有时可以考虑到后面20步。


ff)       
人类如何才能与这样的超入速度相匹敌?荷兰心理学家A.


gg)    
德格罗特的心理实验为我们初步揭开了答案。他将对明智的象棋位置的记忆与对无意义的象棋位置的记忆进行了比较,同时将专家的记忆与一般选手的记忆作出比较。对于棋子的无意义位置的记忆,专家和生手没有什么区别;但对于有意义的位置,专家就表现得十分不同,他们显然具有对复杂位置的超人记忆力,只需看上几秒钟就行了。他们的秘密在于对有意义图案的识别力。这些图案成为模块,使观察和思考简单化。


hh)    
有人认为,象棋中局有100个可能位置(即1后面跟上50个零)。入类选手很少能考虑100种以上的可能性。他们的选择不是随意的,面是基于对有利局势的大量知识、推理能力以及对对手的优势和劣势的了解做出的――无论对手是人还是机器。人工智能专家赫布西蒙认为,一名特级大师能同时和50名甚至更多的实力较弱的选手比赛,他只须看一眼棋盘上各子的位置,就能对脑中的象棋百科大全中的5万个索引条目进行选择。这看上去是直觉的行为,但事实上是在对模块图案进行辨认,并回忆适当对策。所以,所需的信息处理是很有限的,因为这工作是多年来的训练。学习和思考的结果(这是巨大的潜势智力与有限的运动智力一起被利用的实例)。正是这个过程对入类而言才是有意义的。但计算机会怎样呢?当它们能将局势与对应模块联系起来构成整体思维时,它们也会看见周围世界中和它们自己的思维中存在的意义吗?


ii)        
计算机细能是否是不可能实现的?


jj)        
美国哲学家约翰瑟尔曾对计算机总有一天会如人一样进行有意义的思考这一预言提出了著名的反对意见。约翰瑟尔的论点是正确的吗?在他的中文之屋试验中,瑟尔考察了在一个完全封闭的屋中,一个不会说汉语的西方人帮助中国人来回传递他们的语言信号的可能性。他认为这个西方人永远也不会发现这些符号的意义――对计算机也一样,它处理着信号却不知其意义,不了解其内容。我们之所以能从计算机中获取意义是因为我们设置了意义,并用我们自己的词汇对这些信号进行解读。按照瑟尔的观点,计算机永远做不到这些。由原生质构成的、通过器官演化而发展成的大脑会识别意义,拥有意识,这是以硅(或不管是什么)为基础组成的高科技成分永远不可能具备的能力。


kk)     
人们首先会想到的是,哲学讨论如何会得出这样的结论?这难道不是一个经验主义的结论吗――在试图制造智能计算机的几百年来努力后得出的结论?有生命的原生质与任何人工大脑有本质区别的看法显然是生机论的主张。正如生机论者所认为的,生命是以特殊物质为基础的,意义和意识是被灌注在特殊物质中的。


ll)        
这种观点在当今的生物界已经过时了,因为在脱氧核糖核酸被发现之后,越来越多的生命的物理过程被发现了。


mm) 一个在中文之屋里被抚养大的孩子将会遇到什么?这孩子可能在没有与英语或其他语言相关的经历的情况下,学习英语或其他语言吗?孩子们通过将符号与情景、物体联系在一起学习语言。我得出的结论是:那间封闭的中文之屋中没有任何事情出现,没有可触摸、可探究的任何东西,也没有将符号与现实联系起来的途径,在这样一个地方,孩子是不可能从符号中抽象出意义来的。这表明一个有感官和手的主动灵活的机器人是有可能发现符号中隐含的含义的。既然孩子们能做到,为什么以计算机为基本构成的主动积极的机器人不行呢?


nn)    
在计算机中辨别出意识是十分困难的,正如辨别动物或别人的意识是十分困难的一样。这是因为我们无法进人别人的大脑、


oo)    
无法了解别人大脑的性质,也是因为我们无从知道意识会做什么。


pp)    
假设在某个复杂阶段,计算机变得有创造力而且能说笑话――我们能说它们有意识了吗?这样的标准软弱无力,只因为我们自己也不知道人类如果这样做,是否就是意识在起作用。我们不知道我们的意识在起什么作用。我们编笑话时,往往是下意识的。


qq)    
由于不甚有趣的技术原因,研制一个完全仿大脑的计算机可能是太困难了。生物大脑的化学原理和网络结构太微妙精巧了,除了正常的繁殖方法之外.它是无法被成功研制出的。但我将冒险猜测,未来100年内生物大脑的大部分结构能够成功地被制成。不过,至今还没有一个人工大脑被设计制造出来的原因何在?


rr)      
回顾过去,展望未来


ss)     
人工视觉方面最全面、最具权威性的计划是大卫马尔(1945-1980年)制订的,此人很可惜地英年早逝了。他的著作《视觉》(1983年)描述了数字化地解决问题的算法。马尔的系统从刺激点的图案开始逐级向上,根据各点或象素的明亮程度在整体图中得到表示。这就是马尔所谓的“2D,它表现了图像的基本布局,经过许多不同的阶段和过程,完成对外界事物的反映。马尔指出,为了决定有效的行为,仅有观察者的观点是不够的。大脑或者智能机器入需要根据各方面观点建立起对事物的描述,以能够对之采取正确的行动。这叫做以物体为中心。马尔的计划引发了不少重要的研究,但尚未构筑出有效的视觉工作系统。


tt)      
特里威诺格莱特在更早的时候采取了十分不同的方法,那就是构筑一个由方块、锥体等物体构成的模拟世界,通过计算机用语言对它进行描述。计算机可以做得十分好,甚至会编造新词。它


uu)    
能编出如下对话(计算机说的话都用黑体字标出):


vv)     
找到一块比你拿的更高的方块,把它放在盒子里。系统必须辩识出一块是什么,同时运用演绎法,找出它拿的那一块方块。


ww)  我认为你说的是指比我拿的方块更高的一块。


xx)     
有可能是指两个对象:一个是在句子中指代的,另一个是你正拿着的方块。这一程序对在两者中作出选择有启发式作用。


yy)     
好的。


zz)     
它变得越来越聪明,显示出年幼孩子的聪明程度。它引入知识,由知识作出推断,猜测并试验各种可能性。似乎很清楚(至少对我来说),大量的自上而下的知识是大脑和有视觉的机器人所必须的。我们的对事物的常识是很难被描绘清楚并输入计算机的。未来的人工智能计算机将如同孩子一般自己学习――可能要用到神经网络。


aaa)  神经网络――PDP


bbb)  数字计算机只要被编制程序,就能按步骤进行逻辑操作,但这似乎不是大脑的运作方法。加拿大心理学家唐纳德赫布于1949年在他的《行为的组织》中提出了一个不同的方案,它在随后的半个世纪中发展得并不顺利,但现在看起来似乎是一个正确的方案。赫布描述了一些简单的线路,它们不编程序、不进行逻辑步骤操作就能学会联想。许多这样的线路一起操作,就成为现在所谓的自行适应神经网络。约翰・Z・霍普菲尔德以及其他许多人最近重新研究了这些网络,因此,更复杂的神经网络将有可能出现,从而导致有效的学习机器。


ccc)   神经细胞是电一化学的,通过化学浓度控制阀值变化。连接处,即神经元突触处,会因重复使用而改变传输方式。因此,神经细胞的网络可以构成传导模式,从而通过内部的思维状态反映外部世界。首次出现的人工神经网络只有两层,即输人层和输出层。


ddd)  它们的结构辨识能力十分有限,以至于许多年来这一思想几乎被放弃。随后,人们又对它们增加了一层网络,即内部的隐层,使网络能够生成抽象的结构,并可为一般的问题找到解决的办法。


eee)  这使它看上去更像大脑了(图3.1)。网络可以通过非常有限的可视部分,辨识出学习后的结构。如大脑一样,即使网络的大部分被损坏了,它们仍旧可以继续工作。即使它们的部分速度很慢,但它们整体上可以快速运作。它们不需要程序一它们可以自己编程序。它们的工作方式(它们是高度非线性的和相互联系的)几乎和大脑一样神秘。这对依赖于数学家的分析神经科学家来说是很烦人的――不过他们并不装做对这一切了如指掌。


fff)     
神经网络的关键特征是通过使用改变其传导连接。因此,具有时间和空间的外部结构产生了相应的内部传导结构。如上文所说,第一个带有光一电眼睛的感知器只有两层输人层和输出层,这导致了令人失望的结果,直至加上一个内部隐层。这个隐层如思维一样,是和输入层和输出层相关又分离的。它能够进行抽象概括。一个三层或三层以上的神经网络能学会表现物体和一系列的事件。它能够分类,能够被物体的部分或它学过的结构激活,就像我们辨识半隐半现的物体一样。由于物体一般都是半隐半现于其他物体之后,所以这对生物的和人工的视觉机器十分有用。


ggg)  一个神经网络可以同时体现好几种不同(事实上差异越多越好)的结构,还能学习联系事物和结构,就像学习一门语言的词汇和结构一样。事实上,人工神经网络能够学习语言,就像婴儿一样,刚开始咿哑学语,逐渐建立起单词和事物、抽象概念之间的联系并发现语法规则。在学习过程中,它犯的错误是明显的。在学英语的动


hhh)  词过去式时,它们会和孩子犯一样的错误。这一方面的先驱D・E・


iii)       
梅尔哈特和J・L・麦克克里兰德在对并行分布处理网络的教学过程中发现,利用400个动词(有些规则、有些不规则),在190次试验之后,网络就能对没见过的动词,如keep 变成keptcling变成clang做出正确反应,在学习过程中它会犯孩子气的错误,如将came go的过去时变成comedgoed等,那是因为它过于概括化了。但后来它学会了改正。这看来正是我们在理解大脑和设计智能机器人时要走的路。


jjj)       
输出层


kkk)   隐层


lll)       
3.1三层神经网络


mmm)         
情感和目标


nnn)  对于人或高等动物来说,主体的情感状态和行为目标对他将选择什么来学习和他在感知过程中的注意对象都很重要。机器人不管是否能有情感,它们都能够像我们一样有目标,因此,也能进行有选择性的注意和有倾向性的探索和学习。通过控制它们的目标,我们能按人类的要求驾驭它们的发展。但由于它们的身体和需求与我们不同,我们对于它们的道德方向要制订得十分清晰、


ooo)  谨慎,否则它们会发展得失去了控制――那样的话,什么事都会发生。最好的科技小说作家,特别是伊萨克阿西莫夫和他的《机器人法则》可能已为这勇敢的新世界铺平了道路。


ppp)  我们可能会认为一旦事情出错,我们只需简单地关掉电源就行。但当我们越来越依赖于计算机时,情况就不是这样的了。切断医院、机场、发电厂和工厂里的计算机的电源已是十分危险的了,我们已在很大范围内受制于计算机。我们日常生活中很多工作要依赖于它们的正常运转,一旦它们崩溃,那后果将是灾难性的。一旦机器人学会了按它们掌握的知识和价值观作出决定,人类将生活在它们的世界中,而且可能难以逃脱。







 





ETC注销ETC充值ETC客服ETC扣费查询


ETC发行合作