我的研究心得

身体的智能:2.2古典方法的难题




身体的智能:2.2古典方法的难题


不过,由于人工智能原本的意图是不仅要制定聪明的算法,而且要理解智能的自然形式,这就需要与现实世界直接交互。现在普遍认为,古典方法并没有加深我们对许多智能化进程的理解。例如,我们如何弄懂日常生活场景或者在人群中认出一张脸来?我们如何操作物体,尤其是柔软的物体和材料,如衣服、绳子和纸张?我们如何行走、奔跑、骑自行车、跳舞?什么是常识,我们为什么能够理解并表达日常自然语言?不用说,要回答这些问题需要我们考虑的不只是大脑,还有智能体的身体和大脑是如何与真实世界相互作用的。


例如,古典方法的计算机视觉(这是人工感知的一种形式)已经在工厂环境中得到成功的应用,但是必须要求照明条件是常数,场景的几何结构精确已知(即照相机始终走在同一个地方,物体总是出现在传送带的同一位置,对象的种类是已知的,这样才可以建立模型),并始终存在着充足的能源供应。如果这些条件不满足时,这种的系统将以失败收场,而在真实世界中,稳定的和良性的条件是不能够保证的:


运动物体到眼睛的距离总是不断变化;照明条件和朝向总是在变;对象往往是完全或部分被遮挡的;物体本身在运动,而且他们总是出现在不同的和不断变化的背景之中。与人类视觉能力接近,能够迅速处理此类条件的视觉系统,似乎是一个非常遥远的目标。


动物及人类,包括像昆虫一样的简单动物,都非常善于操作物体。如蚂蚁搬运树叶等大型、笨重的物体的强大能力是众所周知的,它们通过和其他蚂蚁的合作来完成这些壮举。再看一只狗控制它的爪子、嘴和舌头啃咬骨头,你会觉得难以置信!


虽然有专门的机器可以在完成特定操作任务方面超越人类,如拧螺丝钉,在生产线上拿起物体并进行包装,在建筑工地举起重物,或在微创外科手术中作出非常精确的动作,但是,自然系统所具有的通用操作能力仍是无可比拟的。


运动是另一个例子。动物和人类能够以惊人的灵活性和优雅的方式运动。昆虫飞行的复杂模式和高精度简直令人难以置信的,尤其当我们知道他们的大脑是那么的小,比人类大脑小100万倍。观看高速奔跑的猎豹是一种审美的愉悦。猴子以不


可思议的攀爬、摇摆、跳跃和奔跑能力穿越雨林。人类可以一手提着袋子,一个手臂挽着朋友,环顾左右边抽烟边上下楼梯,他们也可以以任意一种愚蠢的方式走路,就像John Cleese在著名的Monty Python 短剧“The Ministry of Silly Walks”中描绘的那样,这些动作的敏捷性没有任何机器人所能企及。目前,开发奔跑机器人仍然被视为机器人学的一大挑战。


尽管从20世纪60年代古典人工智能出现之初至今,在机器人方面已经做了大量工作,但这些机器人的定位能力、速度以及操作物体的能力还是很一般。从古典的视角来看,一个重要原因就是对身处何处的判断力是基于详细的内部模型或外部世界的表述的,这意味着这些表述要么已被编程人机器人(在工业机器人中也正是这样做的),要么机器人必须在与外界交互时学习它们。为了与真实世界保持一致,这些表述必须不断地更新,模型越是复杂,就需要做越多的努力来获得有关数据以维持这些模型。以一个城市的地图作为一个真实世界中某一部分模型的例子,地图内容越详细,也就越难让它随时与实际情况保持一致。如果建设用地、临时路障或当前的交通密度都考虑在内,整个地图就必须不断地更新。如果地图是为汽车司机定做的,有关交通密度及交通改道措施的信息对于汽车导航系统是非常有用的,但是为了保持更新需要相当多的资源。如果作其他用途,如在一个地理课上使用,一个简单的地图就绰绰有余了,而且只需要很少的更新。


已经引起了很多关注的一个问题是关于常识的,因为这是掌握我们日常生活的根本,也是理解自然语言的关键。在古典的方式中,常识被视为命题,常识性知识的构件被认为是陈述命题,如车不能怀孕物体(通常)不飞翔


人有生理需求(他们会饥饿和口渴)病毒引起感染疾病应该避免


如果玻璃杯失手掉落在地上,它通常会破碎等。建立能够把这些常识融为一体的系统曾经是很多经典自然语言和问题解决系统如CYC等的目标(见GuhaLenat1990年,提出的一份关于这个项目的第一个五年计划的报告)。英文缩写CYC代表百科全书(encyclopedia),它表明了这个项目的研究人员的追求,即这是一种百科全书式、命题式的知识。斯坦福大学的计算机科学家和人工智能先驱Doug Lenat1984年启动了这项有争议的项目,1991年他预测说,到20世纪90年代中期,他的软件能通过直接阅读文本,而不是编程,获得新的知识(Wood2002年),这是很多没有实现的关于人工智能的预言中的一个。令人惊讶的是,一些研究人员仍然认为,大量的命题集合(一组以逻辑为基础的陈述)和一套推理的规则,本质上就足以表述常识性知识了。2004年,美国军方的研究机构―DARPA(国防部高级研究计划局:the defense advanced research project agency)授予两名美国研究人员400000美元的研究合同,试图制造出一台只要通过阅读文本就可以学习的机器。而CYC项目以及随后的所有有着相似目的项目的问题之一曾是(现在仍是)普通常识是不可能由一套规则来获得的,而是需要通过与现实世界的交互来获取。


举例来说,我们都有一个直观的关于饮用这个词的理解。如果你现在想象饮水的感觉,呈现在脑中的也许是口渴、液体、啤酒或炎热的阳光,当你喝水时感觉液体在润湿你的嘴、嘴唇、舌头,然后流进你的咽喉,到达胃里,如果你真的非常渴,喝完水会感到非常爽快,或者是想起炎热的夏天,海边的酒吧供应的冷饮,或者是葡萄酒洒在你的新西装上,那些污点给你造成的沮丧,或者是雨天水浇在你的裤子上那种湿润的感觉等,正是这样的常识形成了日常语言交流的基础,它牢牢根植于我们自己身体以及我们与现实世界交互体验中。据我们所知,目前还没有人工系统能够以这种灵活和适应性方式处理知识,因为这并不是命题,所以很难从符号体系来正式表达。


语音系统是古典人工智能的另一种分支。不同于如数学或电脑程序等形式语言,自然语言是智能生物所具有最突出的能力之一,而人工智能谋求理解和建立自然语言系统也有着悠久的历史。最初,努力的方向是处理书面语言,后来,语音系统引起了很多研究人员的兴趣,但是对于这种系统发展速度的过高期望和错误预测也开始泛滥。但结果却让人失望,人工智能领域的声誉也因此受到损害。虽然在某些限定的应用中,语音系统是有用的,特别在只需单词命令的某些移动电话应用中,但是在嘈杂的环境中可以鲁棒处理完整句子以及连续的语音流的系统还没有在市场上出现。


语音文本转换系统也被称为语音打字机,这种系统必须把语音调整成发言者的声音,由软件生成的文本也需要很多的后处理步骤,比如,通常文本包含了很多错误,必须加以纠正。尽管想法诱人――从此不用再打字,只要对着麦克风讲话就可以生成文本,但上述问题仍是语音系统没能真正起飞的原因之一。虽然有些系统的功能,已经达到了一定程度,并且相当有用,但是仍然没有哪个通用自然语言系统的性能能够稍微与人的日常对话相接近(有意思的是,最近几年做语音系统的几个大型公司纷纷破产,最有名的例子是L&H,比利时LernoutHouspie的语音产品,是语音文本转换系统领域的三大销售商之一,另外两个是Dragon系统和IBM。破产正式的理由是非法金融交易和虚假销售数字,但我们推测,虽然有一定的金融和法律问题,目前尚未成熟的基本语音技术很可能是最重要的因素)。


可以从另一个角度来看古典人工智能的成功和失败,它已经成功地完成一些人类通常觉得很难的任务,如下棋、运用逻辑规则、证明数学定理或解决抽象的问题,而我们认为自然而且不费力的事情,如视觉、听觉、说话、骑自行车、散步、从玻璃瓶里喝酒、用乐高玩具(Lego kit)拼装一辆汽车、交谈、穿衣服、化妆或刷牙等所有需要常识的技能,对它们来说已被证明是极其困难的。人工智能在实现这些技能方面的成就,至少可以说,是非常有限的;演算方法在帮助我们理解智能方面并没有起到太大的作用(Pfeifer Scheier1999)。







 





ETC注销ETC充值ETC客服ETC扣费查询


ETC发行合作