人工智能:2.1 知识的基本概念
知识反映了客观世界中事物某一方面的属性以及事物之间的相互关系,不同事物或者相同事物间的不同关系形成了不同的知识。这些事物及其属性的反映就是信息,而对信息的处理通常是通过数据来完成的。这里,涉及到 3 个不同层次的概念: 数据、信息和知识。
数据是客观世界中搜集的原始素材,它 是信息的载体和表示,比如,数字“6”就是一个数据。
人们根据一定的目的按一定的形式对数据进行加工与处理,就形成了有关的信息,比如数据“6”可以代表“6
本书”,也可以代表
“6
个人”。可见,信息是数据在特定场合下的具体 含义,或者说信息是数据的语义。数据与信息是紧密相关的,只有将二者结合起来才能实现某一
关联
语义
信 息
知 识
具体事物的描述。 数 据
图 2.1 数据、信息、知识
・10 ・
第 2 章 知识表示
知识是将有关的信息进一步关联在一起,形成了更高层次含义的一种信息结构,信息与关联是构成知识的两个基本要素。图
2.1 反映了数据、信息和知识三者之间的关系。
信息之间有多种关联形式,其中,用得最多的一种是用假定关系表示的关联形式:
如果⋯⋯那么⋯⋯
或
IF
⋯⋯THEN
⋯⋯
例如,在我国北方,人们经过多年的观察发现,每当冬天要来临的时候,就
会看到有一批批的大雁向南方飞去,于是把 “大雁向南飞”与“冬天就要来临了 ”这
两个信息关联在一起,得到如下一条知识
:
如果大雁向南飞,
那么 冬天就要来临了。
在客观世界中,人们通过各种途径和方法可以获得大量知识,如对客观事物或现象等信息进行分析、概括和综合等,所获得的知识为以后解决实际问题
和从事创造活动奠定基础。
由此可见,知识是以高度概括的形式对客观事实及其相互关系的整合,由于
客观事物是相互联系的,因此,知识也必然是相互联系的。正确理解和运用知识之间的这种相互关联,就反映出了人类的智能。智能是比知识更高层次的概念,
它是人类内在的一种获取知识并运用知识的能力,有时称之为智力,即正确地运用信息、知识、经验和悟性,进行判断、计划、处理事务以及创新活动的综合能力。
2.1.1
知识的特性
知识存在着自身的一些特性,主要有如下的几个方面。
1. 相对正确性
任何知识都是在一定的条件及环境下产生的 ,因而只有在符合这种条件及环境下,知识才是正确的
; 脱离开这种环境条件,知识就不一定正确了。如 1+1=2 在十进制的前提下是正确的,如果是二进制,显然就不正确了。因此,在应用知
・11 ・
人工智能技术与方法
识的时候,需注意该知识的适用条件或范围。
2. 不确定性
由于现实世界的复杂性,许多事实和概念都不能绝对精确和肯定,即知识本身具有某些不确定性。这是因为构成知识的信息可能是精确的,也可能是不精确的
。同时,它们之间的关联也可能是确定的或不确定的。因此,许多知识是不能仅仅只用简单的对或错、真或假来划分的,这些知识还存在着一些中间状态,这一特性称
为知识的不确定性。
造成知识不确定性的原因是多方面的 ,如随机特性就是一种 。在随机现象中, 一个事件是否发生不能预先确定,它可能发生也可能不发生。因此,在处理这类 信息时,需要用一个数来衡量事件发生的可能性,而不是二值逻辑数值 0 或 1
。如:“如果头痛且流涕,则有可能患了感冒 ”,其中的有可能反映了一种不确定的因 果关系,可以用数 ? =
0 ~1 的来描述这条知识。
另外,由于人们对客观世界认识的不够全面,致使对它的认识不够准确。这种认识上的不完全、不准确必然导致相应知识的不精确、不确定。事实上,由于现实世界的复杂性,人们很难一
下子掌握完全的信息,因而不完全性就成为引起知识不确定性的一个重要原因。
经验知识也是引起知识不确定性的一个原因。在很多领域中,专家们在长期的实践及研究中积累了一定的经验知识,并能够很好地运用这些知识来处理领域内的有关问题。但是,如果让他们精确地将这些经验知识表述出来则相当困难,
原因在于经验自身就蕴含着许多的不精确性及模糊性,从而造成了知识的不确定。
3. 可表示性
知识不仅可以用适当的形式表示出来,为人们所感知,如语言、文字、图形等,而且能够为人们所认识与理解。正是基于这一特性,它才能被存储并得以传播,才能
获得应用和发展。
4. 关联性
知识是事实、概念及其相互之间的联系,这种联系有两种 : 静态联系和动态联系。静态联系表示事物或概念之间的一种等价关系,比如,一提起 “早上”这个
・12 ・
第 2 章 知识表示
概念就会想起
“太阳东升”,于是可以将这两个概念加以等价替代,即把 “太阳东升” 与“早上”等价起来。静态联系有时是双向联系,有时则是单向联系。除了静态的联系以外,事实和概念之间也会存在一种动态的联系。比如,在某种情况下,提 到“早上”经常能够见到 “小李跑步”锻炼身体,从而建立了一种联系,即“早上”与“小
李跑步”两个概念的一种联系。这种联系显然不是静态的,因为,它是在某个特
定情况下建立起来的,不能够简单应用到其他情况中去,即 “小李跑步”与“早上” 并非存在一种固定联系。
2.1.2
知识的分类
人类的知识是极其丰富和多样的 ,从不同角度 ,可得到不同的知识分类方法, 这里讨论常见的几种。
从知识的作用范围来划分,知识可分为常识性知识和领域性知识。常识性知识是人们普遍知道的知识,适用于所有领域,而领域性知识则是面向某个具体领域的,是专业性的知识,只有相应专业的人员才能掌握并用来求解领域内的有关问题,专家的经验及有关理论就属于领域知识。
从知识的确定性来划分 ,知识可分为确定性知识和不确定性知识。确定性知识是指那些能够用 “真”或“假”、“对”或“错”等来衡量与评判的一些知识 ,它们属于精确性的知识。不确定性知识则是指具有 “不确定”特性的一些知识,它是对不精确、不完全及随机性知识的总称。
从知识的结构及表现形式来划分,知识可分为逻辑性知识和形象性知识。逻辑性知识是反映人类逻辑思维过程的知识,如人类的经验性知识等,一般都具有因果关系及难以精确描述的特点。形象性知识则是通过事物的形象建立起来的知识。如回答“什么是树”这一问题时,用文字描述比较困难,但若指着一棵树说 “这就 是树”,就容易在人们的头脑中建立起 “树”的概念了。
2.1.3
知识的表示方法
知识表示就是指对知识的一种描述或一组约定,是一种计算机可接受的用于描述知识的数据结构。对知识进行表示的过程就是把知识编码成某种数据结构的
・13 ・
人工智能技术与方法
过程,知识表示方法又称为知识表示技术,其表示形式称为知识表示模式。由于目前对人类知识的结构及机制尚未完全了解清楚,关于知识表示的理论及规范也未建立起来,人们尝试着从不同的概念或功能角度来实现知识的表示,提出了一些知识表示的方法,概括起来可分为两大类,即符号表示法和连接机制表示法。符号表示法是
用各种包含具体含义的符号,以各种不同的方式和次序组合起
来表示知识的一类方法。它主要用来表示逻辑性知识。连接机制表示法主要是采用神经网络等技术来表示知识的一种方法。它把各种物理对象以不同的方式及次序连接起来,并在其间互相传递及加工各种包含具体意义的信息,以此来表示相关的概念及知识。相对于符号表示法而言,连接机制表示法是一种隐式的表示知识的方法。
一个好的知识表示系统应该具有能够表达有关领域中所需要的各种知识,并 能够保证这些知识之间的相容;同时能够从已知的旧知识中推导 、产生新的知识, 并通过对知识表示结构的操作而
建立表达新知识所需的新结构 ; 此外,还具有获取新知识的能力,最简单的情况是能够由人工直接输入知识到知识库中; 最后, 还可以融合附加的启发式等知识,使得问题求解的推理向着最有希望的方向上进
行。几种主要的知识表示方法如下。
1. 一阶谓词逻辑表示法
将知识表示为经典逻辑中的谓词形式,于是在推理的过程中知识的处理就比较方便了,但是,这种表示方法存在着局限性,有许多知识实际上是无法表示成谓词形式的,如不确定知识的表示等。
2. 产生式表示法
这种表示方法的基本形式类似于 IF-THEN 语句,由于许多知识可以用因果关系来描
述,特别是这种因果关系与计算机中的一些语句结构十分相似,处理起来就方便许多,从而获得人们的广泛重视和推广应用。但是,它在表示结构性知识上则先天不足。
3. 框架表示法
它的基本方法是把许多事物放在一起,构成一个集合,然后对这个集合中的联系和事实进行表示。这种表示方法是接近于人类思维的一种表示法,其中的知
・14 ・
第 2 章 知识表示
识能够得到继承。
4. 语义网络法
这种表示方法反映了人类知识的网络结构化特性,它能使联想式推理在其上得到很好的发挥,为进行复杂推理打下基础。它很接近人类思维,但不能正确表示类属关系,忽视了事物有类的属性。
5. 脚本表示法
这种表示法在自然语言理解方面开始应用,这是因为自然语言理解的特殊性,采用这样的表示方法,可以表示上下文关系、事物之间的动静态关系,同时还充分考虑到场景(上下文
)。但是,由于实际中的各种场景复杂多样,从而限制了它的应用范围。
同一知识可用多种方法表示,但效果却不相同,上述各种知识表示方法大都是在进行某项具体研究或者建立某个智能系统时提出来的,有一定的针对性和局限性。同时,知识的表示又影响到推理机制的运行,推理机制和知识表示二者是相关的。一种知识表示可以有利于一种
推理机制的运行,而另一种则 不利于这种推理机制的运行,在建立一个智能系统时究竟采用哪种表示模式,目前没有统一标准,也不存在一个万能的知识表示模式。因此,选择知识表示也一定要根据所要处理的具体领域和实际情况来选择相应的知识表示方法。
实际推理
|
|
图 2.2 智能过程的一种模拟
知识及其对知识的运用反映了人类智能活动的两个重要方面,一般来说可以将这种智能活动描述为对问题的求解过程,即在已有的知识基础之上( 状态 0) 去寻求解决问题或达到目标( 状态 S) 的一种过程,如图 2.2 所示。下面来看看如何用机器来模拟人类的这种智能活动。首先,将问题转换为计算机内部可以接受的某种形式,即完成知识的表示
。然后,对该知识进行有关推理,实际上反映为计算机中的一些程序运行,在得出问题目标解的内部表示之后,通过反向映射转化为真实目标解,从而完成这一智能求解活动的模拟。
由上讨论,可以初步认为智能活动过程的模拟主要含有如下内容。
・15 ・
(1)
知识表示: 将某个领域里的事实知识和专家的经验知识加以形式化,即知识的表示过程 ,使计算机能够接受和处理这些知识
,这是问题求解的基础条件, 它涉及如何建造和管理一个知识库。
(2) 知识利用: 在已经建立的知识库的基础之上,利用形式化的知识来解决实际的问题,这部分一般称为推理机,它在计算机中表现为一系列程序的运行。类似数据与算法的关系,知识表示和知识利用在问题的求解过程中相辅相成。
(3) 知识获取: 将对象问题领域的事实知识和经验知识移植到知识库,并能
够实现从专家那里抽取知识、维持知识库完整性、保证新旧知识的一致性、具有知识更新与学习能力,等等。
围绕着这三方面,人们开展了许多的基础理论研究与技术应用工作,取得了一系列的成果,下面介绍知识表示的一些主要方法。