人工智能:4.1 不确定推理概述
4.1.1
不确定推理的概念
前面,讨论了基于一阶谓词逻辑的归结推理方法,这种方法所依据的证据是确定的,即谓词所表示的知识要么为 “真”,要么为“假”,其推理过程以数理逻辑为 基础,推理过程是严密的,所推出的结论也是确定的,要么成立,要么不成立。因此,基于一阶谓词逻辑的归结推理方法是一种确定性的推理方法。但是,现实世界中遇到的很多问题往往都不具有 确定性 。引起不确定性的因素主要有如下几点。
(1) 知识的不完备、不精确。
在解决某一个问题时,往往不具备解决该问题所需要的全部知识,关于它的信息或知识还不全面、不完整、不充分, 不能确定知识是真还是假。例如,医生给病人看病,往往是从部分症状开始,并根据一些经验加以诊断的。显然,医生所得到的信息并不完整,诊断的方法( 知 识) 也不一定是正确的。
(2) 知识描述的模糊性。
知识的边界不明确,如好、很好、比较好等,相应知识描述则必然也是模糊
・60 ・
第 4 章 不确定推理
的。模糊性就是一个命题中所出现的某些言词模糊不清。如 : 小王是个高个子 ; 张三和李四是好朋友 ; 如果向左转,则身体就向左稍倾。
(3) 随机性。
命题(
亦即所表示的事 件) 的真实性不能完全肯定,故只能对其为真的可能性给出某种估计。如 : 如果乌云密布并且电闪雷鸣,则很可能要下暴雨
; 如果头痛发烧,则大概是患了感冒。
(4) 原因的多样性。
同一个结论,往往存在多种原因,故只能根据结论作出一些猜测,这样的推理不可能是精确的。
(5) 不一致性。
不一致性就是指在推理过程中发生前后不相容的结论;或者随着时间的推移或者范围的扩大,原来一些成立的命题变得不成立、不适合了。
(6) 解决问题的方案不唯一。
一个问题存在有多个不同方案,通常是优先选择主观上认为相对较优的方案,这也是一种不确定性推理。
以上几个方面,导致了人们所总结的知识( 或规则) 以及由观察所得到的证据不确定,就分别形成了不确定的知识及不确定的证据。人们通常就是运用这种不确 定性的知识进行思维、推理,进而求解问题 。不确定推理是 建立在不确定性知识和证据的基础之上的推理,就是从不确定性的初始证据出发,通过运用不确定性的知识,最终推出具有一定程度的不确定性的但却是合理或者近乎合理的结论的思维过程。经验性知识一般都带有某种程度的不确定性。在此情况下,如若仍用经典逻辑做精 确处理,就势必要把客观事物原本具有的不确定性及事物之间客观存在的不确定性关系划归为确定性的,在本来不存在明确类属界限的事物间人为地划定界限,这无疑会舍弃事物的某些重要属性,从而失去了真实性。由此可以看出,人工智能中对推理的研究不能仅仅停留在确定性推理这个层次上, 为了解决实际问题, 还必须开展对不确定性的表示及处理的研究,这将使计算机对人类思维的模拟更接近于人类的思维。
4.1.2
不确定推理的基本问题
不确定推理的基本问题包括关于证据的不确定性表示、规则的不确定性表
・61 ・
人工智能技术与方法
示、不确定性的计算和 语义问题 ,这些问题的不 同解决方法就形成了各种不确定推理方法。
1. 关于证据的不确定性表示
在推理过程中,证据的来源一般有两个 。一个是通过观察而得到的所要求解问题的初始证据,如,在解决医疗诊断问题时,当前病人的某些症状、化验结果等都是初始证据。由于观察本身的不精确性,因此所得到的初始证据具有不确定性。再比如,当你观察某物体的颜色时,可能会说它看起来是白色的,但也有可能是灰色的。初始
证据 的不确定性通常由有关领域的专家给出。另一个则是在推理过程中利用前面推理出的结论作为当前新的推理证据。在前面的推理中,所使用的初始证据的不确定性,以 及在推理过程中所使用的知识的不确定性,都会导致所推出的结果的不确定性。
证据的不确定性表示 是指采用什么方法 描 述 证据的不确定性,这是解决不 确定推理的关键一步 。通常有数值表示和非数值的语义表示方法 ,二者都不够完善。数值表示便于计算、比较,而定性的非数值表示更容易描述不确定问题。对于命 题(
事 实)E ,通常用
C ( E ) 来度量其
不确定性。 对于初始证据,其值由用户给出; 对于推理中所得结论作为当前推理的证据,其值由推理中不确定性的传递算法计
算得到。
2. 规则的不确定性表示
规则的不确定性是指当规则的条件被完全满足时,产生某 种结论的不确定程度。例如,有以下规则 :
如果 启动器发出刺耳的噪声
那么 这个启动器损坏的可能
性是 0.8
以上规则表示,如果 “启动器发出刺耳的噪声 ”这个事实完全肯定的可信度为 1.0,
那么得出“这个启动器损坏的 ”的结论的可信度为 0.8 ;当规则的条件部分不完全确定,即当可信度不为 1
时,将涉及下面要讨论的不确定性的传递问题。计算其结论可信度的最简单的方法是取条件可信度与规则的不确定性的乘积。设条件的可信度为 0.7 ,规则的可信度为
0.8, 则结论的可信度为
0.7×0.8= 0.56 。一般地,对于规则
E ® H ,用 f ( H,E ) 表示其不确定性。通常,在专家系统中规则的不确定性一般是由领域专家给出。
・62 ・
3.
不确定性的计算
第 4 章 不确定推理
不确定性的计算是 指不确定性的传播和更新,也即获得新的信 息的过程。不确定性计算主要有如下问题。
(1) 不确定性的传递问题。
已知 C ( E
) ,E ® H f ( H,E ) 如何计算 C ( B ) , 即如何将证据 E 的不确定性和规则 E
® H 的不确定性传递到结论 H 上。
(2) 证据的不确定性合成问题。
如果支持结论的证据不止一个 ,则不止一个证据之间可能是 AND
或 OR 的关系,如何根据 C ( E 1)
和 C ( E 2) 来计算 C
( E 1∧E
2) 和 C
( E 1∨E
2) 。
(3) 结论的不确定性合成问题。
如果有多个规则支持同一个事实,如,已知 E 1 ® H , E 2 ® H ,如何根据这两个规则的可信度 f ( H,E 1) 和 f ( H , E 2) ,以及这两个证据的可信度 C ( E 1) 和 C ( E 2) 来确定结论的不确定性 C ( H) 。
如果结论 H
已有了初始可信度 C0 ( H) ,由于证据 E 的出现,且已知
E ® H ,
C ( E ) 及 f
( H,E)
,那么,如何更新结论 H 的可信度。
4. 语义问题
语义问题 是 指上述 关于证据和规则的 表示和计算的含义是什么,即对它们进行 解释。比如 ,C ( A
) 可理解为 A 为真的程度 ,f ( B ,A
) 可理解为当前提 A 为真时对结论 B 为真的 一种影响程度, 特别 要 关心的 f ( B ,A ) 的几个特殊值是
(1) A 真则 B 真,这时 f ( B , A ) =?
(2) A 真则 B 假 , 这时 f ( B , A ) =?
(3)
A 对 B 没有影响时, f ( B , A) =? 对 于 C(A ) 要关心的值是
(1) A 真时, C ( A ) =?
(2) A 假时, C ( A ) =?
(3) 对 A 一无所知 时, C ( A ) =?
・63 ・
4.1.3
不确定性推理的方法
不确定性推理的方法大致可分为定量的数值计算方法和定性的非数值计算方 法,当前研究和应用较多的是一种用数值对非精确性进行定量 表示和处理的方法, 主要有基于概率理论的确定性方 法( 见 4.2 节) 、主观 Bayes 方法( 见 4.3 节) 、证据理论见 4.4 节等的推理方法和基于模糊理论的可能性理论的模糊推理方法( 见第 6 章) 。