人工智能:4.4 证 据 理 论
证据理论又称为 Dempster – Shafer
理论或信任函 数理论,通常简称为 D –S 理论 。 证 据 理 论 是 经 典 概 率 论 的 一 种 扩 充 形 式 。 证 据 理 论 是 由 德 普 斯 特
(A.P.Dempster) 首先提出,由沙佛(G.Shafer) 进一步发展起来的一种处理不确定性的理论 。1981 年巴纳特(J.A.Barnett) 把该理论引入专家系统中 ,同年卡威(J.Garvey)
等人用它实现了不确定性推理 。由于该理论满足比概率论弱的公理 ,能够区分 “不确定”与“不知道”的差异,并能处理由 “不知道”引起的不确定性,具有较大的灵活性,因而受到了人们的重视。
4.4.1
知识的不确定表示
证据理论是用集合表示 命题的。设 D 是变量 x 所有可能取值的集合,且 D 中的元素是互斥的,在任 一 时刻 x 都取只能 取 D
中的 某 一个元素为值,则称 D 为 x 的样本空间。在证据理论中 ,D 的任何一个子集 A
都 对应于一个关于 x 的命题,称该命题为“x
的值在 A
中”。例如,在医疗诊断系统中,用 x 代表 病人的某种 疾病,若 D={ 感冒,支气管炎,鼻炎} ,则 A = { 感冒} 表 示“ x 的值是感冒”或者“该病人所患的疾病 为 感冒” ; A
= { 感冒,支气管炎} 表 示“该病人所患的疾病 为 感冒或者支气管炎” 。又如,用 x 代表所看到的颜色, D = {red ,yellow ,blue} ,则 A
= {red}
表示“ x 是红色” ; 若 A
= {red ,
blue } ,则它表示“ x 或者是红色,或者是蓝色” 。证据理论中,为了描述和处理不确定性,引
入 了概率分配函数,信任函数及似然函数等概 念。
・78 ・
1. 概率分配函数
第 4 章 不确定推理
设 D 为样本空间,领域内的命题都
用 D 的子集表示
,则概率分配函数
(Function of Probability
Assignment) 定义如下。
定义 4.1 设函数 M
:2 D ® [0 , 1] ,且满足
M(<l) = 0
å M ( A) =1
AÍ D
则称
M 是 2
D上的概率分配函数, M(A ) 称为 A
的基本概率 函 数(Function of Basic Probability Assignment) ,即对于对于 样本空间 D
的任一子集都分配一个 概率 值。
关于 这个定义有以下几点说明。
(1)
设样本空间 D 中有 n 个元素 ,则 D 中子集的个数为 2 n 个 ,例如 ,设 D={red, yellow , blue} ,则它的子集有
Al ={red} A2 ={yellow} A3 ={blue}
A4 ={red , yellow} A5 ={red , blue} A6 ={yellow , blue }
A7={red,yellow , blue} A8 ={ <l}
其中, <l 表示空集,子集的个数刚好是 2 3=8 个
(2) 概率分配函数的作用是把 D 的任意一个子集 A 都映射为[0,1] 上的一个数
M(A ) 。当 A
Ì D 时, M(A ) 表示对相应命题的精确信任度。例如,设
A
={red}
M(A )=0.3
它表示对命题“x
是红色”的精确信任度是 0.3 。又如,设
B
={red,
yellow}
M(B )=0.2
它表示对命题“x
或者是红色,或者是黄 色”的精确信任度是 0.2 。由此可见, 概率分配函 数实 际上是对 D 的各个子集进行信任分配, M (A ) 表示分配给 A 的那一部分。当 A 由多个元 素组成时
,M (A ) 不包括对 A
的子集的精确信任度,而且也不知道该对它如何进行分配 。例如,在 M ({red,yellow}) =0.2 中不包括对 A ={ 红}
的 精确信任度 0.3 ,而且也不知道该把这个 0.2 分配给{red} 还是 分配给{yellow} 。当 A = D 时 ,M(A ) 是对 D 的各子集进行信任分配后剩下的部分,它表示不知道该对 这部分如何进行分配。例如,当 M(D)=
M({red, yellow ,blue }) =0.1 时,它表
・79 ・
人工智能技术与方法
示不知道该对这个 0. 1 如 何分配,但它不是属 于{red}
,就一定属于{yellow}
或
{blue} ,只是由于存在某些未知信息,不知道应该如何分配。
(3) 概率分配函数不是概率。例如,设 D = {red ,yellow , blue} ,且设:
・80 ・
第 4 章 不确定推理
M({red})=0.3 M({yellow})=0 M({blue})=0.1
M({red,yellow})=0.2 M({red,blue})=0.2 M({yellow ,blue})=0.1 M({red,yellow , blue})=0.1 M(<l)=0
显然, M 符合概率分配函数的定义,但是
M({red})+M({yellow})+M({blue})=0.4
若按概率的要求,这三者的和应等于
1 。
2.信任函数
定义 4.2 设函数 Bel:2D ® [0 , 1] , 且
Bel(A )= åM (B)
BÍ A
(A Î 2D)
则称为命 题 A 的 信任函数(Function
of Belief) ,即命 题 A 的 信任函数
值,就是 A 的所有子集的基本概率分配 函数 之和,用来表示对 A 的总信任。Bel 函数又称为下限函数,以 Bel(A ) 表示对命题
A 为真的
信任 程度。
由信任函数及概率分配函数的定义可以证明信任函数有如下性质 :
(1) Bel(<l)=M( <l)=0 , Bel(D) = å M ( B) =1 ,且对于 2 D中的任意元素 A ,有
BÍ D
0≤Bel(A )≤1
;
(2) 当 A 为单元素集,即|A |=1 时 ,B el(A) = M(A );
(3)
信任函数为递增函数, A 1 Í
A 2 Í
D ,则 Bel(A1)≤Bel (A 2)≤1 。根据前面例中给出的数据,可以求得
Bel({red}) = M({red})
= 0.3
Bel({red, yellow})=M({red})+M({yellow})+M({red,yellow})=0.3+0+0.2=0.5
Bel({red, yellow ,blue}) = M({re d})+M({yellow})+M({blue})
+ M({red,yellow})+M({red,blue
})
+M({yellow , blue })+ M({red, yellow ,blue})
=0.3 + 0 + 0.1 + 0.2 +
0.2 + 0.1 + 0.1 = 1
3.似然函数
似然函数(Plausible
Function) 又称为不可驳斥函数或上限函数 ,下面给出它的定义。
定义 4.3 似然函数 Pl :2 D ® [0 , 1] ,且
・81 ・
人工智能技术与方法
P
l(A)=1