微信搜索“高速商务通”,马上办理ETC
人工智能:4.3 主观 Bayes 方法
直接使用 Bayes 公式 求结论 H 在证据 E
存在情况下的概率 P(
H / E) ,不仅需要已知 H 的先验概率 P(
H ) , 而且还需要知道证据 E
出现的条件概率 P(E
/ H ) , 这在实际应用中相当困难。为此,杜达(R.O.Duda)、哈特(P.E.Hart)
等人 1976 年在
Bayes
公式的基础上经 过 适当改进提出了主观 Bayes
方法,建立了相应的不确定性推 理模型, 它是最早用于处理不确定性推理的方法之一, 并在地矿勘探专家系统 PROSPECTOR 中得到了成功的应用。
・70 ・
4.3.1
知识不确定性的表示
第 4 章 不确定推理
在 主观 Bayes 方法 中,知识是用产生式规则表示的,具体形式为
IF E
THE N( LS ,LN )
H ( P ( H ) )
其中 ,(1) E 是该条知识的前提条件,它既可以是一个简单条件
,也可以是用 AND
或 OR 把多 个简单条件连接起来的复合条件;
(2)
H 是结论, P( H ) 是 H 的先验概率,它指出在没有任何专门证据的情况下结论 H 为 真的概率,其值由领域专家根据以往的实践及经验给出 ;
(3) LS 称为充分性量度,用于指出 E 对 H 的支持程度,取值范围 为[0, + ¥ ],
其定义为
LS 的 值 由领域专家给出 ;
LS =
P(E / H )
P(E /
ØH )
(4)
LN
称为必要性量度,用于指出
Ø E 对 H 的支持程度, 即 E 对 H 为 真的必要性程度,取值 范围为[0, + ¥ ] ,其定义为
LN = P(ØE/H)
= 1
– P(E/H)
P(ØE/ØH) 1– P(E/ØH)
LN 的值也是 由领域专家给出。
为了简洁起见,引入几率函数
O ( X ) ,它与概率函数
P ( X ) 的关系为
O( X )
=
P( X )
=
P( X )
1– P( X )
O( X )
1+ O( X
)
几率函数表示证据 X 出现概率与不出现概率之比,显然,P ( X ) 与 O ( X ) 有相 同
的
单调性 。即若 P( X 1) < P( X 2 )
,则而且,当 P( X ) = 0 时,
当
P( X ) = 1 时,
O( X1) < O( X 2 ) ,只是 P(X ) Î [0,1],而
O( X )
= 0
O( X )
= ¥
O( X ) Î [0,¥],
这样相当于将取值为[0 , 1] 的 P ( X ) 放大为取值为[0 , ¥ ] 的 O ( X ) 。
由 LS
的定义,以及 P (X ) 与 O(X ) 的关系式,可 得到
・71 ・
人工智能技术与方法
O(H/E)=LS´O(H)
O(H/ØE
)=LN´O(H)
由这两个公式可看出, LS 表示 E 为真时, 对 H 为真的影响程度,表示规则 E ®
H 成立充分性。LN 表示 E
为假时,对 H 为真的影响程度,表示规则 A ®
B 成立的必要性。
表 4.1 给出 LS 和 LN 的几个特殊值,有助于进一步理解它们的含义。
由 LS , LN 的定义知, LS 、LN 均≥0 ,而且 LS 和 LN 不是独立取 值的 : 不可以 E
支持 H 的同时 Ø
E 也支持 H
,即 不 容许 LS 和 LN 二者同时大于 1 ,类似地, 也 不 容许 LS 和 LN 二者同时小于 1 。
在实际系统中 。LS
和 LN
的值是由专家凭经验 ,以及上述原则给出的,而不是 依 LS 和 LN 的定义来计算的。
表 4.1 LS 和 LN 的几个特殊值
LS
|
=1
|
当 O ( H/ E) = O( H) 时,表明 E 的出现,对 H 没有影响
|
> 1
|
当 O ( H/ E)>
的, 故 称 LS 为 充分性量度
|
|
< 1
|
当
|
|
=0
|
由于证据 E 的存在,将使 H 为假
|
|
LN
|
=1
|
当 O ( H/ ØE)= O( H) 时, 表明 Ø E
|
> 1
|
当 O ( H/ ØE)> O( H), 即 Ø E 支持 H 时,表明 由于证据 E 不存在,将增大结论 H 为真的概率,而且 LN 越大 , P (H/ ØE) 就越大,即 Ø E 对 H 为真的支持越强。当 LN ® ¥ 时, O( H/ ØE) ® ¥ ,即 P(H / ØE) ® 1, 表明由于证据
E 不存在,将导致 H 为真
|
|
< 1
|
当 O ( H/ ØE)< O( H), 即 Ø E 不支持 H 时,表明由于证据 E 不存在,将使 H
为真的可能性下降,或者说 由于证据 E 不存在,将 完全不支持 H 为真。
由此可以看出 E 对 H 为真的必要性
|
|
=0
|
由于证据 Ø E 的存在,将使 H 为假
|
4.3.2
证据不确定性的表示
若以
O ( A ) 或 P
( A )
表示证据 A 的不确定性, 则 转换公式是
・72 ・
第 4 章 不确定推理
O( A)
=
P( A)
1 – P( A)
ì0
|
= ï¥
|
ï(0, ¥)
当 A 为假时当 A 为真时
当 A 界于真假之间时
4.3.3
不确定性的传递算法
在主观 Bayes 方法的知识表示中 ,P (H) 是专家对结论
H 给出的先验概率,它是在没有考
虑任何证据的情况下根据经验给出的。随着新证据的获得 ,对 H
的信任程度应该有所改变。 主观 Bayes 方法推理的任务就是根据证据
E 的概率 P
(E )
及 LS
,LN 的值,把 H 的先验概率 P(H
) 更新为后验概率 P (H/E ) 或 P
( ØH/E ) 。由于一条 知识所对应的证据是肯定存在的 ,或者 是肯定不存在的 ,或者是不确定 的, 而且在不同情况下确定后验概率的方法不同,所以下面分别进行讨论。
1. 证据肯定存在的情况
在证据 E 肯定存在时,把先验几率 O (H) 更 新为后验几率 O (H/E ) 的计算公式
为
O( H / E ) = LS ´ O(H )
(4.4)
如果把上式 换成概率,就可得到
P(H / E) = LS
´ P(H )
(
LS –1) ´ P(
H ) + 1
这是把先验概率
P( H )
更新为后验概率 P( H /
E) 的计算公式。
(4.5)
例如 ,设有规则
IF E THEN(
10 ,1)H ,已知 P(
H ) = 0.03 ,并且证据 E 肯定存在 ,可以计算得 P(
H / E) = 0.24 。
2. 证据肯定不存在的情况
在证据 E 肯定不存在时,把先验几率 O(
H ) 更新为后验几率 O(H
/ ØE)
的计算公式
为:
O(H /
ØE) = LN ´ O(H
)
如果将上式 换成概率,就可得到
(4.6)
P( H /
ØE) =
LN ´ P(H
) (LN – 1) ´ P( H
) + 1
(4.7)
这是把先验概率 P( H ) 更新为后验概率 P( H / ØE) 的计算公式。
・73 ・
人工智能技术与方法
例如, 设有规则 IF E THEN(1,0.002)H
, 已知: P( H ) = 0.3 ,并且证据 E
肯定不存在 ,则 P( H /
ØE) = 0.00086 。
3. 证据不确定的情况
上面讨论了在证据肯定存在和肯定不存在情况下把 H
的先验概率更新为后验概率的方 法 。在现实中 ,这种证据肯定存在和肯定不存在的极端情况是不多的, 更多的是介于二者之间的不确定情况。因为对初始证据来说,由于用户对客观事
物或现象的观察是不精确的,因而所提供的证据是不确定的 。另外,一条知识的证据往往来源于由另一条知识推出的结论, ― 般也具 有某种程度的不确定性。例 如,用户告知只有 60% 的把握说明证据是真的,这就表示初始 证据为真的程度为
0.6 ,即 P( E
/ S ) = 0.6 , 这里 S 是对 E
的有关观察。现在要在 0 < P( E
/ S ) < 1 的情况下确定 H 的后验概率 P(
H / S ) 。
在证据不确定的情况下,不能再用上面的公式计算后验概率,而要用杜达等人 1976 年证 明了的公式
P(H/S)=P (H/E )×P(E /S)+P (H/ Ø
E)×P (
Ø E/S) (4.8)
来计算。
下面分 4 种情况讨论式(4.8)。
(1) 当 P
(E /S)=1 时,P ( Ø E /S)=0 ,此时式(4.8) 变成
P(H/S)=P (H/E )= LS ´ P( H )
(LS
– 1) ´ P(
H ) + 1
这就是证据肯定存在的情况。
(2) 当 P
(E /S)=0 时,P ( Ø E /S)=1 ,此时式(4.8) 变成
P(H/S)=P (H/ Ø
E)= LN ´ P(H )
(LN
– 1) ´ P(
H ) + 1
这就是证据肯定 不 存在的情况。
(3) 当 P (E /S)=P(E ) 时,表示 E 与 S 无关,利用全概率公式将公式(4.8) 变为
P(H/S)=P
(H/E )×P (E )+P (H/ Ø E )×P( Ø E )=P (H)
(4)
当 P (E /S) 为其他值时,通过分段线性插值就可得到计算
P (H/S) 的公式, 如图 4.4 所示。
・74 ・
第 4 章 不确定推理
P(H/E)
P(H)
P(H/¬E)
O P(E) 1 P(E/S)
P(H/S) =
图 4.4 EH 公式的分段线性插值
P(H/Ø E)+ P(H ) – P(H/ØE ) ×P(E/S) 当 0≤P(E/S)<P(E)
P(E)
P(H/E)
– P(H
)
P(H)+
1 – P(E )
×[P(E/S)