机器学习 |Dempster Shafer 理论
Dempster-Shafer 理论是由 Arthur P. Dempster 在1967年创立的。 Glenn Shafer在其学生Arthur P. Dempster指导下,在1976年进一步发展和完善了这一理论。该理论旨在解决复杂信息处理中的不确定性问题。
- 贝叶斯理论只关注单一证据。
- 贝叶斯概率不能描述无知。
Dempster Shafer 理论
Dempster-Shafer理论(DST)是一种证据理论体系,在处理各种可能的结果时具有独特的机制。这种理论被用来应对由不同证据来源导致的不同结果所带来的挑战。
该模型中的不确定性 由下式给出:
- 覆盖所有可能的结果。
- 信仰可能会通过提供支持性论据而引发对某种可能性的信仰。
- 合理性将使证据与可能的结果保持一致。
例:
假设有一个封闭的房间内有四名人员:A、B、C和D。突然间灯熄灭,在灯重新点亮时发现B背受致命伤而死于现场。没有任何人进入了房间也没有任何人离开房间的情况下我们已确定B并非自杀者。那么我们的首要任务就是找出凶手是谁?根据上述情况请协助警方确认所有可能的嫌疑人
要解决这些问题,有以下可能性 :
- 除了选择{A}, 选择{C}, 或选择{D}}之外
- 除了选择{A,C}, 选择{C,D}, 或选择{A,D}}之外
- 或者他们三人共同杀害了他
- 他们都没有杀死他{o}(以比方说)。
基于合理性原则提供的证据线索,请找出凶手
质量函数 m(K) 代表的是对事件 K 发生可能性的一种量化评估指标;它旨在解释关于 K 的基本性质及其与其他相关事件之间的关系;基于现有证据表明,在无法进一步细化 K 的具体条件和背景信息时,将 K 和 B 分为独立的类别更为合理。
关于集合 K 的信仰:集合幂集的元素 K 代表的是其成员所具有的总质量这些子集实际上是集合 K 本身的组成部分。这可以通过举例说明例如取K = {a d c}那么Bel(K)就等于m(a)加上m(d)再加上m(c)再加上m(a d)加上m(a c)再加上m(d c)最后再加上m(a d c)}
在K中的合理性方面:它指的是与K相交的所有集合的质量总和。具体而言, Pl(K)等于各个子集的质量之和:m(a)、m(d)、m(c),以及它们的各种组合质量: m(a,d)+m(d,c)+m(a,c)+m(a,d,c)
Dempster Shafer 理论的特点:
- 不确定性表示:DST专门应对信息不确定的问题,并采用了表示和推理不完整证据的方法。
- 证据冲突:DST支持结合多种证据来源,并提供了结合不同来源信念函数的规则。
- 决策能力:基于从结合后的信念函数中计算出信任度、概率值以及合理性等指标后,则有助于做出决策。
Dempster Shafer 理论的优点:
- 随着我们获取更多数据时,在线性回归模型中不确定性区间会减少。
- DST 的知识水平相对较低。
- 诊断层次结构可以使用该指标来表示在线性回归模型中的不确定性区间。
- 处理此类问题的人可以不加限制地考虑证据。
Dempster Shafer 理论的缺点:
- 在这种情况下,计算工作量很高,因为我们必须处理 2n集
