Advertisement

算法进阶--朴素贝叶斯,贝叶斯网络,D-separation

阅读量:

算法进阶--贝叶斯网络

该分类器基于Naive Bayes算法

复制代码
* 三种通过贝叶斯网络判定条件独立
* D-separation-有向分离

朴素贝叶斯

  • 朴素贝叶斯是假设样本特征之间相互条件 独立(给定条件y时互相独立)
    如:(通过n个特征来判断样本y的分类)
    P(y|x_1,x_2,x_3...x_n)=\frac{P(x_1,x_2,x_3...x_n|y)P(Y)}{P(x_1,x_2,x_3...x_n)}
    在上式贝叶斯公式中,如果特征之间不条件独立,则会有:(对于分子,只展开x1的话)
    P(x_1,x_2,x_3...x_n|y)=P(x_1|y)P(x_2,x_3..x_n|y,x_1)
    若是特征之间相互独立的话:
    P(x_1,x_2,x_3...x_n|y)=P(x_1|y)P(x_2,x_3..x_n|y)
    也就是:
    P(x_1,x_2,x_3...x_n|y)=P(x_1|y)P(x_2|y)P(x_3|y)....P(x_n|y)
    所以最终求的就是:(p(x)为全概率公式,其实是定值来的,也就是分母可以省略)
    y =argmaxP(y)\prod_{i=1}^{n}P(x_i|y)

高斯朴素贝叶斯

y =argmaxP(y)\prod_{i=1}^{n}P(x_i|y)

  • 在朴素贝叶斯的基础上,特征服从高斯分布:
在这里插入图片描述

通过最大后验估计(MAP)来计算P(y)

多项分布朴素贝叶斯

y =argmaxP(y)\prod_{i=1}^{n}P(x_i|y)

  • 假设特征遵循多项式分布,则针对每个类别y而言,在给定变量下其参数定义为向量θ_y=(θ_{y1},θ_{y2},…,θ_{yn})其中n表示特征的数量在给定类别条件下变量x_i的概率由θ_{yi}决定。
    • 基于最大似然估计的方法得出的结果是:
在这里插入图片描述

其中:假设有训练集T

在这里插入图片描述
在这里插入图片描述

贝叶斯网络

定义: 有向无环图=贝叶斯网络

在这里插入图片描述

全连接贝叶斯网络

定义:每一对节点之间都有边相连

在这里插入图片描述

三种通过贝叶斯网络判定条件独立

  • 第一种:已知一个根节点,则根节点下的子节点之间是相互独立的tail to tail ):
在这里插入图片描述

数学推导

在这里插入图片描述
  • 第二种: 已知中间节点,则前后节点之间是独立的 :(head to tail
在这里插入图片描述

数学推导

在这里插入图片描述
  • 第三种,未知子节点的情况下,两个根节点时条件独立的 :(head to head):
在这里插入图片描述

数学推导

在这里插入图片描述

D-separation-有向分离

给定任意三个节点集合A, B, C,在图论中我们通常会考察从A集合中的任一节点至B集合中的任一节点的所有路径。当设定A与B条件独立时,则必须确保所有这样的路径都被阻断。

在这里插入图片描述
在这里插入图片描述

若判定气体(Gas)与无线电(Radio)之间是否存在相互独立性,则需考察系统中节点A与节点B均拥有通过中间节点C的tail到 tail连接路径;此时可推断出气体( Gas)仅存在于节点B内部空间,则由此可知气体( Gas)与无线电( Radio)之间亦为相互独立关系。

全部评论 (0)

还没有任何评论哟~