Advertisement

贝叶斯定理及其在机器学习中的应用——朴素贝叶斯方法

阅读量:

贝叶斯定理及其在机器学习中的应用——朴素贝叶斯方法


文章目录

  • 贝叶斯定理及其在机器学习中的应用——朴素贝叶斯方法

  • 一、关于贝叶斯定理

    • 1.定理的提出
    • 2.研究意义
    • 3.贝叶斯定理的兴盛
  • 第二部分:探讨了基于'信息增益'原理的特征选择方法

    • 第一项:研究并实现了决策树模型的基本构建过程
      • 第二项:分析并比较了几种常用的特征选择方法及其适用场景
      • 第三项:通过实验验证不同特征选择策略对模型性能的影响程度
      • 第四项:结合实例展示了特征工程在提升模型表现方面的实际操作流程

一、关于贝叶斯定理

每一种定理的提出基本都是划时代的,定理的属性代表着它是受逻辑限制的证明为真的陈述,与许多定理一样,可以广泛应用于多种领域,正如热力学中熵的概念,香农则将其迁移到了信息论中,提出了信息论的概念,也有助于后来机器学习决策树中Gini系数的应用。德摩根定理则也有其形式逻辑表示方式,集合论表示方式与概率论表示方式,应用广泛。
而贝叶斯定理是关于随机事件A和B的条件概率(或边缘概率)的一则定理。其中P(A|B)是在B发生的情况下A发生的可能性。

1.定理的提出

托马斯·贝叶斯Thomas Bayes于18世纪创立了计算条件概率的方法。
该方法旨在解决以下类型的问题:
假设有n个变量x₁,x₂,…,xₙ彼此独立且构成一个完全事件集,
并已知每个变量发生的概率P(xᵢ)(i=1,2,…,n)。
当观察到与这些变量相关的事件Y随机发生时,
则可依据已知的条件概率P(Y|xᵢ)
来推导各变量xi在事件Y发生下的后验概率P(xᵢ|Y)。

2.研究意义

在面对不确定性信息时进行推理和决策的过程中,人们往往需要对各种可能的结果进行概率评估。这些评估构成了被称为"概率推断"的过程。作为一门学科领域,在当前知识体系中被划分为两个主要分支:一是传统意义上的"数学统计"方法所涉及的概率计算理论;二是现代认知科学中所关注的人类主观判断机制。这两者虽然研究目标有所不同但都试图揭示人类在面对不确定性时的心理活动规律及其背后所遵循的基本法则。贝叶斯推理的核心问题涉及条件概率计算这一关键环节不仅推动着理论界对人类认知机制的理解而且也为实际应用提供了重要参考框架。

3.贝叶斯定理的兴盛

其思想源于18世纪,在经历了长时间的发展后,在计算机技术兴起之后才获得了真正意义上的广泛应用。由于该定理在大数据与复杂推理领域的优势得以充分展现,在众多互联网相关领域得到了广泛应用包括但不限于自然语言处理、机器学习算法、推荐系统设计、图像识别技术以及博弈论分析等

二、贝叶斯定理在机器学习中的应用

1.朴素贝叶斯算法推导

在机器学习的有监督学习中, 朴素贝叶斯方法体现了贝叶斯定理的思想. 该算法根据预测指定样本属于各个类别的概率来确定该样本所属类别, 即:

在这里插入图片描述

而P(yi|x)可以写成:

在这里插入图片描述

其中x=(x1,x2,…,xn)表示每个样本所具有的n维特征向量集合,P(x)代表该类别的先验概率密度函数。对于任意给定的测试样本x及其所属类别yi,由于P(x)在各类别间取值保持一致,因此在条件概率计算中可以作为常数因子而被忽略不计。基于朴素贝叶斯模型的分类器假设各个特征之间相互独立,因此能够简化计算过程。

在这里插入图片描述

具体来说 ,P(x₁|yᵢ) ,… ,P(xₙ|yᵢ) 以及 P(yᵢ) 均可通过训练样本统计方法获得。
当需要将该模型应用于机器学习时 ,为了确定相应的目标函数 ,我们需要明确每个样本所属的类别 。在有监督的机器学习场景中 ,已知每个样本所属的类别 。那么我们的目标函数即为:

在这里插入图片描述

即为

在这里插入图片描述

在这里插入图片描述

在此时我们需要推断变量x所属的具体类别时

注:原文可能需要进一步说明

2.朴素贝叶斯算法的优缺点

探讨其优缺点时

3.朴素贝叶斯算法优化应用——多项式朴素贝叶斯

多项式朴素贝叶斯基于假设P(x|yi)遵循多项分布这一前提条件进行建模,在每个类别yi中假定各个特征x1,x2,…,xn均服从同一多项分布;亦即:

在这里插入图片描述

关于该模型参数的求解过程如下:首先采用最大似然估计的方法来计算关于参数P(xj|yi)的导数,并将导数值设为零以寻找极值点;随后通过求解相应的方程组即可得到所需参数的表达式。实际上这一过程等价于将问题转化为多项式分布的最大似然估计问题:

在这里插入图片描述
在这里插入图片描述

用于yi类别样本第j维特征值的求和运算

4.多项式朴素贝叶斯在文本分类中应用举例

就其在文本分类中的应用实例而言,基于多项式分布的朴素贝叶斯算法被视为两类经典的朴素贝叶斯变形方法之一。其中数据常被表示为单词计数向量,在实际应用中同样表现出色尽管tf−idf向量在实践中也得到了广泛应用

在这里插入图片描述

然后我们可以推出在未来预测单条样本类别时的概率目标函数:

在这里插入图片描述

在阐述朴素贝叶斯算法时已经分析得出,在信息论中存在一个数学关系式:当变量X的条件概率P越大,则其对数logP也越大;因此,在代入数据后的情况下,使得P(yi|x)达到最大值的文章分类即是我们所要进行的预测分类。
就贝叶斯定理而言,在当前研究领域中其应用范围极为丰富,并且能够覆盖的领域也非常多。

全部评论 (0)

还没有任何评论哟~