概率论信息论基础（随机变量、常用概率分布、贝叶斯规则、信息论基础、结构化概率模型）

阅读量：

随机变量及其概率分布

随机变量遵循可以取不同值的规律，并由一个概率分布来对应于每个状态的可能性。

对于具有不同取值的可能性进行描述的随机变量类型被称为离散型随机变量；它们通常被通过概率质量函数（PMF）来建模，并也被称为概率分布规律。

Continuous random variables are typically represented by the probability density function (PDF), which assigns a probability to each possible area within its domain.

的无限小区域内的概率为

。

多个变量的概率分布被称为联合概率分布 ，例如

也可以简写

。

假设我们有一个联合概率分布P(X,Y)，想要获取某个子集的概率分布P(X)，可以通过计算另一个变量Y的总和来得到。

在某个条件发生的情况下，计算事件的概率，称作条件概率 ，例如在

的条件下，

发生的概率，可表示为：

条件概率的链式法则：

P},...,x{(n)})=P(x^{(1)})\prod_{i=2}{n}P}id x{(1)},...,x{}

独立性

如果满足

，则称这两个随机变量相互独立 。

如果满足

，则称这两个随机变量相互条件独立 。

期望方差协方差

关于某分布

的期望，表示当

由

产生时，

的平均值：
$E_{xim P}=um_xPf$
$E_{xim p}=nt pfdx$

方差表示随机变量

呈现的差异性：
Var=E^2

方差的平方根称为标准差 。

协方差 给出了两个随机变量线性相关性的强度：
Cov,g=E-E

协方差的magnitude如果significantly large意味着变量显示出较大的波动性并且远离各自的average

协方差如果是正的，那么两个变量都倾向于同时取相对较大的值。

当协方差为负数时，在一个变量趋向于较大数值的同时（即当其中一个变量变大时），另一个变量趋向于较小的数值。

协方差矩阵 是一个

的矩阵，满足：

常用概率分布

伯努利分布 （Bernoulli distribution）是单个二值随机变量的分布。

egin{align*} & P=p & P=1-p & E=p & Var=p nd{align*}

二项分布 是

次重复的伯努利实验，记作

。

egin{align*} & P=inom{n}{k}pk(1-p){n-k} & E=np & Var=np nd{align*}

泊松分布 是广泛应用于描述单位时间内随机事件发生次数的概率模型

，

是单位时间内随机事件的平均发生次数。

egin{align*} & P=rac{ambdake{-ambda}}{k!} & E=ambda & Var=ambda nd{align*}

均匀分布 表示在一段连续的范围内概率密度处处相等，记作

。

egin{align*} & f=rac{1}{b-a}a<x<b & E=rac{a+b}{2} & Var=rac{^2}{12} nd{align*}

指数分布 表示概率密度呈指数分布。

egin{align*} & f=rac{1}{heta} e^{-rac{x}{heta}}x>0 & E=heta & Var=heta^2 nd{align*}

高斯分布 （Gaussian distribution），也称作正态分布，是最常用的分布，记作

。

egin{align*} & f=rac{1}{qrt{2i}igma}xp2}{2\sigma2} & E=u & Var=igma^2 nd{align*}

当

时，高斯分布称为标准正态分布 。

多维正态分布 ，参数

表示分布的协方差矩阵。

N=rac{1}{qrt{n\det(\Sigma)}}\exp(-\frac{(x-\mu)Tigma^{-1}}{2}

拉普拉斯分布 （Laplace distribution）可以在任意一点设置概率的峰值。

狄拉克delta函数 （Dirac delta function）的定义为：

狄拉克分布 经常作为经验分布的一个组成部分出现：

常用函数

logistic sigmoid 函数 ，取值范围

：

softplus函数 ，取值范围

，是 ReLu 函数的平滑形式：

sigmoid 函数和 softplus 函数之间的常用性质：

egin{align*} & igma=rac{ex}{ex+e^0} & rac{athrm{d} }{athrm{d} x}igma=igma & 1-igma=igma & ogigma=-eta & rac{athrm{d}}{athrm{d} x}eta=igma & orall xn ,igma^{-1}=og & orall x>0,eta^{-1}=og & eta=nt_{-nfty}^{x}igmady & eta-eta=x nd{align*}

正部函数 是指

，负部函数 是指

。

贝叶斯规则

贝叶斯规则用于计算条件概率：

信息论基础

信息论的核心理念意指一个罕见事件意外地发生所携带的信息量能够更多地反映其重要性。

一个事件

的自信息 表示为：

香农熵 （Shannon entropy）表示整个概率分布中的不确定性总量，指事件所产生的期望信息总量：
$H=E_{xim P}=-E_{xim P}$

当

是连续的，香农熵被称为微分熵 （differential entropy）。

接近确定性分布具有较低的香农熵，接近均匀分布具有较高的香农熵。

同一个随机变量

的两个单独的概率分布

和

，可以使用 KL 散度 来衡量分布的差异性：
$D_{KL}=E_{xim P}=E_{xim P}$

KL 散度衡量的是，当我们使用一种被设计成能够使概率分布

产生的消息的长度最小的编码，发送包含概率分布

产生的符号的消息时，所需要的额外信息量。

与 KL 散度密切联系的量是交叉熵 ：

在信息论中，定义

。

结构化概率模型

通过图形结构来展示概率分布的分解形式，在这种模型中，每个节点代表一个随机变量；每条边则代表两个节点之间的概率分布。

有向模型 对于分布的每一个随机变量，都包含一个父节点

的条件概率影响因子：

例如下图，对应概率分布可分解为

：

无向模型 将分解表示成一组函数，两两之间有边连接的顶点称为团

，每个团都有一个因子

：

其中，

为归一化常数，通常是所有状态的求和或积分。

例如下图，对应概率分布可分解为

：

如果这篇文章对你有一点小小的帮助，请给个关注喔_{我会非常开心的}

全部评论 (0)

还没有任何评论哟~

概率论信息论基础（随机变量、常用概率分布、贝叶斯规则、信息论基础、结构化概率模型）

目录随机变量及其概率分布独立性期望方差协方差常用概率分布常用函数贝叶斯规则信息论基础结构化概率模型如果这篇文章对你有一点小小的帮助，请给个关注喔我会非常开心的随机变量及其概率分布 ...

词信息处理基础（概率论、信息论基础）

文章目录一、概率论基础 1.转移概率 2\.条件概率二、信息论基础 1.信息熵 2\.联合熵 3.条件熵 4.互信息 5\.交叉熵三、n元语法模型四、语法模型的性能评价一、概率论基础语言统...

概率论基本概念：随机变量、概率分布

文章目录 1什么是随机变量 2概率分布 2.1离散型随机变量的概率分布 2.2连续型随机变量的概率分布 2.3写在最后参考文章 1什么是随机变量随机变量也是一种变量，它与普通变量的区别就是随机变量...

用deepseek学大模型03-数学基础概率论随机变量概率分布

deepseek.com:什么是概率，什么是随机变量？深度学习中常用概率的分布有哪些？ 1\.什么是概率？概率是描述事件发生的可能性的数值，范围在0到1之间： 0：事件不可能发生。 1：事件必然发生...

概率论与统计学基础 | 随机变量和概率分布

1. 概率论基本概念：概率的定义与性质：概率是描述随机现象发生可能性的数学工具。概率的基本性质包括非负性、规范性和可列可加性。随机试验与样本空间：随机试验是一种具有随机性质的实验，其所有可能结果组成...

机器人控制概率基础：条件概率、全概率定理、贝叶斯准则、置信分布等

写在前面：本文为原创，如需转载请注明出处。欢迎大家留言共同探讨，有误的地方也希望指出。另如果有好的SLAM、ROS等相关交流群也希望可以留言给我，在此先谢过了。本文参考：《概率机器人》 0引言概率...

【概率论基础进阶】随机变量及其分布-常用分布

文章目录一、01分布二、二项分布三、几何分布四、超几何分布五、泊松分布六、均匀分布性质七、指数分布性质八、正态分布性质一、01分布定义：如果随机变量X有分布律 X01 P1p...

概率论条件概率全概率贝叶斯公式

常用知识点条件概率 1.PBA=1表示A发生的情况下B必然发生 A属于B 2.可列可加性 PBUCA=PBA+PCA 3.PBA的样本空间为A,A与B都发生了大题解答思路 1.首先设取出一件商品为...

用deepseek学大模型03-数学基础概率论条件概率全概率公式贝叶斯定理

要深入浅出地理解条件概率与贝叶斯定理，可以从以下几个方面入手，结合理论知识和实例进行学习：贝叶斯定理与智能世界的暗语条件概率，全概率公式与贝叶斯公式的推导，理解和应用拉普拉斯平滑贝叶斯解决垃圾...

概率论基础

一、概率分布定义：用来描述随机变量或者一簇随机变量在每一个可能取到的状态的可能性大小。描述概率分布的方式取决于随机变量的是离散的还是连续的。 1\.离散型离散型变量的概率分布可以用概率质量函数来...

是否确定退出登录?

概率论信息论基础（随机变量、常用概率分布、贝叶斯规则、信息论基础、结构化概率模型）

目录

随机变量及其概率分布

独立性

期望方差协方差

常用概率分布

常用函数

贝叶斯规则

信息论基础

结构化概率模型

全部评论 (0)

相关文章推荐

概率论信息论基础（随机变量、常用概率分布、贝叶斯规则、信息论基础、结构化概率模型）

词信息处理基础（概率论、信息论基础）

概率论基本概念：随机变量、概率分布

用deepseek学大模型03-数学基础 概率论 随机变量 概率分布

概率论与统计学基础 | 随机变量和概率分布

机器人控制概率基础：条件概率、全概率定理、贝叶斯准则、置信分布等

【概率论基础进阶】随机变量及其分布-常用分布

概率论 条件概率 全概率 贝叶斯公式

用deepseek学大模型03-数学基础 概率论 条件概率 全概率公式 贝叶斯定理

概率论基础

用deepseek学大模型03-数学基础概率论随机变量概率分布

概率论条件概率全概率贝叶斯公式

用deepseek学大模型03-数学基础概率论条件概率全概率公式贝叶斯定理