机器学习 - 隐马尔科夫模型(Hidden Markov Model)

阅读量：

1. 马尔可夫模型

下面介绍几个马尔可夫模型中的重要概念：

1.1 一阶马尔可夫假设 (first order Markov assumption)

n时刻的观测值只依赖于n-1时刻的观测值，即：
$p(x_n|x_{n-1},x_{n-2},...x_0) = p(x_n|x_{n-1})$

1.2 转移概率

$a_{i,j} = p(x_n = S_j|x_{n-1} = S_i)$

1.3 时不变性

2.隐马尔科夫模型

2.1 引入问题

假设有一个人被锁在房间里待了很多天，但是他想知道外面的天气是什么。他猜测天气的唯一途径就是看每天来照顾他的人有没有带伞。
这样，观测状态(observed state)就是{带伞，不带伞}; 隐藏状态(hidden state)就是{晴，雨}。

2.2 图像化表示

在这里插入图片描述
绿色圆圈是hidden state, 这是一个马尔可夫模型；
紫色圆圈是observed state, 只由对应的hidden state决定

2.3 形式化表示

$\{S_1,S_2,...S_N\}$ 表示hidden states的状态
$\{K_1,K_2,...K_N\}$ 表示observation的状态
$\Pi=\{\pi_i\}$ 是初始状态的概率
$A=\{a_{i,j}\}$ 是transition probability $a_{i,j}=p(x_n=j |x_{n-1}=i)$
$B=\{b_{i,j}\}$ 是observation state probability $b_{i,j}=p(y_n=K_j|x_n=S_i)$

2.4 HMM 能解决的问题

HMM的初始化模型 $\mu = \{A,B,\Pi\}$ , 观测序列为 $\sigma = \{O_1, O_2,...O_N\}$

问题一(estimation problem)：计算某个观测序列出现的概率
问题二(decoding problem)：已知观测序列，求最有可能的hidden state

2.4.1 问题1(estimation problem)

2.4.1.1 Solution1

在这里插入图片描述
使用全概率公式，按照hidden states 拆分：
$P(O|\mu) = \sum _{X} P(O,X|\mu)$
其中， $P(O,X|\mu) = P(X|\mu)P(O | X, \mu)$

故： $P(O|\mu) = \sum _{X} P(X|\mu) P(O|X,\mu)~~~~(1)$

其中，
$P(X|\mu) = \pi_{x_1}a_{x_1x_2}a_{x_2x_3}...a_{x_{T-1}x_T}$

这是因为 $P(X|\mu)$ 表示：在HMM 模型的初始条件下，hidden state为X的概率。

还有：
$P(O|X,\mu) = b_{x_1o_1}b_{x_2o_2}...b_{x_To_T}$

这是因为 $P(O|X,\mu)$ 表示：在HMM模型的初始条件下，以及hidden states的条件下，观测值为O的概率。由于观测值只和hidden state有关，这里的 $\mu$ 并没有作用。

这个算法的复杂度为 $O(2TN^T)$ , 其中T为序列长度，N为状态个数。

2.4.1.2 前向算法 (Forward Algorithm)

上面这种做法的明显不足就是复杂度太高了！前向算法通过动态规划来降低复杂度。

【算法1】前向算法

定义 $\alpha_t(i) = p(o_1,...o_t,x_t=i|\mu),$ 则 $P(O| \mu)= \sum _{i=1}^N \alpha_T(i)$

又有：
$\alpha_{t+1}(j)=p(o_1,...o_{t+1},x_{t+1}=j|\mu) \\ =\sum _{i=1}^Np(o_1,...o_{t+1},x_{t+1}=j,x_t=i|\mu) ~~~①\\ =\sum _{i=1}^Np(o_1,...o_{t+1},x_{t+1}=j|x_t=i,\mu)p(x_t=i|\mu)~~~~② \\ = \sum _{i=1}^Np(o_1,...o_{t}|x_t=i,\mu)p(o_{t+1},x_{t+1}=j|x_t=i,\mu)p(x_t=i|\mu)③ \\ =\sum _{i=1}^Np(o_1,...o_{t},x_t=i|\mu)p(o_{t+1},x_{t+1}=j|x_t=i,\mu)~~~④ \\ =\sum _{i=1}^Np(o_1,...o_{t},x_t=i|\mu)p(x_{t+1}=j|x_t=i,\mu)p(o_{t+1}|x_{t+1}=j)~~~⑤ \\ = \sum_{i=1}^N \alpha_t(i)a_{ij}b_{j o_{t+1}}$
②->③:独立性假设
③->④: 第一项第三项合并
④->⑤: 第二项拆分

这样，有 $\alpha_{t+1}(j) = \sum_{i=1}^N \alpha_t(i)a_{ij}b_{j o_{t+1}}$ ,又有 $P(O| \mu)= \sum _{i=1}^N \alpha_T(i)$ ,于是复杂度为 $O(N^2T)$
在这里插入图片描述

2.4.2 问题二(decoding problem)

解码问题就是，已知observed state, 求最有可能的hidden state,即
$\argmax_{X} P(X|O)$

【算法2】viterbi 算法
令 $\delta_t(j)= \max _{x_1,...x_{t-1}}p(x_1,...,x_{t-1},x_t=j,o_1,...o_t)$
它代表了一个最大概率，如下图所示：
求 $\argmax_{X} P(X|O)$ 等价于求 $\argmax_{X} P(X,O)$ 等价于求 $\argmax_{j} \delta_T(j)$
递推公式：
$\delta_{t+1}(j) = \max_j \delta_t(i)a_{ij}b_{j o_{t+1}}$
意思是，每个时刻的前一个时刻一定是概率最大的，在当前时刻也应该选择一个使概率最大的隐藏状态j。这样一步步把使得概率最大的隐藏状态记录下来，就是最后的结果。

2.5 HMM的应用

语音识别
$\bigstar$ 汉语拼音转汉字
(我大二的时候居然还写过这个，我可真厉害！要好好回忆一下细节…)
POS (part of speech) tagging

全部评论 (0)

还没有任何评论哟~

机器学习 - 隐马尔科夫模型(Hidden Markov Model)

1\.马尔可夫模型下面介绍几个马尔可夫模型中的重要概念： 1.1一阶马尔可夫假设firstorderMarkovassumption n时刻的观测值只依赖于n1时刻的观测值，即： pxnxn1,xn...

机器学习笔记6 －－隐马尔科夫模型 Hidden Markov Model

TableofContents 问题域为什么HMM可以解决NLP问题 HMM基于两个假设模型训练三组参数三个基本问题问题域概率模型将学习任务归结于计算变量的概率分布，其核心是如何基于可观测...

HHM(Hidden Markov Model)-隐式马尔科夫模型

HHMHiddenMarkovModel隐式马尔科夫模型隐式马尔科夫模型是通过对观察序列的观测推导出隐藏状态。举例说明，由于本人是在十一小长假写下该篇文章，因此就拿小长假的出行计划介绍该算法，通常本...

.【机器学习】隐马尔可夫模型（Hidden Markov Model，HMM）

概率图模型是一种用图形表示概率分布和条件依赖关系的数学模型。概率图模型可以分为两大类：有向图模型和无向图模型。有向图模型也叫贝叶斯网络，它用有向无环图表示变量之间的因果关系。无向图模型也叫马尔可夫网络...

隐马尔可夫模型 Hidden Markov Model

文章目录 HiddenMarkovModel隐马尔可夫模型概念概率计算前向算法后向算法学习基于极大似然估计基于EM算法 E步 M步 HiddenMarkovModel隐马尔可夫模型隐马...

隐马尔可夫模型（Hidden Markov Model）

隐马尔可夫模型（HiddenMarkovModel） 1、简介隐含马尔可夫模型一直被认为是解决大多数自然语言处理问题最为快速、有效的方法。 2、马尔可夫假设随机过程中各个状态St的概率分布，...

隐马尔可夫模型（Hidden Markov Model）

隐马尔可夫模型（HMM）简述一下HMM：参考资料：《统计学习方法》李航隐马尔可夫模型（HiddenMarkovModel，HMM）描述由隐藏的马尔可夫链随机生成观测序列的过程，属于生成模型。

隐马尔可夫模型(Hidden Markov Model，HMM)

文章目录 1\.引言 2\.HMM变量 3\.HMM的结构 4\.HMM的参数 5\.HMM的生成步骤 1\.引言隐马尔可夫模型是结构最简单的动态贝叶斯网络。是一种有向图模型，主要用于时序数据建模，...

隐马尔可夫模型（Hidden Markov Model, HMM）

隐马尔可夫模型的定义 1.组成部分状态集合Q：所有可能的隐藏状态集合，记为Q=\q1,q2,...,qN\。这些状态是我们无法直接观测到的。例如：生活例子：你在一周中每天的真实心情状态（高兴、平静、...

隐马尔可夫模型（hidden Markov model, HMM）

注：参考李航统计学习方法。该模型是可用于标注问题的统计学习模型，描述由隐藏的马尔可夫链随机生成观测序列的过程，属于生成模型（建立样本的概率密度模型）。另外提下判别式模型是对条件概率建模。

是否确定退出登录?

机器学习 - 隐马尔科夫模型(Hidden Markov Model)

1. 马尔可夫模型

1.1 一阶马尔可夫假设 (first order Markov assumption)

1.2 转移概率

1.3 时不变性

2.隐马尔科夫模型

2.1 引入问题

2.2 图像化表示

2.3 形式化表示

2.4 HMM 能解决的问题

2.4.1 问题1(estimation problem)

2.4.1.1 Solution1

2.4.1.2 前向算法 (Forward Algorithm)

2.4.2 问题二(decoding problem)

2.5 HMM的应用

全部评论 (0)

相关文章推荐

机器学习 - 隐马尔科夫模型(Hidden Markov Model)

机器学习笔记6 －－ 隐马尔科夫模型 Hidden Markov Model

HHM(Hidden Markov Model)-隐式马尔科夫模型

.【机器学习】隐马尔可夫模型（Hidden Markov Model，HMM）

隐马尔可夫模型 Hidden Markov Model

隐马尔可夫模型（Hidden Markov Model）

隐马尔可夫模型（Hidden Markov Model）

隐马尔可夫模型(Hidden Markov Model，HMM)

隐马尔可夫模型（Hidden Markov Model, HMM）

隐马尔可夫模型（hidden Markov model, HMM）

机器学习笔记6 －－隐马尔科夫模型 Hidden Markov Model