隐马尔科夫模型（HMM）及其实现

阅读量：

马尔科夫模型

马尔科夫模型是单重随机过程，是一个2元组：(S,A)。

其中S是状态集合，A是状态转移矩阵。

只用状态转移来描述随机过程。

马尔科夫模型的2个假设

有限历史性假设：t+l时刻系统状态的概率分布只与t时刻的状态有关，与t时刻以前的状态无关；

齐次性假设：从t时刻到t+l时刻的状态转移与t的值无关。

以天气模型为例

天气变化有3中状态S:{1(阴),2（云）,3（晴）}

图片来自网络

则状态转移矩阵A:
![](http://latex.codecogs.com/gif.latex?A = \left\[%20%7b\begin%7barray%7d%7b*%7b20%7d%7bc%7d%7d%7b0.4%7d&%7b0.3%7d&%7b0.3%7d\ %7b0.2%7d&%7b0.6%7d&%7b0.2%7d\ %7b0.1%7d&%7b0.1%7d&%7b0.8%7d\end%7barray%7d%7d%20\right])

这样，只要知道的初始状态概率向量，就能预测接下来每天的天气了。

隐马尔科夫模型

隐马尔科夫模型是双重随机过程，是一个5元组：
$\lambda \left( {S,V,A,B,\pi } \right)$

V是输出集合。
$B = \left{ {{b_j}\left( k \right)} \right}$

表示在状态 j 时输出 k 的概率。
$\pi$ 是初始状态概率。

用状态转移和输出概率一起来描述随机过程。

以扔硬币模型为例

有个小孩手上拿着3个各不相同，也正反不均匀的硬币。他每次随机抽取1个硬币扔，扔了很多次（比如10次），他并不告诉你他每次抽中的是哪个硬币。但是他会告诉你每次的正反结果：正正反正反正正正……

在这个问题中，我们知道观察序列（硬币的正反），但是小孩手上硬币类型的变换序列被隐藏起来了，我们不知道小孩每次拿的哪个硬币扔，因此是双重随机过程。这就隐马尔科夫过程。

这里假设模型参数已知：

复制代码

    A=[0.90.05 0.05;0.45 0.1 0.45;0.45 0.45 0.1];
    B=[0.50.75 0.25;0.5 0.25 0.75];
    Pi=[1/31/3 1/3]';

隐马尔科夫模型的3个问题

1.【概率问题】给定上述模型，观察到[正正反]的概率是多少？

复制代码

    O=[11 2];

2.【预测问题】给定上述模型，如果观察到上述结果，最可能的硬币转换序列（状态转换序列）是什么？

3.【学习问题】不告诉你模型参数，如何根据观察序列得到它们？

【概率问题】

1.向前算法

向前变量：给定模型，在时刻t，状态为i，且之前的观察序列如下的概率。
${\alpha _t}\left( t \right) = P\left( {{o_1}{o_2}{o_3} \ldots {o_t},{q_t} = i\left| \lambda \right.} \right)$

显然有
![](http://latex.codecogs.com/gif.latex?\begin{array}{l}\begin{array}{*{20}{c}}{{\alpha _1}\left( i \right) = {\pi _i}{b_i}\left( {{o_i}} \right)}&{\left( {1 \le i \le N} \right)}\end{array}\\ \begin%7barray%7d%7b*%7b20%7d%7bc%7d%7d%7b%7b\alpha%20_%7bt%20+%201%7d%7d\left%28%20j%20\right%29%20=%20\left $%20%7b\sum\limits_%7bi%20=%201%7d^N%20%7b%7b\alpha%20_t%7d\left%28%20i%20\right%29%7ba_%7bij%7d%7d%7d%20%7d%20\right$ %7bb_j%7d\left%28%20%7b%7bo_%7bt%20+%201%7d%7d%7d%20\right%29%7d&%7b1%20\le%20t%20\le%20T%20-%201,1%20\le%20j%20\le%20N%7d\end%7barray%7d\end%7barray%7d)

复制代码

    Alpha=zeros(3,N);
    Beta=zeros(3,N);
    Lambda=zeros(3,N);
     
    Alpha(:,1)=B(O(1),:)'.*Pi;
    Delta=Alpha;
    fori=2:N
    Alpha(:,i)=A'*Alpha(:,i-1).*B(O(i),:)';
    end
    Q1_1=sum(Alpha(:,N));

输出

复制代码

    Alpha=
    0.166666666666667      0.150000000000000      0.0867187500000000
    0.250000000000000      0.0531250000000000    0.00683593750000000
    0.0833333333333333    0.0322916666666667    0.0259765625000000
     
    Q1_1=0.119531250000000

2.向后算法

向后变量：给定模型，在时刻t，状态为i，且之后的观察序列如下的概率。
${\beta _t}\left( i \right) = P\left( {{o_{t + 1}}{o_{t + 2}} \ldots {o_T}\left| {{q_t} = i,\lambda } \right.} \right)$

显然有
![](http://latex.codecogs.com/gif.latex?\begin{array}{l}\begin{array}{*{20}{c}}{{\beta _T}\left( i \right) = 1}&{\left( {1 \le i \le N} \right)}\end{array}\\ \begin%7barray%7d%7b*%7b20%7d%7bc%7d%7d%7b%7b\beta%20_t%7d\left%28%20i%20\right%29%20=%20\sum\limits_%7bj%20=%201%7d^N%20%7b%7ba_%7bij%7d%7d%7bb_j%7d\left%28%20%7b%7bo_%7bt%20+%201%7d%7d%7d%20\right%29%7b\beta%20_%7bt%20+%201%7d%7d\left%28%20j%20\right%29%7d%20%7d&%7b1%20\le%20t%20\le%20T%20-%201,1%20\le%20j%20\le%20N%7d\end%7barray%7d\end%7barray%7d)

复制代码

    Beta(:,N)=ones(N,1);
    fori=N:-1:2
       Beta(:,i-1)=bsxfun(@times,A,B(O(i),:))*Beta(:,i);
    end
    Q1_2=sum(Pi.*B(1,:)'.*Beta(:,1));

输出

复制代码

    Beta=
    0.252187500000000      0.500000000000000      1
    0.202968750000000      0.587500000000000      1
    0.321093750000000      0.412500000000000      1
     
    Q1_2=0.119531250000000

【预测问题】

Viterbi算法

Viterbi变量：给定模型，在时刻t，状态为i，观察到的最佳转换序列为的概率。
${\delta _t}\left( i \right) = \mathop {\max }\limits_{{q_1},{q_2}, \ldots ,{q_{t - 1}}} P\left( {{q_1}{q_2} \ldots {q_{t - 1}},{q_t} = i,{o_1}{o_2} \ldots {o_t}\left| \lambda \right.} \right)$

显然有
![](http://latex.codecogs.com/gif.latex?\begin{array}{l}\begin{array}{*{20}{c}}{{\delta _1}\left( i \right) = {\pi _i}{b_i}\left( {{o_i}} \right)}&{1 \le i \le N}\end{array}\\ \begin%7barray%7d%7b*%7b20%7d%7bc%7d%7d%7b%7b\delta%20_%7bt%20+%201%7d%7d\left%28%20j%20\right%29%20=%20\left $%20%7b\max%20%7b\delta%20_t%7d\left%28%20i%20\right%29%7ba_%7bij%7d%7d%7d%20\right$ %7bb_j%7d\left%28%20%7b%7bo_%7bt%20+%201%7d%7d%7d%20\right%29%7d&%7b1%20\le%20i%20\le%20N%7d\end%7barray%7d\end%7barray%7d)

这里需要把最佳路径记录下来
${\Psi _t}\left( j \right) = \arg \mathop {\max }\limits_{1 \le i \le N} \left[ {{\delta _{t - 1}}\left( i \right){a_{ij}}} \right$

复制代码

    Q2=zeros(1,N);
    fori=2:N
    Delta(:,i)=max(bsxfun(@times,A,Delta(:,i-1)))'.*B(O(i),:)';
       [~,Lambda(:,i)]=max(bsxfun(@times,A,Delta(:,i-1)));
    end
    [~,Q2(N)]=max(Delta(:,N));
    fori=N:-1:2
    Q2(i-1)=Lambda(Q2(i),i);
    end

输出

复制代码

    Delta=
    0.166666666666667      0.0750000000000000    0.0337500000000000
    0.250000000000000      0.0281250000000000    0.00316406250000000
    0.0833333333333333    0.0281250000000000    0.00949218750000000

最优序列

复制代码

    1     1     1

【学习问题】

1.有监督模式

在有大量标签数据下，直接用频率近似概率参数即可。

2.无监督模式

Baum-Welch算法

定义变量：在给定模型和观察序列O，在t时刻状态为i，在t+1时刻状态为j的概率
![](http://latex.codecogs.com/gif.latex?\begin{array}{l}{\xi _t}\left( {i,j} \right) = P\left( {{q_t} = i,{q_{t + 1}} = j\left| {O,\lambda } \right.} \right)\\ %20=%20%7b%7b%7b\alpha%20_t%7d\left%28%20i%20\right%29%7ba_%7bij%7d%7d%7bb_j%7d\left%28%20%7b%7bo_%7bt%20+%201%7d%7d%7d%20\right%29%7b\beta%20_%7bt%20+%201%7d%7d\left%28%20j%20\right%29%7d%20\mathord%7b\left/%20%7b\vphantom%20%7b%7b%7b\alpha%20_t%7d\left%28%20i%20\right%29%7ba_%7bij%7d%7d%7bb_j%7d\left%28%20%7b%7bo_%7bt%20+%201%7d%7d%7d%20\right%29%7b\beta%20_%7bt%20+%201%7d%7d\left%28%20j%20\right%29%7d%20%7b\sum\limits_%7bi%20=%201%7d^{N%20%7b\sum\limits_%7bj%20=%201%7d}N%20%7b%7b\alpha%20_t%7d\left%28%20i%20\right%29%7ba_%7bij%7d%7d%7bb_j%7d\left%28%20%7b%7bo_%7bt%20+%201%7d%7d%7d%20\right%29%7b\beta%20_%7bt%20+%201%7d%7d\left%28%20j%20\right%29%7d%20%7d%20%7d%7d%7d%20\right.%20\kern-\nulldelimiterspace%7d%20%7b\sum\limits_%7bi%20=%201%7d^{N%20%7b\sum\limits_%7bj%20=%201%7d}N%20%7b%7b\alpha%20_t%7d\left%28%20i%20\right%29%7ba_%7bij%7d%7d%7bb_j%7d\left%28%20%7b%7bo_%7bt%20+%201%7d%7d%7d%20\right%29%7b\beta%20_%7bt%20+%201%7d%7d\left%28%20j%20\right%29%7d%20%7d%20%7d%7d\end%7barray%7d)

令
${\gamma _t}\left( i \right) = \sum\limits_{j = 1}^N {{\xi _t}\left( {i,j} \right)}$

则关于模型参数的一种估计方法为
![](http://latex.codecogs.com/gif.latex?\begin{array}{l}\overline {{\pi _i}} = {\gamma _1}\left( i \right)\\ \overline%20%7b%7ba_%7bij%7d%7d%7d%20%20=%20%7b%7b\sum\limits_%7bt%20=%201%7d^{%7bT%20-%201%7d%20%7b%7b\xi%20_t%7d\left%28%20%7bi,j%7d%20\right%29%7d%20%7d%20\mathord%7b\left/%20%7b\vphantom%20%7b%7b\sum\limits_%7bt%20=%201%7d}%7bT%20-%201%7d%20%7b%7b\xi%20_t%7d\left%28%20%7bi,j%7d%20\right%29%7d%20%7d%20%7b\sum\limits_%7bt%20=%201%7d^{%7bT%20-%201%7d%20%7b%7b\gamma%20_t%7d\left%28%20i%20\right%29%7d%20%7d%7d%7d%20\right.%20\kern-\nulldelimiterspace%7d%20%7b\sum\limits_%7bt%20=%201%7d}%7bT%20-%201%7d%20%7b%7b\gamma%20_t%7d\left%28%20i%20\right%29%7d%20%7d%7d\ \overline%20%7b%7bb_j%7d%7d%20\left%28%20k%20\right%29%20=%20%7b%7b\sum\limits_%7bt%20=%201%7d^{T%20%7b\left%7b%20%7b%7b\gamma%20_t%7d\left%28%20j%20\right%29%7d%20\right%7d\left|%20%7b_%7b%7bo_t%7d%20=%20%7bv_k%7d%7d%7d%20\right.%7d%20%7d%20\mathord%7b\left/%20%7b\vphantom%20%7b%7b\sum\limits_%7bt%20=%201%7d}T%20%7b\left%7b%20%7b%7b\gamma%20_t%7d\left%28%20j%20\right%29%7d%20\right%7d\left|%20%7b_%7b%7bo_t%7d%20=%20%7bv_k%7d%7d%7d%20\right.%7d%20%7d%20%7b\sum\limits_%7bt%20=%201%7d^{T%20%7b%7b\gamma%20_t%7d\left%28%20j%20\right%29%7d%20%7d%7d%7d%20\right.%20\kern-\nulldelimiterspace%7d%20%7b\sum\limits_%7bt%20=%201%7d}T%20%7b%7b\gamma%20_t%7d\left%28%20j%20\right%29%7d%20%7d%7d\end%7barray%7d)

欢迎参与讨论并关注本博客和微博以及知乎个人主页后续内容继续更新哦~

转载请您尊重作者的劳动，完整保留上述文字以及文章链接，谢谢您的支持！

全部评论 (0)

还没有任何评论哟~

隐马尔科夫模型（HMM）及其实现

马尔科夫模型马尔科夫模型是单重随机过程，是一个2元组：S,A。其中S是状态集合，A是状态转移矩阵。只用状态转移来描述随机过程。马尔科夫模型的2个假设有限历史性假设：t+l时刻系统状态的概率分...

隐马尔科夫模型（HMM）

目录参考 1\.背景 1.1数理统计学两大派 1.2概率图 2\.HMM 2.1一个模型，两个假设，三个问题 2.2Evaluation问题（1）前向（2）后向 2.3Learning问题 2....

隐马尔科夫模型(HMM)

基本概念 1MarkovModels 2HiddenMarkovModels 3概率计算算法前向后向算法 131直接计算 132前向算法 133后向算法 4学习问题BaumWelch算法也就是EM算法...

HMM隐马尔科夫模型

对于这些模型的介绍我打算从以下几个部分来写： 1：模型的基本概念 2：模型是如何应用于nlp当中的 3：相关论文 4：代码实现 HMM是隐马尔科夫模型的简称，这个模型的结构可以直接由下面的图来表示：其...

隐马尔科夫模型(HMM)

今天来看看这两种模型。一、马尔科夫模型有以下三个要素：定义每一种状态；每种状态转换到其它状态的概率，即状态转换概率；每种状态的初始概率；这样，通过初始状态，便能计算下一个阶段某状态发生的概...

HMM隐马尔科夫模型

对HMM做概述，主要摘抄自《统计学习方法》，概率计算为主，对学习和预测算法暂时忽略。最后补充一些HMM在地图匹配上的应用 1.HMM 定义和理解隐马尔可夫模型HiddenMarkovModel，标...

HMM隐马尔科夫模型

隐马尔可夫模型马尔科夫性质描述的是客观世界中可能存在的一类现象，其未来的性质由现在条件决定的程度，关于过去的知识丝毫不影响这种决定性。马尔科夫的概率模型从根本上否定了系统中任意状态与其初始状态之间的...

Python隐形马尔科夫实战_python实现隐马尔科夫模型HMM

一份完全按照李航<介绍的HMM代码，供大家参考，具体内容如下 coding=utf8 ''''' Createdon201785 里面的代码许多地方可以精简，但为了百分百还原公式，就没有精简了。

隐马尔科夫模型HMM（一）HMM模型

隐马尔科夫模型HMM（一）HMM模型一、概述隐马尔可夫模型HiddenMarkovModel，HMM是统计模型，包含观察状态和帮助确定观察状态的隐藏状态。它用来描述一个含有隐含未知参数的马尔可夫过...

隐马尔科夫模型HMM（一）HMM模型

什么样的问题需要HMM模型首先我们来看看什么样的问题解决可以用HMM模型。使用HMM模型时我们的问题一般有这两个特征：１）我们的问题是基于序列的，比如时间序列，或者状态序列。

是否确定退出登录?

隐马尔科夫模型（HMM）及其实现

全部评论 (0)

相关文章推荐

隐马尔科夫模型（HMM）及其实现

隐马尔科夫模型（HMM）

隐马尔科夫模型(HMM)

HMM隐马尔科夫模型

隐马尔科夫模型(HMM)

HMM隐马尔科夫模型

HMM隐马尔科夫模型

Python隐形马尔科夫实战_python实现隐马尔科夫模型HMM

隐马尔科夫模型HMM（一）HMM模型

隐马尔科夫模型HMM（一）HMM模型