Advertisement

统计信号处理知识点总结_常用信号特征提取方法总结(完善中...)

阅读量:
3fc66f7de7de62d9f9f7dc03052ae88c.png

由于最近专注于信号处理相关领域,并为了深入分析一维信号处理技术而展开调研工作。经过较为全面的文献调研之后,并对相关技术进行了深入探讨与总结:供各位参考

时域常见的特征指标有:

波形指标:

脉冲指标:

峭度指标:

裕度指标:

峰峰值:

过零率:

29f981aca050ba68b30ad298695f15e9.png

短时能量:

3bbf4bb7ba45a6caa18e145ad5555fc8.png

短时自相关函数:

fb5d665023c6cc37a80a3356235df921.png

短时平均幅度差:

假设x是加窗截断后的信号,短时平均幅度差定义:

fd62d2b94dcfc5ddc2958e84574a4b57.png

理论研究:在声音规律性方面,在稳定噪声环境下通过短时间平均幅度差异能够更加清晰地识别或检测其规律性。

code:

取一帧信号,计算短时平均幅度差:

u被赋值为X中的某一帧信号;然后循环变量k从1开始一直到wlen;在每一个k值下计算向量amdvec中的第k个元素等于所有样本间距离之和:即对于每一个样本位置k到末尾的位置与前面位置的距离之和;最后结束循环。

在本节中所涉及的前四个内容均属于信号的时域分析。
主要针对音频信号的研究通常采用时频域方法,并且可以通过tftb-0.2工具包进行具体实现

常用的有STFT(短时傅里叶变换)、小波变换、ST、W-V变换,以线性调频信号为例:

左图最下面为合成信号,右图为四种变换对合成信号进行的时频分析。

d80a59655b6d35c1923841e4838d6731.png

本研究仅针对**短时傅里叶变换(Short time fourier transform, STFT)**这一技术展开分析。

又因为实数信号的傅里叶变换具有共轭对称性特性 ,通常只需分析频域的一半信息 即可完成整个频谱的描述。

为什么要进行STFT呢,原因按我的理解可能有两点:

传统傅里叶变换(FFT)仅能反映信号的频域特性,在时域上也只能观察到时域特性,并且都是基于单一维度的表现;如果要实现二维联合时频分析,则可以使用短时傅里叶变换(STFT)。
语音信号表现为非平稳特性和动态变化特征;在实际应用中通常需要计算相关矩阵作为特征提取的重要手段;理论上这涉及到均值估计的形式;然而由于实际采集的数据量有限性以及复杂环境的影响;通常情况下无法直接获得真实的概率密度分布情况;而是需要通过数据近似的方法来进行估算。

2b2642c22683d7dd5bf0a3f4ba546fdf.png

这个式子可用来近似相关矩阵,并需满足两个条件:其一为信号呈现局部平稳性质(即在短暂时间段内维持稳定状态),这样才能使相应的统计特性得以保持一致;其二则要求信号需具备遍历性特征(即可以通过有限观测数据准确反映整体统计行为)。值得注意的是虽然语音信号本身具有非平稳性质直接计算相关矩阵在理论上缺乏依据而且会带来误导性结论但语音信号由于变化速度较慢在短期内(例如20至30毫秒)可被视为局部平稳现象在此基础上既满足平稳性的假设又具备遍历性的特点因此我们可以通过分帧处理将原始信号划分为多个稳定区间并针对每个分帧段进行频域分析从而得到短时傅里叶变换结果

信号分帧的code:

计算得到N_{\text{frame}}的值为\left\lfloor \frac{\text{length}(x)-w_{\text{len}}}{n_{\text{step}}} \right\rfloor + 1
设置循环次数为N_{\text{frame}}次。
对于每个循环变量k(其中k \in [0, N_{\text{frame}}-1]),计算每个子块的起始索引\text{idx}
将对应的子块赋值给x_{\text{frame}}

加窗截断分帧的示意图:

943960de7deed2c24f24056d5539b10a.png

为什么要设置帧移量?或者说两帧之间的重叠部分有什么作用?通过观察中间图可以看出,在加窗操作后相邻两帧在两端区域的变化幅度较大。对于两端区域的变化幅度较大等情况而言,通常会采用插值处理以达到平滑效果。实际上,在这一操作过程中完成的正是所谓的"帧移"操作。

频域指标有:

重心频率:

均方频率:

均方根频率:

频率方差:

频率标准差:

短时功率谱密度:

谱熵:

基频:

共振峰:

特征变换方法:

1、FFT:

2、非参数功率谱(周期图法,韦尔奇法):

3、参数功率谱估计法(Burg,yale-worker AR):

4、短时傅里叶变换方法:

滑动窗口傅里叶变换(Short Time Fourier Transform, STFT)理论基础及Python代码实现

9bdaf3b6dd88f75bb8313a18df1df7d2.png

5、小波变换:

小波变换设计知识点过多,本人也看了很久。。。推荐一下写得比较好的文章

这里 是一篇详细的博客文章。
这里 提供了相关的技术讨论。

6、希尔伯特-黄变换

具体内容可查看链接,写得非常详细具体。

7、MFCC(梅尔倒谱系数)

8、Wigner 分布(WDF)

9、Radon 变换

10、加伯变换(Gabor transform)

推荐一个音频信号分析工具:

pyAudioAnalysis是一个音频处理工具包,主要功能如图:

18174599a9336706f9e31b735e0343fc.png

其中Feature Extraction包括(顺序有先后):

3e8dff478fa4ef6961d2213c81310e24.png

这儿有一篇博客写得非常全面,推荐:

音频特征提取--pyAudioAnalysis工具包 - 桂。 - 博客园​www.cnblogs.com

ffc740d0298c312e48b0373d5a24f35f.png

GitHub项目链接地址:

tyiannak/pyAudioAnalysis​github.com

53ffaa47c419c453711a6366fed1443a.png

引用:

全部评论 (0)

还没有任何评论哟~