Advertisement

python音频特征提取_Python音频特征提取(MFCC, IMFCC, GFCC, LFCC, PNCC ...)

阅读量:

初入音频领域的人通常需要先掌握音频特征提取的方法之前才能进一步开展其他相关工作。然而掌握音频处理技术则涉及语音信号处理的各种知识点(如傅里叶变换、离散余弦变换以及小波变换等)。由于我对这些技术还知之甚少。

但是Python成百上千的第三方库为用户提供了很多预设功能模块,从而使得数据提取变得更加便捷,常见的库包括librosa、numpy等...,但目前的功能仍显不足,因为作为一个编程新手,对于编程知识感到陌生,实在抱歉...

该库进行了简要介绍(spafe)。该库实现了自动化特征提取,并提供了多种特征类型对应的jupyter notebook示例代码。

该库进行了简要介绍(spafe)。该库实现了自动化特征提取,并提供了多种特征类型对应的jupyter notebook示例代码。

spafe: 简化的Python音频功能提取

SPAFE专为简化音频中的特征提取而设计。 该库包含以下技术:MFCC、IMFCC、GFCC、LFCC、PNCC和PLP等技术。此外, 该库提供了一系列滤波器组模块(包括Mel滤波器组,Bark滤波器组和Gammatone滤波器组)以及其他与频谱相关的统计信息

Fbank, MFCC, BFCC, GFCC, LFCC, MSRCC, NGCC, PNCC, PSRCC feature extraction methods (many features are unfamiliar to me)

spafe库地址Welcome to spafe documentation!​spafe.readthedocs.io

安装极其简单: pip install spafe

获取不同特性的示例代码位置:提供了详细信息。

这个项目值得更多的Star!!!

以下是小补充:

范例程序中的fs, sig = scipy.io.wavfile.read("./test.wav")

建议采用以下代码进行处理:sig, fs = librosa.load("./test.wav", sr=16000)

全部评论 (0)

还没有任何评论哟~