语音信号处理（1）

阅读量：

#语音信号处理（1）
在语音增强与语音合成领域的深度学习应用中，作为整个系统的重要组成部分之一的语音预处理环节具有决定性作用，在此基础上就个人研究工作做一个简明扼要的总结。

语音的预处理

在对语音信号进行分析与处理之前，在此之前，则必须对其实施预加重处理、分块处理以及加窗处理等必要的预处理步骤。这些步骤的目的在于消除由于人类发声器官自身特性以及采集语音信号设备所导致的混叠失真以及高次谐波失真等现象所造成的干扰因素对语音信号质量的影响以及其它高频成分等干扰因素的影响

预加重

该技术旨在对语音信号中的高频段进行增强处理以减去唇部辐射影响从而提高语音细节。该过程通常通过采用一阶前向递归型数字滤波器来实现具体而言设第n时刻的语音采样值为x(n)经过处理后的输出结果为y(n)=x(n)-ax(n-1)其中a为预加重系数取值范围通常在0.9至1.0之间一般取值为0.98。

本人毕设中预加重的实现：`

复制代码

    def emphasis(signal_batch, emph_coeff=0.95, pre=True):
    """
    Pre-emphasis or De-emphasis of higher frequencies given a batch of signal.
    
    Args:
        signal_batch: batch of signals, represented as numpy arrays
        emph_coeff: emphasis coefficient
        pre: pre-emphasis or de-emphasis signals
    
    Returns:
        result: pre-emphasized or de-emphasized signal batch
    """
    result = np.zeros(signal_batch.shape)    #语音信号的batch_sized的shape用0填充
    for sample_idx, sample in enumerate(signal_batch): #enumerate()函数，同时列出数据和数据下标
        for ch, channel_data in enumerate(sample):#预加重公式y(n)=x(n)-ax(n-1)
            if pre:
                result[sample_idx][ch] = np.append(channel_data[0], channel_data[1:] - emph_coeff * channel_data[:-1])  #将channel_data[1:] - emph_coeff * channel_data[:-1]的值赋给channel_data[0]，得到一个新的列表
            else:
                result[sample_idx][ch] = np.append(channel_data[0], channel_data[1:] + emph_coeff * channel_data[:-1])
    return result

分帧

在整个语音分析过程中始终发挥关键作用的是“短时分析技术”。由于语音信号本身具有时间可变性，在短暂时间段内（通常取值范围为1030ms），其特性基本保持稳定状态即相对稳定，在此时间段内我们可以将其视为一个准稳态过程因此，在此时间段内我们可以将其视为一个准稳态过程即所谓的“短时平稳性”。基于这一理论基础任何语音信号的特征提取与处理都必须基于“短时域”这一前提条件即将整个语音信号划分为多个帧段后分别提取每段特征参数其中每个帧段的时间长度通常设定为1030ms这种划分方法能够有效反映声音信息随时间的变化规律从而实现对声音信息的有效捕捉与处理通过这种方法我们能够获得一段声音信息在其生命周期内各个时刻所具有的特征参数序列这正是本节研究的核心内容

复制代码

    def slice_signal(file, window_size, stride, sample_rate):
    """
    Helper function for slicing the audio file
    by window size and sample rate with [1-stride] percent overlap (default 50%).
    """
    wav, sr = librosa.load(file, sr=sample_rate)  #以16k进行采样，sr=None时默认为22050
    hop = int(window_size * stride)
    slices = []
    for end_idx in range(window_size, len(wav), hop):  #以百分之五十的帧移对语音切片
        start_idx = end_idx - window_size
        slice_sig = wav[start_idx:end_idx]
        slices.append(slice_sig)
    return slices

加窗

基于语音信号的短时平稳特性，在实际应用中我们通常会对信号进行分帧处理

参考博客：

全部评论 (0)

还没有任何评论哟~

语音信号处理（1）

语音信号处理（1）在基于深度学习的语音增强和语音合成中，语音的预处理部分是十分重要的，在此，结合自己的毕设做一个简单的总结。语音的预处理在对语音信号进行分析和处理之前，必须对其进行预加重、分帧、...

MATLAB语音信号处理（1）播放音视频

MATLAB语音信号处理（1）播放音视频前言一.MATLAB仿真二.仿真结果三.小结前言 MATLAB进行图像处理相关的学习是非常友好的，可以从零开始，对基础的图像处理都已经有了封装好的许多...

python语音信号处理_现代语音信号处理笔记 (一)

本系列笔记对胡航老师的现代语音信号处理这本书的语音处理部分进行总结，包含语音信号处理基础、语音信号分析、语音编码三部分。一开始以为三部分总结到一篇文章里就可以了，但写着写着发现事情并没有那么简单。。。...

MATLAB处理语音信号

一、实验项目名称语音信号的处理二、实验目的综合运用数字信号处理课程的理论知识进行频谱分析以及滤波器设计，通过理论推导得出相应结论，并进行计算机仿真，从而复习巩固了课堂所学的理论知识，提高了对所学...

语音信号处理-python

语音信号处理 1.语音信号的产生与特性我们要对语音进行分析，首先要提取能够表示该语音的特征参数，有了特征参数才可能利用这些参数进行有效的处理，在对语音信号处理的过程中，语音信号的质量不仅取决于处理方...

MATLAB语音信号处理

数字信号处理课设，我们使用MATLAB对语音信号进行了一系列处理，并将其所有功能集中于下图界面中：这个界面涉及功能众多，其中包括语音信号的观察分析、音色变换、AM调制解调、减抽样、加噪去噪、相频分析...

MATLAB语音信号处理

MATLAB语音信号处理系统主要内容运用matlab软件实现对声音的变声处理，利用离散付里叶变换进行频谱分析；设计数字滤波器组；通过时域和频域方法做出各种音效效果，实现变速（慢放、快放），变调（频...

MATLAB语音信号处理

题目：MATLAB数字语音识别系统课题介绍本设计为基于MATLAB的HMM语音信号识别，可以识别09十个阿拉伯数字，带有一个丰富的人机交互GUI界面。

MATLAB语音信号处理

题目：MATLAB数字语音识别系统课题介绍本设计为基于MATLAB的HMM语音信号识别，可以识别09十个阿拉伯数字，带有一个丰富的人机交互GUI界面。

语音信号处理之语音特征提取（1）机器学习的语音处理

本文首先是将SpeechProcessingforMachineLearning:Filterbanks,MelFrequencyCepstralCoefficientsMFCCsandWhat'sI...

是否确定退出登录?

语音信号处理（1）

语音的预处理

预加重

分帧

加窗

全部评论 (0)

相关文章推荐

语音信号处理（1）

MATLAB语音信号处理（1）播放音视频

python语音信号处理_现代语音信号处理笔记 (一)

MATLAB处理语音信号

语音信号处理-python

MATLAB语音信号处理

MATLAB语音信号处理

MATLAB语音信号处理

MATLAB语音信号处理

语音信号处理之语音特征提取（1）机器学习的语音处理