MATLAB语音信号处理
题目:MATLAB数字语音识别系统
- 课题介绍
本研究采用基于MATLAB的HMM算法进行语音信号识别,并能够实现对0至9这十个阿拉伯数字的判断。该设计包含一个功能完善的人机交互界面,并运行高效的特征提取程序。算法流程如下:首先展示原始波形图并记录其基本参数信息;接着聚焦于语音结束处的放大波形图并提取相关特征;随后计算短时能量值并对数据进行预处理;之后设定门限阈值并完成端点检测过程;最后输出检测结果供参考使用。同时可引入噪声干扰测试,并比较加噪情况下的识别准确率。作为第一步研究内容,在后续工作中计划将其扩展为一个电话拨号音识别系统,并采用九宫格布局进行二次开发。
- 界面


- 源码
- 读取语音
global filep filename
[filename,filepath]=uigetfile('*.wav','选择音频文件');
filep=strcat(filepath,filename);
[y1,fs1]=wavread(filep);
namen3=filename;
D = dir(filep);
set(handles.edit1,'string',num2str(namen3));
name列表初始化为四个字段信息数组;第一个字段为文件路径信息;第二个字段为number转换函数作用于filep变量;第三个字段设置为10;第四个字段为文件名信息;第五个字段为number转换函数作用于D.name变量;第六个字段设置为10;第七个字段为采样速率信息;第八个字段为number转换函数作用于fs1变量;第九个字段设置为10;第十个字段为文件大小信息;第十一个字段表示D存储的bytes数量;第十二个字段设置为10
set(handles.listbox1,'string',namen4);
axes(handles.axes1);
plot(y1);
namen='原始语音信号';
set(handles.text2,'string',num2str(namen));
- 语音的播放
global filep
[filex,fs]=wavread(filep);
sound(filex,fs);
- 识别
global filep hmm
load hmm.mat
[x,fs]=wavread(filep);
[x1,x2]=vad(x,fs);
O = mfcc(x);
for j=1:10
pout(j) = viterbi(hmm{j}, O);%调用自定义的子函数viterbi.m
end
[d,n] = max(pout);
set(handles.edit5,'string',c);
guidata(hObject, handles);
- 识别率的计算
a=zeros(1,30);b=[zeros(1,3),ones(1,3),2ones(1,3),3ones(1,3),4ones(1,3),5ones(1,3),6ones(1,3),7ones(1,3),8ones(1,3),9ones(1,3)];
for i=1:30
fname = sprintf('test1\ %d.wav',i);
[k,fs]=wavread(fname);
M=handles.M;
y = awgn(k,M,'measured');%此为加噪声函数,第二个参数是噪声值。
[x1,x2]=vad(y,fs);
O = mfcc(y);
O = O(x1:x2-5,:);
for j=1:10
pout(j) = viterbi(hmm{j}, O);
end
[d,n] = max(pout);
a(1,i)=n-1;
end
z=a-b;
d=sum(z==0);
e=d/30;
% fprintf('识别率为%d\n', e);
set(handles.edit4,'string',num2str(e));
guidata(hObject,handles);
