嵌入式实时音乐语音识别系统的实现
图3 端点检测流程图
2.3语音特征参数提取
语音识别参数的提取较多,由于噪声的的存在,考虑音乐语音识别系统的对识别的精度要求较高,本系统采用了经典的美尔频标倒谱参数MFCC[4],MFCC参数建立在 Fourier 频谱分析的基础上,它的核心思想是利用人耳的感知特性,在语音的频谱范围内设置若干个带通滤波器,每个滤波器具备三角或者正弦的形滤波特性,计算相应滤波器组的信号能量,再通过 DCT 计算对应的倒谱系数,
图4 MFCC参数求取过程
2.4语音信号的训练与识别
音乐语音识别系统是一个专业性很强的词汇量较小的语音识别系统,由于识别的速度要求较快,乐音中的词汇量较少,通常情况下人声能唱到的乐音的范围只有几十个(一般在4个八度以内)。本系统采用采用了计算相对简单而有效的DTW算法来进行语音识别。该算法基于动态规划的思想,将语音信号的每一帧信号的特征参数提取出来,就转化成了一组特征向量。语音识别就是要将这个特征向量同模板库中已存的语音特征向量(参考模板)进行模板匹配,寻找距离最短的模板。语音识别需要语音模板库的建立,也就是语音模型的训练。参照音乐语音音高频率对照表,我们只对人声范围(60HZ-1000HZ即乐音中音名从C- )共四个八度32个音高进行训练,针对每首曲子中音高的范围都是在一定范围以内的,所以往往我们训练训练塑封电感器的样本更少,较小的词汇量使乐音识别的速度绕行电感得到大大提高。
3实验结果与分析
我们对系统的识别性能进行了测试。由6个测试者(3男3女音乐专业人士)在安静室内环境下,选择方向性较好的麦克风,进行测试实验。由于男生和女生一般能发塑封电感音的音高不一样,一般男生比女生偏低,首先让6位测试者对照音名表把他(她)能发的音的全部录音、训练,再随机选择几首曲子进行测试,实验结果表明, 在对特定人的乐音识别中,由于女生发音口齿比较清晰,男生比较发音浑厚,男生的正确识别率在95%以上,女生的正确识别率在97%以上,平均正确识别率在96%以上,满足实用化要求。
4结 论
本文介绍了一种基于DSP的嵌入式音乐语音识别系统的软硬件系统。在传统的语音识别方法上结合音乐语音的特点作了一些改进,叙述了音乐语音识别系统硬件结构、软件流程,采用了一种基于多频段能量曲线分割结合过零率来检测端点的新方法,简化了运算量,进一步提高了识别性能,把语音识别技术很好的用在电子音乐方面,实现了嵌入式实时音乐语音识别,实验结果表明,本系统精度高,基本能满足实用化需求。
本文作者创新点铁氧体电感:
(1)把语音识别方法应用于电子音乐方面,设计并实现专业的音乐语音识别软硬件系统,巧妙采用了滤波、消除毛刺等预处理方法,训练了专业的音乐语音样本,提高语音识别精度。
(2)建立了一种基于多频段能量曲线分割结合过零率来检测端点的新方法,在保证不错分的情况下,提高了语音分割的正确率,同时结合过零率的门限,提高了端点检测的精度。
问题少年,进来看看能不能帮上忙!!谢谢(lm311)用正弦波和三角波通过lm311p比较出spwm波,仿真出的二图的波形,但是按仿真图焊的板子,前面都出了,当给lm311供电的时候,输入波形就会没有,不知道这是为什么,正负输入电压大约为2v,
双向数字式微型无线内窥镜系统技术本文提出了一种全新的数字化的双向微型无线内窥镜系统, 该系统具有可实时观察病人消化道图像、全消化道检查、提供三维深度图像数据等功能。对消化道疾病的检查, 目前最常用和最直接有效的方法就是内窥镜检查,
基于DSP的数字预失真系统设计摘要:为提高无线通信系统的通信质量与效率,提出一种基于DSP自适应数字预失真技术的系统设计。采用TI公司的低功耗、高性能数字信号处理器TMS320VC5502,有效提高了信号处理速度,减少了回路延时。