数字变声器设计方案(共15页).doc

上传人:飞****2 文档编号:14462207 上传时间:2022-05-04 格式:DOC 页数:15 大小:192KB
返回 下载 相关 举报
数字变声器设计方案(共15页).doc_第1页
第1页 / 共15页
数字变声器设计方案(共15页).doc_第2页
第2页 / 共15页
点击查看更多>>
资源描述

《数字变声器设计方案(共15页).doc》由会员分享,可在线阅读,更多相关《数字变声器设计方案(共15页).doc(15页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、精选优质文档-倾情为你奉上基于FFT算法的数字变声器河北北方学院宣化教学部 河北宣化 【摘 要】 本数字变声器是实现男声变女声和女声变男声以及变成童声的系统。设计本数字变声器的目的是锻炼自己的学习实践能力。通过matlab编写程序修改语音参数来实现男声女声之间的变换。【关键词】 变音算法 数字滤波器 语音信号 数字滤波器 频谱分析 MATLAB1 引言 变声器在现实生活中应用广泛,变声器是通过改变输入音频的音色、音调,并将变声后的音频输出的工具。根据变声器材质不同,变声器分为变声器硬件和变声器。变声器硬件,即通过硬件实现变声的工具;变声器,即通过软件实现变声的工具,软件类变声器,运行平台皆为。

2、无论是硬件变声器,还是变声器,其原理都是,通过改变输入声音频率,进而改变声音的音色、音调,使输出声音在感官上与原声音不同。我们每个人的声音不同,源于我们的每个人的音色和音调不同,我们所说的男中音、男高音,就是音调的不同,而即便音调一致,我们依然能区分出两个不同人的声音,或不同乐器的声音,这就是音色的不同。,正是借助对声音音色和音调的双重复合改变,实现输出声音的改变。我们这里的变声器就是matlab来实现变声。2 数字变声器的原理和算法发音方法,发音时,喉头、鼻腔节制气流的方式和状态,包括发音时构成阻碍和克服阻碍的方式,气流强弱的情况及声带是否振动等几个方面。人类语音可分为有380声语音和无声语

3、音,前者是由声带振动激励的脉冲信号经声腔调制变成不同的音,它是人类语言中元音的基础,声带振动的频率称为基频。无声语音则是声带保持开启状态,禁止振动引发的。一般来说,由声门振动决定的基频跟说话人的性别特征有关,如下表,而无声语音则没有体现这个特征。说话人的个性化音色和语音的另外一个声学参数共振峰频率的分布有关。儿童由于声道短,其共振峰频率高于成年人,成年女性的声道一般短于成年男性,所以女性的共振峰频率一般高于男性。本实验是基于男生录制的声音进行相关参数提取,修改接近于女声、童声、老人声,并实现了音调的高低与速度的快慢1.变声原理 在进行性别变声时,主要考虑基音周期、基频和共振峰频率的变化。基音周

4、期改变时,基频、共振峰同时变化,若伸展既有男变女、女变童,反之亦可。本实验是基于男生录制的声音进行相关参数提取,修改接近于女声,实现男声到女声的变换。 音段特征:描述的是语音的音色特征。特征参数主要包括基音频率、共振峰位置、共振峰带宽、基音频率、能量等。 超音段特征:描述的是语音的韵律特征。特征参数主要包括因素的时长、基音频率的变化(音调)、能量等 语言特征:包括习惯用语、方言、口音等。基音是指发浊音时声带振动所引起的周期性, 而基音周期是指声带振动频率的倒数。基音周期是语音信号最重要的参数之一, 它描述了语音激励源的一个重要特征。不同的人以及同一个人在不同的年龄时期有不同的基音周期。人唱歌时

5、,其基音频率范围大约是:童声高音频率范围为 260-880Hz ,低音频率范围为 196-700Hz ,女声高音频率范围为 220-1.1KHz, 低音频率范围为 200-700Hz ,男声高音频率范围为 160-523Hz 低音频率范围为 80-358Hz 。此外,基音的变化模式称为声调,它携带着非常重要的具有辨意作用的信息。先就如何实时地通过基音频率的变化来实现语声变声,进行讨论, Matlab实现算法。 男声 基频分布(hz):50180 共振峰频率分布:偏低人群 女声 基频分布(hz):160380 共振峰频率分布:中提取参数 (1 )语音时变傅里叶变换为:在低通滤波时,采用巴特沃斯。

6、(2) 构建巴特沃斯低通滤波器 根据人的说话特征设定相应指标参数,对本段语音设计算出巴特沃斯模拟滤波器的阶数,截止频率,归一化原型系统函数。 本段语音设计算出巴特沃斯模拟滤波器的阶数N为5,3dB截止频率,算出为0.175,归一化低通原型系统函数为:其中将带人中,得到低通滤波器,各种理想数字滤波器的幅度频率响应流程图3 数字变声器的软件实现与仿真结果代码部分选择音频文件filename,pathname=uigetfile(*.wav,ALL FILES,select voice file);if isequal(filename pathname,0,0) return;endstr=pat

7、hname filename;temp,Fs=audioread(str);temp1=resample(temp,80,441);handles.y1=temp;handles.y=temp1;handles.Fs=Fs;guidata(hObject,handles);原音播放c=handles.Fs;sound(handles.y1,c);plot(handles.axes1,handles.y1)title(handles.axes1,时域图);ysize=size(handles.y1);y1=fft(handles.y,length(handles.y1);ysize=size(y

8、1);plot(handles.axes2,abs(y1(1:ysize/2);xlabel(handles.axes2,频率);ylabel(handles.axes2,幅度);title(handles.axes2,频率特性);男声变女声FL=80;WL=240;P=10;x1=handles.y;fs=handles.Fs;x1=resample(x1(:,1),8000,fs);fs=8000;x1=x1+0.*randn(length(x1),1);x1=x1/max(x1);L=length(x1);FN=floor(L/FL)-2;exc=zeros(L,1);zi_pre=ze

9、ros(P,1);x1_rec=zeros(L,1);zi_rec=zeros(P,1);exc_syn=zeros(L,1);x1_syn=zeros(L,1);last_syn=0;zi_syn=zeros(P,1);exc_syn_t=zeros(L,1);x1_syn_t=zeros(L,1);last_syn_t=0;zi_syn_t=zeros(P,1);hw=hamming(WL);for n=3:FNx1_w=x1(n*FL-WL+1:n*FL).*hw;A E=lpc(x1_w,P);x1_f=x1(n-1)*FL+1:n*FL);exc1,zi_pre=filter(A,1

10、,x1_f,zi_pre);exc(n-1)*FL+1:n*FL)=exc1;x1_rec1,zi_rec=filter(1,A,exc1,zi_rec);x1_rec(n-1)*FL+1:n*FL)=x1_rec1;x1_Pitch=exc(n*FL-222:n*FL);PT=findpitch(x1_Pitch);G=sqrt(E*PT);PT1=floor(PT/2);poles=roots(A);deltaOMG=190*2*pi/8000;for p=1:10if imag(poles(p)0 poles(p)=poles(p)*exp(j*deltaOMG);elseif imag

11、(poles(p)0 ,poles(p) = poles(p)*exp(1i*deltaOMG); elseif imag(poles(p)0 ,poles(p) = poles(p)*exp(-1i*deltaOMG); end end A1=poly(poles); tempn_syn_t = (1:n*FL-last_syn_t); exc_syn1_t = zeros(length(tempn_syn_t),1); exc_syn1_t(mod(tempn_syn_t,PT1)=0) = G; %算出脉冲 exc_syn1_t = exc_syn1_t(n-1)*FL-last_syn

12、_t+1:n*FL-last_syn_t); s_syn1_t,zi_syn_t = filter(1,A1,exc_syn1_t,zi_syn_t); exc_syn_t(n-1)*FL+1:n*FL) = exc_syn1_t; %计算得到的合成激励 s_syn_t(n-1)*FL+1:n*FL) = s_syn1_t; %计算得到的合成语音 last_syn_t = last_syn_t+PT1*floor(n*FL-last_syn_t)/PT1); endsound(s_syn_t,Fs);plot(handles.axes1,s_syn_t)title (handles.axes1

13、,时域);ysize=size(s_syn_t);y=fft(s_syn_t,length(s_syn_t);ysize=size(y);plot(handles.axes2,abs(y);xlabel(handles.axes2,频率);ylabel(handles.axes2,振幅);title(handles.axes2,频域);仿真图形(1)男原声播放女原声播放(2)男声变女声(3)女声变男声4结束语经过对数字变声器的设计,我收获很多。自己也感觉到数字信号处理的应用和matlab的强大,同时网络是学习的重要工具,能在网络上获得好多资料。在这里非常感谢曹老师给我的这次机会,也感谢老师和同

14、学们的热心的帮助。参考文献1 程佩青.数字信号处理教程。清华大学出版社,2007.22 张威 MATLAB基础与编程入门 (第二版) 西安电子科技大学出版社,2008.13 陈垚光等.精通MATLAB GUI设计.北京:电子工业出版社,2011.14 高西全,丁玉美.数字信号处理(第三版)M.西安电子科技大学出版社,2011.5陈生潭,郭宝龙,李学武,高建宁.信号与系统(第三版)M.西安电子科技大学出版社,2008.6 张雪英.数字语音处理及MATLAB仿真.北京:电子工业出版社,2010.77 郑阿奇.MATLAB实用教程。北京:电子工业出版社,2007.8欢迎您的光临,Word文档下载后可修改编辑.双击可删除页眉页脚.谢谢!让我们共同学习共同进步!学无止境.更上一层楼。专心-专注-专业

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁