99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

<small id="i8iii"><menu id="i8iii"></menu></small>

?

基于離散變換域的語(yǔ)音合成算法研究

2013-11-19 11:27:36李亞文

商洛學(xué)院學(xué)報(bào) 2013年6期

關(guān)鍵詞：離散系統(tǒng)聲道線性

李亞文

（商洛學(xué)院物理與電子信息工程系，陜西商洛 726000）

語(yǔ)音合成技術(shù)的發(fā)展起步較早，早在1791年由Wolfgang Von Kempelen等[1]發(fā)明的語(yǔ)音合成器，使得機(jī)器能用法語(yǔ)拼出完整的短語(yǔ)，英語(yǔ)文語(yǔ)轉(zhuǎn)換系統(tǒng)發(fā)展比較早，代表性是DECTalk語(yǔ)音合成器[2]，它可以發(fā)出7種不同音色的語(yǔ)音信號(hào)，用戶可以任意選擇，德國(guó)Franunhofer學(xué)會(huì)開(kāi)發(fā)了DECTalk德語(yǔ)版本，它還被不同的國(guó)家轉(zhuǎn)化為烏克蘭語(yǔ)、俄語(yǔ)、匈牙利語(yǔ)等。從20世紀(jì)80年代我國(guó)自動(dòng)化研究所、聲學(xué)研究所、社科院，就開(kāi)始了語(yǔ)音合成方面的研究[3]，目前漢語(yǔ)語(yǔ)音合成系統(tǒng)都是采用波形拼接合成技術(shù)[4]，基于參數(shù)的語(yǔ)音合成算法，基于數(shù)據(jù)單元挑選語(yǔ)音合成算法和基于數(shù)據(jù)驅(qū)動(dòng)的語(yǔ)音合成方法，以及語(yǔ)音識(shí)別中的數(shù)據(jù)驅(qū)動(dòng)建模、最優(yōu)搜索等[1-2,4]優(yōu)秀的算法思想在語(yǔ)音合成中得到了廣泛的應(yīng)用，然而這些算法各有優(yōu)缺點(diǎn)，主要問(wèn)題是占用的數(shù)據(jù)存儲(chǔ)空間較大，可懂度不高，從而影響了發(fā)音的質(zhì)量，合成的語(yǔ)音音色單一，韻律結(jié)構(gòu)預(yù)測(cè)誤差較大等。本文繼承基于參數(shù)的語(yǔ)音合成算法中線性預(yù)測(cè)的思想，提出了一種基于離散變換域的語(yǔ)音信號(hào)合成方法，對(duì)采樣的語(yǔ)音信號(hào)進(jìn)行濾波，送入預(yù)測(cè)器中并進(jìn)行語(yǔ)音預(yù)測(cè)，采用線性預(yù)測(cè)的方法壓縮語(yǔ)音數(shù)據(jù)量，大大的降低了語(yǔ)音信號(hào)的帶寬，再對(duì)語(yǔ)音信號(hào)加窗、基音提取，最后在聲道模型中重構(gòu)合成語(yǔ)音信號(hào)。

1 離散變換域

離散信號(hào)相比模擬信號(hào)在傳輸中有明顯的優(yōu)勢(shì)，因此大部分的信號(hào)傳輸都是要將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào)，其中語(yǔ)音信號(hào)的傳輸也是一樣。將時(shí)域的離散系統(tǒng)轉(zhuǎn)化為變換域（Z域）中，在變化域中的分析研究語(yǔ)音信號(hào)的重構(gòu)合成。

N階線性時(shí)不變（LTI）的離散系統(tǒng)的數(shù)學(xué)模型是常系數(shù)N階線性差分方程[5]，它的一般形式為：

分析離散系統(tǒng)響應(yīng)的結(jié)果就是求解式(1)N階差分方程[5]的過(guò)程，其中差分方程中的系數(shù)aN,bm由系統(tǒng)的元件參數(shù)決定。

時(shí)域分析中，由系統(tǒng)的單位脈沖響應(yīng)h(n)，可判斷離散時(shí)間系統(tǒng)的因果穩(wěn)定性。由于輸出變化發(fā)生在輸入變化之后，因此y(n)只取決于此時(shí)及以前的激勵(lì)x(n)、x(n+1)、離散LTI系統(tǒng)具有因果性的充分必要條件為：h(n)=0,n＜0，離散LTI系統(tǒng)穩(wěn)定的充分必要條件為單位脈沖響應(yīng)滿足絕對(duì)可和，即

為了分析離散系統(tǒng)響應(yīng)和系統(tǒng)特性，引入了離散系統(tǒng)Z變換，方便了計(jì)算，可將時(shí)域的數(shù)學(xué)模型差分方程轉(zhuǎn)化為線性的代數(shù)方程；通過(guò)分析單位沖激響應(yīng)h(n)對(duì)應(yīng)的Z變換H(z)的零極點(diǎn)分布間接分析系統(tǒng)的因果穩(wěn)定性。

N階LTI離散系統(tǒng)的差分方程一般形式為：

對(duì)系統(tǒng)兩邊同時(shí)取Z變換得到：

其中式(4)中,y(l)是初始條件。這樣離散系統(tǒng)的

時(shí)域響應(yīng)可表示為：

式(6)中,{ck}是 H(z)的零點(diǎn)；{dk}是 H(z)的極點(diǎn)。由式（6）中H(z)的表示式中除了系數(shù)A外，H(z)可由其零、極點(diǎn)確定。

H(z)與h(n)是一對(duì)Z變換對(duì),所以只要知道H(z)在z平面上的零、極點(diǎn)分布情況，就可以知道系統(tǒng)的脈沖響應(yīng)h(n)變化規(guī)律[5]，進(jìn)而可以判斷系統(tǒng)的因果穩(wěn)定性。

2 語(yǔ)音合成

在語(yǔ)音信號(hào)分析研究的過(guò)程中，通過(guò)分析語(yǔ)音的發(fā)生機(jī)理，可將語(yǔ)音信號(hào)的形成過(guò)程簡(jiǎn)化為圖1的模型。假設(shè)激勵(lì)信號(hào)為e(n)表示，語(yǔ)音信號(hào)用s(n)表示，則濾波后得到的語(yǔ)音信號(hào)s(n)就可以表示為[6]式（7）的形式。

圖1 語(yǔ)音信號(hào)生成的簡(jiǎn)化模型

2.1 語(yǔ)音預(yù)測(cè)

采集到的語(yǔ)音信號(hào)的得到是將脈沖序列和聲道模型的系統(tǒng)函數(shù)進(jìn)行卷積的過(guò)程，由于激勵(lì)信號(hào)e(n)和濾波器的模型V(z)中的系數(shù)ai(n)表示，因此這是一個(gè)復(fù)雜的解卷積的過(guò)程。通常激勵(lì)信號(hào)為周期脈沖序列，聲道模型中是高斯白噪聲序列，兩個(gè)信號(hào)的解卷積，可以使用自相關(guān)法或者自協(xié)方差法來(lái)求解系數(shù)ai(n)，并且還Durbin遞推算法[7-8]和Schuir遞推算法[9]等。

經(jīng)過(guò)相應(yīng)的方法得到了系數(shù)ai(n)，則將圖1中的輸入和輸出對(duì)換，就構(gòu)成了語(yǔ)音的預(yù)測(cè)模型，并將語(yǔ)音信號(hào)e(n)送入預(yù)測(cè)濾波器中，檢測(cè)預(yù)測(cè)語(yǔ)音信號(hào)和傳輸?shù)恼Z(yǔ)音信號(hào)的預(yù)測(cè)殘差e(n)，因此e(n)可表示為

信號(hào)的發(fā)送和接受端都已知預(yù)測(cè)系數(shù)ai(n)，在發(fā)送端只需將誤差e(n)發(fā)送到接收端，然后將e(n)作為差分方程的激勵(lì)得到重建的語(yǔ)音信號(hào)。在發(fā)送端語(yǔ)音信號(hào)s(n)是濾波器的輸入而誤差預(yù)測(cè)信號(hào)e(n)為濾波器的輸出，由于語(yǔ)音在短時(shí)間內(nèi)有平穩(wěn)特性，因此認(rèn)為預(yù)測(cè)系數(shù)ai(n)不發(fā)生變化，不用頻繁的傳輸，可采用線性預(yù)測(cè)的方法壓縮語(yǔ)音數(shù)據(jù)量，可以大幅度地降低語(yǔ)音信號(hào)的帶寬。

2.2 語(yǔ)音重構(gòu)

假設(shè)激勵(lì)信號(hào)為x{n}，濾波器系數(shù)為ai(n)，則可以利用激勵(lì)生成重建的語(yǔ)音信號(hào)，設(shè)重建的語(yǔ)音信號(hào)為，可以表示為語(yǔ)音信號(hào)在長(zhǎng)時(shí)間內(nèi)是非平穩(wěn)導(dǎo)致預(yù)測(cè)系數(shù)ai(n)是時(shí)變的，一般是每10-20 ms就會(huì)發(fā)生變化，從而產(chǎn)生不同的音節(jié)。因此，濾波要根據(jù)不同的濾波系數(shù)分段進(jìn)行，相鄰兩次的濾波必須保持濾波器的狀態(tài)不發(fā)生變化。

2.3 合成語(yǔ)音信號(hào)

分析一段10 ms的語(yǔ)音信號(hào)，得到它的最佳系數(shù)ai(n)，就可以用適當(dāng)?shù)妮斎雭?lái)合成語(yǔ)音，對(duì)于濁音信號(hào)，以特定的基音頻率重復(fù)的單位沖激序列作為激勵(lì)模型；對(duì)于清音信號(hào)，選擇隨機(jī)噪聲和白噪聲作為輸入，如果不區(qū)分清濁語(yǔ)音信號(hào)，一般可使用周期激勵(lì)合成即可。

圖2是合成語(yǔ)音信號(hào)的系統(tǒng)模擬框圖。

圖2 分析合成語(yǔ)音的系統(tǒng)模擬框圖

抽樣的語(yǔ)音信號(hào)被分成10 ms的長(zhǎng)度，然后對(duì)每段數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析，計(jì)算相鄰樣點(diǎn)的相關(guān)性從而得到最佳的預(yù)測(cè)系數(shù)，語(yǔ)音合成的過(guò)程就是將這些預(yù)測(cè)系數(shù)和周期單位沖激系列作為輸入，依次得到每段的合成語(yǔ)音。

3 仿真實(shí)驗(yàn)

在matlab中編寫speechproc.m文件，實(shí)現(xiàn)對(duì)現(xiàn)有語(yǔ)音的分幀、加窗、線性預(yù)測(cè)和基音周期提取，在語(yǔ)音信號(hào)合成前，先要對(duì)系統(tǒng)進(jìn)行線性預(yù)測(cè)得到系統(tǒng)的最佳預(yù)測(cè)系數(shù)ai(n)。對(duì)每幀語(yǔ)音信號(hào)s(n)和預(yù)測(cè)模型系數(shù)ai(n)，用filter計(jì)算激勵(lì)信號(hào)e(n)，在系數(shù)變化的情況下連續(xù)濾波，利用filter的zi和zf參數(shù)去維持濾波器的狀態(tài)不變。如圖3所示為模擬聲道中的系統(tǒng)特性零極點(diǎn)分布圖；圖4的語(yǔ)音信號(hào)1和語(yǔ)音信號(hào)2為模擬原始的語(yǔ)音信號(hào)和在信道中傳輸疊加高斯白噪聲的信號(hào)；根據(jù)計(jì)算得到的激勵(lì)語(yǔ)音信號(hào)s(n)和預(yù)測(cè)模型系數(shù)ai(n)，計(jì)算重構(gòu)的合成的語(yǔ)音信號(hào)?(n)，并將其與原始的語(yǔ)音信號(hào)比較，如圖5所示。

對(duì)比試聽(tīng)原始的語(yǔ)音信號(hào)1和聲道中傳輸?shù)恼Z(yǔ)音信號(hào)2以及合成的語(yǔ)音信號(hào)，可以明顯清晰的聽(tīng)到聲道中傳輸?shù)恼Z(yǔ)音信號(hào)2十分模糊，噪聲干擾比較大，只能大概聽(tīng)見(jiàn)說(shuō)話的內(nèi)容，合成后的信號(hào)雖然語(yǔ)音效果不如原始的語(yǔ)音信號(hào)1，但是語(yǔ)音質(zhì)量在可以接受的范圍內(nèi)，說(shuō)話的內(nèi)容清楚，偶爾有些“啪，啪”的聲音，可能是由于相位的不連續(xù)造成的，也可能是波形中的一些毛刺。實(shí)驗(yàn)中如果選取激勵(lì)信號(hào)較為簡(jiǎn)單，在聲道中就會(huì)丟失很多的信息，合成的語(yǔ)音信號(hào)也沒(méi)有原來(lái)的信號(hào)內(nèi)容豐富，經(jīng)過(guò)濾波后可以發(fā)現(xiàn)合成后的信號(hào)比原來(lái)的語(yǔ)音信號(hào)有一定的延遲，可能是相位發(fā)生了變化導(dǎo)致的，選取樣值n取1000-2000，觀察3個(gè)語(yǔ)音信號(hào)，如圖6所示。

圖3 聲道的系統(tǒng)特性零極點(diǎn)分布

圖4 原始的語(yǔ)音信號(hào)和在聲道中傳輸?shù)恼Z(yǔ)音信

圖5 重構(gòu)合成的語(yǔ)音信號(hào)

圖6 n取1000-2000的3種語(yǔ)音的對(duì)

除了該實(shí)驗(yàn)基本合成外，還可以試著對(duì)原始的語(yǔ)音信號(hào)稍做變化，比如變速不變調(diào)（改變?cè)颊Z(yǔ)音信號(hào)的抽樣速率），其主要應(yīng)用于消費(fèi)類電子產(chǎn)品，如英語(yǔ)點(diǎn)讀機(jī)等；或者變調(diào)不變速，不是簡(jiǎn)單的快進(jìn)播放，需要通過(guò)改變共振頻率和基音周期的大小改變音調(diào)改變。這兩項(xiàng)技術(shù)都是以Z變換和線性預(yù)測(cè)模型為基礎(chǔ)的，是語(yǔ)音數(shù)字信號(hào)處理中的技術(shù)。

4 結(jié)語(yǔ)

本文分析了語(yǔ)音信號(hào)的特點(diǎn)，提出了一種在離散變換域中分析語(yǔ)音信號(hào)合成的方法。實(shí)驗(yàn)中使用離散系統(tǒng)去模擬聲道模型，借助離散系統(tǒng)變換域分析的特點(diǎn)，對(duì)語(yǔ)音信號(hào)分幀、加窗，進(jìn)行線性預(yù)測(cè)和基音周期的提取，從而模擬重構(gòu)合成語(yǔ)音信號(hào)。實(shí)驗(yàn)結(jié)果表明，該種算法合成的語(yǔ)音信號(hào)與原始語(yǔ)音信號(hào)非常接近，系統(tǒng)的功能語(yǔ)調(diào)，發(fā)音風(fēng)格易于控制，重構(gòu)精度較高，合成語(yǔ)音準(zhǔn)確、生動(dòng)的傳遞語(yǔ)音信息，為以后做語(yǔ)音信號(hào)處理和可視化的語(yǔ)音視頻處理提供一種新的方法。

[1]朱維彬,呂士楠.基于語(yǔ)義的語(yǔ)音合成技術(shù)的現(xiàn)狀及展望[J].北京理工大學(xué)學(xué)報(bào),2007,27(5):408-411.

[2]康廣玉,郭世澤.基于共振峰過(guò)度的協(xié)同發(fā)音語(yǔ)音合成算法[J].天津大學(xué)學(xué)報(bào),2010,43(9):810-814.

[3]Thierry Dutoit.High-quality text-to-speech synthesis[J].Journal of Electrical and Electronics Engineering,1997,17(1):25-37

[4]韓紀(jì)慶,張磊,鄭鐵然.語(yǔ)音信號(hào)處理[M].北京:清華大學(xué)出版社,2004.

[5]李亞文.基于MATLAB的離散系統(tǒng)分析[J].商洛學(xué)院學(xué)報(bào),2013,27(4):34-36.

[6]于馳,王宏偉,宮明龍.多輸入多輸出離散系統(tǒng)的輸出反饋滑?？刂芠J].東北大學(xué)學(xué)報(bào):自然科學(xué)版,2012,33(2):187-190.

[7]WANG Y Z,ZHANG H G,YANG J.Robust adaptive control for interval time-delay systems[J].Journal of control Theroy and Application,2006,4:367-371.

[8]郭海燕,楊震.基于近似KLT域的語(yǔ)音信號(hào)壓縮感知[J].電子與信息學(xué)報(bào),2009,31(12):2948-2952.

[9]Chou F C,Seng C Y,Lee L S.A set of corpusbased text-to-speech synthesis technologies for Mandarin Chinese[J].IEEE Transaction on Speech and Audio Processing,2002,10(7):481-494.

[10]張德豐.matlab在數(shù)字信號(hào)處理中的應(yīng)用[M].北京:清華大學(xué)出版社,2010.

猜你喜歡

離散系統(tǒng)聲道線性

漸近線性Klein-Gordon-Maxwell系統(tǒng)正解的存在性

數(shù)學(xué)物理學(xué)報(bào)(2022年4期)2022-08-22 04:08:00

9.7.8聲道、造價(jià)250余萬(wàn) James極品影院賞析

家庭影院技術(shù)(2021年10期)2021-11-20 06:09:16

線性回歸方程的求解與應(yīng)用

中學(xué)生數(shù)理化·高一版(2021年2期)2021-03-19 08:32:06

為發(fā)燒需求打造的11聲道后級(jí) Orisun(傲力聲)OA-S11

家庭影院技術(shù)(2020年7期)2020-08-24 08:18:10

二階線性微分方程的解法

中央民族大學(xué)學(xué)報(bào)(自然科學(xué)版)(2018年3期)2018-11-09 01:16:34

實(shí)現(xiàn)從7.2到11.2聲道的飛躍 Onkyo(安橋)TX-RZ830

家庭影院技術(shù)(2018年10期)2018-11-02 05:35:24

關(guān)于非自治離散系統(tǒng)中敏感性的一些結(jié)論

數(shù)學(xué)物理學(xué)報(bào)(2017年5期)2017-11-23 07:51:08

2-D連續(xù)-離散系統(tǒng)的迭代學(xué)習(xí)控制

四川師范大學(xué)學(xué)報(bào)(自然科學(xué)版)(2015年2期)2015-02-28 14:07:41

考慮覆蓋率下時(shí)差式超聲流量計(jì)的平面聲道模型*

華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版)(2014年1期)2014-08-16 07:58:48

基于MATLAB的離散系統(tǒng)分析

商洛學(xué)院學(xué)報(bào)(2013年4期)2013-11-19 11:27:54

商洛學(xué)院學(xué)報(bào)2013年6期

商洛學(xué)院學(xué)報(bào)的其它文章: 核桃葉中多酚類物質(zhì)的浸提工藝優(yōu)化; 基于Delphi的溫度監(jiān)測(cè)軟件的設(shè)計(jì); 支持AAA的MPLS VPN安全解決方案; 基于直覺(jué)模糊的大學(xué)生滿意度研究; 基于FPGA的一體化實(shí)時(shí)圖像采集系統(tǒng)設(shè)計(jì); 心理健康、領(lǐng)悟社會(huì)支持和復(fù)原力關(guān)系研究

嘉兴市| 旬阳县| 洛南县| 安陆市| 扶沟县| 合江县| 左权县| 延吉市| 广州市| 玉门市| 宁武县| 宝清县| 庄河市| 朝阳县| 论坛| 弋阳县| 全椒县| 龙泉市| 苍南县| 哈巴河县| 体育| 普兰县| 皋兰县| 岳普湖县| 施甸县| 定结县| 师宗县| 德格县| 清镇市| 高淳县| 大厂| 罗定市| 洮南市| 南宁市| 靖边县| 荆门市| 那坡县| 嘉荫县| 富源县| 灵武市| 景德镇市|

<tfoot id="4iii8"><noscript id="4iii8"></noscript></tfoot>

<nav id="4iii8"><sup id="4iii8"></sup></nav>