• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      同態(tài)解卷處理在基音檢測(cè)中的應(yīng)用

      2013-07-20 02:34:40楊順遼
      關(guān)鍵詞:濁音基音聲道

      楊順遼

      長(zhǎng)江大學(xué)電子信息學(xué)院,湖北荊州 434023

      同態(tài)解卷處理在基音檢測(cè)中的應(yīng)用

      楊順遼

      長(zhǎng)江大學(xué)電子信息學(xué)院,湖北荊州 434023

      1 引言

      人類語(yǔ)音分為濁音和清音,其中發(fā)濁音時(shí)氣流通過(guò)聲門使得聲帶產(chǎn)生張弛震蕩式振動(dòng),從而產(chǎn)生準(zhǔn)周期氣流脈沖,該氣流脈沖激勵(lì)聲道就產(chǎn)生濁音。這種聲帶振動(dòng)的頻率稱為基頻,相應(yīng)的周期就稱為基音周期?;糁芷诰哂袝r(shí)變性和準(zhǔn)周期性,其大小與聲帶、發(fā)音習(xí)慣、發(fā)音者年齡、性別和發(fā)音時(shí)的情感有關(guān)[1]。基音周期的估計(jì)稱為基音檢測(cè),是語(yǔ)音處理中一個(gè)重要參數(shù),基音檢測(cè)是語(yǔ)音處理中的關(guān)鍵環(huán)節(jié)和難點(diǎn)所在。

      人們已經(jīng)提出了多種基音檢測(cè)方法,如自相關(guān)函數(shù)法[2]、平均幅度差函數(shù)法[3]、小波變換法[4]等,而基于同態(tài)濾波的基音檢測(cè)法也引起了研究者的重視[5]。

      基音檢測(cè)的難點(diǎn)在于聲道特性對(duì)基音的影響難以去除。本文采用同態(tài)解卷處理,將聲門激勵(lì)信號(hào)和聲道特性進(jìn)行分離,并對(duì)處理結(jié)果采用頻率不變線性低通濾波器進(jìn)行濾波,然后再采用自相關(guān)法檢測(cè)基音周期,從而減小聲道特性和噪聲對(duì)基音檢測(cè)的影響,以提高基音檢測(cè)的精度。

      2 語(yǔ)音信號(hào)產(chǎn)生模型

      語(yǔ)音信號(hào)產(chǎn)生過(guò)程較復(fù)雜,影響因素多,人們希望建立語(yǔ)音信號(hào)產(chǎn)生的數(shù)字模型,以利用數(shù)字信號(hào)處理技術(shù)來(lái)實(shí)現(xiàn)發(fā)音器官的模擬。1930年Duddley發(fā)明的聲碼器為語(yǔ)音信號(hào)產(chǎn)生模型的建立提供了依據(jù)。其基本思想是將語(yǔ)音產(chǎn)生過(guò)程分為激勵(lì)和系統(tǒng)兩個(gè)部分,語(yǔ)音信號(hào)就是激勵(lì)和系統(tǒng)的卷積結(jié)果,如圖1所示[6]。

      圖1 語(yǔ)音信號(hào)產(chǎn)生模型

      圖1所示語(yǔ)音產(chǎn)生模型表明,語(yǔ)音信號(hào)中濁音可以看做是一個(gè)周期信號(hào)激勵(lì)于系統(tǒng)的響應(yīng),而清音是隨機(jī)噪聲激勵(lì)于系統(tǒng)的響應(yīng)。顯然,濁音中的基音受到了聲門模型、聲道模型和口唇輻射模型的綜合影響,而這些模型會(huì)對(duì)從濁音中檢測(cè)出基音的準(zhǔn)確性產(chǎn)生影響。

      基音頻率一般處于80~500 Hz之間,而聲道特性中的第一共振峰頻率與基音頻率最為接近,其對(duì)基音檢測(cè)影響最大。

      3 同態(tài)解卷

      3.1 基本原理

      同態(tài)解卷處理是以倒譜和復(fù)倒譜為基礎(chǔ)的。所謂復(fù)倒譜,是對(duì)序列x(n)的傅里葉變換X(ejω)取對(duì)數(shù):

      然后再進(jìn)行傅里葉逆變換所得序列x?(n)即為序列x(n)的復(fù)倒譜。顯然,如果將X(ejω)表示成幅度和相位的形式,則有:即包含了實(shí)部和虛部,實(shí)部為對(duì)數(shù)幅度譜,虛部為相位。

      所謂倒譜是對(duì)序列x(n)的傅里葉變換X(ejω)的幅度取對(duì)數(shù),即

      然后再進(jìn)行傅里葉逆變換所得序列cx(n)即為序列x(n)的倒譜。

      如果有一個(gè)序列x(n)為兩個(gè)序列x1(n)和x2(n)的卷積,即

      則其復(fù)倒譜x?(n)和倒譜cx(n)為:

      也就是將兩序列的卷積運(yùn)算變成了加法運(yùn)算,即滿足廣義的疊加原理,滿足廣義疊加原理的系統(tǒng)就稱為同態(tài)系統(tǒng)[7]。

      復(fù)倒譜是可逆的,也就是一個(gè)序列可由它的復(fù)倒譜恢復(fù)出來(lái),即將復(fù)倒譜的傅里葉變換取指數(shù)運(yùn)算:

      然后再作傅里葉逆變換即可恢復(fù)原序列x(n)。

      既然復(fù)倒譜運(yùn)算可以將卷積運(yùn)算關(guān)系變?yōu)榫€性求和運(yùn)算關(guān)系,因此可以將激勵(lì)信號(hào)和系統(tǒng)單位脈沖響應(yīng)加以分離?;纛l率低于聲道的共振峰頻率,因此,在濁音的復(fù)倒譜中,“低時(shí)”部分對(duì)應(yīng)于頻率較高的聲道特性,而“高時(shí)”部分對(duì)應(yīng)于頻率較低的基音。所以可以采用頻率不變線性高通濾波器實(shí)現(xiàn)解卷處理,以減小聲道對(duì)基音檢測(cè)的影響。

      3.2 基音檢測(cè)步驟

      根據(jù)上述原理,可得出基于同態(tài)解卷處理的基音檢測(cè)步驟如下:

      (1)對(duì)濁音進(jìn)行傅里葉變換;

      (2)對(duì)變換結(jié)果取對(duì)數(shù)然后再進(jìn)行逆變換;

      (3)進(jìn)行頻率不變線性濾波,取出“高時(shí)”部分;

      (4)進(jìn)行傅里葉變換;

      (5)對(duì)變換結(jié)果取指數(shù)運(yùn)算并進(jìn)行傅里葉逆變換;

      (6)自相關(guān)法進(jìn)行基音檢測(cè)。

      上述檢測(cè)流程如圖2所示。

      圖2 基于同態(tài)解卷的基音檢測(cè)流程

      4 檢測(cè)處理結(jié)果

      4.1 理論模型的處理

      為了驗(yàn)證本文方法的可行性,下面通過(guò)理論模型進(jìn)行處理。聲門及聲道諧振作用的綜合影響用下式進(jìn)行模擬[8]:

      而發(fā)濁音時(shí)的激勵(lì)信號(hào)為:

      其中β0=0.98,β1=1,α=r=0.9,θ=π/6,N0=15時(shí)的波形如圖3所示。其中圖3(c)為聲道和激勵(lì)信號(hào)的卷積,即聲音信號(hào)的模擬。

      圖3(d)為利用同態(tài)解卷處理分離出的激勵(lì)信號(hào),對(duì)復(fù)倒譜采用的是頻率不變線性高通濾波器濾波。顯然,采用同態(tài)解卷處理分離出的激勵(lì)與原始激勵(lì)信號(hào)模型基本相同,其周期性保留得較完整,而且基本不受聲門和聲道特性的影響。表明該方法用于提取基音能夠減少聲門和聲道特性的影響,從而可以提高基音檢測(cè)的精度。

      4.2 實(shí)際語(yǔ)音的處理

      下面通過(guò)一段實(shí)際的語(yǔ)音進(jìn)行基音檢測(cè)的驗(yàn)證。圖4(a)為成年男性發(fā)濁音“啊”時(shí)的一幀語(yǔ)音時(shí)域波形,采樣率為16 kHz,幀長(zhǎng)為400,從圖中可以看出,基音周期為110個(gè)樣點(diǎn)數(shù),從時(shí)域波形中可估計(jì)出其基音頻率為16 kHz/110= 145.45 Hz。圖4(b)為該語(yǔ)音的自相關(guān)結(jié)果,顯然,自相關(guān)具有周期性,可以用來(lái)檢測(cè)基音周期,估計(jì)出的基音頻率也為145.45 Hz。但是,無(wú)論是從時(shí)域波形還是從其自相關(guān)結(jié)果來(lái)看,都具有明顯的高頻成分,在進(jìn)行基音檢測(cè)時(shí)易對(duì)檢測(cè)結(jié)果產(chǎn)生影響。

      在基音檢測(cè)處理中為了減小聲道特性的影響,往往采用低通濾波預(yù)處理然后再進(jìn)行基音檢測(cè),低通濾波器的截止頻率一般取900 Hz[5,9],這樣處理雖然在一定程度上能減小聲道特性的影響,但是仍然含有一定的高頻成分,對(duì)基音檢測(cè)還是會(huì)存在影響。圖4(a)的語(yǔ)音信號(hào)經(jīng)過(guò)900 Hz的低通濾波器濾波后的波形及其自相關(guān)如圖5所示。

      圖3 理論模型及其處理結(jié)果

      圖4 語(yǔ)音時(shí)域波形及其直接自相關(guān)

      圖6(a)為采用本文方法進(jìn)行同態(tài)解卷所得到的基音激勵(lì)信號(hào)。圖中存在兩個(gè)明顯的類似于沖激的等間隔脈沖,其間隔為110個(gè)樣點(diǎn)數(shù)。圖6(b)為圖6(a)的自相關(guān)處理結(jié)果,圖6(b)中檢測(cè)出的基音周期為110個(gè)樣點(diǎn)數(shù),即145.45 Hz,與直接相關(guān)檢測(cè)結(jié)果相同。但是圖6(b)與圖4(b)和圖5(b)相比較,顯然圖6(b)中沒(méi)有明顯的其他周期成分,即減小了聲道特性對(duì)基音檢測(cè)的影響。

      圖7為一段高信噪比(60 dB)濁音采用直接相關(guān)法、低通濾波后再相關(guān)處理法和本文同態(tài)解卷后再相關(guān)處理方法檢測(cè)的基音頻率檢測(cè)結(jié)果,其中橫坐標(biāo)為語(yǔ)音幀序號(hào),縱坐標(biāo)為頻率,單位為Hz。

      圖7表明在高信噪比語(yǔ)音中,三種方法均能較準(zhǔn)確地檢測(cè)出基音頻率,檢測(cè)出的頻率在145 Hz左右,與時(shí)域觀察結(jié)果一致。

      圖6 同態(tài)解卷分離出的激勵(lì)信號(hào)及其自相關(guān)

      圖7 高信噪比語(yǔ)音三種方法檢測(cè)基音頻率對(duì)比

      圖8 低信噪比語(yǔ)音三種方法檢測(cè)基音頻率對(duì)比

      圖8為受隨機(jī)噪聲干擾的濁音語(yǔ)音(信噪比為17 dB)采用上述三種方法檢測(cè)出的基音頻率。采用直接相關(guān)處理檢測(cè)的基音頻率中有16幀出現(xiàn)了錯(cuò)誤,誤檢率為61.5%,錯(cuò)誤頻率在500 Hz到1 000 Hz之間,處于聲道的第一共振峰頻率范圍內(nèi)。低通濾波處理后有11幀出現(xiàn)錯(cuò)誤,誤檢率為42.3%,錯(cuò)誤頻率處于聲道第一共振峰范圍內(nèi)。而采用本文方法檢測(cè)時(shí)沒(méi)有出現(xiàn)將聲道共振峰頻率錯(cuò)誤地檢測(cè)為基音頻率的情況。表明本文方法在基音檢測(cè)中性能優(yōu)于另外兩種方法,具有較好的抗聲道特性影響和抗噪聲性能。

      表1中列出了不同信噪比時(shí)三種方法基音檢測(cè)的錯(cuò)誤率。隨著信噪比的降低,本文方法的錯(cuò)誤檢測(cè)率也會(huì)增加,但是,其誤檢率遠(yuǎn)小于另外兩種常用方法。

      表1 不同信噪比時(shí)基音檢測(cè)結(jié)果對(duì)比

      5 結(jié)束語(yǔ)

      同態(tài)解卷處理可以將卷積運(yùn)算的兩個(gè)分量進(jìn)行分離,而語(yǔ)音中濁音的產(chǎn)生過(guò)程可以看做是基音周期性脈沖與聲道特性的卷積,因此,從語(yǔ)音中直接檢測(cè)基音不可避免地會(huì)受到聲道特性和噪聲的影響。將同態(tài)解卷技術(shù)用于語(yǔ)音基音檢測(cè)中,可以減小聲道特性和噪聲對(duì)基音檢測(cè)的影響。理論模型和實(shí)際語(yǔ)音處理結(jié)果均表明該方法的可行性和有效性,從而為基音檢測(cè)提供了一種思路。

      [1]馮康,時(shí)慧琨.語(yǔ)音信號(hào)基音檢測(cè)的現(xiàn)狀及展望[J].微機(jī)發(fā)展,2004,14(3):95-98.

      [2]Shimamura T,Kobayashi H.Weighted autocorrelation for pitch extraction of noisy speech[J].IEEE Trans on Speech Audio Processing,2001,9(7):727-730.

      [3]李晉,江成,劉甫.改進(jìn)的基音檢測(cè)算法[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(3):117-119.

      [4]Kadambe S,Boudreaux-Bartels G F.Application on the wavelet transform for pitch detection of speech signals[J].IEEE Trans on Inform Theory,1992,38(2):917-924.

      [5]胡立波,吳月萍,孫光中.基于同態(tài)濾波的基音檢測(cè)算法[J].微電子學(xué)與計(jì)算機(jī),2009,26(4):95-97.

      [6]胡航.語(yǔ)音信號(hào)處理[M].哈爾濱:哈爾濱工業(yè)大學(xué)出版社,2005. [7]奧本海姆,謝弗.數(shù)字信號(hào)處理[M].董士嘉,譯.北京:科學(xué)出版社,1981.

      [8]楊順遼,李永全.數(shù)字信號(hào)處理實(shí)現(xiàn)與實(shí)踐[M].武漢:華中科技大學(xué)出版社,2011.

      [9]陳小利,徐金甫.利用小波變換加權(quán)自相關(guān)的基音檢測(cè)法[J].數(shù)據(jù)采集與處理,2007,22(4):463-467.

      YANG Shunliao

      Electronics and Information College of Yangtze University,Jingzhou,Hubei 434023,China

      Pitch detection is one of the extremely important steps in speech signal processing,but the detection result usually has errors because pitch is influenced by vocal tract characteristics and noise.The excitation signal and vocal tract characteristics in voiced speech are separated by using homomorphism deconvolution,so as to reduce the influence of vocal tract characteristics and improve the pitch detection accuracy.Then autocorrelation is used to detect pitch in excitation signal.The feasibility is verified by theoretical model.The experiment results of real speech signal indicate that the vocal tract characteristics and noise have rarely influence on pitch detection using this method.

      homomorphism deconvolution;pitch detection;speech;frequency invariant linear filter

      語(yǔ)音處理中基音檢測(cè)是極為重要的環(huán)節(jié)之一,然而濁音中的基音往往會(huì)受到聲道特性和噪聲的影響而導(dǎo)致檢測(cè)結(jié)果的誤差。利用同態(tài)解卷處理,將濁音中的激勵(lì)信號(hào)和聲道特性進(jìn)行分離,然后再在激勵(lì)信號(hào)中利用自相關(guān)檢測(cè)基音,可以減小聲道特性和噪聲對(duì)基音檢測(cè)的影響,從而提高基音檢測(cè)的精度。通過(guò)理論模型驗(yàn)證了該方法的可行性,而且實(shí)際語(yǔ)音信號(hào)處理結(jié)果表明,該方法在基音檢測(cè)時(shí)可以基本不受聲道特性和噪聲的影響。

      同態(tài)解卷;基音檢測(cè);語(yǔ)音;頻率不變線性濾波器

      A

      TN912.3

      10.3778/j.issn.1002-8331.1203-0044

      YANG Shunliao.Application of homomorphism deconvolution processing in pitch detection.Computer Engineering and Applications,2013,49(24):214-218.

      楊順遼(1973—),男,副教授,研究領(lǐng)域?yàn)樾盘?hào)處理,語(yǔ)音,圖像處理。E-mail:robertysl@yahoo.com.cn

      2012-03-02

      2012-05-30

      1002-8331(2013)24-0214-05

      CNKI出版日期:2012-07-16http://www.cnki.net/kcms/detail/11.2127.TP.20120716.1501.050.html

      ◎工程與應(yīng)用◎

      猜你喜歡
      濁音基音聲道
      9.7.8聲道、造價(jià)250余萬(wàn) James極品影院賞析
      為發(fā)燒需求打造的11聲道后級(jí) Orisun(傲力聲)OA-S11
      基于基音跟蹤的語(yǔ)音增強(qiáng)研究
      日語(yǔ)半濁音的變化規(guī)律研究
      實(shí)現(xiàn)從7.2到11.2聲道的飛躍 Onkyo(安橋)TX-RZ830
      清濁音分離抗噪的語(yǔ)音識(shí)別算法的研究
      有關(guān)鼻濁音使用實(shí)態(tài)的研究
      ——以NHK新聞為中心
      樂(lè)理小知識(shí)
      小演奏家(2014年11期)2014-12-17 01:18:52
      考慮覆蓋率下時(shí)差式超聲流量計(jì)的平面聲道模型*
      一種改進(jìn)的基音周期提取算法
      石首市| 陵水| 东方市| 安溪县| 万州区| 广安市| 漯河市| 东丰县| 莫力| 夏河县| 舒兰市| 宜宾市| 塘沽区| 稻城县| 柏乡县| 石城县| 惠州市| 洛南县| 宜城市| 紫云| 攀枝花市| 贵德县| 新绛县| 大兴区| 武清区| 高尔夫| 涞水县| 山东| 祁阳县| 波密县| 乌什县| 麦盖提县| 石楼县| 乳山市| 长汀县| 寿阳县| 英山县| 彭山县| 盖州市| 定州市| 海淀区|