• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      一種基音周期檢測中減小中值平滑誤差的方法

      2016-07-31 17:08:40陳善繼
      關(guān)鍵詞:基音中值樣點(diǎn)

      馬 英, 陳 超, 陳善繼

      (青海民族大學(xué) 物理與電子信息工程學(xué)院,青海 西寧 810007)

      一種基音周期檢測中減小中值平滑誤差的方法

      馬 英, 陳 超, 陳善繼

      (青海民族大學(xué) 物理與電子信息工程學(xué)院,青海 西寧 810007)

      在語音信號處理中,常用的基音檢測算法對于純凈語音信號的檢測效果較好;然而,實際的語音信號都會受到背景噪音的影響,使得常用的檢測算法不能達(dá)到最優(yōu)化,為提高檢測基音周期的準(zhǔn)確性,可以在基音檢測后處理中采用多種平滑技術(shù),但大多情況下后處理基音周期估值仍然產(chǎn)生很大的誤差,為此文章針對語音信號基音周期估值的中值平滑處理中,可能產(chǎn)生基音提取的誤差,進(jìn)行誤差分析,提出一種減小中值平滑誤差的方法。

      語音信號;基音周期;中值平滑;誤差

      語音信號分析中,語音信號特征參數(shù)的提取是非常重要的,只有獲取準(zhǔn)確的特征參數(shù),才可以進(jìn)行有效的語音識別,其中特征參數(shù)基音周期在參數(shù)提取中尤為重要,它的準(zhǔn)確性決定著合成語音時是否能夠高效地體現(xiàn)原始語音的頻譜[2]。

      而常用的基音周期檢測算法都會產(chǎn)生檢測誤差,為了減小誤差,可以采用各種平滑處理,常用的平滑處理技術(shù)主要有:中值濾波平滑技術(shù),線性平滑技術(shù),動態(tài)規(guī)劃平滑技術(shù)。線性平滑處理雖然可以增加平滑的效果,但是可能導(dǎo)致兩個平滑段之間階躍的模糊程度加重,增加基音提取的難度;動態(tài)規(guī)劃平滑處理采用的算法復(fù)雜度較高;而中值濾波平滑處理是最早興起的,易于實現(xiàn),可以較好地去除少量的“野點(diǎn)”,又不會使兩個平滑段之間的階躍性發(fā)生變化,但若原始信號中,某一點(diǎn)本身就是突變的,容易產(chǎn)生誤差,從而得不到最準(zhǔn)確的基音周期,文章針對語音信號基音周期檢測的中值平滑處理產(chǎn)生的誤差進(jìn)行實驗分析,提出減小誤差的方法,提高基音周期檢測的準(zhǔn)確性。

      1 原理基礎(chǔ)

      1.1 中值平滑技術(shù)

      中值平滑是平滑技術(shù)中最常采用,原理簡明,它的基本原理是:設(shè)x為中值濾波器的輸入信號,y為輸出信號,采用一個滑動窗,輸出值就是將窗外的中心搬移到n處時窗口輸入樣點(diǎn)的中值,及n點(diǎn)處左右各取s個樣點(diǎn),與平滑點(diǎn)中心共同構(gòu)成一組信號采樣點(diǎn)(共2s+1個樣值),然后將這(2s+1)個樣點(diǎn)按大小順序排成一排,平滑器的輸出為該序列的中間值。s值一般為1或2,那么中值平滑起的“窗口”一般包含3到5個樣點(diǎn)[1]。

      1.2 線性平滑技術(shù)

      線性平滑技術(shù)是采用滑動窗進(jìn)行線性濾波處理,即

      線性平滑處理不僅可以糾正輸入信號中不平滑處的樣點(diǎn)值,也可以修改附近各樣點(diǎn)的值。

      1.3 動態(tài)規(guī)劃平滑技術(shù)

      動態(tài)規(guī)劃平滑處理的基本思想是:設(shè)計合理的代價函數(shù),尋找使最終的合計代價最小的路徑,它必須考慮與分析信號幀左右相鄰的幀,并且在尋找最小代價的路徑時,使用從前向后,從后向前,或從中間開始三種算法處理,算法復(fù)雜度高。在實際平滑處理中很少采用。

      2 實驗結(jié)果與分析

      在實驗檢測中,采用Cooledit在普通室內(nèi)環(huán)境下錄制的男聲語音信號,采樣頻率為44kHZ,單聲道。

      2.1 語音信號預(yù)處理

      對輸入的語音信號進(jìn)行預(yù)處理,主要是為了對語音的高頻部分進(jìn)行加重,提升高頻特性,增加語音的高頻分辨率。[4,21]

      MATLAB中的FDATool(FilterDesign&Analysis Tool),可以完成多種濾波器的設(shè)計分析。

      在MATLAB命令窗口輸入“fadtool”調(diào)出FDATool。輸入濾波器參數(shù)得到相應(yīng)的濾波器,

      Fs=44000; %Sampling Frequency

      Fpass=600; %Passband Frequency

      Fstop=700; %Stopband Frequency

      Dpass=0.057501127785;

      Dstop=0.031622776602;

      flag='scale';

      [M,W,B,T]=kaiserord([Fpass Fstop]/(Fs/2),[1 0],[Dstop Dpass]);

      b=fir1(M,W,T,kaiser(M+1,B),flag);

      Hd=dfilt.dffir(b);

      如圖1所示:

      圖1 FDATOOL設(shè)計濾波器

      輸入語音信號進(jìn)行預(yù)處理,由圖2中可以看出,預(yù)處理后的語音信號在高頻部分的幅度得到了提升,使信號的頻譜變得平坦,更能有效地提取語音信號的特征參數(shù)。

      圖2 預(yù)處理前后的語音信號

      2.2 基音周期估值的中值平滑處理

      在實驗檢測中,一般窗長應(yīng)選為基音周期的兩倍以上,才會有較好的效果,語音中最長基音周期大約為20ms,故在基音周期估值時窗長選為40ms效果比較好[1]。設(shè)置分幀長度,取40ms,即1764個樣點(diǎn),取50幀語音信號進(jìn)行實驗分析,提取各幀基音周期,如圖3所示。

      圖3(a)ACF提取基音周期

      圖3(b)CEP提取基音周期

      由圖3(a)和圖3(b)可見在去除野點(diǎn)前兩種基音檢測方法都出現(xiàn)了較大的誤差,使得基音周期軌跡中有幾個基音周期偏離了原有的軌跡,這種偏離點(diǎn)即為基音軌跡的“野點(diǎn)”。而這些“野點(diǎn)”在基音周期檢測中會造成基音周期的誤判,因此對該50幀語音信號繼續(xù)進(jìn)行中值濾波平滑處理,如圖4所示。

      圖4(a)ACF中值平滑分析

      圖4(b)CEP中值平滑分析

      在圖4(a)和圖4(b)中進(jìn)行中值平滑處理去除野點(diǎn)后,兩種基音檢測結(jié)果差距減小,50幀信號的基音周期大部分在4ms-6ms之間,但仍然有個別幀信號偏離了基音周期的正常軌跡,產(chǎn)生了一定的誤差。

      2.3 減小誤差的方法

      實驗中提取中值濾波后偏離基音軌跡的第20幀語音信號做進(jìn)一步分析。

      第20幀語音信號進(jìn)行提取基音周期,如圖5所示。

      圖5 第20幀語音信號ACF

      在語音信號中,對于濁音的ACF,具有一定的周期性,進(jìn)行一定的采樣后,ACF具有最大值,可用ACF的相鄰峰值點(diǎn)的距離來估算濁音的基音周期。由于一般語音信號基音頻率不會低于40Hz,最大不會高于1000Hz,在實驗檢測中,去掉前面有可能的錯誤值,防止誤判,但是,在計算基音周期時,必須補(bǔ)回去掉的樣點(diǎn)數(shù),算出對應(yīng)的基音周期約為T=(相鄰峰值點(diǎn)的距離+去掉的樣點(diǎn)數(shù))/采樣頻率。

      由圖5(圖中已去掉前40點(diǎn))得:

      檢測結(jié)果基本在基音周期的軌跡曲線上,與前面50幀信號檢測出來的基音相比周期誤差較小。

      第20幀語音信號進(jìn)行CEP提取基音周期,如圖6所示:

      圖6 第20幀語音信號CEP

      由圖6難以讀出這幀信號的最大值,倒譜近乎直線。在利用MATLAB的“max”函數(shù)判斷時最大值的橫坐標(biāo)是127,在倒譜法中,濁音語音的基音周期可用倒頻譜的最大峰值點(diǎn)的倒數(shù)來估值,其基音周期為

      檢測結(jié)果偏離基音周期軌跡曲線,與前面50幀信號檢測出來基音周期有較大的誤差。重復(fù)上述實驗,發(fā)現(xiàn)中值平滑處理后基音周期檢測時,無論采用什么方法個別幀仍然會產(chǎn)生較大的誤差,在這種情況下,對語音信號中值濾波平滑處理后采用多種方法提取基音周期并求得平均值,即

      可以得到相對準(zhǔn)確的基音周期。

      3 結(jié)論

      針對聲學(xué)特征提取基音周期時,可能產(chǎn)生基音周期檢測的錯誤,文章采用了短時自相關(guān)和倒譜檢測算法后進(jìn)行中值平滑后處理,雖然提高了基音周期檢測的相對準(zhǔn)確性。但是,個別幀基音周期檢測準(zhǔn)確度并不是很高,中值平滑輸出后基音周期檢測仍然存在誤差,因此,通過實驗分析,提出了中值平滑處理后用兩種以上的方法共同求同一幀語音信號的基音周期,然后求平均的方法,可以得到相對準(zhǔn)確的結(jié)果,此方法可以減小語音信號中值平滑處理中產(chǎn)生的相對誤差。

      [1]趙力.語音信號處理版[M].北京:機(jī)械工業(yè)出版社,2009:5.

      [2]高西全、丁玉美.數(shù)字信號處理[M].西安:西安電子科技大學(xué)出版社,2008:8.

      [3]張志涌.精通MATLABR2011a[M].北京航空航天大學(xué)出版社,2011:11.

      [4]張雪英.數(shù)字語音處理及MATLAB仿真[M].電子工業(yè)出版社,2010:7.

      [5]羅博、孫超.一種基于自相關(guān)函數(shù)的冪律檢測器[J].應(yīng)用聲學(xué),2010,25(5):352-355.

      [6]頓珠次仁.藏語語音信號降噪算法研究[J].西藏大學(xué)學(xué)報,2010,11(25):251-255.

      [7]敏生智、耿顯宗.安多藏語會話讀本[M].西寧:青海民族出版社,2003.

      [8]李洪波、于洪志.藏語語音識別的預(yù)處理研究[G].中國中文信息學(xué)會二十五周年學(xué)術(shù)會議論文集,2006.

      [9]Y.Fuji,K.Yamamoto,and S.Nakagawa.Hidden conditional neural fields for continuous phome speech recognition,IEICE Trans[J].Inf.&Syst.,2012,95(8):2094-2104.

      [10]T.N.Sainath,D.Nahamoo,B.Ramabhadran,etal.Exemplar-based sparse representation phone identification features[J].Proc.ICASSP,2011:4492-4495.

      [11]G.Dahl,D.Yu,L.Deng,et al.Large vocabulary continuous speech recognition with context-dependent DBN-HMMS[J].Proc.ICASSP,2011:4688-4691.

      [12]王文延、曾慶寧.一種噪聲環(huán)境下的語音端點(diǎn)檢測方法[J].聲學(xué)技術(shù),2007,26(3):435-437.

      [13]簡志華,王向文.采用壓縮感知的改進(jìn)的語音轉(zhuǎn)換算法[J].聲學(xué)學(xué)報,2014,24(3):400-406.

      [14]顏永紅,李軍峰,等.語音中元音和輔音的聽覺感知研究[J].應(yīng)用聲學(xué),2013,22(3):231-233.

      [15]馬永,賈俊芳.遺傳算法研究綜述[J].雁北師范學(xué)院學(xué)報,2007,23(3):11-13,21.

      [16]韓闊業(yè),江海,等.一種基于minimax準(zhǔn)則的壓縮采樣信號檢測方法[J].中國科學(xué)院研究生院學(xué)報,2010,27(6):794-799.[17]蔡鐵,唐飛,等.采用子帶長時信號變化特征的穩(wěn)健語音活動檢測[J].電視技術(shù),2014,38(19):221-223.

      [18]趙萍.語音信號的自相關(guān)基音周期檢測[J].上海電力學(xué)院學(xué)報,2011,27(3):297-300.

      [19]胡劍凌,徐盛,等.一種改進(jìn)的基音檢測算法[J].上海交通大學(xué)學(xué)報,2000,34(6):827-829.

      [20]趙振東,胡喜梅,等.基于譜減法的基音檢測算法[J].計算機(jī)工程與應(yīng)用,2008,44(5):197-198.

      [21]閔孝忠,朱林立.聽診采樣仿真系統(tǒng)的設(shè)計與實現(xiàn)[J].云南師范大學(xué)學(xué)報(自然科學(xué)版),2015,35(2),62-66.

      In a Pitch Detection Method for Decreasing the Median Smoothing Error

      MA Ying,CHEN Chao,CHEN Shan-ji
      (School ofPhysicsand Electronic Information Engineering,QinghaiUniversity for Nationalities, Xining,Qinghai,810007,China)

      In speech signal processing,commonly used pitch detection algorithm for clean speech signal detection effect is better;However,the actual speech signalwill be influenced by background noise,make the commonly used detection algorithm can notachieve optimization,In order to improve the accuracy of pitch detection,in pitch detection post-processing used in a variety of smoothing techniques,but in most cases the post-processing pitch valuationsstillproduce very big error,for thispitch for speech signal in the valuation of themedian smoothing,may produce the error of pitch extraction,detection analysis,put forward amethod to reduce themedian smoothing error.

      Speech signal;Pitch period;Themedian smoothing;Error

      O424

      A

      1008-9659(2016)02-0075-05

      2015-03-15

      青海民族大學(xué)科技合作基金(312000514315008);青海省國際科技合作項目(2014-HZ-821);青海省科技廳應(yīng)用基礎(chǔ)研究項目(2015-ZJ-721)。

      馬 英(1978-),女,青海西寧市人,副教授,主要從事信號處理研究。

      猜你喜歡
      基音中值樣點(diǎn)
      小麥條銹病田間為害損失的初步分析
      湖北植保(2022年4期)2022-08-23 10:51:52
      基于空間模擬退火算法的最優(yōu)土壤采樣尺度選擇研究①
      土壤(2021年1期)2021-03-23 07:29:06
      基于基音跟蹤的語音增強(qiáng)研究
      Lagrange中值定理的巧妙應(yīng)用
      基于分融策略的土壤采樣設(shè)計方法*
      微分中值定理教法研討
      后中值波電流脈沖MIG焊工藝
      樂理小知識
      小演奏家(2014年11期)2014-12-17 01:18:52
      一種改進(jìn)的基音周期提取算法
      函數(shù)矩陣的增減性及中值定理
      天祝| 鄂托克前旗| 荆州市| 读书| 吉林市| 含山县| 喀什市| 于都县| 马尔康县| 呼伦贝尔市| 阜南县| 浏阳市| 凯里市| 邮箱| 建昌县| 新郑市| 老河口市| 舒兰市| 广河县| 达日县| 鄯善县| 伽师县| 大邑县| 且末县| 乌拉特前旗| 同江市| 铜梁县| 鄂伦春自治旗| 阳城县| 邓州市| 博兴县| 罗定市| 天等县| 体育| 乌拉特前旗| 菏泽市| 平山县| 台湾省| 晋江市| 洛隆县| 祁门县|