• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      一種分層閾值優(yōu)化的語音感知小波去噪方法

      2014-05-13 10:02:46曹斌芳彭光含彭元杰黎小琴
      關鍵詞:小波語音閾值

      曹斌芳, 彭光含, 彭元杰, 黎小琴

      ?

      一種分層閾值優(yōu)化的語音感知小波去噪方法

      曹斌芳*, 彭光含, 彭元杰, 黎小琴

      (湖南文理學院 物理與電子科學學院, 湖南 常德, 415000)

      通過分析含噪語音信號的特點, 引入能夠兼顧人耳聽覺特性的聽覺感知小波變換, 構造了新的小波閾值函數(shù), 并對小波變換分解后的閾值進行基于微粒群算法的分層優(yōu)化. 仿真實驗表明, 該方法在不同信噪比條件下均具有較好的去噪性能, 語音的可懂度和聽覺效果得到有效提高.

      語音去噪; 聽覺感知小波變換; 分層閾值; 微粒群算法

      在語音通信過程中, 常常會受到環(huán)境噪聲的影響, 這些噪聲的存在嚴重影響了語音的質量, 導致接收者收到的語音信號并非純凈的原始信號. 語音信號的噪聲消除技術是語音信號處理的一個重要分支, 主要是完成在保證語音可懂度的條件下, 較多地消除語音信號中的噪聲成分[1]. 經過多年的發(fā)展, 研究者提出了多種語音去噪算法, 如維納濾波方法、譜減法、子空間法、統(tǒng)計模型法以及小波變換法[2—4]等, 它們具有各自不同的特點, 實際應用時可以依據這些算法的難易程度及去噪效果進行選擇.

      語音信號是一種時變的非平穩(wěn)信號, 很難用傳統(tǒng)的維納濾波或者卡爾曼濾波實現(xiàn)最優(yōu)去噪, 而小波變換(Wavelet transform, WT)作為一種非常重要的非平穩(wěn)信號分析工具, 它可以在很大程度上對噪聲加以消除[4], 因此, 在信號處理領域獲得了廣泛的應用. 目前, 基于小波變化的噪聲消除方法大致有以下幾種: 第1種, 基于Mallat及其合作者提出的模極大值的小波去噪算法[5]; 第2種, 依據小波變換后系數(shù)之間的相關性實現(xiàn)小波系數(shù)的類型判別, 從而完成處理; 第3種, Donoho提出的軟硬閾值去噪方法, 該方法實現(xiàn)簡單、計算量小, 因而獲得了廣泛應用. 在小波閾值法進行語音信號的噪聲消除時, 發(fā)現(xiàn)該方法不能很好地反應人耳對信號幅度以及頻率的聽覺特性, 因此, 文獻[6—7]采用了一種聽覺感知的小波變換, 建立了人類聽覺系統(tǒng)對于聲音頻率的感知與實際頻率的對應關系. 另外研究發(fā)現(xiàn), 在小波閾值去噪法中, 不同的閾值和閾值函數(shù)都會影響到最終的去噪效果, 所以很多的研究者針對閾值和閾值函數(shù)的合理選擇問題進行了大量研究. Donoho通過理論證明, 得出小波變化過程存在最優(yōu)的通用閾值, 然而后續(xù)的分析和研究說明噪聲和信號的小波系數(shù)具有明顯不同的分布特征, 因此通用閾值很難在實際中產生很好的效果. 國內外學者提出了多種改進閾值去噪法[8—11], 本文在此基礎上, 結合語音信號的特點, 構造了一個新的閾值函數(shù), 并提出針對不同的小波分解尺度, 采用不同的閾值, 即分層閾值. 針對分層閾值的選擇問題, 本文采用微粒群優(yōu)化算法來確定最佳分層閾值, 最后通過實驗仿真驗證了該方法的有效性.

      1 基于小波變化的閾值去噪法

      1.1 聽覺感知小波變換

      人耳基底膜具有與頻譜分析器相似的作用, 可將20~16 000 Hz分成24個頻率群[6]. 文中引入聽覺感知的小波變換進行語音信號的分解和重構, 可以很好地兼顧多分辨率的思想, 同時也使得處理后的語音信號可以在很大程度上符合人類的聽覺系統(tǒng)特性.

      定義信號()的小波變換為:

      人耳的聽覺系統(tǒng)非常復雜, 目前很難從機理結構上對它進行完全的解釋. 人耳對于聲音頻率的理解與真實頻率之間呈現(xiàn)一種復雜的非線性關系, 如文獻[7]給出其函數(shù)表達式如下:

      其中,代表聽覺感知頻率,代表線性頻率.

      選擇小波母函數(shù):

      其中,1= 4ln2, 取參數(shù)(,)為(1,1-D)可得聽覺感知域下的小波函數(shù)的表達式, 即:

      1.2 閾值函數(shù)分析

      小波變換過程中閾值函數(shù)的選取是非常重要的, 它直接影響到后續(xù)對不同分解層次上小波系數(shù)的處理. 小波軟、硬閾值噪聲消除方法最早由Donoho等人提出[12], 其定義如下:

      硬閾值:

      軟閾值:

      其中, sign()為符號函數(shù), 該軟、硬閾值函數(shù)在去噪方法中獲得廣泛應用, 也成為后續(xù)閾值去噪方法的基礎.

      Donoho提出的軟、硬閾值函數(shù)在很多方面獲得了廣泛的應用, 但是研究發(fā)現(xiàn)它們都有一定的局限性. 比如, 硬閾值法可以較好地消除噪聲, 但是由于閾值函數(shù)在連接點處存在不連續(xù)性, 進行小波去噪后, 恢復出來的信號會出現(xiàn)振蕩現(xiàn)象. 相比硬閾值法, 由于軟閾值方法在連接點處是連續(xù)的, 進而可以避免振蕩現(xiàn)象的產生, 但是, 軟閾值后的小波系數(shù)與真實信號的小波系數(shù)相比, 有一定的偏差, 會造成信號的逼近誤差偏大.

      針對軟、硬閾值方法的這些缺點, 很多學者提出了改進的閾值方法, 但各種方法在小波系數(shù)小于0時都簡單地設置為0, 這是不合理的. 為了既保證施加閾值后小波系數(shù)的平滑過渡, 又保證大的小波系數(shù)能夠去掉噪聲, 本文結合語音信號的特點構造了一種新的閾值函數(shù), 其描述如下:

      式中為0~1之間的一個參數(shù), 即當小波系數(shù)小于閾值時, 讓小波系數(shù)平滑減小到0, 大于閾值時, 小波系數(shù)的平方減去閾值平方再開方, 從而減少音樂噪聲. 針對所提出的閾值函數(shù)中閾值的選取, 本文引入微粒群算法進行分層優(yōu)化.

      2 語音聽覺感知小波變化分層閾值去噪的微粒群優(yōu)化方法

      2.1 微粒群算法

      Kennedy和Eberhart在1995年提出了粒子群優(yōu)化進化算法(Particle Swarm Optimization algorithm, PSO), 與其他進化算法相類似, PSO算法也是通過個體間的協(xié)作與競爭, 實現(xiàn)在復雜空間中最優(yōu)解的搜索[13]. PSO算法借用了“群體”和“進化”的概念, 依據粒子的適應值大小進行變換操作, 但是與其它進化算法的不同在于, 它同時保留和利用了位置和速度信息, 從理論上將進化規(guī)劃有更大可能在優(yōu)化點區(qū)域內獲取, PSO有更大可能更快的抵達最優(yōu)解.

      在PSO優(yōu)化算法中, 離子從進化種群中可以提取的信息包括群體的最優(yōu)位置、粒子的全局極值以及單個粒子的個體極值, 其中群體最優(yōu)位置使得粒子能夠快速收斂形成微粒群, 并對全局極值的鄰域進行搜索, 個體自身經驗最優(yōu)位置保證粒子不至于過快收斂到群最優(yōu), 而陷入局部極小點, 使得粒子能夠在一次迭代中對個體極值和全局極值之間的區(qū)域進行搜索.

      2.2 基于PSO的感知小波語音閾值去噪方法

      小波變換已經成為信號處理領域噪聲消除的強有力工具, 本文在常規(guī)小波閾值去噪方法的基礎上, 提出了一種分層閾值優(yōu)化的語音感知小波去噪方法, 具體包括以下步驟:

      Step1:利用聽覺感知小波對包含噪聲的語音信號進行多層分解. 設含噪語音信號表示為:

      其中,為純凈語音信號,為加性噪聲,為含噪語音信號,為信號的長度. 對上述含噪語音信號利用公式(1)和公式(4)進行聽覺感知小波變換分解, 得到小波系數(shù).

      Step2: 初始化微粒群參數(shù), 包括算法控制參數(shù)、粒子的速度、位置以及設置最大迭代次數(shù).

      Step3: 采用去噪信號的信噪比(Signal to Noise Ratio, SNR)作為適應值函數(shù), 將PSO中的位置參數(shù)作為要尋優(yōu)的小波閾值. 采用本文所提出的閾值函數(shù)對小波分解以后的系數(shù)進行處理, 便可以獲得估計信號.

      Step4:評價粒子的個體極值和種群全局極值. 具體評價包括2部分: ① 目標函數(shù)值的比較. 如果粒子當前的目標函數(shù)值小于以前獲得的最優(yōu)目標函數(shù)值, 則需要將當前的目標函數(shù)值作為最優(yōu)的個體極值P, 否則,P保持不變. ②適應值的比較. 如果當前粒子的適應值小于全局所經歷的最好位置P, 則需要將當前的適應值作為最好的位置P, 相反則P保持不變.

      Step5: 更新群中粒子的速度和位置.

      Step6:判斷粒子的更新結束與否. 判斷粒子的迭代次數(shù)是否達到了預先設定值, 是否滿足精度要求, 如果滿足要求, 則停止迭代, 否則重復上述Step2~Step5.

      利用上述微粒群優(yōu)化算法可以獲得不同信噪比下的最優(yōu)分層閾值POS, 再結合本文提出的閾值函數(shù), 完成對含噪語音信號的噪聲消除.

      3 仿真實驗和結果分析

      本文采用傳統(tǒng)的軟閾值函數(shù)、硬閾值函數(shù)、文獻[4]方法和本文提出的采用微粒群優(yōu)化后的分層閾值方法進行去噪實驗. 具體實驗過程:首先從863語音庫中選取語音樣本, 然后設置信號的采樣頻率(文中為8 kHz), 最后通過改變高斯白噪聲(0,W2)的噪聲方差W2來達到調節(jié)語音信號輸出信噪比的目的, 實驗中調節(jié)范圍為-10~10 dB, 間隔為5 dB. 實驗用窗函數(shù)選取漢寧窗, 經過多次試驗參數(shù)取0.564 2. PSO算法中的參數(shù)設置為: 種群數(shù)目25, 最大迭代次數(shù)100, 學習因子1,2均為1.370 6. 采用Morlet函數(shù)作為聽覺感知小波的母小波函數(shù), 變換尺度為22, 分解層數(shù)為3. 仿真結果如表1所示, 表1給出了4種語音去噪方法在-10~10 dB間的信噪比的改善情況.

      表1 4種算法在10、5、0、-5、-10 dB處信噪比改善情況

      圖1給出了信噪比為-10 dB時不同去噪算法的仿真圖, 其中, 圖1(a)為純凈的語音信號, 圖1(b)為帶噪語音信號, 圖1(c)、(d)、(e)、(f)分別為采用聽覺感知小波變換的硬閾值法、軟閾值法、文獻[4]方法和本文研究所述方法去噪后的仿真圖形.

      圖1 采用不同閾值法去噪后的語音波形

      由圖1可知, 不同去噪方法的效果差別很大, 如: 硬閾值去噪法具有對噪聲消除不夠徹底, 而且圖形中存在局部振蕩和突變現(xiàn)象; 軟閾值去噪法可以在一定程度上消除噪聲, 但對語音的損害較大, 導致語音質量下降; 文獻[4]的方法能夠較好地去除背景噪聲, 聽覺效果有明顯提高, 但在不同分解層次上小波層次不齊, 進而影響最終去噪效果. 本文提出的方法克服了上述問題, 對語音質量有較大的改善.

      表1數(shù)據進一步說明, 隨著信噪比的降低, 本文方法對噪聲的抑制效果也越來越明顯, 其原因主要是因為聽覺感知小波變換保證了人耳對信號幅度以及頻率的聽覺特性, 微粒群優(yōu)化閾值能夠保證最優(yōu)的分層閾值. 結合人耳的聽覺測試, 進一步說明本文提出的分層閾值優(yōu)化的語音感知小波去噪方法具有較好的聽覺效果, 能夠滿足通信中語音信號的質量要求.

      4 結束語

      針對傳統(tǒng)小波變化去噪方法存在的一些問題, 本文從小波變換后閾值函數(shù)和閾值的優(yōu)化問題出發(fā), 進行了相應的改進和優(yōu)化. 本文方法兼顧了人耳對聲音信號的感知特性, 構造了新的閾值函數(shù), 并對小波變換后的閾值進行基于PSO算法的參數(shù)優(yōu)化. 實驗結果表明, 本文方法能有效地去除語音信號中包含的高斯白噪聲, 提高峰值信噪比, 并能較好地保留語音信號的細節(jié). 與小波硬閾值法、軟閾值法、感知小波軟閾值法相比, 本文方法在不同信噪比條件下均具有較好的去噪性能, 在語音波形的視覺和聽覺效果2方面都有明顯地改善.

      [1] You C H, Rahardja S, Koh S N. Audible noise reduction in eigendomain for speech enhancement [J]. Audio Speech and Language Processing, IEEE Transactions on, 2007, 15(6): 1753—1765.

      [2] 李如瑋, 鮑長春. 基于小波變換的語音增強算法綜述[J]. 數(shù)據采集與處理, 2009, 24(3): 362—368.

      [3] Ephraim Y, Malah D. Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator [J]. IEEE Trans Acoust, Speech Signal Process, 1984, 32(6): 1109—1121.

      [4] Donoho D L. De-noising by soft-thresholding [J]. IEEE Trans on Information Theory, 1995, 41(3):613—627

      [5] Mallat S, Hwang W L. Singularity Direction and Processing with Wavelets [J]. IEEE Trans on IT, 1992, 38(2): 617—643.

      [6] Yu Shao, Chip-Hong Chang. A versatile speech enhancement system based on perceptual wavelet denoising [J]. Circuits and Systems, 2005(2): 23—26.

      [7] 曹斌芳, 李建奇. 一種基于聽覺特性的自適應小波語音增強方法[J]. 計算機工程與應用, 2012, 47(33): 123—125.

      [8] Tao Z, Zhao H, Gu J, et al. Speech feature extraction of cochlear implants on the basis of auditory perception wavelet transform [C]. Shanghai: Audio, Language and Image Processing, 2008. ICALIP 2008. International Conference on IEEE, 2008: 80—86.

      [9] Virag N. Single channel speech enhancement based on masking properties of the human auditory system [J]. Speech and Audio Processing, IEEE Transactions on, 1999, 7(2): 126—137.

      [10] Hu Y, Loizou, Philipos C. Speech enhancement based on wavelet thresholding the multitaper spectrum [J]. IEEE Trans on Speech and Audio Processing, 2004, 12(1): 59—67.

      [11] Lei S F, Tung Y K. Speech enhancement for nonstationary noises by wavelet packet transform and adaptive noise estimation [C]. Hongkong: International Sym. on Intelligent Signal Processing and Comm. Systems, 2005: 41—44.

      [12] Donoho D L, Yu T P Y. Robust nonlinear wavelet transform based on median-interpolation [J]. Conference Record of the Thirty-First Asilomar Conference on. IEEE, 1997, 1: 75—79.

      [13] Kennedy J, Eberhart R. Particle swarm optimization [J]. Proceedings of IEEE international conference on neural networks, 1995, 4(2): 1942—1948.

      Speech de-noising algorithm of perception wavelet transform based on hierarchical threshold optimization

      CAO BinFang, PENG GuangHan, PENG YuanJie, LI XiaoQin

      (College of Physics and Electronics Science, Hunan University of Arts and Science, Changde 415000, China)

      By analyzing the characteristicof noisy speech signals, audio perception wavelet transform was introduced, which considered human auditory effect. New wavelet threshold function was constructed and hierarchical optimization was performed based on particle swarm optimizationalgorithm after wavelet transform. Simulation indicated that the proposed method had a good de-noising effect under circumstances of different signal-noise-ratio(SNR) , improved speech intelligibility and auditory effect.

      speech de-noising; auditory perception wavelet transform; Hierarchical threshold; particle swarm optimization

      TN 912

      1672-6146(2014)02-0035-05

      10.3969/j.issn.1672-6146.2014.02.008

      通訊作者email: cao_bf@163.com.

      2014-05-06

      湖南省科技計劃資助項目(2010SK3052); 光電信息集成與光學制造技術湖南省重點實驗室資助項目; 湖南文理學院重點學科建設項目(無線電物理).

      (責任編校: 江 河)

      猜你喜歡
      小波語音閾值
      構造Daubechies小波的一些注記
      科技風(2021年19期)2021-09-07 14:04:29
      基于MATLAB的小波降噪研究
      電子制作(2019年13期)2020-01-14 03:15:32
      小波閾值去噪在深小孔鉆削聲發(fā)射信號處理中的應用
      魔力語音
      基于MATLAB的語音信號處理
      電子制作(2019年14期)2019-08-20 05:43:38
      基于MQ3與MP3的價廉物美的酒駕語音提醒器
      電子制作(2019年9期)2019-05-30 09:42:10
      基于自適應閾值和連通域的隧道裂縫提取
      對方正在輸入……
      小說界(2018年5期)2018-11-26 12:43:42
      基于改進的G-SVS LMS 與冗余提升小波的滾動軸承故障診斷
      比值遙感蝕變信息提取及閾值確定(插圖)
      河北遙感(2017年2期)2017-08-07 14:49:00
      定州市| 新民市| 侯马市| 望谟县| 定远县| 靖边县| 师宗县| 铜山县| 花莲市| 阿城市| 天水市| 高安市| 凤冈县| 平凉市| 息烽县| 宜兰县| 舒城县| 盈江县| 新竹县| 武隆县| 水富县| 独山县| 申扎县| 康马县| 青海省| 扎囊县| 富源县| 湖州市| 广安市| 浦东新区| 孙吴县| 伊金霍洛旗| 诸暨市| 汉源县| 罗田县| 曲沃县| 灵武市| 进贤县| 九江县| 平昌县| 昌吉市|