張啟明
摘 要:目前,盲源分離技術(shù)廣泛應(yīng)用于電子信號(hào)處理領(lǐng)域,但盲源分離中各算法的分離效果具有較大差異。對(duì)此,本文以盲源分離理論中的AMUSE算法為研究對(duì)象,通過MATLAB生成的周期性函數(shù)信號(hào)和隨機(jī)收集的4種語音信號(hào)進(jìn)行仿真試驗(yàn),并選取相似系數(shù)作為AMUSE算法的評(píng)價(jià)準(zhǔn)則。試驗(yàn)結(jié)果以及評(píng)價(jià)準(zhǔn)則表明,AMUSE算法對(duì)信號(hào)的分離效果出色,且對(duì)噪聲具有較好的魯棒性。
關(guān)鍵詞:盲源分離;AMUSE算法;信號(hào)處理;仿真試驗(yàn)
Abstract: At present, blind source separation technology is widely used in the field of electronic signal processing. but the separation effect of each algorithm in blind source separation is different. In this regard, this paper took the AMUSE algorithm in the blind source separation theory as the research object, and conducted simulation experiments through the periodic function signal generated by MATLAB and four randomly collected speech signals, and selected the similarity coefficient as the evaluation criterion of the AMUSE algorithm. The test results and evaluation criteria show that the AMUSE algorithm has excellent signal separation effect and good robustness to noise.
Keywords: blind source separation; AMUSE algorithm; signal processing; simulation experiment
1 基本理論
1.1 盲源分離
盲源分離(Blind Sources Separation,BSS)指的是在源信號(hào)未知的情況下,從觀測(cè)到的信號(hào)中提取出各個(gè)初始源信號(hào)的過程,盲源分離中的“盲”主要表現(xiàn)為源信號(hào)未知、源信號(hào)之間的混合方式未知或者只知道少量的先驗(yàn)知識(shí)[1]。其中,“雞尾酒會(huì)”問題(Cocktail Party Problem)是盲源分離中的典型問題,具體可以表述為:假設(shè)你參加了一個(gè)雞尾酒會(huì),在會(huì)場(chǎng)上有許許多多的聲源,如賓客之間的談話聲(可能包括不同的語言)、酒會(huì)樂隊(duì)的演奏聲以及門外的噪聲,如果此時(shí)在會(huì)場(chǎng)不同位置上有足夠多的麥克風(fēng)記錄這些聲音,那么每個(gè)麥克風(fēng)所記錄的聲音信號(hào)即為會(huì)場(chǎng)內(nèi)眾多語音信號(hào)的混合信號(hào)。在事先不知道記錄下哪些聲音信號(hào),也不知道麥克風(fēng)位置的情況下,如何從麥克風(fēng)收集到的混合信號(hào)中提取所需要談話者的聲音就是典型的盲源分離問題。
盲源分離最早可以追溯到20世紀(jì)80年代,當(dāng)時(shí)是為了解決數(shù)字通信中線性單輸入單輸出(Single Input Single Output,SISO)統(tǒng)計(jì)信道的補(bǔ)償問題而發(fā)展起來的多輸入多輸出系統(tǒng)(Multiple-Input Multiple-Output,MIMO)。HERAULT J完成了奠基性的工作,提出了H-J學(xué)習(xí)算法,并通過該算法將兩個(gè)互不相關(guān)的源信號(hào)的混合信號(hào)分離開來[2]。
盲源分離的數(shù)學(xué)模型具體表述如下:在多輸入多輸出系統(tǒng)中,傳感器觀測(cè)到的信號(hào)如式(1)所示,要求找到一個(gè)逆系統(tǒng),以得到原始的源信號(hào),如式(2)所示,各源信號(hào)之間的混合方式未知。原理如圖1所示,圖中,[nt]表示噪聲干擾信號(hào);[Yt]表示經(jīng)過分離矩陣W分離處理后的觀測(cè)信號(hào)的近似信號(hào);[W]表示為樣點(diǎn)數(shù)。
因?yàn)槊ぴ捶蛛x中“盲”的特性,需要做出一些假定來確保分離結(jié)果具有唯一解。假定如下:①源信號(hào)為平穩(wěn)隨機(jī)過程信號(hào)且至多只有一個(gè)信號(hào)服從高斯分布;②源信號(hào)矩陣中各個(gè)行向量相互獨(dú)立;③混合矩陣[Α]為滿秩矩陣。
1.2 AMUSE算法
Tong等人提出,當(dāng)觀測(cè)信號(hào)中的源信號(hào)具有非平穩(wěn)隨機(jī)的信號(hào)特性時(shí),可以通過求解其相關(guān)矩陣的特征值達(dá)到盲源分離的目的[3]。該理論對(duì)應(yīng)的盲源分離算法即為多源提?。ˋlgorithm of Multiple Unknow Signals Extraction,AMUSE)。
AMUSE算法是一種典型的基于二階統(tǒng)計(jì)量的盲源分離算法,在進(jìn)行盲源分離時(shí),除需要滿足盲源分離的基本假定外,必須對(duì)傳感器收集到的觀測(cè)信號(hào)進(jìn)行預(yù)處理[4]。白化矩陣可通過求解觀測(cè)信號(hào)自相關(guān)矩陣的奇異值得到。選取經(jīng)白化處理后觀測(cè)信號(hào)對(duì)應(yīng)自相關(guān)矩陣時(shí)間延遲常數(shù)[τ],對(duì)時(shí)間延遲常數(shù)[τ]的自相關(guān)矩陣進(jìn)行奇異值分解,若時(shí)間延遲常數(shù)[τ]的自相關(guān)矩陣的奇異值各不相同,則通過兩次奇異值分解即可成功構(gòu)造出最終的分離矩陣W,進(jìn)而完成盲源分離。AMUSE算法實(shí)質(zhì)上是將復(fù)雜的信號(hào)處理問題轉(zhuǎn)化為簡(jiǎn)單的矩陣計(jì)算問題。
本文選用盲源分離中較為經(jīng)典的AMUSE算法,主要是因?yàn)锳MUSE算法中關(guān)于時(shí)間延遲的自相關(guān)矩陣可以是觀測(cè)信號(hào)的任意相關(guān)矩陣,可以是任何值,這樣就相當(dāng)于擴(kuò)大了AMUSE算法的適用范圍。因此,無論是非白信號(hào)還是平穩(wěn)信號(hào),都可以使用AMUSE算法分離。因?yàn)槊ぴ捶蛛x并不知道觀測(cè)信號(hào)的先驗(yàn)信息,因此在對(duì)觀測(cè)信號(hào)進(jìn)行AMUSE算法處理前,需要對(duì)觀測(cè)信號(hào)進(jìn)行數(shù)據(jù)的預(yù)處理。
1.3 盲源分離的算法評(píng)價(jià)準(zhǔn)則
盲源分離算法的評(píng)價(jià)準(zhǔn)則是衡量算法分離效果的重要依據(jù),其中相似系數(shù)是較為常用且計(jì)算便捷的算法評(píng)價(jià)準(zhǔn)則。相似系數(shù)是通過比較分離前后各信號(hào)之間的相似程度,進(jìn)而以此為依據(jù)來衡量盲源分離算法好壞的一種評(píng)價(jià)準(zhǔn)則[5]。
相似系數(shù)這種評(píng)價(jià)準(zhǔn)則避免了因幅值不確定性帶來的影響,可以客觀真實(shí)地評(píng)價(jià)分離效果。若相似系數(shù)趨近于1,則可認(rèn)為盲源分離的算法分離效果較好。
2 信號(hào)仿真試驗(yàn)
選用AMUSE算法作為分離算法,利用MATLAB軟件工具進(jìn)行信號(hào)仿真試驗(yàn),仿真信號(hào)源分別為確定時(shí)序的隨機(jī)函數(shù)信號(hào)和電腦收集的語音信號(hào)兩種情況,并選取相似系數(shù)作為算法評(píng)價(jià)準(zhǔn)則。
實(shí)例一:利用MATLAB編程語句隨機(jī)生成3種確定時(shí)序的周期性平穩(wěn)信號(hào)和平穩(wěn)白噪聲信號(hào)。3種確定時(shí)序的周期性平穩(wěn)信號(hào)分別為周期為40的余弦信號(hào)、周期為20的正弦信號(hào)以及方波脈沖信號(hào)。平穩(wěn)白噪聲信號(hào)由一隨機(jī)數(shù)列組成。源信號(hào)如圖2所示?;旌虾蟮挠^測(cè)信號(hào)如圖3所示,運(yùn)用AMUSE算法對(duì)其進(jìn)行分離,分離結(jié)果如圖4所示。
在圖2、3、4中,因?yàn)榉凳怯脕砗饬坎ㄐ蔚拇笮?,故縱坐標(biāo)幅值是沒有單位的。
源信號(hào)與分離信號(hào)的相似系數(shù)分別為0.998、0.999、0.997、0.999,因相似系數(shù)的數(shù)值接近于1,說明AMUSE算法分離效果良好,且對(duì)噪聲具有較好的魯棒性;可以在噪聲干擾下有效分離出混合信號(hào)中的噪聲信號(hào)和3種函數(shù)信號(hào)。
在圖5、6、7中,因?yàn)榉凳怯脕砗饬坎ㄐ蔚拇笮?,故縱坐標(biāo)幅值是沒有單位的。
源信號(hào)與分離信號(hào)的相似系數(shù)分別為0.921、0.919、0.9992、0.948,分離前后語音信號(hào)相似系數(shù)均在0.9以上,說明AMUSE算法對(duì)語音信號(hào)的分解效果良好,可將語音混合信號(hào)一一分離出來,得到初始的語音源信號(hào)。
3 結(jié)論
本文以盲源分離中的AMUSE算法為研究對(duì)象,通過MATLAB軟件進(jìn)行了兩次信號(hào)仿真試驗(yàn)。試驗(yàn)一中分離前后的函數(shù)信號(hào)的相似系數(shù)最小值為0.9925,試驗(yàn)二中分離前后的語音信號(hào)的相似系數(shù)最小值為0.9198,均非常趨近于1,表明AMUSE算法的分離效果良好。
參考文獻(xiàn):
[1]張洪淵.信號(hào)源盲分離的理論與實(shí)驗(yàn)研究[D].上海:上海交通大學(xué),2000:24.
[2]HERAULT J. Space and Time Adaptive Signal Processing by Neural Network Models.Neural Network for Computing[C]//AIP Conference Processing,1986.
[3]TONG L,LIU RW,SOON VC,et al. Indeterminacy and Identifiability of Blind Identification[J]. IEEE Transactions on Circuits & Systems,1991(5):499-509.
[4]LANG T,LIU R.Blind Estimation of Correlated Source Signals[C]//Conference Record Twenty-fourth Asilomar Conference on Signals. IEEE,1990.
[5]黃艷波.單通道盲源分離算法的研究[D].杭州:杭州電子科技大學(xué),2017:12.