張 華,左健存,戴 虹,桂 林
(上海第二工業(yè)大學(xué)計算機(jī)與信息工程學(xué)院,上海201209)
?
基于Givens-Hyperbolic雙旋轉(zhuǎn)的多路語音信號卷積盲分離
張華,左健存,戴虹,桂林
(上海第二工業(yè)大學(xué)計算機(jī)與信息工程學(xué)院,上海201209)
摘要:針對語音信號的卷積混迭模型,通過對接收信號進(jìn)行滑窗處理并重新排列,使得重構(gòu)后的接收信號可表示為塊獨立的源信號與擴(kuò)展的混迭矩陣的瞬時混迭模型。利用不同語音信號之間的近似獨立和短時平穩(wěn)特性,分析接收信號二階相關(guān)矩陣的非正交聯(lián)合塊對角化結(jié)構(gòu)。改進(jìn)基于Givens和Hyperbolic旋轉(zhuǎn)的瞬時混疊盲分離算法,提出Givens-Hyperbolic雙旋轉(zhuǎn)的聯(lián)合塊對角化算法(GH-JBD)。所提出的GH-JBD算法可以直接在時域估計傳輸信道的塊本質(zhì)相等矩陣,實現(xiàn)非正交聯(lián)合塊對角化,進(jìn)而完成卷積混疊信號盲分離。該方法不需要進(jìn)行預(yù)白化處理,避免了由于白化不徹底而引入的額外誤差。仿真實驗驗證了該算法的有效性并就參數(shù)變化對分離信號的影響進(jìn)行了分析。
關(guān)鍵詞:卷積盲分離;非正交聯(lián)合塊對角化;Givens-Hyperbolic雙旋轉(zhuǎn);置換矩陣
盲源分離是指在源信號和傳輸通道參數(shù)未知的情況下,依據(jù)源信號的統(tǒng)計特性,僅由接收信號分離各個源信號的過程。近年來,隨著盲分離技術(shù)的發(fā)展,盲源分離算法可有效應(yīng)用于語音信號處理、圖像處理、移動通信以及雷達(dá)信號處理等各個領(lǐng)域[1-12]。
根據(jù)不同的信號混迭方式,盲分離問題可分為瞬時盲分離[1-5]和卷積盲分離[6-8]。聯(lián)合對角化(Joint Diagonlization,JD)方法是解決瞬時盲分離問題的最為有效的手段。Cardoso等[1]首先提出了基于Givens旋轉(zhuǎn)(又稱Jacobi旋轉(zhuǎn))的JADE方法,通過對接收信號的四階累積量切片矩陣進(jìn)行正交聯(lián)合對角化,得到混迭矩陣的估計,實現(xiàn)獨立多分量瞬時盲分離。以JADE為代表的基于Givens旋轉(zhuǎn)的JD方法,具有收斂速度快、計算復(fù)雜度低的特點。在此基礎(chǔ)上,利用信號的二階矩陣組,提出基于Givens旋轉(zhuǎn)的SOBI方法[2],實現(xiàn)多個二階不相關(guān)信號的瞬時盲分離;另一方面,自Cardoso等[1]通過將傳輸信道混合矩陣分解為多個Givens矩陣相乘的形式,提出JADE算法,解決了信號瞬時盲分離問題。此后,越來越多的矩陣分解方法被用于解決多路信號瞬時混迭盲分離問題,如Afsari[3]提出基于矩陣的三角分解(LU)的LUJD算法以及基于矩陣的正交分解(QR)的QRJD算法,Wang[4]提出基于三角分解的DNJD算法,Souloumiac[5]結(jié)合Givens 和Hyperbolic旋轉(zhuǎn)推導(dǎo)出J-Di算法,有效地實現(xiàn)非正交聯(lián)合對角化算法?;诼?lián)合對角化的瞬時盲分離問題已經(jīng)得到廣泛而完善的研究。
然而,因傳輸信道的多徑效應(yīng),接收信號一般是源信號與傳輸信道矩陣的卷積混迭信號,瞬時盲分離算法不適用于此類場景。而卷積盲分離算法可以較好地解決這一問題。Bousbia-Salah[6]等開創(chuàng)性地將改進(jìn)的二階盲辨識(Second-Order Blind Identification,SOBI)方法用于實現(xiàn)聯(lián)合塊狀對角化(Joint Block-Diagonalization,JBD),直接在時域解決卷積盲分離問題。此后,改進(jìn)并歸納總結(jié)了基于Givens旋轉(zhuǎn)的正交JBD算法[7-8]。通常稱此類方法為類Jacobi方法。與正交JD方法類似,正交JBD算法要求對傳輸信道矩陣進(jìn)行預(yù)白化處理。非正交JBD方法可以避免由于預(yù)白化處理而引入誤差[5]。
針對上述問題,本文根據(jù)不同語音信號相互獨立以及短時平穩(wěn)的特性,分析接收信號相關(guān)矩陣組具有聯(lián)合塊對角化結(jié)構(gòu),將J-Di方法加以推廣,提出一種基于Givens-Hyperbolic旋轉(zhuǎn)的非正交塊聯(lián)合對角化方法——GH-JBD算法,在時域解決語音信號的卷積盲分離問題。該方法不需要對接收信號進(jìn)行預(yù)白化處理,避免了由于白化不徹底而引入的額外誤差。仿真實驗驗證了該算法的有效性并就參數(shù)變化對分離性能的影響進(jìn)行了分析。
假定有N個源信號sn(t)(n=1,2,···,N)經(jīng)過階數(shù)為P的多徑信道,由M(M>N)個麥克風(fēng)接收,第m路接收信號可記為
式中,amn(p)表示第n個信源到達(dá)第m個接收陣元的第p條信道響應(yīng)。
取長度為W的滑窗對接收信號進(jìn)行滑窗處理。定義源信號與接收信號矢量分別為定義混疊矩陣為A∈CMW×N(P+W+1),那么混疊矩陣可表示為分塊矩陣的形式:
那么根據(jù)式(1)有
此時,式(1)所示卷積混迭模型就轉(zhuǎn)化為式(2)所示的源信號矢量s(t)與混迭矩陣A的瞬時混迭模型。為了使得混迭矩陣A滿足列滿秩的條件,通過選擇適當(dāng)?shù)挠^測窗長W,使得MW> N(P+W?1)[6-8]。為了便于描述,令Q=P+W?1表示源信號子塊維數(shù);令J=MW,I=NQ分別表示接收信號與源信號適量的維數(shù)。不失一般性假設(shè)I=J(當(dāng)J>I時,可通過降維處理,使得I=J)。
考慮到不同語音信號近似獨立以及短時平穩(wěn)的特點,易知
由式(4)易知,接收信號相關(guān)矩陣具有可聯(lián)合塊對角化結(jié)構(gòu)。
下一節(jié)將給出一種基于Givens-Hyperbolic雙旋轉(zhuǎn)的非正交塊聯(lián)合對角化方法——GH-JBD算法:從一組接收信號相關(guān)矩陣R(l)(l=1,2,···,L)中,估計出解混疊矩陣B,使得y(t)=Bx(t)中包含N個與源信號一一對應(yīng)的相互獨立的分離信號。
2.1J-Di算法實現(xiàn)中JD與JBD的關(guān)系
盡可能最小。其中矩陣
將矩陣PQ表示為分塊矩陣的形式,其中第(m,n)塊子矩陣表示為若對于任意m= 1,2,···,N,有且僅有一個n∈{1,2,···,N},使得那么稱矩陣PQ為廣義Q-置換矩陣[7]。若分離矩陣B使得BA=PQ,那么矩陣為塊對角矩陣。也就是說,矩陣B使得所有的目標(biāo)矩陣都轉(zhuǎn)化為塊對角矩陣,即實現(xiàn)了聯(lián)合塊對角化。此時,代價函數(shù)J(B)達(dá)到最小點0。分離信號可表示為
式中,fn(q)表示矩陣PQ按行數(shù)第n個子矩陣的第q列。式(7)表明分離矩陣的任意子塊只與其中一個源信號相關(guān),而與其他源信號相互獨立[6-8]??紤]到盲分離固有的排列不定性的影響,不能保證n0=n,然而,這并不影響分離效果,只是改變分離信號的輸出次序。
本文將J-Di算法[6]擴(kuò)展應(yīng)用于求解式(4)所示的卷積盲分離聯(lián)合塊對角化問題時,可歸納出如下的規(guī)律性結(jié)論:
下面,通過直觀的實驗來驗證上述結(jié)論的正確性。選擇混疊參數(shù)N=3,M=6,濾波器階數(shù)P=3,觀測滑窗長W=2,因此有Q=5,J=I=12。構(gòu)造L=9個12×12維的矩陣組R(l)=AΛ(l)AH,其對角線上的子矩陣Λn(l)∈C5×5(n=1,2,3)列滿秩的混疊矩陣A 由Matlab語言randn(I)隨機(jī)產(chǎn)生。該實驗通過J-Di的聯(lián)合對角化方法和一個“合理”的置換矩陣,估計可以最小化代價函數(shù)式(5)的解混疊矩陣B。圖1(a)為僅經(jīng)J-Di算法得到的對角矩陣組的灰度圖,圖1(b)經(jīng)過置換矩陣處理后得到的聯(lián)合塊對角矩陣組的灰度圖。圖中顏色越深代表元素絕對值越大,顯然圖1(b)通過估計一個置換矩陣,更好地將矩陣組中非0元素聚集在對角塊矩陣中,即有效地實現(xiàn)了聯(lián)合塊對角化。由圖1易知,給定一組具有式(4)所示結(jié)構(gòu)的目標(biāo)矩陣,將聯(lián)合對角化的J-Di算法與置換矩陣P估計算法相結(jié)合,可以實現(xiàn)聯(lián)合塊對角化。
基于此,本文提出如下的改進(jìn)型J-Di算法:由GH-JBD來實現(xiàn)卷積盲分離中的聯(lián)合塊對角化。該方法首先通過J-Di算法對目標(biāo)矩陣進(jìn)行聯(lián)合對角化操作,得到JD分離矩陣BJD以及;其次,估計置換矩陣P,使得盡可能地為塊對角矩陣;最后,令B=PBJD,得到JBD分離矩陣的估計B。
2.2置換矩陣的估計
通過反復(fù)交換矩陣組ΦJD(l)(l=1,2,···,L)的行與列,使矩陣中非0元素盡可能地出現(xiàn)在對角線上的子矩陣中,逐步使交換后的矩陣Φ(l)=PΦJD(l)PT接近塊對角化結(jié)構(gòu)。基于這一思想,給出一種簡單有效的計算置換矩陣P的方法如下。
圖1 JD和JBD得到的塊對角矩陣各元素灰度圖的比較Fig.1 Grey-scale comparison of elements of block diagonal matrices derived from both JD and JBD algorithms
2.3GH-JBD算法實現(xiàn)
(1)根據(jù)式(1),構(gòu)造接收信號矢量x(t);
(2)計算x(t)在L個不同時延下的相關(guān)矩陣,記為R(1),R(2),···,R(L);
(3)給定目標(biāo)矩陣組R(1),R(2),···,R(L),通過J-Di算法,估計JD分離矩陣BJD,以及矩陣組
(4)給定ΦJD(l)(l=1,2,···,L),求置換矩陣P和解卷積混迭矩陣B;
(5)計算分離信號y(t)=Bx(t)。
實驗1采用全局拒噪水平GRL以及非對角塊矩陣與對角塊矩陣的F-范數(shù)平方和之比Roffon兩個性能指標(biāo)來衡量塊對角矩陣特性。經(jīng)過100次獨立實驗,通過構(gòu)造100組每組L個具有聯(lián)合塊對角化特性的矩陣組,驗證2.2節(jié)給出的置換矩陣估計算法的有效性,并分析目標(biāo)矩陣個數(shù)L、矩陣維度N 和Q對算法性能的影響。其次,將該方法用于高斯多徑信道下的語音信號卷積混迭場景,驗證該方法的實用效果。
實驗1給定目標(biāo)矩陣組R(l)=AΛ(l)AH(l=1,2,···,L),其中,混迭矩陣A∈CNQ×NQ,與塊對角矩陣Λ(l)=bdiag{Λ1(l),···,ΛN(l)},Λn(l)∈CQ×Q的每個元素隨機(jī)產(chǎn)生,且服從(0,1)正態(tài)分布。采用如下兩個性能參數(shù)來衡量混迭矩陣估計和JBD效果:
(1)采用全局拒噪水平GRL[11],來衡量解混迭矩陣B的估計精度;
(2)采用Roffon來衡量JBD性能:令近似塊兒對角矩陣組Φ(l)=BR(l)BT(l=1,2,···,L),則
顯然,Roffon越小,聯(lián)合塊對角化性能越好。
不同的混疊參數(shù),(N,Q)分別為(5,5),(6,6)和(7,7)下,圖2和圖3分別給出GRL和Roffon隨目標(biāo)矩陣個數(shù)L變化的曲線。易知,①當(dāng)目標(biāo)矩陣維數(shù)I=N×Q增大時,混迭矩陣的估計精度GRL和JBD性能Roffon都受到輕微的影響;②隨著目標(biāo)矩陣個數(shù)L的增大,GRL和Roffon都有所改善。因此,當(dāng)目標(biāo)矩陣維數(shù)增大時,可通過增多目標(biāo)矩陣個數(shù)來改善GRL和Roffon。
圖2 GRL隨L變化曲線Fig.2 GRL curves with respect to L
圖3 Roffon隨L變化曲線Fig.3 Roffoncurves with respect to L
圖4 源信號,接收信號,與分離信號波形圖Fig.4 The waveform of source signal,receiving signal and separated signal
實驗2N=6段語音信號(如圖4(a)所示),通過P=5的高斯多徑信道,由M=10個麥克風(fēng)接收,得到如圖4(b)所示的接收信號。為了滿足假設(shè)MW>N(P+W?1),選擇滑動窗長W=6,此時子矩陣Q=P+W?1=10。圖4(c)和4(d)所示分別為本文方法和類Jacobi方法得到的分離信號波形。其中,在采用類Jacobi方法之前,進(jìn)行預(yù)白化處理[11]。比較圖4(a)源信號波形圖,可以直觀地看出,本文方法可以較好地分離各源信號。此外,①采用分離信號與對應(yīng)的源信號之間的巴克譜失真測度BSD[12](如圖5所示)客觀評價兩種方法性能;②比較本文所提方法,類Jacobi方法以及Ghennioui等提出的非正交聯(lián)合塊對角化算法[10]分離性能參數(shù)PI[11](單位dB),如圖6所示。PI值越小說明分離信號之間的相異度越高,即分離得越徹底;BSD值越小說明分離出的信號與源語音信號之間的譜失真度越小,即分離信號的失真程度越低。由圖5、6不難看出,與類Jacobi方法及Ghennioui等人提出的非正交聯(lián)合塊對角化算法相比,本文方法能夠得到更加有效的分離性能,其中PI值改善了3.858 dB,BSD均值改善了0.1。
圖5 分離信號與源信號BSD曲線圖Fig.5 BSD curves of separation and source signals
圖6 分離信號與源信號相似度曲線圖Fig.6 Similarity curves of separation and source signals
利用不同語音信號間近似相互獨立的性質(zhì),多段語音信號經(jīng)多徑傳輸信道后得到的接收信號,經(jīng)過重新排列后可表示為塊獨立的源信號與擴(kuò)展的混迭矩陣的時域瞬時混迭模型。利用不同語音信號之間的近似獨立和短時平穩(wěn)特性,分析重新排列后接收信號二階相關(guān)矩陣的聯(lián)合塊對角化結(jié)構(gòu),提出一種尋找置換矩陣的后處理方法GH-JBD,對基于Givens和Hyperbolic旋轉(zhuǎn)的非正交聯(lián)合對角化方法進(jìn)行后處理,使之可以實現(xiàn)聯(lián)合塊對角化,并將其用于語音信號卷積盲分離。實驗表明,在不同的信噪比下,與傳統(tǒng)的類Jacobi方法相比,本文提出的GH-JBD方法得到的分離信號與源信號相似度較高,能有效地解決語音信號卷積盲分離問題。
參考文獻(xiàn):
[1]CARDOSO J F,SOULOUMIAC A.Blind beamforming for non-gaussian signals[J].IEE Proceeding of the Radar and Signal Processing,1993,140(6):362-370.
[2]BELOUCHRANI A,ABED-MARAIM K,CARDOSO J F,et al.A blind source separation technique using secondorder statistics[J].IEEE Transactions on Signal Process,1997,45(2):434-444.
[3]AFSARI B.Simple LU and QR based on non-orthogonal matrix joint diagonalization[C]//Independent Component Analysis and Blind Source Separation.Charleston:Springer-Verlag,2006:1-7.
[4]WANG F X,LIU Z K,ZHANG J.Non-orthogonal joint diagonalization algorithm based on trigonometric parametrization[J].IEEE Transactions on Signal Processing,2007,55(11):5299-5308.
[5]SOULOUMIAC A.Non-orthogonal joint diagonalization by combining givens and hyperbolic rotation[J].IEEE Transactions on Signal Processing,2009,57(6):2222-2231.
[6]BOUSBIA-SALAH H,BELOUCHRANI A,ABEDMERAIM K.Jacobi-like algorithm for blind signal separation of convolutive mixture[J].Electron.Letters,2001,37(16):1049-1050.
[7]ABED-MERAIM K,BELOUCHARNI A.Algorithms for joint block diagonalization[C]//Signal Processing Conference,2004 12th European.Vienna,Austria:IEEE,2004:209-212.
[8]F′EVOTTE C,THEIS F J.Orthonormal approximate jointblock-diagonalization[C]//TechnicalReport GET/T′el′ecom,Pairs:Imprim′e`a I'Ecole Nationale Sup′erieure des T′el′ecommunications,2007.
[9]FENG D Z,ZHENG W X,CICHOCKI A.Matrix-group algorithm via improved whiting process for extracting statistically independent sources from array signals[J].IEEE Transactions on Signal Processing,2007,55(3):962-977.
[10]GHENNIOUI H,F(xiàn)ADAILI E M,THIRION-MOREAU N,et al.A non-unitary joint block diagonalization algorithm for blind separation of convolutive mixtures of sources[J]. IEEE Signal Processing Letters,2007,14(11):860-863.
[11]AMARI S,CICHOCKI A,YANG H H.A new learning algorithm for blind signal separation[C]//Advances in Neural Information Processing Systems.Cambridge,MA:MIT Press,1995:757-763.
[12]WANG S,SEKEY A,GERSHO A.An objective measure for predicting subjective quality of speech coders[J]. IEEE Journal on Selected Areas in Communications,1992,10(5):819-829.
Convolutive Blind Separation for Multi-Channel Speech Signal Based on Givens and Hyperbolic Double-Rotation
ZHANG Hua,ZUO Jiancun,DAI Hong,GUI Lin
(School of Computer and Information Engineering,Shanghai Polytechnic University,Shanghai 201209,P.R.China)
Abstract:The convolutive mixture model of speech signal could be expressed as an instantaneous mixture of block-independent source signal and extended mixture matrix by reconstructing the received signal after sliding-window segmentation.And based on the mutualindependence property and the short-time stationary of the speech signals,the second-order correlation matrix of the received signal has a structure of non-orthogonal joint block-diagonalization.Then a new Givens-Hyperbolic double-rotation based joint blockdiagonalization algorithm GH-JBD is proposed by improving the existing algorithm of instantaneous mixture blind separation based on Givens-and-Hyperbolic rotations.The GH-JBD algorithm estimates the block essentially-equal matrix of the mixture matrix directly in time domain to realize non-orthogonal joint block diagonalization for convolutive blind source separation.Since pre-whitening of the received signal is not needed,there is no residual error induced in GH-JBD processing.Simulations prove the validity of the proposed algorithm in various scenarios.
Keywords:convolutiveblind source separation;jointblock-diagonalization;GivensandHyperbolicdouble-rotation;permutationmatrix
中圖分類號:TN911.7
文獻(xiàn)標(biāo)志碼:A
文章編號:1001-4543(2016)02-0134-07
收稿日期:2015-12-29
通信作者:張華(1982—),女,山西臨汾人,講師,博士,主要研究方向為移動通信、信號處理、盲信號處理。電子郵箱zhanghua@sspu.edu.cn。
基金項目:上海第二工業(yè)大學(xué)?;痦椖浚∟o.EGD15XQD07)、上海第二工業(yè)大學(xué)校級重點學(xué)科(No.XXKZD1302)資助