代 金 良,陳 喆,殷 福 亮*
(1.大連理工大學(xué) 信息與通信工程學(xué)院,遼寧 大連 116024;2.北京三聽科技有限公司,北京 100176 )
近年來,基于麥克風(fēng)陣列的聲源定位和跟蹤算法已被廣泛地應(yīng)用于工業(yè)設(shè)備和民用系統(tǒng)中,如遠(yuǎn)程視頻會(huì)議和智能機(jī)器人等[1].在傳統(tǒng)的基于麥克風(fēng)陣列的聲源定位系統(tǒng)中,麥克風(fēng)被固定安置在特定位置上,利用滿足特殊幾何模型的特定拓?fù)浣Y(jié)構(gòu)來實(shí)現(xiàn)音頻信號(hào)收集和聲源位置估計(jì)等功能,然而這種固定的麥克風(fēng)陣列拓?fù)浣Y(jié)構(gòu)極大地限制了其應(yīng)用[2].隨著半導(dǎo)體技術(shù)和嵌入式系統(tǒng)的快速發(fā)展,微型及嵌入式麥克風(fēng)音頻接口模塊可以被方便地安裝在便攜式智能移動(dòng)終端設(shè)備(如智能手機(jī)和筆記本電腦等),從而構(gòu)成分布式麥克風(fēng)網(wǎng)絡(luò)(distributed microphone network,DMN).這種分布式麥克風(fēng)網(wǎng)絡(luò)可以更加容易地構(gòu)建起一套ad-hoc網(wǎng)絡(luò)[3-4].不同于傳統(tǒng)的麥克風(fēng)陣列,其包含了一組具有隨機(jī)位置的通信節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)上含有若干麥克風(fēng)并可以與相鄰節(jié)點(diǎn)保持通信.此外,在DMN中,每個(gè)節(jié)點(diǎn)上的麥克風(fēng)能夠?qū)崿F(xiàn)在本地獨(dú)立地采集和處理語(yǔ)音信號(hào),從而實(shí)現(xiàn)基于DMN的說話人定位和跟蹤等功能.然而,傳統(tǒng)的基于特殊幾何拓?fù)浣Y(jié)構(gòu)麥克風(fēng)陣列的聲源定位方法無法直接應(yīng)用于DMN中,極大地限制了DMN在實(shí)際系統(tǒng)中的應(yīng)用.
近年來,聲源定位和跟蹤算法已得到廣泛研究[5-7].在文獻(xiàn)[6]中,Cho等將說話人定位問題建模為累積相關(guān)最大化的優(yōu)化問題,從而實(shí)現(xiàn)了對(duì)說話人的定位.在文獻(xiàn)[7]中,Canclini等提出了一種基于時(shí)延估計(jì)的聲源定位方法.該方法基于對(duì)到達(dá)時(shí)間(TDOA)的估計(jì),具有復(fù)雜度低、魯棒性強(qiáng)的優(yōu)點(diǎn).盡管以文獻(xiàn)[6-7]為代表的這些已有算法獲得了不錯(cuò)的聲源定位性能,然而,對(duì)于實(shí)際系統(tǒng)而言,這些已有算法都是利用當(dāng)前時(shí)刻估計(jì)值(如TDOA)來估算聲源位置,因此無法克服背景噪聲和強(qiáng)混響對(duì)定位結(jié)果的影響.為了解決這個(gè)問題,貝葉斯濾波可以被用來嘗試?yán)盟羞^去和當(dāng)前時(shí)刻的觀測(cè)值來估計(jì)得到更加準(zhǔn)確的聲源定位結(jié)果.例如,在文獻(xiàn)[8]中,根據(jù)非線性觀測(cè)模型,擴(kuò)展卡爾曼濾波和無跡卡爾曼濾波(UKF)已被用在DMN中實(shí)現(xiàn)對(duì)聲源的分布式跟蹤.文獻(xiàn)[9]則是研究了分布式粒子濾波器(DPF)在聲源定位和跟蹤中的應(yīng)用.在這些分布式粒子濾波算法中,于DMN中的每個(gè)節(jié)點(diǎn)在本地進(jìn)行語(yǔ)音采集并通過粒子濾波器實(shí)現(xiàn)對(duì)說話人的位置估計(jì),然后通過一致性算法實(shí)現(xiàn)對(duì)各個(gè)節(jié)點(diǎn)上說話人位置后驗(yàn)分布的近似最優(yōu)融合.此外,文獻(xiàn)[10]提出一種新的自適應(yīng)分布式粒子濾波算法,在DMN中實(shí)現(xiàn)了更好的說話人跟蹤性能.雖然以文獻(xiàn)[9-10]為代表的分布式聲源跟蹤算法能夠?qū)崿F(xiàn)單一運(yùn)動(dòng)模式下說話人的跟蹤定位,但實(shí)際應(yīng)用中聲源運(yùn)動(dòng)模式往往復(fù)雜,這些跟蹤算法的性能會(huì)出現(xiàn)不同程度的下降.針對(duì)這個(gè)問題,文獻(xiàn)[8]雖然提出了基于交互式多模型(interacting multiple model,IMM)的分布式卡爾曼濾波算法,在復(fù)雜的說話人運(yùn)動(dòng)狀態(tài)下仍然可以獲得較好的跟蹤性能,然而,該算法依賴線性高斯?fàn)顟B(tài)空間模型,因此對(duì)強(qiáng)混響和非高斯背景噪聲的魯棒性較差.文獻(xiàn)[11]則是在文獻(xiàn)[8]的基礎(chǔ)上,將IMM與分布式粒子濾波算法相結(jié)合,提高說話人跟蹤算法對(duì)混響和非高斯噪聲的魯棒性,但是該算法假設(shè)IMM中各運(yùn)動(dòng)模型之間的轉(zhuǎn)換概率為固定值并且已知,這極大限制了其在實(shí)際系統(tǒng)中的應(yīng)用.
本文針對(duì)分布式麥克風(fēng)網(wǎng)絡(luò),提出一種基于自適應(yīng)交互式多模型粒子濾波的分布式說話人跟蹤算法.首先,該算法基于說話人的運(yùn)動(dòng)規(guī)律滿足多種運(yùn)動(dòng)模型[11];其次,DMN中的各個(gè)節(jié)點(diǎn)上的一組麥克風(fēng)采集說話人發(fā)出的語(yǔ)音信號(hào)并估計(jì)TDOA,以TDOA作為說話人位置的觀測(cè)量,建立多模態(tài)狀態(tài)空間模型;再次,利用雙粒子濾波器(dual-PF)實(shí)現(xiàn)對(duì)運(yùn)動(dòng)模型轉(zhuǎn)換概率和說話人當(dāng)前位置信息的聯(lián)合估計(jì),進(jìn)而得到說話人位置信息的局部后驗(yàn)分布;最后,通過文獻(xiàn)[12]中的一致性融合算法,將DMN各個(gè)節(jié)點(diǎn)上得到的局部后驗(yàn)分布進(jìn)行分布式最優(yōu)融合,最終實(shí)現(xiàn)對(duì)說話人位置信息的全局最優(yōu)估計(jì).
在一個(gè)具有二維拓?fù)浣Y(jié)構(gòu)的DMN中,共有L個(gè)相互獨(dú)立的節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)上有一個(gè)由兩個(gè)麥克風(fēng)構(gòu)成的小型麥克風(fēng)陣列,以及能夠與其他節(jié)點(diǎn)保持通信的微控制器和通信模塊.假設(shè)sl,i表示DMN中第l個(gè)節(jié)點(diǎn)上第i個(gè)麥克風(fēng)的位置向量,u(t)表示說話人的語(yǔ)音信號(hào),hl,i(sl,i)表示說話人到第i個(gè)麥克風(fēng)的沖激響應(yīng),則第l個(gè)節(jié)點(diǎn)上第i個(gè)麥克風(fēng)采集到的信號(hào)可以表示為
zl,i(t)=hl,i(sl,i)*u(t)+wl,i(t)
(1)
式中:wl,i(t)表示背景噪聲.假設(shè)聲源在給定的時(shí)間間隔內(nèi)沒有明顯的運(yùn)動(dòng),則可以對(duì)接收到的語(yǔ)音信號(hào)zl,i(t)進(jìn)行幀內(nèi)處理,以估計(jì)聲源的位置.設(shè)Nf為接收語(yǔ)音信號(hào)幀長(zhǎng)度,則時(shí)間索引k處一幀信號(hào)可以表示為
zl,i(k)=(zl,i(kNf)zl,i(kNf+1)…
zl,i(kNf+Nf-1))T
(2)
(3)
TDOA模型由于原理簡(jiǎn)單、計(jì)算復(fù)雜度低,被廣泛用于聲源定位和移動(dòng)跟蹤系統(tǒng)中.本文的DMN中,每個(gè)節(jié)點(diǎn)上都裝有一對(duì)同步的麥克風(fēng),每個(gè)節(jié)點(diǎn)都可利用該麥克風(fēng)對(duì)計(jì)算TDOA,并作為說話人位置坐標(biāo)的觀測(cè)量.
根據(jù)式(2),在第l個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)上對(duì)于第k幀接收信號(hào),廣義互相關(guān)(GCC)函數(shù)[14]可以通過下式計(jì)算得出:
(4)
其中“*”表示復(fù)共軛計(jì)算,zl,1(f)和zl,2(f)表示接收信號(hào)的頻譜,Ω為積分區(qū)間.在此基礎(chǔ)上,第l個(gè)節(jié)點(diǎn)上的TDOA觀測(cè)量可以通過下式計(jì)算得到:
(5)
其中τmax表示由麥克風(fēng)間距計(jì)算得到的TDOA理論最大值.
由于TDOA的理論計(jì)算公式為
(6)
(7)
其中nl,k為觀測(cè)噪聲.
根據(jù)式(3)和(7)所示狀態(tài)空間模型,說話人位置向量的最小均方誤差估計(jì)值可以表示為
(8)
其中后驗(yàn)分布p(xk|y1:k)可以表示為
p(xk|y1:k)∝p(yk|xk)p(xk|y1:k-1)
(9)
其中p(yk|xk)為似然函數(shù);p(xk|y1:k-1)為一步預(yù)測(cè)后驗(yàn)分布,可以表示為
(10)
由于式(8)所示的高維積分無法得到明確的解析解,已有文獻(xiàn)常采用粒子濾波算法進(jìn)行求解.
(11)
(12)
對(duì)于復(fù)雜的運(yùn)動(dòng)模型,很難通過經(jīng)典的粒子濾波算法快速跟蹤運(yùn)動(dòng)目標(biāo).如果將交互式多模型(IMM)算法與粒子濾波算法相結(jié)合,則可以對(duì)復(fù)雜運(yùn)動(dòng)模型進(jìn)行較為準(zhǔn)確的預(yù)測(cè)和切換,進(jìn)而實(shí)現(xiàn)較為準(zhǔn)確的目標(biāo)跟蹤.
根據(jù)文獻(xiàn)[12],對(duì)于式(3)所示的運(yùn)動(dòng)狀態(tài)模型,假設(shè)勻速模型、勻加速模型以及轉(zhuǎn)向速度不變模型之間的轉(zhuǎn)換概率pi,j已知,則運(yùn)動(dòng)模型轉(zhuǎn)換矩陣可以表示為
(13)
其中p1,1=p2,2=p3,3,p1,2=p2,1,p1,3=p3,1,p2,3=p3,2,則相應(yīng)的交互式多模型粒子濾波(IMMPF)算法可以總結(jié)為以下幾個(gè)階段:
(1)運(yùn)動(dòng)模式交互計(jì)算
(14)
(15)
(16)
(2)狀態(tài)預(yù)測(cè)
式(3)考慮了多種運(yùn)動(dòng)模式的復(fù)雜情況,因此對(duì)于運(yùn)動(dòng)模式j(luò),可以通過下式實(shí)現(xiàn)對(duì)狀態(tài)粒子的預(yù)測(cè)更新:
(17)
相應(yīng)的權(quán)值也更新為
(18)
(3)運(yùn)動(dòng)狀態(tài)模型更新
根據(jù)式(6)、(7),可以進(jìn)一步計(jì)算得到運(yùn)動(dòng)模式j(luò)的殘差觀測(cè)向量和殘差協(xié)方差矩陣:
(19)
(20)
相應(yīng)地,運(yùn)動(dòng)狀態(tài)模型的似然函數(shù)可以表示為
(21)
(4)運(yùn)動(dòng)狀態(tài)模型概率更新
(22)
(5)估計(jì)狀態(tài)向量以及估計(jì)誤差的協(xié)方差矩陣
(23)
(24)
由文獻(xiàn)[11]和前文中的推導(dǎo)可知,傳統(tǒng)的IMMPF算法通常假設(shè)式(13)中的運(yùn)動(dòng)模型轉(zhuǎn)換概率已知,然而在實(shí)際系統(tǒng)中,通常無法預(yù)先獲知該參數(shù)值,往往只能根據(jù)經(jīng)驗(yàn)對(duì)其進(jìn)行假定設(shè)置,這將使得IMMPF算法的性能下降.
針對(duì)此問題,本文根據(jù)文獻(xiàn)[16]中的雙濾波器(dual filters)原理,提出如圖1所示的自適應(yīng)IMMPF算法.該算法包含兩個(gè)粒子濾波器,其中參數(shù)估計(jì)粒子濾波器用于對(duì)運(yùn)動(dòng)模型轉(zhuǎn)換概率的估計(jì),而IMMPF濾波器用于對(duì)狀態(tài)向量進(jìn)行估計(jì),進(jìn)而實(shí)現(xiàn)在運(yùn)動(dòng)模型轉(zhuǎn)換概率未知情況下對(duì)狀態(tài)向量的貝葉斯估計(jì).
圖1 基于雙濾波器原理的自適應(yīng)IMMPF濾波器Fig.1 Adaptive IMMPF filter based on dual filters principle
如圖1所示,在本文提出的自適應(yīng)IMMPF算法中,首先給定運(yùn)動(dòng)模型轉(zhuǎn)換概率向量一個(gè)初始值,然后利用式(14)~(24)使用一個(gè)粒子濾波器實(shí)現(xiàn)對(duì)狀態(tài)向量的粗估計(jì);接下來,基于該狀態(tài)向量的粗估計(jì)值,建立如下的運(yùn)動(dòng)模型轉(zhuǎn)換概率向量Γ的狀態(tài)空間模型:
Γk+1=Γk+bk
(25)
其中Γk=(p1,1p1,2p1,3)T,p1,1、p1,2、p1,3為式(13)中的運(yùn)動(dòng)模型轉(zhuǎn)換概率,驅(qū)動(dòng)噪聲bk假設(shè)滿足均值為0、方差為0.1的高斯分布.
假設(shè)圖1中已經(jīng)計(jì)算得到了狀態(tài)向量粗估計(jì)值,式(25)可以同樣作為運(yùn)動(dòng)模型轉(zhuǎn)換概率向量Γk的觀測(cè)方程,則使用如下粒子濾波算法可以得到運(yùn)動(dòng)模型轉(zhuǎn)換概率的估計(jì)值:
(1)根據(jù)式(25)對(duì)運(yùn)動(dòng)模型轉(zhuǎn)換概率的采樣值進(jìn)行更新:
(26)
(2)根據(jù)式(12)計(jì)算相應(yīng)的權(quán)值
(27)
(3)得到運(yùn)動(dòng)模型轉(zhuǎn)換概率向量的估計(jì)值
(28)
在DMN中,雖然每個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)都可以根據(jù)式(23)計(jì)算得到局部狀態(tài)估計(jì)向量,然而該計(jì)算方法只用到了局部觀測(cè)向量,沒有考慮到全局觀測(cè)信息對(duì)狀態(tài)估計(jì)值的影響.因此,本文利用各個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)上的局部估計(jì)值實(shí)現(xiàn)近似全局最優(yōu)的融合處理.
假設(shè)在k-1時(shí)刻第l個(gè)節(jié)點(diǎn)上估計(jì)得到的說話人狀態(tài)向量的全局后驗(yàn)分布滿足高斯分布,由式(10)可知,預(yù)測(cè)后驗(yàn)分布p(xk|y1:k-1)可以使用基于Sigma點(diǎn)的無跡變換(unscented transformation,UT)算法[17]計(jì)算得到:
(29)
假設(shè)使用p(xk|y1:k-1)作為參考分布,則式(12)對(duì)應(yīng)的權(quán)值計(jì)算公式可以改寫為
(30)
由于全局似然函數(shù)p(yk|xk)可以寫成如下形式:
(31)
其中yl,k為第l個(gè)節(jié)點(diǎn)上計(jì)算得到的TDOA觀測(cè)量,p(yl,k|xk)為第l個(gè)節(jié)點(diǎn)對(duì)應(yīng)的局部后驗(yàn)似然分布,將式(31)代入式(9)中可以得到
p(xk|y1:k)∝p(yk|xk)p(xk|y1:k-1)=
(32)
(33)
(34)
式中的累加求和可以利用文獻(xiàn)[12]中的一致性方法采用分布式的方式計(jì)算得到.
本文提出的基于分布式交互粒子濾波的說話人跟蹤算法可歸納為如下步驟:
對(duì)于k=0,1,2,…,K,執(zhí)行以下操作:
(1)利用式(4)、(5)在每個(gè)節(jié)點(diǎn)上都計(jì)算得到TDOA觀測(cè)量;
(2)利用式(14)~(28)在每個(gè)節(jié)點(diǎn)上運(yùn)行IMMPF算法得到局部后驗(yàn)分布估計(jì)值和運(yùn)動(dòng)模型轉(zhuǎn)換概率估計(jì)值;
(3)基于步驟(2)中得到的概率估計(jì)值,利用式(14)~(24)得到局部后驗(yàn)分布估計(jì)值;
(4)根據(jù)式(33)、(34)利用一致性算法在各個(gè)節(jié)點(diǎn)上實(shí)現(xiàn)局部后驗(yàn)分布的分布式融合;
(5)得到全局狀態(tài)估計(jì)最優(yōu)值.
即首先,在DMN的每個(gè)節(jié)點(diǎn)上計(jì)算得到TDOA觀測(cè)值;然后,利用局部IMMPF算法和參數(shù)估計(jì)粒子濾波器相結(jié)合計(jì)算得到運(yùn)動(dòng)模型轉(zhuǎn)換概率的估計(jì)值,然后將該概率估計(jì)值送入IMMPF算法得到說話人狀態(tài)向量的局部后驗(yàn)分布估計(jì)值;接下來,利用一致性算法,在各個(gè)節(jié)點(diǎn)上計(jì)算得到近似的全局最優(yōu)狀態(tài)估計(jì)值.
為了驗(yàn)證本文算法的有效性,計(jì)算機(jī)仿真實(shí)驗(yàn)環(huán)境設(shè)置為一個(gè)長(zhǎng)×寬×高為6 m×5 m×4 m的辦公室房間.在該房間中布置了一個(gè)含有10個(gè)節(jié)點(diǎn)的分布式麥克風(fēng)網(wǎng)絡(luò)(如圖2所示),每個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)的位置坐標(biāo)都是隨機(jī)選取的.在每個(gè)節(jié)點(diǎn)上,通過一個(gè)麥克風(fēng)對(duì)進(jìn)行語(yǔ)音信號(hào)的采集.假設(shè)網(wǎng)絡(luò)節(jié)點(diǎn)上的麥克風(fēng)對(duì)的高度與說話人的高度相等,都是1.8 m,說話人在二維平面上的移動(dòng)軌跡如圖2所示.該說話人的移動(dòng)軌跡滿足如下規(guī)律:前1/3時(shí)間是勻速運(yùn)動(dòng),中間1/3時(shí)間是原地靜止?fàn)顟B(tài),后1/3時(shí)間采用勻加速運(yùn)動(dòng)模式.語(yǔ)音信號(hào)在該實(shí)驗(yàn)環(huán)境中的房間沖擊響應(yīng)由文獻(xiàn)[18]中IMAGE方法仿真產(chǎn)生,仿真實(shí)驗(yàn)中混響值設(shè)為0.38.假設(shè)說話人發(fā)出的聲音為一段性語(yǔ)音信號(hào),麥克風(fēng)上的語(yǔ)音信號(hào)采樣頻率為16 kHz,一幀信號(hào)長(zhǎng)度為96 ms.說話人位置估計(jì)均方誤差E(MSE)可以由下式計(jì)算得到:
圖2 分布式麥克風(fēng)網(wǎng)絡(luò)Fig.2 Distributed microphone network
(35)
圖3給出了本文算法與文獻(xiàn)[9]中的分布式高斯粒子濾波算法、文獻(xiàn)[8]中經(jīng)典粒子濾波算法,以及文獻(xiàn)[11]中傳統(tǒng)的分布式IMMPF算法的說話人跟蹤結(jié)果對(duì)比.需要說明的是,文獻(xiàn)[11]所示算法和本文算法的仿真實(shí)驗(yàn)中,運(yùn)動(dòng)模型轉(zhuǎn)換概率初始值{p1,1,p1,2,p1,3}被隨機(jī)設(shè)定為{0.92,0.04,0.04}.
(a)二維平面坐標(biāo)下的跟蹤結(jié)果比較
由圖3可看出,本文算法對(duì)說話人的跟蹤結(jié)果與實(shí)際的說話人運(yùn)動(dòng)軌跡更吻合,特別是存在說話人運(yùn)動(dòng)模式發(fā)生改變的情況,本文算法的說話人跟蹤誤差更小.相比之下,經(jīng)典的粒子濾波算法的跟蹤結(jié)果無法對(duì)說話人的運(yùn)動(dòng)模式變化做出及時(shí)的識(shí)別,因此誤差更大.雖然分布式高斯粒子濾波算法可以對(duì)說話人進(jìn)行有效跟蹤,但其未考慮多種運(yùn)動(dòng)模式的復(fù)雜情況,因此跟蹤結(jié)果不如本文算法.此外,文獻(xiàn)[11]中的算法雖然采用IMM方法實(shí)現(xiàn)對(duì)運(yùn)動(dòng)模式的判別,但是該算法需要已知運(yùn)動(dòng)模型轉(zhuǎn)換概率,而在本文的仿真實(shí)驗(yàn)中是假設(shè)該概率值為未知的,采用隨機(jī)設(shè)置該概率值的方式,因此文獻(xiàn)[11]算法的性能有所下降.相反,由于本文算法采用雙濾波器結(jié)構(gòu),對(duì)運(yùn)動(dòng)模型轉(zhuǎn)換概率采用自適應(yīng)估計(jì),可以更加準(zhǔn)確地得到說話人位置狀態(tài)信息的估計(jì)值.
圖4給出了幾種算法的跟蹤性能對(duì)比,即MSE性能對(duì)比.與圖3對(duì)應(yīng),在圖4中,本文算法由于使用了IMM算法,可以及時(shí)地響應(yīng)運(yùn)動(dòng)模式的變化,因此對(duì)應(yīng)的跟蹤性能更好,MSE更低.相反,經(jīng)典粒子濾波算法和分布式高斯粒子濾波算法沒有考慮多運(yùn)動(dòng)模式的復(fù)雜情況,因此其跟蹤性能略遜于本文算法,其MSE也高于本文算法.同樣,文獻(xiàn)[11]中算法的性能依賴于對(duì)運(yùn)動(dòng)模型轉(zhuǎn)換概率的準(zhǔn)確設(shè)置,因此在該概率值未知情況下,本文算法的性能更優(yōu).
本文算法是通過循環(huán)迭代同時(shí)估計(jì)運(yùn)動(dòng)模型轉(zhuǎn)換概率和運(yùn)動(dòng)軌跡,在算法運(yùn)行過程中,當(dāng)運(yùn)動(dòng)模式發(fā)生變化時(shí)(如圖4的1.5~1.8 s處,3.8 s處),本文算法對(duì)運(yùn)動(dòng)模型轉(zhuǎn)換概率估計(jì)需要一定的收斂時(shí)間,從圖4可以清晰地看出,從這些說話人運(yùn)動(dòng)模式發(fā)生變化的時(shí)刻開始的一小段時(shí)間內(nèi),本文算法的MSE性能與之前比會(huì)有所下降(即MSE會(huì)升高),但是不久之后算法重新收斂,MSE又會(huì)有所下降,趨于穩(wěn)定.
(a)x軸坐標(biāo)
本文提出一種基于自適應(yīng)交互式多模型粒子濾波的分布式說話人跟蹤算法.首先,該算法在分布式麥克風(fēng)網(wǎng)絡(luò)的各個(gè)節(jié)點(diǎn)上利用一組麥克風(fēng)對(duì)采集語(yǔ)音信號(hào),并計(jì)算得到TDOA觀測(cè)量;其次,利用雙粒子濾波器,將IMM算法和粒子濾波算法相結(jié)合,對(duì)說話人位置坐標(biāo)進(jìn)行局部估計(jì);最后,利用一致性算法對(duì)各個(gè)節(jié)點(diǎn)上得到的說話人位置坐標(biāo)的局部后驗(yàn)分布估計(jì)值進(jìn)行分布式融合,進(jìn)而得到近似全局最優(yōu)的說話人位置坐標(biāo)估計(jì)值.與已有算法相比,本文算法采用雙濾波器結(jié)構(gòu)實(shí)現(xiàn)對(duì)運(yùn)動(dòng)模型轉(zhuǎn)換概率和說話人位置信息狀態(tài)向量的聯(lián)合估計(jì),可以及時(shí)響應(yīng)運(yùn)動(dòng)模型的變化,因此可以得到更加準(zhǔn)確的說話人位置狀態(tài)估計(jì).