王順利 洪強 黃歡
摘 要 目標(biāo)聲音識別技術(shù)是語音識別的一個重要分支,它極大地提高了人們的工作效率,生活質(zhì)量和服務(wù)質(zhì)量。但由于語音變化范圍大,聲音識別系統(tǒng)精確匹配困難,聲音容易收到音質(zhì),速度和背景噪聲的影響而降低識別能力。隨著語音信號處理技術(shù)的深入研究,結(jié)果發(fā)現(xiàn):人的聽覺系統(tǒng)對聲音配合物具有獨特的優(yōu)勢,它可以準(zhǔn)確地提取目標(biāo)聲特性并辨別聲音的方向和內(nèi)容,基于仿生學(xué)的聲源定位技術(shù)越來越受到人們的關(guān)注。
關(guān)鍵詞 仿生學(xué) 聲源定位技術(shù) 聽覺系統(tǒng) 聲音信號 目標(biāo)聲音
中圖分類號:TB51 文獻(xiàn)標(biāo)識碼:A
1仿生學(xué)概覽
1.1仿生學(xué)的發(fā)展歷史
通過研究可以得出結(jié)論:一些植物和動物具有類似的功能,實際上超出人們關(guān)于這方面設(shè)計的方案需要。人們通過模仿動物和植物在技術(shù)方面得以借鑒,是一個突破。仿生學(xué)是一門交叉學(xué)科,如工程仿生技術(shù)和生物科學(xué)相結(jié)合,近年來發(fā)展迅速。對于合理應(yīng)用生物學(xué)原理,不僅要找到一些長期存在難題的解決方案,而要使這個方案完全適應(yīng)自然的需要。
仿生學(xué)研究生物學(xué)的系統(tǒng)結(jié)構(gòu),研究功能,信息控制與能量轉(zhuǎn)換等的優(yōu)良特性,而這些特性應(yīng)用于實際系統(tǒng),用于改善現(xiàn)有的技術(shù),并建立一個全面的自動設(shè)備,工藝,技術(shù)架構(gòu)配置系統(tǒng)等。從生物學(xué)的角度看,仿生學(xué)的一個分支,屬于生物學(xué)的應(yīng)用。仿生學(xué)作為一門獨立的學(xué)科,在1960年9月問世,仿生學(xué)在俄亥俄州空軍基地的第一次會議在美國空軍航空局召開了。從第二十世紀(jì)50年代以來,人們已經(jīng)認(rèn)識到,生物系統(tǒng)是一個開發(fā)新技術(shù)的主要途徑。人們通過數(shù)學(xué),化學(xué),物理和數(shù)學(xué)模型,對生物系統(tǒng)的研究,并促進(jìn)生物學(xué)快速發(fā)展,而研究生物功能的機制也取得了很大的進(jìn)步。
1.2仿生學(xué)的應(yīng)用背景
仿生學(xué)已經(jīng)進(jìn)入了各行各業(yè)技術(shù)創(chuàng)新和技術(shù)革命的前沿,如在自動控制,航空,航海等軍事領(lǐng)域都獲得了不少的成就。科學(xué)家的靈感來自與旗魚狀突起的長針,開發(fā)超音速飛機在高速飛行時產(chǎn)生刺耳聲的屏障;從鯨魚的形狀發(fā)展?jié)撏?;通過模仿蝙蝠的行為使雷達(dá)可以在任何時間根據(jù)脈沖參數(shù)的目標(biāo)檢測方法和調(diào)整方向,提高雷達(dá)的靈敏度和抗干擾的能力。
仿生學(xué)的任務(wù)是研究生物系統(tǒng)與生俱來的能力和原則,為這些能力與原則創(chuàng)建相應(yīng)的數(shù)學(xué)模型,并設(shè)計嶄新的設(shè)備,開展了一個全新的應(yīng)用空間。聽覺仿生模型應(yīng)該更全面地描述目標(biāo)聲識別過程?,F(xiàn)在大多數(shù)的研究沒有在本質(zhì)上對聽覺系統(tǒng)創(chuàng)建出一個合理的模型,特征提取不能夠完全體現(xiàn)出聲音的特點。因此,在聽覺系統(tǒng)模型幾何部分中建立一個更精確的語音識別系統(tǒng)是發(fā)展的必然趨勢。
1.3機器人聽覺系統(tǒng)的應(yīng)用
隨著電子技術(shù)和數(shù)字信號處理技術(shù)的發(fā)展,仿人機器人(如圖1所示)的研究有了新的進(jìn)展,機器人聽覺與視覺系統(tǒng)是智能機器人的重要標(biāo)志,已成為機器人研究領(lǐng)域的一個重要研究方向,是實現(xiàn)機器人與環(huán)境的相互作用和人機交互的一個重要手段。因為聲音繞過障礙,聽覺可以由機器人多信息采集系統(tǒng)來實現(xiàn)功能,利用機器人的其他感官來彌補其他傳感系統(tǒng)無法通過非透明障礙物的缺點。此外,對于模擬人類聽覺系統(tǒng)的研究,也表明了人類對于聽覺生理能力所掌握的知識程度很高。
2聲源定位技術(shù)的發(fā)展
2.1聲源定位技術(shù)的應(yīng)用背景
聲源定位技術(shù)是對具有聽力功能的耳朵進(jìn)行仿真,利用聲波傳感裝置接收聲音,聲音信號通過電子設(shè)備進(jìn)行處理,從而實現(xiàn)并定位聲源識別的檢測,定位和聲源目標(biāo)跟蹤。利用被動聲來定位,并對多通道信號分析與處理,得出一個或多個在平面或在空間域中的聲源空間坐標(biāo),以獲得聲源位置。
聲源定位技術(shù)具有隱蔽性強,適應(yīng)性強的優(yōu)點,成本低,逐漸受到世界各國的重視,在軍事和民用領(lǐng)域具有廣闊的應(yīng)用前景。在水下感知目標(biāo),在危險的環(huán)境中應(yīng)用程序來完成戰(zhàn)場掃雷工作。聲探測技術(shù)在許多控制裝置中得到廣泛使用,如聲雷達(dá),被動聲納,語音識別系統(tǒng),視頻會議系統(tǒng)和輔助收聽系統(tǒng)等。它可用于揚聲器麥克風(fēng)陣列波束的方向控制,視頻會議系統(tǒng)的對準(zhǔn);也可用于語音信號的預(yù)處理,提供高質(zhì)量的聲音信號,提高相關(guān)的系統(tǒng)功能;檢測管道泄漏的位置,管道泄漏后的聲波振動會沿墻傳播,只要在管道泄漏的地方進(jìn)聲源振動信號的采集,就可以通過兩個信號時延估計確定泄漏的位置;在電話會議中的聲源定位,語音信號接收不同談話的人,根據(jù)不同的傳感器位置接收聲音信息,確定發(fā)言人的立場;對于室內(nèi)監(jiān)控系統(tǒng),安裝拾音器在走廊,房間,采集目標(biāo)方位角接收到的聲音信號,并進(jìn)一步記錄聲音和圖像目標(biāo)的信息。聲源定位技術(shù)具有應(yīng)用價值和廣闊的發(fā)展前景,值得研究。
2.2聲源定位技術(shù)的優(yōu)勢
聲源定位技術(shù)是利用電子裝置來獲知聲音位置的信號處理技術(shù)。聲源定位技術(shù)可以分為被動聲源定位和主動聲源定位兩種。主動定位包括發(fā)送和接收裝置,如雷達(dá)發(fā)射信號的使用,根據(jù)目標(biāo)的接受波形來判斷的位置。被動聲定位是接收裝置,與傳統(tǒng)的主動聲源定位技術(shù)相比,它具有隱蔽性強的優(yōu)點,不易受電磁干擾。
參考文獻(xiàn)
[1] 郭策,戴振東,孫久榮.?生物機器人的研究現(xiàn)狀及其未來發(fā)展[J].機器人,2005(02).
[2] 崔瑋瑋,曹志剛,魏建強.?聲源定位中的時延估計技術(shù)[J].數(shù)據(jù)采集與處理,2007(01).