王高峰
摘 要 軌道交通自動售檢票系統(tǒng)(AFC,Automatic Fare Collection),英文縮寫AFC,傳統(tǒng)的架構(gòu)為5層,從下至上分別是車票位于第5層,車站現(xiàn)場設(shè)備(SLE)位于第4層,車站計算機系統(tǒng)(SC)和線路中央計算機系統(tǒng)(LC)分別位于第3和第2層,最上端是清分中心計算機系統(tǒng)(ACC),本系統(tǒng)可對軌道交通票卡完整生命周期進行管理。筆者通過介紹語音識別技術(shù)理論,重點對車站現(xiàn)場設(shè)備的語音識別模塊的降噪技術(shù)、環(huán)境影響及安裝技術(shù)進行了研究,結(jié)合城市軌道交通語音識別技術(shù)應用項目,對實踐中的建設(shè)經(jīng)驗進行介紹,以期為軌道交通自動售檢票系統(tǒng)的語音識別技術(shù)大面積應用提供一定參考。
關(guān)鍵詞 語音識別;軌道交通;降噪;麥克風陣列;安裝
引言
軌道交通自動售檢票系統(tǒng)(AFC)的車站現(xiàn)場設(shè)備當中使用語音識別相關(guān)設(shè)備引導乘客進行車票購買、地圖查詢等工作。車站現(xiàn)場環(huán)噪音影響大,乘客語言描述種類多,應用環(huán)境復雜等問題顯著。
降噪技術(shù)為車站環(huán)境應用語音購票系統(tǒng)提供了必要的技術(shù)支撐,本文在對噪音消除技術(shù)理論研究的基礎(chǔ)上,結(jié)合軌道交通實際業(yè)務(wù)要求和建設(shè)實踐給出了安裝實施、檢測等建議。
1語音識別降噪技術(shù)研究
1.1 實現(xiàn)原理
目前主要的降噪技術(shù)方法有四種,包括譜相減法、維納濾波法、卡爾曼濾波法和噪聲對消法。
在平穩(wěn)條件下的數(shù)字濾波器算法一般采用維納濾波法,最小均方誤差是此種方法的設(shè)計準則,含有噪音的語音信號通過此濾波器后可以得到語音信號的最優(yōu)估計值。
在維納濾波法的基礎(chǔ)上采用信號與噪聲的狀態(tài)空間模型,對狀態(tài)變量的估計使用前一時刻的估計值和當前時刻的觀察值來更新,以求現(xiàn)時刻的估計值,這種方法稱為卡爾曼濾波法。
譜相減法是利用人耳對聲波相位不敏感的特點,從帶有噪聲的語音估值中,采用傅立葉及逆傅立葉變換方法,削減去噪聲頻譜估值,得到純凈語音頻譜估值,主要針對短時幅度譜進行應用。
在以上方法基礎(chǔ)上采用噪聲對消法采用多個麥克風對背景噪聲進行拾音,經(jīng)過計算后對噪聲進行對消,保留原始語音。
市場上語音識別對應廠家很多,本文以科大訊飛的語音識別模塊及4麥克風陣列為例介紹相關(guān)技術(shù)和應用實踐說明。
1.2 語音識別模塊介紹
麥克風陣列的語音前端設(shè)備是語音識別處理模塊。
語音識別處理模塊利用空域濾波特性,定位說話人的角度,進而形成定向拾音波束。
通過軟件算法對波束以外的噪聲進行對消處理,增強語音質(zhì)量、加強識別效果。
模塊功能包括:定位聲源、噪音抑制、消除回聲、聲音感應。
模塊主要包括評估板卡、麥克板卡、音頻線、錄音線、USB電源線(5V)、USB轉(zhuǎn)串口數(shù)據(jù)線(控制線)。
1.3 四麥克風陣列介紹
四麥線性陣列的尺寸為165(毫米)x18(毫米)x10(毫米);
4個麥克風直線等距離擺放,每個麥克風之間的距離保持35毫米,4麥克風陣列可以形成3個波束,這樣在0°~180°范圍內(nèi)每個波束可以覆蓋60°的區(qū)域。
針對識別點語音利用信號處理的方法對進行識別點檢測、噪音消除等預處理,以便得到最適合識別算法模型處理的語音。
四麥克風陣列:支持,四麥線性構(gòu)型
支持波束形成技術(shù);
支持回聲消除技術(shù);
支持聲源定位技術(shù);
支持去除混響技術(shù);
2語音識別技術(shù)在AFC系統(tǒng)建設(shè)中的應用實踐
2.1 麥克風的應用要求說明
①要求每個麥克風均能不被遮擋的直接收到聲源,不可出現(xiàn)聲音遮蔽,保證每個麥克風都能均等機會接收聲源。例如某個麥克風被衣物遮擋,從而造成掩蔽效應。②聲源與麥克風的路徑做到最短、最寬。在緊貼面殼安裝拾音孔時,距離MIC進聲孔外側(cè)的距離不要大于1.5毫米,拾音孔的直徑越大越好,但最小要求2毫米。條件適合的情況下,麥克風最好安裝在表面,這樣效果最好。③安裝結(jié)構(gòu)當中的干擾和震動(包括喇叭、轉(zhuǎn)動結(jié)構(gòu)等)要遠離麥克風,并盡可能采用硅膠套進行減震密封,減少干擾,根據(jù)使用環(huán)境和氣候條件選擇盡量柔軟的硅膠套以達到最好效果。④喇叭在盡量遠離的原則上要進行減震處理,例如減震棉或減震墊片等,也可從結(jié)構(gòu)設(shè)計上盡量避免對麥克風造成影響出現(xiàn)失真。⑤在結(jié)構(gòu)內(nèi)設(shè)計不同的聲音通道,采用不同的腔體結(jié)構(gòu)分別對麥克風和喇叭進行密封分離,避免出現(xiàn)結(jié)構(gòu)內(nèi)聲音傳播,腔體選用性能較好的密封材料以達到最好的效果。⑥麥克風的生產(chǎn)要注意保護,避免出現(xiàn)結(jié)構(gòu)性的損壞,特別是駐極體麥克風需要避免擠壓帶來的一致性損失。
2.2 麥克風結(jié)構(gòu)和說明
本文介紹的麥克風陣列產(chǎn)品采用面殼安裝方式,本產(chǎn)品在面殼固定安裝之前預先裝配硅膠套以達到密封減震目的,預留的拾音孔位于面殼上,通過它進行錄音采集。
①硅膠套的作用使每個麥克風之間嚴格獨立,預先留置的拾音孔是唯一的進聲孔。(驗證方法:用手按住麥克風的拾音孔,拾音音量降低不小于10dB。) ②麥克風需要有橡膠套和固體表面隔絕,起到降低殼體震動傳聲以及密封的作用。③麥克風距離外表面的距離(拾音孔深度)要盡可能的?。ㄒ话阋笮∮?1.5毫米),聲孔直徑盡可能大(一般要求大于 2毫米),防止聲音在拾音孔內(nèi)壁的反射形成諧振點。④根據(jù)軌道交通應用場景情況,使用防風棉和防塵棉對麥克風表面增加防護,減少環(huán)境噪聲和靜電影響等問題出現(xiàn)。
2.3 喇叭與麥克風安裝
軌道交通應用環(huán)境當中的語音設(shè)備采用喇叭與麥克風隔離安裝的方案,結(jié)構(gòu)內(nèi)喇叭不會傳導聲音到麥克風,在麥克風表面測試喇叭聲壓不超過90分貝。有效聲源音量與喇叭音量信噪比高于-25dB,有效聲源在麥克風表面測試聲壓約為65分貝。
調(diào)試步驟:
(1)將喇叭音量調(diào)整到最大,測試麥克風表面錄音效果,達到不劫輻的要求。
(2)從麥克風距離0到5米均勻分布測試點進行有效聲源的喚醒測試(當超過3米后要提升聲源強度),經(jīng)測試確認聲源喚醒的有效距離,通過調(diào)整功放增益達到要求的喚醒距離。
3結(jié)束語
隨著軌道交通智能化的高速發(fā)展,語音識別技術(shù)可以極大豐富購票、事務(wù)處理等業(yè)務(wù)形式,提升乘客乘車體驗,越來越便利的應用場景帶來越來越復雜的使用環(huán)境,語音識別技術(shù)還需要繼續(xù)深入研究和實踐,以其滿足更多更新的業(yè)務(wù)需求。
參考文獻
[1] 錢小毅,龔迥.地鐵互聯(lián)網(wǎng)購票方式的研發(fā)[J].科技風,2019,9(1):63-65.