宋金澤(上海飛機(jī)設(shè)計研究院,上海 201210)
語音識別系統(tǒng)在民機(jī)駕駛艙的應(yīng)用
宋金澤
(上海飛機(jī)設(shè)計研究院,上海 201210)
在飛機(jī)駕駛艙引入語音識別系統(tǒng),是時代與科技發(fā)展的必然結(jié)果,減輕駕駛員負(fù)荷,并符合新一代飛行員對智能科技的追求。語音識別系統(tǒng)的核心在于特性提取、模式匹配和噪聲濾除,該領(lǐng)域的研究都比較成熟,使得語音識別系統(tǒng)在飛機(jī)駕駛艙應(yīng)用成為可能。本文結(jié)合飛機(jī)駕駛艙使用環(huán)境與民機(jī)設(shè)計特點,對民用飛機(jī)駕駛艙內(nèi)貫徹語音識別系統(tǒng)進(jìn)行了探討。
民機(jī) 駕駛艙 語音識別
民航系統(tǒng)出于安全考慮,對技術(shù)的成熟度要求較高,因此不論機(jī)載還是地面系統(tǒng),并不總是急于第一時間嘗試新技術(shù)。然而在飛機(jī)駕駛艙引入語音識別系統(tǒng),是技術(shù)進(jìn)步帶來的一種必然[1],可以減輕飛行員負(fù)荷,并符合新一代飛行員對智能科技的追求。
語音識別系統(tǒng)的核心在于特性提取、模式匹配和噪聲濾除,這些領(lǐng)域的研究目前都已比較成熟。
參數(shù)提取的算法主要有LPCC(線性預(yù)測倒譜系數(shù))和MFCC (Mel頻率倒譜)。MFCC具有更強(qiáng)的抗干擾能力等特點,更適合與噪聲較多、發(fā)話人不能離輸入設(shè)備很近的環(huán)境。模式匹配通過計算現(xiàn)有語音模式與語音模板庫中的模板的距離,來獲得最佳的匹配模式。主要有DTW(動態(tài)時間規(guī)整)、HMM(隱馬爾科夫模型)和ANN(人工神經(jīng)元網(wǎng)絡(luò))法。ANN與HMM需要大量的計算,DTW更適合用于孤立詞、小詞匯量的語音識別[2]。噪聲是影響識別準(zhǔn)確率的重要因素,但是汽車領(lǐng)域里已經(jīng)有了較好的實踐,可以做到即使車內(nèi)環(huán)境很嘈雜(副駕駛座上的乘客在說話, 或者車載音響被打開),也不影響駕駛者操控語音系統(tǒng)[3]。
某些航空設(shè)備制造商已經(jīng)推出了語音識別產(chǎn)品,但是只局限于個別廠家的單個產(chǎn)品,功能有限。相比單一設(shè)備供應(yīng)商,主制造商具有無以倫比的綜合集成優(yōu)勢:(1)在機(jī)上選用性能更強(qiáng)的機(jī)載硬件,富余的計算資源可以支持復(fù)雜的運算;(2)采用集成度高的航電系統(tǒng),語音識別的結(jié)果可以有效輸出到各系統(tǒng)。以下給出一種設(shè)想的實施架構(gòu)。
(1)在飛機(jī)上增加專用設(shè)備——“語音處理單元”用于處理飛行員的語音輸入并產(chǎn)生指令輸出;或不增加專用設(shè)備,而將該部分功能——“語音處理功能”駐留在綜合航電系統(tǒng)中。(2)通過各系統(tǒng)的設(shè)計保障等級與系統(tǒng)安全性分析,制定控制飛機(jī)的語音指令集,分別對應(yīng)不同安全級別系統(tǒng)的響應(yīng)??梢酝ㄟ^航電軟件升級對語音指令集進(jìn)行修改。對于不影響安全的一些語音指令,允許航空公司通過USB等方式快速更新。(3)飛機(jī)駕駛艙處于持續(xù)噪聲環(huán)境中,而且隨著飛行階段的不同,噪聲水平也不同。因此除了選用良好的麥克風(fēng)輸入設(shè)備,還需要精準(zhǔn)的噪聲濾除??筛鶕?jù)不同飛行階段的環(huán)境噪聲建立數(shù)據(jù)庫,比較合適的方式是在飛機(jī)型號研制試飛時,隨著對飛機(jī)包線的摸索一并完成。(4)飛行員通過打開指令接收通道來激活語音處理單元/功能,激活指令的方式可選(以下選項互不排斥):1)在飛機(jī)上加裝專用的激活按鈕;2)使用現(xiàn)有的PTT內(nèi)話按鈕;3)關(guān)鍵詞激活HOT MIC。(5)語音處理單元/功能激活后,將按照事先規(guī)定的標(biāo)準(zhǔn)句法識別飛行員的意圖。飛行員可以隨時中斷語音輸入。語音輸入成功后根據(jù)命令等級不同對應(yīng)不同的確認(rèn)程序,如音響或機(jī)器人聲的語音回放。該聲音的大小可調(diào)。語音輸入的同時系統(tǒng)將會監(jiān)視對應(yīng)的設(shè)備有無被手動操作,如有將取消語音輸入指令并提示飛行員。
下面結(jié)合4條實例說明在駕駛艙實裝語音識別系統(tǒng)的優(yōu)勢。
(1)飛行員注意到EICAS上有一條故障信息,通過語音助手打開對應(yīng)的CMS顯示頁面,這些頁面在沒有語音識別的情況往往需要飛行員多步導(dǎo)航才能到達(dá);(2)飛機(jī)正在飛越一片嚴(yán)重湍流區(qū),飛行員忙于穩(wěn)住飛機(jī)的姿態(tài),通過語音助手打開系緊安全帶指示燈,并實時下傳湍流報,提醒地面規(guī)劃好后續(xù)飛機(jī)的航線;(3)惡劣天氣下,飛行員通過語音助手發(fā)出氣象請求,并顯示收到的回復(fù)。當(dāng)管制員要求飛機(jī)復(fù)飛轉(zhuǎn)場時,飛行員通過語音助手更改飛行計劃到備用機(jī)場。 (4)延時提醒,管制員要求飛行員在某高度報告,飛行員告知語音助手,當(dāng)系統(tǒng)檢測到飛機(jī)達(dá)到指定高度時提醒飛行員。
語音識別技術(shù)在國內(nèi)外均有大量研究,技術(shù)的成熟度日漸提高,普及領(lǐng)域呈現(xiàn)拓展趨勢,如蘋果的”SIRI”、電腦平臺的“Saybot”、百度語音搜索等。許多汽車也具有語音識別功能,作為高端產(chǎn)品的飛機(jī)更不應(yīng)當(dāng)落后于潮流。
如果說當(dāng)前還沒有廣泛使用是因為可靠性尚待提高,那么當(dāng)技術(shù)水平進(jìn)步到以前的劣勢,如可靠性,已經(jīng)不再是制約瓶頸的時候,就是新技術(shù)一馬平川的應(yīng)用之時。在飛機(jī)駕駛艙應(yīng)用語音識別系統(tǒng)前景廣闊,技術(shù)儲備逐漸成熟,國外嗅覺敏銳的航電系統(tǒng)集成商已經(jīng)開始建立專利壁壘,如HONEYWELL公司就在2010年申請了一項美國專利Methods and systems for utilizing voice commands onboard an aircraft[4]。波音夢想飛機(jī)的夢幻燈光爭取了乘客的好奇心,語音識別系統(tǒng)也同樣會爭取到飛行員的好奇心,行業(yè)內(nèi)應(yīng)當(dāng)引起重視。
[1]凱文 凱利.必然[M].北京:電子工業(yè)出版社,2016:29.
[2]石可箴.車載多媒體系統(tǒng)中語音識別技術(shù)研究[J].數(shù)字技術(shù)與應(yīng)用.2012(2):82-82.
[3]朱敏會.Nuance 的創(chuàng)新語音技術(shù)[J].汽車與配件.2012(1):30-31.
[4]DONG X Q,QIN X L.Methods and systems for utilizing voice commands onboard an aircraft[P].USA.2011.
宋金澤(1986—)男,漢族,黑龍江哈爾濱人,上海交通大學(xué)碩士,工程師,研究方向:民機(jī)甚高頻通信、數(shù)據(jù)鏈、靜電放電。