雷國志,代紅
(1.西南電子技術(shù)研究所 航空部, 成都 610036)(2.陸軍航空軍代局駐成都地區(qū)軍代室, 成都 610036)
隨著神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等技術(shù)的突破,利用人工智能技術(shù)降低操作者負(fù)荷,提高系統(tǒng)安全性已成為民航發(fā)展的方向。國內(nèi)外圍繞人工智能在機(jī)器人替代副駕駛、替代空管等方面進(jìn)行了大量的研究工作。例如,Aurora公司研發(fā)了ALIAS機(jī)器人并進(jìn)行飛行測試[1];楊紅雨等[2]研究利用人工智能代替空管人員的方法。但上述研究卻未涉及關(guān)于人工智能替代飛行通信員方面的研究。
雖然隨著電子信息技術(shù)的發(fā)展,新的航電設(shè)備的出現(xiàn),專職飛行通訊員崗位已經(jīng)消失,但其陸空通信的職責(zé)仍然存在,并由飛行駕駛員承擔(dān)。張璐[3]通過統(tǒng)計歷年來民航所發(fā)生的不安全事件,總結(jié)發(fā)生在通話過程中的不安全事件要高于其他技術(shù)原因,而目前空管領(lǐng)域采用人工“對關(guān)鍵指令進(jìn)行抄收和復(fù)誦”[4]的方法,該方法耗時長且效率低。
本文用人工智能技術(shù)替代飛行通信員(或飛行駕駛員的通信職責(zé)),從飛行員操作過程、系統(tǒng)內(nèi)外部接口、系統(tǒng)的功能架構(gòu)、機(jī)載電子系統(tǒng)的可實現(xiàn)性等角度進(jìn)行綜合設(shè)計,針對系統(tǒng)的安全性和通信效率進(jìn)行充分地分析評估。
陸空通話過程包括5個子過程:話音接收、語義理解、指令執(zhí)行、指令復(fù)誦和話音發(fā)射,其中語義理解和指令復(fù)誦是單純的人類活動,而話音接收、指令執(zhí)行和話音發(fā)射則是人機(jī)在環(huán)行為。人工智能飛行通信員系統(tǒng)(ACPS)代替飛行通信員(或飛行駕駛員的通信職責(zé))的通話過程如圖1所示[5],通話過程為:
(1) 話音接收不變,將原先送給機(jī)組成員的接收音頻同步發(fā)送給ACPS。
(2) 語義理解過程在原先的聽覺認(rèn)知基礎(chǔ)上增加了視覺認(rèn)知,通過視覺、聽覺跨模態(tài)交互促進(jìn)機(jī)組認(rèn)知。
(3) 當(dāng)視覺聽覺認(rèn)知一致既語義理解無誤時,ACPS自動執(zhí)行指令,并自動進(jìn)行指令復(fù)誦;當(dāng)視聽認(rèn)知不一致既語義理解不清時,不執(zhí)行指令,機(jī)組成員完成復(fù)誦,因此原先的指令執(zhí)行和指令復(fù)誦過程合并為一個過程。
(4) 話音發(fā)射過程增加ACPS音頻發(fā)送和機(jī)組音頻發(fā)送的切換。
圖1 人工智能飛行通信員系統(tǒng)(ACPS)陸空通話過程
ACPS過程中有許多機(jī)器活動,ACPS需要操控機(jī)載航電系統(tǒng)完成帶飛、天氣解讀、飛行計劃和航行通告等陸空通話活動,而飛行通信員的這些操作都可以包含在機(jī)載通信導(dǎo)航監(jiān)視(Communication Navigation System,簡稱CNS)系統(tǒng)中?,F(xiàn)代飛機(jī)CNS系統(tǒng)基本作為一個整體進(jìn)行設(shè)計的,ACPS可以通過統(tǒng)一的總線實現(xiàn)CNS系統(tǒng)的互操作。ARINC660A推薦的CNS系統(tǒng)架構(gòu)與ACPS的交聯(lián)關(guān)系如圖2所示[6],具體包括:
(1) 機(jī)組控制:耳機(jī)、話筒、音頻、發(fā)話使能(PTT)等;
(2) 導(dǎo)航接收機(jī):導(dǎo)航數(shù)據(jù)、自動調(diào)諧指令;
(3) 傳感器:高度、空速、航姿等;
(4) 通信電臺:自動調(diào)諧指令;
(5) 飛行顯示器:飛機(jī)位置、航圖、數(shù)據(jù)鏈信息等;
(6) 飛行控制:飛行計劃、自動調(diào)諧指令等;
(7) 監(jiān)視設(shè)備:應(yīng)答機(jī)、高度表、雷達(dá)。
圖2 CNS系統(tǒng)與ACPS交聯(lián)圖
不同的CNS系統(tǒng)架構(gòu)可以有不同的ACPS設(shè)計方案[7],采用綜合模塊化航空電子(IMA)架構(gòu)的CNS系統(tǒng)理論可以采用“純軟件”的方式予以實現(xiàn),但由于現(xiàn)行的IMA計算機(jī)并沒有考慮深度學(xué)習(xí)等人工智能計算需求。因此本文在典型CNS系統(tǒng)架構(gòu)上,通過增加ACPS主機(jī)的方式,給出ACPS的系統(tǒng)架構(gòu)如圖3所示。
該架構(gòu)以語音識別和指令生成兩個深度信念網(wǎng)絡(luò)(Deep Belief Network,簡稱DBN)為核心構(gòu)建,語音識別功能將來自CNS系統(tǒng)的音頻輸入進(jìn)行降噪處理后提取特征參數(shù),通過DBN后生成語義序列;其后的指令生成功能將語義序列與來自機(jī)載總線的飛行計劃、飛行參數(shù)、航行位置、航圖等數(shù)據(jù)進(jìn)行聯(lián)合并提取特征參數(shù),通過第二個DBN生成執(zhí)行指令和復(fù)誦指令,其中執(zhí)行指令通過機(jī)載總線發(fā)送給CNS系統(tǒng),復(fù)誦指令在通過韻律處理后讀取語音庫生成復(fù)誦話音,最后輸出到CNS系統(tǒng)。
圖3 ACPS原理架構(gòu)
由于機(jī)載航電系統(tǒng)對實時性要求很高,為提高效率,ACPS在離線的情況下對兩個DBN進(jìn)行訓(xùn)練學(xué)習(xí)[8],訓(xùn)練好的聲學(xué)、語言模型和指令模型加載到機(jī)載環(huán)境中進(jìn)行快速計算。
ACPS計算機(jī)作為機(jī)載嵌入式平臺,應(yīng)同時滿足數(shù)據(jù)實時性和可計算性能的需求。相對于單個服務(wù)器CPU而言嵌入式計算機(jī)性能普遍較弱,ACPS計算機(jī)系統(tǒng)采用分布式異構(gòu)架構(gòu),主控模塊采用事務(wù)型處理器,DBN計算模塊采用多片計算型CPU并行計算,并通過Rapid IO直接與主控模塊互聯(lián),接口模塊采用IO型處理器,多種CPU構(gòu)成了ACPS的計算系統(tǒng),其硬件架構(gòu)如圖4所示,主要模塊功能如下:
(1) 主控模塊完成ACPS功能,系統(tǒng)內(nèi)的維護(hù)等;
(2) 接口模塊將總線、模擬、離散接口數(shù)據(jù)和狀態(tài)發(fā)給主控模塊,并將主控模塊的指令通過總線、模擬、離散接口發(fā)送給其他系統(tǒng);
(3) 神經(jīng)網(wǎng)絡(luò)計算模塊實現(xiàn)語音識別、自動指令控制等功能所需的DBN計算;
(4) 大容量存儲器用于保存數(shù)據(jù)模型、新的神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)、ACPS工作參數(shù)等。
圖4 ACPS硬件架構(gòu)
相對于原先飛行通信員完全依靠聽覺認(rèn)知的操作過程,ACPS增加了視覺認(rèn)知過程和聽視覺交互過程,這需要新的飛行員操作程序(Pilot Operational Procedures,簡稱POP)支撐。針對飛機(jī)離港和新管制頻率確認(rèn)兩個空管過程設(shè)計了空管指令確認(rèn)界面和調(diào)諧指令生成界面,分別如圖5~圖6所示。
圖5 空管指令確認(rèn)界面
圖6 調(diào)諧指令生成界面
對于空管指令確認(rèn)界面,ACPS將空管發(fā)送的語音指令轉(zhuǎn)化成文字顯示在屏幕上,同時自動生成所需復(fù)誦文字,當(dāng)機(jī)組確實視覺指令與聽覺指令一致后按壓確認(rèn)鍵(或PTT)即可執(zhí)行后續(xù)操作。
對于調(diào)諧指令生成界面,ACPS將空管發(fā)送的飛行計劃轉(zhuǎn)化自動調(diào)諧指令,當(dāng)機(jī)組確認(rèn)后錄入飛行管理系統(tǒng),更新飛行計劃。
航電系統(tǒng)是安全性相關(guān)的系統(tǒng),從圖2可以看出ACPS和機(jī)組的陸空通話操作在機(jī)載設(shè)備操作需求方面是完全獨(dú)立的,同時ACPS硬件和軟件是獨(dú)立開發(fā)的,ACPS與原機(jī)載設(shè)備沒有直接耦合,是通過機(jī)組人員完成,滿足ARP4754A的獨(dú)立性要求。當(dāng)ACPS的研制保證等級與原機(jī)載設(shè)備的研制保證等級一致,根據(jù)ARP4754A,具備ACPS的通話功能喪失的失效狀態(tài)分類可以提升一個等級;如果ACPS的研制保證等級低于原機(jī)載設(shè)備一個等級,新的通話功能喪失的失效分類與原通話安全性等級一致。
因此ACPS不會導(dǎo)致陸空通話安全性下降,同時解決了語言、口音、注意力問題,也提升了系統(tǒng)安全性[9-10],保證飛行安全[11]。
DO284中95%RCP通信時間的過程分析如圖7所示[12],其中人因性能包括地面管制員和飛行通信員兩部分,機(jī)器性能主要由通信設(shè)備提供,ACPS主要改善的飛行通信員的人員績效的反應(yīng)時間(人因性能),因此本文采用ACPS后的反應(yīng)時間。
圖7 95%RCP通信時間
一般聽覺認(rèn)知短時記憶為tH1=3~5 s,而視覺認(rèn)知短時記憶一般為tH2=1~2 s[5],語音識別tH3<1 s[13],因此圖1中聽視覺交互確認(rèn)的時間tH5=max (tH1,tH2+tH3)=5 s。當(dāng)視聽一致情況下后續(xù)指令均為系統(tǒng)自動產(chǎn)生,僅需一次人工確認(rèn)tH6=tH2,且小于2 s,因此完整的人員績效的最大反應(yīng)時間tH7=tH5+tH6=7 s。當(dāng)視聽不一致情況,仍采用原陸空通話確認(rèn)方式,ACPS不會導(dǎo)致反應(yīng)時間的增加。
ACPS主要用于改善人員績效的反應(yīng)時間,可以將反應(yīng)時間由47~98 s[14]下降至7 s,進(jìn)而提高溝通效率。
(1) ACPS在不降低系統(tǒng)安全性的基礎(chǔ)上將通信時間縮減至7 s,提高了陸空通話效率。
(2) ACPS減少了機(jī)組人員工作量,進(jìn)而潛在地提高飛行員的表現(xiàn),保證飛行安全;通過人工智能機(jī)器人進(jìn)行溝通,減少語言、口音和其他干擾因素的影響,減少二次確認(rèn)過程,提高了溝通效率。