王 蕾
(杭州應(yīng)用聲學(xué)研究所 杭州 310023)
基于深度學(xué)習(xí)的聲納智能化顯控設(shè)計方法?
王 蕾
(杭州應(yīng)用聲學(xué)研究所 杭州 310023)
聲納顯控的智能化能降低聲納使用者的操作難度,提高聲納使用效率,在實戰(zhàn)中具有重要意義。在具備可擴(kuò)展性的聲納顯控開發(fā)平臺下,基于Tensorflow的深度學(xué)習(xí)框架,論文提出了一種智能化聲納顯控設(shè)計的方法,給出了相應(yīng)的可行性分析,具有一定的應(yīng)用前景。
聲納;顯控設(shè)計;深度學(xué)習(xí);Tensorflow
聲納顯控臺作為聲納系統(tǒng)的重要組成部分,是聲納使用者人機(jī)交互的主要工具,目前,相對開放的聲納顯控軟件平臺使得聲納顯控軟件基本具備了軟件的重用性、可擴(kuò)展性和可維護(hù)性[1]。然而,隨著聲納技術(shù)的發(fā)展,聲納的控制參數(shù)及顯示輸出信息的種類、數(shù)量及復(fù)雜度都在相應(yīng)增大,在實用中聲納操作難度也會相應(yīng)增加。本文提出的智能聲納顯控設(shè)計就是在充分利用聲納信息的前提下,基于聲納使用人機(jī)交互訓(xùn)練過程,在Tensorflow深度學(xué)習(xí)框架下,使顯控軟件能半自主或自主地達(dá)到最優(yōu)的控制參數(shù)設(shè)置和最佳的界面顯示,從而實現(xiàn)高效的聲納智能化使用。聲納顯控兩個主要功能就是聲納信息匯總顯示與聲納系統(tǒng)參數(shù)控制,常用的聲納顯控軟件設(shè)計主要考慮人機(jī)交互的操作實時性及可靠性,僅包含了基本顯示與控制功能,而且一般采用集成式的設(shè)計[2~3]。對于前沿的聲納系統(tǒng),聲納信息處理的輸入和輸出不僅種類繁多,而且數(shù)量龐大,對于顯控設(shè)計者而言,需要將聲納信息的處理演變?yōu)檫吙刂?邊存儲-邊分類、分層顯示。在基于對信息分層和分類的前提下,可以通過兩種方式來提高聲納使用效率,一種是基于專家知識系統(tǒng)來引導(dǎo)聲納使用者,該方法實現(xiàn)相對容易,但不具備自主學(xué)習(xí)能力,需要人為補(bǔ)充知識庫;另一種是在使用過程中的數(shù)據(jù)訓(xùn)練,通過深度學(xué)習(xí)算法使得聲納顯控的控制操作和顯示逐步自主化、智能化。本文傾向與采用深度學(xué)習(xí)方法來設(shè)計聲納智能化顯控系統(tǒng),首先介紹了深度學(xué)習(xí)的基本概念和框架,同時介紹了聲納顯控系統(tǒng)的神經(jīng)網(wǎng)絡(luò)建模,接著給出了基于深度學(xué)習(xí)框架Tensorflow進(jìn)行聲納顯控設(shè)計的思路與解決方法,最后對目前存在的問題進(jìn)行了分析總結(jié),確定了接下來進(jìn)一步的研究重點。
深度學(xué)習(xí)算法通過提取不同層次的特征來對抽象知識進(jìn)行歸納,具備從數(shù)據(jù)訓(xùn)練中進(jìn)行學(xué)習(xí)的能力。早期的深度學(xué)習(xí)更多借鑒了神經(jīng)科學(xué)的生物表征,因此通常引用神經(jīng)網(wǎng)絡(luò)模型,類似于仿生機(jī)器學(xué)習(xí),現(xiàn)代的深度學(xué)習(xí)依托于高速計算能力的計算硬件、更先進(jìn)算法以及更廣泛的訓(xùn)練數(shù)據(jù)的發(fā)展。
深度學(xué)習(xí)主要包含兩個過程:前向傳播和反向傳播。前向傳播是通過在每一層隱藏單元的傳播過程中提取輸入信息,得到輸出,基于訓(xùn)練過程可以得到一個預(yù)期的輸出結(jié)果,從而可以基于信息度量準(zhǔn)則(如交叉熵、均方誤差)產(chǎn)生損失函數(shù);反向傳播可以通過損失函數(shù)的信息通過網(wǎng)絡(luò)向后流動,通過反饋的方式來計算梯度,優(yōu)化模型參量[4]。
2.1 聲納顯控系統(tǒng)的神經(jīng)網(wǎng)絡(luò)建模
聲納顯控系統(tǒng)不僅僅是一個數(shù)據(jù)傳輸與界面構(gòu)成的終端顯示,對于一個聲納使用者而言,眾多與聲納使用相關(guān)的參數(shù)及聲納信息都會在這個終端匯聚,隨著聲納技術(shù)的發(fā)展,對聲納的使用也變得愈加復(fù)雜,因而顯控的智能化會大大提高聲納使用者的效率,減輕其任務(wù)負(fù)擔(dān),使聲納在實戰(zhàn)應(yīng)用中變得更可靠。智能聲納顯控就是一種具有學(xué)習(xí)能力的顯示與控制系統(tǒng),智能化的體現(xiàn)就是機(jī)器學(xué)習(xí)。目前實現(xiàn)該功能的途徑有兩條,可以依賴專家知識庫的方法[5],通過一個if-then的專家系統(tǒng)來實現(xiàn),但是該方法只能被設(shè)定規(guī)則,而不能適應(yīng)規(guī)則和預(yù)測,所以本文更傾向于另一種方法,即通過建立深度神經(jīng)網(wǎng)絡(luò)來構(gòu)造一個具有深度學(xué)習(xí)能力的聲納顯控系統(tǒng)[6~7]。例如:對于一個包含兩個參量(類似于基陣、陣段、景深、頻帶、算法)輸入的例子,其組合形式對于特定環(huán)境下的聲納信息分層提取的性能是各不相同的,因而每一種組合具有對應(yīng)的信息權(quán)重[8],所以可以如圖1構(gòu)建一個簡單的4層前向神經(jīng)網(wǎng)絡(luò),包含輸入層X,第一隱藏層a,第二隱藏層b及輸出層Y,各層之間的不同節(jié)點鏈接都用權(quán)重表示。
神經(jīng)網(wǎng)絡(luò)本質(zhì)上是一個優(yōu)化問題,對于聲納顯控使用者而言,他在使用過程中可以不斷積累經(jīng)驗,甚至舉一反三,提高使用效率,這也是一個不斷自我完善和優(yōu)化的過程。設(shè)計智能顯控的一個原理上的關(guān)鍵步驟就是要設(shè)定好損失函數(shù),因為損失函數(shù)就描述了神經(jīng)網(wǎng)絡(luò)需要優(yōu)化的目標(biāo)[9~11]。針對分層特性的聲納信息:寬帶輸出方位信噪比及跟蹤關(guān)聯(lián)結(jié)果-窄帶特征線譜-單波束調(diào)制譜-單波束收聽信號等等,在一定輸入情形下,每一層信息的表示形式不同,但各層之間具有一定的先后依賴關(guān)系,對于顯控使用者而言,其對顯控輸出的這些信息進(jìn)行綜合判斷,從而給出最佳決策。然而在深度學(xué)習(xí)的范疇下,顯控輸入的控制參數(shù)及顯示輸出的結(jié)果均要構(gòu)成分布式的神經(jīng)網(wǎng)絡(luò)輸入,可以使用常用的交叉熵作為損失函數(shù),通過聲納使用者在使用過程中給出的數(shù)據(jù)累計訓(xùn)練,使聲納顯控的控制參數(shù)通過權(quán)重分配實現(xiàn)簡約化,聲納的輸出布局實現(xiàn)最佳顯示,甚至具有自主鑒別聲納目標(biāo)能力。
圖1 聲納顯控系統(tǒng)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
2.2 深度學(xué)習(xí)框架
目前主流的深度學(xué)習(xí)框架有Tensorflow、Caffe、Theano、Torch等[12~13],綜合考慮算法庫的完備性、支持語言的通用性、對不同硬件架構(gòu)及接口的兼容性以及計算效率等多方面因素,最終選擇了綜合優(yōu)勢最佳的Tensorflow深度學(xué)習(xí)框架。
Tensorflow可以方便地部署到各種平臺,簡化了在聲納顯控系統(tǒng)中應(yīng)用深度學(xué)習(xí)的難度。除此之外,Tensorflow能夠通過單機(jī)模式和分布式模式來實現(xiàn),單機(jī)模式就是將客戶端(client)、主端(master)及苦力(worker)全部在一臺機(jī)器上的同一個進(jìn)程中實現(xiàn),分布式模式允許上述三個組件在不同機(jī)器的不同進(jìn)程中,每一個worker可以連接多個硬件設(shè)備,同時由集群調(diào)度系統(tǒng)統(tǒng)一管理各項任務(wù)。顯然,對于未來升級和擴(kuò)展需求,具備兼容性的軟、硬件框架,分布式模式更加符合這一發(fā)展的需求。
圖2 Tensorflow分布模式
智能聲納顯控設(shè)計應(yīng)當(dāng)滿足三種選擇:自主、半自主、人工;自主或半自主功能的實現(xiàn)需要嵌入Tensorflow,設(shè)定好其輸入及各隱層及損失函數(shù),進(jìn)行一定的數(shù)據(jù)流上的完善就能在功能上實現(xiàn)了[13]。如圖3給出了一個設(shè)計好的具有三個隱層的Tensorflow可視化計算圖。
圖3 Tensorflow可視化計算圖
如2.2節(jié)所述,Tensorflow的一個有利條件便是其具有在語言、操作系統(tǒng)平臺及硬件上的兼容開放性,所以在聲納顯控設(shè)計中嵌入Tensorflow的途徑也很多。然而需要注意的是,Tensorflow也并非一個即插即用的插件,如果構(gòu)建這樣一個深度學(xué)習(xí)框架,在顯控軟件架構(gòu)設(shè)計上需要投入大量的精力,而且為了滿足實時高效的處理能力,需要滿足與之配套的硬件條件。
在搭建好深度學(xué)習(xí)的軟件和硬件架構(gòu)的基礎(chǔ)上,與當(dāng)前顯控平臺進(jìn)行合并,需要解釋兩個問題:1)基于當(dāng)前的顯控臺需要給深度學(xué)習(xí)什么樣的輸入;2)深度學(xué)習(xí)輸出什么樣的信息給顯控。深度學(xué)習(xí)模塊的輸入應(yīng)當(dāng)是人工控制的命令表及與之對應(yīng)的聲納信息,而且由于輸入數(shù)據(jù)的種類和數(shù)量均比較多,所以需要對其進(jìn)行降維和壓縮。經(jīng)過訓(xùn)練且具備一定辨識能力后的深度學(xué)習(xí)模塊輸出的應(yīng)當(dāng)是可以輔助或者代替人工的最佳決策表及最佳的顯示分布。
圖4 智能顯控系統(tǒng)的示意圖
本文針對當(dāng)前聲納使用的需求,期望通過具有自主學(xué)習(xí)的辦法來提高聲納使用效率,提出了一種通過深度學(xué)習(xí)算法來實現(xiàn)智能聲納顯控設(shè)計的方法。首先對實現(xiàn)原理進(jìn)行了分析,構(gòu)建與之相對應(yīng)的神經(jīng)網(wǎng)絡(luò)模型,其次對Tensorflow深度學(xué)習(xí)框架進(jìn)行了分析,并對其嵌入智能顯控給出了具體實現(xiàn)上的分析,接下來的工作就是在目前的研究基礎(chǔ)上,對針對顯控輸入輸出構(gòu)建的神經(jīng)網(wǎng)絡(luò)模型進(jìn)行具體設(shè)計和優(yōu)化,同時需要對相應(yīng)的算法性能(包括運(yùn)算效率)進(jìn)行測試分析,并給出滿足綜合最佳性的智能聲納顯控設(shè)計原理。
[1]徐麗華.基于JARI_EGK面向?qū)ο蟮穆晠蕊@控界面軟件開發(fā)方法[J].聲學(xué)與電子工程,2015(2):30-33.
[2]魏銀英.基于VxWorks的成像聲納顯控軟件技術(shù)研究[D].哈爾濱:哈爾濱工程大學(xué),2008.
[3]于海春,馮師軍,孫長喻.基于統(tǒng)一建模語言的聲納顯控設(shè)計[J].應(yīng)用聲學(xué),2009,28(4):268-272.
[4]黃文堅,唐源.Tensorflow實戰(zhàn)[M].北京:電子工業(yè)出版社,2017:18-25.
[5]王凱,李貴陽,應(yīng)文健.基于Visio故障樹的艦炮故障診斷專家系統(tǒng)設(shè)計與實現(xiàn)[J].艦船電子工程,2017(1):100-104.
[6]肖晶,吳學(xué)智.一種基于神經(jīng)網(wǎng)絡(luò)的故障診斷新方法研究[J]. 艦船電子工程,2010(1):160-163.
[7]楊文慧.基于深度學(xué)習(xí)的圖像態(tài)勢感知應(yīng)用研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2016.
[8]李啟虎.數(shù)字聲納設(shè)計原理[M].合肥:安徽教育出版社,2003:291-303.
[9]Bahdanau D,Cho K,Bengio Y.Neural Machine Translation by Jointly Learning to Align and Translate[J].Com-puter Science,2014.
[10]Bengio Y.Deep learning of representations:looking forward[C]∕International Conference on Statistical Language and Speech Processing.Berlin, Heidelberg:Springer-Verlag,2013:1-37.
[11] Goodfellow I J,Courville A,Bengio Y.Scaling Up Spike-and-Slab Models for Unsupervised Feature Learning[J].IEEE Transactions on Pattern Analysisamp;Machine Intelligence,2013,35(8):1902-1914.
[12]王茜,張海仙.深度學(xué)習(xí)框架Caffe在圖像分類中的應(yīng)用[J].現(xiàn)代計算機(jī),2016(5):72-75.
[13]鄭澤宇,顧思宇.Tensorflow實戰(zhàn)Google深度學(xué)習(xí)框架[M].北京:電子工業(yè)出版社,2017:40-62.
A Design Method of Intelligent Display and Control of Sonar Based on Depth Learning
WANG Lei
(Hangzhou Applied Acoustics Research Institute,Hangzhou 310023)
The intelligentization of sonar display can reduce the difficulty of the operation of sonar users and improve the efficiency of sonar,which is of great significance in actual combat.Based on the Tensorflow depth learning framework,this paper presents a method of intelligent sonar display and control design,and gives the corresponding feasibility analysis,which has certain application foreground.
sonar,display and control design,depth learning,Tensorflow
TP391
10.3969∕j.issn.1672-9730.2017.10.020
Class Number TP391
2017年4月8日,
2017年5月29日
王蕾,女,碩士,助理工程師,研究方向:聲納顯控系統(tǒng)研究。