張玉石 李笑宇 張金鵬 夏曉云
(中國電波傳播研究所電波環(huán)境特性及模化技術重點實驗室 青島 266107)
受海洋氣象和地理環(huán)境的影響,海面環(huán)境錯綜復雜,實現(xiàn)海上目標的精準探測具有極大的挑戰(zhàn)性[1,2],這是由于當雷達對海面進行探測時,接收到的海面回波信號同時混雜著目標信號、噪聲信號和海雜波信號。海雜波是指海面的雷達散射回波,是海面目標信號的重要“污染源”,研究海雜波特性對于海面目標檢測具有重要的意義[3-5]。
海雜波的多普勒譜特性是指海表面單個距離門內連續(xù)相參時間序列信號自相關函數(shù)的傅里葉變換,譜參數(shù)包括多普勒頻移與多普勒展寬。海雜波的譜特性能夠反映海面能量特征和運動相位信息,在海雜波研究中有著不可替代的作用。1955年,Crombie[6]通過分析L波段雷達海雜波實測數(shù)據(jù),開啟了海雜波多普勒譜特性研究的先河。20世紀90年代,各國研究團體陸續(xù)開展了多項海雜波譜特性研究試驗,建立了多種考慮散射機理的海雜波多普勒譜模型。例如,Lee等人[7]通過對多組實測數(shù)據(jù)的分析,提出了具有一定物理意義的Lee模型。Walker[8]利用造浪池數(shù)據(jù),分析了海浪從產(chǎn)生到破碎全過程的多普勒變化特性,并建立了結合布拉格、白浪和破碎3種散射機制的Walker模型。Ward等人[3]借鑒了復合K分布幅度建模的思想,提出了利用兩個高斯函數(shù)對譜形狀進行描述的Ward模型。進入21世紀,澳大利亞國防科技部(DSTO)的Rosenberg等人[9,10]詳細研究了海雜波譜特性在不同海洋環(huán)境和不同測量雷達下的詳細變化,并提出了Rosenberg模型。中國電波傳播研究所的Zhang等人[11]通過對海雜波實測數(shù)據(jù)的長期觀測,對多普勒譜建模進行了深入的研究,并提出了時變多普勒譜模型。然而,上述模型都屬于基于物理機理和經(jīng)驗數(shù)據(jù)的海雜波譜形狀建模,解決的是譜線結構服從何種函數(shù)形式的問題,尚未實現(xiàn)從測量參數(shù)出發(fā)的海雜波譜形狀和譜參數(shù)的預測。
近年來,人工智能、深度學習等新興信息技術手段,被用于更加快速、智能化地研究各種海雜波特性[12],這給從海量的海雜波數(shù)據(jù)出發(fā),解決海雜波多普勒譜特性預測的問題帶來了曙光。McDonald等人[13]使用徑向基神經(jīng)網(wǎng)絡(Radial Basis Function Neural Network,RBFNN)對包含噪聲的海雜波混沌序列進行預測,并得到了較好的結果。Shen等人[14]使用后向傳播神經(jīng)網(wǎng)絡(Back Propagation Neural Network,BPNN)對海雜波幅度進行了預測。Fernández等人[15]使用BPNN實現(xiàn)了對海雜波幅度分布參數(shù)的預測;2019年,Ma等人[16]用LSTM-NN對海雜波幅度均值和幅度分布參數(shù)進行預測;2021年,Shui等人[17]使用廣義回歸神經(jīng)網(wǎng)絡(General Regression Neural Network,GRNN)對UHF波段海雜波散射均值進行預測。可見,眾多學者已經(jīng)利用人工智能手段先后嘗試解決了海雜波幅度均值和幅度分布特性的預測問題,然而在海雜波多普勒特性的智能化預測方面,尚未見相關研究報道。此外,現(xiàn)有的海雜波特性參數(shù)預測研究成果,測量覆蓋的雷達參數(shù)和海洋環(huán)境參數(shù)范圍有限,并且缺乏預測結果的影響因素分析。
本文基于黃海海域測量的大量Ku波段岸基雷達實測海雜波數(shù)據(jù),利用深度學習網(wǎng)絡建模技術,研究了從多個測量條件參數(shù)出發(fā)的海雜波多普勒譜參數(shù)預測方法,建立了譜頻移和展寬的預測模型,并提出了一種基于參數(shù)循環(huán)遞減認知的多普勒譜影響因素分析方法,首次實現(xiàn)了海雜波多普勒譜的多影響因素定量分析,得到了譜參數(shù)隨主要影響因素的變化規(guī)律,對基于多普勒特征的海面目標檢測應用具有重要意義。
本文基于中國電波傳播研究所在黃海靈山島海域測量的Ku波段岸基雷達海雜波數(shù)據(jù)開展海雜波譜參數(shù)預測方法研究。Ku波段雷達為全相參脈沖體制,可實現(xiàn)HH和VV極化、小擦地角(1°~10°)及多種海洋環(huán)境參數(shù)條件下的海雜波數(shù)據(jù)采集,雷達脈寬5~40 μs,脈沖重復頻率(Pulse Repetition Freguency,PRF)為1 kHz或2 kHz。雷達架設高度約450 m,架設實況如圖1所示。
圖1 Ku波段海雜波測量雷達實況Fig.1 Reality of Ku band sea clutter measurement radar
海雜波數(shù)據(jù)測量的時間范圍為2020年11月-2021年3月,雷達工作在凝視模式下,每一組數(shù)據(jù)包括一段20 s的海面固定區(qū)域的雷達連續(xù)觀測回波,覆蓋海況等級為1~3級。經(jīng)過數(shù)據(jù)預處理和雜噪比分析,篩選出雜波區(qū)域明顯的105363組數(shù)據(jù)。根據(jù)海情大小和極化方式的不同,數(shù)據(jù)集信息如表1所示。從數(shù)據(jù)總量上可以看出,2級海況下的數(shù)據(jù)最多,3級海況下的數(shù)據(jù)最少。此外,HH極化的海雜波數(shù)據(jù)比VV極化的海雜波數(shù)據(jù)更多;HH極化的2級海況數(shù)據(jù)占比比VV極化更多,3級海況數(shù)據(jù)占比比VV極化更少。
表1 Ku波段海雜波數(shù)據(jù)集信息Tab.1 Ku band sea clutter dataset information
在進行海雜波的譜參數(shù)智能化預測之前,需要先構建預測模型的數(shù)據(jù)集。數(shù)據(jù)集構建的具體步驟包括譜參數(shù)提取、環(huán)境參數(shù)匹配、數(shù)據(jù)篩選與清洗和歸一化等。
海雜波譜參數(shù)提取方法包含以下流程:首先對實測原始數(shù)據(jù)進行預處理,包括數(shù)制轉換、脈沖壓縮、有效雜波區(qū)域提取等,從而得到距離-脈沖幅值圖;然后使用頻譜估計方法,估計得到海雜波的多普勒譜;最后計算得到海雜波的多普勒頻移和展寬。具體流程如圖2所示。
圖2 海雜波多普勒譜參數(shù)的提取流程Fig.2 Extraction process of Doppler spectral parameters of sea clutter
本文選擇Burg法[18]作為海雜波譜估計方法,該方法比起傳統(tǒng)估計方法頻率分辨率更好、適應性更強,比起其他現(xiàn)代譜估計方法的計算效率更高。根據(jù)Ku波段實測數(shù)據(jù)的參數(shù)情況,Burg法中的AR模型階數(shù)取50,F(xiàn)FT點數(shù)取1024,采樣頻率設置為雷達的脈沖重復頻率,取1 kHz或2 kHz。估計得到的多普勒譜表達式如式(1)所示:
式(1)中,Ep表 示方差,SBu(f)表示估計得到的海雜波功率譜密度。
在得到多普勒譜曲線后,計算海雜波有效區(qū)域內每個距離門的多普勒頻移fd和展寬Bw,公式如下:
海雜波的測量條件參數(shù)是實現(xiàn)海雜波譜參數(shù)預測的輸入數(shù)據(jù),主要包括雷達測量參數(shù)和海洋環(huán)境參數(shù)。在海雜波測量過程中,Ku波段雷達固定照射頻率,調整俯仰角和方向角實現(xiàn)對不同方向海域的探測。本文選取擦地角、極化方式和帶寬3個雷達測量參數(shù)作為輸入信息。海洋環(huán)境參數(shù)由浮標系統(tǒng)和風速計測量得到,其中浮標(波浪騎士DWR4)投放于海雜波測量區(qū)域,風速計架設于雷達位置附近,周圍無遮擋。在浮標和風速計記錄的多維參數(shù)中,篩選出7個海洋環(huán)境參數(shù),包括海浪參數(shù)(有效浪高、浪向、浪周期)、海流參數(shù)(有效流速、流向)和海風參數(shù)(有效風速、風向),作為譜預測的輸入信息。因此,用于海雜波多普勒譜參數(shù)預測的測量條件參數(shù)共計10個。
在海雜波的測量條件參數(shù)中,風浪流三者的方向存在密切的關聯(lián),若三者一致性程度很高,則這種強關聯(lián)會影響海雜波多普勒譜影響因素的分析結果,若三者完全不相關,尤其是如果風向和浪向完全不吻合,則說明海面風對海浪的形成起的作用很小,風速意義不大。圖3給出了2021年2月測量的風浪流方向的關系圖。從圖3可以看出,2月23日至2月26日,風向和浪向存在一定的關聯(lián)性,說明這期間海浪充分發(fā)展;2月14日至2月16日,風向和浪向偏差較大,說明這期間海浪發(fā)展程度很低。對流向而言,其與另外兩種參數(shù)的一致性較低,這與海流形成的物理機理是一致的,不影響數(shù)據(jù)分析??傮w而言,本文使用的風浪流數(shù)據(jù)存在一定的關聯(lián)耦合性,也存在相當?shù)莫毩⑿?,滿足海雜波影響因素分析對數(shù)據(jù)的需求。
圖3 試驗數(shù)據(jù)中風浪流方向的關系Fig.3 Relationship between wind,wave and current direction in test data
為消除不同參數(shù)的量綱對譜預測準確度的影響,本文對10個測量條件參數(shù)進行歸一化操作。在這里,歸一化處理是指將輸入數(shù)據(jù)統(tǒng)一限制在給定的范圍內,從而加快模型訓練過程中的收斂速度,同時提高訓練的精度。對于數(shù)據(jù)的所有輸入?yún)?shù),都將歸一化到區(qū)間[0,1]內,其變換公式為
式(4)中,pi依 次對應每個輸入?yún)?shù),表示歸一化之后的輸入?yún)?shù)。
按照測量時間將測量條件參數(shù)與海雜波頻移和展寬進行匹配,得到譜參數(shù)預測的訓練數(shù)據(jù)集,形式如表2所示。
表2 海雜波譜參數(shù)預測訓練數(shù)據(jù)集組成形式Tab.2 Composition of training data set for prediction of sea clutter spectral parameters
為了實現(xiàn)海雜波多普勒譜參數(shù)快速高效的智能化預測,本文基于上述Ku波段岸基海雜波數(shù)據(jù)集,利用深度神經(jīng)網(wǎng)絡(Deep Neural Network,DNN)建模技術,建立了從多個測量條件參數(shù)出發(fā)的海雜波多普勒譜參數(shù)網(wǎng)絡預測模型,模型架構如圖4所示。
圖4 海雜波譜參數(shù)預測模型架構Fig.4 Prediction model framework of sea clutter spectral parameters
經(jīng)過試驗數(shù)據(jù)的測試調優(yōu),本文提出使用一種5層的深度神經(jīng)網(wǎng)絡(DNN-5)建立預測模型。DNN-5是一種復合前饋神經(jīng)網(wǎng)絡,由4個全連接層和1個丟棄層組成,每個全連接層的神經(jīng)元個數(shù)分別為10個、20個、10個和2個,而丟棄層進行隨機丟棄,丟棄比例是25%。DNN-5網(wǎng)絡及其輸入-輸出結構圖如圖5所示。
圖5 DNN-5網(wǎng)絡結構圖Fig.5 DNN-5 network structure diagram
為了與提出的DNN-5網(wǎng)絡模型預測效果相比較,論文另外采用了5種經(jīng)典的回歸預測模型,包括徑向基函數(shù)神經(jīng)網(wǎng)絡(RBFNN)、反向傳播神經(jīng)網(wǎng)絡(BPNN)、循環(huán)神經(jīng)網(wǎng)絡(RNN)、支持向量回歸模型(SVR)和K-近鄰回歸模型(KNN)。不同網(wǎng)絡的隱層函數(shù)與參數(shù)設置如表3所示,表3中的“改進Huber Loss”如式(5)所示,改進后的Huber Loss加快了小誤差范圍內模型的收斂速率。
表3 不同網(wǎng)絡的隱層參數(shù)設置Tab.3 Hidden layer parameter settings of different networks
本文中海雜波的譜參數(shù)預測基于Tensorflow v2.2平臺進行,并使用單塊Titan V GPU進行模型訓練。對于每種網(wǎng)絡模型的每一步訓練,劃分數(shù)據(jù)集比例為“訓練集:驗證集:測試集=3:1:1”。對數(shù)據(jù)隨機打亂后,將輸入?yún)?shù)歸一化到區(qū)間[0,1]。對于每種需要訓練的網(wǎng)絡模型,首先在學習率為0.001,batchsize為100的參數(shù)下訓練500個epochs;再在學習率為0.0002,batchsize為100的參數(shù)下訓練100個epochs。
在網(wǎng)絡模型的評價指標方面,同時選用平均絕對誤差(Mean Absolute Error,MAE)、均方根誤差(Root Mean Squared Error,RMSE)和皮爾遜相關系數(shù)(Pearson Correlation Coefficient,PR),以上指標的計算公式如式(6)-式(8)所示,多普勒頻移和譜寬的各項參數(shù)將分開計算。
為更為直觀地評估模型預測精度,本文中提出一種新的評價參數(shù)“平均預測精度(用η表示)”,該參數(shù)能夠反映譜參數(shù)預測模型的準確度,其表達式由式(9)給出。多普勒頻移fd和多普勒展寬Bw平均預測精度也將分開計算。
基于測試集數(shù)據(jù),對海雜波譜參數(shù)預測模型的精度進行了測試。表4記錄了6種不同模型下的4種預測指標。為了減小隨機誤差,每個模型均運行3遍,并將3次的結果取平均值填入表中。從表4可以看出,各個指標下評價結果體現(xiàn)出較高的一致性:對于多普勒頻移的預測,DNN-5模型具有最好的效果,平均預測精度η達91.3%,RBFNN和KNN其次,RNN,BPNN和SVR的預測效果較為一般。對于多普勒展寬的預測,DNN-5和RNN具有較好的預測效果,平均預測精度η分別達95.3%和95.2%,RBFNN效果其次,BPNN,KNN和SVR模型的預測效果較為一般。通過5種經(jīng)典回歸預測模型的對比,可以發(fā)現(xiàn)DNN-5是效果最好的預測模型。
表4 各個模型的譜參數(shù)預測結果Tab.4 Prediction results of spectral parameters of each model
對于預測效果最好的譜參數(shù)預測模型DNN-5,畫出其頻移和譜寬的(真實值、預測值)的散點圖如圖6所示,圖中藍點代表每個譜參數(shù)樣本的真實值和預測值的對應關系。當預測值完全等于真實值時,藍點落在紅色直線上,當預測值偏離真實值時,藍點遠離紅色直線。相應的誤差分布直方圖如圖7所示。從圖6可以看出,DNN-5模型的預測散點非??拷鼀=x直線,具有較好的預測效果;從圖7可以看出,DNN-5模型的誤差分布直方圖也較為靠近中心0誤差區(qū)域,誤差分布較為合理。
圖6 基于DNN-5模型的譜參數(shù)預測散點圖Fig.6 Scatter plot of spectral parameter prediction based on DNN-5 model
圖7 基于DNN-5模型的頻移譜寬預測誤差分布圖Fig.7 Error distribution of Doppler parameter prediction based on DNN-5 model
為了預測海雜波的多普勒頻移和展寬,輸入模型的10維參數(shù)包括三維雷達測量參數(shù)和7維海洋環(huán)境參數(shù)。為了確定每個輸入?yún)?shù)對于預測結果的影響大小和變化關系,需要進行詳細的參數(shù)影響分析。本文提出一種參數(shù)循環(huán)遞減認知的譜影響參數(shù)分析方法,對預測影響因素的權重進行分析,分析方法如圖8所示。在分析過程中,海雜波譜預測模型采用DNN-5模型,訓練時的參數(shù)設置仍與3.1節(jié)相同,隱藏層的神經(jīng)元數(shù)量則依據(jù)輸入?yún)?shù)的情況進行等比例調整。
圖8 基于循環(huán)遞減認知的譜參數(shù)影響分析流程Fig.8 Influence analysis process of spectral parameters based on cyclic decreasing cognition
基于循環(huán)遞減認知的網(wǎng)絡影響參數(shù)分析步驟為:假設不同參數(shù)之間彼此相互獨立,首先確定10維輸入?yún)?shù),每次抽取去掉一個參數(shù),將9維輸入?yún)?shù)輸入DNN-5模型中,預測多普勒頻移和展寬;記錄模型的評價指標后,則繼續(xù)抽取去掉另一個參數(shù)(上一次去掉的參數(shù)恢復,始終保持9個輸入?yún)?shù)),直到10維輸入?yún)?shù)均完成循環(huán),每次記錄的評價指標如表5所示。
表5 基于循環(huán)遞減認知方法的DNN-5評價指標Tab.5 Evaluation index of DNN-5 based on the cyclic decreasing cognition method
為了能更全面地根據(jù)評價指標對預測結果進行分析,本文定義參數(shù)影響因子φ,如式(9)所示。由于RMSE和MAE隨預測效果的提升而減小,PR和η隨預測效果的提升而增大,因而影響因子φ隨預測效果的提升而減??;φ越大即表示在去掉某影響因素后的預測效果越差,即該因素對預測結果的影響越大。
圖9給出了各個輸入?yún)?shù)對多普勒頻移和譜寬預測的影響因子統(tǒng)計圖。分析該統(tǒng)計圖可以看出,對多普勒頻移影響最大的因素依次為擦地角、風速和風向(均超過1.4),其余影響因素的影響因子對譜參數(shù)預測的影響相對較小。對多普勒展寬影響最大的因素為風向,對展寬影響最小的因素為極化方式,其余參數(shù)的影響因子大小較為接近。因而,將擦地角、風速和風向稱作多普勒頻移的主影響因素,將風向稱作多普勒展寬的主影響因素。
圖9 多普勒參數(shù)影響因子統(tǒng)計圖Fig.9 Statistical chart of influence factors of Doppler parameters
本文進一步分析了海雜波多普勒頻移和展寬隨主影響因素的變化趨勢??紤]到實際物理意義,在多普勒頻移隨擦地角和風速的變化圖中,頻移取絕對值;而在多普勒頻移和展寬隨風向角的變化圖中,頻移不取絕對值,其中風向角表示風向與雷達探測方向的夾角。
為了便于觀察參數(shù)變化規(guī)律,依據(jù)L-M (Levenberg-Marquardt)算法對散點圖的整體變化趨勢進行擬合。L-M算法是一種使用廣泛的非線性最小二乘算法,是對牛頓迭代算法的改進,使用該算法對參數(shù)變化趨勢進行擬合,運算效率出色,精確度也較高[19]。依據(jù)擬合的均方根誤差(RMSE),本文在頻移和擦地角的關系擬合中采用分式函數(shù),在頻移和風速的關系擬合中采用一階多項式函數(shù),而在頻移/展寬與風向的關系擬合中采用二項三角函數(shù)。頻移/譜寬隨主影響因素變化的散點圖分別如圖10所示,其中藍點代表不同參數(shù)條件下的實測譜參數(shù)樣本,紅色曲線表示擬合結果。
圖10 主影響因素變化趨勢擬合圖Fig.10 Fitting diagram of change trend of main influencing factors
通過圖10可以看出,海雜波頻移和譜寬的樣本方差相對較大,但紅色擬合曲線隨主影響因素的變化規(guī)律較明顯,方差較大可能是由于海面未充分發(fā)展造成的,這通過圖3給出的測量參數(shù)對應關系也可以反映出,不影響海雜波譜參數(shù)的變化規(guī)律分析。由圖10(a)可以看出,隨著擦地角的增大,多普勒頻移絕對值呈逐漸減小的趨勢,這是由于海浪速度在雷達視向的投影減小造成的。圖中數(shù)據(jù)樣本呈現(xiàn)柱狀條形分布,是由于試驗測量數(shù)據(jù)集中在某些擦地角,在部分擦地角處無數(shù)據(jù)。從圖10(b)可以看出,隨著風速增大,多普勒頻移絕對值呈增大的趨勢,說明海浪速度變大,與機理相符;在圖10(c)中,多普勒頻移受風向角的影響非常顯著,在逆風情況下(風向角小于90°),顯示為正向頻移,在側風情況下(風向角為90°附近)頻移近似為0,在順風情況下(風向角大于90°),顯示為負向頻移。值得注意的是,在一定的風向角情況下,多普勒頻移可能同時出現(xiàn)正值樣本和負值樣本,這是由于風向角和浪向角未達到完全一致性,同一個浪向下可能對應多個不同風向的樣本。從圖10(d)可以看出,多普勒展寬隨風向角近似呈現(xiàn)周期性變化,在風向角約為0°(逆風)、90°(正側風)和180°(順風)情況下,譜展寬相對較小,當風向角在0°~90°中間和90°~180°中間(斜側風)情況下,譜展寬相對較大,該規(guī)律說明斜側風條件下的海浪速度分量更多,海浪狀態(tài)更為復雜,從而反映海浪運動速度的海雜波譜展寬更大。
本文基于岸基雷達海雜波實測數(shù)據(jù),提出了一種基于DNN-5的海雜波譜參數(shù)預測方法,對多普勒頻移和譜寬的預測精度分別達到了91.3%和95.3%?;谠擃A測模型,本文提出了一種基于參數(shù)循環(huán)遞減認知的多普勒譜影響因素分析方法,對海雜波多普勒譜的影響因素展開了定性和定量分析,確定了多普勒頻移的主影響因素(擦地角、風速和風向)和多普勒展寬的主影響因素(風向),并分析了頻移和展寬參數(shù)隨主影響因素的變化趨勢。研究結果對基于海雜波頻譜的目標檢測算法設計和應用具有重要意義。
致謝感謝各位編輯和讀者的寶貴意見,感謝中國電波傳播研究所提供的Ku波段雷達海雜波實測數(shù)據(jù),感謝各位同事在研究過程中提供的慷慨援助。