王 玄,潘衛(wèi)軍,韓 帥,吳鄭源
(中國民用航空飛行學(xué)院空中交通管理學(xué)院, 四川 廣漢 618307)
飛機(jī)尾流是飛機(jī)升力的產(chǎn)物,它在機(jī)翼后方呈現(xiàn)漩渦的形式[1],尾流也被稱為飛機(jī)尾渦,能夠在空中較為穩(wěn)定的存在一段時間[2]。當(dāng)后機(jī)遭遇尾流時,由于飛機(jī)周圍空氣狀態(tài)發(fā)生變化,氣動性能會受到影響,嚴(yán)重時可能會發(fā)生滾轉(zhuǎn)、掉高度、失速等情況[3-4]。
對飛機(jī)尾流的研究是保障飛行安全的前提,研究飛機(jī)尾流的常用方法包括基于計算流體力學(xué) (CFD)的數(shù)值模擬、風(fēng)洞試驗和實地探測等方法[5]。Hallock等[6]在英國希思羅機(jī)場進(jìn)行飛機(jī)尾流探測實驗時,發(fā)現(xiàn)大型飛機(jī)尾渦消散和小型飛機(jī)與在低雷諾數(shù)風(fēng)洞試驗中的結(jié)果存在差異。Harris等[7]對比風(fēng)洞試驗飛機(jī)尾渦數(shù)據(jù)與雷達(dá)實地探測數(shù)據(jù),提出了一種用于比較不同數(shù)據(jù)源的飛機(jī)尾渦方法。國內(nèi)專家學(xué)者對尾流也進(jìn)行了一定研究,牛鳳梁等使用W波段雷達(dá)對飛機(jī)尾渦進(jìn)行探測和識別,通過建立雨滴受力微分方程,對飛機(jī)尾渦的雷達(dá)回波的多種特性進(jìn)行了研究[8-11]。劉俊凱等研究了潮濕大氣下的飛機(jī)尾渦特性和飛機(jī)尾渦提取方法,給出了基于矩陣恒虛警率的飛機(jī)尾渦追蹤檢測方法[12-18]。但是,這些研究沒有考慮尾渦探測中實際存在的非均勻風(fēng)場等因素,導(dǎo)致傳統(tǒng)識別模型和實際探測到的飛機(jī)尾流數(shù)據(jù)不能很好的匹配。
本文使用多普勒激光雷達(dá)在國內(nèi)多個機(jī)場進(jìn)行實地探測,前期研究中提出了基于波形相似匹配的尾渦識別方法[19]、基于Alex和基于K最近鄰的尾渦識別方法[20-21],波形相似匹配方法和Alex卷積神經(jīng)網(wǎng)絡(luò)法對于靜風(fēng)情況下的尾渦有較好的識別效果,但在一定風(fēng)的影響下,識別效果有限。KNN(K nearest neighbor)方法能夠較好識別一定風(fēng)速下的尾渦,但識別精度有待提升,鑒于此種情況,本文結(jié)合激光雷達(dá)實地探測的航班尾流數(shù)據(jù),提出了一種基于支持向量機(jī)(SVM)的飛機(jī)尾渦識別方法,對提取特征后的尾渦數(shù)據(jù)進(jìn)行識別,并與KNN方法進(jìn)行對比,確保其有效性和精準(zhǔn)性。
飛機(jī)尾渦是旋轉(zhuǎn)運動,其運動速度方向垂直于飛機(jī)尾渦渦心連線,即切向方向,因此也稱之為切向速度,用vr表示。切向速度vr的大小和飛機(jī)尾渦的強弱密切相關(guān),衡量尾渦強弱的物理量是渦環(huán)量,用Γ表示,初始渦環(huán)量Γ0和切向速度vt(r)分別表示為:
(1)
(2)
式中:m和B分別表示飛機(jī)的質(zhì)量和翼展;s為常量,其值為π/4;v表示飛機(jī)的空速;ρ表示空氣密度;g表示重力加速度;r表示尾渦橫截面上的點到渦核的距離;rc為渦核半徑,通常取值rc=0.052Bs。
激光雷達(dá)常用的掃描模式有距離高度指示器(RHI) 和平面位置指示器 (PPI)兩種,綜合分析兩種掃描模式,本文采用RHI模式進(jìn)行掃描,在實地探測過程中,多普勒激光雷達(dá)安放位置如圖1所示。
圖1 普勒激光雷達(dá)安放位置示意圖
受限于脈沖多普勒激光雷達(dá)探測原理,最后處理出來的數(shù)據(jù)是離散數(shù)據(jù),每個掃描周期得到的徑向風(fēng)場為不同距離門、不同仰角的徑向風(fēng)速集合,用Vr表示,具體為:
Vr={vr(ρi,θj)},i∈[1,n],j∈[1,m]
(3)
式中:ρi表示探測點距離雷達(dá)距離;θj表示探測點連線和水平面的夾角,n和m分別代表距離門的數(shù)量和不同俯角角度。
在對激光雷達(dá)探測的徑向速度場識別之前,需要對能夠表征飛機(jī)尾渦的特征進(jìn)行提取和處理。特征提取是非常最重要的一環(huán),特征提取的效果,直接影響到最后識別的結(jié)果,本文考慮最大速度極差和環(huán)境因素作為重要特征。
對于激光雷達(dá)探測的徑向速度場數(shù)據(jù),傳統(tǒng)的提取徑向速度風(fēng)場的方式為速度極差法,為了體現(xiàn)飛機(jī)尾渦存在的正負(fù)速度的差異,分別按照不同徑向計算速度極差,或按照不同的角度計算速度極差,用Dr(ri)和Da(θj)表示,其計算公式為[22]:
Dr(ri)=max(vr(ri,θj))-min(vr(ri,θj))
?j∈[1,m]
Da(θj)=max(vr(ri,θj))-min(vr(ri,θj))
?i∈[1,n]
(4)
式中,n和m分別表示激光雷達(dá)距離門的數(shù)量和不同掃描仰角的數(shù)量。
由于空中的風(fēng)存在不均勻現(xiàn)象,風(fēng)場本身不均勻的變化也可能表征在該區(qū)域范圍內(nèi),因此按照式(4)計算出的最大速度極差所表征的區(qū)域可能并不代表飛機(jī)的尾渦區(qū)域。
在實際探測中,對于雷達(dá)掃描到的飛機(jī)尾渦區(qū)域,無論是采用不同徑向速度極差或者不同仰角的速度極差,考慮的都只是航空器產(chǎn)生的單個尾渦,考慮到航空器在實際飛行中左右機(jī)翼同時生成尾渦,假定左右尾渦之間的間隔為b0(b0=Bs),則航空器左右尾渦產(chǎn)生的矩形區(qū)域速度極差,如圖2所示。
圖2 矩形區(qū)域速度極差示意圖
在圖2中,矩形區(qū)域的大小設(shè)定為固定值,該矩形區(qū)域包括4個大小相同的子矩形,分別表示為左上(UL),左下(LL),右上(UR),右下(LR),定義最大矩形極差Drec(ri,θj)為:
(5)
在激光雷達(dá)實地探測過程中,大氣環(huán)境參數(shù)對飛機(jī)尾渦的探測有較大影響,本文在民航局氣象部門的支持下,獲得了探測時段的機(jī)場氣象數(shù)據(jù),經(jīng)篩選后,選擇氣溫T,氣壓P,背景風(fēng)速vwv,背景風(fēng)向θwd,分別作為表征氣象和順風(fēng)、逆風(fēng)、側(cè)風(fēng)等因素對飛機(jī)尾渦影響的特征[22]。
根據(jù)上述對尾渦特征的提取,合并環(huán)境參數(shù),可得特征向量xi和對應(yīng)標(biāo)記yi為:
xi=(Dr,Da,Drec,T,vwv,θwd,P),yi∈{-1,+1}
(6)
式中:i∈[1,N],N表示樣本數(shù)量;yi=-1表示飛機(jī)尾渦不存在,yi=+1表示飛機(jī)尾渦存在。特征向量xi中每一個特征向量對應(yīng)第2節(jié)的定義。
提取1 038組激光雷達(dá)探測的徑向風(fēng)場數(shù)據(jù)和對應(yīng)的環(huán)境參數(shù)數(shù)據(jù),其中523組數(shù)據(jù)包含飛機(jī)尾渦,515組徑向風(fēng)場數(shù)據(jù)不包含飛機(jī)尾渦,從徑向風(fēng)場數(shù)據(jù)中提取對應(yīng)的DrDa,和Drec3個特征,提取對應(yīng)時間的環(huán)境數(shù)據(jù),溫度T,壓力P,風(fēng)速vwv,風(fēng)向θwd,最后得到的數(shù)據(jù)集D為[22]:
D={(xi,yi)},i∈[1,N]
(7)
式中,N=1 038表示數(shù)據(jù)集中特征向量的數(shù)量。
合計7類特征,數(shù)據(jù)集中每個特征的具體范圍如表1中所示,表1中依次是所有樣本特征的統(tǒng)計值,分別列出了最大值、最小值、均值和標(biāo)準(zhǔn)差,可以看出,不同距離的速度極差和不同角度的速度極差,以及溫度標(biāo)準(zhǔn)差較大,說明不同樣本之間的差距較大,其余特征不同樣本之間的差距較小[22]。
表1 特征值范圍
本文采用機(jī)器學(xué)習(xí)的方法對飛機(jī)尾渦進(jìn)行識別,它通過尋找超平面對給定的向量進(jìn)行分類。圖3為SVM分類示意圖,當(dāng)特征數(shù)為2的時候,根據(jù)數(shù)據(jù)集中樣本的二維特征值,將其作為X坐標(biāo)和Y坐標(biāo),繪制在二維平面中,其中實心圓形和空心圓形分別代表不同分類的樣本點,對于飛機(jī)尾渦識別,即是否存在飛機(jī)尾渦,SVM方法在于從其中找出一個直線,能夠?qū)深悩颖军c分離開,對于需要識別的徑向風(fēng)場數(shù)據(jù),根據(jù)對應(yīng)的二維特征,判斷是落在直線的哪邊,從而確定分類結(jié)果[22]。
圖3 SVM分類示意圖
對于具備p個特征的數(shù)據(jù),其特征向量為p維向量,SVM計算的是能夠?qū)深悩颖緮?shù)據(jù)完全分離開來的p-1維超平面,結(jié)合式(6)中特征向量的表達(dá)式,可得:
w·x+b=0
(8)
對于超平面w·x+b=0,樣本點xi到超平面的幾何間隔yi表示為:
(9)
對于SVM所求解的超平面是使得間隔值最大的超平面,因此式(9)的問題轉(zhuǎn)化為:
(10)
其中,滿足該約束條件成立的特征向量,也被稱為支持向量(support vector)。
本文對尾渦的識別可看做是典型的SVM分類問題,因此SVM模型可改進(jìn)為:
(11)
式中:ξi為松弛變量,每個特征向量都對應(yīng)了一個松弛變量,代表該組樣本不滿足約束的程度;C表示懲罰因子,表示部分樣本能夠允許不完全被超平面完整劃分的約束強弱。
SVM通過映射函數(shù)φ將特征向量xi映射到高維空間,再尋找最佳超平面。本文定義內(nèi)核函數(shù)為K,若K和φ滿足以下關(guān)系:
K(xi,xj)=φ(xi)·φ(xj)
(12)
則求解函數(shù)的內(nèi)積能夠直接替換成對應(yīng)的核函數(shù),本文選擇引用RBF核函數(shù)中的經(jīng)典高斯核函數(shù),高斯核函數(shù)K和其映射函數(shù)φ為:
K(xi,xj)=e-γxi-xj||
(13)
φ(xi)=(e-γxi-x1||,e-γxi-x2||,…,e-γxi-xm||)
(14)
式中,γ是RBF核函數(shù)的參數(shù),等于1/2σ2。
因此通過高斯核函數(shù)后能夠?qū)⒕€性不可分的特征向量轉(zhuǎn)換稱為線性可分的特征向量,最終SVM的求解模型為:
(15)
該問題為不等式約束的凸二次規(guī)劃問題,直接求解較為困難。因此對其使用拉格朗日乘子法,轉(zhuǎn)化為對應(yīng)的對偶問題,式(15)對應(yīng)的對偶問題為:
(16)
該損失函數(shù)和約束條件的形式,能夠通過啟發(fā)式策略的序列最小優(yōu)化算法解決。
對RBF核函數(shù),需要設(shè)置參數(shù)γ,以及懲罰系數(shù)C,不同參數(shù)最后結(jié)果差距較大,本文采用網(wǎng)格搜索的方法,將參數(shù)可能的取值按照等比數(shù)列的方式進(jìn)行設(shè)置,根據(jù)網(wǎng)格搜索的結(jié)果,確定一個對于分類器效果更好的參數(shù)子空間,通過參數(shù)子空間,繼續(xù)網(wǎng)格搜索,通過重復(fù)這個過程,將參數(shù)的范圍不斷搜索,最后確定最佳參數(shù)[22]。
在進(jìn)行初次網(wǎng)格搜索的過程中,首次搜索范圍較大,參數(shù)取值范圍為log2C∈[-5,15],log2γ∈[-15,5],步長為1,此時參數(shù)空間為C=2-5,2-4,…,214,215,γ=2-15,2-14,…,24,25,結(jié)果如圖4(a)所示,橫縱坐標(biāo)表示C和γ的取值,圖4中顏色條的色彩越亮,表示搜索性能越好,顏色越差,性能越差,從圖中可以看出當(dāng)log2C=[1,5],log2γ=[-5,-1]時,圖4中顏色相對其他區(qū)域更亮,性能優(yōu)于其他參數(shù)空間,對應(yīng)的C=8,γ=0.125時,此時分類器交叉驗證的平均得分最高,為0.880。
繼續(xù)縮小參數(shù)范圍,取log2C∈[1,5],log2γ∈[-5,-1],步長調(diào)整為0.25,此時參數(shù)空間范圍為C=2-1,2-0.75,…,24.75,25和γ=2-5,2-4.75,…,20.75,21,進(jìn)行第二次搜索,搜索結(jié)果如圖4(b)所示,當(dāng)參數(shù)空間范圍進(jìn)一步縮小至log2C∈[1.75,3.75],log2γ∈[-3.75,-2.25],此時分類器性能最佳的參數(shù)組合還是C=8,γ=0.125。重復(fù)該過程,迭代第4次,精度為0.1時,得到了參數(shù)為C=7.464,γ=0.125,繼續(xù)搜索,顏色不會發(fā)生明顯變化,且參數(shù)值固定為C=7.464,γ=0.125,因此該參數(shù)下分類器平均性能最佳,驗證集平均性能為0.882,對應(yīng)的支持向量數(shù)330,為最終得到模型。
圖4 網(wǎng)格搜索性能圖
通過網(wǎng)格搜索調(diào)整參數(shù)后會得到一個新的SVM分類器,本文對模型的泛化特性進(jìn)行驗證,通過3.2節(jié)分析將參數(shù)設(shè)置為C=7.464,γ=0.125,對785組訓(xùn)練集樣本訓(xùn)練后,得到對應(yīng)的分類器,對測試集中253組樣本進(jìn)行分類,識別的結(jié)果如表2所示。
表2 測試集識別結(jié)果
表2中最后分類的樣本,是通過混淆矩陣的方式呈現(xiàn)出來,并與基于相同訓(xùn)練集訓(xùn)練后的k最近鄰(KNN)的方法對比。從識別的結(jié)果來看,SVM無論是對于存在尾渦的風(fēng)場和不存在尾渦的風(fēng)場,正確識別的數(shù)量都比KNN更多[22]。
根據(jù)混淆矩陣中的正負(fù)樣本的分類情況,分別定義準(zhǔn)確率(ACC)、正預(yù)測值 (PPV)、真正率 ( TPR) 、召回率Recall、 F1-Score 作為對識別性能的評估指標(biāo)。其中PPV表示實際存在的尾渦占識別存在的尾渦的比率,TPR表示所有存在尾渦數(shù)據(jù)中成功識別的比率,Recall表示相關(guān)數(shù)據(jù)樣本里,成功識別尾渦的比例??紤]實際應(yīng)用PPV和TPR有時差距過大,需額外納入F1-Score來綜合評估SVM模型的分類性能,根據(jù)模型識別結(jié)果計算的性能如表3所示。SVM 的方法較KNN的方法無論是準(zhǔn)確率、精準(zhǔn)率,召回率都更高。
表3 測試集識別結(jié)果
由于兩種方法的驗證均是基于測試集樣本的識別情況,識別的數(shù)據(jù)僅能說明對于該數(shù)據(jù)集有效,因此引入了受試者工作曲線 (receiver operation characteristic curve,ROC)來評價模型的泛化性能。機(jī)器學(xué)習(xí)的方法性能很大程度上會受到樣本數(shù)據(jù)的限制,當(dāng)樣本數(shù)據(jù)發(fā)生較大變化時,性能也會相應(yīng)的變化,但是ROC曲線往往能夠保持不變,ROC曲線下的面積(area under curve,AUC)越大,也就說明模型的泛化性能相對更好,面對未知的樣本,也能保證一定的性能[22]。圖5(a) 和圖5(b)分別為 KNN 和 SVM 的 ROC 曲線,AUC 分別為0.906和0.920,遠(yuǎn)遠(yuǎn)大于隨機(jī)分類器的AUC值0.5,因此兩者對于飛機(jī)尾渦的識別具備良好的魯棒性。
圖5 模型ROC曲線
為更進(jìn)一步說明模型的效果,使用激光雷達(dá)實地探測數(shù)據(jù)進(jìn)行測試,識別效果如圖6所示。
圖6 尾渦實測識別效果
圖6中左上角表示的是尾渦存在的概率值,通過3.2節(jié)訓(xùn)練好的模型,可得出SVM模型中的最佳超平面,根據(jù)最佳超平面的劃分方法以及提取的徑向風(fēng)場數(shù)據(jù)特征,可確定數(shù)據(jù)樣本是否存在尾渦,然后通過仿真SVM中的擬合sigmoid模型,最終得到該樣本尾渦存在的概率。圖6從上至下分別為靜風(fēng)無尾渦、靜風(fēng)有尾渦、背景風(fēng)干擾有尾渦和靜風(fēng)不明顯尾渦,識別尾渦存在的概率分別為7%、96%、83%和92%,給出正負(fù)樣本的判斷有足夠的差別,均能夠正確識別,對本文中提到的影響尾渦識別的場景具備較好的抵抗性。
本文將徑向風(fēng)場中的尾渦的識別問題,抽象成機(jī)器學(xué)習(xí)中的二分類問題,提出了考慮不同環(huán)境因素下的基于SVM的飛機(jī)尾渦識別方法。該方法提取尾渦的速尾度極差特征,并結(jié)合溫度、氣壓、風(fēng)速、風(fēng)向這四種環(huán)境因素,建立對應(yīng)的特征向量和目標(biāo)函數(shù)。在上述基礎(chǔ)上,通過網(wǎng)格搜索和交叉驗證的方法訓(xùn)練模型,確定模型的最佳參數(shù),得到最佳超平面,通過測試集驗證了訓(xùn)練模型的優(yōu)良性,識別飛機(jī)尾渦的平均性能達(dá)到0.85以上,AUC超過0.9,具備一定的泛化性能,同時SVM方法在與KNN的飛機(jī)尾渦識別方法對比過程中,表現(xiàn)出更優(yōu)的識別性能,結(jié)合項目組實際探測的雷達(dá)數(shù)據(jù)進(jìn)行模型驗證,驗證結(jié)果顯示在靜風(fēng)環(huán)境或者有一定背景風(fēng)場存在的情況下,SVM方法能夠有效識別具備明顯特征和不明顯特征的飛機(jī)尾渦。