田 珂
(中國人民解放軍63861部隊,吉林 白城 137001)
靶場試驗中利用連續(xù)波雷達準確測試彈丸的炮口初速,主要通過將雷達測試的徑向速度轉換為切向速度后遞推得出。徑向速度是指在雷達與彈丸的方向上,雷達測試彈丸的飛行速度,切向速度是指彈丸在飛行軌跡的切向上的速度,而彈丸初速是指彈丸在飛出炮口瞬間的切向速度,因此彈丸炮口初速通過將雷達測試的一定時間內的徑向速度近似轉換為對應時間的切向速度后再擬合遞推得到。但是當遇到雷達死機、天氣條件不良、火炮發(fā)射故障或者彈丸自身異常時,雷達捕獲的徑向速度會出現(xiàn)缺失,導致計算出的炮口初速不準確。預測缺失的徑向速度成為解決這一問題的重要手段。目前研究彈丸徑向速度的文獻很多,文獻[1]主要研究如何實時高精度對彈丸徑向速度進行處理,前提是雷達能夠完整捕獲到彈丸的徑向速度,并未考慮到彈丸徑向速度缺失時的解決辦法;文獻[2]提出了在彈丸徑向速度缺失時,利用回歸模型預測出缺失的數(shù)據(jù),主要研究的是大口徑彈丸,并未提到小口徑彈丸的解決辦法,而且沒有考慮到單項模型預測精度不理想的情況;文獻[3]研究的是根據(jù)徑向速度檢測低速目標的問題,前提依然是獲取到部分徑向速度,當徑向速度不完整時該方法將無能為力。由于雷達測試的徑向速度屬于一維數(shù)據(jù),而ARIMA(autoregressive integrated moving average,ARIMA)模型、GM(grey model,GM)(1,1)灰色模型和回歸模型(model of regression)都是針對一維數(shù)據(jù)建模的,正好可以用這3種模型建模預測。由于大口徑彈丸自身質量較大,初速高,重力、風的阻力等各種因素對其速度的影響較小,所以大口徑彈丸的徑向速度的下降變化量基本不變,單調線性變化特征較為明顯;小口徑彈丸自身質量較小,初速小,重力、風的阻力等各種因素對其速度的影響較大,徑向速度下降變化量始終在變化,導致其既具有線性變化特征又具有非線性變化特征。ARIMA模型擅長預測出數(shù)據(jù)中的線性特征,預測非線性特征的能力較弱,GM(1,1)模型擅長預測出數(shù)據(jù)中的線性特征,預測精度較高,但無法預測出非線性特征,回歸模型中的一元線性回歸模型能預測出線性特征,二次多項式回歸模型能預測出非線性特征,但兩者有時預測精度會不理想,而且單一模型的預測能力有限,只能預測出徑向速度中的部分特征。因此,為盡可能提高預測精度,在按照迭代方式預測的前提下,選擇利用ARIMA模型、GM(1,1)灰色模型與一元線性回歸模型共同建立線性組合模型,預測出大口徑彈丸缺失的徑向速度;利用ARIMA模型、GM(1,1)灰色模型與二次多項式回歸模型共同建立非線性組合模型預測出小口徑彈丸缺失的徑向速度,這樣就把所有模型的預測優(yōu)勢整合到一起。實驗發(fā)現(xiàn),組合模型的預測精度高于所有單項模型,整體預測誤差和單項預測誤差,均小于1‰,更加適合作為彈丸徑向速度預測模型。
ARIMA模型于1976年提出,在許多領域都得到了廣泛應用,研究實踐也證實了它的有效性。ARIMA模型是自回歸模型的差分形式與移動平均模型相結合的結果,即同時包含了自回歸和移動平均成分,模型表達式為
=-1+-2+…+-+--1--2-…--
(1)
式中:表示當時刻處于時,的取值是其前期序列值的多元線性回歸,受過去期序列值的影響;為隨機干擾,屬于誤差項;表示當時刻處于時,的取值是其前期的隨機擾動的多元線性函數(shù),受過去期隨機擾動的影響,即是時刻之前期序列值、誤差項和期隨機擾動共同作用的結果。
ARIMA模型通??梢员磉_為ARIMA(,,),其中為差分階次。要對徑向速度建立ARIMA模型,首先要采用ADF(augmented dickey-fuller,ADF)單位根檢驗法準確檢驗平穩(wěn)性。如果徑向速度對應的檢驗統(tǒng)計量中對應的概率值遠遠小于臨界統(tǒng)計值0.05,說明該數(shù)據(jù)序列是平穩(wěn)序列,否則是非平穩(wěn)的,此時需要對其進行差分處理,直到變?yōu)槠椒€(wěn)序列為止;然后利用LB(Ljung-Box)檢驗法檢驗時間序列是否為白噪聲序列,如果檢驗統(tǒng)計量對應的概率值遠小于0.05,說明徑向速度對應的數(shù)據(jù)序列是非白噪聲序列,此時就可以直接進行建模,如果是白噪聲序列,說明徑向速度中沒有可被提取的有用信息,則無法建模。ARIMA模型能夠解決非平穩(wěn)時間序列預測的建模問題,只有將數(shù)據(jù)序列轉換為平穩(wěn)非白噪聲序列才能建立ARIMA模型,即利用數(shù)據(jù)序列中穩(wěn)定的信息預測后期的數(shù)據(jù),所以該模型無法預測出潛藏的隨機因素,同時該模型的優(yōu)點是預測短期數(shù)據(jù)精度較高,而預測長期數(shù)據(jù)誤差會很大。通常采用自相關圖和偏自相關圖顯示的特征確定模型中的參數(shù),,。模型類別確定好以后,還要檢查模型殘差是否是白噪聲序列。如果模型殘差LB檢驗統(tǒng)計量對應的概率值遠大于0.05,說明模型殘差是白噪聲序列,意味著有用信息已經(jīng)提取完畢,所建模型通過了檢驗,可以直接利用所建模型進行后期預測;如果模型殘差LB檢驗統(tǒng)計量對應的概率值遠小于或等于0.05,說明其是非白噪聲序列,表示有用信息尚未提取完畢,需要重新確定模型類別,直到模型殘差變?yōu)榘自肼曅蛄袨橹埂?/p>
(2)
式中:=1,2,…,。GM(1,1)灰色模型的算法是先對數(shù)據(jù)序列進行累加然后再進行累減。檢驗GM(1,1)灰色模型預測結果用后驗差比值和小誤差概率進行評價,如表1所示?;疑P屯瑯由瞄L預測出數(shù)據(jù)序列中的穩(wěn)定信息,擅長進行短期預測,且精度較高,但對隨機因素預測會出現(xiàn)誤差較大的情況,而且進行長期預測精度并不理想。
表1 GM(1,1)預測結果評價表
回歸分析的目的是了解兩個或多個變量間是否相關、相關方向及強度,并建立數(shù)學模型以便通過觀察特定變量來預測或控制相關變量的方法。線性回歸模型在處理線性變化的原始數(shù)據(jù)方面預測精度很高。一元線性回歸模型是分析因變量與自變量之間的線性關系,數(shù)據(jù)模型為
(3)
式中:和為回歸系數(shù)。
多項式回歸模型的數(shù)學表達式如式(4)所示,因變量和自變量是次多項式關系。
=+++…++
(4)
檢驗回歸模型的過程:方程的顯著性檢驗主要根據(jù)檢驗統(tǒng)計量對應的概率值與臨界統(tǒng)計值005進行比較來判斷,如果遠小于0.05,就說明回歸模型是顯著的,否則不顯著;模型的擬合效果是根據(jù)參數(shù)Multiple R-squared和Adjusted R-squared與1的比較結果進行判斷,如果它們取值都非常接近1,就說明模型的擬合效果很好;回歸系數(shù)是根據(jù)其檢驗統(tǒng)計量對應的概率值與0.001的比較進行判斷,如果遠小于0.001說明回歸系數(shù)是顯著的,否則說明回歸系數(shù)不顯著?;貧w模型擬合線性特征和二次曲線特征的能力較強,但是模型較為簡單,對相關特征的擬合精度還有待提高。
組合預測模型是利用相同的樣本信息從不同的分析角度對未來信息進行預測,它把所屬預測模型的預測結果進行總體性綜合考慮,最大限度利用所有預測模型的樣本信息,這樣考慮問題更全面、更系統(tǒng),深化對時間序列演化規(guī)律的認識。
(5)
在組合模型中關鍵是求解權系數(shù),具體思想是:對單一模型誤差平方和較小的模型賦予較高的權系數(shù),對單一模型誤差平方和較大的模型賦予較小的權系數(shù),進而使組合模型誤差平方和盡可能小,權系數(shù)的確定方式為
(6)
式中:,為第期第個單項模型預測值與實測值的誤差平方和。由式(5)或式(6)可知,先計算出第期單項模型的誤差平方和就可以計算出第期單項模型的權系數(shù),最后就可以計算出組合模型的預測值。
實驗選擇利用RStudio軟件環(huán)境進行數(shù)據(jù)分析、統(tǒng)計建模及數(shù)據(jù)可視化。為了驗證ARIMA模型、GM(1,1)灰色模型與回歸模型新建立的組合模型的預測精度高于所有單項模型,選擇采用4組徑向速度實測數(shù)據(jù)進行驗證。針對大口徑彈丸而言,從0.1 s開始每隔0.005 s選取一發(fā)徑向速度值,一直取到0.5 s為止,共獲取到81發(fā)徑向速度值。而針對小口徑彈丸而言,從0.05 s開始每隔0.005 s選取一發(fā)徑向速度值,一直取到0.3 s為止,共獲取到51發(fā)徑向速度值。4組徑向速度數(shù)據(jù)分別記為DATA1、DATA2、DATA3和DATA4,其中DATA1和DATA2是大口徑彈丸的徑向速度數(shù)據(jù),DATA3和DATA4是小口徑彈丸的徑向速度數(shù)據(jù),其時間序列曲線分別如圖1~圖4所示。針對DATA1和DATA2而言,把第1~71發(fā)徑向速度作為訓練數(shù)據(jù),訓練ARIMA模型、GM(1,1)灰色模型和回歸模型,把第72~81發(fā)徑向速度作為測試數(shù)據(jù),檢驗這3個模型及其組合模型的預測精度的高低。具體原理:先利用第1~71發(fā)數(shù)據(jù)訓練3個模型,預測出第72發(fā)數(shù)據(jù)后,利用組合模型原理計算出第72發(fā)數(shù)據(jù)的組合模型預測值,再把第72發(fā)實測值代入到訓練數(shù)據(jù)中,預測出第73發(fā)數(shù)據(jù),以此類推就可以得到DATA1和DATA2中第72~81發(fā)徑向速度3個模型及其組合模型的預測值。針對DATA3和DATA4而言,把第1~41發(fā)作為訓練數(shù)據(jù)訓練3個模型,第42~51發(fā)作為測試數(shù)據(jù),檢驗3個模型及其組合模型的預測精度的高低。先利用第1~41發(fā)數(shù)據(jù)訓練3個模型,然后預測出第42發(fā)徑向速度,利用組合模型建模原理計算出第42發(fā)組合模型預測值,然后把第42發(fā)實測值代入到訓練數(shù)據(jù)中,再預測出第43發(fā)數(shù)據(jù),以此類推,就可以得到DATA3和DATA4第42~51發(fā)徑向速度3個模型及其組合模型預測值。先以DATA1為例進行驗證分析。
圖1 DATA1時間序列圖
圖2 DATA2時間序列圖
圖3 DATA3時間序列圖
圖4 DATA4時間序列圖
DATA1第1~71發(fā)數(shù)據(jù)的ADF單位根檢驗統(tǒng)計量對應的概率值為0.01,小于臨界統(tǒng)計值0.05,LB檢驗統(tǒng)計量對應的概率值為2.22×10,遠遠小于臨界統(tǒng)計值0.05,說明DATA1第1~71發(fā)數(shù)據(jù)是平穩(wěn)非白噪聲時間序列。DATA1第1~71發(fā)數(shù)據(jù)對應的自相關圖顯示出拖尾的特點,如圖5所示;偏自相關圖是一階結尾,如圖6所示,再結合BIC信息圖可以確定模型類別為ARIMA(1,0,0)。模型殘差的LB檢驗統(tǒng)計量對應的概率值為0.495 8,遠大于臨界統(tǒng)計值0.05,所以模型殘差為白噪聲序列,即數(shù)據(jù)中的有用信息已經(jīng)提取完畢,模型通過了檢驗,可以進行預測,最后得到DATA1第72發(fā)數(shù)據(jù)的ARIMA模型預測值。采用同樣的方法最后可得到DATA1第72~81發(fā)ARIMA模型預測值。
圖5 DATA1第1~71發(fā)數(shù)據(jù)自相關圖
圖6 DATA1第1~71發(fā)數(shù)據(jù)偏自相關圖
經(jīng)過檢驗發(fā)現(xiàn)DATA1第1~71發(fā)數(shù)據(jù)的級比都處于區(qū)間[0.972 604 5,1.028 167]之中,滿足建立GM(1,1)灰色預測模型的條件,經(jīng)過建模預測得到DATA1第72發(fā)GM(1,1)模型預測值,預測結果顯示后驗差比值=0.007 959 138,預測精度=99.973 13%,預測精度等級為“好”。采用同樣的方法最后得到了DATA1第72~81發(fā)GM(1,1)模型預測值。
由于DATA1屬于大口徑彈丸的徑向速度,整體呈線性分布,所以對DATA1第1~71發(fā)數(shù)據(jù)建立速度與時間的一元線性回歸模型,模型擬合結果顯示檢驗統(tǒng)計量對應的概率值小于2.2×10,遠小于臨界統(tǒng)計值0.05,說明回歸模型是顯著的;Multiple R-squared為0.999 5,Adjusted R-squared為0.999 5,兩者取值都非常接近1,說明模型的擬合效果很好;截距估計值檢驗對應的概率值小于2×10,回歸系數(shù)檢驗對應的概率值小于2×10,兩者都遠遠小于0.001,說明截距估計值和回歸系數(shù)都是顯著的,最終證明可以用所建一元線性回歸模型進行預測,再把第72發(fā)徑向速度對應的時間數(shù)據(jù)代入到所建模型中就可以預測出第72發(fā)徑向速度。采用同樣的方法總共就可以得到DATA1第72~81發(fā)徑向速度一元線性回歸模型預測值。而DATA3和DATA4屬于小口徑彈丸的徑向速度,其徑向速度時間曲線屬于二次曲線,應該建立速度與時間的一元二次多項式回歸模型。實際上,以DATA3為例,經(jīng)過檢驗發(fā)現(xiàn):建立徑向速度與時間的一階線性回歸模型時,Multiple R-squared為0.986 0,Adjusted R-squared為0.985 9;建立徑向速度與時間的二次多項式回歸模型時,Multiple R-squared為0.994 0,Adjusted R-squared為0.993 7。兩個模型的其余檢驗結果均符合要求,對比得出DATA3更適合建立徑向速度與時間的二次多項式回歸模型。
經(jīng)過3個模型對DATA1的建模預測,最后就得到了3個模型及其組合模型預測出的DATA1第72~81發(fā)徑向速度,實測值與預測值如表2所示,繪制其時間序列關系曲線,如圖7所示。經(jīng)過計算得到ARIMA模型預測值與DATA1第72~81發(fā)實測值的平均相對誤差為0.136%,GM(1,1)灰色模型預測值與實測值的平均相對誤差為0.06%,一元線性回歸模型預測值與實測值的平均相對誤差為0.159%,組合模型預測值與實測值的平均相對誤差為0.042%,小于1‰的誤差標準,而且組合模型每發(fā)預測值與實測值的相對誤差的關系曲線如圖8所示,每發(fā)預測值與實測值的相對誤差均小于1‰,所以組合模型整體的預測精度和單項預測精度均達到了雷達測試彈丸徑向速度的誤差要求。
表2 DATA1第72~81發(fā)實測值與各模型預測值
圖7 DATA1第72~81發(fā)實測值與各模型預測值關系曲線
圖8 DATA1組合模型預測值與實測值相對誤差變化曲線
采用對DATA1建模預測的方法應用于DATA2,就可以得到DATA2第72~81發(fā)實測值與各個模型預測值,如表3所示,其時間序列關系曲線如圖9所示。經(jīng)過計算得到ARIMA模型預測值與DATA2第72~81發(fā)實測值的平均相對誤差為0.123%,GM(1,1)模型預測值與實測值的平均相對誤差為0.035%,一元線性回歸模型預測值與實測值的平均相對誤差為0.114%,組合模型預測值與預測值的平均相對誤差為0.03%,小于1‰的誤差標準,而且組合模型預測值與實測值的相對誤差曲線如圖10所示,可以看出每發(fā)預測值與實測值的相對誤差均小于1‰,所以組合模型不論是整體的預測精度還是單項預測精度均達到了雷達測試彈丸徑向速度的誤差要求。
表3 DATA2第72~81發(fā)實測值與各個模型預測值
圖9 DATA2第72~81發(fā)實測值與各模型預測值關系曲線
圖10 DATA2組合模型預測值與實測值相對誤差變化曲線
采用與預測DATA1同樣的方法,得到了DATA3第42~51發(fā)實測值與各個模型預測值如表4所示,其時間序列關系曲線如圖11所示。
表4 DATA3第42~51發(fā)實測值與各模型預測值
圖11 DATA3第42~51發(fā)實測值與各模型預測值關系曲線
經(jīng)過計算得到ARIMA模型預測值與DATA3第42~51發(fā)徑向速度實測值的平均相對誤差為0.014%,GM(1,1)灰色模型預測值與實測值的平均相對誤差為0.062%,二次多項式回歸模型預測值與實測值的平均相對誤差為0.083%,組合模型預測值與實測值的平均相對誤差為0.012%,所以組合模型預測的徑向速度誤差最小,精度最高,誤差小于1‰,而且組合模型預測值與實測值的相對誤差曲線如圖12所示,均小于1‰,整體的預測精度和單項預測精度均達到了雷達測試彈丸徑向速度的誤差要求。DATA4第42~51發(fā)徑向速度實測值與各個模型預測值如表5所示,其時間序列關系曲線如圖13所示。ARIMA模型預測值與DATA4第42~51發(fā)徑向速度實測值的平均相對誤差為0.038%,GM(1,1)灰色模型預測值與實測值的平均相對誤差為0.098%,二次多項式回歸模型預測值與實測值的平均相對誤差為0.085%,組合模型預測值與實測值的平均相對誤差為0.015%,所以組合模型預測出的徑向速度誤差是最小的,精度是最高的,誤差小于1‰,而且組合模型預測值與實測值的相對誤差曲線如圖14所示,單項誤差也小于1‰,說明整體的預測精度和單項預測精度均達到了雷達測試彈丸徑向速度的誤差要求。
圖12 DATA3組合模型預測值與實測值相對誤差變化曲線
表5 DATA4第42~51發(fā)實測值與各個模型預測值
圖13 DATA4第42~51發(fā)實測值與各個模型預測值關系曲線
圖14 DATA4組合模型預測值與實測值相對誤差變化曲線
通過利用DATA1、DATA2、DATA3和DATA4共4組實測數(shù)據(jù)進行建模預測的結果可知,3個單項模型預測徑向速度的精度并不穩(wěn)定,但組合模型預測彈丸徑向速度的誤差始終最小,精度始終高于所有單項模型,而且整體的誤差和單項誤差均低于1‰,預測值更加逼近試驗中實測值,達到了雷達測試彈丸徑向速度的誤差要求,可以作為預測彈丸徑向速度的預測模型。
實際上,樣本量的選取完全是隨機的,因為樣本量越大,涵蓋的數(shù)據(jù)特征就越多,模型的泛化能力就越強,而不同樣本量對應的模型是一致的,建立的ARIMA模型都是ARIMA(1,0,0),GM(1,1)灰色模型和速度時間的回歸模型都能通過檢驗,并且組合模型的預測精度始終大于單項模型。
徑向速度的缺失會影響靶場試驗對武器裝備戰(zhàn)斗性能的準確鑒定,利用科學合理的模型預測出缺失的徑向速度顯得至關重要。單一模型的預測能力有限,預測精度不夠理想,組合預測模型能夠充分發(fā)揮所有單項模型的預測能力,大幅度提高數(shù)據(jù)的擬合精度,可以最大限度提高預測精度。實驗結果表明,經(jīng)過對DATA1~DATA4 4組數(shù)據(jù)建模預測的結果可知,組合預測模型的預測精度最高,預測出的徑向速度誤差最小,整體誤差和單項誤差均小于1‰,達到了單臺初速雷達測試彈丸初速的誤差要求,可以作為彈丸徑向速度的預測模型。