趙丹寧,雷 雨
(1. 寶雞文理學(xué)院電子電氣工程學(xué)院,陜西 寶雞 721016;2. 西安郵電大學(xué)計算機學(xué)院,陜西 西安 710121)
地球極移表示地球瞬時自轉(zhuǎn)軸相對于地球表面或者歷元平極的運行,是表征地球自轉(zhuǎn)變化的一個重要參量,簡稱極移。極移的兩個分量xp和yp、UT1-UTC與歲差、章動統(tǒng)稱為地球定向參數(shù)(Earth Orientation Parameters, EOP),地球定向參數(shù)是天球參考系和地球參考系相互轉(zhuǎn)換的必需參數(shù)。甚長基線干涉(Very Long Baseline Interferometry, VLBI)和全球?qū)Ш叫l(wèi)星系統(tǒng)(Global Navigation Satellite Systems, GNSS)等空間大地測量技術(shù)的極移測定精度可達0.05 mas[1]。但由于復(fù)雜的資料處理過程,由空間大地測量技術(shù)獲取的極移結(jié)果存在一定的延遲,而深空探測和衛(wèi)星精密定軌等領(lǐng)域?qū)O移的實時測量有重要需求,所以對極移進行短期預(yù)報就顯得尤為必要,此外,極移中長期預(yù)報在衛(wèi)星自主導(dǎo)航和天文地球動力學(xué)研究中也有重要應(yīng)用,因此,極移的中長期預(yù)報具有重要的科學(xué)及現(xiàn)實意義。
國內(nèi)外學(xué)者提出了多種極移預(yù)報方法,如最小二乘外推[2]、自協(xié)方差模型[3]、模糊推理系統(tǒng)[4]、神經(jīng)網(wǎng)絡(luò)[5]、自回歸模型[5-6]以及這些模型的不同組合。受大氣和海洋等多種激發(fā)源的影響,極移呈現(xiàn)復(fù)雜的非線性、非平穩(wěn)變化,因此,采用神經(jīng)網(wǎng)絡(luò)等非線性方法對其進行預(yù)報在理論上更為合適,許多學(xué)者將神經(jīng)網(wǎng)絡(luò)應(yīng)用于極移預(yù)報,取得了較好的預(yù)報效果[7-8]。國際地球定向參數(shù)比較活動的結(jié)果也表明,神經(jīng)網(wǎng)絡(luò)是當(dāng)前極移預(yù)報精度最高的方法之一[9]。
反向傳播神經(jīng)網(wǎng)絡(luò)是當(dāng)前應(yīng)用最為廣泛的一種網(wǎng)絡(luò)學(xué)習(xí)算法,在時間序列預(yù)測、圖像處理和自動控制等領(lǐng)域均有應(yīng)用,但反向傳播神經(jīng)網(wǎng)絡(luò)存在易陷入局部極小值、學(xué)習(xí)速度慢和泛化能力弱等缺點。極限學(xué)習(xí)機是近年發(fā)展起來的一種新型單隱含層前饋神經(jīng)網(wǎng)絡(luò),其特點是隱含層神經(jīng)元的權(quán)重可以隨機給定,且不需要更新,網(wǎng)絡(luò)學(xué)習(xí)過程僅計算輸出權(quán)重,因此,在學(xué)習(xí)速度與泛化能力方面較傳統(tǒng)反向傳播神經(jīng)網(wǎng)絡(luò)具有一定優(yōu)勢[10-11]?;诖耍疚膶O限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)應(yīng)用于極移中長期預(yù)報,根據(jù)極移時間序列特征,建立了基于極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)的極移預(yù)報模型,試驗結(jié)果驗證了極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)應(yīng)用于極移預(yù)報的有效性和實用性。
給定N個訓(xùn)練樣本(xi,yi),其中,輸入向量xi=[xi1,xi2, …,xiu]T∈Ru,輸出向量yi=[yi1,yi2, …,
yiv]T∈Rv,u,v分別為輸入向量維數(shù)與輸出向量維數(shù),則具有h個隱含層節(jié)點的單隱含層前饋神經(jīng)網(wǎng)絡(luò)能夠以零誤差逼近這N個樣本,即[10]:
(1)
其中,wj=[wj1,wj2, …,wju]T為第j個隱含層神經(jīng)元與輸入層神經(jīng)元間的連接權(quán)重;βj=[βj1,βj2, …,
βjv]T為第j個隱含層神經(jīng)元與輸出層神經(jīng)元間的連接權(quán)重;bj為第j個隱含層神經(jīng)元的偏置;g(x)為激活函數(shù)。(1)式可以表示為矩陣相乘的形式:
Y=Hβ,
(2)
其中,H為隱含層輸出矩陣:
(3)
β和Y為
(4)
極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)的訓(xùn)練步驟如下[10]:(1)隨機選取輸入層權(quán)重wj和偏置bj,j=1,2,…,h;(2)計算隱含層輸出矩陣H;(3)計算輸出層權(quán)值β=H?Y,其中H?為矩陣H的Moore-Penrose廣義逆。
最小二乘外推模型包含3部分:線性趨勢項、錢德勒項和周年項,其數(shù)學(xué)模型為
(5)
其中,T1,T2分別為錢德勒項和周年項的振蕩周期,取T1=432.08天、T2=365.24天;a,γ為趨勢項參數(shù);c1,d1為錢德勒項參數(shù);c2,d2為周年項參數(shù),這些未知參數(shù)可以根據(jù)最小二乘法求解。
最小二乘擬合殘差含有剩余的短周期成分,也含有各種準(zhǔn)周期和非線性成分,對于這些成分,利用神經(jīng)網(wǎng)絡(luò)的非線性擬合能力對其進行建模與預(yù)報。依據(jù)神經(jīng)網(wǎng)絡(luò)模型構(gòu)建與極移預(yù)報的實際情況,采用如下方式確定網(wǎng)絡(luò)的輸入和輸出:
[ε(t-k-u+1),ε(t-k-u+2),…,ε(t-k)]→ε(t) ,
(6)
其中,ε(t)為最小二乘擬合殘差,t=1, 2, …,n;k為預(yù)報跨度。為了提高數(shù)據(jù)利用率,采用滑動窗口的方式構(gòu)建訓(xùn)練樣本:
(7)
相應(yīng)地,在預(yù)報階段網(wǎng)絡(luò)的輸入和輸出為
[ε(n-u+1),ε(n-u+2),…,ε(n)]→ε^(n+k),
(8)
其中,ε^(n+k)為神經(jīng)網(wǎng)絡(luò)模型的第k步預(yù)報值。
由于本文利用極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)實現(xiàn)從輸入到輸出的非線性映射,需要事先確定激活函數(shù)類型和網(wǎng)絡(luò)拓撲結(jié)構(gòu)(輸入層神經(jīng)元數(shù)和隱含層神經(jīng)元數(shù)),其中,激活函數(shù)選用Sigmoid函數(shù),表達式為
g(x)=1/(1+e-x) .
(9)
由于網(wǎng)絡(luò)拓撲結(jié)構(gòu)對網(wǎng)絡(luò)性能有至關(guān)重要的影響,為了確定較優(yōu)的網(wǎng)絡(luò)拓撲結(jié)構(gòu),通過觀察網(wǎng)絡(luò)訓(xùn)練誤差隨輸入層神經(jīng)元數(shù)和隱含層神經(jīng)元數(shù)的變化情況優(yōu)化網(wǎng)絡(luò)拓撲結(jié)構(gòu),即網(wǎng)絡(luò)訓(xùn)練誤差最小時所對應(yīng)的輸入層神經(jīng)元數(shù)和隱含層神經(jīng)元數(shù)為最優(yōu)輸入層和隱含層神經(jīng)元數(shù)。以預(yù)報跨度30 d為例,圖1給出了網(wǎng)絡(luò)訓(xùn)練均方根誤差(Root Mean Square Error, RMSE)隨輸入層和隱含層神經(jīng)元數(shù)的變化情況,從圖1可以看出,當(dāng)輸入層神經(jīng)元數(shù)為17、隱含層神經(jīng)元數(shù)為47時,網(wǎng)絡(luò)訓(xùn)練均方根誤差最小。
圖1 網(wǎng)絡(luò)訓(xùn)練均方根誤差隨輸入層和隱含層神經(jīng)元數(shù)的變化情況
Fig.1 Changes of the network training RMSE with the neutron number of input and hidden layers
為了評估極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)用于極移長期預(yù)報的性能,首先將本文的預(yù)報結(jié)果同文[7]的反向傳播神經(jīng)網(wǎng)絡(luò)預(yù)報結(jié)果進行比較和分析,為了較為客觀地對二者的結(jié)果進行對比,本文預(yù)報過程中采用與文[7]相同的預(yù)報策略和誤差評價指標(biāo),其中,試驗數(shù)據(jù)采用國際地球自轉(zhuǎn)與參考服務(wù)(International Earth Rotation and Reference Systems Service, IERS)發(fā)布的EOP 05C04序列,基礎(chǔ)數(shù)據(jù)長度為3年,預(yù)報時段為2001年4月6日(MJD 52005)至2010年3月25日(MJD 55280),每隔91天預(yù)報一次,一共進行了37期的預(yù)報,預(yù)報誤差評價指標(biāo)選用平均絕對誤差(Mean Absolute Error, MAE),其計算公式為
(10)
其中,Oj,Pj分別表示j點的觀測值與預(yù)測值;l為預(yù)報期數(shù)。
圖2給出了本文極移預(yù)報結(jié)果的誤差曲線和文[7]預(yù)報結(jié)果的誤差曲線,表1統(tǒng)計了兩者1天、5天、10天、20天、30天、60天、90天、120天、180天、240天、300天和360天預(yù)報跨度的平均絕對誤差。從圖2和表1可以看出,對于xp分量中長期預(yù)報,除了120天、180天和240天的極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)方法的預(yù)報精度稍遜于文[7]的反向傳播神經(jīng)網(wǎng)絡(luò)方法,其余跨度的預(yù)報精度優(yōu)于文[7]的反向傳播神經(jīng)網(wǎng)絡(luò)方法或與之相當(dāng);對于yp分量中長期預(yù)報,除了120天的預(yù)報精度稍遜于文[7]的反向傳播神經(jīng)網(wǎng)絡(luò)方法,其余跨度的預(yù)報精度優(yōu)于文[7]的反向傳播神經(jīng)網(wǎng)絡(luò)方法或與之相當(dāng)。從圖2還可以發(fā)現(xiàn),極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)預(yù)報誤差曲線變化比較平緩,預(yù)報誤差呈現(xiàn)逐漸增大的趨勢,而反向傳播神經(jīng)網(wǎng)絡(luò)預(yù)報誤差曲線跳躍較為明顯,預(yù)報誤差不穩(wěn)定。
圖2 極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)預(yù)報誤差與文[7]預(yù)報誤差的對比
Fig.2 Comparison of the prediction errors for pole coordinates obtained by the ELM and reference [7]
表1 極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)極移預(yù)報與文[7]預(yù)報結(jié)果的平均絕對誤差統(tǒng)計(單位: mas)
為了進一步分析極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)方法的預(yù)報性能,本文也預(yù)報了2005年10月1日至2008年2月28日(與EOP PCC時段相同)不同預(yù)報跨度的極移值,并將本文預(yù)報結(jié)果的平均絕對誤差與EOP PCC預(yù)報結(jié)果的平均絕對誤差進行對比分析[9],如圖3~圖5,圖中數(shù)字代表參與EOP PCC的不同團隊的編號,不同顏色曲線表示不同團隊預(yù)報結(jié)果的平均絕對誤差,參與EOP PCC的團隊詳細情況見文[9],其中,極移超短期(1~10天)預(yù)報精度較高的團隊是Kalarus(編號061,黑色實線)和IERS EOP產(chǎn)品中心(編號071,綠色實線);短期(1~30天)預(yù)報精度較高的團隊是Kalarus(編號061,黑色實線)、Zotov(編號091,淺藍色實線)和Kosek(編號051,灰藍色實線);中長期(1~500天)預(yù)報精度較高的團隊是Kalarus(編號061,黑色實線)和Kosek(編號051,灰藍色實線)。
從圖3~圖5可以看到,對于1~10天的超短期預(yù)報,極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)方法的預(yù)報精度僅低于排在第1位的Kalarus團隊的預(yù)報精度,優(yōu)于其他團隊的預(yù)報精度;對于1~30天的短期預(yù)報,極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)方法的預(yù)報精度大體處于所有團隊的中間位置;對于1~500天的中長期預(yù)報,極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)方法的預(yù)報精度低于排在第1位的Kalarus團隊的預(yù)報精度,稍遜于排在第2位的Kosek團隊的預(yù)報精度或與之相當(dāng),優(yōu)于其他團隊的預(yù)報精度。
圖3 極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)超短期(1~10天)預(yù)報誤差與EOP PCC的對比
Fig.3 Comparison of the ultra short-term (1-10d) prediction errors obtained by the ELM and EOP PCC
圖4 極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)短期(1~30天)預(yù)報誤差與EOP PCC的對比
Fig.4 Comparison of the short-term (1-30d) prediction errors obtained by the ELM and EOP PCC
圖5 極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)中長期(1~500天)預(yù)報誤差與EOP PCC的對比
Fig.5 Comparison of the medium- and long-term (1-500d) prediction errors obtained by the ELM and EOP PCC
本文針對極移序列非線性、非平穩(wěn)變化的特性,將一種新型極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)用于極移中長期預(yù)報。通過預(yù)報試驗可以發(fā)現(xiàn),極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)用于極移中長期預(yù)報可以獲得較好的預(yù)報效果。與反向傳播神經(jīng)網(wǎng)絡(luò)預(yù)報結(jié)果的對比表明,極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)的預(yù)報精度優(yōu)于反向傳播神經(jīng)網(wǎng)絡(luò)的預(yù)報精度;與EOP PCC預(yù)報結(jié)果的比較發(fā)現(xiàn),極限學(xué)習(xí)機神經(jīng)網(wǎng)絡(luò)的中長期預(yù)報精度優(yōu)于大部分參與EOP PCC團隊的預(yù)報精度。