吳 晗 黃 玲 劉立龍 黃良珂 章紅平
1 桂林理工大學測繪地理信息學院,桂林市雁山街319號,541006 2 廣西空間信息與測繪重點實驗室,桂林市雁山街319號,541006 3 武漢大學衛(wèi)星導航定位技術研究中心,武漢市珞喻路129號,430079
奇異譜分析(singular spectrum analysis,SSA)是一種處理非線性時間序列數據且與經驗正交函數相聯(lián)系的主成分分析,適合于研究周期振蕩行為。SSA分解的空間結構與時間尺度密切相關,在細節(jié)分量分析方面具有優(yōu)勢,可以較好地提取TEC序列中的趨勢項、周期項、噪聲殘差項信息,從而對TEC時間序列進行分析或去噪[1-2]。長短期記憶(long-short term memory,LSTM)神經網絡模型是一種特殊的遞歸神經網絡(recursive neural network,RNN),解決了神經網絡在反向傳播過程中出現梯度爆炸、消失等缺點,可以更好地學習電離層TEC長期時序信息。但單一LSTM模型易受冗余信息等因素影響,難以完全利用時間信息,無法很好地表現TEC 時間序列的動態(tài)變化規(guī)律,導致電離層 TEC 預報精度較低[3-5]。本文采用SSA法對電離層TEC原始序列數據進行預處理,與LSTM神經網絡組合構建SSA-LSTM短期電離層TEC預報模型,并分析其在磁暴期和磁平靜期的TEC預報精度。
奇異譜分析處理過程主要為構造軌跡矩陣X(嵌入)、對軌跡矩陣X進行奇異值分解(singular value decomposition,SVD)、分組、對角平均化(重構)。詳細過程如下[6-8]:
1) 構建軌跡矩陣X(嵌入)。
電離層TEC時間序列可表示為s=(s1,s2,s3,…,sN),N為時間序列長度。軌跡矩陣XM×K可以表示為:
(1)
式中,X為M×K維Hankel矩陣,K=N-M+1,M為窗口長度,是取值范圍為2≤M≤N/2的整數,窗口長度設置為時序數據周期的整數倍,一般不超過N/3。
2) 奇異值分解(SVD)。
3) 分組。
4) 對角平均化(重構)。
(2)
圖1 LSTM模型神經元網絡結構Fig.1 Neural network structure of LSTM model
本文SSA-LSTM短期電離層TEC預報模型思路如下:首先對電離層TEC數據進行SSA分解,重構為趨勢項、周期項和噪聲殘差項3個分量;然后各分量分別使用LSTM模型進行預測;最后疊加各分量預測結果,得到TEC預報值。SSA-LSTM模型示意圖如圖2所示。在磁平靜期時,神經元層數為8,初始學習率為0.02,迭代次數為50,學習率衰減周期為20,衰減因子為0.2;在磁暴期時,由于TEC非平穩(wěn)性與非線性特征明顯增強,將學習率衰減周期調整為30。
圖2 SSA-LSTM模型示意圖Fig.2 Schematic diagram of SSA-LSTM model
本文采用EUREF(ftp:∥gnss.oma.be/gnss/products/IONEX/)提供的P1(35.5°N,10°W)、P2(35.5°N,0°)、P3(35.5°N,10°E)、P4(35.5°N,20°E)、P5(61.5°N,10°W)、P6(61.5°N,0°)、P7(61.5°N,10°E)、P8(61.5°N,20°E)8個格網點2015年doy050~079(磁暴期)、2020年doy173~202(磁平靜期)的電離層TEC數據,時間分辨率為15 min,空間范圍為15°W~25°E、 35°~62°N,空間分辨率為0.5°。用前27 d的TEC值預報后3 d的TEC值,實驗數據和預報結果數據的時間分辨率均為15 min。
根據電離層TEC時間序列(取窗口長度M=96)經奇異值分解(SVD)降序排列得到奇異值的貢獻率,第1項成分貢獻率最大,將其作為趨勢項;周期項重構成分與噪聲殘差項重構成分的選取以貢獻率變化速率突變拐點為界線,突變拐點之前(含拐點)的作為周期項重構成分,突變拐點之后的作為噪聲殘差項重構成分。因此選取第1奇異值對應的矩陣重構為趨勢項,第2~8奇異值對應的組合矩陣重構為周期項,其余的組合矩陣重構為噪聲殘差項。P8(61.5°N,20°E)格網點在磁暴期和磁平靜期的重構分量如圖3所示。
圖3 SSA重構分量Fig.3 Component reconstructed with SSA
2.2.1 地磁活動情況
Dst(disturbance storm time)是研究地磁暴及其相關現象的重要指標。本文采用ICSU-WDS數據中心(http:∥wdc.kugi.kyoto-u.ac.jp/wdc/Sec3.html)提供的地磁指數Dst,參考地磁暴強度等級標準文件(GB/T 31160-2014)和NOAA空間天氣預報中心等級標準,得到Dst值與磁暴等級如表1所示。
表2為2個預報時段的Dst指數日均值,數據來自ICSU-WDS數據中心(http:∥wdc.kugi.kyoto-u.ac.jp/wdc/Sec3.html)。從表1可知,2015年doy077~079為地磁磁暴期;2020年doy200~202為地磁平靜期。
表2 預報時段的Dst指數
2.2.2 不同地磁活動條件下預報模型改進精度分析
本文采用相對精度P和均方根誤差RMSE作為預報模型精度的評估指標:
(3)
(4)
式中,tecp為模型預測值,tecr為EUREF提供的參考值,n為預報TEC數據長度。
圖4為地磁平靜期2種模型在P4、P6格網點的TEC預報結果與參考值對比,圖5為2種模型的預報結果誤差。結合圖4、圖5可知,SSA-LSTM模型的預報結果與參考值更為接近。在低緯度格網點P4(35.5°N,20°E),SSA-LSTM模型預報結果與EUREF參考值最大殘差為0.85 TECu,比單一LSTM模型預報結果降低0.03 TECu。其3 d預報相對精度為97.10%,比單一LSTM模型提高1.20百分點;RMSE為0.27 TECu,比單一LSTM模型提高0.06 TECu。在高緯度格網點P6(61.5°N,0°),SSA-LSTM模型預報結果與EUREF參考值最大殘差為0.77 TECu,比單一LSTM模型結果降低0.25 TECu。其3 d預報相對精度為94.60%,比單一LSTM模型提高1.00百分點;RMSE為0.20 TECu,比單一LSTM模型提高0.02 TECu。
圖4 地磁平靜期2種模型在P4、P6格網點的TEC預報結果對比Fig.4 Comparison of the prediction results of the two models during the geomagnetic calm period at P4 and P6 grid networks
圖5 地磁平靜期2種模型在P4、P6格網點的預報結果誤差Fig.5 Errors of the prediction results of the two models during the geomagnetic calm period at P4 and P6 grid networks
圖6為地磁磁暴期2種模型在P3、P5格網點的TEC預報結果與參考值對比,圖7為2種模型的預報結果誤差。結合圖6、圖7可知,在地磁磁暴期,電離層處于極不穩(wěn)定狀態(tài),SSA-LSTM模型和單一LSTM模型預報結果精度都低于地磁平靜期,但SSA-LSTM模型預報效果更優(yōu)。在低緯度格網點P3(35.5°N,10°E),SSA-LSTM模型預報結果與EUREF參考值最大殘差為3.88 TECu,比單一LSTM模型預報結果降低2.70 TECu。其3 d預報相對精度為92.40%,比單一LSTM模型提高5.60百分點;RMSE為1.19 TECu,比單一LSTM模型提高0.27 TECu。在高緯度格網點P5(61.5°N,10°W),SSA-LSTM模型預報結果與EUREF參考值最大殘差為1.62 TECu,比單一LSTM模型預報結果降低0.75 TECu。其3 d預報相對精度為94.60%,比單一LSTM模型提高4.20百分點;RMSE為0.48 TECu,比單一LSTM模型提高0.19 TECu。
圖6 地磁活躍期2種模型在P3、P5格網點的TEC預報結果對比Fig.6 Comparison of the prediction results of the two models during the geomagnetic explosion period at P3 and P5 grid networks
圖7 地磁活躍期2種模型在P3、P5格網點的預報結果誤差Fig.7 Errors of the prediction results of the two models during the geomagnetic explosion period at P3 and P5 grid networks
根據2種模型在不同地磁活動情況下8個格網點3 d TEC預報結果的RMSE百分比統(tǒng)計結果(見表3,單位%)可知,在地磁平靜期,SSA-LSTM模型預報結果的RMSE均在1.0 TECu之內,RMSE≤0.5 TECu的占比94.10%,比單一LSTM模型提高20.49百分點;在地磁磁暴期,SSA-LSTM模型預報結果RMSE≤2.0 TECu的占比98.61%,比單一LSTM提高12.85百分點。
表3 2種模型3 d預報結果RMSE百分比統(tǒng)計
圖8為2種模型在不同地磁活動情況下所有實驗格網點的TEC預報結果的相對精度P和RMSE均值統(tǒng)計結果。由圖8可知,在磁暴期,SSA-LSTM模型預報3 d、2 d、1 d TEC的相對精度分別為91.17%、92.30%、90.48%,比單一LSTM模型分別提高4.92百分點、7.18百分點、5.79百分點;SSA-LSTM模型預報結果的RMSE分別為0.98 TECu、0.77 TECu、0.85 TECu,比單一LSTM模型分別提高0.24 TECu、0.54 TECu、0.50 TECu。在地磁平靜期,SSA-LSTM模型預報3 d、2 d、1 d TEC的相對精度分別為95.46%、95.30%、95.24%,比單一LSTM模型分別提高3.17百分點、3.60百分點、3.07百分點;SSA-LSTM模型預報結果的RMSE分別為0.29 TECu、0.30 TECu、0.27 TECu,比單一LSTM模型分別提高0.12 TECu、0.14 TECu、0.13 TECu。由此得出,SSA-LSTM模型比單一LSTM模型能夠更好地利用電離層TEC時序數據的時間信息,反映TEC動態(tài)變化趨勢。
本文提出一種新的電離層TEC預報模型SSA-LSTM,該模型對電離層TEC時間序列數據進行SSA分解,根據每個初等矩陣的貢獻率確定合適的矩陣分組并重構為趨勢項、周期項、噪聲殘差項,用LSTM預測結果疊加各分量得到最終的TEC預報值。實驗分析表明,在磁暴期,SSA-LSTM模型3 d預報結果相對精度為91.17%,比單一LSTM模型提高4.92百分點;RMSE為0.98 TECu,精度比單一LSTM模型提高0.24 TECu。在地磁平靜期,SSA-LSTM模型3 d預報結果相對精度為95.46%,比單一LSTM模型提高3.17百分點;RMSE為0.29 TECu,精度比單一LSTM模型提高0.12 TECu。