雷 雨,蔡宏兵
(1. 中國科學(xué)院國家授時中心,陜西 西安 710600;2. 中國科學(xué)院時間頻率基準(zhǔn)重點實驗室,陜西 西安 710600;3. 中國科學(xué)院大學(xué),北京 100049)
?
顧及最小二乘擬合端點效應(yīng)的日長變化預(yù)報*
雷雨1,2,3,蔡宏兵1,2
(1. 中國科學(xué)院國家授時中心,陜西 西安710600;2. 中國科學(xué)院時間頻率基準(zhǔn)重點實驗室,陜西 西安710600;3. 中國科學(xué)院大學(xué),北京100049)
針對日長(Length Of Day, LOD)變化預(yù)報中最小二乘(Least Squares, LS)擬合存在端點效應(yīng)的問題,采用時間序列分析方法對日長變化序列進(jìn)行端點延拓,形成一個新序列,然后用新序列建立最小二乘模型,最后再結(jié)合最小二乘模型和自回歸(Autoregressive, AR)模型對原始日長變化序列進(jìn)行預(yù)報。實驗結(jié)果表明,在日長變化序列兩端增加統(tǒng)計延拓數(shù)據(jù),能有效減小最小二乘擬合序列的端點畸變,從而提高日長變化的預(yù)報精度,尤其對中長期預(yù)報精度提高明顯。
日長變化;預(yù)報;最小二乘擬合;端點效應(yīng);時間序列分析
日長變化是表征地球自轉(zhuǎn)運(yùn)動的一個重要參量,反映了地球自轉(zhuǎn)速率的快慢。日長變化與極移(Polar Motion, PM)的兩個分量統(tǒng)稱為地球自轉(zhuǎn)參數(shù)(Earth Rotation Parameters, ERP)。地球自轉(zhuǎn)參數(shù)是實現(xiàn)地球參考系與天球參考系相互轉(zhuǎn)換的必需參數(shù),在衛(wèi)星導(dǎo)航、深空探測以及天文地球動力學(xué)研究等領(lǐng)域有重要應(yīng)用[1]。衛(wèi)星激光測距(Satellite Laser Ranging, SLR)、甚長干涉基線測量(Very Long Baseline Interferometry, VLBI)與全球衛(wèi)星導(dǎo)航系統(tǒng)(Global Navigation Satellite System, GNSS)等現(xiàn)代空間測地技術(shù)是獲取地球自轉(zhuǎn)參數(shù)的主要手段,但復(fù)雜的資料處理過程使得地球自轉(zhuǎn)參數(shù)的獲取存在一定延遲,因此對地球自轉(zhuǎn)參數(shù)進(jìn)行高精度預(yù)報是一項必要工作。
當(dāng)前預(yù)報日長變化的方法有多種,這些方法大多是最小二乘外推模型和其他模型的組合,如最小二乘外推與自回歸(Autoregressive, AR)模型的組合(LS+AR)[2]、最小二乘外推與神經(jīng)網(wǎng)絡(luò)(Neural Network, NN)技術(shù)的組合(LS+NN)[3-5]和最小二乘外推與高斯過程回歸(Gaussian Process Regression, GPR)模型的組合(LS+GPR)[6-7]等。這些組合方法均是首先建立最小二乘外推模型,得到日長變化序列趨勢項和周期項的外推值,再利用其他方法對最小二乘擬合殘差序列進(jìn)行預(yù)報,而日長變化預(yù)測值為最小二乘外推值和殘差序列預(yù)測值的疊加。
實際工作中發(fā)現(xiàn),在利用最小二乘模型對日長變化序列進(jìn)行擬合時,在擬合序列的兩端存在發(fā)散畸變現(xiàn)象(在數(shù)據(jù)處理中稱作端點畸變效應(yīng),簡稱端點效應(yīng)),致使趨勢項、周期項和殘差序列的預(yù)報值出現(xiàn)偏差,最終導(dǎo)致日長變化序列的最終預(yù)測值不準(zhǔn)確。本文針對日長變化預(yù)報中最小二乘擬合存在端點效應(yīng)的問題,在利用最小二乘模型擬合日長變化序列之前,先采用時間序列分析方法對日長變化序列進(jìn)行數(shù)據(jù)延拓,即在觀測序列的兩端增加用統(tǒng)計學(xué)方法延拓出的若干數(shù)據(jù)點,形成一個新序列,然后用新序列求得最小二乘模型系數(shù),最后再利用最小二乘外推與自回歸組合模型對日長變化原始序列進(jìn)行預(yù)測。算例表明,通過對觀測序列兩端的數(shù)據(jù)延拓,可以有效消除端點效應(yīng)的影響,從而提高日長變化預(yù)報的精度。
1.1資料預(yù)處理
本文所用日長變化資料源自國際地球自轉(zhuǎn)與參考系服務(wù)(International Earth Rotation and Reference Systems Service, IERS)組織發(fā)布的EOP 05 C04序列,采樣間隔為1 d。日長變化序列中包含多種周期性變化成分,其中對周期為5 d~18.6 a的62個固體地球帶諧潮汐項利用IERS協(xié)議給出的經(jīng)驗?zāi)P徒o予扣除[8],而扣除這些固體潮汐項后的日長變化稱為ΔLODR。本文對日長變化的預(yù)報均是針對ΔLODR的預(yù)報。
1.2最小二乘外推模型
日長變化序列扣除固體潮汐項后,還含有長期趨勢項和周年項、半周年項等季節(jié)性變化成分,這些趨勢項和周期項采用下述最小二乘模型進(jìn)行擬合和外推:
(1)
其中,T1和T2分別表示周年項和半周年項的振蕩周期,本文取T1=365.24 d、T2=182.62 d;a和b表示長期趨勢項參數(shù);c1和d1表示周年項參數(shù);c2和d2表示半周年項參數(shù)。這6個未知參數(shù)可以通過最小二乘法求得。
1.3自回歸模型
自回歸模型是對平穩(wěn)時間序列{zt,t=1, 2, …,n}建立的一個概率統(tǒng)計模型,它根據(jù)變量自身過去的變化規(guī)律來建立預(yù)報模型,其數(shù)學(xué)模型為
(2)
其中,p為模型階次;εt為白噪聲;φ1,φ2, …,φp為模型參數(shù),可以采用Yule-Walker方程求解。
使用自回歸模型的關(guān)鍵在于選取模型階次p。常用的定階準(zhǔn)則有信息論準(zhǔn)則、傳遞函數(shù)準(zhǔn)則與最終預(yù)報誤差準(zhǔn)則,這3種準(zhǔn)則在實際應(yīng)用中是等效的[9]。本文選用赤池信息量準(zhǔn)則(Akaike Information Criterion, AIC)確定階次p,準(zhǔn)則函數(shù)可以表示為
(3)
當(dāng)模型階次p和模型參數(shù)φ1, φ2, …, φp確定時,可根據(jù)下述方式進(jìn)行時間序列的多步外推預(yù)報。
(4)
(5)
(6)
1.4預(yù)報流程
本文預(yù)報方法與常規(guī)方法的區(qū)別在于,本文方法在對ΔLODR序列建立趨勢項和周期項最小二乘外推模型之前,首先利用時間序列分析方法在ΔLODR序列首尾兩端進(jìn)行數(shù)據(jù)延拓,以削弱最小二乘擬合端點效應(yīng)的影響,具體方法如下:
(1)首先根據(jù)(1)式對ΔLODR序列進(jìn)行最小二乘擬合,建立趨勢項和周期項外推模型,然后利用自回歸模型對最小二乘殘差序列進(jìn)行預(yù)報,最后利用最小二乘外推與自回歸組合模型在ΔLODR序列首尾兩端分別外推若干數(shù)據(jù)點,這樣原始ΔLODR序列加上首尾兩端外推的數(shù)據(jù)形成了一個新序列。
(2)利用新序列確定最小二乘模型系數(shù),即用新序列重新建立趨勢項和周期項最小二乘外推模型,然后再結(jié)合最小二乘模型和自回歸模型對原始ΔLODR序列進(jìn)行預(yù)報。
需要說明的是,新序列只用來求解最小二乘模型系數(shù),而在后續(xù)預(yù)報中仍然使用原始ΔLODR序列。
選用1999年1月1日至2011年10月22日期間的日長變化數(shù)據(jù)進(jìn)行實驗,其中2010年1月1日至2011年10月22日作為預(yù)報期,建模序列長度取為10a。
為了驗證端點數(shù)據(jù)延拓方法對端點效應(yīng)的改善效果,首先對比端點延拓前后最小二乘擬合效果。圖1繪出了端點延拓前后最小二乘擬合的殘差序列,其中圖1(a)為最小二乘擬合序列首端前50個歷元的殘差序列,圖1(b)為最小二乘擬合序列尾端最后50個歷元的殘差序列,擬合時段為2000年10月26日至2010年10月25日,端點延拓數(shù)據(jù)個數(shù)為360,即在首尾兩端各外推360個數(shù)據(jù)點。
圖1端點延拓前后最小二乘擬合效果對比
Fig.1ComparisonofLSfittingwithandwithoutedgeextension
從圖1可以看到,與端點延拓前相比,端點延拓后最小二乘擬合殘差在序列首尾兩端更接近于0,即端點延拓后最小二乘擬合的ΔLODR序列更為準(zhǔn)確,這說明端點延拓方法能有效抑制最小二乘擬合出現(xiàn)的端點效應(yīng)問題。為了進(jìn)一步說明端點延拓方法對端點效應(yīng)的改善作用,本文選取1999年1月1日至2009年12月31日期間的日長變化數(shù)據(jù)進(jìn)行擬合實驗,將擬合長度取為10 a,每隔1 d擬合1次,即擬合滑動窗口為10 a,總共擬合300次,并統(tǒng)計每次端點延拓前后首部和尾部50個歷元殘差序列的均方根誤差(Root Mean Square Error, RMSE),其中端點延拓前首部和尾部50個歷元殘差序列的300次平均均方根誤差分別為0.29 ms和0.30 ms,端點延拓后首部和尾部50個歷元殘差序列的300次平均均方根誤差分別為0.22 ms和0.23 ms,實驗結(jié)果可以說明端點延拓方法對端點畸變的抑制效果。
為了驗證本文方法相對于常規(guī)最小二乘外推與自回歸組合模型對日長變化預(yù)報精度的改善情況,分別利用這兩種方法對日長變化進(jìn)行1~360 d跨度預(yù)報,選用均方根誤差作為精度評估指標(biāo),其計算公式為
(7)
其中,Pj、Oj分別表示j點的日長變化預(yù)測值和觀測值;l為預(yù)報跨度;N為預(yù)報期數(shù)。本文總共進(jìn)行了300期的預(yù)報,每次預(yù)報時建模序列長度始終取為10 a,每隔1 d滑動預(yù)報1次,即N=300。
圖2給出了本文方法和常規(guī)最小二乘外推與自回歸組合模型的日長變化預(yù)報均方根誤差對比圖,表1統(tǒng)計了兩種方法在各種跨度的預(yù)報均方根誤差情況。結(jié)合圖2和表1可以看出,本文方法的預(yù)報精度相對于常規(guī)最小二乘外推與自回歸組合模型在各個預(yù)報跨度有不同程度的改善,其中,對于1~30 d短期預(yù)報,預(yù)報精度改善不明顯,在10%以內(nèi);從第30 d開始,本文方法的預(yù)報精度明顯優(yōu)于常規(guī)最小二乘外推與自回歸組合模型,精度最大改善了15.80%,且一直保持在13%左右,這說明本文方法對于中長期跨度預(yù)報具有更明顯的優(yōu)勢,同時也從側(cè)面說明端點效應(yīng)對日長變化中長期預(yù)報的影響更大。
圖2本文方法和常規(guī)最小二乘外推與自回歸組合模型的日長變化預(yù)報均方根誤差對比
Fig.2 Comparison of the prediction RMSE between the LS+AR and the proposed method
本文提出了一種顧及最小二乘擬合端點效應(yīng)的日長變化預(yù)報方法,其實質(zhì)是在原始序列兩端增加統(tǒng)計延拓數(shù)據(jù),以將最小二乘擬合出現(xiàn)的端點效應(yīng)移至模擬序列的兩端,從而減小原始序列的端點畸變。算例表明,通過在觀測序列的兩端增加用時間序列分析方法延拓的模擬數(shù)據(jù)點,然后再進(jìn)行最小二乘擬合,可以有效削弱端點效應(yīng)的影響;相對于常規(guī)最小二乘外推與自回歸組合預(yù)報模型,本文方法的日長變化預(yù)報精度有明顯改善,對于中長期預(yù)報其精度提高尤為明顯。此外,在實驗中發(fā)現(xiàn),端點延拓長度對本文方法的預(yù)報精度具有較大影響,本文對此并未進(jìn)行深入研究,而僅僅選取了相對較優(yōu)的預(yù)報結(jié)果,因此,本文方法仍有提升空間。對于如何選取最佳的端點延拓長度,將進(jìn)行深入研究。
[1]Gambis D, Luzum B. Earth rotation monitoring, UT1 determination and prediction[J]. Metrologia, 2011, 48(4): 165-170.
[2]Xu Xueqing, Zhou Yonghong. EOP prediction using least square fitting and autoregressive filter over optimized data intervals[J]. Advances in Space Research, 2015, 56(10): 2248-2253.
[3]Wang Qijie, Du Yanan, Liu Jian. Introducing atmospheric angular momentum into prediction of length of day change by generalized regression neural network model[J]. Journal of Central South University, 2014, 21(4): 1396-1401.
[4]Lei Yu, Zhao Danning, Cai Hongbing. Prediction of length-of-day using extreme learning machine[J]. Geodesy and Geodynamics, 2015, 6(2): 151-159.
[5]雷雨, 蔡宏兵, 趙丹寧. 樣本輸入方式對極端學(xué)習(xí)機(jī)預(yù)報日長變化的影響[J]. 天文研究與技術(shù), 2015, 12(3): 299-305.
Lei Yu, Cai Hongbing, Zhao Daning. Effects of training patterns on predictions of variations of length of day using an extreme learning machine neural network[J]. Astronomical Research & Technology, 2015, 12(3): 299-305.
[6]雷雨, 趙丹寧, 高玉平, 等. 基于高斯過程的日長變化預(yù)報[J]. 天文學(xué)報, 2015, 56(1): 53-62.
Lei Yu, Zhao Daning, Gao Yuping, et al. The prediction of length-of-day variations based on Gaussian processes[J]. Acta Astronomica Sinica, 2015, 56(1): 53-62.
[7]Lei Yu, Guo Min, Cai Hongbing, et al. Prediction of length-of-day using Gaussian process regression[J]. The Journal of Navigation, 2015, 68(3): 563-575.
[8]Petit G, Luzum B. IERS conventions (2010) [R]. Frankfurt am Main: Verlag des Bundesamts für Kartographie und Geod?sie, 2011: 123-131.
[9]丁月蓉, 鄭大偉. 天文數(shù)據(jù)處理方法[M]. 南京: 南京大學(xué)出版社, 1998: 307-308.
Enhancing the Prediction Accuracy of the Length of Day Change by Eliminating the Edge-effect of Least Squares Fitting
Lei Yu1,2,3, Cai Hongbing1,2
(1. National Time Service Center, Chinese Academy of Sciences, Xi’an 710600, China, Email: leiyu@ntsc.ac.cn;2. Key Laboratory of Time and Frequency Primary Standards, Chinese Academy of Sciences, Xi’an 710600, China;3. University of Chinese Academy of Sciences, Beijing 100049, China)
In order to eliminate the edge-effect of least squares (LS) fitting for the length of day change (ΔLOD), the time-series analysis model is first used to extrapolate ΔLOD series forward and backward and then generate a new series. Subsequently, the cofficients of a LS model are estimated using the new generated series. As a result, the edge-effect is changed to the edge of the new series, and thus the original fitted ΔLOD series can be free from the edge-effect. Finally, a combination of LS and autoregressive (AR) models (LS+AR) is employed to predict the original ΔLOD data. The results indicate that the proposed method can efficiently eliminate the edge-effect, and thus improve the prediction accurcy of the LS+AR model, especially for medium- and long-term prediction.
Length Of Day (LOD) change; Prediction; Least Squares (LS) fitting; Edge-effect; Time-series analysis
中國科學(xué)院 “西部之光” 人才培養(yǎng)計劃聯(lián)合學(xué)者項目(201491) 資助.
2015-12-29;
2016-01-19
雷雨,男,博士. 研究方向:地球自轉(zhuǎn)變化監(jiān)測與預(yù)報. Email: leiyu@ntsc.ac.cn
P227.1
A
1672-7673(2016)04-0441-05
CN 53-1189/PISSN 1672-7673