雷 雨,趙丹寧
(1.中國科學院 國家授時中心,西安 710600;2.中國科學院 時間頻率基準重點實驗室,西安 710600;3.中國科學院 精密導航定位與定時技術重點實驗室,西安 710600;4.中國科學院大學,北京 100049)
衛(wèi)星鐘差(satellite clock bias, SCB)的預報在衛(wèi)星導航定位系統(tǒng)中具有重要作用。由于星載原子鐘受外界及其自身因素的影響,很難掌握其復雜細致的變化規(guī)律。因此建立精確的原子鐘運行模型非常困難,相應地準確預報鐘差也非常困難。目前,應用較多的衛(wèi)星鐘差預報方法主要有GM(1,1)模型法[1]、二次多項式模型法(quadratic polynomial, QP)[2]、ARIMA模型法[3]等。同時,伴隨著機器學習理論的發(fā)展,一些非線性模型如人工神經(jīng)網(wǎng)絡(artificial neural network, ANN)[4-5]、最小二乘支持向量機(least squares support vector machines, LSSVM)[6]已被成功應用于衛(wèi)星鐘差預報中。然而,當采用ANN模型來進行預報時,存在易陷入局部極小、網(wǎng)絡結構難以確定等缺點[5],而且它是基于經(jīng)驗風險最小化的原則,易導致過學習現(xiàn)象的產(chǎn)生;除此之外,ANN模型是建立在大樣本基礎之上,如果樣本量較小,則建模效果就不是很理想。而LSSVM較好地解決了小樣本和局部極小等實際問題,被認為是ANN的替代方法[7]。筆者將LSSVM應用于衛(wèi)星鐘差的短期預報中,研究結果表明,LSSVM通過對樣本的學習可以準確地預報鐘差序列,非常適合于解決非線性、非平穩(wěn)衛(wèi)星鐘差序列的預報問題[6]。本文在上述研究的基礎上,結合實例詳細探討在建模時,樣本數(shù)據(jù)預處理方法的選用對LSSVM鐘差預報模型性能的影響。
由于當前時刻的鐘差值與過去某個時間段內的鐘差值密切相關,因此假設t+m時刻的鐘差值x(t+m)可由t、t+1、…、t+m-1時刻的歷史鐘差值x(t)、x(t+1)、…、x(t+m-1)來進行預報,則可建立映射f:Rm→R,預報模型可表示為
x(t+m)=f[x(t),x(t+1),…,x(t+m-1)]
t=1,2,…,n-m
(1)
本文采用LSSVM來完成對非線性映射f(·)的逼近,相應的LSSVM算法見文獻[8]。式(1)中,m表示嵌入維數(shù),n為已知鐘差數(shù)據(jù)個數(shù)。
表1 輸入向量和輸出向量的結構
由于選取不同的核函數(shù)可以構造不同的學習機,所以利用LSSVM解決具體問題時,最關鍵的是針對具體對象的特點選取合適的核函數(shù),但是對于核函數(shù)的確定目前還沒有明確的理論依據(jù)可以遵循[9],只能憑經(jīng)驗確定。常用的核函數(shù)有徑向基(radial basis function, RBF)核、線性核和多項式核,其表達式分別為
RBF函數(shù)
K(xi,xj)=exp(-xi-xj2/2σ2)
(2)
式中,σ為核寬度。
線性函數(shù)
K(xi,xj)=xixj
(3)
多項式函數(shù)
K(xi,xj)=(1+xixj)d
(4)
式中,d為多項式階次,d=1,2,…。
在選取上述某一種函數(shù)為核函數(shù)的條件下,影響LSSVM鐘差預報精度的核心參數(shù)包括正則化參數(shù)、核參數(shù)與嵌入維數(shù)。本文以交叉驗證誤差為評價準則,利用網(wǎng)格搜索算法[10]搜索LSSVM預報模型的最優(yōu)參數(shù)組合。
在進行衛(wèi)星鐘差建模預報時,一般將可用樣本分為訓練樣本集和測試樣本集兩部分。訓練集的功能是對模型進行訓練,訓練好的模型對訓練集的符合程度稱為模型的學習能力,又稱可塑性,而測試集的功能是對模型的泛化能力進行檢驗。一個性能好的模型應同時具有很好的可塑性和泛化能力。
樣本數(shù)據(jù)預處理是指通過變換處理將LSSVM的輸入、輸出數(shù)據(jù)限制在一定范圍內。在利用LSSVM模型進行衛(wèi)星鐘差預報時,對數(shù)據(jù)進行預處理的原因是:1)鐘差序列有效位數(shù)太多,并且相鄰歷元鐘差數(shù)值變化不大,造成LSSVM難以較好地擬合鐘差模型;2)數(shù)據(jù)有效位數(shù)多引起LSSVM收斂速度慢。
假設{x(t),t=1,2,…,n}為需要進行數(shù)據(jù)預處理的樣本數(shù)據(jù),根據(jù)預處理后數(shù)值分布范圍,可將預處理方法分為3種:
1)歸一化
歸一化的變換式為
(5)
2)標準化
標準化的變換式為
(6)
3)一次差
鐘差序列相鄰歷元間一次差的變換式為
(7)
通常得到的衛(wèi)星鐘差相鄰歷元的數(shù)值變化不大,鐘差相鄰歷元間作一次差后的差值序列有效位數(shù)減少,以全球定位系統(tǒng)(global positioning system, GPS)衛(wèi)星鐘為例,其鐘差一次差序列一般在[-2,2]范圍內變化。
需要說明的是,數(shù)據(jù)預處理的對象既包括訓練集的輸入、輸出樣本,也包括測試集的輸入樣本。與使用原始數(shù)據(jù)序列進行建模不同,這里首先對原始數(shù)據(jù)進行預處理,然后使用預處理后的數(shù)據(jù)序列進行建模,最后還原得到最終預報結果。
實驗數(shù)據(jù)來自全球衛(wèi)星導航系統(tǒng)國際服務協(xié)會(international global navigation satellite system service,IGS)網(wǎng)站提供的 5min間隔的事后精密GPS衛(wèi)星鐘差數(shù)據(jù)。以2012-07-11-08-10共31 d的數(shù)據(jù)為例,同時考慮此時的星載原子鐘包括Block ⅡA Cs鐘、ⅡA Rb鐘、ⅡR Rb鐘和ⅡR-M Rb鐘4類,隨機選取每類鐘的衛(wèi)星進行實驗,本文選取的是PRN04(ⅡA Rb)、PRN08(ⅡA Cs)、PRN23(ⅡR Rb)和PRN29(ⅡR-M Rb)這4顆衛(wèi)星。其中,PRN04和PRN29衛(wèi)星鐘差呈遞增變化,PRN23衛(wèi)星鐘差呈遞減變化,而PRN08衛(wèi)星既不呈遞增也不呈遞減變化。
使用7月11日1 d(288個歷元)的鐘差數(shù)據(jù)進行建模,預報接下來1 d的鐘差,即將7月11日及12日的數(shù)據(jù)分別作為訓練樣本集和測試樣本集。分別使用原始數(shù)據(jù)、歸一化數(shù)據(jù)、標準化數(shù)據(jù)和一次差數(shù)據(jù)序列建立LSSVM模型,并對比不同核函數(shù)對預報精度的影響。表2給出了模型使用不同數(shù)據(jù)序列、不同核函數(shù)時預報精度統(tǒng)計,其中,以IGS相應的精密鐘差值為基準,使用均方根(root mean square,RMS)作為統(tǒng)計量。
從表2中可以看出:
1)不同核函數(shù)對LSSVM模型性能有重要影響。使用原始數(shù)據(jù)和歸一化數(shù)據(jù)序列建模時,基于線性核函數(shù)的預報效果最好,使用差分數(shù)據(jù)序列建模時,基于RBF核函數(shù)的預報精度最高,而使用標準化數(shù)據(jù)序列建模時,基于線性和多項式兩種核函數(shù)的預報效果相當,整體而言,多項式核函數(shù)稍好;
2)與不對樣本進行數(shù)據(jù)預處理相比,數(shù)據(jù)預處理方法沒有提高LSSVM的可塑性,不同的數(shù)據(jù)預處理方法對LSSVM的可塑性影響也是相當?shù)?;但?shù)據(jù)預處理方法對泛化性能的改善是顯著的,并且不同的數(shù)據(jù)預處理方法對泛化性的影響有很大差別,這一點可以從模型測試集的均方根誤差看出。
3)LSSVM模型采用一次差數(shù)據(jù)預處理方法時預報精度最高,而運用歸一化和標準化兩種方法時預報精度無明顯差別。
表2 基于不同數(shù)據(jù)序列、不同核函數(shù)的預報精度統(tǒng)計表/ns
注:“—”表示無窮大
為了進一步對比不同數(shù)據(jù)預處理方法的鐘差預報效果,同樣使用7月11日的數(shù)據(jù)進行建模,分別預報接下來7 d、14 d和30 d的鐘差。為了驗證LSSVM在衛(wèi)星鐘差預報時的優(yōu)越性,將其與傳統(tǒng)的QP模型和GM(1,1)模型進行對比分析,其中,采用11日的原始鐘差數(shù)據(jù)建立QP模型,使用11日最后1 h(12個歷元)的原始數(shù)據(jù)建立GM(1,1)模型。
根據(jù)3.2節(jié)的分析可知,運用不同數(shù)據(jù)序列建模時,不同核函數(shù)的適用性不盡相同。對于原始數(shù)據(jù)和歸一化數(shù)據(jù)序列,這里使用線性核,差分序列使用RBF核;由于采用標準化數(shù)據(jù)序列建模時,線性核和多項式核的適用性大體相同,但線性核不需要確定核參數(shù),可以簡化計算,所以這里仍使用線性核。
表3給出了4顆衛(wèi)星在LSSVM模型使用數(shù)據(jù)預處理方法前后的預報結果統(tǒng)計值,表3中,使用RMS和極差(Range,最大誤差與最小誤差之差的絕對值)作為統(tǒng)計量,比較分析模型使用不同數(shù)據(jù)序列時的預報效果。
從表3可以看出,LSSVM模型使用數(shù)據(jù)預處理方法時預報精度和穩(wěn)定性較不使用時有了明顯的提高,其中一次差數(shù)據(jù)預處理方法對預報效果的改善最為顯著,歸一化和標準化方法次之,并且這兩種方法的改善效果相當。在實驗過程中發(fā)現(xiàn),使用經(jīng)過數(shù)據(jù)預處理的數(shù)據(jù)序列進行建模,LSSVM的訓練時間明顯縮短,以利用一次差分數(shù)據(jù)作為訓練數(shù)據(jù)為例,其訓練時間和預報時間(7 d)之和一般在10 min以內,保證了算法的實時性,而利用原始鐘差數(shù)據(jù)建模預報,需消耗時間至少20 min。
表3 預報結果統(tǒng)計表
下面對LSSVM模型使用各數(shù)據(jù)預處理方法時表現(xiàn)出的特點進行分析說明。由于使用的是IGS提供的精密鐘差數(shù)據(jù),其鐘差序列自身誤差很小,其精度最高可達75 ps,因此可以認為鐘差預報誤差是由LSSVM的建模誤差所造成的。歸一化和標準化方法純粹是兩種數(shù)字變換方法,只是將鐘差序列限制在一定的范圍內,而沒有考慮到鐘差序列自身表現(xiàn)出的特性,雖然可以明顯提高LSSVM的建模精度,但不及一次差方法,這兩種方法的區(qū)別也只是變換后數(shù)值分布范圍不同,所以對LSSVM的建模影響程度也相當。而一次差數(shù)據(jù)預處理方法顧及了星載原子鐘鐘差的特點,通過相鄰歷元間一次差的建模方法,LSSVM模型可以較好地擬合鐘差模型,進而可以提高LSSVM模型的預報精度和泛化能力。但一次差方法本身也存在一定的缺點,即經(jīng)過數(shù)據(jù)的一次差處理和預報后的鐘差還原,根據(jù)誤差傳播定律可知,這樣會使預報結果所含的誤差變大。然后從實驗結果可以看到,即使對于30 d的長期預報,使用一次差方法時LSSVM的鐘差預報效果仍比不使用時得到了明顯提高,這是因為由原鐘差序列有效位數(shù)太多引起的LSSVM模型難以較好地擬合鐘差模型所造成的誤差遠大于由相鄰歷元作差對建模所造成的預報誤差。值得一提的是,如果LSSVM建模時,所使用的鐘差數(shù)據(jù)含有一定的系統(tǒng)誤差,則基于一次差方法的LSSVM模型會得到更好的預報效果。
為了驗證基于LSSVM的鐘差預報性能,將基于一次差方法的LSSVM模型同QP模型和GM(1,1)模型加以比較,表2給出了4顆衛(wèi)星的QP模型、GM(1,1)模型和LSSVM模型的預報均方根誤差和極差,限于篇幅,僅給出了PRN04衛(wèi)星7 d、14 d和30 d的誤差比對圖,見圖1~圖3。
圖1 PRN04衛(wèi)星預報7 d誤差
圖2 PRN04衛(wèi)星預報14 d誤差
圖3 PRN04衛(wèi)星預報30 d誤差
結合圖1~圖3和表3可以看出,與QP模型和GM(1,1)模型相比較而言,基于一次差方法的LSSVM模型對7 d、14 d和30 d的預報精度均有顯著改進,尤其對于變化比較復雜、嚴重老化的Block ⅡA Cs鐘和ⅡA Rb鐘,基于LSSVM模型的預報效果仍比較理想,這說明LSSVM在處理非線性鐘差的預報問題時具有一定的優(yōu)勢。
以樣本數(shù)據(jù)預處理對基于LSSVM的衛(wèi)星鐘差預報的影響為切入點,探討了不同數(shù)據(jù)預處理方法對鐘差預報結果的影響。對預報結果進行分析,得到以下結論:
1)使用LSSVM進行衛(wèi)星鐘差預報,數(shù)據(jù)有效位數(shù)的多少對LSSVM的預報性能有重要影響,因此在使用LSSVM前對有效位數(shù)多的原鐘差數(shù)據(jù)序列進行適當?shù)奶幚砜梢蕴岣週SSVM的預報性能;
2)使用預處理后的數(shù)據(jù)序列進行建模時,各種核函數(shù)的適用性不盡相同,需要根據(jù)實際情況來選擇合適的核函數(shù);
3)歸一化、標準化和相鄰歷元間一次差的3種數(shù)據(jù)預處理方法,在保證模型可塑性的情況下,對模型的泛化能力都有顯著改進,其中基于一次差方法的改進效果最為明顯,歸一化和標準化方法次之,并且這兩種方法對泛化能力的改善程度相當;
4)基于一次差方法的LSSVM模型預報性能明顯優(yōu)于傳統(tǒng)的二次多項式模型和灰色系統(tǒng)模型,可以考慮作為一種較為有效的導航衛(wèi)星鐘差短期、中長期預報方法使用。
[1] 崔先強,焦文海.灰色系統(tǒng)模型在衛(wèi)星鐘差預報中的應用[J].武漢大學學報:信息科學版,2005,30(5):447-450.
[2] 鄭作亞,盧秀山.幾種GPS衛(wèi)星鐘差預報方法比較及精度分析[J].山東科技大學:自然科學版,2008,27(4):6-11,15.
[3] 徐君毅,曾安敏.ARIMA(0,2,q)模型在衛(wèi)星鐘差預報中的應用[J].大地測量與地球動力學,2009,29(5):116-120.
[4] 郭承軍,滕云龍.基于小波分析和神經(jīng)網(wǎng)絡的衛(wèi)星鐘差預報性能分析[J].天文學報,2010,51(4):395-403.
[5] LI Xiao-yu,DONG Xu-rong,ZHENG Kun,et al.Research of Satellite Clock Error Prediction Based on RBF Neural Network and ARMA Model[EB/OL].[2013-08-12].http://link.springer.com/chapter/10.1007%2F978-3-642-37407-4_29#page-1.
[6] 雷雨,趙丹寧.基于最小二乘支持向量機的鐘差預報[J].大地測量與地球動力學,2013,33(2):91-95.
[7] VAPNIK V N.An Overview of Statistical Learning Theory[J].IEEE Transactions on Neural Networks,1999,10(5):988-999.
[8] SUYKENS J A K,VANDEWALLE J.Least Squares Support Vector Machine Classifiers[J].Neural Processing Letters,1999,19(3):293-300.
[9] 祝志慧,孫云蓮,季宇.基于EMD和SVM的短期負荷預測[J].高電壓技術,2007,33(5):118-122.
[10] 王興玲,李占斌.基于網(wǎng)格搜索的支持向量機核函數(shù)參數(shù)的確定[J].中國海洋大學學報,2005,35(5):859-862.