徐苑景
摘要:利用傅立葉級(jí)數(shù)對(duì)散點(diǎn)小行星光變數(shù)據(jù)進(jìn)行曲線擬合,以獲得小行星表示參數(shù),選取傅立葉級(jí)數(shù)為6的擬合方式對(duì)單體或雙體小行星光變曲線進(jìn)行分類,并用機(jī)器學(xué)習(xí)算法中的SVM和決策樹建立預(yù)測(cè)模型。檢驗(yàn)結(jié)果表明,SVM模型對(duì)單體和雙體小行星的預(yù)測(cè)正確率達(dá)到95%,相較于決策樹正確率提高了10%,為從小行星實(shí)際觀測(cè)數(shù)據(jù)直接推測(cè)雙體小行星潛在相關(guān)應(yīng)用提供了參考。
關(guān)鍵詞:傅立葉級(jí)數(shù);機(jī)器學(xué)習(xí);預(yù)測(cè);小行星
DOI:10. 11907/rjdk. 201152????????????????????????????????????????????????????????????????? 開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
中圖分類號(hào):TP301 ? 文獻(xiàn)標(biāo)識(shí)碼:A ??????????????? 文章編號(hào):1672-7800(2020)011-0042-04
Asteroid Classification Based on Joint Fourier Series and Machine Learning
XU Yuan-jing
(State Key Laboratory of Lunar and Planetary Science,Macau University of Science and Technology,Macau 999078,China)
Abstract:In this article, the Fourier series is used to fit the light change data of scattered asteroids, so as to obtain the representation parameters of the asteroids. A fitting method is choser with a Fourier series of 6 to classify the light curve of single or binary asteroids, and SVM and decision tree in machine learning algorithm are used to build prediction model. The result shows that the accuracy rate of SVM model predicting single and binary asteroids is 95%, which is 10% higher than that of decision tree. This method can be applied to provide reference for directly estimating the potential twin asteroids from the actual observation data of the asteroids.
Key Words:Fourier series; machine learning algorithm; prediction; asteroids
0 引言
小行星是太陽系中圍繞太陽系質(zhì)心運(yùn)動(dòng)的小天體,其保留了大量太陽系形成初期的珍貴信息[1]。但其本身不發(fā)射可見光,只有通過反射太陽光才能被觀測(cè)到,目前通過測(cè)光觀測(cè)獲得行星自轉(zhuǎn)軸在空間指向的小行星僅有幾百顆[2]。小行星光變是指由于小行星自轉(zhuǎn)引起的光度變化,對(duì)小行星進(jìn)行激光觀測(cè),可得到小行星光變曲線[3]。小行星和地球在繞日公轉(zhuǎn)過程中,它們與太陽的幾何位置會(huì)變化,當(dāng)運(yùn)行到恰當(dāng)位置時(shí),才能在地球上被觀測(cè)到,形成可觀測(cè)窗口。不同觀測(cè)窗口獲得的小行星光變曲線存在差異,故通過積累多個(gè)觀測(cè)窗口的多條光變曲線數(shù)據(jù)可反演計(jì)算出小行星形狀、自轉(zhuǎn)軸指向及表面基本光學(xué)特征[4]。因小行星數(shù)量眾多,實(shí)際觀測(cè)數(shù)據(jù)量將非常龐大,且觀測(cè)過程中可能出現(xiàn)兩個(gè)或多個(gè)小行星共同旋轉(zhuǎn)的情況。
近年來,太陽系中所有小行星種群中都發(fā)現(xiàn)了雙星系統(tǒng),其構(gòu)成了近地小行星(NEA)和小型主帶小行星的主要部分[5]。在近地小行星中,雙體小行星數(shù)量約占其總數(shù)的15±4%[6-7]。雙體小行星模型的不確定性及其附近復(fù)雜多變的動(dòng)力學(xué)環(huán)境,對(duì)雙體小行星探測(cè)任務(wù)設(shè)計(jì)提出了挑戰(zhàn)[8]。
1965年,張鈺哲等[9]使用60cm望遠(yuǎn)鏡結(jié)合光電倍增管對(duì)小行星(26)Proserpina進(jìn)行時(shí)序測(cè)光,獲得該小行星的光變曲線。但在小行星實(shí)際測(cè)光過程中,只能測(cè)得一些分散的數(shù)據(jù)點(diǎn)。為了從這些分散的數(shù)據(jù)點(diǎn)中找到其內(nèi)在規(guī)律,需運(yùn)用多項(xiàng)式或函數(shù)逼近這些已知點(diǎn),許多學(xué)者對(duì)其進(jìn)行了研究。如張勤[10]認(rèn)為最小二乘法是一種簡便、有效的擬合方法;肖軼軍等[11]提出基于迭代最近點(diǎn)的優(yōu)化方法;包健等[12]研究由輸入層神經(jīng)元數(shù)、輸出層神經(jīng)元數(shù)及樣本點(diǎn)數(shù)確定隱含層神經(jīng)元數(shù)的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。但目前通過計(jì)算機(jī)模擬預(yù)測(cè)小行星特性的研究很少。
本文嘗試了傅立葉級(jí)數(shù)、多項(xiàng)式、高斯、神經(jīng)網(wǎng)絡(luò)4種擬合方式,最后確定采用精度最高的傅里葉級(jí)數(shù)對(duì)小行星測(cè)光數(shù)據(jù)進(jìn)行擬合,以期獲得小行星表示參數(shù),找出其特征;通過機(jī)器學(xué)習(xí)法對(duì)單體和雙體小行星光變曲線進(jìn)行檢驗(yàn),以推算哪些是潛在可能的雙體小行星。
1 傅里葉級(jí)數(shù)
傅里葉級(jí)數(shù)(Fourier Series)是一種將波狀函數(shù)表示為簡單正弦波的方法,對(duì)周期現(xiàn)象進(jìn)行數(shù)學(xué)分析可將任何周期函數(shù)或周期信號(hào)分解為一組簡單的振蕩函數(shù)(可能由無限元素組成),即正弦函數(shù)和余弦函數(shù)(或等效地使用復(fù)指數(shù))。
設(shè)定傅立葉級(jí)數(shù)為N、矩陣大小為N×2N+1,矩陣第一列為常數(shù)項(xiàng),第二列至N+1列為cos(x)-cos(Nx),第N+2至2N+1列為sin(x)-sin(Nx),得到矩陣M為:
M=1cosx1cos2x1?cosNx1sinx1sin2x1?sinNx11cosx2cos2x2?cosNx2sinx2sin2x2?sinNx21cosx3cos2x3?cosNx3sinx3sin2x3?sinNx31cosx4cos2x4?cosNx4sinx4sin2x4?sinNx4?????????1cosxNcos2xN?cosNxNsinxNsin2xN?sinNxN????? (1)
y的線性方程為:
b=y1y2?yn?????????? (2)
AX=b可表示為:
y1y2?yn=1cosx1cos2x1?cosNx1sinx1sin2x1?sinNx11cosx2cos2x2?cosNx2sinx2sin2x2?sinNx21cosx3cos2x3?cosNx3sinx3sin2x3?sinNx31cosx4cos2x4?cosNx4sinx4sin2x4?sinNx4?????????1cosxNcos2xN?cosNxNsinxNsin2xN?sinNxN
a0a1?aNb1b2?bN?? (3)
求解得到傅立葉級(jí)數(shù)對(duì)應(yīng)的每一個(gè)系數(shù),包括a0~an,以及b1~bn,得到公式:
ft=a0+a1cosω0t+a2cos2ω0t+?+b1sinω0t+b2sin2ω0t+?=a0+n=1∞ancosnω0t+bnsinnω0t? (4)
2 機(jī)器學(xué)習(xí)算法
機(jī)器學(xué)習(xí)是一類算法的總稱,是指通過賦予機(jī)器學(xué)習(xí)的能力,使計(jì)算機(jī)能夠從特定數(shù)據(jù)集中學(xué)習(xí)規(guī)律并作出預(yù)測(cè)。主要分為線性模型和非線性模型,非線性模型又分為傳統(tǒng)機(jī)器學(xué)習(xí)模型(如SVM、KNN、決策樹等)和深度學(xué)習(xí)模型。本文選取SVM和決策樹兩種方法進(jìn)行研究。
2.1 支持向量機(jī)
支持向量機(jī)(Support Vector Machine,SVM)是基于統(tǒng)計(jì)學(xué)理論發(fā)展起來的一種機(jī)器學(xué)習(xí)方法,其以結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則為理論基礎(chǔ),引入核函數(shù)方法,將原始問題映射到高維空間,把待求解問題轉(zhuǎn)換為二次優(yōu)化問題,使SVM收斂于問題全局最優(yōu)解。它能較好地解決小樣本、非線性、高維數(shù)和局部極小點(diǎn)等實(shí)際問題,具有良好的泛化能力[13]。
通過高斯徑向核函數(shù)?(x)將訓(xùn)練集xi映射到高維線性空間,構(gòu)造回歸估計(jì)函數(shù):
f(x)=ω?(x)+b? (5)
式中,ω為高維空間權(quán)向量,b為偏置常數(shù)。則最優(yōu)問題為:
minR=12ω2+12γi=1mξ2i
yi=ωT?(x)+b+ξi????? (i=1,2,…m)???????????????? (6)
式中,ξi為松弛因子。
利用Lagrange函數(shù)求解上述優(yōu)化問題,即:
L(ω,,b,ξ,α,γ)=12ω2+12γi=1mξ2i-i=1mαiωT?(xi)+b+ξi-yi???????? (7)
式中,αi∈R(i=1,2,…,m)為拉格朗日乘子。
根據(jù)Karush-Kuhn-Tucher(KKT)優(yōu)化條件,得到如下等式:
?L?ω=0→ω=i=1mαi?(xi)?L?b=0→i=1mαi=0?L?ξ=0→αi=γξi?L?αi=0→ωT?(xi)+b+ξi-yi=0????? (8)
代入式(4)消去ω和ξ,得到以下線性方程:
01…m1K(x1+x1)+1γ…K(x1+xm)…………mK(xm+x1)…K(x1+xm)+1γ?bα1…αm=0y1…ym?????????? (9)
式中,K(xi,xj)為核函數(shù)。
然后用最小二乘法求出α和b,即得到非線性預(yù)測(cè)輸出模型。
y=i=1mαiK(x,xi)+b ?????????(10)
2.2 決策樹
決策樹(Decision Tree)是指在已知各種情況發(fā)生概率的基礎(chǔ)上,通過構(gòu)成決策樹求取凈現(xiàn)值期望值大于等于零的概率,從而評(píng)價(jià)項(xiàng)目風(fēng)險(xiǎn)、判斷其可行性的決策分析方法,是直觀運(yùn)用概率分析的一種圖解法[14]。假設(shè)T為訓(xùn)練集, 為T構(gòu)造決策樹時(shí), 選擇信息增益值作為分裂節(jié)點(diǎn)的屬性及標(biāo)準(zhǔn), 按照該標(biāo)準(zhǔn)將T分成n個(gè)子集。若第i個(gè)子集Ti含有的元組類別一致, 該節(jié)點(diǎn)即成為決策樹的葉子節(jié)點(diǎn)而停止分裂。對(duì)于不滿足該條件T的其它子集, 按照上述方法繼續(xù)分裂,直至所有子集所含元組都屬于一個(gè)類別為止[15]。
[7] 杜燕茹,李翔宇,韓宏偉,等. 雙體小行星系統(tǒng)平衡態(tài)與穩(wěn)定性研究[J]. 深空探測(cè)學(xué)報(bào),2019,6(5):456-462.
[8] SCHEIRICH P, PRAVEC P. Modeling of lightcurves of binary asteroids[J].? Icarus, 2009, 200(2):531-547.
[9] 張鈺哲, 周興海, 楊修義,等.? 小行星光變曲線(Ⅳ)[J].? 天文學(xué)報(bào), 1981(2):65-69.
[10] 張勤.? 最小二乘估計(jì)在曲線擬合中應(yīng)用的研究[J].? 成功(教育),2011(18): 296-297.
[11] 肖軼軍,丁明躍,彭嘉雄. 基于迭代最近點(diǎn)的B樣條曲線擬合方法研究[J]. 中國圖像圖形學(xué)報(bào),2000(7): 585-588.
[12] 包健, 趙建勇,周華英. 基于BP網(wǎng)絡(luò)曲線擬合方法的研究[J]. 計(jì)算機(jī)工程與設(shè)計(jì),2005, 26(7):1840-1841,1848.
[13] 畢天騰,劉越,翁冬冬,等. 基于監(jiān)督學(xué)習(xí)的單幅圖像深度估計(jì)綜述[J]. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2018,30(8):1383-1393.
[14] ABHISEK U. Support vector machine[J].? Computer Science, 2002 (4):1-28.?
[15] 聯(lián)合開發(fā)網(wǎng). matlab例程[EB/OL]. http://www.pudn.com/Download/item/id/3707674.html.
[16] 劉紅巖,陳劍,陳國青. 數(shù)據(jù)挖掘中的數(shù)據(jù)分類算法綜述[J]. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2002(6):727-730.
[17] EDBERG S J. International Halley watch amateur observersmanual for science comet studies [M]. Jwt Propulsion Lab,California Inst.of Technology,1993.
[18] 白春紅. 基于SVM模型的充填體強(qiáng)度與采場(chǎng)穩(wěn)定性需求智能匹配研究[J]. 中國礦業(yè),2019,28(11):104-108.
(責(zé)任編輯:黃 ?。?/p>