葉嘉暉12趙海斌13李 彬13
(1中國科學院紫金山天文臺南京210008)
(2中國科學院大學北京100049)
(3中國科學院行星科學重點實驗室南京210008)
利用小行星色指數(shù)區(qū)分S/C型小行星的方法?
葉嘉暉1,2?趙海斌1,3?李 彬1,3
(1中國科學院紫金山天文臺南京210008)
(2中國科學院大學北京100049)
(3中國科學院行星科學重點實驗室南京210008)
利用多色測光得到的色指數(shù)在區(qū)分S/C型小行星過程中具有重要的參考意義,由色指數(shù)空間主成分分析到的顏色參數(shù)a區(qū)分S/C類型是一種有效的方法.采用a=0分劃的硬分割方法和對a作聚類分析法分別對SDSSMOC4和XSTPS-GAC的小行星多色數(shù)據(jù)樣本進行分類,結果表明:兩種方法對較完備的數(shù)據(jù)樣本無明顯差別,且都與Carvano的S/C分類結果相符;a=0分劃方法對樣本空間變化敏感,而a聚類分析方法更為穩(wěn)定.
小行星:普通,方法:數(shù)據(jù)分析
小行星是圍繞太陽運動的巖石或者金屬天體,它們是太陽系形成早期未能發(fā)生吸積的遺留物質,因此仍然蘊含著太陽系原始星云的信息.S型和C型是最常見的小行星類型,分別代表了小行星兩種不同的光譜特征,與它們的物質成分相關.S型常見于小行星主帶內側,主要成分是硅酸鹽巖石;C型常見于小行星主帶中部和外側,主要成分是碳類物質.物質成分的差異導致兩類小行星的反照率不一樣,S型小行星通常比同距離的相同大小的C型小行星亮.從反射光譜的形狀能夠明顯地區(qū)分兩類小行星,如圖1所示.S型小行星光譜在小于0.7μm的部分有很陡的上升斜率,大于0.75μm部分有中等至較強的吸收,峰值在0.73μm附近達到1.2左右.C型小行星光譜在小于0.55μm部分有較弱至中等的紫外吸收,大于0.55μm部分平緩無特征.其他類型的小行星光譜與S或C型小行星的光譜相似,區(qū)別在于反照率大小和吸收帶的強弱[1].
小行星光譜觀測耗費大量觀測資源,因此獲得大樣本連續(xù)光譜數(shù)據(jù)難度大,而獲得大樣本多色測光數(shù)據(jù)則更可行[2?3].利用多色測光數(shù)據(jù)得到小行星的色指數(shù),進一步對多個色指數(shù)開展主成分分析研究成為初步區(qū)分小行星類型的重要方法.1984年Tholen使用主成分分析法研究了8色小行星巡天的結果,從而總結出最早的被廣泛使用的小行星分類方法[4].2006年Roig和Gil-Hutton使用了主成分分析法在斯隆巡天的小行星中尋找候選V型小行星[5].主成分分析法也能作為區(qū)分S/C型小行星的手段,通過色指數(shù)構建出第1主成分,定義為小行星的顏色參數(shù)a,它反映了光譜顏色偏紅/藍的特征,a=0是劃分S和C型小行星的界線.Ivezi′c等[6]和Roig等[5]曾對斯隆巡天發(fā)布的不同批次數(shù)據(jù)作了同樣的處理.
圖1 典型S型和C型小行星在0.4~1.0μm內的反射光譜.左圖是S型,右圖是C型.數(shù)值已歸一到0.55μm處[1].Fig.1 The re fl ectance spectra of S type and C type asteroids within 0.4~1.0μm,normalized to unity at 0.55μm.The left one is S type,and the right one is C type[1].
以a=0分劃的區(qū)分方式對完備樣本的分析結果與已有分類結果相符,但是對有偏的樣本數(shù)據(jù)庫會得到不一致的結果,對樣本數(shù)量的敏感依賴性是該方法的固有缺點.聚類分析法由于考慮了樣本存在S/C類型的特征聚集現(xiàn)象,其結果對樣本數(shù)量的依賴性更小,比a=0分劃的方式更合理,其中K平均算法在已知分類的聚類分析法中是快速而有效的.
使用主成分分析和聚類分析,目的是利用色指數(shù)區(qū)分S和C型小行星,對繼續(xù)區(qū)分小行星亞類有重要的參考意義.本文應用這兩種方法處理斯隆巡天中MOC4小行星數(shù)據(jù)和近地天體望遠鏡反銀心方向小行星多色巡天的數(shù)據(jù),給出了有效的S/C分類,并對結果進行了分析和討論.
2.1 主成分分析(Principal Component Analysis,PCA)
主成分分析是一種數(shù)學變換方法,通過把一組相關的變量變換成另一組互不相關的變量,新的變量按照方差大小排列,第1變量具有最大的方差,稱為第1主成分,方差次大的變量稱為第2主成分,以此類推.變量的方差越大包含越多的信息,因此第1主成分包含了原變量組的主要信息,通過分析第1主成分來達到多維變量分析的降維目的.在色指數(shù)研究中,第1主成分反映了光譜的顏色特征.
通過多色巡天觀測獲取小行星色指數(shù).不同的觀測項目使用數(shù)目不同的濾光片,如8色小行星巡天使用了8個濾光片,斯隆數(shù)字巡天使用了5個濾光片.每個色指數(shù)在不同程度上反映了小行星的光譜信息,相互之間有信息的重疊,符合使用主成分分析的條件.
計算主成分的變換式為:
其中PC為所求的主成分,F為色指數(shù),B為色指數(shù)的均值,E為色指數(shù)協(xié)方差矩陣的特征向量.
2.2 K平均算法(K-means algorithm)
K平均算法屬于硬聚類算法,在已知類個數(shù)的前提下,根據(jù)特征相似性劃分數(shù)據(jù)子集(類簇).首先選擇K個簇的初始平均值或中心,對剩余的每個對象根據(jù)其與各個簇中心的距離,將它賦給最近的簇,然后重新計算每個簇的平均值.這個過程不斷迭代直至準則函數(shù)收斂.
使用K平均算法可以根據(jù)第1主成分PC1把小行星分成S類和C類.S型和C型小行星是兩類的主要成員,聚集在兩中心附近,其他類型小行星也會被劃分到特征相近的一類中.由于類簇中心密集,我們假定數(shù)據(jù)呈正態(tài)分布,均值為μ,標準差為σ,區(qū)分依據(jù)是到兩均值點的概率距離d:
當μ和σ不再變化時,所有小行星都能夠唯一地劃分到S或C類.這里選擇概率距離優(yōu)于歐氏距離,因為概率距離考慮了數(shù)據(jù)的聚集程度,體現(xiàn)在標準差σ上.
2.3 星等歸算
絕對星等計算采用Bowell等人在1985年提出的HG星等系統(tǒng)[7],可以表示為:
其中H是小行星的絕對星等;α是小行星的太陽相位角;H(α)是一個與α有關的函數(shù),稱為相位函數(shù).G值表征相位函數(shù)的斜率,稱為斜率參數(shù).不同的小行星有不同的G值,反照率大的G較大,反照率小的G較小.對于未知G值的小行星,通常取G=0.15.函數(shù)Φ表示為:
其中A1=3.332,B1=0.631,C1=0.986,A2=1.862,B2=1.218,C2=0.238.
3.1 斯隆數(shù)字巡天數(shù)據(jù)處理
斯隆巡天的移動天體數(shù)據(jù)星表(Sloan Digital Sky Survey Moving Object Catalog, SDSSMOC)中提供了小行星可見光波段高精度的色指數(shù)信息,最新發(fā)布的是第4版數(shù)據(jù),觀測歷元至2007年3月.SDSSMOC4共計包含了104 539個小行星的220 101次觀測1http://sbn.psi.edu/pds/resource/sdssmoc.html.
圖2為斯隆巡天g、r、i濾光片的響應曲線.結合圖1可見小行星的反射光譜特征區(qū)域落在g、r、i覆蓋范圍內.為了與前人的工作結果保持一致,我們使用g、r、i表示小行星在g、r、i波段內的絕對星等,并省略單位mag.根據(jù)Ivezi′c等[6]的研究,我們在選取小行星樣本時選擇色指數(shù)范圍:g-r:0~1.2;r-i:?0.2~0.6,共計選取103 641個小行星.
圖2 斯隆巡天g、r、i濾光片的響應曲線Fig.2 The fi lter pro fi les of SDSS g,r,and i wavebands
圖3 為SDSSMOC4的(g-r)-(r-i)色指數(shù)分布,從圖中可以看出明顯的雙峰結構.雙峰結構主要由兩大類型小行星的分布造成,如圖4所示.S型和C型的聚集區(qū)域分別對應圖3中的右上峰和左下峰.小行星光譜在0.3~1μm內有兩個主要吸收特征:一個小于0.55μm,另一個大于0.7μm.r波段處于兩個吸收帶之間,所以小行星的g-r和r-i色指數(shù)能夠反映光譜的變化情況,S型和C型小行星色指數(shù)的差異是造成雙峰分布的原因.
根據(jù)(1)式得到的小行星顏色參數(shù)a為:
實際上a是色指數(shù)在特征向量方向上的投影,如圖3中虛線所示,根據(jù)主成分分析的原理,數(shù)據(jù)的方差在該方向上最大.a反映了小行星的光譜形態(tài)或顏色信息,a越大表示光譜顏色偏紅,a越小表示光譜顏色偏藍.Ivezi′c等[6]在2001年分析了最早發(fā)布的斯隆數(shù)據(jù),根據(jù)6 150個小行星得到的a值為:
2006年Roig和Gil-Hutton根據(jù)SDSSMOC3中17 957個小行星得到的a值為[5]:
可見不同版本斯隆數(shù)據(jù)的a值隨著小行星樣本數(shù)量的增加而變化,g-r系數(shù)會變大而r-i系數(shù)則變小.
圖3 SDSSMOC4小行星的(g-r)-(r-i)色指數(shù)分布Fig.3 The distributions of SDSSMOC4 asteroids’(g-r)-(r-i)color indexes
為了比較兩種分類方式的效果,我們用Carvano等[8]的分類結果作了對比2http://sbn.psi.edu/pds/resource/sdsstax.html.Carvano分類是最新的使用廣泛的小行星分類系統(tǒng).表1是兩種分類結果與Carvano系統(tǒng)S/C型小行星數(shù)目的比較.由比較結果可見兩種分類方式對S和C型小行星的區(qū)分非常符合已知的分類結果.對于數(shù)據(jù)較完備的樣本,如SDSSMOC4,以a=0和聚類劃分的結果沒有明顯差別.
圖4 S型和C型小行星的(g-r)-(r-i)色指數(shù)分布Fig.4 The distributions of S type and C type asteroids’(g-r)-(r-i)color indexes
圖5 SDSSMOC4小行星a參數(shù)高斯分布.左右兩個分布分別對應C型和S型小行星.Fig.5The Gaussian distributions of“a”derived from the SDSSMOC4 data.The left and right distributions correspond to C type and S type asteroids,respectively.
表1 SDSSMOC4兩種分類結果與Carvano S/C型小行星的數(shù)目比較Table 1 The comparison of our results of SDSSMOC4 derived by PCA and cluster analysis methods respectively with those of the Carvano’s method
主成分分析的a值依賴于樣本,由圖4可見兩類小行星的分布有交集,以數(shù)據(jù)均值a=0作為劃分界線屬于硬分割,這種劃分方式?jīng)]有考慮交集部分.聚類分析考慮了數(shù)據(jù)有聚集和交集現(xiàn)象,以兩個正態(tài)分布模擬雙峰分布,所以更符合實際情況.當樣本包含的S型和C型小行星數(shù)目有很大差別時,a=0不能準確區(qū)分兩種類型,但是聚類分析依然有效.我們隨機選擇了Carvano分類中不同數(shù)量的S和C型小行星組成新樣本作分類處理.結果表明以a=0劃分的結果對不同的樣本空間有波動,而聚類分析的劃分結果相對穩(wěn)定,聚類分析更適合有選擇性樣本的數(shù)據(jù)處理.因此為了都能夠使用兩種分類方法,我們應該選擇數(shù)據(jù)完備的樣本.表2和表3是兩種不同情況的對比結果.
表27 000個S型、3 000個C型小行星使用兩種劃分方法與Carvano分類的數(shù)目對比Table 2 The comparison of the results of 7000 S type and 3000 C type asteroids derived by PCA and cluster analysis methods respectively with those of the Carvano’s method
表38 000個S型、2 000個C型小行星使用兩種劃分方法與Carvano分類的數(shù)目對比Table 3 The comparison of the results of 8000 S type and 2000 C type asteroids derived by PCA and cluster analysis methods respectively with those of the Carvano’s method
3.2 盱眙近地天體望遠鏡反銀心方向測光巡天數(shù)據(jù)處理
盱眙近地天體望遠鏡反銀心方向測光巡天(Xuyi Schmidt Telescope Photometric Survey of the Galactic Anti-center,XSTPS-GAC)由北京大學科維理天文與天體物理研究所和紫金山天文臺合作完成,觀測歷元為2009年10月至2010年3月、2010年9月至2011年3月,歷時2 yr共13個月.在以銀河系反銀心方向為中心、赤經(jīng)3h~9h、赤緯?10°~+60°約6 000平方度的天區(qū)以及覆蓋仙女座大星云、三角座風車星云約600平方度的擴展天區(qū)開展了CCD成像測光觀測.觀測使用了斯隆巡天g、r、i濾光片,每個觀測夜只在一個波段觀測,其中g波段觀測42 d(2009年10月至2011年3月),r波段觀測37 d(2010年9月至2011年3月),i波段觀測47 d(2009年10月至2011年3月).有關XSTPS-GAC的數(shù)據(jù)處理流程,在Zhang等的研究中有詳細介紹[9?10].
因為各小行星的g、r、i波段的觀測數(shù)據(jù)是在2 yr內的不同觀測歷元獲取的,小行星的相位角變化、小行星的自轉效應均會引起小行星光度的變化,這些原因最終造成了色指數(shù)的彌散.圖6為XSTPS-GAC的1 173個小行星的(g-r)-(r-i)色指數(shù)分布,其中實心圓和空心圓分別表示S型和C型小行星.從圖中無法識別色指數(shù)的雙峰結構,S型和C型小行星的聚集區(qū)域沒有分離.
圖6 XSTPS-GAC小行星的(g-r)-(r-i)色指數(shù)分布Fig.6 The distributions of XSTPS-GAC asteroids’(g-r)-(r-i)color indexes
盡管色指數(shù)沒有明顯的聚集分布,但仍然能夠使用主成分分析和聚類分析.主成分分析得到的a值為:
聚類分析的結果為:μS=0.1468、σS=0.1497和μC=?0.1837、σC=0.1117.XSTPSGAC色指數(shù)的方差比SDSSMOC4大.圖7為擬合的S和C型小行星a參數(shù)的分布曲線.
根據(jù)圖6,對于XSTPS-GAC數(shù)據(jù)未能明確地區(qū)分出S/C兩類小行星,主要是由于觀測數(shù)據(jù)的方差大所致.表4為兩種分類結果與Carvano系統(tǒng)S/C型小行星數(shù)目的比較.
表4 XSTPS-GAC兩種分類結果與Carvano S/C型小行星的數(shù)目比較Table 4 The comparison of our results of XSTPS-GAC derived by PCA and cluster analysis methods respectively with those of the Carvano’s method
研究色指數(shù)分類方法的目的是對已有多色測光觀測的但無光譜觀測的小行星作初步類型判定,以及為確定小行星亞類提供參考信息.本文通過對小行星色指數(shù)使用主成分分析法構建顏色參數(shù)a,并利用a=0分劃和a聚類分析來區(qū)分S/C型小行星,得到結論如下:
(1)分析得到了SDSSMOC4的g-r、r-i色指數(shù)的雙峰分布,S/C型分類結果表明a=0分劃和a聚類分析方法對數(shù)據(jù)較完備的樣本的區(qū)分無明顯差別,與Carvano的分類結果相符合.
圖7 XSTPS-GAC小行星a參數(shù)高斯分布.左右兩個分布分別對應C型和S型小行星.Fig.7The Gaussian distributions of“a”derived from the XSTPS-GAC data.The left and right distributions correspond to C type and S type asteroids,respectively.
(2)由于a值的大小依賴于樣本空間,而聚類分析考慮了數(shù)據(jù)的聚集分布和交集情況,所以a=0分劃的結果對樣本數(shù)量敏感,而聚類分析的結果則更穩(wěn)定.
(3)對XSTPS-GAC的小行星測光數(shù)據(jù)分析表明,對于小行星的色指數(shù)方差大的情況,仍然可以使用兩種區(qū)分方法,只是數(shù)據(jù)彌散會弱化區(qū)分結果,甚至導致無法區(qū)分.
a=0分劃和a聚類分析法的有效性得益于g、r、i波段覆蓋了小行星光譜最重要的兩個吸收特征,所以即使只有兩個色指數(shù),仍然能夠與S/C類型有很強的相關性,從而達到區(qū)分的目的.該方法在具有較完備的SDSSMOC4樣本中的應用得到了證實,而XSTPSGAC的數(shù)據(jù)由于觀測方式?jīng)Q定了色指數(shù)彌散大,因此未來需要獲取多波段同時觀測的數(shù)據(jù).
致謝衷心感謝紫金山天文臺王歆研究員為本文的研究方法和結果提出的寶貴意見.
[1]Bus S J,Binzel R P.Icar,2002,158:146
[2]李雪婧.天文學報,2010,51:384
[3]Li X J.ChA&A,2010,35:117
[4]Tholen D J.Asteroid Taxonomy from Cluster Analysis of Photometry.Tucson:University of Arizona, 1984
[5]Roig F,Gil-Hutton R.Icar,2006,183:411
[6]Ivezi′cˇZ,Tabachnik S,Ra fi kov R,et al.AJ,2001,122:2749
[7]Lagerkvist C I,Williams I P.A&AS,1987,68:295
[8]Carvano J M,Hasselmann P H,Lazzaro D,et al.A&A,2010,510:A43
[9]Zhang H H,Liu X W,Yuan H B,et al.RAA,2013,13:490
[10]Zhang H H,Liu X W,Yuan H B,et al.RAA,2014,14:456
Methods of Asteroid S/C Type Classi fi cation Using Color Index
YE Jia-hui1,2ZHAO Hai-bin1,3LI Bin1,3
(1 Purple Mountain Observatory,Chinese Academy of Sciences,Nanjing 210008)
(2 University of Chinese Academy of Sciences,Beijing 100049)
(3 Key Laboratory of Planetary Sciences,Chinese Academy of Sciences,Nanjing 210008)
Color indexes are important to classify the S/C type asteroids.The asteroids’color parameterareduced from principal component analysis of color indexes is a key parameter of classi fi cation.Two methods,dividing by the parameteradirectly and the cluster analysis by parametera,are applied in asteroids’S/C classi fi cation of Sloan Digital Sky Survey(SDSS)and Xuyi Schmidt Telescope Photometric Survey of the Galactic Anti-center.The SDSSMOC4 shows a bimodal distribution in theg-rvsr-idiagram.The results show that these two methods are e ff ective and consistent in the case of large samples,well in accordance with the Carvano’s consequences.But the result divided by parameteradirectly is unstable for di ff erent subsets,while the cluster analysis is more stable.Both methods still can be used even the variances of the color indexes are large,but the results of classi fi cation are not obvious.
asteroids:general,methods:data analysis
P185;
A
10.15940/j.cnki.0001-5245.2015.03.005
2014-10-14收到原稿,2014-11-14收到修改稿
?國家自然科學基金項目(11273067,11178025)、小行星基金會、澳門科學技術發(fā)展基金項目(095/2013/A3)及江蘇省自然科學基金項目(BK2011890)資助
?yejiahui@pmo.ac.cn
?meteorzh@pmo.ac.cn