卜育德
(山東大學(xué)(威海) 數(shù)學(xué)與統(tǒng)計學(xué)院,山東 威海,264209)
中低分辨率光譜的恒星大氣物理參數(shù)自動提取方法
卜育德
(山東大學(xué)(威海) 數(shù)學(xué)與統(tǒng)計學(xué)院,山東 威海,264209)
恒星大氣物理參數(shù)的信息對我們研究恒星和銀河系的結(jié)構(gòu)和演化有重要意義。由于多目標(biāo)光纖光譜儀的發(fā)展,人類獲取恒星光譜的數(shù)量有了極大的增加。但由于這些光譜數(shù)量眾多,天文學(xué)家快速而又精確的提取相應(yīng)的恒星大氣物理參數(shù)有很多困難。為此,天文學(xué)家發(fā)展了一系列新的方法提取恒星的大氣物理參數(shù)。本文總結(jié)了目前主要的恒星大氣物理參數(shù)估計方法,并對以后可能的重點研究方向給出了建議。
恒星大氣物理參數(shù);α元素豐度;線性回歸
恒星大氣物理參數(shù)是指恒星的表面溫度Teff,表面重力加速度logg和金屬豐度[Fe/H]以及恒星的α元素豐度[α/Fe]等。現(xiàn)代天文學(xué)研究的一個主要課題是理解銀河系的形成和演化歷史,這需要我們獲取大量恒星的大氣物理參數(shù),這些信息將對銀河系的演化歷史和模型提供很強的觀測約束。
隨著多目標(biāo)光纖光譜儀技術(shù)的發(fā)展,天文學(xué)家獲取恒星光譜的能力有了質(zhì)的飛躍。截止到2014年12月,美國的SLOAN數(shù)字巡天(SDSS)項目共釋放了12批約80萬條中分辨率(R~2000)的恒星光譜[1];我國大科學(xué)工程郭守敬望遠(yuǎn)鏡(LAMOST)于2012年9月開始正式巡天后,截止到2016年12月,對國內(nèi)科學(xué)家釋放了四批數(shù)據(jù)6,898,298條恒星光譜(4,202,927條光譜有恒星大氣物理參數(shù))[2];而RAVE巡天獲取了483,330個目標(biāo)574,630個光譜[3]。
基于這些海量的恒星大氣物理參數(shù)等信息,科學(xué)家對銀河系的結(jié)構(gòu)、形成和演化等問題進行了深入研究。比如,針對厚盤和薄盤是兩個完全不同的結(jié)構(gòu)子系,還是同一成分連續(xù)演化過程中呈現(xiàn)的兩種極端情況這個重要問題,Bovy等人使用SDSS發(fā)布的恒星大氣物理參數(shù)和視向速度等參量,通過擬合選擇函數(shù)得到銀河系的標(biāo)高和標(biāo)長,進而認(rèn)為銀河系不存在厚盤和薄盤之分,而是連續(xù)變化的,顛覆了傳統(tǒng)的對銀河系結(jié)構(gòu)的認(rèn)知,促使人們重新思考銀河系的結(jié)構(gòu)[4]。而針對銀暈的年齡問題,Jofre和Weiss利用SDSS DR7發(fā)布的恒星有效溫度和金屬豐度對銀暈中的場星年齡進行了估計,認(rèn)為銀暈的年齡為10-12Gyr,但有效溫度、金屬豐度等的誤差會影響估計精度,誤差大約在4Gyr左右[5]。針對暗物質(zhì)密度問題,張嵐等人利用SDSS提供的[Fe/H]和α豐度等參數(shù)對太陽系附近的暗物質(zhì)密度進行了估算[6],得出暗物質(zhì)密度的估計值為0.0065±0.0023M⊙pc-3。
傳統(tǒng)的恒星大氣物理參數(shù)提取是基于高分辨率光譜的人工分析方法。面對海量的光譜,傳統(tǒng)的方法已無法滿足需要,為此,需要研究新的提取方法。最近20年機器學(xué)習(xí)領(lǐng)域的進展為我們提供了能自動提取恒星大氣物理參數(shù)的方法,可以提高恒星大氣物理參數(shù)的提取效率和精度,有效滿足天文數(shù)據(jù)處理的實時性和精確性的要求。
本文將對目前恒星大氣物理參數(shù)的估計方法做一個總結(jié)??紤]到在實際問題中大多數(shù)研究對大氣物理參數(shù)中的Teff,logg和[Fe/H]與α元素豐度分別研究,本文也將分開討論。
模板匹配方法是使用最為廣泛的方法之一。所謂模板匹配,是指計算待測光譜與光譜庫中光譜的距離,而與待測光譜距離最近的光譜所對應(yīng)的恒星大氣物理參數(shù)值即為該待測光譜的恒星大氣物理參數(shù)。不同的模板匹配方法一般使用不同的方法計算最小距離,而且往往使用不同的光譜庫。SDSS光譜的恒星大氣物理參數(shù)測量程序SSPP包含了兩種模板匹配方法,分別使用不同的理論模板庫[7]。而LAMOST恒星大氣物理參數(shù)的估計方法也是模板匹配方法,所用光譜模板來自于ELODIE光譜庫[8]。向茂盛等人的估計恒星大氣物理參數(shù)的pipeline LSP3使用的也是模板匹配方法,所用的模板光譜來自于MILES光譜庫[9]。
神經(jīng)網(wǎng)絡(luò)方法作為機器學(xué)習(xí)的一個重要方法,較早的被引入了恒星大氣物理參數(shù)的估計當(dāng)中。Bailer-Jones等人和Re Fiorentin等人研究了神經(jīng)網(wǎng)絡(luò)算法的恒星大氣物理參數(shù)提取方法[10,11];譚鑫等人基于Lick線指數(shù)使用神經(jīng)網(wǎng)絡(luò)方法估計了恒星大氣物理參數(shù)[12]。深度學(xué)習(xí)方法作為一種推廣的神經(jīng)網(wǎng)絡(luò)方法,也被應(yīng)用在了恒星大氣物理參數(shù)的估計當(dāng)中。潘儒揚&李鄉(xiāng)儒使用DNN方法估計了SDSS的恒星大氣物理參數(shù)[13]。
回歸方法作為統(tǒng)計學(xué)的一個基本方法也被廣泛的應(yīng)用于恒星大氣物理參數(shù)的估計。張健楠等研究了基于核回歸算法(KR)的恒星大氣物理參數(shù)測量方法[14];卜育德等人研究了高斯過程回歸方法GPR,使用該方法估計了SDSS光譜的恒星大氣物理參數(shù)[15];王杰等人研究了使用Lick線指數(shù)基于核偏最小二乘回歸的恒星大氣物理參數(shù)估計方法[16];李鄉(xiāng)儒等人研究了基于小波分析和線性回歸的恒星大氣物理參數(shù)估計方法[17]。盧瑜等人使用稀疏回歸方法LASSO估計了SDSS的恒星大氣物理參數(shù)[18];Ivezic 等人利用SDSS提供的F/G型恒星的有效溫度和[Fe/H]構(gòu)建了一個使用顏色確定溫度和[Fe/H]的多項式模型,該方法也可以看作一個回歸模型[19]。
使用星震學(xué)方法估計恒星大氣物理參數(shù)中的logg特別適用于巨星和類太陽恒星。所謂星震學(xué)方法,是指基于如下公式計算恒星的表面重力加速度:
其中vmax,⊙=3140.0 μHz,Teff,⊙=5777K,logg⊙=4.44dex。該方法適用于紅巨星,已被用于估計LAMOST和RAVE的恒星的logg,提高了結(jié)果的估計精度[20,21]。
然而,SSPP使用的很多方法并不適用于LAMOST光譜。如無法使用顏色方法測量LAMOST恒星的溫度,這是因為LAMOST沒有測光數(shù)據(jù)。為此,LAMOST項目開發(fā)了自己的pipeline進行恒星大氣物理參數(shù)的測量,主要基于模板匹配的方法[13]。LAMOST目前只發(fā)布了由一種方法測量的恒星大氣物理參數(shù),即模板匹配方法,是由吳悅等人在軟件UlySS基礎(chǔ)上開發(fā)的pipeline實現(xiàn)的[25],使用的光譜庫主要是ELODIE光譜庫。向茂盛等人開發(fā)了自己的程序?qū)AMOST光譜的恒星大氣物理參數(shù)進行測量(LSP3),主要方法也是模板匹配[9],使用的光譜來自于MILES光譜庫。
RAVE巡天的恒星大氣物理參數(shù)提取使用了DEGAS算法和MATISSE方法,最終估計精度約為σ(Teff)=150K,σ(logg)=0.30dex,σ([Fe/H])=0.12dex。該方法的原理是把輸入光譜投影到由訓(xùn)練集得到的幾個向量中[26]。而GAIA光譜的參數(shù)估計融合了MATISSE算法,DEGAS方法和GAUGUIN方法[27]。
α元素一般指的是化學(xué)元素 O,Mg,Si,Ca,and Ti。傳統(tǒng)的對α元素的測量一般使用高信噪比和高分辨率(R>20,000)的光譜,此時可以對每個α元素都做精確的測量。但由于獲取高分辨光譜需要較長的曝光時間,我們難以獲得足夠多的光譜樣本,以深入研究恒星的形成和化學(xué)增豐等問題。而目前獲得的海量的光譜都是中低分辨率的,為此,我們需要研究從中低分辨率的光譜中提取α元素的豐度。
Kirby等人使用模板匹配方法對中分辨率(R~6000)的波長覆蓋范圍為6300-9100?的光譜進行了α元素的豐度測量,最終的測量精度為0.05dex[28]。而為處理RAVE項目得到的波長覆蓋范圍為8410-8795?的分辨率為 R=7500的光譜,科學(xué)家開發(fā)了自動測量α元素豐度的程序,使用的是χ2匹配方法,最終的α元素估計精度在0.15dex 左右[29]。
為了從SDSS SEGUE發(fā)布的分辨率為R~2000的光譜中確定恒星的α元素的豐度,Lee等人開發(fā)了自動程序,通過構(gòu)建理論模板,使用模板匹配方法得到α元素的豐度[30]。通過與SDSS獲取的高分辨率的光譜的α元素的豐度進行對比,得到該方法的測量誤差為0.062dex。但該方法對貧金屬的冷巨星(Teff<4800K,logg<2.0,[Fe/H]<-2.5)的測量誤差較大。
卜育德等人研究了基于ELM算法的α元素豐度估計方法[31]。通過應(yīng)用ELM算法由ELODIE光譜構(gòu)建的不同信噪比、不同分辨率的光譜,證實該算法對信噪比和分辨率變化不敏感,且對低分辨率光譜的α豐度的估計精度約為0.10dex;通過與ANN、核回歸算法(KR)、支持向量回歸(SVR)算法等對比,顯示該算法精度和效率都比其他算法高。韓晨、李冀等人研究了基于模板匹配方法的LAMOST光譜的α元素豐度估計方法,精度約為Δ=0.13dex(σ=0.08dex)[32]。Ho et al.使用非線性回歸的方法估計了LAMOST光譜的α豐度,訓(xùn)練參數(shù)為APOGEE項目提供的α豐度,最終精度在0.05dex左右[33]。向茂盛等人使用核主成分分析(KPCA)方法估計了LAMOST恒星的α豐度,結(jié)果較好[34]。為了從SDSS和LAMOST光譜中搜尋貧α恒星、邢千帆等使用模板匹配方法估計α豐度[35,36].
我們把目前廣泛使用的α豐度估計方法及其特點總結(jié)在了表1里。
表1 中低分辨率光譜的α元素豐度估計方法Table 1 The method of estimating α elements abundance with low resolution spectrum
恒星大氣物理參數(shù)的估計一直是天文學(xué)家尤其是天文數(shù)據(jù)處理專家重點研究的領(lǐng)域。目前,有一些問題是天文學(xué)家在實際處理問題時重點關(guān)注的:
(1)如何產(chǎn)生和實測光譜類似的好的理論光譜模板庫是核心問題之一。現(xiàn)在的理論模板庫和實測光譜差距較大,這提高了精確估計恒星大氣物理參數(shù)的難度。目前一般的解決方法是使用高分辨率的光譜。但考慮到不同的巡天項目得到的光譜特征和波長覆蓋區(qū)間并不完全一致,因此這些光譜庫無法完全滿足需要。如果能產(chǎn)生和實測光譜類似的理論光譜,將會較好的解決這些問題。
(2)如何提高對某一類特殊恒星的估計精度是天文學(xué)家重點研究和關(guān)心的問題。比如,提高對貧金屬星的參數(shù)估計精度,將有助于我們快速搜尋貧金屬星并且分析貧金屬星的元素特征。
(3)如何對某一類特殊數(shù)據(jù)進行恒星大氣物理參數(shù)的估計。這類數(shù)據(jù)包括有缺失數(shù)據(jù)的光譜以及訓(xùn)練數(shù)據(jù)和光譜模板類型較少的數(shù)據(jù)。比如,MILES光譜庫包含的類型較少,一般情形下需要進行觀測以進一步擴充光譜庫。是否有機器學(xué)習(xí)的方法解決這類問題,是值得探討的。
[1]SDSS[EB/OL].http://www.sdss.org
[2]LAMOST[EB/OL].http://www.lamost.org
[3]RAVE[EB/OL].http://www.rave-survey.org/project/
[4]Bovy J,Rix H W,Hogg D W.The milky way has no distinct thick disk[J].ApJ,2012,751(2):633-1642.
[5]Jofre P,Weiss A.The age of the Milky Way halo stars from the Sloan Digital Sky Survey[J].A&A,2011,533(533):14-29.
[6]Zhang Lan,Rix H W,Ven GVD,et al.The gravitational potential near the sun from SEGUE K-dwarf kinematics[J].ApJ,2012,772(2):547-568.
[7]Ys Lee,TC Beers,T Sivarani et al.The SEGUE stellar parameter pipeline.I.Description and comparison of individual methods[J].AJ,2008,136(5):2022-2049.
[8]Luo A L,Zhao Y H,Zhao G,et al.The first data release(DR1)of the LAMOST regular survey[J].Research in Astronomy and Astrophysics,2015,15(8):1095-1124.
[9]Xiang M S,Liu X W,Yuan H B,et al.The LAMOST stellar parameter pipeline at Peking University-LSP3[J].Monthly Notices of the Royal Astronomical Society,2014,448(1):822-854.
[10]Bailerjones C A L.Stellar parameters from very low resolution spectra and medium band filters:Teff,logg and [M/H] using neural networks[J].Physics,2000,357(1):197-205.
[11]Fiorentin P R,Bailerjones C A L,Lee Y S,et al.Estimation of stellar atmospheric parameters from SDSS/SEGUE spectra[J].Astronomy & Astrophysics,2007,467(3):1373-1387.
[12]譚鑫,潘景昌,王杰,等.基于神經(jīng)網(wǎng)絡(luò)的線指數(shù)恒星大氣物理參數(shù)測量方法[J].光譜學(xué)與光譜分析,2013,33(6):1701-1705.
[13]潘儒揚,李鄉(xiāng)儒.基于深度學(xué)習(xí)技術(shù)的恒星大氣物理參數(shù)自動估計[J].天文學(xué)報,2016,57(4):379-388.
[14]張健楠,吳福朝,羅阿理.核回歸方法在恒星光譜物理參量自動估計中的應(yīng)用[J].光譜學(xué)與光譜分析,2009,29(4):1131-1136.
[15]Bu Yude and Pan Jingchang.Stellar atmospheric parameter estimation using Gaussian process regression[J].Monthly Notices of the Royal Astronomical Society,2015,447(1):256-265.
[16]王杰,潘景昌,譚鑫.基于線指數(shù)的核偏最小二乘回歸在恒星大氣物理參數(shù)測量中的應(yīng)用[J].光譜學(xué)與光譜分析,2014(3):833-837.
[17]Li X,Lu Y,Comte G,et al.Linearly Supporting Feature Extraction For Automated Estimation Of Stellar Atmospheric Parameters[J].Astrophysical Journal Supplement Series,2015,218.
[18]Lu Y,Li X.Estimating stellar atmospheric parameters based on LASSO and support-vector regression[J].Monthly Notices of the Royal Astronomical Society,2015,452(2):1394.
[20]Wang L,Wang W,Wu Y,et al.Calibration of LAMOST Stellar Surface Gravities Using the Kepler Asteroseismic Data[J].The Astronomical Journal,2016,152(1):6.
[21]Valentini M,Chiappini C,Davies G R,et al.RAVE stars in K2-I.Improving RAVE red giants spectroscopy using asteroseismology from K2 Campaign 1[J].arXiv:1609.03826,2016.
[22]YS Lee,TC Beers,T Sivarani,et al.The SEGUE stellar parameter pipeline.Ⅱ.Validation with galactic globular and open clusters[J].AJ,2007,136(5):2050-2069.
[23]CA Prieto,T sivarani,TC Beers,et al.The SEGUE stellar parameter pipeline.Ⅲ.Comparison with high-resolution spectroscopy of SDSS/SEGUE field stars[J].AJ,2007,136(5):2070-2082.
[24]JP smolinski,YS Lee,TC Beers,et al.The SEGUE stellar parameter pipeline.IV.Validation with an extended sample of galactic globular and open clusters[J].AJ,2011,141(3):2770-2791.
[25]吳悅.恒星光譜基本物理參數(shù)自動測量的實現(xiàn)及應(yīng)用[D].北京:中國科學(xué)院研究生院,2010.
[26]Kordopatis G,Gilmore G,Steinmetz M,et al.The Radial Velocity Experiment(RAVE):Fourth Data Release[J].The Astronomical Journal,2013,146(5),134,36 pp.
[27]Bailer-Jones C.A.L,Andrae R,Arcay B,et al.The Gaia astrophysical parameters inference system(Apsis).Pre-launch description [J].Astronomy & Astrophysics,2013,559,A74,1-20.
[28]Kirby E N,Guhathakurta P,Sneden C.Metallicity and Alpha-Element Abundance Measurement in Red Giant Stars from Medium Resolution Spectra[J].Astrophysical Journal,2008,682(2),1217-1233.
[29]Zwitter T,Siebert A,Munari U,et al.The Radial Velocity Experiment(RAVE):second data release[J].Astronomical Journal,2008,136(1),421-451.
[30]Lee Y S,Beers T C,Prieto C A,et al.The SEGUE Stellar Parameter Pipeline.V.Estimation of Alpha-element Abundance Ratios from Low-resolution SDSS/SEGUE Stellar Spectra[J].Astronomical Journal,2010,141(3),2770-2791.
[31]Bu Y,Zhao G,Pan J,et al.ELM:an Algorithm to Estimate the Alpha Abundance from Low-resolution Spectra[J].The Astrophysical Journal,2016,817(1):78.
[32]韓晨.基于低分辨率LAMOST恒星光譜估算α元素豐度[D].石家莊:河北師范大學(xué),2015.
[33]Ho A.Y.Q.et al.Survey Cross-Calibration with The Cannon:Apogee-scale Stellar Labels from Lamost Spectra.2016,arXiv,1602.00303.
[34]Xiang M S,Liu X W,Shi J R,et al.Estimating stellar atmospheric parameters,absolute magnitudes and elemental abundances from the LAMOST spectra with Kernel-based Principal Component Analysis[J].Monthly Notices of the Royal Astronomical Society,2016,464(3):3657-3678.
[35]Xing Q F,Zhao G,Zhang Y,et al.A search for Mg-poor stars using LAMOST survey data[J].Research in Astronomy and Astrophysics,2015,15(8):1275-1281.
[36]Xing Q F,Zhao G.Mining the Sloan Digital Sky Survey in Search of Extremely α-poor Stars in the Galaxy[J].The Astrophysical Journal,2014,790(1):33.
Automatic extraction of stellar atmospheric physical parameters in low resolution spectra
BU Yude
(School of Mathematics and Statistics,Shandong University,Weihai 264209,China)
The information of the stellar atmospheric parameters is important for us to study the structure and evolution of stars and the Galaxy.With the development of multi-object fiber spectroscopic telescope,the number of stellar spectra has greatly increased.However,it is difficult for us to extract stellar atmospheric parameters from these massive spectra data.To overcome this difficult,the astronomers have developed a series of new methods to extract the physical parameters of stars and the abundance ofαelements.In this paper,the main methods of extracting the stellar atmospheric parameter are summarized.
stellar atmospheric parameter;αabundance;linear regression.
1672-7010(2017)01-0030-06
2016-12-25
國家自然科學(xué)基金資助項目(U1431102,11603012);山東省青年基金項目(ZR2015AQ011);中國博士后
基金項目(2015M571124);山東大學(xué)青年學(xué)者未來計劃資助項目(2016WHWIJH09)
卜育德(1981-),男,山東人,副教授,博士,從事天文數(shù)據(jù)挖掘與處理研究;E-mail:buyude001@163.com
P152.1 < class="emphasis_bold">文獻標(biāo)志碼:A
A