張雙寒 王珊 王特
摘 ?要:畢星團(tuán)成員星的判定始終是天文學(xué)中一項(xiàng)重要的任務(wù)。文章根據(jù)依巴谷衛(wèi)星的觀測數(shù)據(jù)來判別畢星團(tuán)的成員星。在此問題中,根據(jù)畢星團(tuán)中心密度大,恒星數(shù)量多的特點(diǎn),采用DBSCAN密度聚類算法來判斷恒星是否屬于畢星團(tuán)成員星,由于三維聚類計(jì)算消耗較大,于是首先利用二維投影替代三維圖像。考慮到二維可能出現(xiàn)判斷重疊的現(xiàn)象,又對其他變量進(jìn)行聚類對結(jié)果進(jìn)行修正得到了最終的成員星組成和赫羅圖,結(jié)果顯示模型應(yīng)用性和準(zhǔn)確性能夠滿足要求。
關(guān)鍵詞: DBSCAN聚類;畢星團(tuán);視差法;赫羅圖
中圖分類號:TP391 ? ? ? ?文獻(xiàn)標(biāo)識碼:A文章編號:2096-4706(2021)24-0146-04
Abstract: It is always an important task in astronomy to determine the member stars of Hyades. Based on the observation data of Hipparcos, this paper discriminates the member stars of Hyades. In this problem, according to the characteristics of high density and large number of stars in the center of Hyades, the DBSCAN density clustering algorithm is adopted to judge whether the stars belong to the member stars of Hyades. Due to the high consumption of 3D clustering calculation, the two-dimensional projection is first used to replace 3D image. Considering that judgment overlap may occur in two dimensions, the final member star composition and Hertzsprung-Russell diagram are obtained by clustering other variables and revising the results. The results show that the applicability and accuracy of the model can meet the requirements.
Keywords: DBSCAN clustering; Hyades; parallax method; Hertzsprung-Russell diagram
0 ?引 ?言
天體測量學(xué)是天文學(xué)的一個(gè)重要分支,對于離地較近天體的測量,視差法是一種較為通用的方法。依巴谷衛(wèi)星(High Precision Parallax Collecting Satellite)全稱為“依巴谷高精度視差測量衛(wèi)星”,主要用于精確測量恒星的視差和自行,之后可以通過視差數(shù)據(jù)推斷出恒星距地球的距離。
畢星團(tuán)是位于金牛座的離地球最近的疏散星團(tuán),形狀近似球形,它大約有三百多個(gè)成員星,總質(zhì)量約為三百個(gè)太陽的質(zhì)量。而且其具有中心聚度高的特征,約有一半質(zhì)量位于半徑為6秒差距所形成的球內(nèi)[1]。根據(jù)依巴谷衛(wèi)星的高精度觀測數(shù)據(jù),可以了解到相關(guān)各星的距離以及運(yùn)動情況。其中已知恒星的視星等,赤經(jīng),赤緯,視差角,自行情況和色指數(shù)等參數(shù),分別解釋如下:
(1)視星等:指觀測者用肉眼看到的星體亮度,數(shù)值越小,亮度越高,其與絕對星等存在如下函數(shù)關(guān)系:
M=m+5-lgr ? ? ?(1)
其中:r為距離(秒差距);M為絕對星等;m為視星等;
(2)赤經(jīng),赤緯:指天體對應(yīng)于天球上的坐標(biāo);
(3)視差角:如下圖所示,指采用三角式差法測量恒星距離時(shí),三角形中對應(yīng)1Au邊的角度大小,如圖1所示;
(4)恒星自行:指恒星垂直于視向的運(yùn)動;
(5)色指數(shù):指同一個(gè)天體在任意兩個(gè)波段之內(nèi)的星等差;
(6)赫羅圖:是指以恒星的色指數(shù)作為橫坐標(biāo),以其絕對星等作為縱坐標(biāo)而作出的散布圖。
需要根據(jù)這些數(shù)據(jù)建立合理的數(shù)學(xué)模型,在數(shù)據(jù)中確認(rèn)畢星團(tuán)的成員星并繪制出畢星團(tuán)成員星的赫羅圖。
1 ?方法分析
從介紹中可以看出,從這些恒星中區(qū)分出屬于hyderite星團(tuán)的恒星是一個(gè)成員恒星識別問題。為了建立成員星的識別模型,需要知道以哪些物理性質(zhì)作為判斷依據(jù),然后用數(shù)學(xué)模型表示成員星與場星的區(qū)別,并對其進(jìn)行識別。
可以直接測量的恒星的物理性質(zhì)一般分為兩類:亮度和運(yùn)動。因此,目前的成員星識別方法主要分為光度法和運(yùn)動學(xué)[2]法。運(yùn)動學(xué)方法需要知道恒星的運(yùn)動數(shù)據(jù),如自走速度或徑向速度數(shù)據(jù),并做一些運(yùn)動學(xué)假設(shè)。例如,之前成熟的vasilevski-sanders方法[2]利用運(yùn)動學(xué)特征來識別開放星團(tuán)的成員。該方法需要在以下三個(gè)假設(shè)中應(yīng)用:
(1)天域內(nèi)的恒星僅分為兩部分:星團(tuán)成員星和場星;
(2)星團(tuán)和場星在各自的空間都滿足二元正態(tài)分布;
(3)用二維圓形正態(tài)分布函數(shù)擬合星團(tuán)成員星在自身空間的分布[2]。
雖然在實(shí)際應(yīng)用中會受到許多因素的影響,例如當(dāng)自精度較差或遠(yuǎn)低于場星時(shí),該方法的結(jié)果并不理想,經(jīng)常會出現(xiàn)一些誤差,但它仍然是一種成熟和應(yīng)用最廣泛的經(jīng)典模型。
在測光方法中,研究人員利用測光數(shù)據(jù)進(jìn)行經(jīng)驗(yàn)判斷,但對色幅圖的形狀很難建立嚴(yán)格的數(shù)學(xué)模型,因此測光數(shù)據(jù)往往得不到充分利用。根據(jù)上述方法中存在的問題,結(jié)合Hyderite集群的特點(diǎn),這是一個(gè)近似球形疏散星團(tuán),根據(jù)已知的數(shù)據(jù)[1],它有大約300成員恒星中央收斂和大約一半的高質(zhì)量位于范圍6秒差距。本文提出了利用DBACAN聚類模型來識別成員星的方法。高新華等[3]首次使用DBACAN方法分別確定開放星團(tuán)NGC 6971和NGC 2682的隸屬度,表明DBACAN聚類算法是一種有效的隸屬度確定方法,具有一些傳統(tǒng)隸屬度確定方法所不具備的優(yōu)點(diǎn)。由于三維聚類難以實(shí)現(xiàn),且計(jì)算量過大,本文首先將其簡化為二維問題。為了彌補(bǔ)二維聚類精度的不足,采用多場三維聚類的方法對結(jié)果進(jìn)行校正,最終得到畢星團(tuán)成員星的完整信息和赫羅圖。
2 ?模型假設(shè)
在本文工作中,對模型建立做出如下假設(shè):
(1)依巴谷衛(wèi)星觀測數(shù)據(jù)可靠精確;
(2)不考慮相對論效應(yīng);
(3)認(rèn)為三角視差法測距帶來的誤差對結(jié)果影響可以忽略。
3 ?定義與符號說明
文中涉及的定義與符號說明如表1所示。
4 ?模型建立與求解
4.1 ?數(shù)據(jù)預(yù)處理
4.1.1 ?誤差離群點(diǎn)檢測
從已有觀測數(shù)據(jù)中可以看到,有的數(shù)據(jù)存在著比較大的測量誤差,因此對整體數(shù)據(jù)做如下的離群點(diǎn)檢測,將檢測出的誤差偏離過大的離群點(diǎn)剔除,以保證判別星團(tuán)成員星的效果和精確性,如圖2所示。從圖中可得:所有數(shù)據(jù)誤差均值為1.627,絕大部分?jǐn)?shù)據(jù)集中在這附近,但有少數(shù)偏離過大,故將其篩選掉。
4.1.2 ?數(shù)據(jù)基本統(tǒng)計(jì)
由各個(gè)恒星的赤經(jīng),赤緯數(shù)據(jù),可得恒星在天球上的大致分布,首先以二維形式作圖,以赤經(jīng)為橫坐標(biāo),赤緯為縱坐標(biāo),得出分布如圖3所示。
從圖中可以看到,整體恒星分布較為均勻,某些位置較為稠密,初步判斷可能是屬于畢星團(tuán)的成員星。但實(shí)際上恒星的位置信息,二維并不足以表達(dá),需要根據(jù)視差角得到距離信息,它們之間有如下?lián)Q算關(guān)系:
x=rcos(DE)sin(RA) ? ?(2)
y=rcos(DE)sin(RA) ? ?(3)
z=rsin(DE)(4)
在三維坐標(biāo)軸中,以1秒差距為基本單位,將球坐標(biāo)系轉(zhuǎn)換為直角坐標(biāo)系,通過以上關(guān)系得到三個(gè)維度的信息,便得到如下的空間位置分布,如圖4所示。
接著同樣也對恒星的視星等信息和色指數(shù)進(jìn)行統(tǒng)計(jì),將其由低到高排序,得到如下分布,如圖5、6所示。
4.2 ?二維DBSCAN模型
DBSCAN算法是一種基于密度的聚類算法,它主要原理是通過統(tǒng)計(jì)每個(gè)點(diǎn)鄰域內(nèi)包含的點(diǎn)個(gè)數(shù)來確定該點(diǎn)的密度,不像VS方法這樣的參數(shù)方法需要對數(shù)據(jù)進(jìn)行模型假設(shè),因而它可以發(fā)現(xiàn)任意形狀的簇,另外,此算法也不需要復(fù)雜的數(shù)學(xué)計(jì)算,適用于高維數(shù)據(jù)的聚類,根據(jù)畢星團(tuán)中心密度集中,恒星數(shù)量分布多的特點(diǎn),可將恒星看作在空間中分布的點(diǎn),那么這種算法可以較好地將屬于畢星團(tuán)的點(diǎn)判別出來。
最近,天文學(xué)家逐漸意識到DBSCAN算法的潛力。Castro-ginard等人[4]提出了一種DBSCAN算法與神經(jīng)網(wǎng)絡(luò)相結(jié)合的方法來檢測開放的聚類成員。他們將該方法應(yīng)用于Tycho-Gaia Astrometric Solution (TGAS)[5]數(shù)據(jù),并通過GAIA-DR2中的光度數(shù)據(jù)驗(yàn)證了該方法的可靠性。
4.2.1 ?基本概念
(1)聚類:將某組數(shù)據(jù)的對象劃分為若干個(gè)子集的過程,劃分的每個(gè)子集是一個(gè)類或者簇,在同一類中的對象有著較高的相似度,反之,不同類之間的對象相似度較低;
(2)r鄰域:指以某一個(gè)點(diǎn)為圓心,以半徑為r畫圓所包含的范圍;
(3)MinPts:某個(gè)點(diǎn)的r鄰域內(nèi)所包含的點(diǎn)的數(shù)量閾值;
(4)核心對象:假如某個(gè)點(diǎn)所定義的密度達(dá)到算法設(shè)定的閾值,那么算法認(rèn)為其為核心點(diǎn);
(5)直接密度可達(dá):假如點(diǎn)a在點(diǎn)b的r鄰域內(nèi),且b是核心點(diǎn),則認(rèn)為a-b直接密度可達(dá)。
(6)密度可達(dá):假如有一個(gè)點(diǎn)的序列,對其中任意相鄰的兩個(gè)點(diǎn)直接密度可達(dá),則首尾點(diǎn)密度可達(dá)。
4.2.2 ?模型求解
由于DBSCAN模型對于輸入值極度敏感,不同的輸入值可能會使結(jié)果有著很大的差別,因此需要首先確定r和MinPts,在這里根據(jù)查閱的畢星團(tuán)相關(guān)資料,設(shè)定r為1.1秒差距,MinPts為6。根據(jù)之前得到的恒星的三維坐標(biāo)信息,將其投影到xoy,yoz,zox平面,分別進(jìn)行聚類,結(jié)果如圖7、8、9所示。
5 ?模型修正
畢星團(tuán)恒星和其它恒星不僅僅在空間位置上有所區(qū)別,在其他的信息上也會呈現(xiàn)出相關(guān)的特征,因此將其他信息也加以考慮,三維聚類分析并與前述結(jié)果對照修正得到三維聚類分析對比圖和以及赫羅圖,如圖10、11所示。
6 ?結(jié) ?論
本文根據(jù)畢星團(tuán)中心密度大,恒星數(shù)量多的特征,采用DBSCAN密度聚類算法來判斷恒星是否屬于畢星團(tuán)成員星,首先利用二維數(shù)據(jù)進(jìn)行聚類,但二維信息可能出現(xiàn)判斷重疊的現(xiàn)象,因此對其他變量進(jìn)行聚類得到了最終的成員星組成和赫羅圖,結(jié)果顯示模型應(yīng)用性和準(zhǔn)確性能夠滿足要求。
需要指出的是:DBSCAN算法在應(yīng)用中也有其無法滿足要求的地方, 如在確定疏散星團(tuán)成員時(shí),算法無法計(jì)算出每一顆恒星所具有的成員概率,而且DBACAN算法對已知測量數(shù)據(jù)的測量精度要求比較高,而且由于此算法的兩個(gè)輸入?yún)?shù)(Eps和MinPts)針對全局所有的數(shù)據(jù),那么當(dāng)數(shù)據(jù)集中或者數(shù)據(jù)分布不均勻時(shí),有些相對松散的簇可能在計(jì)算時(shí)會被遺漏掉。因此此方法仍在研究和完善當(dāng)中,之后將根據(jù)其缺點(diǎn)和不足對以上工作繼續(xù)完善和改正。
參考文獻(xiàn):
[1] CHUMAK Y O, RASTORGUEV A S,AARSET S J. Numerical Simulations of the Hyades Dynamics and the Nature of the Moving Hyades Cluster [J].Astronomy Letters,2005,31(5):308-314.
[2] 謝安琪,齊朝祥.星團(tuán)成員辨認(rèn)方法研究進(jìn)展 [J].天文學(xué)進(jìn)展,2018,36(1):17-28.
[3] 高新華,陳力,侯振杰.一種新的疏散星團(tuán)成員判定方法 [J].天文學(xué)報(bào),2013,54(5):439-446.
[4] GINARD A C,JORDI C,LURI X,et al. A new method for unveiling Open Clusters in Gaia: new nearby Open Clusters confirmed by DR2 [J/OL].arXiv:1805.03045 [astro-ph.GA].(2018-05-08).https://arxiv.org/abs/1805.03045.
[5] LINDEGREN L,LAMMERS U,BASTIAN U. Gaia Data Release 1 Astrometry:one billion positions,two million proper motions and parallaxes [J/OL].A&A,2016,595:A4[2021-09-24].https://doi.org/10.1051/0004-6361/201628714.
[6] 張會彥.衛(wèi)星光學(xué)測量方法與精密定軌研究 [D].西安:中國科學(xué)院研究生院(國家授時(shí)中心),2014.
[7] 許偉維,廖新浩,周永宏,等.天體測量法探測系外行星 [J].天文學(xué)報(bào),2016,57(4):422-436.
[8] 丁成宇.天體測量衛(wèi)星Gaia第二批數(shù)據(jù)中類星體天體測量性質(zhì)研究 [D].南京:南京大學(xué),2020.
[9] 雷偉偉,張捍衛(wèi),李凱.天體測量與空間科學(xué)中的時(shí)間尺度及其轉(zhuǎn)換 [J].飛行器測控學(xué)報(bào),2016,35(3):212-221.
[10] 金文敬.天體測量星表與巡天觀測的進(jìn)展 [J].天文學(xué)進(jìn)展,2009,27(3):247-269.
[11] 孫一鳴.疏散星團(tuán)的空間分布 [D].上海:上海師范大學(xué),2009.
[12] 高新華,王超,顧曉清,等.基于DBSCAN聚類算法的疏散星團(tuán)NGC 188的3維運(yùn)動學(xué)成員判定 [J].天文學(xué)報(bào),2017,58(5):67-74.
作者簡介:張雙寒(2000—),女,漢族,河北邢臺人,本科在讀,研究方向:深度學(xué)習(xí);王珊(2000—),女,漢族,河北保定人,本科在讀,研究方向:深度學(xué)習(xí);王特(2000—),男,漢族,河北廊坊人,本科在讀,研究方向:深度學(xué)習(xí)。