• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于深度學(xué)習(xí)的LAMOST光譜分類研究?

      2019-04-18 07:57:18許婷婷馬晨曄張靜敏周衛(wèi)紅
      天文學(xué)報(bào) 2019年2期
      關(guān)鍵詞:光譜分類深度

      許婷婷 馬晨曄 張靜敏 周衛(wèi)紅,3

      (1 云南民族大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院昆明650500)

      (2 云南農(nóng)業(yè)職業(yè)技術(shù)學(xué)院經(jīng)濟(jì)管理學(xué)院昆明650031)

      (3 中國科學(xué)院天體結(jié)構(gòu)與演化重點(diǎn)實(shí)驗(yàn)室昆明650011)

      1 引言

      伴隨著天文觀測儀器的問世,例如在SDSS (Sloan Digital Sky Survey)[1]、GAIA(Global Astrometric Interferometer for Astrophysics)[2]和LAMOST (Large Sky Area Multi-Object Fiber Spectroscopic Telescope)[3]等巡天項(xiàng)目中大量光譜數(shù)據(jù)也隨之產(chǎn)生.在這些已獲得的光譜數(shù)據(jù)中,有很多是光譜型未知或者是現(xiàn)有分類可信度低的光譜數(shù)據(jù),從這些光譜數(shù)據(jù)中獲得有價(jià)值的信息,提高LAMOST望遠(yuǎn)鏡的科學(xué)產(chǎn)出是非常有必要的,因此對這些光譜數(shù)據(jù)進(jìn)行分析研究是一項(xiàng)非常重要的工作.

      天體光譜處理主要是自動(dòng)地對光譜進(jìn)行分析與測量,抽取出光譜中所包含的各種物理信息,如視向速度、光譜型和紅移等,并實(shí)現(xiàn)光譜的測量、證認(rèn)和分類.鑒于LAMOST海量的光譜數(shù)據(jù),引入計(jì)算機(jī)程序進(jìn)行自動(dòng)或者半自動(dòng)的分析處理顯得尤為重要.

      隨著光譜觀測在天文上的廣泛開展,學(xué)者們對光譜分類的方法及在天文上的應(yīng)用進(jìn)行了大量研究.較早的有吳永東等[4]應(yīng)用空間選擇性濾波、多尺度形態(tài)濾波等技術(shù)對類星體光譜進(jìn)行識(shí)別.后來覃冬梅等[5?6]提出了兩種快速的恒星光譜型分類方法,一種是基于主成分分析方法利用最近鄰分類器構(gòu)建分類樹進(jìn)行光譜分類;另一種方法是結(jié)合主成分分析方法提出一種新的基于支撐矢量機(jī)的非活動(dòng)天體與活動(dòng)天體的自動(dòng)分類方法.Shi等[7]采用支持向量機(jī)(SVM)方法對星系的分類問題進(jìn)行了研究.趙瑞珍等[8]采用基于稀疏表示的方法進(jìn)行譜線自動(dòng)提取的研究.

      LAMOST巡天項(xiàng)目投入運(yùn)行之后,與美國的SDSS巡天項(xiàng)目相比較,LAMOST沒有配套的測光觀測,只有光譜數(shù)據(jù),在進(jìn)行自動(dòng)分類時(shí)不能借助色指數(shù),對分類識(shí)別增加了難度.雖然LAMOST的Pipeline對光譜進(jìn)行了初步的分類[9],但由于多種原因一些恒星的分類識(shí)別結(jié)果還不是十分理想.此后,Liu等[10]對LAMOST光譜的進(jìn)一步分類研究,發(fā)現(xiàn)由于巨星中B型以及早期的K型光譜與A型以及晚型的G型光譜非常相似導(dǎo)致分類困難,尚未解決的主要問題包括巨星中的OB、K,亞巨星支的A、G的分類精度非常低,分類識(shí)別方法和結(jié)果仍然有待完善.由以上分析可知,LAMOST光譜中還存在一些不能確定的類型或者分類可信度低的光譜數(shù)據(jù),針對這一問題,計(jì)劃將人工智能的最新成果用于光譜數(shù)據(jù)的分類識(shí)別中,即采用深度學(xué)習(xí)的方法對天體光譜數(shù)據(jù)進(jìn)行分類研究并結(jié)合天體物理理論進(jìn)行描述.

      深度學(xué)習(xí)概念起源于人工神經(jīng)網(wǎng)絡(luò),作為機(jī)器學(xué)習(xí)中的一個(gè)新領(lǐng)域由Hinton等人于2006年提出[11],通過對人腦機(jī)制的模仿來解釋圖像、文本和語音等數(shù)據(jù),訓(xùn)練和學(xué)習(xí)類似于人腦的神經(jīng)網(wǎng)絡(luò).微軟研究人員通過與Hinton合作,首先將深度學(xué)習(xí)中的受限玻爾茲曼機(jī)(Restricted Boltzmann Machine,RBM)[12]和深度信念網(wǎng)絡(luò)(Deep Belief Network,DBN)引入到語音識(shí)別模型中,在詞匯量較大的識(shí)別系統(tǒng)中效果具有明顯的提升,相比之前的語音識(shí)別錯(cuò)誤率下降了30%.由于深度學(xué)習(xí)的優(yōu)勢在于樣本越大分類精度越高,得益于LAMOST光譜數(shù)據(jù)的大樣本優(yōu)勢,有理由相信將深度學(xué)習(xí)方法應(yīng)用于LAMOST光譜數(shù)據(jù)的分類會(huì)取得較好結(jié)果.近期相關(guān)研究見Wang等[13]將深度神經(jīng)網(wǎng)絡(luò)方法應(yīng)用到光譜分類研究和缺陷譜恢復(fù)的研究中,潘濡揚(yáng)等[14?15]利用深度學(xué)習(xí)方法對恒星大氣物理參數(shù)自動(dòng)估計(jì)研究,因此相關(guān)研究工作值得進(jìn)一步開展.

      2 光譜數(shù)據(jù)和預(yù)處理

      大天區(qū)面積多目標(biāo)光纖光譜天文望遠(yuǎn)鏡LAMOST是一架視場為5?、橫臥于南北方向的中星儀式反射施密特望遠(yuǎn)鏡,也稱為郭守敬望遠(yuǎn)鏡,是當(dāng)今世界上光譜獲取率最高的天文望遠(yuǎn)鏡,最多可同時(shí)獲得4000個(gè)天體的光譜.截止2017年12月31日,包含先導(dǎo)巡天及正式巡天5 yr的LAMOST Data Release 5 (DR5)數(shù)據(jù)集正式發(fā)布,其中包括4154個(gè)觀測天區(qū),共發(fā)布了901萬條光譜,高質(zhì)量光譜數(shù)(信噪比>10)達(dá)到了777萬條,恒星參數(shù)534萬組,是世界上最大的、有傳承價(jià)值的天體光譜數(shù)據(jù)庫,為研究銀河系的形成和演化提供了基礎(chǔ)性數(shù)據(jù).

      實(shí)驗(yàn)中總共包含來自LAMOST DR5中的31667條光譜數(shù)據(jù),其中1667條F、G和K型光譜數(shù)據(jù)的信噪比大于20,樣本數(shù)據(jù)取自文獻(xiàn)[11],并在SIMBAD天文數(shù)據(jù)庫中證認(rèn)其Morgan-Keenan (MK)類別.另外考慮到1667條光譜數(shù)據(jù)樣本規(guī)模較小,為了體現(xiàn)深度信念網(wǎng)絡(luò)大樣本的優(yōu)勢,我們引入同樣來源于LAMOST DR5數(shù)據(jù)庫的30000條樣本,所選取的數(shù)據(jù)已被LAMOST Pipeline分為F、G和K 3種光譜型,每種類型的樣本均為10000條.同樣3種類型的光譜,與文獻(xiàn)[11]中的樣本不同之處在于后者對信噪比沒有進(jìn)行限制.為了驗(yàn)證數(shù)據(jù)標(biāo)注的準(zhǔn)確性,將其樣本在TOPCAT中與GAIA數(shù)據(jù)進(jìn)行了交叉,得到顏色-星等圖如圖1所示,其中3種顏色分別代表3種類型的光譜數(shù)據(jù),橫坐標(biāo)表示顏色,縱坐標(biāo)代表光譜數(shù)據(jù)的絕對星等值.

      圖1 樣本與GAIA數(shù)據(jù)交叉的顏色-星等圖Fig.1 The color-magnitude diagram of sample crossed with the GAIA data

      為了方便,我們將所有光譜數(shù)據(jù)樣本的維度統(tǒng)一調(diào)整為3909維.但值得注意的是,在不同波長下,流量頻譜變化很大,即原始數(shù)據(jù)不同維度的值差異很大.因此,為了降低其計(jì)算復(fù)雜度且不影響光譜分類精確率,需要對原始數(shù)據(jù)進(jìn)行歸一化處理,本文采用的歸一化方法是:min-max標(biāo)準(zhǔn)化,也稱為離差標(biāo)準(zhǔn)化,是對原始數(shù)據(jù)的線性變換,使結(jié)果映射到[0,1]之間.其轉(zhuǎn)換函數(shù)如下:

      其中,xnorm表示歸一化后得到的特征值,x為光譜數(shù)據(jù)對應(yīng)的每個(gè)特征值,xmax為每條光譜樣本數(shù)據(jù)的最大特征值,xmin為每條光譜樣本數(shù)據(jù)的最小特征值.

      3 深度信念網(wǎng)絡(luò)設(shè)計(jì)

      3.1 受限玻爾茲曼機(jī)的結(jié)構(gòu)

      受限玻爾茲曼機(jī)是一種特殊的玻爾茲曼機(jī),具有兩層結(jié)構(gòu)、對稱連接和無自反饋的特點(diǎn),它可用來作為基本模塊構(gòu)造自編碼器、深層信念網(wǎng)絡(luò)、深層玻爾茲曼機(jī)等許多其他深層模型,其結(jié)構(gòu)如圖2所示.

      圖2 受限玻爾茲曼機(jī)的結(jié)構(gòu)圖Fig.2 Structure diagram of the RBM

      由RBM層間有連接,層內(nèi)無連接的特殊結(jié)構(gòu)可看出:當(dāng)給定可見單元的狀態(tài)時(shí),各隱單元的激活狀態(tài)之間條件獨(dú)立.其中第1層稱為可視層,用于數(shù)據(jù)特征的輸入,另一層是隱含層,也就是特征提取層,W是可視層與隱含層之間的權(quán)重矩陣.

      3.2 深度信念網(wǎng)絡(luò)結(jié)構(gòu)

      深度信念網(wǎng)絡(luò)又譯為深層信念網(wǎng)絡(luò),由Hinton及其合作者在2006年提出[11],可以認(rèn)為它是一種多隱層的人工神經(jīng)網(wǎng)絡(luò),其結(jié)構(gòu)示意圖如圖3所示.其結(jié)構(gòu)由RBM堆疊構(gòu)造而成,其中的每一層RBM都可以單獨(dú)作為聚類器,可以用來對數(shù)據(jù)的概率分布進(jìn)行建模,也可以用來對數(shù)據(jù)進(jìn)行分類.DBN的神經(jīng)元可以分為顯性神經(jīng)元和隱性神經(jīng)元,顯性神經(jīng)元用于數(shù)據(jù)的輸入,隱性神經(jīng)元用于數(shù)據(jù)特征的提取.此外,DBN作為判別模型時(shí),深度信念網(wǎng)絡(luò)的學(xué)習(xí)過程更像自編碼器,在經(jīng)過受限玻爾茲曼機(jī)的逐層訓(xùn)練之后,直接再用反向傳播(Back propagation,BP)進(jìn)行有監(jiān)督的調(diào)優(yōu),無須睡醒算法的參與.

      圖3 深度信念網(wǎng)絡(luò)的結(jié)構(gòu)圖Fig.3 Structure diagram of the DBN

      DBN得益于模型本身的構(gòu)造其最主要的優(yōu)勢就是對數(shù)據(jù)特征的分層學(xué)習(xí),也就是對深度學(xué)習(xí)算法而言,本身結(jié)構(gòu)就具有良好的降維功能和性能,使得能夠從大數(shù)據(jù)中學(xué)習(xí)到合適且有效的特征.因此,在DBN結(jié)構(gòu)的構(gòu)造過程中,雖然不需要像傳統(tǒng)的分類算法一樣進(jìn)行顯示特征的提取,只是針對光譜數(shù)據(jù),也需要考慮相應(yīng)的DBN模型中各層網(wǎng)絡(luò)的選取和構(gòu)造,從而取得較好的特征學(xué)習(xí)能力和降維能力(在用傳統(tǒng)方法構(gòu)造光譜分類器時(shí),光譜特征的提取和選擇是非常重要的一項(xiàng)工作.可通過測量特征譜線的參量,例如譜線的線心深度、等值寬度、特征譜線最大相對強(qiáng)度、特征譜線的特征波長、特征譜線的輻射強(qiáng)度度量等作為特征,以降低光譜數(shù)據(jù)的維度).

      3.3 深度信念網(wǎng)絡(luò)的算法過程

      (1)DBN的預(yù)訓(xùn)練過程:分別對每一層RBM網(wǎng)絡(luò)進(jìn)行單獨(dú)無監(jiān)督訓(xùn)練,使其數(shù)據(jù)的特征在不同空間的映射過程中,都盡量保留光譜數(shù)據(jù)的特征信息.

      (2)DBN的微調(diào)過程:在DBN的結(jié)構(gòu)中,前面的每一層RBM網(wǎng)絡(luò)都只能使得自身層內(nèi)的權(quán)值對該層特征向量映射達(dá)到最優(yōu),并不是對整個(gè)DBN的特征向量映射達(dá)到最優(yōu).因此需要設(shè)置最后一層BP網(wǎng)絡(luò)層,將錯(cuò)誤的信息自頂向下傳播至每一層RBM層,再全局微調(diào)整個(gè)DBN網(wǎng)絡(luò),這樣的訓(xùn)練過程使DBN克服了BP網(wǎng)絡(luò)因隨機(jī)初始化權(quán)值參數(shù)而容易陷入局部最優(yōu)和時(shí)間復(fù)雜度高的問題.

      3.4 深度信念網(wǎng)絡(luò)模型的參數(shù)選擇

      DBN中RBM的層數(shù)越多對應(yīng)的學(xué)習(xí)次數(shù)也越多,獲得的學(xué)習(xí)效果隨之變好.這里我們采用分類精確率和時(shí)間復(fù)雜度兩個(gè)指標(biāo)來對模型進(jìn)行綜合評估,精確率的計(jì)算遵循以下計(jì)算方法:

      其中,A表示樣本數(shù)據(jù)得到的分類精確率,N為樣本個(gè)數(shù),yi和xi分別表示樣本的標(biāo)簽類別與模型輸出的類別.

      此外,由于我們采用的模型不需要設(shè)置學(xué)習(xí)控制參數(shù),比如步長和動(dòng)量的設(shè)置,只需要設(shè)置隱含層的節(jié)點(diǎn)個(gè)數(shù).為了確保結(jié)果的可靠性,所涉及到的DBN模型中參數(shù)設(shè)置均保持一致:輸入的光譜數(shù)據(jù)維度均為3909,RBM層數(shù)為3層,類別數(shù)為3類.其中,第1層RBM的可見元個(gè)數(shù)設(shè)置為500,第2層RBM的隱含層節(jié)點(diǎn)個(gè)數(shù)設(shè)置為500,第3層RBM的隱含層節(jié)點(diǎn)個(gè)數(shù)設(shè)置為2000,即DBN網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)分別為3909-500-500-2000-3.訓(xùn)練中迭代次數(shù)為200次,學(xué)習(xí)率為0.1.

      4 分類實(shí)驗(yàn)與結(jié)果分析

      與我們方法不同的是Liu等[10]采用27種線指數(shù)特征和支持向量機(jī)對LAMOST光譜數(shù)據(jù)進(jìn)行自動(dòng)分類研究(線指數(shù)是一個(gè)用譜線名稱命名的數(shù)值,用這個(gè)數(shù)值來代表光譜中的某些物理特征.它可以是光譜中某一段的積分星等,可以是某條譜線的等值寬度(EW)或者半高全寬(CFWHM),也可以是光譜中幾個(gè)線指數(shù)的組合),利用線指數(shù)來描述光譜特征,在對高維數(shù)據(jù)進(jìn)行降維時(shí)能夠較完整地保留光譜信息.在此基礎(chǔ)上,文章基于支持向量機(jī)進(jìn)行分類研究,結(jié)果顯示對G型光譜能夠被很好地分類,但對于F和K光譜分類效果并不十分理想.這可能有3個(gè)原因:

      (1)晚-F型和早-G型光譜,晚-G型和早-K型光譜的譜線特征很相似,在SVM中很難區(qū)分,見圖4和圖5;

      (2)所采用的27種線指數(shù)特征對于高維光譜而言特征提取可能不具有代表性,使得高維光譜數(shù)據(jù)的特征有所丟失;

      (3)從SIMBAD數(shù)據(jù)庫中采用的正確類是從多種文獻(xiàn)以及用肉眼分類收集到的數(shù)據(jù),彼此之間很難校準(zhǔn).

      圖4 晚-F型與早-G型星譜線特征圖Fig.4 Spectral lines feature of the late-F and early-G type

      圖5 晚-G型與早-K型星譜線特征圖Fig.5 Spectral lines feature of the late-G and early-K type

      本實(shí)驗(yàn)選取的DBN模型最大的優(yōu)勢在于對光譜數(shù)據(jù)特征的分層學(xué)習(xí)本身就具備降維功能,能夠很好地提取光譜數(shù)據(jù)的顯示特征,從而更好地進(jìn)行特征學(xué)習(xí)和分類實(shí)驗(yàn).基于以上樣本和分類模型進(jìn)行分類實(shí)驗(yàn),并將分類結(jié)果與Liu等[10]的結(jié)果進(jìn)行對比分析,結(jié)果見表1.

      表1 小樣本的分類結(jié)果比較Table 1 Comparison of classification results of small samples

      考慮到以上實(shí)驗(yàn)樣本數(shù)據(jù)較少,結(jié)果可能不具有代表性,而DBN模型的優(yōu)勢又在于樣本越大分類精確度越高.因此,我們引入了更具有代表性的大樣本,樣本總數(shù)為30000條光譜數(shù)據(jù),維度為3909,分別為F、G、K型.值得注意的是,除對數(shù)據(jù)進(jìn)行歸一化處理以外,未進(jìn)行其他預(yù)處理過程,且未限制光譜的信噪比值,樣本標(biāo)簽分別為1、2、3,且在實(shí)驗(yàn)中將樣本分為訓(xùn)練集和測試集,其中訓(xùn)練集27000條光譜,測試集3000條光譜.此外,Wang等[13]采用深度神經(jīng)網(wǎng)絡(luò)對同樣F、G、K 3種類型恒星光譜的分類結(jié)果進(jìn)行比較,樣本為30000條,對光譜信噪比沒有作限制.文章采用深度神經(jīng)網(wǎng)絡(luò)分類模型,節(jié)點(diǎn)設(shè)計(jì)為721-400-800-1200-2000-3,即有4個(gè)隱含層的分類器模型.可見在光譜數(shù)據(jù)保留721個(gè)特征的基礎(chǔ)上基于偽逆學(xué)習(xí)算法對光譜進(jìn)行分類實(shí)驗(yàn),分類精確率為0.819.本實(shí)驗(yàn)同樣采用深度學(xué)習(xí)模型,但與其不同的是深度信念網(wǎng)絡(luò)結(jié)構(gòu)由受限玻爾茲曼機(jī)堆疊而成,不需要對光譜進(jìn)行降維,應(yīng)用該模型對高維光譜數(shù)據(jù)的特征分層學(xué)習(xí)能力,盡可能保留有效特征以提升分類精確度.基于以上模型進(jìn)行分類實(shí)驗(yàn),并將所得結(jié)果同樣在TOPCAT中與GAIA數(shù)據(jù)交叉,得到的顏色-星等圖如圖6所示,且將分類精確度與文獻(xiàn)[11]進(jìn)行比較,結(jié)果見表2 (注:PILDNN是指基于偽逆學(xué)習(xí)算法的深度神經(jīng)網(wǎng)絡(luò),PILDNN*是指將每條光譜作為輸入向量時(shí)分為4個(gè)階段并基于偽逆學(xué)習(xí)算法的深度神經(jīng)網(wǎng)絡(luò)).

      表2 大樣本的分類結(jié)果比較Table 2 Comparison of classification results of large samples

      圖6 輸出結(jié)果的顏色-星等圖Fig.6 The color-magnitude diagram of output results

      本文采用DBN對F、G和K型恒星光譜進(jìn)行分類研究,由以上結(jié)果分析可知:當(dāng)樣本較小時(shí),3種類型的光譜在分類精確度上均有較大提升.在大樣本分類工作中,圖7、圖8和圖9分別是F、G和K型恒星光譜的輸入輸出顏色-星等圖.由此可知:采用DBN模型對F、G和K 3種類型的光譜進(jìn)行分類識(shí)別,在精確率上均有很大提升,尤其針對K型光譜而言,參考文獻(xiàn)中的精確度只達(dá)到0.52,但就該模型而言,采用分層學(xué)習(xí)特征的方法,盡可能地保留了光譜數(shù)據(jù)的顯著特征用于分類識(shí)別工作,得到的結(jié)果更具說服力.

      鑒于LAMOST巡天項(xiàng)目發(fā)布的大樣本數(shù)據(jù)優(yōu)勢,將DBN分類模型用于F、G、K 3種光譜數(shù)據(jù)中,由以上分析可以看出:

      圖7 F型光譜輸出類別的顏色-星等圖Fig.7 The color-magnitude diagram of the F-type stars output labels

      圖8 G型光譜輸出類別的顏色-星等圖Fig.8 The color-magnitude diagram of the G-type stars output labels

      圖9 K型光譜輸出類別的顏色-星等圖Fig.9 The color-magnitude diagram of the K-type stars output labels

      (1)DBN分類模型與其他算法相比較,該模型通過受限玻爾茲曼機(jī)分層學(xué)習(xí)、訓(xùn)練各個(gè)參數(shù)的權(quán)值,并根據(jù)目標(biāo)函數(shù)值經(jīng)誤差反饋對參數(shù)數(shù)值進(jìn)行微調(diào),使得對于天體光譜的總體分類精確率有明顯提升;

      (2)DBN模型充分體現(xiàn)了樣本越大,分類準(zhǔn)確率越高的優(yōu)勢.由于DBN結(jié)構(gòu)的特殊性,樣本越大,在訓(xùn)練過程中越能分層學(xué)習(xí)到更多有效的光譜特征信息,進(jìn)而提升分類準(zhǔn)確率;

      (3)DBN模型具有較強(qiáng)的學(xué)習(xí)能力,不需要對數(shù)據(jù)進(jìn)行降維處理,且精確率優(yōu)于降維處理后的效果.常見的分類算法(SVM、BP神經(jīng)網(wǎng)絡(luò)和終端學(xué)習(xí)機(jī)(ELM)等算法)往往存在陷入局部最優(yōu)或者過度學(xué)習(xí)的問題,為了避免維數(shù)災(zāi)難通常需要對數(shù)據(jù)做降維處理,因此得到的結(jié)果并不能很好地反映數(shù)據(jù)的總體特征,最終導(dǎo)致分類準(zhǔn)確率的下降.而DBN模型可以從高維的原始數(shù)據(jù)中提取差別較大的低維特征,不需要對數(shù)據(jù)進(jìn)行降維就可直接開始訓(xùn)練分類模型,不僅能夠更全面地考慮到光譜信息量,而且能夠較為準(zhǔn)確地對光譜數(shù)據(jù)進(jìn)行分類識(shí)別.

      5 總結(jié)與展望

      文章針對原有方法分類可信度較低的F、G、K 3種類型的恒星光譜,采用DBN進(jìn)行大樣本分類實(shí)驗(yàn),結(jié)果表明通過分層學(xué)習(xí)提取光譜數(shù)據(jù)特征的方法具有很好的魯棒性,且分類效果優(yōu)于其他分類模型.深度學(xué)習(xí)方法雖然在大樣本數(shù)據(jù)分類識(shí)別時(shí)具有較大優(yōu)勢,但是該方法計(jì)算量巨大,對計(jì)算資源具有較高要求,因此,還需要優(yōu)化算法以解決計(jì)算復(fù)雜度高的問題.在接下來的工作中,我們會(huì)繼續(xù)選取分類精度低或光譜型未知的光譜作為分類搜尋的候選體,采用DBN模型輸出分層學(xué)習(xí)得到的特征,與專家選擇的特征進(jìn)行比較,進(jìn)而分析模型的有效性.此外,本文所采用的有監(jiān)督學(xué)習(xí)都是基于強(qiáng)標(biāo)簽標(biāo)記的數(shù)據(jù),后續(xù)工作中我們將搜尋弱標(biāo)簽樣本,采用該模型進(jìn)行研究.并在此基礎(chǔ)上,我們也將繼續(xù)采用聚類分析和離群點(diǎn)分析,對特殊天體進(jìn)行觀測證認(rèn),進(jìn)一步完備各型巨星樣本.除此之外,還計(jì)劃采用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則挖掘方法,嘗試發(fā)現(xiàn)各類已知和未知的天體光譜之間的聯(lián)系,進(jìn)一步揭示尚未被發(fā)現(xiàn)的天體物理規(guī)律,研究成果可以為銀河系結(jié)構(gòu)和動(dòng)力學(xué)研究提供更好的支持.

      猜你喜歡
      光譜分類深度
      基于三維Saab變換的高光譜圖像壓縮方法
      分類算一算
      深度理解一元一次方程
      分類討論求坐標(biāo)
      深度觀察
      深度觀察
      深度觀察
      數(shù)據(jù)分析中的分類討論
      教你一招:數(shù)的分類
      星載近紅外高光譜CO2遙感進(jìn)展
      常宁市| 郧西县| 玛曲县| 石家庄市| 桐庐县| 太仓市| 东乌| 建昌县| 丰城市| 濮阳市| 乡城县| 新蔡县| 东兰县| 房产| 乌鲁木齐市| 沾化县| 浦北县| 临邑县| 电白县| 屏东市| 运城市| 嘉兴市| 瓦房店市| 桃园市| 长岛县| 昔阳县| 元谋县| 合江县| 蒙山县| 厦门市| 正蓝旗| 陕西省| 安乡县| 涟源市| 梨树县| 吉木萨尔县| 孝昌县| 太原市| 武穴市| 中山市| 台东县|