• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于數(shù)據(jù)挖掘方法的空間大氣模型修正

      2019-01-14 06:46:32廖川白雪徐明
      關(guān)鍵詞:決策樹數(shù)據(jù)挖掘軌道

      廖川, 白雪, 徐明

      (北京航空航天大學(xué)宇航學(xué)院, 北京 100083)

      數(shù)據(jù)挖掘(又稱從數(shù)據(jù)中發(fā)現(xiàn)知識(shí))起源于20世紀(jì)80年代后期,在20世紀(jì)90年代有了突飛猛進(jìn)的發(fā)展,數(shù)據(jù)挖掘提供了發(fā)現(xiàn)隱藏在大型數(shù)據(jù)集中的模式的技術(shù),關(guān)注可行性、有用性、有效性和可伸縮性問題[1]。大數(shù)據(jù)指的是以不同形式存在于數(shù)據(jù)庫(kù)、網(wǎng)絡(luò)等媒介上蘊(yùn)含豐富信息的規(guī)模巨大的數(shù)據(jù)。大數(shù)據(jù)是一個(gè)寬泛的概念,其基本特征可以用4個(gè)V(Volume、Variety、Value和Velocity)來總結(jié),隨著大數(shù)據(jù)的發(fā)展,也有演變成5個(gè)甚至6個(gè)V(Volume、Variety、Value、Velocity、Veracity和Variability)的趨勢(shì)[2]。

      近年來,隨著各行業(yè)從業(yè)人員和產(chǎn)品的開發(fā)應(yīng)用,數(shù)據(jù)挖掘技術(shù)得到了長(zhǎng)足的發(fā)展。例如:金融證券行業(yè)利用大數(shù)據(jù)預(yù)測(cè)股票價(jià)格的波動(dòng)和走勢(shì),分析用戶投資習(xí)慣;電力行業(yè)利用大數(shù)據(jù)進(jìn)行電力負(fù)載情況的統(tǒng)計(jì),加強(qiáng)分時(shí)分流管理;互聯(lián)網(wǎng)行業(yè)利用大數(shù)據(jù)挖掘上網(wǎng)用戶的使用習(xí)慣,為用戶推薦相應(yīng)優(yōu)質(zhì)內(nèi)容。而在航天領(lǐng)域,國(guó)內(nèi)外也有相當(dāng)多的學(xué)者進(jìn)行了深入研究。

      Chen等[3]站在數(shù)據(jù)庫(kù)研究人員的角度,對(duì)數(shù)據(jù)挖掘技術(shù)做出了綜合性闡述,調(diào)查各類數(shù)據(jù)挖掘新技術(shù),包括挖掘關(guān)聯(lián)規(guī)則的Apriori算法、數(shù)據(jù)立方體方法、基于決策樹(Decision Tree,DT)的數(shù)據(jù)分類方法等內(nèi)容。Tanner等[4]提出了星上數(shù)據(jù)挖掘的概念,將傳感器數(shù)據(jù)進(jìn)行星上處理,可以提升網(wǎng)絡(luò)通信能力,并降低成本,可適用于無人自主航天器、火星表面測(cè)繪衛(wèi)星、生物識(shí)別系統(tǒng)等。Sánchez-Sánchez等[5]通過大數(shù)據(jù)和神經(jīng)網(wǎng)絡(luò)(Neural Network,NN)學(xué)習(xí)連續(xù)確定非線性系統(tǒng)的狀態(tài)反饋?zhàn)顑?yōu)控制問題,利用深度神經(jīng)網(wǎng)絡(luò)對(duì)最優(yōu)控制問題生成的軌道進(jìn)行有監(jiān)督學(xué)習(xí)。最終利用得到的神經(jīng)網(wǎng)絡(luò)求解Hamilton-Jacobi-Belman方程,借此直接在星上實(shí)時(shí)生成近優(yōu)控制行為。Hennes等[6]考慮航天器在主帶小行星間的小推力最優(yōu)轉(zhuǎn)移問題,針對(duì)相位值、最大初始質(zhì)量和最大最終質(zhì)量,采用計(jì)算智能技術(shù)(包括分解框架的多目標(biāo)進(jìn)化算法、超體積指標(biāo)和機(jī)器學(xué)習(xí)回歸),分別對(duì)3個(gè)目標(biāo)函數(shù)進(jìn)行最優(yōu)設(shè)計(jì)。

      李德仁等[7]分析了空間數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)(Spatial Data Mining and Knowledge Discovery,SDMKD)的內(nèi)涵和外延,利用SDMKD從空間數(shù)據(jù)庫(kù)中自動(dòng)或半自動(dòng)地挖掘事先未知卻潛在有用的空間模式。宮輝力等[8]針對(duì)國(guó)內(nèi)缺乏對(duì)海量衛(wèi)星遙感數(shù)據(jù)的有效數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)技術(shù),設(shè)計(jì)了一種面向地學(xué)應(yīng)用的衛(wèi)星多源遙感圖像數(shù)據(jù)挖掘系統(tǒng)框架和原型。Peng和Bai[9]針對(duì)空間目標(biāo)編錄中通常缺失的面質(zhì)比信息,利用隨機(jī)森林(Random Forest,RF)方法學(xué)習(xí)一致性誤差和面質(zhì)比間的關(guān)系,從而確定空間目標(biāo)的面質(zhì)比類型。

      異常檢測(cè)與模式挖掘作為數(shù)據(jù)挖掘的一個(gè)重要分支,也逐漸成為研究熱點(diǎn)方向。胡小平等[10]分析了液體火箭發(fā)動(dòng)機(jī)的工作和故障特點(diǎn),提出利用數(shù)據(jù)挖掘方法從數(shù)據(jù)倉(cāng)庫(kù)的角度對(duì)液體火箭發(fā)動(dòng)機(jī)進(jìn)行故障檢測(cè)和診斷的策略。徐宇航和皮德常[11]為了及時(shí)發(fā)現(xiàn)衛(wèi)星故障情況并提取異常模式,提出一種基于PrefixSpan算法,對(duì)衛(wèi)星異常數(shù)據(jù)集進(jìn)行模式挖掘。肇剛和李言俊[12]研究時(shí)間序列數(shù)據(jù)挖掘技術(shù)現(xiàn)狀,提出一種基于時(shí)間序列數(shù)據(jù)挖掘的航天器故障診斷方法,包括7個(gè)步驟:確定診斷對(duì)象、遙測(cè)數(shù)據(jù)選取、數(shù)據(jù)再處理、時(shí)間序列特征表示、數(shù)據(jù)挖掘方法執(zhí)行、挖掘結(jié)果的解釋與評(píng)估、軟件系統(tǒng)開發(fā)。對(duì)促進(jìn)航天器故障診斷技術(shù)的發(fā)展和完善有重要意義。

      某型號(hào)衛(wèi)星是一顆典型的低軌衛(wèi)星,在其軌道預(yù)報(bào)和實(shí)際運(yùn)行中,大氣阻力是最主要的非保守力。本文基于以上現(xiàn)狀,將利用基于決策樹的隨機(jī)森林方法、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(Support Vector Machine,SVM)這3類數(shù)據(jù)挖掘的方法,學(xué)習(xí)大氣阻力在不同誤差情況下導(dǎo)致的軌道預(yù)報(bào)的偏差,借此對(duì)所使用的大氣模型進(jìn)行修正,并評(píng)估3種方法的修正性能,以及給出方法間的對(duì)比。本文的創(chuàng)新點(diǎn)如下:1)針對(duì)有監(jiān)督學(xué)習(xí)方法需要先驗(yàn)類標(biāo)簽的問題,利用2種不同精度的軌道預(yù)報(bào)模型作為仿真環(huán)境,產(chǎn)生訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)。2)采用了大數(shù)據(jù)處理技巧中的3種數(shù)據(jù)挖掘方法與傳統(tǒng)數(shù)理統(tǒng)計(jì)方法相比,具有快速處理大數(shù)據(jù)集(本文中數(shù)據(jù)點(diǎn)達(dá)到18萬左右,甚至更多)、能夠挖掘隱藏在軌道預(yù)報(bào)微小誤差中的潛在信息等優(yōu)勢(shì),驗(yàn)證了數(shù)據(jù)挖掘方法的應(yīng)用可行性,為未來在實(shí)際運(yùn)行環(huán)境下進(jìn)一步修正大氣模型提供參考。

      1 軌道動(dòng)力學(xué)模型

      高精度軌道預(yù)報(bào)需要對(duì)空間環(huán)境進(jìn)行精確建模,軌道預(yù)報(bào)的主要攝動(dòng)因素包括地球引力、太陽引力、太陽光壓和大氣阻力。首先,對(duì)各攝動(dòng)因素進(jìn)行了精確的數(shù)學(xué)建模;然后,提出2種軌道動(dòng)力學(xué)模型,作為軌道預(yù)報(bào)和產(chǎn)生訓(xùn)練數(shù)據(jù)的基礎(chǔ)。

      1.1 高階地球引力場(chǎng)

      根據(jù)參考文獻(xiàn)[13]給出的相關(guān)內(nèi)容,地球引力勢(shì)可以寫成

      (1)

      式中:

      (2)

      GMe為地球引力常數(shù),G為萬有引力常數(shù),Me為地球質(zhì)量;r為地心固連坐標(biāo)系中的航天器位置矢量;φ和λ分別為航天器的地心緯度和地心經(jīng)度;Re為地球的赤道半徑;Pnm為n階m次締合勒讓德多項(xiàng)式;Cnm和Snm分別為相應(yīng)的重力勢(shì)系數(shù)。

      這種形式的引力場(chǎng)模型可以擴(kuò)展至任意階次,而不僅僅限制在帶諧項(xiàng),因此可以用以精確描述地球引力場(chǎng)。

      (3)

      式中:

      (4)

      式(1)~式(4)得到的是地心固連坐標(biāo)系中的加速度,為統(tǒng)一各攝動(dòng)加速度,后文所有其他加速度也將轉(zhuǎn)換到地心固連坐標(biāo)系下,如式(5)所示:

      (5)

      式中:U(t)為坐標(biāo)轉(zhuǎn)換矩陣,用以刻畫地球自轉(zhuǎn),實(shí)際計(jì)算中還需考慮歲差和章動(dòng)效應(yīng);r為航天器位置矢量,下標(biāo)e和s分別表示地心固連坐標(biāo)系和空間固定坐標(biāo)系。

      1.2 非地球引力攝動(dòng)

      太陽引力引起的攝動(dòng)加速度可在地心慣性坐標(biāo)系下表示為

      (6)

      式中:ri和s分別為航天器和太陽的地心坐標(biāo);MS為太陽的質(zhì)量。

      由于太陽輻射光壓導(dǎo)致的攝動(dòng)加速度可以表示為

      (7)

      式中:PS為太陽輻射壓;1 AU為一個(gè)天文單位,1 AU=1.496×108km;rS為太陽地心矢量;n為航天器表面的單位法線矢量,A為航天器的迎風(fēng)面積;eS為太陽方向單位矢量;θ為矢量n和矢量eS間的夾角;ε為航天器所用材料的反射率。衛(wèi)星在運(yùn)行過程中,由于存在太陽光遮擋的問題,本文在進(jìn)行軌道預(yù)報(bào)的過程中,將采用參考文獻(xiàn)[14]中的地影預(yù)報(bào)算法,計(jì)算衛(wèi)星當(dāng)前是否處于地影區(qū),從而判斷當(dāng)前狀態(tài)是否存在太陽光壓攝動(dòng)。

      對(duì)于低軌衛(wèi)星而言,大氣阻力是最主要的非保守力。大氣阻力引起的攝動(dòng)加速度可表示為

      (8)

      式中:CD為阻力系數(shù);m為航天器質(zhì)量;ρ為航天器所處位置的大氣密度,本文采用MSISE86大氣密度模型[15];vr為航天器相對(duì)于大氣的速度;ev為相對(duì)速度的單位矢量,即ev=vr/vr。

      1.3 精確模型和誤差簡(jiǎn)化模型

      1.1節(jié)和1.2節(jié)已經(jīng)給出了航天器軌道動(dòng)力學(xué)模型,該模型可以用于航天器軌道預(yù)報(bào)。為產(chǎn)生分類器的訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù),本節(jié)將給出2種模型,精確模型將作為航天器軌道預(yù)報(bào)的基準(zhǔn),模擬航天器在軌“真實(shí)”情況;不同的誤差模型將人為對(duì)大氣模型施加誤差,從工程實(shí)踐角度出發(fā),CD(A/m)ρ可以被視作一個(gè)阻力系數(shù)CS,因此本文實(shí)際上是對(duì)CS進(jìn)行修正,因此式(8)在誤差簡(jiǎn)化模型中可寫成如下形式:

      (9)

      通過精確模型產(chǎn)生的軌道,與誤差簡(jiǎn)化模型產(chǎn)生的軌道的各項(xiàng)數(shù)據(jù)差值,即可作為分類器的訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)。2種模型具體的參數(shù)設(shè)置由表1所示。

      表1 精確模型與誤差簡(jiǎn)化模型參數(shù)Table 1 Parameters of accurate model and error simplified model

      2 數(shù)據(jù)挖掘方法

      數(shù)據(jù)挖掘能夠從大量雜亂的數(shù)據(jù)中挖掘出有價(jià)值的信息,但是其過程是相當(dāng)復(fù)雜的。針對(duì)本文的研究?jī)?nèi)容及數(shù)據(jù)的特性,本節(jié)將介紹3種分類方法,利用這3種分類方法就能夠?qū)W習(xí)第1節(jié)得到的訓(xùn)練數(shù)據(jù),并通過測(cè)試數(shù)據(jù)對(duì)3種分類方法進(jìn)行準(zhǔn)確度檢驗(yàn)。

      2.1 決策樹與隨機(jī)森林

      決策樹又稱分類樹,是應(yīng)用最為廣泛的分類方法之一。如圖1所示,決策樹是一種監(jiān)督學(xué)習(xí)方法,通過不斷地劃分?jǐn)?shù)據(jù),使依賴變量的差別最大,最終目的是將數(shù)據(jù)分類到不同的組織或不同的分枝,在依賴變量的基礎(chǔ)上建立最強(qiáng)的歸類,其訓(xùn)練結(jié)果是類似流程圖的樹結(jié)構(gòu)。

      但是決策樹是一種“貪心算法”,在應(yīng)用過程中,每一步的判斷,僅是針對(duì)當(dāng)前測(cè)試做出最優(yōu)選擇,并不考慮全局結(jié)果。如果將多棵樹以某種關(guān)系結(jié)合起來,對(duì)數(shù)據(jù)進(jìn)行分類,以解決單一決策樹泛化能力弱的缺點(diǎn),這就是隨機(jī)森林。

      圖1 決策樹Fig.1 Decision tree

      隨機(jī)森林實(shí)際上是套袋法與決策樹的結(jié)合,如圖2所示,隨機(jī)森林的隨機(jī)性體現(xiàn)在:

      1) 從樣本中隨機(jī)選擇n個(gè)樣本。

      2) 從所有屬性中隨機(jī)選擇k個(gè)屬性。

      3) 選擇最佳分割屬性作為節(jié)點(diǎn)建立決策樹;

      4) 以上步驟重復(fù)j次,即得到j(luò)棵決策樹,進(jìn)而完成隨機(jī)森林訓(xùn)練。

      5) 分類問題中,通過投票決定數(shù)據(jù)的類別?;貧w問題中,由j棵決策樹預(yù)測(cè)結(jié)果的均值作為最后的預(yù)測(cè)結(jié)果。

      隨機(jī)森林的優(yōu)點(diǎn)很多,對(duì)于多種數(shù)據(jù),隨機(jī)森林可以產(chǎn)生高精度的分類器;建造森林時(shí),隨機(jī)森林可以在內(nèi)部對(duì)于一般化后的誤差產(chǎn)生不偏差的估計(jì);在決定類別時(shí),可以評(píng)估變數(shù)的重要性等等。當(dāng)然隨機(jī)森林的缺點(diǎn)也是顯而易見的,因?yàn)橐?xùn)練m棵決策樹,其訓(xùn)練過程會(huì)是訓(xùn)練單棵決策樹的數(shù)倍。

      圖2 隨機(jī)森林Fig.2 Random forest

      2.2 神經(jīng)網(wǎng)絡(luò)

      神經(jīng)網(wǎng)絡(luò)是應(yīng)用類似于人腦神經(jīng)突觸連接的結(jié)構(gòu)進(jìn)行信息處理的數(shù)學(xué)模型。在早期對(duì)人腦的理解中,人腦主要由稱為神經(jīng)元的神經(jīng)細(xì)胞組成,神經(jīng)元通過軸突的纖維絲連接在一起,當(dāng)一個(gè)神經(jīng)元受到刺激時(shí),神經(jīng)脈沖通過軸突從一個(gè)神經(jīng)元傳遞到另一個(gè)神經(jīng)元。一個(gè)神經(jīng)元通過樹突連接到其他神經(jīng)元的軸突,樹突是神經(jīng)元的延伸物。樹突與軸突之間的連接點(diǎn)叫做神經(jīng)鍵。人腦通過在同一脈沖反復(fù)刺激下改變神經(jīng)元之間的神經(jīng)鍵連接強(qiáng)度來進(jìn)行學(xué)習(xí)。類似于人腦的結(jié)構(gòu),神經(jīng)網(wǎng)絡(luò)也是由一組相互連接的節(jié)點(diǎn)和有向鏈構(gòu)成。

      圖3 神經(jīng)網(wǎng)絡(luò)感知器Fig.3 Neural network perceptron

      圖3為神經(jīng)網(wǎng)絡(luò)最簡(jiǎn)單的模型——感知器,包含多個(gè)輸入節(jié)點(diǎn)、一個(gè)輸出節(jié)點(diǎn),節(jié)點(diǎn)即是神經(jīng)元。在感知器中,每個(gè)輸入節(jié)點(diǎn)通過一個(gè)加權(quán)的鏈連接到輸出節(jié)點(diǎn),該加權(quán)鏈用以模擬神經(jīng)元之間神經(jīng)鍵的連接強(qiáng)度,如人腦一樣,訓(xùn)練一個(gè)感知器就是不斷調(diào)整鏈的權(quán)值,直到能擬合出輸入輸出間的關(guān)系為止。

      本文將采用前饋負(fù)向傳播神經(jīng)網(wǎng)絡(luò),前饋是指:每一層的神經(jīng)元僅與前一層連接,且輸出給下一層,各層之間沒有反饋,不對(duì)網(wǎng)絡(luò)的參數(shù)進(jìn)行調(diào)整。負(fù)向傳播是指:誤差會(huì)進(jìn)行方向傳播,用以調(diào)整權(quán)值和閾值。至少含有一個(gè)隱藏層的多層神經(jīng)網(wǎng)絡(luò)可以用來擬合任何目標(biāo)函數(shù),且可以處理冗余特征,但是神經(jīng)網(wǎng)絡(luò)對(duì)于噪聲十分敏感,訓(xùn)練過程也很耗時(shí)。

      2.3 支持向量機(jī)

      支持向量機(jī)是建立在統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上的機(jī)器學(xué)習(xí)方法。支持向量機(jī)通過構(gòu)建分割多類的超平面,在構(gòu)建過程中,會(huì)試圖將多類之間的分割達(dá)到最大化(如圖4所示)。

      支持向量機(jī)的理論包括3個(gè)要點(diǎn):最大化間距、對(duì)偶理論和核函數(shù)?!白畲蠡g距”實(shí)際上是一個(gè)優(yōu)化問題,該優(yōu)化問題,可以利用拉格朗日對(duì)偶理論變換到對(duì)偶變量的優(yōu)化問題。然而在輸入空間中,數(shù)據(jù)可能是不可分的,支持向量機(jī)就需要通過非線性映射,將數(shù)據(jù)映射到某個(gè)其他點(diǎn)積空間。本文所使用的支持向量機(jī)將采用高斯核函數(shù):

      (10)

      式中:X為空間中任一點(diǎn);Y為核函數(shù)中心;σ為函數(shù)的寬度參數(shù)。高斯核函數(shù)對(duì)于噪聲有著較好的抗干擾能力,但是其參數(shù)決定了函數(shù)作用范圍,超過了這個(gè)范圍,數(shù)據(jù)的作用就“基本消失”。

      圖4 支持向量機(jī)分類方法示意圖Fig.4 Schematic diagram of classification method of SVM

      3 分類器訓(xùn)練與評(píng)估

      首先,將利用第1節(jié)提出的2種軌道動(dòng)力學(xué)模型進(jìn)行軌道預(yù)報(bào),并生成訓(xùn)練數(shù)據(jù);然后,將訓(xùn)練數(shù)據(jù)導(dǎo)入第2節(jié)中介紹的各分類方法,進(jìn)行適當(dāng)參數(shù)調(diào)整后完成訓(xùn)練。

      某型號(hào)衛(wèi)星是中國(guó)第一代傳輸型立體測(cè)繪衛(wèi)星,于2010年8月24日發(fā)射成功,其軌道高度為500 km左右,運(yùn)行過程中,大氣阻力對(duì)其造成較大的軌道衰減。因此本節(jié)將以該衛(wèi)星在軌實(shí)際狀態(tài)作為軌道預(yù)報(bào)起點(diǎn),從而生成一系列訓(xùn)練數(shù)據(jù)。

      3.1 訓(xùn)練數(shù)據(jù)生成

      仿真起始時(shí)刻為2016年5月31日21:07:05,衛(wèi)星真實(shí)在軌狀態(tài)如表2所示,其中:a為半長(zhǎng)軸;e為偏心率;i為軌道傾角;Ω為升交點(diǎn)赤經(jīng);ω為近地點(diǎn)幅角;M為平近點(diǎn)角;rx、ry、rz為衛(wèi)星在慣性系下的位置三軸分量;vx、vy、vz為衛(wèi)星在慣性系下的速度三軸分量。

      表2 仿真初始狀態(tài)Table 2 Initial state of simulation

      向后進(jìn)行1 d軌道預(yù)報(bào)可以得到多條衛(wèi)星軌道,預(yù)報(bào)間隔為10 s,每一個(gè)點(diǎn)都對(duì)應(yīng)一定時(shí)間后由25個(gè)變量組成的衛(wèi)星在軌狀態(tài)Xi:

      (11)

      式中:Δt為該點(diǎn)的預(yù)報(bào)時(shí)長(zhǎng);前標(biāo)Δ表示誤差簡(jiǎn)化模型與精確模型間的差值;下標(biāo)i表示該組狀態(tài)的編號(hào)。

      因此可以得到181 440組衛(wèi)星的在軌狀態(tài),且每一組狀態(tài)都對(duì)應(yīng)一個(gè)人為施加在大氣模型上的誤差值εi,即可以得到181440個(gè)樣本數(shù)據(jù)及其類別屬性的組合[Xiεi]作為訓(xùn)練數(shù)據(jù),訓(xùn)練數(shù)據(jù)的如表3所示。

      由表3可以看出,不同誤差值的模型進(jìn)行軌道預(yù)報(bào),得到的在軌狀態(tài)數(shù)據(jù)相差很小,無法用傳統(tǒng)方法得到這些值與誤差值間的關(guān)系,更無法通過這些值準(zhǔn)確得到誤差值大小,因此本文采用數(shù)據(jù)挖掘的技巧,對(duì)以上數(shù)據(jù)進(jìn)行處理、分類,這也是本文的創(chuàng)新點(diǎn)之一。

      3.2 分類器訓(xùn)練

      將3.1節(jié)得到的訓(xùn)練數(shù)據(jù)導(dǎo)入各分類模型,并適當(dāng)設(shè)置參數(shù),即可完成分類器訓(xùn)練的初始化。各分類模型的訓(xùn)練參數(shù)設(shè)置如表4~表6所示。

      3.3 訓(xùn)練結(jié)果與評(píng)估

      隨機(jī)森林方法分類結(jié)果如圖5所示,橫坐標(biāo)為181 440組狀態(tài)的編號(hào),縱坐標(biāo)為該組狀態(tài)對(duì)應(yīng)的大氣模型誤差值。因?yàn)殡S機(jī)森林的訓(xùn)練和預(yù)測(cè)中采用投票機(jī)制決定最終結(jié)果,所以圖5(b)的結(jié)果是通過選擇圖5(a)的最大概率取值得到的。

      表3 部分訓(xùn)練數(shù)據(jù)Table 3 Partial training data

      表4 隨機(jī)森林訓(xùn)練參數(shù)設(shè)置Table 4 Training parameter setting of random forest

      表5 神經(jīng)網(wǎng)絡(luò)訓(xùn)練參數(shù)設(shè)置

      表6 支持向量機(jī)訓(xùn)練參數(shù)設(shè)置Table 6 Training parameter setting of SVM

      可以看到,5(a)中顏色越接近紅色,表示概率越大,因?yàn)殡S機(jī)性和投票機(jī)制,最終的精確度高達(dá)99.99%。

      神經(jīng)網(wǎng)絡(luò)訓(xùn)練結(jié)果如圖6所示,圖6(a)為在5 461次循環(huán)中,神經(jīng)網(wǎng)絡(luò)通過不斷調(diào)整神經(jīng)鍵上的權(quán)值,逐步減小性能函數(shù)的取值,于5 451次循環(huán)時(shí)達(dá)到最小值0.014 55,并在第5 461次循環(huán)后達(dá)到最大驗(yàn)證數(shù)據(jù)失敗的次數(shù),停止循環(huán);圖6(b)為在5 461次循環(huán)中,性能梯度、動(dòng)量和驗(yàn)證數(shù)據(jù)失敗次數(shù)的變化,性能梯度于5461次循環(huán)時(shí)達(dá)到最小值0.022 783,動(dòng)量于5 461次循環(huán)時(shí)達(dá)到最小值1×10-7,驗(yàn)證數(shù)據(jù)失敗次數(shù)于5 461次循環(huán)時(shí)達(dá)到最大值10次。

      圖7橫坐標(biāo)為181 440組狀態(tài)的編號(hào),縱坐標(biāo)為該組狀態(tài)對(duì)應(yīng)的大氣模型誤差值,可以看到訓(xùn)練結(jié)果相比隨機(jī)森林已經(jīng)有了較大的降幅,精確率僅有0.011 6%。而且通過圖8可以看出,在預(yù)報(bào)時(shí)長(zhǎng)較小時(shí),因?yàn)椴煌P偷玫降脑谲墵顟B(tài)差值很小,這一段內(nèi)的結(jié)果誤差尤其劇烈,甚至超過了100%,隨著預(yù)報(bào)時(shí)長(zhǎng)的增加,誤差將會(huì)逐步減小。支持向量機(jī)分類結(jié)果如圖9所示,結(jié)果誤差較大,其精確度僅為50.7%。對(duì)比圖7,神經(jīng)網(wǎng)絡(luò)分類結(jié)果僅在一定范圍內(nèi)波動(dòng),而支持向量機(jī)的結(jié)果可能在全域內(nèi)離散波動(dòng)。

      圖5 混淆矩陣和隨機(jī)森林分類結(jié)果Fig.5 Classification results of confusion matrix and random forest

      圖6 神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程Fig.6 Training process of neural network

      圖7 神經(jīng)網(wǎng)絡(luò)分類結(jié)果Fig.7 Classification results of neural network

      對(duì)比3種方法的性能(見表7),隨機(jī)森林訓(xùn)練時(shí)長(zhǎng)最短,精確度最高,因此該方法的性能最佳,考慮到森林中包含決策樹的數(shù)量為50棵,減少?zèng)Q策樹的數(shù)會(huì)進(jìn)一步縮短訓(xùn)練時(shí)長(zhǎng)。而神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的應(yīng)用結(jié)果都不理想,原因在于本文中使用的在軌狀態(tài)和大氣模型誤差值的訓(xùn)練數(shù)據(jù),對(duì)于這2種方法來說學(xué)習(xí)較為困難,尤其是神經(jīng)網(wǎng)絡(luò),容易出現(xiàn)過擬合以及不學(xué)習(xí),即過早達(dá)到最大驗(yàn)證失敗次數(shù)的情況。

      圖8 神經(jīng)網(wǎng)絡(luò)分類誤差變化Fig.8 Classification error variation of neural network

      圖9 支持向量機(jī)分類結(jié)果Fig.9 Classification results of SVM

      表7 3種分類方法性能對(duì)比Table 7 Performance comparison of three classification methods

      4 結(jié) 論

      本文以某型號(hào)衛(wèi)星的軌道預(yù)報(bào)及數(shù)據(jù)挖掘方法作為切入點(diǎn),完成了以下內(nèi)容的研究分析:

      1) 對(duì)衛(wèi)星在軌的空間環(huán)境進(jìn)行數(shù)學(xué)建模,基于各個(gè)攝動(dòng)力因素,提出了2種軌道動(dòng)力學(xué)模型,精確模型用于模擬衛(wèi)星在軌真實(shí)情況,誤差簡(jiǎn)化模型通過人為對(duì)大氣模型施加-100%~100%的誤差,作為生成訓(xùn)練數(shù)據(jù)的基礎(chǔ)。

      2) 對(duì)本文利用到的支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林3種分類方法進(jìn)行了概述和總結(jié),闡明了3種方法的原理及特點(diǎn)。

      3) 利用2種模型向后進(jìn)行1 d的軌道預(yù)報(bào),預(yù)報(bào)結(jié)果作差,由此產(chǎn)生181 440組訓(xùn)練數(shù)據(jù),并導(dǎo)入3種分類模型訓(xùn)練。

      4) 從訓(xùn)練結(jié)果可以看出,數(shù)據(jù)挖掘方法能夠?qū)Υ髿饽P偷恼`差進(jìn)行較好的反演,尤其是隨機(jī)森林的方法,反演的結(jié)果高達(dá)99.99%。

      本文的結(jié)果為衛(wèi)星軌道預(yù)報(bào)以及大氣模型的建立提供了新思路,結(jié)合時(shí)下熱門的大數(shù)據(jù)概念,將數(shù)據(jù)挖掘方法應(yīng)用至傳統(tǒng)的航天領(lǐng)域,具有良好的參考意義,為航天領(lǐng)域應(yīng)用人工智能、大數(shù)據(jù)等技術(shù)奠定了基礎(chǔ)。

      猜你喜歡
      決策樹數(shù)據(jù)挖掘軌道
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
      基于單純形法的TLE軌道確定
      CryoSat提升軌道高度與ICESat-2同步運(yùn)行
      朝美重回“相互羞辱軌道”?
      一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹算法
      決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      基于決策樹的出租車乘客出行目的識(shí)別
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
      临汾市| 阿拉善盟| 彰化市| 广汉市| 凤山县| 伊吾县| 盐城市| 海门市| 锡林郭勒盟| 兴义市| 涞源县| 保靖县| 婺源县| 布尔津县| 西昌市| 格尔木市| 屯留县| 英德市| 柯坪县| 黎川县| 行唐县| 尚义县| 砚山县| 年辖:市辖区| 察雅县| 武乡县| 饶河县| 沁源县| 烟台市| 望江县| 聊城市| 乌鲁木齐市| 曲靖市| 郯城县| 句容市| 平利县| 泗洪县| 洛南县| 临安市| 瑞安市| 洛隆县|