劉潤逸,諸峰,王健, 葉生毅
南方科技大學(xué)地球與空間科學(xué)系, 深圳 518055
星際空間中有無數(shù)尺寸微小的塵埃(Wozniakiewicz, 2017),當(dāng)塵埃以km·s-1量級速度碰撞人造衛(wèi)星時,20%~40%的動能被轉(zhuǎn)化成熱能,導(dǎo)致碰撞塵埃以及被碰撞的衛(wèi)星表面物質(zhì)的氣化,產(chǎn)生等離子體云(Braslau, 1970),后又因等離子云中正負(fù)電荷粒子的不同反應(yīng),使得人造衛(wèi)星表面的電勢發(fā)生波動,最后緩慢恢復(fù)到碰撞前的狀態(tài)(Pantellini et al., 2012; Tarantino et al., 2018).因此根據(jù)電場天線之間或天線與飛船之間電勢差隨時間變化的信號,人們試圖從中尋找塵埃碰撞事件,這可以追溯到Voyager任務(wù)以及他們對土星、天王星、海王星的訪問(Aubier et al., 1983; Gurnett et al., 1991; Meyer-Vernet et al., 1986).眾多科學(xué)家對塵埃碰撞建立了物理實驗和數(shù)值實驗?zāi)P?,嘗試模擬整個塵埃碰撞過程,并找出其與觀測到的電場天線的電勢差信號的聯(lián)系(Ellerbroek et al., 2017; Shen et al., 2021).但總體上因碰撞塵埃所處的環(huán)境不同,在各個模型基礎(chǔ)上對塵埃碰撞引起的電勢差信號的識別能力有限且效率不高.
星際空間中高速運動的塵埃是航天器的重要潛在威脅之一(Anders et al., 2012),參與航天任務(wù)的科學(xué)家們需要考慮空間塵埃分布來規(guī)劃航天器的運行軌道以及設(shè)計標(biāo)準(zhǔn).除此之外,星際塵埃本身在星系演化(Asano et al., 2013; Calura et al., 2017)甚至生命出現(xiàn)(Berera, 2017)都扮演了重要的角色.因此,借助電場天線為代表的航天器電勢測量裝置來識別航天器運行中遭遇的塵埃碰撞事件以分析空間塵埃分布情況在航天工程以及相應(yīng)的科學(xué)研究上很有意義.相應(yīng)地,識別由塵埃碰撞引起的電勢差隨時間變化信號成為幾乎所有工作的基礎(chǔ),同時,對航天器電勢差信號做自動化且高效的程序分析也被急切地需要,使航天器在運行過程中收集到的海量電勢差信號得到實時識別.
要識別塵埃碰撞事件引起的電勢差信號,現(xiàn)有的方法主要是在對塵埃碰撞物理過程的更好模擬基礎(chǔ)上,去總結(jié)其對應(yīng)電勢差信號的普遍特征(O′Shea et al., 2017; Ye et al., 2019),再根據(jù)對應(yīng)特征去人工識別或基于塵埃碰撞引起的電勢差信號波形特征的機器識別,如對Solar Terrestrial Relations Observatory(STEREO)航天器電場天線電勢變化的識別(O′Shea et al., 2017)和基于電壓變化閾值在Cassini航天器The Radio and Plasma Wave Science(RPWS)instrument′s wideband receiver(WBR)波形數(shù)據(jù)中識別塵埃碰撞引起的電勢差信號(Ye et al., 2014).但是塵埃碰撞的機制仍有爭議,并且不同航天器在不同環(huán)境下的可變性使得解釋其機制變得困難(Kellogg et al., 2016, 2018).這讓人們無法通過統(tǒng)一標(biāo)準(zhǔn)來快速識別塵埃碰撞引起的電勢差隨時間變化信號,人工識別的效率低下.
近些年來,基于深度神經(jīng)網(wǎng)絡(luò)對信號特征提取并檢測已經(jīng)在地球物理領(lǐng)域不斷推廣,如對極光亞暴的自動檢測(楊秋菊等, 2022),對產(chǎn)生機制同樣仍存在爭議的極光亞暴做快速檢測;對地震波形的自動分類(趙明等, 2019),對從全球地震臺收集到的海量數(shù)據(jù)檢測波形并相應(yīng)分類.通過深度學(xué)習(xí)來實現(xiàn)自動化檢測信號的準(zhǔn)確性和高效得到了認(rèn)可.
為了快速且高精度地對航天器收集到的電勢差信號識別,判斷其是否由塵埃碰撞事件產(chǎn)生,本文使用深度卷積神經(jīng)網(wǎng)絡(luò)模型對已通過人工識別的塵埃碰撞引起的電勢差隨時間變化信號提取特征.電勢差隨時間變化信號一般由航天器上的電場天線獲取,再通過訓(xùn)練好的模型來識別通過人工識別的電勢差隨時間變化信號,對其分類.本文把已有標(biāo)簽的數(shù)據(jù)集劃分成訓(xùn)練集、測試集、驗證集,訓(xùn)練集和驗證集用來訓(xùn)練并評估模型分類效果,測試集用來衡量模型的泛化性,即在未知數(shù)據(jù)集的表現(xiàn).
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN)的核心為卷積過程.卷積過程相較于全連接神經(jīng)網(wǎng)絡(luò),具有避免訓(xùn)練參數(shù)過多、提取信號空間結(jié)構(gòu)的優(yōu)點.卷積層將上一層的輸出與當(dāng)前卷積核進行卷積,疊加、加上偏置項b,再將得到的結(jié)果放入一個非線性的激活函數(shù):
(1)
激活函數(shù)能夠?qū)崿F(xiàn)對目標(biāo)函數(shù)的非線性擬合,提升模型對復(fù)雜函數(shù)的擬合能力.常見的激活函數(shù)有Sigmoid函數(shù),tanh函數(shù),ReLU函數(shù).在淺層全連接神經(jīng)網(wǎng)絡(luò)中激活函數(shù)常用Sigmoid或tanh,在深層全連接神經(jīng)網(wǎng)絡(luò)中激活函數(shù)常用ReLU,它們具有較好的非線性表達能力,如:有研究利用tanh作為激活函數(shù)能夠較好地預(yù)測太陽風(fēng)速度的復(fù)雜變化(Yang et al., 2018),有研究利用ReLU作為激活函數(shù)用以預(yù)測地球物理測井儲層參數(shù)(邵蓉波等, 2022).在卷積過程中,本文使用ReLU函數(shù)
f(x)=max(0,x),
(2)
作為激活函數(shù),原因是ReLU函數(shù)在小于0的區(qū)間把輸入值重置為0輸出,在大于0的區(qū)間輸出值即為輸入值.它即實現(xiàn)了去線性化,也保證了大于0部分的梯度為1,從而避開了梯度下降計算過程中的梯度消失問題.
如圖1所示,輸入的1501×1信號,其中1501指信號尺寸,1指信號通道數(shù),經(jīng)過64個隨機初始化生成的1×3的卷積核對信號做卷積,同時在卷積過程中對信號兩端補零以保證卷積前后信號尺寸相同,信號尺寸仍為1501,通道數(shù)變?yōu)榫矸e層對應(yīng)卷積核個數(shù),即為64.再在同樣64個隨機初始化生成的1×3的卷積核對信號做卷積后,經(jīng)過最大池化層,即用相鄰兩個數(shù)據(jù)點的最大值來做新的數(shù)據(jù)點,信號尺寸變?yōu)?50,通道數(shù)不變?nèi)詾?4.在多層卷積、池化的過程中,通過誤差反向傳播不斷更新1×3的卷積核對應(yīng)的權(quán)重矩陣W和偏置矩陣b,同時通過不斷增加卷積核個數(shù),即從64個逐步增加到128個,256個,512個,在壓縮信號長度的同時,由于增多的卷積核,導(dǎo)致信號通道數(shù)的增加,每個通道上有對應(yīng)的特征,以保證信號尺寸減小過程中的信息有效保留.
之后通過展開層(Flatten),將輸出的多通道信號轉(zhuǎn)為一維的單通道信號用以連接全連接神經(jīng)網(wǎng)絡(luò).在全連接神經(jīng)網(wǎng)絡(luò)中通過增加Dropout層,即丟棄層,按照設(shè)定比例隨機舍棄神經(jīng)元之間的連接,適當(dāng)降低模型對訓(xùn)練集數(shù)據(jù)的擬合程度,以換取泛化性的提升,即提升對以測試集為代表的真實海量數(shù)據(jù)上的擬合程度.
最后通過把輸出層的神經(jīng)元個數(shù)設(shè)置為1并且使用Sigmoid激活函數(shù):
(3)
式中,x為最后一層神經(jīng)元的輸入值.Sigmoid函數(shù)把輸入值轉(zhuǎn)換到(0,1)區(qū)間,再通過歸一化來給出信號,預(yù)測不同種類的各自概率:
(4)
式中zi為最后一層輸出Z的第i個元素值,qi表示屬于第i個種類的概率值, 在0~1之間,值越大代表對應(yīng)種類的可能越大.最后一層的輸出設(shè)為Z=(z1,z2,…,zn),本文因?qū)﹄妱莶钚盘枡z測,判斷其是否為塵埃碰撞引起的電勢差信號,因而n=2.
卷積神經(jīng)網(wǎng)絡(luò)在提取數(shù)據(jù)結(jié)構(gòu)信息上有顯著優(yōu)勢,并且相較于全連接神經(jīng)網(wǎng)絡(luò),相同情況下卷積神經(jīng)網(wǎng)絡(luò)的參數(shù)數(shù)量明顯少于全連接神經(jīng)網(wǎng)絡(luò)的參數(shù)數(shù)量.VGGNet(Kim et al., 2016)是牛津大學(xué)的視覺幾何小組(Visual Geometry Group, VGG)在2014年提出的一種深度卷積神經(jīng)網(wǎng)絡(luò),在提取信號局部結(jié)構(gòu)特征得到應(yīng)用,如通過學(xué)習(xí)復(fù)雜空間粒子樣本圖像集的特征細(xì)節(jié),對煤塵顆粒的分類(Wang et al., 2021).在本文關(guān)注對象信號,即電勢差隨時間變化的信號,同樣有局部結(jié)構(gòu)特征,且具有一維的結(jié)構(gòu)特征,因此本文改造了VGGNet深度卷積神經(jīng)網(wǎng)絡(luò),使其適用于一維信號.具體模型如圖1所示.
圖1 深度卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
損失函數(shù)衡量模型的預(yù)測值與真實值的誤差.在訓(xùn)練集上損失函數(shù)的值稱為訓(xùn)練誤差,用損失函數(shù)是否隨著訓(xùn)練過程變小來衡量訓(xùn)練過程是否收斂.在測試集上的損失函數(shù)值稱為測試誤差,與能否準(zhǔn)確預(yù)測測試集樣本緊密相關(guān).
在監(jiān)督學(xué)習(xí)中有分類和預(yù)測兩大類問題.本文需要解決的是判斷電勢差信號是否由塵埃碰撞事件引發(fā),因此屬于分類問題,具體為二分類問題.塵埃碰撞引起的電勢差信號的標(biāo)簽為1,非塵埃碰撞引起的電勢差信號標(biāo)簽為0.分類問題最常使用的損失函數(shù)是交叉熵函數(shù),其中“交叉熵”的定義如下:
L(x)i=-[yiln(fi(x))+(1-yi)ln(1-fi(x))],
(5)
式中yi為第i個信號的標(biāo)簽值,fi(x)為神經(jīng)網(wǎng)絡(luò)對第i個信號給出的預(yù)測值.
本文數(shù)據(jù)來源為MAVEN任務(wù)航天器.MAVEN任務(wù),全稱為Mars Atmosphere and Volatile Evolution,是美國宇航局火星偵察計劃的一部分,由美國宇航局總部資助,于2013年11月啟動,將探索火星高層大氣、電離層及其與太陽風(fēng)的相互作用.其下的一個載荷LPW,全稱為Langmuir Probe and Waves,記錄了航天器電位、電場波形等隨時間變化的數(shù)據(jù)(Andersson et al., 2015).
本文所用數(shù)據(jù)是2015全年LPW的電勢差信號.2015年大部分時間內(nèi),MAVEN航天器的軌道高度在距離火星表面高度100~300 km,而火星高空塵埃層的中心為距離其固體表面高度45~65 km(Guzewich et al., 2013).航天器所處軌道塵埃密度有限,這在前面的理論分布以及其他學(xué)者的人工識別都得到了支持(Pabari, 2017).這也在客觀上導(dǎo)致了塵埃碰撞引起的電勢差信號遠(yuǎn)少于非塵埃碰撞引起的電勢差信號.
由于LPW記錄的電勢差隨時間變化是連續(xù)的,為把不同的塵埃碰撞事件引起的電勢差信號分離,本文根據(jù)1501×1的信號長度來分離信號.由于采樣頻率為65536 Hz,單個電勢差信號對應(yīng)的時長為22.9 ms.常見的由塵埃碰撞引起的電勢差信號時長在10 ms左右(Meyer-Vernet et al., 1986),22.9 ms足夠記錄完整的由塵埃碰撞引起的電勢差信號.常見塵埃碰撞引起的電勢差信號(在航天器自身電勢約為0或略大于0的情況下)由三部分組成,電子從碰撞處逃逸引起的pre-spike,即電場天線電勢差的快速下降;離子從碰撞處逃逸引起的main peak,電場天線電勢差的快速上升;最后的恢復(fù)相,電場天線因與周圍等離子體相互作用而緩慢恢復(fù)到塵埃碰撞前水平.但影響電勢差波動具體形狀的因素有很多,如航天器自身電勢,航天器所處環(huán)境等離子體密度,德拜長度,碰撞塵埃的速度和尺寸,在航天器上碰撞發(fā)生位置.電勢差信號的極性、三個相的時間長度甚至是否缺失都受這些因素的影響,具體可以參見對卡西尼號RPWS由塵埃碰撞引起的天線信號的理解,即Understanding Cassini RPWS Antenna Signals Triggered by Dust Impacts(Ye et al., 2019).本文的數(shù)據(jù)篩選除了分析電勢差信號本身波形之外,還結(jié)合了其他因素進一步篩選,并經(jīng)過人工確認(rèn).本文使用的數(shù)據(jù)中共有7200個塵埃碰撞引起的電勢差信號和7200個非塵埃碰撞引起的電勢差信號.部分電勢差信號示例見圖2.
在眾多影響因素中,航天器自身電勢以及航天器所處環(huán)境等離子體密度對電勢差信號波形的影響最為明確(Ye et al., 2019).圖2中左列為塵埃碰撞引起的電勢差信號,從上到下(a1)和(a5)對應(yīng)的是航天器自身電勢約為0或略大于0的情況,電勢差快速增大再回落.(a2)到(a4)對應(yīng)的是航天器自身電勢明顯為負(fù)的情況,電勢差快速下降再緩慢恢復(fù)至塵埃碰撞發(fā)生前水平.而從(a2)到(a4)電勢差快速下降到緩慢恢復(fù)的恢復(fù)相長度從短到長,對應(yīng)的是環(huán)境等離子體密度從高到低(Ye et al., 2019).而圖2中右列對應(yīng)的非塵埃碰撞引起的電勢差信號(噪聲),即Non-Dust Impact Signal,其來源較塵埃碰撞引起的電勢差信號更多,如2013年對歐空局ESA的Juice,即Jupiter Icy Moons Explorer,其Langmuir Probe噪聲來源的分析(Odelstad, 2013).本文對非塵埃碰撞引起的電勢差信號(噪聲)不做細(xì)分,統(tǒng)一歸為非塵埃碰撞引起的電勢差信號.
圖2 部分電勢差信號示例圖
值得一提的是,閃電也是引起電勢差發(fā)生波動的潛在來源之一,但本文使用的電勢差信號可以排除由閃電誘發(fā)的可能性.地球大氣層發(fā)生閃電,其生成的電場相應(yīng)誘發(fā)的單個電勢差信號時長在10 μs量級(Johari, 2017),遠(yuǎn)小于本文研究對象——單個時長在10 ms量級的電勢差信號;除了電勢差信號時長差距懸殊,閃電誘發(fā)的電勢差信號波形特征也和塵埃碰撞事件誘發(fā)的電勢差信號波形特征有顯著不同(Johari, 2017).對于不同行星上的閃電,以太陽系的各個行星為例,成因有所不同(Fischer et al., 2011).火星不滿足發(fā)生類似地球閃電的大氣條件,其“閃電”的潛在來源為沙塵暴期間的放電現(xiàn)象(Fischer et al., 2011).但其是否發(fā)生仍然存在爭議(Melnik and Parrot, 1998; Gurnett et al., 2010).即使火星沙塵暴期間的放電現(xiàn)象存在,例如實驗?zāi)M結(jié)果(Krauss et al., 2003), 放電過程導(dǎo)致的電勢差快速上升下降和塵埃碰撞事件誘發(fā)的由三部分結(jié)構(gòu)組成的電勢差信號仍有明顯區(qū)別.
在深度卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練過程中,需要尋找最優(yōu)解,即最大/最小值,因此需要通過梯度下降法來確定最大/最小值的位置.但是未歸一化的數(shù)據(jù)會導(dǎo)致在大多數(shù)位置上的梯度方向并不是最優(yōu)的搜索方向,這會導(dǎo)致訓(xùn)練輪次總數(shù)的明顯增加.如果把數(shù)據(jù)歸一化為相同尺度,大部分位置的梯度方向近似于最優(yōu)搜索方向,使在梯度下降法求解時,每一步梯度的方向都基本指向最小值,大大提升訓(xùn)練效率.(邱錫鵬, 2020)歸一化過程見(6)式:
(6)
式中,vi指一個信號第i個數(shù)據(jù)點,max(vi),min(vi)分別指信號中1501個數(shù)據(jù)點的最大值最小值,即把信號中1501個數(shù)據(jù)點都統(tǒng)一歸一化.最后按7∶1∶2的比例來把所有信號劃分為訓(xùn)練集、驗證集、測試集.
為了證明訓(xùn)練的深度卷積神經(jīng)網(wǎng)絡(luò)可以成功區(qū)分塵埃碰撞引起的電勢差信號與非塵埃碰撞引起的電勢差信號,本文把經(jīng)過預(yù)處理的包含10080個帶標(biāo)簽的電勢差信號的訓(xùn)練集上通過Adam優(yōu)化算法最小化((5)式)來訓(xùn)練神經(jīng)網(wǎng)絡(luò),獲得的損失函數(shù)曲線見圖3.在訓(xùn)練過程中使用的初始學(xué)習(xí)率為2×10-4,訓(xùn)練輪次總數(shù)為50,批尺寸為128,dropout共有三處,在圖1所示中四個”Fully connected layers”之間各有一處,dropout值都為0.5,即隨即丟棄50%的神經(jīng)元之間的連接.從圖3可知,前10個訓(xùn)練輪次,訓(xùn)練集的損失函數(shù)曲線從3.5快速下降到0.5,隨著訓(xùn)練輪次的增加,損失函數(shù)的值緩慢下降并趨于平穩(wěn),在第50個訓(xùn)練輪次時下降到0.1左右.
圖3 模型訓(xùn)練時訓(xùn)練集和驗證集對應(yīng)的損失函數(shù)值曲線
同時深度卷積神經(jīng)網(wǎng)絡(luò)模型在訓(xùn)練集和驗證集上的準(zhǔn)確率見圖4.前6個訓(xùn)練輪次中,模型在訓(xùn)練集上的準(zhǔn)確率從約50%快速提升至約98%,后緩慢波動提升,在第50個訓(xùn)練輪次時,模型在訓(xùn)練集上的準(zhǔn)確率達到99.46%.
圖4 模型訓(xùn)練時訓(xùn)練集和驗證集對應(yīng)的準(zhǔn)確率變化曲線
包含1440個塵埃碰撞引起的電勢差信號和1440個非塵埃碰撞引起的電勢差信號的測試集在訓(xùn)練好的模型上的結(jié)果見表1.
表1 測試集在訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果
準(zhǔn)確率accuracy,即正確分類比例,模型在測試集的準(zhǔn)確率為98.68%.準(zhǔn)確率計算公式見(7)式:
(7)
查全率recall,即被模型正確分類為塵埃碰撞引起的電勢差信號(TP)在所有實際塵埃碰撞引起的電勢差信號(TP+FN)中的比例,查全率為100%表示所有實際為塵埃碰撞引起的電勢差信號都被模型預(yù)測為塵埃碰撞引起的電勢差信號,反之查全率為0表示所有實際為塵埃碰撞引起的電勢差信號都被模型預(yù)測為非塵埃碰撞引起的電勢差信號.模型在測試集的查全率為99.44%.查全率計算公式見(8)式:
(8)
查準(zhǔn)率precision,即被模型正確分類為塵埃碰撞引起的電勢差信號(TP)在所有被模型分類為塵埃碰撞引起的電勢差信號(TP+FP)中的比例,查準(zhǔn)率100%表示被模型預(yù)測為塵埃碰撞引起的電勢差信號全部都是實際的塵埃碰撞引起的電勢差信號,反之查準(zhǔn)率為0表示所有被模型預(yù)測為塵埃碰撞引起的電勢差信號實際上全部都是非塵埃碰撞引起的電勢差信號.模型在測試集的查準(zhǔn)率為97.95%.查準(zhǔn)率計算公式見(9)式:
(9)
除了以上三個評價標(biāo)準(zhǔn),還可以引入在太陽風(fēng)風(fēng)速預(yù)報中使用的threat score(Owens et al., 2005; Yang et al., 2018),在本文中即被模型正確分類為塵埃碰撞引起的電勢差信號(TP)在除去被模型正確分類為非塵埃碰撞引起的電勢差信號(TN)后剩余所有信號(TP+FP+FN)的比例,為97.41%.threat score計算公式見(10)式:
(10)
本文在google colab上使用內(nèi)存為16 GB、GPU為Tesla P100-PCIE的云端計算機上使用tensorflow框架訓(xùn)練模型,耗時32 min.訓(xùn)練好的模型在預(yù)測測試集信號時,1 s能預(yù)測的信號數(shù)量達到103量級以上,而103個信號對應(yīng)的時長在22.9 s.如本文的測試集2880個電勢差信號對應(yīng)的時長是65.96 s,數(shù)據(jù)預(yù)處理中的連續(xù)電勢差信號分割以及隨機打亂對應(yīng)的耗時約9 s,放入模型預(yù)測的耗時約2 s,保存結(jié)果耗時約1 s.也就是說在航天器運行過程中,使用已經(jīng)訓(xùn)練好的深度卷積神經(jīng)網(wǎng)絡(luò)模型可以在理論上實現(xiàn)對航天器電勢差信號的實時檢測.
本文的方法可以用于實際航天器電勢差信號的塵埃碰撞事件識別,但無法直接將本文根據(jù)MAVEN航天器LPW載荷的電勢差數(shù)據(jù)訓(xùn)練出來的深度卷積神經(jīng)網(wǎng)絡(luò)模型直接用來識別其他航天器的實際數(shù)據(jù).因為不同航天器處于的不同空間環(huán)境必然導(dǎo)致數(shù)據(jù)分布不同且在不同空間環(huán)境下塵埃碰撞引起的電勢差信號可能呈現(xiàn)不同特征.在訓(xùn)練模型之前,需要利用實際數(shù)據(jù)制作帶標(biāo)簽的符合實際數(shù)據(jù)分布的數(shù)據(jù)集,然后再采用和本文相同的步驟重新訓(xùn)練模型.
本文基于深度卷積神經(jīng)網(wǎng)絡(luò)提出了一種從航天器電勢差信號識別塵埃碰撞事件的技術(shù).基于這個技術(shù),理論上可以實現(xiàn)航天器電勢差信號的實時識別.訓(xùn)練模型前,地面工作站需要把傳輸回來的電勢差信號預(yù)處理,值得一提的是,倘若此時預(yù)處理中直接武斷地將實際連續(xù)電勢差信號以等間距分割,可能導(dǎo)致單個塵埃碰撞引起的電勢差信號波形被分割到兩個甚至多個獨立電勢差信號中,勢必會影響后續(xù)模型訓(xùn)練以及信號檢測.可行的解決方案是在分割前引入一個檢測機制,例如在檢測到電勢差信號快速波動時(快速增加或快速下降),把這個作為一個獨立信號的開端,再使用定長來截取信號,如本文中的1501×1對應(yīng)的22.9 ms時間長度的獨立電勢差信號,這可以保證塵埃碰撞引起的電勢差信號被完整記錄在截取后的獨立電勢差信號中.再對這些獨立的電勢差信號打標(biāo)簽,放入模型,對模型進行訓(xùn)練.在訓(xùn)練好模型后,不管是繼續(xù)以電勢差信號傳送回來再檢測的方式還是將訓(xùn)練好的模型上傳至航天器系統(tǒng)從而在航天器上檢測電勢差信號的方式,電勢差信號可以在理論上得到實時信號檢測,從而快速準(zhǔn)確地獲得航天器周圍空間塵埃分布情況.
深度神經(jīng)網(wǎng)絡(luò)在航天器信號識別的應(yīng)用前景很廣,本文相關(guān)未來工作會集中在兩個方面.第一個方面,嘗試對模型性能做更多對比論證并提升,如可以考慮在預(yù)處理過程中加入傅里葉變換嘗試從信號頻域上提取特征,這點在地震波波形識別以及分析上得到了印證(孟小紅等, 2008; 張華等, 2017).在模型選擇時除了本文使用的以卷積神經(jīng)網(wǎng)絡(luò)為主的用以提取電勢差信號時間結(jié)構(gòu)的模型之外,也可以考慮從電勢差信號時序關(guān)系上入手,嘗試使用循環(huán)神經(jīng)網(wǎng)絡(luò)如LSTM,比如電離層對流電勢模型(鄧天云等, 2022).或者嘗試使用常用于視覺圖片識別的YOLO模型,比如對空間多目標(biāo)的識別(Liu et al., 2019).在訓(xùn)練時,可以使用數(shù)據(jù)增強來增加數(shù)據(jù)數(shù)量提升訓(xùn)練效果.第二個方面,嘗試識別其他事件.本文把塵埃碰撞引起的電勢差信號之外的所有信號都?xì)w為非塵埃碰撞引起的電勢差信號(噪聲),其中也有很多事件值得去識別,如可以在噪聲中嘗試提取種類眾多的空間等離子體波動信號.
致謝感謝NASA提供MAVEN下LPW的電勢差數(shù)據(jù).該數(shù)據(jù)可以從NASA下PDS/PPI官方網(wǎng)站免費獲得(https:∥pds-ppi.igpp.ucla.edu/mission/MAVEN/MAVEN/MAG).非常感謝審稿人和編輯的意見和建議.感謝南方科技大學(xué)地球與空間科學(xué)系陳克杰老師《地球科學(xué)大數(shù)據(jù)與人工智能》課程的幫助指導(dǎo).