胡萬平 張貴宇,2,3 張云龍 庹先國,2 李戶林
1(四川輕化工大學(xué) 自動化與信息工程學(xué)院 宜賓 644000)
2(四川輕化工大學(xué) 人工智能四川省重點實驗室 宜賓 644000)
3(西南科技大學(xué) 信息工程學(xué)院 綿陽 621010)
4(成都惠利特自動化科技有限公司 成都 610000)
在使用有機閃爍體探測器對中子進行探測時,由于存在自發(fā)核裂變、非彈性散射和慢中子捕獲等反應(yīng)[1],往往會同時探測到中子和γ射線,因此,中子/伽馬(n/γ)甄別在中子探測中是必不可少的。中子在有機閃爍體中誘發(fā)的延遲熒光比例大于γ射線[2],從而具有更長、更平坦的脈沖尾部,脈沖形狀甄別(Pulse Shape Discriminarion,PSD)方法正是根據(jù)這一差異實現(xiàn)n/γ甄別的。傳統(tǒng)的PSD方法包括:電荷比較法(Charge Comparison Method,CCM)[3]、脈沖梯度分析(Pulse Gradient Analysis,PGA)[4]、過零時間法[5]和上升時間法[6]等,這些方法通過時域特征實現(xiàn)n/γ甄別。隨著數(shù)字化技術(shù)的發(fā)展,利用傅里葉變換[7]或小波變換[8]將時域上的脈沖信號轉(zhuǎn)換到頻域上,分析和對比各類頻域特征亦可實現(xiàn)n/γ甄別。PSD方法原理簡單,根據(jù)特定的脈沖形狀甄別參數(shù)實現(xiàn)n/γ甄別,但是存在噪聲干擾和不穩(wěn)定性等缺點[9]。
近年來,人工智能技術(shù)迅速發(fā)展,K-means和高斯混合模型(Gaussian Mixture Model,GMM)[10]等無監(jiān)督學(xué)習(xí)方法可直接對脈沖波形進行聚類,無須利用飛行時間實驗對粒子進行標(biāo)記。劉路峰等[10]分析了無監(jiān)督學(xué)習(xí)在n/γ甄別中的優(yōu)點,最顯著的優(yōu)點就是不需要真實標(biāo)簽數(shù)據(jù)集。Senteno[11]驗證了GMM和變分貝葉斯GMM的聚類結(jié)果優(yōu)于K-means。Blair等[9]研究了GMM中的對角協(xié)方差矩陣、全協(xié)方差矩陣和共享協(xié)方差矩陣對n/γ聚類的影響,并探索了一種狄利克雷過程的GMM。神經(jīng)網(wǎng)絡(luò)[12]和支持向量機[13]等監(jiān)督學(xué)習(xí)方法在該領(lǐng)域應(yīng)用也很廣泛。張才勛等[14]提出一種基于Elman神經(jīng)網(wǎng)絡(luò)的n/γ甄別方法,獲得了較高的品質(zhì)因數(shù)(Figure of Merit,F(xiàn)OM)值。Gelfusa等[15]實現(xiàn)了熱核聚變中的GMM純無監(jiān)督聚類,并在高能量下訓(xùn)練了一個概率支持向量機(Support Vector Machine,SVM)模型,兩類機器學(xué)習(xí)模型在n/γ甄別中獲得了良好的一致性。Liu等[16]引入一種脈沖耦合神經(jīng)網(wǎng)絡(luò),獲得比CCM、反向傳播神經(jīng)網(wǎng)絡(luò)和分形譜法更優(yōu)的FOM值,并在后續(xù)的研究中[17]驗證了該網(wǎng)絡(luò)的抗噪聲能力顯著優(yōu)于電荷比較法和頻域梯度分析法等。對于高維的脈沖信號特征,主成分分析(Principal Component Analysis,PCA)[18]和核主成分分析(Kernel Principal Component Analysis,KPCA)[19]通常用于減少脈沖信號特征的維數(shù),選擇最佳的特征數(shù)目用于訓(xùn)練機器學(xué)習(xí)模型。此外,PCA[20]也可在一定程度上甄別中子和γ射線。機器學(xué)習(xí)方法可靈活地根據(jù)脈沖差異特征實現(xiàn)n/γ甄別,甄別精度普遍提高,并且可通過分類精度和甄別錯誤率等指標(biāo)進行定量評價。
在n/γ甄別中,常用的機器學(xué)習(xí)模型過于復(fù)雜。因此,本文選擇了網(wǎng)絡(luò)結(jié)構(gòu)簡單的極限學(xué)習(xí)機(Extreme Learning Machine,ELM)[21]作為基礎(chǔ)模型,對KPCA降維后的脈沖數(shù)據(jù)進行訓(xùn)練,并利用海洋捕食者算法(Marine Predator Algorithm,MPA)[22]優(yōu)化ELM的輸入層權(quán)重和隱藏層偏置,提高n/γ甄別精度。
實驗數(shù)據(jù)來自中國原子能科學(xué)研究院串列終端。實驗裝置主要由钚碳(Pu-C)中子源、BC-501A液體閃爍體探測器、XIA數(shù)字化采集卡、高壓電源以及計算機組成(圖1)。中子探測器由5.08 cm×5.08 cm的BC-501A液體閃爍體耦合到XP-2020光電倍增管上,再封裝在鋁制的圓柱體中。BC-501A液體閃爍體中的氫原子數(shù)為4.82×1022cm-3,碳原子數(shù)為3.98×1022cm-3,電子數(shù)為2.87×1023cm-3。光輸出量為蒽的78%,延遲熒光衰減時間為3.2 ns,適用于γ射線輻射下進行中子探測。首先,使用137Cs標(biāo)準(zhǔn)γ源進行能量校準(zhǔn),得到ADC通道與電子等效能量之間的關(guān)系。然后對12 mm×16 mm的Pu-C中子源進行探測,探測器與中子源之間的距離設(shè)置為20 cm。XIA的數(shù)字化采集卡為Pixie(16通道,14位),采用基于4個ADC子卡的6UPXI主板,以500 Ms·s-1的采樣率采集10000組脈沖波形數(shù)據(jù),每組數(shù)據(jù)間隔4 ns采集一個樣本,總共采集250個脈沖波形離散點。
圖1 實驗流程圖Fig.1 Experimental flowchart
探測器采集的脈沖信號有250個離散點(圖2),由于原始脈沖波形的前半部分和后半部分趨于平緩,截掉脈沖上升之前的前50個點和脈沖下降到平穩(wěn)值之后的120個點,留脈沖差異較大的80個離散點。為了減小基線漂移和噪聲干擾的影響,對原始脈沖波形進行基線校正、滑動平均濾波和幅度歸一化等預(yù)處理(圖3),作為ELM網(wǎng)絡(luò)的輸入特征。前期通過大量的實驗數(shù)據(jù)分析,并結(jié)合PSD方法和聚類分析方法綜合分析得到10000組脈沖信號中有3871組中子脈沖信號和6129組γ脈沖信號。
圖2 中子和γ射線的脈沖樣本Fig.2 Pulse samples of neutron and gamma rays
圖3 截取后的脈沖波形(a)以及基線調(diào)整(b)、平滑濾波(c)和幅度歸一化(d)Fig.3 Intercepted pulse waveform (a) and baseline adjustment (b), smoothing filtering (c), and amplitude normalization (d)
與傳統(tǒng)的線性變換方法PCA相比,KPCA是一種非線性的方法。KPCA使用核函數(shù)將線性不可分的輸入空間映射到更高維度的線性可分特征空間[1],然后在特征空間中使用PCA的線性映射來減少特征的數(shù)量。大多數(shù)基于機器學(xué)習(xí)的n/γ甄別方法直接將全部或部分差異較大的脈沖樣本點作為模型的輸入特征,特征數(shù)量過多,容易造成過擬合。因此,該研究在盡可能保留數(shù)據(jù)差異的基礎(chǔ)上,引入KPCA對脈沖波形特征降維,加快后續(xù)算法的運行速度。在KPCA降維中,常見的核函數(shù)主要有線性核函數(shù)、多項式核函數(shù)和高斯徑向基核函數(shù)。線性核函數(shù)主要適用于線性可分的情況,而后兩者皆適用于線性不可分的情況,相比多項式核函數(shù),高斯徑向基核函數(shù)參數(shù)少,應(yīng)用范圍廣,因此,該研究引入了高斯徑向基核函數(shù)計算特征向量,如式(1)。
ELM是Huang等[23]在2006年提出的單隱層前饋神經(jīng)網(wǎng)絡(luò)。與傳統(tǒng)的前饋神經(jīng)網(wǎng)絡(luò)不同,ELM不采用基于梯度的學(xué)習(xí)算法,隨機生成輸入層權(quán)重和隱藏層偏置。根據(jù)廣義逆矩陣?yán)碚?,通過減少訓(xùn)練誤差項和輸出層權(quán)重范數(shù)規(guī)則項形成的損失函數(shù),計算和分析輸出層的權(quán)重,從而完成模型訓(xùn)練。近年來,隨著人工神經(jīng)網(wǎng)絡(luò)的發(fā)展,ELM憑借其簡單、運算速度快等優(yōu)點逐漸應(yīng)用于模式識別、回歸預(yù)測和分類等領(lǐng)域[24]。ELM的單隱層和不需要反向傳播的前饋神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)適合解決二分類問題,因此,本文中采用KPCA-ELM模型實現(xiàn)n/γ甄別,結(jié)構(gòu)如圖4所示。
圖4 KPCA-ELM模型結(jié)構(gòu)圖Fig.4 Diagram of the KPCA-ELM model structure
由圖4可知,ELM網(wǎng)絡(luò)結(jié)構(gòu)主要由輸入層、隱藏層以及輸出層三部分組成。假如隱藏層節(jié)點數(shù)量為L,有n個不同的樣本,其中xi=[xi1,xi2,…,xid]T是第i組訓(xùn)練樣本,ti=[ti1,ti2,…,tim]T是第i組樣本的期望輸出,d是樣本維度。含有L個隱藏層節(jié)點的輸出矩陣H可以表示為:
式中:(wi,bi)是隱藏層第i個神經(jīng)元的參數(shù),W=(w1,w2,…,wL)和b=(b1,b2,…,bL)分別是隨機化的輸入層權(quán)重和隱藏層偏置。在該模型中,sigmoid作為隱藏層神經(jīng)元的激活函數(shù)g(·),具體函數(shù)表達式如式(3):
ELM采用Hβ=T對輸出矩陣T進行求解,其中隱藏層權(quán)重矩陣β=[β1,β2,…,βL]T∈βL×m,期望輸出T=[t1,t2,…,tn]∈TL×m。ELM的訓(xùn)練目標(biāo)是通過min‖Hβ-T‖2訓(xùn)練模型參數(shù),使模型的輸出最大限度地逼近訓(xùn)練樣本,對隱藏層的權(quán)重矩陣β進行求解。最終輸出權(quán)重結(jié)果為β*=H+T,H+是矩陣H的Moore-Penrose廣義逆。經(jīng)典ELM的輸入層權(quán)重和隱藏層偏置都是隨機的,不能保證預(yù)測和分類的精度,泛化能力不強,這也是ELM不可避免的一個缺陷。因此,采用了優(yōu)化效率較高的MPA算法對ELM的輸入層權(quán)重和隱藏層偏置進行優(yōu)化。
MPA[22]是一種新型的元啟發(fā)式智能優(yōu)化算法。它的核心覓食策略結(jié)合了萊維運動和布朗運動。MPA通過迭代更新捕食者矩陣E和獵物矩陣P來得到目標(biāo)的最優(yōu)解。相較于遺傳算法和粒子群等優(yōu)化算法,MPA一般情況下具有更快的收斂速度和更優(yōu)的收斂值。目前,MPA已成功應(yīng)用于分類、聚類、特征選擇、圖像識別和信號處理等領(lǐng)域,如癌癥分類和新冠肺炎預(yù)測等[25]。MPA算法的主要步驟如下:
1)種群初始化
式中:Xmax和Xmin是搜索范圍的上界和下界,rand表示(0,1)之間的均勻分布的隨機數(shù)。
2)優(yōu)化階段
迭代初期(Iter<13Max_Iter),獵物比捕食者移動得更快。捕食者最好的策略是不移動,獵物通常是萊維運動。該階段的數(shù)學(xué)模型由式(5)給出:
式中:?符號表示矩陣中的逐項乘法;Si代表運動的步長;Q是等于0.5的常數(shù);R是0~1之間均勻分布的隨機數(shù)組成的向量;Iter是迭代次數(shù),Max_Iter是最大迭代次數(shù);RB是由布朗運動產(chǎn)生的隨機數(shù)組成的向量。
迭代中期(13Max_Iter≤Iter<23Max_Iter),單位速度比為1,捕食者和獵物以大致相同的速度移動。獵物通常進行萊維運動,捕食者的最優(yōu)策略是布朗運動??傮w分為兩個相等的部分,一個用于局部優(yōu)化,另一個用于全局搜索。局部優(yōu)化的數(shù)學(xué)模型由式(6)給出,全局搜索的數(shù)學(xué)模型由式(7)給出:
RL是萊維運動生成的隨機向量。CF是步長的自適應(yīng)參數(shù),用于調(diào)整捕食者的運動步長,由式(8)定義:
迭代后期(Iter≥23Max_Iter),捕食者比獵物移動得更快。這個階段是局部優(yōu)化階段,捕食者的最佳策略是萊維運動。該階段的更新規(guī)則如等(9)所示:
3)魚類聚集裝置(Fish Aggregation Devices,F(xiàn)ADs)
在每次迭代后,MPA通過利用魚類聚集裝置效應(yīng),使捕食者跳得更遠,避免陷入局部最優(yōu)。數(shù)學(xué)模型如下:
式中:r是(0,1)之間的隨機數(shù),F(xiàn)ADs=0.2。r1和r2是獵物矩陣P的隨機索引。U是包含0或1的二進制向量。
KPCA對預(yù)處理之后的數(shù)據(jù)進行特征降維,MPA用于優(yōu)化ELM的輸入層權(quán)重和隱藏層偏置,KPCA-MPA-ELM模型的流程見圖5。
圖5 KPCA-MPA-ELM模型的具體算法流程圖Fig.5 Specific algorithm flowchart of the KPCA-MPA-ELM model
1)對脈沖信號進行預(yù)處理(截取、基線調(diào)零、平滑濾波和幅度歸一化)。
2)KPCA對特征點進行降維,前n個主成分代替原80個離散特征點。
3)10000個降維后的數(shù)據(jù)劃分7000個訓(xùn)練樣本和3000個測試樣本。
4)隨機生成ELM的輸入層權(quán)重和隱含層偏置,設(shè)置激活函數(shù)為sigmoid函數(shù)。訓(xùn)練ELM網(wǎng)絡(luò),得到分類準(zhǔn)確率。
5)初始種群數(shù)量設(shè)置為25,最大迭代次數(shù)設(shè)置為120。根據(jù)待優(yōu)化的變量初始化獵物矩陣P,并以分類準(zhǔn)確率作為MPA的適應(yīng)度函數(shù)。
6)根據(jù)相應(yīng)的數(shù)學(xué)模型更新獵物矩陣P,保存每次迭代的最優(yōu)解,并更新捕食者矩陣E。
7)利用FADs效應(yīng)對獵物矩陣進行更新,判斷是否達到最大迭代次數(shù)。
8)以最優(yōu)的輸入層權(quán)重和隱藏層偏置對ELM網(wǎng)絡(luò)重新進行訓(xùn)練,并輸出分類結(jié)果。
對比多項式核函數(shù)和高斯核函數(shù)的降維結(jié)果發(fā)現(xiàn),當(dāng)KPCA的核函數(shù)設(shè)置為高斯徑向基核函數(shù),且對應(yīng)的γ參數(shù)值設(shè)置為0.1時,降維效果更好。圖6為前10個主成分的貢獻率和累積貢獻率。根據(jù)圖6可發(fā)現(xiàn),前3個主成分特征的累積貢獻率已經(jīng)大于90%,表明前3個主成分特征可以替換脈沖波形的80個數(shù)據(jù)點,因此,保留前3個主成分特征,輸入到ELM中進行訓(xùn)練。
圖6 前10個主成分特征的貢獻率和累積貢獻率Fig.6 Contribution rate and cumulative contribution rate of the first 10 principal component features
經(jīng)過KPCA降維后,10000×80數(shù)據(jù)矩陣壓縮為10000×3數(shù)據(jù)矩陣。10000組樣本隨機劃分為7000個訓(xùn)練樣本和3000個測試樣本。ELM的隱藏層節(jié)點數(shù)量設(shè)置為20,對輸入層權(quán)重和隱藏層偏置進行隨機初始化,輸出層1代表中子,2代表γ射線。MPA最大迭代次數(shù)設(shè)置為120,種群大小設(shè)置為25,將FADs設(shè)置為0.2。分類精度作為MPA的適應(yīng)度函數(shù)來優(yōu)化輸入層權(quán)重和隱藏層偏置。MPA優(yōu)化ELM的適應(yīng)度變化曲線如圖7所示。KPCAELM和KPCA-MPA-ELM模型對應(yīng)的甄別結(jié)果如圖8和圖9中的混淆矩陣表示。
圖7 MPA-ELM的適應(yīng)度變化曲線Fig.7 Fitness change curve of the MPA-ELM
圖8 KPCA-ELM模型的3000組測試樣本的混淆矩陣Fig.8 Confusion matrix of the 3000 test samples of the KPCA-ELM model
圖9 KPCA-MPA-ELM模型的3000組測試樣本的混淆矩陣Fig.9 Confusion matrix of the 3000 groups of the test samples of the KPCA-MPA-ELM model
從圖7可以看出,對于KPCA降維之后的數(shù)據(jù),MPA優(yōu)化的ELM的最優(yōu)分類精度從95.27%提高到99.27%左右。此外,還可以發(fā)現(xiàn)KPCA-MPA-ELM的收斂速度比MPA-ELM更快。圖8和圖9中的混淆矩陣直觀地顯示了真實數(shù)據(jù)和預(yù)測數(shù)據(jù)之間的差異。3000組測試樣本中有1156組中子脈沖信號和1844組γ脈沖信號,圖9中KPCA-MPA-ELM模型正確分類的中子和γ射線數(shù)量分別為1153和1825組。通過計算可知中子的甄別誤差率從11.68%降低到0.26%,由此可見中子的甄別準(zhǔn)確率明顯提高。
為了充分驗證KPCA-MPA-ELM的甄別效率,使用ELM和MPA-ELM模型對未降維和KPCA降維的數(shù)據(jù)進行了10次重復(fù)實驗。對于未降維的數(shù)據(jù),通過反復(fù)測試,選擇了峰值之后脈沖波形差異較大的20個點作為特征點來訓(xùn)練ELM和MPA-ELM模型。重復(fù)10次實驗之后4個模型的分類精度比較如圖10所示。4個模型的平均分類準(zhǔn)確率和運行時間的比較如表1所示。
表1 4種模型的分類效率對比Table 1 Comparison of the classification efficiency of four models
圖10 4種模型的分類精度對比Fig.10 Comparison of the classification accuracy of four models
根據(jù)圖10和表1,發(fā)現(xiàn)KPCA-ELM模型的平均運行時間最短為0.83 s,這是因為KPCA降維后的數(shù)據(jù)特征減少了,縮短了ELM模型的運行時間,分類精度相比于ELM也有明顯提升。KPCA-MPA-ELM的分類精度總是4個模型中最好的,且甄別結(jié)果更加穩(wěn)定。KPCA-MPA-ELM模型的運行時間較長,主要是由數(shù)據(jù)集過大和MPA優(yōu)化過程復(fù)雜導(dǎo)致,但是其平均準(zhǔn)確率最高為99.07%,相較于KPCA-ELM還是有1.56%左右的提升。此外,當(dāng)未使用KPCA降維時,MPA-ELM的分類精度比ELM有顯著提高,可見MPA的優(yōu)化還是很有效的。因此,在實際n/γ甄別中,有必要綜合考慮運行時間和分類精度兩個影響因素,合理地選擇模型,KPCA-ELM適用于大規(guī)模的數(shù)據(jù)集和實時性的甄別問題,而對于精度要求較高的甄別問題,KPCA-MPA-ELM依然更具有優(yōu)勢。
為了說明該模型的有效性,進一步實現(xiàn)了CCM和PGA甄別方法。CCM以峰值為起點,脈沖波形高度的1/4處為終點,作為短門積分Qtail;脈沖開始到結(jié)束作為總積分Qtotal。計算脈沖波形尾到總的電荷積分比Qtail/Qtotal,并繪制CCM甄別結(jié)果(圖11)。PGA以峰值為起點,脈沖波形下降至平穩(wěn)之后的第一個點為結(jié)束點計算脈沖波形的梯度,并繪制PGA甄別結(jié)果(圖12)。品質(zhì)因數(shù)(Figure of Merit,F(xiàn)OM)作為大多數(shù)PSD方法的評價指標(biāo),并不能對機器學(xué)習(xí)甄別結(jié)果進行定量評價。為了統(tǒng)一評價指標(biāo),分別以圖中最優(yōu)的紅色虛線為分界線計算CCM和PGA的n/γ甄別準(zhǔn)確率,與KPCA-ELM和KPCAMPA-ELM模型進行對比,如表2所示。
表2 機器學(xué)習(xí)模型與傳統(tǒng)PSD方法的甄別效率對比Table 2 Comparison of the discrimination efficiency between the machine-learning model and traditional PSD method
圖11 CCM甄別結(jié)果圖(彩圖見網(wǎng)絡(luò)版)Fig.11 CCM discrimination result chart (color online)
圖12 PGA甄別結(jié)果圖Fig.12 PGA discrimination result chart
經(jīng)對比,KPCA-MPA和KPCA-MPA-ELM的準(zhǔn)確率明顯優(yōu)于CCM和PGA,KPCA-ELM在時間效率上更優(yōu),而KPCA-MPA-ELM具有更高的甄別準(zhǔn)確率。
本文結(jié)合KPCA、MPA和ELM各自的優(yōu)點建立了一種KPCA-MPA-ELM的n/γ甄別模型,為實際n/γ甄別提供了一種新的方法,該方法泛化能力強,穩(wěn)定性好。
KPCA特征提取降低數(shù)據(jù)特征維數(shù),有效減少了分類模型的運行時間,提高模型的運行效率。MPA優(yōu)化了ELM的隨機初始化的輸入層權(quán)重和隱藏層偏置,提高了ELM模型的分類精度和穩(wěn)定性。與ELM、MPA-ELM和KPCA-ELM相比,KPCAMPA-ELM模型的分類精度和穩(wěn)定性更好,但運行時間大于KPCA-ELM。KPCA-ELM和KPCA-MPAELM在甄別精度上都比傳統(tǒng)PSD方法CMM和PGA更高,KPCA-MPA-ELM優(yōu)勢在于高精度,KPCA-ELM優(yōu)勢在于運行時間效率。在今后的實際n/γ甄別研究工作中,需要綜合分析精度和運行時間兩個影響因素;繼續(xù)考慮如何平衡精度與時間;在保證精度的同時,減少模型的運行時間。模型的優(yōu)化包括對初始種群進行混沌初始化或改進自適應(yīng)步長參數(shù)等方法增加MPA的全局和局部尋優(yōu)能力,從而達到減少運行時間并提高甄別準(zhǔn)確率的效果。
作者貢獻聲明胡萬平負責(zé)數(shù)據(jù)處理、模型的構(gòu)建、實驗結(jié)果分析和論文寫作;張貴宇負責(zé)技術(shù)指導(dǎo)和審閱;張云龍負責(zé)模型訓(xùn)練;庹先國負責(zé)技術(shù)指導(dǎo)和校對;李戶林負責(zé)提出相關(guān)問題。