王 俊,劉明哲,*,庹先國,2,李 哲,李 磊,石 睿
(1.成都理工大學 地質災害防治與地質環(huán)境保護國家重點實驗室,四川 成都 610059;2.西南科技大學 核廢物與環(huán)境安全國防重點學科實驗室,四川 綿陽 621010)
?
遺傳算法優(yōu)化的BP神經網絡在EDXRF中對鈦鐵元素含量的預測
王 俊1,劉明哲1,*,庹先國1,2,李 哲1,李 磊1,石 睿1
(1.成都理工大學 地質災害防治與地質環(huán)境保護國家重點實驗室,四川 成都 610059;2.西南科技大學 核廢物與環(huán)境安全國防重點學科實驗室,四川 綿陽 621010)
在能量色散X熒光分析(EDXRF)技術中,受均勻效應、顆粒效應和基體效應等的干擾,定量分析精度受到影響。本文針對這一問題提出了遺傳算法(GA)優(yōu)化BP神經網絡(GA-BP)的混合算法,該算法無需考慮元素濃度和射線強度之間的復雜關系。遺傳算法優(yōu)化BP神經網絡的目的是為了獲得更好的網絡初始權值和閾值,其基本思想是:將初始化的BP神經網絡均方根誤差的倒數編碼為遺傳算法中個體的適應度;初始的權值和閾值用遺傳算法中的個體代替,然后通過選擇、交叉和變異操作挑選出最優(yōu)個體,最后通過解碼用最優(yōu)的權值和閾值創(chuàng)建一個新的BP網絡模型。攀枝花礦區(qū)5類礦樣中鈦和鐵含量的整體預測和分類預測實驗表明,分類預測效果遠好于整體預測。預測值與化學分析值比較結果表明,其中76.7%的樣品相對誤差小于2%,表明了該方法在元素間基體效應校正上的有效性。
能量色散X熒光分析;定量分析;BP神經網絡;遺傳算法
釩鈦磁鐵礦的成分較復雜,生產過程中要對其進行定量分析。雖然傳統(tǒng)的化學分析方法穩(wěn)定、可靠,但費時費力,且成本較高。能量色散X射線熒光(EDXRF)分析技術是一種先進的非破壞性分析技術,該技術已在水泥、礦業(yè)、環(huán)境防治等諸多領域中得到了廣泛的運用[1-3]。在EDXRF分析技術中,基體效應是影響其分析準確性的一個關鍵因素,特別是元素間吸收增強效應的干擾,使得熒光強度和元素濃度之間呈非線性關系,在X熒光分析技術領域,基體效應的準確校正仍然是一個難點[4]。傳統(tǒng)的實驗校正法、數學校正法的準確度在很大程度上依賴于標樣的準確度和標樣與待測試樣的相似性[5],屬于相對測量法?;緟捣朔讼鄬y量方法的不足,但它所采用的很多基本參數很難確定,如果獨立進行測定,參數數據的準確性較差[6]。Guo等[7-9]將遺傳算法、神經網絡等運用于XRF、EDXRF和PIXE的微區(qū)定量分析中,取得了較好的成果。宋梅村和李金陽等[10-11]將BP神經網絡方法用于核反應堆的功率預測和核電廠主動容錯控制方法的研究中,均證明BP神經網絡具有很好的非線性過程逼近能力。
在存在強吸收增強效應的復雜礦樣中,如何得到更精確的分析結果,一直以來都是X射線熒光分析技術研究者努力想要解決的問題。本文提出利用遺傳算法(GA)優(yōu)化BP神經網絡的權值和閾值的混合算法,來校正元素間的基體效應,該方法無需考慮熒光強度和元素濃度間的復雜關系,直接從訓練樣本的濃度、強度數據中抽取它們的相關關系用于元素含量的定量分析。
GA-BP網絡模型有3層:m個節(jié)點的輸入層、h個節(jié)點的隱含層和n個節(jié)點的輸出層。首先,模型給出1個基本狀態(tài)空間的連接權值矩陣;然后,將隱含層節(jié)點和權值矩陣通過編碼形成包含整數和真實值的字符串;最后通過解碼再重新建立1個新的BP網絡[12]。該方法的執(zhí)行步驟如下:
第1步:建立1個具有3層結構的BP神經網絡,訓練出1個在[-1,1]范圍內的連接權值和閾值矩陣,用于GA優(yōu)化。
第2步:連接權值和隱含層節(jié)點編碼,隱藏的節(jié)點編碼為二進制代碼字符串,1代表輸入和輸出層節(jié)點之間有連接,0則代表無連接;連接權值編碼為浮點字符串,串長H=m×h+h+h×n+n。每個字符串對應1個包含某些基因片段的染色體,染色體的編碼由A、B、C、D、E5個部分組成。其中,A為隱含層節(jié)點;B為輸入層到隱含層權值;C為隱含層閾值;D為隱含層到輸出層權值;E為輸出層閾值。A部分是0和1組成的二進制碼;B、C、D、E為0.1~0.9之間的真實值,這些值在訓練中將會發(fā)生改變。
第3步:由染色體組成的種群初始化,每個染色體的長度L為G+H,G為隱含層節(jié)點二進制碼的長度。
第4步:適應度函數計算。計算公式如下:
(1)
第5步:按式(2)計算種群中所有個體的適應度之和,以及每個個體的相對適應度,并以此作為遺傳到下一代的概率,具有最高相對適應度的個體直接復制到下一代,剩下的采用輪盤賭的方式遺傳到下一代。
(2)
第6步:使用基本的交叉和變異操作來控制代碼,即,如果一個隱藏節(jié)點被刪除(或添加),根據突變操作,相應的控制代碼編碼是0(或1),交叉和變異算子的權值編碼如下。
1) 給定概率Pc的交叉操作:
(3)
(4)
2) 給定概率Pm的變異操作:
(5)
第7步:重復第4~6步,直至滿足收斂條件,用產生的新種群代替當前種群。
第8步:解碼適應度最大的個體獲得相應的連接權值和閾值,建立新的BP網絡并輸出預測結果。
實驗樣品采用來自攀枝花礦區(qū)的5類礦樣:原礦、鐵精礦、鐵尾礦、鈦精礦、鈦尾礦,各取4 kg,粉碎后在105~110 ℃下烘干1 h,減小濕度效應的影響。測量前,取少許在瑪瑙研缽中研磨30 min,保證均勻性;過180目篩子,降低顆粒效應的不利影響。實驗采用CIT-3000SM型EDXRF分析儀,X光管激發(fā)、電制冷半導體Si(PIN)探測器,能量分辨率為180~190 eV(55Fe,5.90 keV)。實驗時,管壓12.25 kV,管流25.68 μA,環(huán)境溫度25 ℃。用粉末壓片法制樣,每組樣品測量3次,每次測量3 min,取3次測量結果對應道址的平均計數率作為最終的分析數據。圖1為待測樣品,圖2為鐵精礦中含54.45%鐵和7.0%鈦樣品的EDXRF能譜。
圖1 待測樣品Fig.1 Sample to be tested
圖2 鈦、鐵EDXRF能譜Fig.2 EDXRF spectra of titanium and iron
5類礦產樣品中均含有10多種元素(Ca、V、Cr、Ni、Cu、Zn、As、Pb、Ti和Fe等),但鈦和鐵是其中最主要的組成元素。用能量譜對其進行標定后,選擇4.038~8.364 keV (280~580道)之間的能譜數據作為研究對象,因為在該能量區(qū)間包含了影響鈦和鐵含量定量分析的主要元素Ti、Fe、V、Ni和Cu,它們的特征X射線Kα能量分別為:Ti,4.510 keV;Fe,6.403 keV;V,4.951 keV;Ni,7.477 keV;Cu,8.046 keV。
實驗樣品是鈦和鐵含量均不相同的5類礦樣,每類16組,共80組。實驗分2組進行,第1組實驗為5類礦樣分別訓練和預測,其中每類礦樣中10組作為訓練樣本,6組作為預測樣本,實驗分5次進行;第2組實驗為5類礦樣整體訓練和預測,即將第1組實驗中的50組訓練樣本和30組預測樣本分別作為整體訓練和預測的樣本,實驗一次完成。各樣品中鈦和鐵的濃度通過化學分析方法獲得,化學分析值作為實驗的期望輸出值。2組實驗分別進行30次,分別統(tǒng)計鈦和鐵含量的預測值。采用相對誤差與變異系數判斷兩組實驗結果的準確度與精確度。
在GA-BP網絡結構中,取能量區(qū)間4.038~8.364 keV內每道址所對應的計數率為輸入變量,共301個神經元;鈦和鐵的含量作為輸出層的輸出變量,共2個神經元;輸入層到隱含層的激發(fā)函數選擇logsig函數,隱含層到輸出層的激發(fā)函數選擇purelin函數,網絡訓練函數選擇traincgb函數。GA-BP網絡結構的各項重要參數列于表1。
表1 各項網絡模型的重要參數Table 1 Important parameters for required model
注:括號內為整體預測實驗參數,括號外為分類預測實驗參數
分類預測和整體預測中訓練網絡收斂到均方根誤差(MSE)和適應度的情況列于表2。從表2可看出:分類預測收斂步數遠小于整體預測的,收斂速度要快于整體預測的,這是因為整體預測數據量大于分類預測數據量;適應度二者相當。
整體預測和分類預測中訓練網絡的MSE和適應度收斂的過程分別示于圖3、4。由圖3、4可見,整體預測和分類預測的MSE收斂過程中的預設目標值均達到了最佳值,所以預設目標值與最佳值曲線重合;從MSE與適應度收斂過程來看,在遺傳算法優(yōu)化過程中,兩組實驗均未出現局部最小值點,說明經過GA優(yōu)化后的BP神經網絡不易陷入局部最小值點。
表2 收斂步數與適應度Table 2 Steps of convergence and fitness value
圖4 分類預測的收斂均方根誤差曲線與適應度曲線Fig.4 Convergence curve of MSE and fitness value for classification prediction
整體預測和分類預測實驗結果與化學分析值的比較分別示于圖5、6,圖中,從左起分別為原礦、鈦尾礦、鈦精礦、鐵精礦、鐵尾礦。由圖5、6可見,雖然實驗結果與化學分析值符合較好,但整體預測時,數據離散度遠大于分類預測,分類預測結果要好于整體預測,說明數據離散度是影響GA-BP方法的一個重要因素。
圖5 整體預測值與化學分析值Fig.5 Overall predicted values and chemical analysis values
圖6 分類預測值與化學分析值Fig.6 Classification predicted values and chemical analysis values
分類預測和整體預測結果的準確度和精確度即相對誤差和變異系數列于表3。由表3可看出,兩類實驗結果平均相對誤差均小于5%,但分類預測的準確度和精確度均明顯好于整體預測,分析其原因在于,礦樣分類后,分析數據間的離散度大幅減小,這將有利于GA優(yōu)化后的BP神經網絡得到更好的權值和閾值,進而獲得更佳的實驗結果。
表3 分類預測和整體預測的準確度和精確度Table 3 Accuracy and precision of classification prediction and overall prediction
本文提出了一種新的基于GA-BP的混合算法用于X射線熒光能譜數據的處理。經過優(yōu)化的BP神經網絡收斂速度快且不易陷入局部最小值點。該方法在分析成分復雜的釩鈦磁鐵礦時,無須考慮元素濃度與熒光強度之間的復雜關系,而是直接從訓練樣本中提取相關信息,對主要元素鐵和鈦的含量進行分析。實驗結果表明,分類預測平均相對誤差小于2%,整體預測平均相對誤差小于4%;分類預測精度要好于整體預測。該方法沒有受到強的基體效應的影響。
值得注意的是,將復雜的礦樣分類,其實質是減小了訓練樣本與預測樣本的差異性,這樣處理有利于獲得更優(yōu)的BP神經網絡的權值和閾值,進而能獲得更好的實驗結果。
[1] SUMPUN W, PHADOONG B, THIPPAWAN S. Determination of impurities in ilmenite ore and residues after leaching with HCl-ethylene glycol by energy dispersive X-ray fluorescence (EDXRF) spectrometry[J]. Hydrometallurgy, 1997, 45(1-2): 161-167.
[2] GONZALEZ-FERNANDEZ O, QUERALT I, CARVALHO M L, et al. Elemental analysis of mining wastes by energy dispersive X-ray fluorescence (EDXRF)[J]. Nuclear Instruments and Methods in Physics Research B, 2007, 262(1): 81-86.
[3] NATARAJAN V, PORWAL N K, BABU Y, et al. Direct determination of metallic impurities in graphite by EDXRF[J]. Applied Radiation and Isotopes, 2010, 68(6): 1 128-1 131.
[4] RICHARD M R. Corrections for matrix effects in X-ray fluorescence analysis: A tutorial[J]. Spectrochimica: Acta Part B, 2006, 61(7): 759-777.
[5] 曹利國. X射線熒光分析中的綜合靈敏度因子KI0和準絕對測量[J]. 核技術,1987,10(7):15-21.
CAO Liguo. Comprehensive sensitivity factor KI0and quasi-absolute determination in XRF[J]. Nuclear Techniques, 1987, 10(7): 15-21(in Chinese).
[6] 曹利國,丁益民,黃志琦. 能量色散X熒光方法[M]. 成都:成都科技大學出版社,1998:182-274.
[7] GUO P L, WANG J Q, LI X J, et al. Combination of pattern recognition with micro-PIXE for the source indentification individual aerosol particles[J]. Applied Specscopy, 2000, 54(6): 807-811.
[8] LUO L Q. An algorithm combining neural networks with fundamental parameters[J]. X-Ray Spectrometry, 2002, 31(4): 332-338.
[9] 李哲,庹先國,穆克亮,等. 礦樣中鈦鐵EDXRF分析的基體效應和神經網絡校正研究[J]. 核技術,2009,32(1):35-40.
LI Zhe, TUO Xianguo, MU Keliang, et al. Matrix effect and ANN correcting technique in EDXRF analysis of Ti and Fe in core samples[J]. Nuclear Techniques, 2009, 32(1): 35-40(in Chinese).
[10]宋梅村,蔡琦. 基于BP神經網絡的反應堆功率預測[J]. 原子能科學技術,2011,45(10):1 242-1 246.
SONG Meicun, CAI Qi. Reactor power prediction based on BP neural network[J]. Atomic Energy Science and Technology, 2011, 45(10): 1 242-1 246(in Chinese).
[11]李金陽,夏虹,劉永闊,等. 基于BP神經網絡的核電廠主動容錯控制方法研究[J]. 原子能科學技術,2012,46(7):827-830.
LI Jinyang, XIA Hong, LIU Yongkuo, et al. Active fault tolerant control research for nuclear power plant based on BP neural network[J]. Atomic Energy Science and Technology, 2012, 46(7): 827-830(in Chinese).
[12]OZKAYA B, DEMI A, BILGILI M S. Neural network prediction model for the methane fraction in biogas from field-scale landfill bioreactors[J]. Environmental Modeling & Software, 2007, 22(6): 815-822.
BP Neural Network Optimized by Genetic Algorithm Approach for Titanium and Iron Content Prediction in EDXRF
WANG Jun1, LIU Ming-zhe1,*, TUO Xian-guo1,2, LI Zhe1, LI Lei1, SHI Rui1
(1.StateKeyLaboratoryofGeohazardPreventionandGeoenvironmentProtection,ChengduUniversityofTechnology,Chengdu610059,China; 2.FundamentalScienceonNuclearWastesandEnvironmentalSafetyLaboratory,SouthwestUniversityofScienceandTechnology,Mianyang621010,China)
The quantitative elemental content analysis is difficult due to the uniform effect, particle effect and the element matrix effect, etc, when using energy dispersive X-ray fluorescence (EDXRF) technique. In this paper, a hybrid approach of genetic algorithm (GA) and back propagation (BP) neural network was proposed without considering the complex relationship between the concentration and intensity. The aim of GA optimized BP was to get better network initial weights and thresholds. The basic idea was that the reciprocal of the mean square error of the initialization BP neural network was set as the fitness value of the individual in GA, and the initial weights and thresholds were replaced by individuals, and then the optimal individual was sought by selection, crossover and mutation operations, finally a new BP neural network model was created with the optimal initial weights and thresholds. The calculation results of quantitative analysis of titanium and iron contents for five types of ore bodies in Panzhihua Mine show that the results of classification prediction are far better than that of overall forecasting, and relative errors of 76.7% samples are less than 2% compared with chemical analysis values, which demonstrates the effectiveness of the proposed method.
EDXRF; quantitative analysis; BP neural network; genetic algorithm
2014-02-18;
2014-05-03
國家杰出青年科學基金資助項目(41025015);國家自然科學基金資助項目(41274109);四川省青年科技創(chuàng)新研究團隊資助項目(2011JTD001);四川省科技支撐計劃資助項目(2013FZ0022)
王 俊(1984—),男,四川西昌人,碩士研究生,核能與核技術工程專業(yè)
*通信作者:劉明哲,E-mail: liumz@cdut.edu.cn
TL99
A
1000-6931(2015)06-1143-06
10.7538/yzk.2015.49.06.1143