• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      一種兩階段變量選擇的LIBS定量分析方法

      2021-05-11 01:13:22郭宇瀟史晉芳王慧麗鄧承付
      激光與紅外 2021年4期
      關(guān)鍵詞:定標排序光譜

      郭宇瀟,史晉芳,王慧麗,邱 榮,鄧承付

      (1.西南科技大學(xué)制造科學(xué)與工程學(xué)院 教育部制造過程測試技術(shù)重點實驗室,四川 綿陽621010; 2.西南科技大學(xué) 極端條件物質(zhì)特性聯(lián)合實驗室,四川 綿陽 621010)

      1 引 言

      激光誘導(dǎo)擊穿光譜是一種原子發(fā)射光譜技術(shù),在分析物質(zhì)成分方面有很大潛力。LIBS定量分析一直是一個研究難題[1],已有研究表明,機器學(xué)習(xí)方法能顯著提升LIBS定量分析效果,例如支持向量回歸(Support Vector Regression,SVR)[2-3]、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)[4-5]、隨機森林(Random Forest,RF)[6-7]、偏最小二乘回歸(Partial Least Squares Regression,PLSR)[8-9]、最小絕對收斂選擇算子(Latest absolute shrink and selection operator,Lasso)[10]等。然而,如何從數(shù)以萬計的光譜信息中提取有效信息,進行高效的變量選擇,是建立高質(zhì)量定量分析模型的關(guān)鍵[11]。

      LIBS定量分析的變量選擇方法可以分為兩類:(1)基于先驗知識的手動變量選擇[12];(2)基于機器學(xué)習(xí)中優(yōu)化方法的自動變量選擇[13]。前者需要一些基體的知識,所選的變量往往包含基體元素的發(fā)射線。例如,Sirven[14]在使用LIBS結(jié)合ANN分析土壤中Cr的含量時,同時選擇了目標元素Cr和基體元素Fe的發(fā)射線作為ANN的輸入變量。然而,在大部分場景(例如:土壤)先驗知識往往難以獲得。目前,研究者更致力于探索基于機器學(xué)習(xí)方法的變量選擇。Guezenoc[11]使用LIBS定量分析土壤中的K,采用經(jīng)典的PLS-VIP進行變量選擇,最終建立并比較了3種PLS模型,不過,作者在研究中仍然手動排除了H、Ca的發(fā)射線和608~1000 nm波長范圍的變量。除此之外,連續(xù)投影算法(Successive Projection Algorithm,SPA)[15]、遺傳算法(Genetic Algorithm,GA)[16]在LIBS分析中也有應(yīng)用,但是這些方法的計算量都非常龐大。Duan[15]使用LIBS定量分析土壤中的Cu、Ba、Cr,分別以SPA和GA作為變量選擇方法,計算時間分別為7200 s和1200 s。Yan[17]在使用LIBS定量分析煤炭的熱值時,提出一種小波變化(Wavelet Transformation,WT)結(jié)合平均影響值(Mean Influence Value,MIV)的變量選擇方法并取得了較好的結(jié)果,不過MIV閾值的不當(dāng)選擇可能導(dǎo)致丟失重要信息。

      針對LIBS定量分析的變量選擇問題,提出一種結(jié)合排序和搜索策略的兩階段變量選擇方法,該方法無需先驗知識,能自動、快速完成變量選擇。將之結(jié)合不同機器學(xué)習(xí)方法,提升LIBS定量分析的精密度和準確度。

      2 LIBS實驗

      2.1 樣品制備

      LIBS實驗以標準土壤樣品GBW07387(GSS-31)作為分析物。首先,將10份純凈的、不同質(zhì)量的(C2H3O2)2Sr混合PE微粉(HDPE,1810)和標準土壤,在瑪瑙研缽中均勻研磨,得到10個Sr濃度在110~850 ppm之間的土壤樣品。然后,每個樣品在20 MPa壓力下壓成薄片(φ12 mm×2.3 mm)。

      如表1所示,根據(jù)濃度從高到低,將樣品標記為C1~C10。C2和C9作為驗證集,其他樣品作為定標集。

      表1 樣品分類

      2.2 數(shù)據(jù)采集

      LIBS設(shè)備如圖1所示。光源為兩個調(diào)Q Nd-YAG激光器(λ1=355 nm,λ2=1064 nm)。激光器1(Spectral Physics,LAB-190-10)能量為45 mJ,脈沖持續(xù)時間10 ns。激光器2(Innolas,Spitlight 600)能量45 mJ,脈沖持續(xù)時間7 ns。樣品置于X-Y-Z平臺(LTB,XYZ-Tish)。兩道激光光束通過透鏡(focal length=300 mm)匯聚于樣品表面2 mm以下。等離子體輻射由透鏡(focal length=150mm)聚焦,由光纖采集,用光譜儀(LTB,Aryelle200)進行分析。光譜儀的光譜間隔在193~793 nm之間,分辨率為0.02 nm。延遲由延遲生成器(DG645,stanford)生成。優(yōu)化實驗參數(shù)后,將兩個激光器的延遲固定為1 μs,將光譜儀采集延遲設(shè)定為第二次激光脈沖后3.3 μs,ICCD(Andor,i-star)積分時間為1 s。

      在每個樣品的表面5×5矩形方陣上一共采集25幅光譜,除去離群值后,10個樣品一共獲得220幅光譜。由于每一幅光譜有42870個波長,即42870個強度值,可以得到一個光譜矩陣X[220,42870]和標簽矩陣y[220,1]。

      圖1 LIBS原理

      3 變量選擇方法

      在實際測量的光譜中,由LIBS實驗得到的光譜矩陣為X[m,n],待測元素濃度矩陣為y[m,1],其中,m為光譜數(shù)量,n為一幅光譜擁有的強度值數(shù)量。一幅LIBS光譜由大量波長對應(yīng)不同的強度值構(gòu)成,一幅光譜可以記為[x1,x2,…,xn]。大多數(shù)情況下,待測元素原子發(fā)射光譜譜線強度值x與待測元素的濃度y符合塞伯-羅馬金(Schiebe-Lomakin)公式:

      x=a·yb

      (1)

      式中,a、b在一定條件下為常數(shù),常數(shù)b與譜線的自吸收有關(guān),當(dāng)譜線自吸收可以被忽略時b=1,此時元素的發(fā)射線強度x與該元素的濃度y呈線性關(guān)系。

      3.1 基于皮爾遜相關(guān)系數(shù)的排序策略

      皮爾遜相關(guān)系數(shù)r是用于計算兩個變量之間線性相關(guān)性的統(tǒng)計準則,它可以與實驗獲得的光譜數(shù)量m構(gòu)成統(tǒng)計量F:

      首先,完善集成電路產(chǎn)業(yè)的風(fēng)險投資機制:一方面,由國家在技術(shù)創(chuàng)新初期投入一定比例的種子基金,建立風(fēng)險投資基金,通過風(fēng)險投資機構(gòu)以股份的形式向社會公開募集;另一方面,通過稅收優(yōu)惠等政策,吸引國外風(fēng)險投資基金尤其是跨國公司投資我國的集成電路產(chǎn)業(yè)。同時,政府可以設(shè)立專項資金,成立集成電路產(chǎn)業(yè)風(fēng)險擔(dān)?;?,為一些國家戰(zhàn)略重點發(fā)展的技術(shù)項目提供部分的融資擔(dān)保。

      (2)

      其中,std( )是標準偏差;cov( )是方差。

      通過計算待測元素濃度y與光譜中每個強度變量{xi|xi∈[x1,x2,…,xn]}的F,獲得集合[F1,F2,…,Fn]。變量xi的得分Fi越高,則xi與待測元素濃度y之間的線性相關(guān)性越強。通過皮爾遜相關(guān)系數(shù)可以快速得出每個強度變量xi與待測元素濃度y的相關(guān)性,變量的排序策略如圖2所示。通過變量評價準則F計算每個變量xi的得分Fi,選擇前k個得分最高的變量從而快速排除與待測元素濃度y無關(guān)、弱相關(guān)的變量,并將保留的變量記為S1,S1=[x1,x2,…,xk]。

      圖2 變量排序過程

      3.2 基于近似馬爾科夫毯(AMB)的搜索策略

      排序策略并不能消除冗余變量,變量集合S1中的冗余變量會干擾機器學(xué)習(xí)模型的準確度和精密度,本文中使用近似馬爾科夫毯消除S1中的冗余變量。

      在變量集合U中,對于變量x∈U,變量集合MB∈U(x?MB),若有:

      x⊥U-MB-x|MB

      (4)

      認為當(dāng)MB存在時,x對問題沒有貢獻,可以被刪除。由于馬爾科夫毯的時間復(fù)雜度極高,實際中,近似馬爾科夫毯常被用于消除冗余變量。下列條件滿足時,變量xi是變量xj的AMB:

      (5)

      其中,MIC(x,y)表示變量x和變量y的最大信息系數(shù)。

      圖3 變量搜索過程

      3.3 基于兩階段變量選擇的LIBS定量分析方法

      基于兩階段變量選擇的LIBS定量分析流程如圖4所示。首先通過離散小波變換(Discrete Wavelet Transform,DWT)對原始LIBS光譜進行降噪和去基線,然后通過排序策略得到變量集合S1,之后通過搜索策略得到變量集合S2,最后將S2作為機器學(xué)習(xí)方法的輸入變量,得到土壤中目標元素Sr的濃度預(yù)測模型。

      圖4 基于兩階段變量選擇的LIBS定量分析流程

      4 數(shù)據(jù)處理

      實驗采集的典型LIBS光譜如圖5所示,根據(jù)NIST數(shù)據(jù)集,圖中標注了Sr I 460.73 nm,小圖中的黑線代表原始光譜,紅線代表DWT對原始光譜降噪和去基線的效果。

      圖5 樣品C2的平均光譜

      4.1 兩階段變量選擇

      LIBS變量選擇由兩階段組成。在第一階段,通過排序策略從原始光譜X[220,42870]中保留178個與目標元素Sr濃度相關(guān)性最大的變量,保留的變量集合記為S1,這個階段保留的變量數(shù)目k一般參考定標集中光譜的數(shù)量[18]。在第二階段,通過搜索策略從S1篩選出14個沒有AMB的變量,保留的變量集合記為S2。與S1不同的是,第二階段保留的變量數(shù)目是唯一確定的。圖6的(a)和(b)分別顯示了S1和S2中的變量。完成變量選擇后,光譜矩陣由X[220,42870]變?yōu)閄[220,14],其中的時間成本為3.75 s。

      圖6 Wavelengths stored by sorting and searching strategy

      4.2 LIBS定量分析模型

      以變量集合S2結(jié)合SVR、ANN和RF,獲得的3種定標模型性能如表2的No.1,2,3所示,定標曲線如圖7所示。本文通過絕對系數(shù)R2、均方根誤差RMSE、相對偏差RE、相對標準偏差RSD來全面評價模型的質(zhì)量。

      就準確度而言,三種模型的R2均高于0.99,REC(RE of Calibration set)和REP(RE of Validation set)均低于5 %,RMSEC和RMSEP均低于22 ppm,表明三種模型都有很好的預(yù)測能力。就精密度而言,三種模型的RSD均低于20 %,說明模型對同一樣品表面不同位置的光譜預(yù)測偏差較小。

      圖7 以S2為輸入變量建立的3個定標模型

      將本文提出的變量選擇方法與經(jīng)典的變量選擇方法PLS-VIP作比較。在實踐中,一般選擇VIP值大于1的變量作為機器學(xué)習(xí)模型的輸入變量[11]。通過PLS-VIP方法,從X[220,42870]中篩選出9994個VIP值大于1的變量,將此變量集合記為S3。完成變量選擇后,光譜矩陣由X[220,42870]變?yōu)閄[220,9994]。將S3分別作為ANN、SVR和RF的輸入變量,得到的定標模型的性能如表2的No.4,5,6所示。

      可以發(fā)現(xiàn),無論是準確度還是精密度,以S2為輸入的3種定標模型均優(yōu)于以S3為輸入的3種定標模型。

      5 結(jié) 論

      本文針對LIBS定量分析中的變量選擇問題,提出一種兩階段的變量選擇方法,并將該方法結(jié)合機器學(xué)習(xí)方法用于土壤中Sr的定量分析。將該方法得到的14個變量集合記為S2,將PLS-VIP方法得到的9994個變量集合記為S3。通過比較分別由S2和S3生成的ANN、SVR、RF發(fā)現(xiàn):以S2生成的模型,R2大于0.99,RE低于5 %,RMSE低于22 ppm,RSD低于20 %,準確度和精密度均優(yōu)于以S3生成的模型。研究結(jié)果證明了該方法的高效性和普適性,在LIBS定量分析中有著重要作用。

      表2 分別以S2、S3為輸入的SVR、ANN、RF模型的表現(xiàn)

      猜你喜歡
      定標排序光譜
      基于三維Saab變換的高光譜圖像壓縮方法
      排序不等式
      我國為世界大豆精準選種“定標”
      基于恒星的電離層成像儀在軌幾何定標
      恐怖排序
      節(jié)日排序
      刻舟求劍
      兒童繪本(2018年5期)2018-04-12 16:45:32
      基于角反射器的機載毫米波云雷達外定標實驗
      4m直徑均勻擴展定標光源
      星載近紅外高光譜CO2遙感進展
      汉沽区| 怀远县| 垣曲县| 永德县| 连平县| 永康市| 射洪县| 新晃| 崇左市| 清流县| 侯马市| 浦北县| 枝江市| 盖州市| 且末县| 南安市| 浮梁县| 林口县| 扎鲁特旗| 邛崃市| 南涧| 正蓝旗| 文昌市| 闽清县| 临洮县| 甘洛县| 新沂市| 江川县| 东至县| 江源县| 元氏县| 轮台县| 嘉定区| 安泽县| 府谷县| 屏东县| 曲松县| 丹巴县| 宁明县| 和平区| 瑞丽市|