• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      雙模型結(jié)合進(jìn)一步降低預(yù)測(cè)均方根誤差和均方根相對(duì)誤差的方法

      2015-07-09 18:11:10吳雪梅劉志強(qiáng)張?zhí)忑?/span>李華
      分析化學(xué) 2015年5期

      吳雪梅 劉志強(qiáng) 張?zhí)忑?李華

      摘 要 前期研究工作提出了以預(yù)測(cè)均方根相對(duì)誤差最小為回歸目標(biāo)的方法(Minimization of prediction relative error,MPRE),它能使得預(yù)測(cè)結(jié)果的均方根相對(duì)誤差更小。偏最小二乘法(Partial least squares,PLS)是以預(yù)測(cè)均方根誤差為回歸目標(biāo),能使得預(yù)測(cè)結(jié)果的均方根誤差更小。基于多模型結(jié)合的思想,提出將MPRE與PLS相結(jié)合的雙模型結(jié)合多元校正方法。本方法步驟為:(1) 分別采用MPRE與PLS法對(duì)校正集建模;(2) 計(jì)算閾值;(3)分別采用已建立好的MPRE與PLS模型進(jìn)行預(yù)測(cè);(4)將預(yù)測(cè)結(jié)果與閾值進(jìn)行比較,得到預(yù)測(cè)結(jié)果。通過(guò)對(duì)酒精的近紅外光譜與汽油紫外光譜進(jìn)行定量分析結(jié)果表明,本方法可進(jìn)一步減小預(yù)測(cè)均方根誤差與相對(duì)誤差。

      關(guān)鍵詞 雙模型; 多元校正; 均方根相對(duì)誤差; 均方根誤差

      1 引 言

      隨著現(xiàn)代大型儀器的使用,多元校正方法被廣泛應(yīng)用于分析化學(xué)領(lǐng)域【1~3】。目前常用的多元校正方法主要有經(jīng)典最小二乘法(Classical least-squares,CLS)、主成分回歸法(Principal component regression,PCR)、偏最小二乘法(Partial least squares,PLS)等線性多元校正方法及人工神經(jīng)網(wǎng)絡(luò)法(Artificial neural network, ANN)、非線性PLS等非線性多元校正方法【7,8】。無(wú)論是線性多元校正方法,還是非線性多元校正方法,均方根誤差(Root-mean-square error of prediction, RMSEP)通常被用作多元校正的評(píng)價(jià)指標(biāo)【9~11】。換言之,在這些多元校正方法中,其校正的目標(biāo)是預(yù)測(cè)樣本組分的均方根誤差最小,其建模的代價(jià)函數(shù)是預(yù)測(cè)誤差平方和。采用該代價(jià)函數(shù)可在一定程度上使預(yù)測(cè)組分的絕對(duì)誤差盡可能小。在組分值動(dòng)態(tài)范圍較小時(shí),現(xiàn)有的線性或非線性多元校正方法能取得較為理想的結(jié)果。但是當(dāng)組分值動(dòng)態(tài)范圍較大時(shí),如組分值范圍為1~100 mmol/L時(shí),雖然采用現(xiàn)有的多元校正方法能使得預(yù)測(cè)均方根誤差較?。ㄈ珙A(yù)測(cè)均方根誤差為0.5 mmol/L),在實(shí)際應(yīng)用中,較小的預(yù)測(cè)均方根誤差相對(duì)較大組分值而言相對(duì)誤差較小,預(yù)測(cè)數(shù)據(jù)可靠性高,但是相對(duì)于較小組分值而言,預(yù)測(cè)相對(duì)誤差非常大,甚至超過(guò)100%,預(yù)測(cè)數(shù)據(jù)可靠性變差。

      本研究組前期工作提出了一種能使預(yù)測(cè)均方根相對(duì)誤差最小化的方法(Minimization of prediction relative error,MPRE)【12】。MPRE法選擇反向傳播神經(jīng)網(wǎng)絡(luò)(Back-propagation artificial neural network, BP-ANN))【13】為回歸方法,通過(guò)改變預(yù)測(cè)器輸出來(lái)實(shí)現(xiàn)預(yù)測(cè)結(jié)果均方根相對(duì)誤差最小的目的。PLS是以均方根誤差最小為回歸目標(biāo)的多元校正方法,1983年Wold and Martens將該方法引入化學(xué)領(lǐng)域后,由于其性能突出被廣泛應(yīng)用于多元校正分析中【14】。本研究利用MPRE法與PLS法的雙模型結(jié)合多元校正方法,進(jìn)一步減小預(yù)測(cè)均方根誤差與相對(duì)誤差。

      2 基本理論

      2.1 MPRE法簡(jiǎn)介

      預(yù)測(cè)均方根相對(duì)誤差最小化方法(MPRE)【12】采用BP神經(jīng)網(wǎng)絡(luò)建模。與常見(jiàn)的神經(jīng)網(wǎng)絡(luò)建模方法相同,MPRE將光譜信息作為輸入信息,采用經(jīng)典的訓(xùn)練方法對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。為了實(shí)現(xiàn)預(yù)測(cè)均方根相對(duì)誤差最小,在MPRE方法中,對(duì)輸出值進(jìn)行了調(diào)整,以組分信息的對(duì)數(shù)值作為輸出:

      文獻(xiàn)已從理論上證明,對(duì)建模輸出值采用組分值的對(duì)數(shù),MPRE可實(shí)現(xiàn)預(yù)測(cè)均方根相對(duì)誤差最小的目標(biāo); 雖然MPRE法與PLS法的預(yù)測(cè)結(jié)果的RMSEP值相當(dāng),但MPRE法能獲得更小的均方根相對(duì)誤差。

      預(yù)測(cè)均方根誤差RMSEP定義為:

      2.2 雙模型結(jié)合方法

      2.2.1 基本思想 從文獻(xiàn)的理論分析與實(shí)驗(yàn)結(jié)果可知,采用常規(guī)的多元校正方法只能實(shí)現(xiàn)RMSEP最小,難以實(shí)現(xiàn)預(yù)測(cè)均方根相對(duì)誤差Pre最小,其原因是對(duì)低含量組分預(yù)測(cè)時(shí),預(yù)測(cè)誤差與組分值的比值較大,從而導(dǎo)致總體預(yù)測(cè)均方根相對(duì)誤差較大。MPRE方法能減小低含量組分的預(yù)測(cè)誤差,保證預(yù)測(cè)均方根相對(duì)誤差較小,但是由于其功能設(shè)計(jì)時(shí)只保證預(yù)測(cè)均方根相對(duì)誤差最小,并未考慮預(yù)測(cè)均方根誤差RMSEP,故在組分值較大時(shí),其預(yù)測(cè)誤差也較大,甚至超過(guò)常規(guī)多元校正方法。從文獻(xiàn)的實(shí)驗(yàn)結(jié)果還可看出,MPRE與PLS的RMSEP相當(dāng),但預(yù)測(cè)均方根相對(duì)誤差Pre卻存在明顯差別。從統(tǒng)計(jì)學(xué)角度來(lái)看,在組分值較小時(shí)MPRE法預(yù)測(cè)絕對(duì)誤差較小,當(dāng)組分值較大時(shí)PLS法預(yù)測(cè)相對(duì)誤差較小。如果將MPRE法與PLS法等常規(guī)校正算法相結(jié)合,在組分值較小時(shí),采用MPRE預(yù)測(cè)結(jié)果,在組分值較大時(shí)采用常規(guī)校正算法(如PLS)預(yù)測(cè)結(jié)果,那么最終預(yù)測(cè)均方根相對(duì)誤差與預(yù)測(cè)均方根誤差均可能進(jìn)一步減小。

      2.2.2 閾值確定 從基本思想可知,雙模型結(jié)合方法的關(guān)鍵是確定一個(gè)合適的閾值g,當(dāng)采用MPRE預(yù)測(cè)結(jié)果小于閾值g時(shí),選用MPRE法預(yù)測(cè)結(jié)果,反之選用PLS等常規(guī)校正算法的預(yù)測(cè)結(jié)果。

      假設(shè)已知MPRE法取得的預(yù)測(cè)均方根相對(duì)誤差為Pre,PLS等常規(guī)多元校正方法預(yù)測(cè)均方根誤差為RMSEPs。顯然閾值g的選擇應(yīng)滿足如下條件:對(duì)于組分值為g的樣本而言,MPRE的預(yù)測(cè)均方根誤差RMSEP1與常規(guī)多元校正方法預(yù)測(cè)均方根誤差RMSEPs2相等。

      RMSEP1=gPre=RMSEP2 (7)

      由式(7)可求得閾值:

      g=RMSEP2Pre(8)

      在實(shí)際預(yù)測(cè)中,如果實(shí)驗(yàn)數(shù)據(jù)較多,可將數(shù)據(jù)分為校正集、驗(yàn)證集和預(yù)測(cè)集。此時(shí),RMSEP2即為驗(yàn)證集的預(yù)測(cè)均方根誤差,Pre為驗(yàn)證集的預(yù)測(cè)均方根相對(duì)誤差。如果沒(méi)有大量數(shù)據(jù),可將數(shù)據(jù)分為校正集和預(yù)測(cè)集。此時(shí),由于不知道待測(cè)光譜的具體組分值,RMSEP2與Pre值無(wú)法獲得,這兩個(gè)參數(shù)可以分別采用常規(guī)校正算法的校正均方根誤差(Root-mean-square error of calibration, RMSEC)與MPRE法中間層確定時(shí)計(jì)算的預(yù)測(cè)相對(duì)誤差來(lái)代替。endprint

      2.2.3 雙模型結(jié)合方法步驟 雙模型結(jié)合法步驟為: 分別采用MPRE法與PLS法對(duì)校正集建模;由公式(8)確定閾值g; 分別采用已建立好的MPRE與PLS模型進(jìn)行預(yù)測(cè),設(shè)預(yù)測(cè)結(jié)果分別為p1與p2;如果p1

      3 實(shí)驗(yàn)數(shù)據(jù)

      與文獻(xiàn)相同,為了驗(yàn)證所提方法在預(yù)測(cè)單組分樣品、同時(shí)預(yù)測(cè)多組分樣品、在樣品存在組分值為0時(shí)的預(yù)測(cè)性能,同時(shí),也為了說(shuō)明算法對(duì)于不同光譜數(shù)據(jù)的適應(yīng)性,實(shí)驗(yàn)中選擇了兩組不同類(lèi)型的數(shù)據(jù)。

      數(shù)據(jù)A 酒精的近紅外光譜測(cè)量數(shù)據(jù)。酒精的濃度范圍為:0.02~0.61(體積比,間隔0.01)共60個(gè)樣本,由VERTEX 70傅里葉變換近紅外光譜儀(布魯克公司)測(cè)量各溶液的光譜。實(shí)驗(yàn)中,溶液按濃度從低到高排列,在建模與預(yù)測(cè)時(shí),從第2個(gè)樣品開(kāi)始,每隔2個(gè)樣品選一個(gè)樣品作為預(yù)測(cè)集樣品,其余樣品作為校正集樣品。

      數(shù)據(jù)B 這是一組在網(wǎng)上公開(kāi)的汽油的紫外光譜數(shù)據(jù)。實(shí)驗(yàn)中采用了其中名為“gasoil”的這組數(shù)據(jù)。下載網(wǎng)址為:http://myweb.dal.ca/pdwentze/downloads.html, Data Set #3。該數(shù)據(jù)共有115個(gè)樣品的組分信息和光譜數(shù)據(jù)。根據(jù)樣品提供者建議,采用前70個(gè)樣品作為校正集樣品,后續(xù)44個(gè)樣品為預(yù)測(cè)集樣品,最后一個(gè)為奇異值,在實(shí)驗(yàn)中不予使用。在這組數(shù)據(jù)中,組分2和3的組分值范圍較寬,便于驗(yàn)證所提方法的性能。

      4 結(jié)果與討論

      在實(shí)驗(yàn)中,PLS_toolbox(V5.5)用于建立PLS模型。建模時(shí)采用留一交叉檢驗(yàn)法確定因子數(shù),對(duì)數(shù)據(jù)集A確定的因子數(shù)是3,對(duì)數(shù)據(jù)集B確定的因子數(shù)為4。

      MPRE法采用MATLAB 2006a編寫(xiě)完成。同文獻(xiàn),神經(jīng)網(wǎng)絡(luò)的輸入和輸出采用的是autoscale預(yù)處理方法,神經(jīng)網(wǎng)絡(luò)的中間層傳遞函數(shù)為logsig函數(shù),輸出層傳遞函數(shù)為purelin函數(shù),對(duì)數(shù)據(jù)集A確定的中間層神經(jīng)元數(shù)為2,對(duì)數(shù)據(jù)集B確定的中間層神經(jīng)元數(shù)為3?;貧w過(guò)程的訓(xùn)練目標(biāo)誤差設(shè)置為0。訓(xùn)練的最大迭代次數(shù)設(shè)置為5000。對(duì)于數(shù)據(jù)B,其組分值中含有0,因此MPRE建模與預(yù)測(cè)時(shí)分別選用式(3)與式(4)進(jìn)行處理,且f值設(shè)定為0.001。

      根據(jù)雙模型結(jié)合方法步驟,閾值確定結(jié)果見(jiàn)表1。預(yù)測(cè)均方根誤差與預(yù)測(cè)均方根相對(duì)誤差統(tǒng)計(jì)結(jié)果見(jiàn)表 2。

      實(shí)驗(yàn)結(jié)果表明,對(duì)于數(shù)據(jù)A,采用雙模型結(jié)合算法后,預(yù)測(cè)結(jié)果的預(yù)測(cè)均方根誤差與預(yù)測(cè)均方根相對(duì)誤差均比MPRE法與PLS法低;對(duì)于數(shù)據(jù)B,第二組分的預(yù)測(cè)均方根誤差介于MPRE法與PLS算法之間,但預(yù)測(cè)均方根相對(duì)誤差小于MPRE法與PLS算法,第三組分的預(yù)測(cè)均方根誤差與預(yù)測(cè)均方根相對(duì)誤差均低于MPRE法與PLS法。從理論上講,采用雙模型結(jié)合校正算法預(yù)測(cè)結(jié)果的預(yù)測(cè)均方根誤差與預(yù)測(cè)均方根相對(duì)誤差均應(yīng)比MPRE法與PLS法低,但是在實(shí)際計(jì)算中,一方面由于預(yù)測(cè)誤差具有一定的隨機(jī)性;另一方面閾值選取中重要參數(shù)RMSEP與Pre受到數(shù)據(jù)量小的限制,采用建模時(shí)RMSEC與選擇中間層時(shí)確定的預(yù)測(cè)均方

      根誤差代替,使得閾值g不夠準(zhǔn)確;最終導(dǎo)致數(shù)據(jù)B組分二的預(yù)測(cè)均方根誤差大于基本方法預(yù)測(cè)均方根誤差。如果通過(guò)大量實(shí)驗(yàn),準(zhǔn)確地確定RMSEP與Pre兩個(gè)參數(shù),那么采用雙模型結(jié)合算法將會(huì)以更大概率取得更優(yōu)的預(yù)測(cè)結(jié)果。

      5 結(jié) 論

      雙模型結(jié)合多元校正方法是一個(gè)多模型選擇算法,當(dāng)采用MPRE法預(yù)測(cè)結(jié)果低于閾值時(shí),選用MPRE法結(jié)果,反之選用PLS法預(yù)測(cè)結(jié)果。該方法充分利用了MPRE法對(duì)低含量組分值預(yù)測(cè)準(zhǔn)確與PLS法對(duì)高組分預(yù)測(cè)相對(duì)誤差較小的優(yōu)點(diǎn),可同時(shí)減小預(yù)測(cè)均方根相對(duì)誤差與預(yù)測(cè)均方根誤差,適用于組分值具有較寬范圍的多元校正。

      References

      1 Silva M A M, Ferreira M H, Braga J W B, Sena M M. Talanta, 2012, 89: 342-351

      2 Beebe K R, Kowalski B R. Anal. Chem., 1987, 59(17): 1007A-1017A

      3 NI Yong-Nian, CAO Dong-Xia. Chem. J. Chinese Universities, 2006, 27(6): 1048-1050

      倪永年, 曹東霞. 高等學(xué)?;瘜W(xué)學(xué)報(bào), 2006, 27(6): 1048-1050

      4 Zhou Y, Cao H, Hu J, Yu S, Zhao Q, Li X, Ju L. Instrum. Sci. Technol., 2011, 39(4): 394-405

      5 Ns T, Martens H. J. Chemometr., 1988, 2(2): 155-167

      6 BI Yan-Lan, REN Xiao-Na, PENG Dan, YANG Guo-Long, ZHANG Lin-Shang, WANG Xue-De. Chinese J. Anal. Chem., 2013, 41(9): 1366-1372

      畢艷蘭, 任小娜, 彭 丹,楊國(guó)龍, 張林尚, 汪學(xué)德. 分析化學(xué), 2013, 41(9): 1366-1372

      7 Long J R, Gregoriou V G, Gemperline P J. Anal. Chem., 1990, 62(17): 1791-1797

      8 Malthouse E C, Tamhane A C, Mah R S H. Comput. Chem. Eng., 1997, 21(8): 875-890

      9 Li Y, Shao X, Cai W. Talanta, 2007, 72(1): 217-222

      10 Shao X, Bian X, Cai W. Anal. Chim. Acta, 2010, 666(1): 32-37

      11 Nakagawa H, Tajima T, Kano M, Kim S, Hasebe S, Suzuki T, Nakagami H. Anal. Chem., 2012, 84(8): 3820-3826

      12 Wu X, Liu Z, Li H. Anal. Methods, 2014, 6(12): 4056-4060

      13 Mitchell T M. Mach. Learn., 1997: 81-127

      14 Zhang M H, Xu Q S, Massart D L. Anal. Chem., 2005, 77(5): 1423-1431

      广安市| 通河县| 昌吉市| 关岭| 辉县市| 江陵县| 黔东| 福贡县| 睢宁县| 六盘水市| 红桥区| 房产| 石台县| 防城港市| 亚东县| 永和县| 海盐县| 咸丰县| 盐亭县| 西盟| 游戏| 台南县| 姜堰市| 晴隆县| 峨眉山市| 海口市| 府谷县| 米泉市| 蒙城县| 宝清县| 金湖县| 松江区| 柳河县| 大同市| 平泉县| 柯坪县| 全州县| 郯城县| 海宁市| 巍山| 邵阳市|