張燕君, 康成龍, 柳雅倩, 付興虎, 張金霄, 王明學(xué), 楊劉震
燕山大學(xué)信息科學(xué)與工程學(xué)院, 河北省特種光纖與光纖傳感重點實驗室, 河北 秦皇島 066004
隨著科技不斷地發(fā)展, 人類活動范圍不斷地擴(kuò)大, 生活污水、 工業(yè)和農(nóng)業(yè)廢水的排放量激增, 從而對環(huán)境的影響也越來越嚴(yán)重, 其中水質(zhì)污染尤其嚴(yán)重。 水中總氮(total nitrogen, TN)、 總磷(total phosphorus, TP)是評價水體受到污染嚴(yán)重程度的關(guān)鍵性指標(biāo)[1]之一。 當(dāng)水域中TN、 TP含量過高時, 會造成水體富營養(yǎng)化嚴(yán)重, 致使藻類和浮游生物過度繁殖, 水體透明度下降, 水質(zhì)甚至?xí)夯劣泻Φ某潭龋?最終對人類的生活產(chǎn)生危害, 因此快速準(zhǔn)確測定水體中TN、 TP的含量十分必要。
目前對于TN、 TP測定的常規(guī)方法有很多, 比如國家標(biāo)準(zhǔn)法即堿性過硫酸鉀氧化-紫外分光光度法[2]和鉬酸銨分光光度法。 但是這些方法適用范圍較小, 操作繁瑣, 對實驗環(huán)境要求高且檢測時間長。 近年來光譜技術(shù)在水質(zhì)檢測領(lǐng)域得到廣泛的應(yīng)用, 在檢測重金屬離子濃度[3]和COD含量[4]方面較為成熟, 但在水中氮磷含量檢測[5]方面少有報道。 而SERS技術(shù)[6-7]能夠?qū)崿F(xiàn)快速檢測, 操作簡單, 相較于普通拉曼光譜技術(shù), SERS技術(shù)通過制備金屬納米粒子(如Au, Ag和Cu等)作為增強基底來吸附待測溶液中某些分子, 實現(xiàn)拉曼信號增強, 增強效果甚至可以達(dá)到104~106倍, 并且SERS頻道窄, 水溶液對光譜信號干擾弱, 可檢測到的光譜信息豐富, 非常適用于水質(zhì)的在線快速檢測[8]。 為了滿足水中氮磷含量檢測的高精度、 高效率等要求, 本文提出應(yīng)用SERS 技術(shù)結(jié)合灰狼優(yōu)化支持向量回歸(grey wolf optimizer-support vector regression, GWO-SVR)算法建立水中氮磷濃度預(yù)測模型。 SVR在處理非線性回歸問題上是一種比較高效優(yōu)越的算法, 將其與其他智能算法相結(jié)合會使得預(yù)測模型更加準(zhǔn)確高效。 GWO通過優(yōu)化SVR的懲罰因子C和核參數(shù)g建立訓(xùn)練模型, 避免了陷入過擬合和局部最優(yōu)等問題, 提高了模型的預(yù)測精度。
支持向量回歸(SVR)是在支持向量機(jī)(support vector machine, SVM)基礎(chǔ)上擴(kuò)展出來的一種監(jiān)督性機(jī)器學(xué)習(xí)算法, 用于處理數(shù)據(jù)回歸預(yù)測方面的問題[9]。 對于給定的樣本數(shù)據(jù){(xi,yi),i=1, 2, …,n}xi∈Rn,yi∈Rn這里xi∈Rn是第i個樣本的輸入值,yi∈Rn是第i個樣本的輸出值,n為訓(xùn)練樣本的數(shù)目, 假定回歸函數(shù)為
f(x)=ωφ(x)+b
(1)
式(1)中,φ(x)為非線性映射函數(shù),ω和b為要求解的參數(shù)。
(2)
式(2)中, ‖ω‖2為懲罰函數(shù);C為懲罰因子, 訓(xùn)練誤差受C影響;g則影響著回歸函數(shù)的精度。 因此C和g是評價函數(shù)的重要指標(biāo), 也是GWO算法要進(jìn)行尋優(yōu)的兩個參數(shù)。
(3)
(4)
(5)
灰狼優(yōu)化算法(GWO)是一種群體智能優(yōu)化算法, 該算法模擬了自然界中灰狼的狩獵機(jī)制和領(lǐng)導(dǎo)等級[11]。 在建立灰狼等級模型時, 將具有最優(yōu)適應(yīng)度值的狼群個體依次標(biāo)記為α,β,δ, 剩下的標(biāo)記為ω。 在尋優(yōu)過程中, 首先由三只頭狼α,β,δ搜尋獵物位置, 逐漸接近獵物, 然后帶領(lǐng)ω包圍目標(biāo)。
D=|CXp(t)-X(t)|
(6)
X(t+1)=XP(t)-AD
(7)
式(6)和式(7)中,t為當(dāng)前迭代次數(shù),A和C為協(xié)同系數(shù)向量;Xp是獵物位置;X表示當(dāng)前灰狼位置。 當(dāng)狼群開始包圍獵物時, 隨著目標(biāo)獵物位置發(fā)生變化,α,β,δ的位置也在不斷的迭代變化, 為獲取最優(yōu)值更新公式為
(8)
(9)
(10)
式(8)—式(10)中,Xα(t),Xβ(t)和Xδ(t)分別是當(dāng)前種群迭代t次后α,β,δ位置向量;Dα,Dβ,Dδ分別表示迭代t次后當(dāng)前候選灰狼與最優(yōu)三條狼的之間距離;X(t+1)為迭代t+1次后灰狼的位置。 灰狼群通過迭代過程不斷地更新位置, 逐步的逼近獵物, 直到算法迭代完成, 成功捕獲獵物獲取最優(yōu)解。
GWO-SVR算法[12]的核心思想是利用GWO的快速搜索能力, 實現(xiàn)對SVR參數(shù)的自動優(yōu)化, 以提升模型的預(yù)測效果[13]。 首先根據(jù)所建模型需求確定輸入數(shù)據(jù)和輸出數(shù)據(jù)并對數(shù)據(jù)集進(jìn)行預(yù)處理。 然后對GWO算法設(shè)置初始化參數(shù), 初始化狼群數(shù)量M=20, 迭代次數(shù)T=10。 根據(jù)要優(yōu)化的模型和數(shù)據(jù)集的需求設(shè)置對應(yīng)SVR模型的可調(diào)節(jié)參數(shù)數(shù)目和參數(shù)的取值范圍, 本文SVR所要優(yōu)化的參數(shù)為C和g, 取值范圍為0.01~100。
適應(yīng)度函數(shù)是評價參數(shù)性能的重要指標(biāo), 選取SVR算法訓(xùn)練集樣本的均方誤差(MSE)作為適應(yīng)度函數(shù), MSE的數(shù)值越小則認(rèn)為目標(biāo)參數(shù)值越優(yōu), 適應(yīng)度函數(shù)式為
(11)
圖1 GWO-SVR算法流程圖
實驗使用的儀器是必達(dá)泰克公司生產(chǎn)的BWS465-785S便攜式拉曼光譜儀, 選取激發(fā)波長785 nm作為激發(fā)光源, 激發(fā)功率設(shè)置為300 mW, 在光譜范圍為175~3 200 cm-1范圍內(nèi)對待測樣本進(jìn)行測量, 積分時間設(shè)置為10 000 ms, 每個樣本檢測3次取平均值。 配合光譜儀自帶軟件BWRam4TM進(jìn)行光譜預(yù)處理, 然后采集光譜數(shù)據(jù)獲取光譜特征值建立模型, 測試其預(yù)測功能并分析。
實驗采用的TN和TP標(biāo)準(zhǔn)液為環(huán)境保護(hù)部標(biāo)準(zhǔn)樣品, 用18兆歐超純水將TN和TP樣本溶液分別稀釋配制成不同濃度梯度的待測溶液。 TN和TP濃度范圍分為1.5~15和2~15 μg·mL-1, 樣本數(shù)為26和23。 對每個配制樣本充分混合均勻, 放在10 mL離心管中密封避光保存。
硝酸銀(AgNO3)和檸檬酸鈉(C7H5Na3O7)購置于國藥集團(tuán)化學(xué)試劑有限公司。 取1 mL濃度為1%的硝酸銀溶液于錐形瓶中并用超純水定容至200 mL, 進(jìn)行加熱并不斷攪拌, 使硝酸銀充分溶解。 當(dāng)水沸騰后迅速加入3 mL濃度為1%的檸檬酸鈉溶液, 繼續(xù)加熱攪拌60 min, 直到變化為乳白色即銀溶膠制備完成。 將制備好的銀溶膠放置高硼硅試劑瓶中冷卻至室溫后, 4 ℃冷藏保存。
用一次性滴管吸取配制好的樣本溶液2 mL滴入試管中, 然后吸取配制好的銀溶膠1 mL緩慢滴入試管中, 輕晃搖勻, 避光靜置30 min, 使其充分混合后進(jìn)行檢測。 實驗時, 打開激光拉曼光譜儀預(yù)熱15 min, 然后將配制好的加入了銀溶膠的待測溶液用一次性滴管取3 mL放入比色皿中, 蓋上遮光罩制造黑暗環(huán)境進(jìn)行檢測。 為使SERS基底增強效果理想化, 現(xiàn)通過對比實驗探究基底與待測溶液的最佳體積混合比。 將TN和TP分別與銀溶膠進(jìn)行1∶1, 1∶2, 1∶3, 2∶1, 3∶1的體積比混合, 靜置30 min后觀察其拉曼圖譜。 圖2(a)和(b)分別為不同比例TN和TP的SERS光譜圖。 由圖可知在相同條件下, TN和TP溶液均與銀溶膠以2∶1混合時增強效果最好。
圖2 表面增強拉曼光譜圖
TN和TP的主要拉曼特征峰的相關(guān)信息見表1和表2。 在檢測濃度范圍內(nèi)光譜中特征峰的峰值強度會隨著分子式基團(tuán)濃度的改變而改變, 峰值強度越高表示此處物質(zhì)含量越高。 通過配制不同濃度梯度溶液加入銀溶膠進(jìn)行檢測, 得到TN和TP溶液能檢測到特征峰的最低濃度分別為1.5和2 μg·mL-1, 當(dāng)繼續(xù)降低待測溶液濃度時并不能檢測到明顯的特征峰。 實驗檢測選取穩(wěn)定性較好的TN溶液948.90 cm-1處特征峰和TP溶液930.44 cm-1處特征峰的峰值強度作為訓(xùn)練模型的輸入值, 以其對應(yīng)的濃度值作為模型的輸出值。
表1 TN的拉曼光譜特征峰
表2 TP的拉曼光譜特征峰
在實驗過程中, 由于受到樣本的熒光背景和儀器的系統(tǒng)噪聲影響, 光譜圖出現(xiàn)基線漂移和峰值淹沒導(dǎo)致光譜信噪比降低, 所以需對光譜進(jìn)行預(yù)處理。 本文采用暗電流扣除、 光譜背景扣除(基線校正)和光譜平滑對原始光譜進(jìn)行預(yù)處理, 各光譜在測量之前用BWRam4TM軟件去除暗電流。 圖3(a)為原始光譜和進(jìn)行光譜背景扣除(基線校正)后的光譜。 圖3(b)為光譜平滑處理, 選用Savitzky-Golay Filters平滑法進(jìn)行光譜平滑處理, 窗口尺寸大小選擇5作為光譜平滑的數(shù)據(jù)點。
圖3 光譜預(yù)處理
分別從配制好的TN和TP樣本溶液中選取8組和7組作為測試集, 剩余溶液作為訓(xùn)練集。 將處理過的訓(xùn)練集峰值強度作為模型的輸入, TN和TP溶液濃度為輸出建立GWO-SVR濃度預(yù)測模型。
GWO-SVR定量分析模型對TN和TP測試集預(yù)測結(jié)果模型評價如表3所示。 基于模型的實際值和預(yù)測值之間的相關(guān)度結(jié)果分析如圖4所示。
表3 GWO-SVR模型評價結(jié)果
圖4 預(yù)測值和真實值相關(guān)性比較
由表3可以看出, GWO-SVR定量模型得到的TN和TP溶液的相關(guān)度均高于0.998, MSE均低于0.04, 具有較好的精確度。 從圖4可以看出, 模型的相關(guān)度極高, 預(yù)測值濃度和真實值濃度基本都落在同一點上, 而且建模時間均在2 s內(nèi), 具有良好的實時性。
將同組數(shù)據(jù)通過人工蜂群算法優(yōu)化支持向量回歸(ABC-SVR)和粒子群算法優(yōu)化神經(jīng)網(wǎng)絡(luò)(PSO-BP)分別建模進(jìn)行預(yù)測, 其中ABC-SVR模型初始蜂群規(guī)模M=20, 迭代次數(shù)T=10, 個體最大更新次數(shù)G=100, 蜜源數(shù)量為M/2; PSO-BP模型初始參數(shù)設(shè)置為粒子群規(guī)模M=200, 學(xué)習(xí)因子C1和C2均為1, 隱藏層節(jié)點數(shù)為13, 最大訓(xùn)練次數(shù)為40 000。 模型評價結(jié)果見表4和表5。 不同建模程序的相關(guān)度曲線見圖5。
表4 不同模型預(yù)測結(jié)果對比(TN)
表5 不同模型預(yù)測結(jié)果對比(TP)
從表4和表5評價結(jié)果可知, ABC-SVR模型運行時間雖控制在2 s左右, 但其相關(guān)系數(shù)和均方誤差評價結(jié)果均低于GWO-SVR模型和PSO-BP模型; 同樣PSO-BP模型相關(guān)度均高于0.996, MSE均低于0.05, 評價結(jié)果略低于GWO-SVR模型, 但運行時間和GWO-SVR模型相差數(shù)倍。 結(jié)合圖5分析來看, GWO-SVR定量分析模型對TN和TP溶度的預(yù)測有著更好的相關(guān)性。 綜上來說, GWO-SVR模型既能保證較好的預(yù)測精度又能將運行時間控制在2 s內(nèi), 具有良好實時性。 而且相較于另外兩種模型來說, 該模型有著更少的參數(shù)輸入, 只需設(shè)置種群數(shù)量M和迭代次數(shù)T兩個參數(shù)。 GWO對SVR進(jìn)行優(yōu)化, 可以在短時間內(nèi)尋找到最優(yōu)的全局最優(yōu)參數(shù)組合(C,g), 縮短了模型的運行時間, 提高了預(yù)測精度, 進(jìn)而提升了模型的工作效率。 由此可見GWO-SVR建立的定量分析模型結(jié)合拉曼光譜可以很好地實現(xiàn)對不同濃度梯度的TN和TP溶液含量的預(yù)測, 為以后水質(zhì)監(jiān)測提供了新方法。
圖5 不同模型相關(guān)性曲線
提出了一種以納米銀溶膠作為基底的SERS技術(shù)結(jié)合GWO-SVR混合優(yōu)化算法實現(xiàn)對不同濃度TN和TP溶液的快速定量檢測方法。 通過以測得溶液光譜強度作為輸入值,溶液濃度作為輸出建立模型。 經(jīng)過暗電流扣除、 基線校正和光譜平滑三個步驟對原始數(shù)據(jù)進(jìn)行預(yù)處理, 選取GWO優(yōu)化算法對SVR算法的參數(shù)C和g進(jìn)行尋優(yōu), 避免了局部最優(yōu)和過擬合問題, 提升了收斂速度。 為做對比將同組數(shù)據(jù)代入ABC-SVR和PSO-BP模型中, 以相關(guān)系數(shù)、 均方誤差和運行時間作為指標(biāo)進(jìn)行對比。 預(yù)測結(jié)果表明, GWO-SVR定量分析模型相關(guān)系數(shù)、 均方誤差以及建模時間均優(yōu)于其他兩種模型, 相關(guān)系數(shù)高達(dá)0.998 5, 均方誤差也控制在0.04以內(nèi), 說明該模型能較好的完成快速定量分析, 具備良好的實時性和更高的檢測精度。 因此, 此方法可以適用于水中TN和TP含量的快速定量檢測, 為今后水質(zhì)檢測提供了理論依據(jù)。