居錦武
(四川理工學(xué)院計算機(jī)學(xué)院,四川自貢 643000)
基于LS-SVM的養(yǎng)殖水體氨氮含量分析預(yù)測模型
居錦武
(四川理工學(xué)院計算機(jī)學(xué)院,四川自貢 643000)
養(yǎng)殖水體的氨氮含量是水產(chǎn)養(yǎng)殖中的關(guān)鍵水質(zhì)指標(biāo),是評價水體污染情況的基本測量項目。設(shè)計一種自動氨氮監(jiān)測系統(tǒng),自動抽取水樣并定時測量,使用最小二乘支持向量機(jī)算法(LS-SVM)建立了分析預(yù)測模型,LS-SVM最小二乘支持向量機(jī)算法增強(qiáng)了泛化能力,減少了異常樣本的預(yù)測偏差,提高了預(yù)測學(xué)習(xí)的精度。對基于神經(jīng)網(wǎng)絡(luò)模型、基于LS-SVM模型進(jìn)行了仿真比較,結(jié)果顯示LS-SVM模型具有更優(yōu)良的分析預(yù)測效果。
支持向量機(jī);水產(chǎn)養(yǎng)殖;氨氮;分析預(yù)測模型;比色法;光強(qiáng)
隨著水產(chǎn)養(yǎng)殖業(yè)的快速發(fā)展,養(yǎng)殖水體的污染情況越來越嚴(yán)重。各種餌料、化學(xué)物質(zhì)、藥物、排泄物殘留在水體中,經(jīng)腐敗和分解,引起水體水質(zhì)的嚴(yán)重劣化,使水體中氨氮等有害物質(zhì)含量上升,造成養(yǎng)殖對象發(fā)病或死亡,嚴(yán)重影響產(chǎn)業(yè)的發(fā)展。我國《漁業(yè)水質(zhì)標(biāo)準(zhǔn)(GB 11607—1989)》中規(guī)定,氨氮質(zhì)量濃度小于0.02 mg/L時,對魚類的生命活動沒有影響。養(yǎng)殖水體中銨離子(NH4+)的質(zhì)量濃度不允許超過5 mg/L。
筆者設(shè)計的自動氨氮含量監(jiān)測系統(tǒng)[1]基于HJ535—2009標(biāo)準(zhǔn)。其基本原理是將被測水樣與納氏試劑混合,納氏試劑與水樣中的氨反應(yīng),采用紫外線光度計對生成的化合物進(jìn)行光度測量,吸光度與水樣中的氨氮含量成正比,從而計算出水樣的氨氮含量。此方法的優(yōu)點為所需試劑種類少、生成化合物速度快、吸光度分辨率高,是一種簡單高效的測量方法,特別適合設(shè)計成自動氨氮含量監(jiān)測系統(tǒng)。
納氏試劑比色法的缺點為試劑成本較高、測量數(shù)據(jù)量少、測量過程易受環(huán)境變化等不可預(yù)見因素的影響[2],重復(fù)性誤差<±10%,數(shù)據(jù)可靠性還需提高。建立數(shù)據(jù)分析預(yù)測模型是提高數(shù)據(jù)可靠性的常用方法,常用的分析預(yù)測模型包括神經(jīng)網(wǎng)絡(luò)[3-4]、支持向量機(jī)[5]等,神經(jīng)網(wǎng)絡(luò)一般要求使用大量數(shù)據(jù)作為訓(xùn)練樣本,采用比色法測量氨氮含量所得數(shù)據(jù)樣本較少,符合支持向量機(jī)的特點?;局С窒蛄繖C(jī)(SVM)的泛化能力不足,對于異常樣本數(shù)據(jù),預(yù)測數(shù)據(jù)偏差較大。最小二乘支持向量機(jī)(LS-SVM)[6]對其進(jìn)行了改進(jìn),優(yōu)化了模型函數(shù),具有更好的預(yù)測速度和效果。
筆者在設(shè)計自動氨氮監(jiān)測系統(tǒng)時,針對測量數(shù)據(jù)的準(zhǔn)確性波動問題,將LS-SVM算法應(yīng)用到測量結(jié)果的分析中,建立了養(yǎng)殖水體氨氮含量測量結(jié)果的分析預(yù)測模型,獲得了較好的效果。
Vapnik等于20世紀(jì)90年代提出支持向量機(jī)(SVM)方法,該方法是一種機(jī)器學(xué)習(xí)方法,通過遵循結(jié)構(gòu)風(fēng)險最小原則,提高學(xué)習(xí)機(jī)的泛化能力,即使在統(tǒng)計樣本數(shù)量較少的情況下也能得到良好的統(tǒng)計結(jié)果。LS-SVM由Suykens等提出,改變了SVM使用的約束條件,同時使用新的目標(biāo)優(yōu)化函數(shù),改變風(fēng)險控制函數(shù),進(jìn)一步改善了泛化能力[7-8]。
設(shè)有訓(xùn)練集D,內(nèi)部包含N個樣本,將D表示為:{(x1,y1),(x2,y2),…,(xN,yN)}。其中x、y分別為輸入、輸出。通過1個非線性映射φ(),將樣本數(shù)據(jù)從原空間映射到另一個高維特征空間φ(x),新空間表示為φ(x)=[φ(x1),φ(x2),…,φ(xN)]。在空間φ(x)中設(shè)置最優(yōu)決策函數(shù)y(x)=ωφ(x)+b+ξk,函數(shù)中的ω、b分別為權(quán)值向量、閾值。LS-SVM的目標(biāo)優(yōu)化函數(shù)[9]為:
s.t. yk=φ(xk)ωT+b+ξk。
(1)
式中:C是用于平衡誤差與復(fù)雜度的正則化參數(shù),誤差分量ξk≥0,k=1,2,…,N。
對式(1)函數(shù)采用Lagrange法求解:
(2)
式中:αk(k=1,2,…,N)為Lagrange乘子,分別對ω、b、ξ、α求偏導(dǎo)=0,即
(3)
設(shè)Ω為N×N對稱方陣,即
(4)
定義核函數(shù)k(xi,xj),滿足以下Mercer條件:
Ωij=k(xi,xj)=φ(xi)φ(xj)i,j=1,…,N。
(5)
LS-SVM的回歸模型為:
(6)
選擇徑向基核函數(shù)(RBF)作為核函數(shù),模型具有學(xué)習(xí)速度快的特點,公式為:
(7)
整個算法中有2個可調(diào)參數(shù),即正則化參數(shù)C、σ核寬度參數(shù)。在確定2個參數(shù)的值時,通常先采用搜索法選擇參數(shù),再采用交叉驗證法進(jìn)行最小誤差尋優(yōu),這樣能夠確定最佳的參數(shù)對。這2個參數(shù)將影響算法的泛化性能和學(xué)習(xí)能力。
養(yǎng)殖水體自動氨氮監(jiān)測系統(tǒng)基于納氏試劑比色法測量水體的氨氮含量,其系統(tǒng)設(shè)計結(jié)構(gòu)見圖1,監(jiān)測系統(tǒng)的實物照片見圖2。整個監(jiān)測系統(tǒng)由IPC、PLC、LCD、比色計、反應(yīng)瓶、液量器、注射泵、多通閥及多種試劑等組成。IPC通過LCD顯示人機(jī)界面,通過PLC控制液量器和多通閥的工作,同時通過比色計讀取反應(yīng)瓶的色度數(shù)據(jù),再計算氨氮質(zhì)量濃度。其基本操作流程為:(1)控制電磁閥,接入水樣,驅(qū)動注射泵,水樣進(jìn)入液位計量器;(2)液位達(dá)到規(guī)定值后切換電磁閥,水樣送入反應(yīng)器;(3)切換電磁閥,掩蔽劑進(jìn)入計量器,達(dá)到規(guī)定液位后再進(jìn)入反應(yīng)器;(4)切換電磁閥,納氏試劑抽入計量器,達(dá)到規(guī)定液位后再進(jìn)入反應(yīng)器;(5)等待10 min,測量比色計的輸出數(shù)據(jù),即為測量光強(qiáng);(6)切換電磁閥,反應(yīng)后的溶液排到廢液瓶中;(7)切換電磁閥,反應(yīng)器抽入蒸餾水,測量比色計的輸出,即為參比光強(qiáng);(8)將廢水排到廢液瓶中。
基于比色法設(shè)計的自動氨氮監(jiān)測系統(tǒng),氨氮含量計算的數(shù)據(jù)來源包括參比光強(qiáng)、測量光強(qiáng)。選取40組標(biāo)準(zhǔn)氨氮溶液,其含量從0 mg/L遞增至10 mg/L,間隔0.25 mg/L。系統(tǒng)測量的總樣本數(shù)據(jù)為40個,奇序列為訓(xùn)練樣本,偶序列為測試樣本,部分測量數(shù)據(jù)見表1。使用神經(jīng)網(wǎng)絡(luò)模型和LS-SVM模型分別建立分析預(yù)測模型,仿真試驗數(shù)據(jù)見表2。
使用神經(jīng)網(wǎng)絡(luò)模型和LS-SVM模型分別對水體氨氮含量進(jìn)行預(yù)測,氨氮實際含量與2組預(yù)測結(jié)果的對比見圖3。
表1 部分樣本數(shù)據(jù)
表2 仿真試驗結(jié)果
由表2、圖3可知,神經(jīng)網(wǎng)絡(luò)模型預(yù)測結(jié)果的相對誤差極值為 12.69%,平均值為6.43%;LS-SVM模型預(yù)測結(jié)果的相對誤差極值為2.91%,平均值為1.32%??梢?,使用LS-SVM預(yù)測模型獲得了更高的精度。
設(shè)計了一種養(yǎng)殖水體自動氨氮監(jiān)測系統(tǒng),并將LS-SVM技術(shù)應(yīng)用于測量結(jié)果的分析預(yù)測中。數(shù)據(jù)預(yù)測結(jié)果與實際含量的比較表明,該模型是有效的預(yù)測模型,用于實際的數(shù)據(jù)分析預(yù)測工作可明顯提高數(shù)據(jù)的準(zhǔn)確率。LS-SVM預(yù)測模型的可變參數(shù)較少,只需確定正則化參數(shù)C和核寬度參數(shù)σ,可使用交叉驗證法確定2個參數(shù)的值。LS-SVM預(yù)測模型的精度高,可廣泛應(yīng)用于數(shù)據(jù)分析預(yù)測模型的建立。
[1]馬淑勍,梁 濱. 利用自動分析儀測定水中氨氮的方法研究[J]. 山東化工,2015(44):62-64.
[2]俞繼梅. 納氏試劑測氨氮影響因素的分析和研究[J]. 江西化工,2013(4):11-14.
[3]童敏明,張 愉,齊美星. 基于BP神經(jīng)網(wǎng)絡(luò)的可燃混合氣體分析方法的研究[J]. 計量學(xué)報,2006,27(2):169-171.
[4]侯迪波,陳 玥,趙海峰,等. 基于RBF神經(jīng)網(wǎng)絡(luò)和小波分析的水質(zhì)異常檢測方法[J]. 傳感器與微系統(tǒng),2013,32(2):138-141.
[5]黃 苜,程小平. 基于支持向量機(jī)回歸料子濾波器的運(yùn)動員實時跟蹤方法[J]. 西南大學(xué)學(xué)報(自然科學(xué)版),2008,30(5):165-169.
[6]曾 燕,成新文,王紅旗,等. 基于加權(quán)最小二乘支持向量機(jī)的下水道可燃?xì)怏w分析[J]. 西南師范大學(xué)學(xué)報(自然科學(xué)版),2014,39(9):94-99.
[7]Suykens J,Vandewalle J. Least squares support vector machine classifiers[J]. Neural Processing Letters,1999,9(3):293-300.
[8]Wen W,Hao Z,Yang X. A heuristic Weight-Setting strategy and iteratively updating algorithm for weighted LeastSquares support vector regression[J]. Neurocomputing,2008,71(16/18):3096-3103.
[9]Suykens J,Vandewalle J. Recurrent least squares support vector machines[J]. IEEE Transactions on Circuits and System,2000,47(7):1109-1114.
10.15889/j.issn.1002-1302.2017.02.061
2015-11-18
四川省院士(專家)工作站基金(編號:2014YSGZZ01);企業(yè)信息化與物聯(lián)網(wǎng)測控技術(shù)四川省高校重點實驗室基金(編號:2014WYY01)。
居錦武(1976—),男,上海人,碩士,副教授,主要從事嵌入式計算機(jī)系統(tǒng)設(shè)計研究。E-mail:jjwmail@163.com。
TP391
A
1002-1302(2017)02-0210-03
居錦武. 基于LS-SVM的養(yǎng)殖水體氨氮含量分析預(yù)測模型[J]. 江蘇農(nóng)業(yè)科學(xué),2017,45(2):210-212.