劉海林, 王庭有
(昆明理工大學機電工程學院, 云南 昆明650500)
凈水投藥作為整個凈水處理生產的核心工藝之 一,在投藥過程中存在復雜動態(tài)非線性,難以建立一個精確的模型來預測混凝劑投加量。 因此,實現投藥量的最佳控制,保障出廠水質達標和提高經濟效益,是現階段凈水工藝的重要研究方向[1-2]。 針對投藥過程中的高度非線性的特點,韓梅等[3]、饒小康等[4]采用人工神經網絡算法從歷史投藥數據進行自適應學習和訓練并與自動化系統(tǒng)結合實現混凝投藥自動化控制系統(tǒng)。 OLADIPUPO 等[5]、張瑤瑤等[6]結合自來水廠進水指標影響因子,通過多模型預測控制策略、混凝分析計算,構建線性回歸模型和機理模型,進行投藥量預測,提高了投藥量的精確度,但線性回歸模型和機理模型均需要滿足影響因子的動態(tài)穩(wěn)定,計算方式復雜冗余且對數據的要求苛刻,難以全面推廣。 黃麗娟等[7]、唐德翠等[8]、徐洋等[8-9]通過BP 神經絡模型結合專家經驗對混凝投藥進行辨識建模,然而單一標準BP 神經網絡預測模型對復雜非線性動態(tài)投藥自適應學習能力較差,預測效果有較大偏差,模型性能受到制約。 余峰等[10]、李贊等[11]采用遺傳算法(GA)或煙花爆炸算法優(yōu)化了BP 神經網絡預測模型建模缺點,極大提高了BP 神經網絡模型在全局范圍內尋優(yōu)能力以及對水質動態(tài)復雜投藥的自適應學習和預測效果,但BP 易陷入局部極小值,導致存在誤差,穩(wěn)定性不高,使預測誤差增大。 徐少川等[12]提出模糊算法優(yōu)化多小腦神經網絡,更精確地將濁度控制在控制范圍內,進一步優(yōu)化投藥量,提供了良好優(yōu)化思路。 庹婧藝等[13]采用改進RBF 神經網絡有效規(guī)避了BP 神經網絡缺陷,提高了模型的泛用能力。
通過改進GA 算法適應度,優(yōu)化函數提高魯棒性和并行計算能力,優(yōu)化神經網絡的權值和中心寬度向量參數的尋優(yōu)效率,能更好的達到模型預期的目標值,精確預測效果和檢驗所建立GA-RBF 模型對水質預測數據擬合能力[14]。 本文采用改進RBF神經網絡模型,通過進水水質指標與投加量的非線性規(guī)律,建立GA-RBF 神經網絡凈水廠投藥量預測模型。 GA-RBF 算法的應用有助于減少資源浪費和提高水質處理的效率,實現更加有效的藥劑使用和資源配置,減少過量投藥或不足投藥的現象,可以降低成本并提高生產效率。 同時,該模型可以更準確地預測水質變化趨勢,幫助凈水廠及時調整投藥量和水質管理策略,避免因水質問題導致的損失,提高凈水廠運營的穩(wěn)定性和可靠性。
RBF 神經網絡是一種特殊的三層前饋式神經網絡,包含輸入層、隱含層和輸出層的簡單拓撲結構,具有核函數轉置映射到高維度線性空間的非線性樣本特征,直接用網絡的權值求解線性方程組來轉化輸出的特性。 RBF 神經網絡可全局逼近任意非線性函數,搜索功能精度更高,可以回避局部極值問題[15],具有良好的局部逼近能力的高斯核函數常作為維度激活函數,在輸入層映射到隱含層的一系列徑向基函數中使用,其表達式(1)如下[13]:
式中,x為網絡輸入向量;ri為高斯基函數中心向量;σi為高斯基函數寬度向量。
RBF 神經網絡輸出的表達式如式(2)[13]:
式中,f(x)為網絡輸出預測值等于隱含層所含各節(jié)點輸出與權值的乘積之和;wi為隱含層至輸出層之間的權值。
混凝沉淀所關聯(lián)的影響因素很多,基于水質檢測指標之間數據高度非線性的特點,通過前人分析各因素對混凝劑投加量的影響程度及現場水廠調查,最終確定8 個指標作為RBF 網絡的8 個工藝輸入參數維度[16],分別為原水水質指標中的水溫、電導率、pH、CODMn、原水濁度和進水量Q,沉淀池加藥反應出水滯后時間和濾前水濁度,建立以混凝劑投藥量為RBF 網絡的輸出參數維度[17]的RBF 神經網絡結構,見圖1。
圖1 RBF 神經網絡結構Fig.1 Structure of RBF neural network
在RBF 神經網絡中,通常選用K均值聚類法求得最佳聚類數K值,用來確定隱含層神經元高斯徑向基函數的中心,進一步優(yōu)化RBF 神經網絡結構和對數據進行重新分類,因此,可通過聚類數K值推導隱含層最佳神經元個數。 對輸入特征參數數據集x(x1,x2,x3,x4,x5,x6,x7,x8)進行數據預處理歸一化轉置到隱含層中,并隨機選取所設定的K個固定中心點見式(3)。
高斯基函數方差μ表達見式(4)[16]。
式中,Smax為各中心點之間的最大距離;N為神經網絡隱含層神經元總節(jié)點數。
其中,損失函數大小可對應聚類結果的好壞,因此,損失函數可定義為各輸入特征參數數據集樣本到所屬的ρK簇中心點距離差的平方和,見式(5)[16]。
式中,xi為第i組數據集樣本;Ki為xi數據集所屬的簇;ρK為Ki簇對應的中心點。
通過調整損失函數第一次所得不同數據集樣本xi對應分配到距離最近所屬類別的ρKi中心點,然后重新聚合計算該類中心,再調整中心點繼續(xù)減少損失函數值,反復迭代。 當滿足時,即停止迭代,此時,損失函數遞減到極小值且滿足中心點的變化收斂條件,得到最佳聚類數K值。
遺傳算法是以種群的形式進行交叉、選擇和變異等過程,經過多代遺傳進化獲得適應度最優(yōu)的個體作為目標值最優(yōu)解的一種自然規(guī)律演化優(yōu)化算法[18],在全局范圍內具有較強的搜索能力。 由于RBF 神經網絡可通過局部逼近進行累加從而實現全局逼近,具有較強的泛化能力,但對神經網絡的參數優(yōu)化有較高要求,因此,本文采用GA 優(yōu)化RBF神經網絡的隱含層至輸出層之間的權值wi和高斯基函數中心寬度向量σi兩種參數進行優(yōu)化提高神經網絡的效率和訓練精度,從而提高對投藥量變化趨勢精準預測。 當種群適應度值滿足進化精度要求或遺傳算法達到進化迭代收斂上限次數時,即輸出遺傳優(yōu)化之后的隱含層至輸出層之間的權值wi和高斯基函數中心寬度向量σi兩種參數并映射轉換更新RBF 神經網絡結構和參數,改進GA 算法優(yōu)化流程見圖2。
圖2 改進GA 算法優(yōu)化流程Fig.2 Improve GA algorithm optimization process
GA-RBF 神經網絡主要優(yōu)化步驟如下:
(1)染色體編碼優(yōu)化
本文采用gray 二進制編碼方法隨機將RBF 神經網絡中初始高斯基函數寬度向量σi和權值wi兩個優(yōu)化參數染色體轉換為對應的二進制混合編碼并對轉換后的二進制數值進行異或操作得到新的數值生成特殊gray 二進制編碼,該方法簡單易行且符合最小字符集編碼原則[19],對于離散性變量可以直接進行編碼,同時在編碼轉換過程中只有一位的變化,避免了普通二進制編碼中的不連續(xù)性問題,在執(zhí)行交叉和變異操作時可以縮減多余的解空間,提高算法的計算效率。 設初始種群規(guī)模數量為P,則編碼每代新種群的染色體見式(6)。
(2)改進適應度函數
基因誤差參數選取為RBF 神經網絡對應的第i個遺傳因子的期望輸出與實際輸出的差值的絕對值的平方和,即式(7)[19]。
令種群中第i個遺傳因子適應度函數為常數與ei基因誤差參數差值的倒數,當ei誤差逐漸減小時,遺傳因子適應度逐漸收斂至極小值,得到的染色體越優(yōu)秀[20],通過對適應度值進行縮放,使適應種群的個體獲得更大的選擇概率并通過添加懲罰函數策略對適應度值進行優(yōu)化避免模型存在過擬合的問題,即改進得到的適應度函數見式(8)。
(3)遺傳操作優(yōu)化
采用賭輪盤法對種群P進化擇優(yōu),則該種群中隨機選其中第i個遺傳個體的概率見式(9)。
通過賭輪盤法初步選擇操作后,即開始對該類父代個體進行初始自適應交叉、變異得到新一代子代個體,其中自適應交叉概率和變異概率均會隨子代種群的適應度不斷改變,優(yōu)化變異操作引入了隨機性,保持了個體的多樣性以控制多樣性和局部搜索的平衡,得到初始交叉概率、變異概率和子代新交叉概率、變異概率關系見式(10)~式(11)[19-20]。
式中,Pa為交叉概率;Pa1為初始交叉概率;Pa2為新交叉概率;Pb為變異概率;Pb1為初始變異概率;Pb2為新變異概率;Favg為種群平均適應度;Fmin為種群收斂最小適應度。
兩個變異子代個體是在經過優(yōu)化篩選的父代種群中隨機選取兩個父體進行交叉選擇和變異擇優(yōu)選擇得到的,將變異子代染色體與父代染色體的適應度進行比較,如果子代適應度優(yōu)于父代,則將子代與父代替換編入種群P中成為新種群進行反復迭代進化,通過交叉和變異所得兩個子代染色體表示為式(12)[20]。
式中,λ為(0,1)任意實數。
其中每個種群個體可以作為一個獨立的計算單元在交叉和變異過程中進行并行計算優(yōu)化,實現多目標并行優(yōu)化,從而縮短搜索過程。 通過精英保留策略,將適應度最優(yōu)的個體保留至下一代,保持種群的進化優(yōu)勢同時這個過程不受隨機選擇的限制,直接得到最優(yōu)選擇個體。
為了獲得樣本數據用于構建預測模型,本試驗數據采集自四川某自來水廠不同時段水質監(jiān)測站的自動監(jiān)測數據,采集該自來水廠2022 年3 月至2023年3 月共1 263 組相關非線性因素影響指標參數以及相應時段調控實際混凝劑投加量數據,其中1 220組作為訓練集和43 組作為測試集,見表1。
總而言之,高效課堂是新課程標準改革形勢下教師的一種新的教學理念,更是判斷教師授課質量的評判標準。因此,高中政治教師應為學生構建輕松、和諧的課堂學習氛圍,從而構建高效的高中政治課堂。
表1 試驗數據樣本采集Tab.1 Collection of experimental data samples
2.2.1 運行結果
本文仿真采用Matlab 軟件進行神經網絡搭建和相應遺傳優(yōu)化,經計算,當遺傳算法中的初始種群規(guī)模P設為30,最大進化代數設為200,最佳交叉概率Pa設為0.75,變異概率Pb設為0.24 時,該自來水廠模型當神經網絡中聚類數K值為9,隱含層的高斯基函數各類簇的方差最優(yōu),即隱含層結構神經元最佳個數l也為9,所得混凝劑投加量預測結果均方誤差(MSE)為0.193%,進化代數43 代開始收斂,仿真計算得到測試集數據的擬合優(yōu)度R2為0.984 61,平均絕對誤差(MAE)約為2.184%,根均方誤差(RMSE)約為4.878%,平均絕對百分比誤差(MAPE)約為0.126 49%。 得到的改進GA-RBF 神經網絡凈水廠投藥量預測模型對水廠優(yōu)化預測結果見圖3,混凝劑投加量預測結果優(yōu)秀,該自來水廠的擬合優(yōu)度R2值趨近1,模擬預測精度高。
圖3 改進GA-RBF 神經網絡預測結果Fig.3 Improved GA-RBF neural network prediction results
2.2.2 性能分析
改進GA 優(yōu)化的RBF 神經網絡進化代數在43代就能完成收斂,而單一的RBF 神經網絡則需要進化149 代才能完成收斂,兩種模型適應度曲線對比見圖4。 通過改進GA 優(yōu)化的RBF 神經網絡,遺傳進化代數明顯降低,預測模型運行速度更快。
圖4 改進GA-RBF 與RBF 神經網絡適應度曲線對比Fig.4 Comparison of fitness curves between improved GA-RBF and RBF neural networks
由圖5 可知,改進GA-BP 神經網絡模型在全局學習預測效果一般,容易陷入極小值陷阱且模型的穩(wěn)定性不高,單一RBF 神經網絡模型所預測的結果與實際藥劑投加量有較大誤差,擬合能力較差,搜索的精度不高,而改進GA-RBF 神經網絡模型優(yōu)化明顯優(yōu)于前兩種神經網絡模型,其精度更高,穩(wěn)定性強,對數據有更好地擬合能力,且通過比較PSORBF 模型預測效果可知,GA-RBF 模型在預測解空間的并行計算能力和魯棒性比PSO 優(yōu)化的模型具有更好的優(yōu)勢。
圖5 不同算法預測效果對比Fig.5 Comparison of prediction effects of different algorithms
改進GA-RBF 神經網絡相較于單一RBF 神經網絡,混凝劑投藥量預測擬合優(yōu)度提高5.474%,平均絕對誤差降低了4.14%, 根均方誤差降低3.392%,且對比其他兩種優(yōu)化的神經網絡具有更高的模擬精度,能有效預測自來水廠混凝劑投加量,網絡模型參數對比見表2。
表2 網絡模型參數對比Tab.2 Comparison of network model parameters
本文將改進GA 算法與RBF 神經網絡模型相結合,提出一種改進GA-RBF 神經網絡優(yōu)化預測模型,解決自來水廠混凝劑投加量預測控制問題,其仿真結果表明:
① 本文提出的GA 算法優(yōu)化后的RBF 神經網絡預測模型回避了GA 優(yōu)化BP 神經網絡易陷入極值陷阱的缺點,提高了穩(wěn)定性和全局尋優(yōu)能力,對數據有更好的擬合能力。
② 水質影響因素特征參數和投藥量之間的高度非線性關系可直接由RBF 神經網絡的徑向基函數轉換并通過網絡線性輸出,滿足了影響因子的動態(tài)穩(wěn)定,對數據沒有過多的要求,減少了對復雜模型的構建和冗余計算。
③ 在水廠投藥量預測模型預測效果參數對比中,GA 算法優(yōu)化RBF 神經網絡凈水廠投藥量預測模型的MAE 約為2.184%,RMSE 約為4.878%,R2為0.984 61,相較于單一RBF 神經網絡預測模型迭代速度更快、預測精度更高,并且相較于PSO-RBF模型預測效果,GA-RBF 模型對解空間的魯棒性和并行計算能力更具優(yōu)勢,可為水廠混凝投藥預測模擬提供有效參考。