洪永強(qiáng),謝永和,劉魯強(qiáng),董韶光,李德堂,王云杰,姜旭陽(yáng),張佳奇,王 君,高煒鵬,陳 卿
1. 浙江海洋大學(xué) a. 船舶與海運(yùn)學(xué)院,b. 海洋工程裝備學(xué)院,浙江 舟山 316022
2. 青島國(guó)信發(fā)展 (集團(tuán)) 有限公司,山東 青島 266200
3. 中國(guó)水產(chǎn)科學(xué)研究院漁業(yè)機(jī)械儀器研究所,上海 200092
4. 國(guó)信中船 (青島) 海洋科技有限公司,山東 青島 266200
隨著水產(chǎn)養(yǎng)殖業(yè)的迅速發(fā)展和養(yǎng)殖規(guī)模的不斷擴(kuò)大,精準(zhǔn)預(yù)測(cè)和監(jiān)測(cè)水質(zhì)參數(shù)對(duì)于保障養(yǎng)殖效益[1]和生物健康變得至關(guān)重要。然而,現(xiàn)今水產(chǎn)養(yǎng)殖業(yè)面臨著許多挑戰(zhàn),維持良好的水質(zhì)環(huán)境便是其中之一。在養(yǎng)殖系統(tǒng)中,溶解氧[2]是一個(gè)非常重要的水質(zhì)參數(shù),溶解氧不足可能導(dǎo)致魚類窒息、生長(zhǎng)受限甚至死亡。傳統(tǒng)的溶解氧測(cè)量方法需要采集水樣在實(shí)驗(yàn)室進(jìn)行分析,這種方法耗時(shí)久、成本高,且無(wú)法提供實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)。隨著養(yǎng)殖方式向深遠(yuǎn)海[3]養(yǎng)殖工船發(fā)展,對(duì)養(yǎng)殖水質(zhì)的要求日趨嚴(yán)格,溶解氧的精準(zhǔn)預(yù)測(cè)變得越來(lái)越重要。近年來(lái),大數(shù)據(jù)和機(jī)器學(xué)習(xí)技術(shù)[4]為溶解氧預(yù)測(cè)提供了新的解決方案,可以利用歷史監(jiān)測(cè)數(shù)據(jù)和水質(zhì)參數(shù)建立預(yù)測(cè)模型,準(zhǔn)確預(yù)測(cè)溶解氧濃度。這些模型可以基于氣象、水質(zhì)、養(yǎng)殖方式和其他相關(guān)因素進(jìn)行訓(xùn)練,能及時(shí)響應(yīng)環(huán)境變化和養(yǎng)殖條件調(diào)整,以維持良好的水質(zhì)環(huán)境,從而促進(jìn)魚類健康生長(zhǎng)。
精準(zhǔn)預(yù)測(cè)溶解氧對(duì)水產(chǎn)養(yǎng)殖意義重大。近年來(lái),國(guó)內(nèi)外學(xué)者對(duì)水質(zhì)預(yù)測(cè)進(jìn)行了廣泛研究,并對(duì)提高預(yù)測(cè)精度的方法作了改進(jìn)。沈時(shí)宇和陳明[5]采用一種Prophet 時(shí)序模型的方法來(lái)提高水質(zhì)預(yù)測(cè)精度,但該方法存在模型訓(xùn)練欠擬合缺陷。Ren 等[6]選擇基于深度信念網(wǎng)絡(luò)的溶解氧預(yù)測(cè)模型,成功實(shí)現(xiàn)了溶解氧含量預(yù)測(cè)。Cao 等[7]提出了基于K均值聚類和GRU (Gate Recurrent Unit) 神經(jīng)網(wǎng)絡(luò)的池塘養(yǎng)殖溶解氧預(yù)測(cè)模型,該方法雖然提高了預(yù)測(cè)精度,但GRU 神經(jīng)網(wǎng)絡(luò)仍無(wú)法完全解決梯度消失問(wèn)題,且隨著數(shù)據(jù)量和模型規(guī)模的增加,效果不理想。此外,研究者還探索了其他方法?;戮甑萚8]提出了一種基于集合經(jīng)驗(yàn)?zāi)B(tài)分解、游程檢測(cè)法重構(gòu)、適宜的單項(xiàng)預(yù)測(cè)算法建模和BP 神經(jīng)網(wǎng)絡(luò)非線性疊加的組合預(yù)測(cè)模型,但在高頻分量波動(dòng)較大的情況下,該算法參數(shù)難以確定,預(yù)測(cè)效果不佳。林彬彬等[9]提出基于麻雀搜索算法 (Sparrow Search Algorithm, SSA)[10-11]和長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò) (Long Short-Term Memory, LSTM)[12]的黃鱔 (Monopterus albus) 池塘溶解氧濃度預(yù)測(cè)模型,該模型具有良好的準(zhǔn)確性和魯棒性,但仍存在局部最優(yōu)解問(wèn)題,導(dǎo)致模型參數(shù)的準(zhǔn)確性不高,進(jìn)而降低了預(yù)測(cè)的準(zhǔn)確性。
當(dāng)考慮到模型參數(shù)的后期優(yōu)化時(shí),通常會(huì)使用算法代替人工參數(shù)設(shè)置。為解決這一問(wèn)題,本研究采用了兩種啟發(fā)式算法—麻雀搜索算法和海洋捕食算法 (Marine Predators Algorithm, MPA)[13],以及兩種群體智能算法—灰狼優(yōu)化算法 (Grey Wolf Optimizer, GWO) [14]和鯨魚算法 (Whale Optimization Algorithm, WOA)[15]。這些算法在全局搜索和多模態(tài)問(wèn)題的處理上均表現(xiàn)出色,并且在不同領(lǐng)域有成功的應(yīng)用?;谶@些算法的特點(diǎn)及其在應(yīng)用領(lǐng)域的成功案例[16-19],本文比較了這些算法在LSTM模型中進(jìn)行參數(shù)優(yōu)化的效果,并通過(guò)優(yōu)化模型參數(shù)實(shí)現(xiàn)既定目標(biāo)。
為了提高溶解氧參數(shù)預(yù)測(cè)的準(zhǔn)確性,本文提出了一種增強(qiáng)型麻雀搜索算法 (Enhance Sparrow Search Algorithm, ESSA) 用于優(yōu)化LSTM 模型參數(shù),更好地調(diào)整模型的結(jié)構(gòu)和初始狀態(tài),以滿足溶解氧參數(shù)的預(yù)測(cè)需求,從而提高預(yù)測(cè)結(jié)果的精確度。
本文用于驗(yàn)證模型的數(shù)據(jù)來(lái)源于某養(yǎng)殖工船,其相關(guān)信息為:全長(zhǎng)249.9 m,型寬14 m,型深21.5 m,排水量130 000 t,航速10.6 kn,養(yǎng)殖水體90 000 m3,單艙水體6 000 m3,定員3 人,年產(chǎn)量370 t,總投資4.5 億元。該工船在福建寧德海域養(yǎng)殖大黃魚 (Larimichthyscrocea),傳感器布置于魚艙內(nèi)深度14 m 處,采集數(shù)據(jù)開(kāi)始時(shí)間為2023-04-11 00:05:00,結(jié)束時(shí)間為2023-04-24 00:00:00。采集數(shù)據(jù)的步長(zhǎng)為5 min。一共有3 745 組數(shù)據(jù)。選取MPS-400 多參數(shù)傳感器進(jìn)行數(shù)據(jù)采集,該傳感器具有自清洗、多參數(shù)測(cè)量、信號(hào)輸出協(xié)議為Modbus特點(diǎn),安裝傳感器的方式為投入式。采集pH、溫度 (℃)、鹽度 (‰)、溶解氧 (mg·L?1) 4 類參數(shù)。本文中水質(zhì)預(yù)測(cè)目標(biāo)為溶氧,水質(zhì)特征變量為pH、溫度、鹽度。表1 為養(yǎng)殖水質(zhì)參數(shù)溶解氧的原始數(shù)據(jù),圖1、圖2 分別為養(yǎng)殖工船場(chǎng)景和原始數(shù)據(jù)溶解氧的變化曲線。
圖1 養(yǎng)殖工船內(nèi)部Fig. 1 Inside aquaculture ship
圖2 原始數(shù)據(jù)溶解氧變化曲線Fig. 2 Change curve of dissolved oxygen in raw data
表1 養(yǎng)殖水質(zhì)原始數(shù)據(jù)表Table 1 Raw data sheet for aquaculture water quality
1.2.1 數(shù)據(jù)處理
1) 數(shù)據(jù)預(yù)處理。采集的數(shù)據(jù),可能會(huì)因數(shù)據(jù)傳輸異常等導(dǎo)致丟失,需要對(duì)數(shù)據(jù)作預(yù)處理,對(duì)缺失的數(shù)值需要通過(guò)線性插值進(jìn)行填補(bǔ),公式如下:
式中:xk表示需要填補(bǔ)的值;xf表示前一個(gè)非缺失數(shù)據(jù)點(diǎn)的值;xb表示后一個(gè)非缺失數(shù)據(jù)點(diǎn)的值;f和b分別表示前后非缺失數(shù)據(jù)點(diǎn)的索引。
數(shù)據(jù)歸一化[20]是將不同特征的數(shù)據(jù)按照一定規(guī)則進(jìn)行縮放,以消除特征之間的量綱差異,使得不同特征具有相同的尺度。本文使用Min-Max 歸一化的具體表達(dá)式如下:
式中:xmax表示樣本數(shù)據(jù)最大值;xmin表示樣本數(shù)據(jù)最小值;xi表示樣本數(shù)據(jù)中的第i個(gè)數(shù)據(jù);xnor表示歸一化后的數(shù)據(jù)。在經(jīng)過(guò)歸一化的訓(xùn)練和測(cè)試后,為了得到真實(shí)的預(yù)測(cè)結(jié)果,需要對(duì)預(yù)測(cè)值進(jìn)行反歸一化,將其重新映射回原始數(shù)據(jù)的范圍。
2) 數(shù)據(jù)集的劃分。首先將采集到的數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集,本實(shí)驗(yàn)是將前12 d 的數(shù)據(jù)作為訓(xùn)練集,最后1 d 的數(shù)據(jù)作為測(cè)試集。使用訓(xùn)練集來(lái)訓(xùn)練模型,使用測(cè)試集評(píng)估模型在未見(jiàn)過(guò)的數(shù)據(jù)上的性能。
1.2.2 長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)
為了有效捕捉具有長(zhǎng)期依賴關(guān)系的序列數(shù)據(jù),如連續(xù)時(shí)間上測(cè)得的溶解氧參數(shù),傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型往往無(wú)法提供令人滿意的結(jié)果。為解決該問(wèn)題,長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)被引入并廣泛應(yīng)用。LSTM 是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò) (Recurrent Neural Network, RNN)[21],專門設(shè)計(jì)用于處理序列數(shù)據(jù)。LSTM 與其他神經(jīng)網(wǎng)絡(luò)模型之間的區(qū)別在于獨(dú)特的內(nèi)部單元結(jié)構(gòu) (圖3)。
圖3 LSTM 內(nèi)部單元結(jié)構(gòu)Fig. 3 Internal unit structure of LSTM model
圖3 中,f、i、o分別表示遺忘門、輸入門、輸出門;σ表示全連接層。xt是t時(shí)刻的輸入,ct?1和ct分別表示上一時(shí)刻和這一時(shí)刻的輸出,?ct為t時(shí)刻候選記憶細(xì)胞的信息,ht?1、ht分別表示為上一時(shí)刻和這一時(shí)刻隱藏狀態(tài)的信息,tanh為激活函數(shù)。
3 個(gè)門的更新計(jì)算公式為:
式中:W和b分別表示網(wǎng)絡(luò)的權(quán)重矩陣和偏置向量;σ(x)是Sigmoid 激勵(lì)函數(shù),為平滑的階梯函數(shù)。它可以將任何值轉(zhuǎn)化為0~1,此函數(shù)的輸出介于0~1,代表具體有多少信息能夠流過(guò)Sigmoid層,0 表示不能通過(guò),1 表示能全部通過(guò)。
1.2.3 ESSA-LSTM 預(yù)測(cè)模型
水質(zhì)參數(shù)溶解氧受多種因素的影響,由于數(shù)據(jù)采集于養(yǎng)殖工船,其空間特征是一定的,因此本文僅考慮水質(zhì)中的pH、溫度、鹽度對(duì)溶解氧的影響。為了更好地預(yù)測(cè)溶解氧,引入長(zhǎng)短時(shí)記憶網(wǎng)絡(luò),并針對(duì)該網(wǎng)絡(luò)模型中存在的參數(shù)問(wèn)題引入增強(qiáng)型麻雀搜索算法進(jìn)行改進(jìn)。在基本的LSTM 模型中,權(quán)重和偏置是通過(guò)矩陣乘法和加法來(lái)更新的,而在本文使用的LSTM 模型中,參數(shù)的更新是通過(guò)訓(xùn)練過(guò)程中的反向傳播和優(yōu)化算法來(lái)實(shí)現(xiàn)。增強(qiáng)型麻雀搜索算法優(yōu)化LSTM 模型結(jié)構(gòu)如圖4 所示,模型流程如圖5 所示。
圖5 預(yù)測(cè)模型流程Fig. 5 Flowchart of predictive modeling
在LSTM 模型中,隱藏層神經(jīng)元個(gè)數(shù)是影響模型性能關(guān)鍵性的超參數(shù)。本文在LSTM 模型的訓(xùn)練模型中引入了Adam (Adaptive Moment Estimation)梯度下降[22]算法,為此,該算法的初始化學(xué)習(xí)速率也成為影響模型性能的關(guān)鍵。通過(guò)采用增強(qiáng)型麻雀搜索算法,來(lái)確定隱藏層的神經(jīng)元個(gè)數(shù)和初始化學(xué)習(xí)速率。具體步驟如下:
1) 初始化參數(shù),將數(shù)據(jù)進(jìn)行歸一化處理,并且將數(shù)據(jù)分為訓(xùn)練集和測(cè)試集。
2) 確定LSTM 模型的拓?fù)浣Y(jié)構(gòu)。
3) 通過(guò)增強(qiáng)型麻雀搜索算法對(duì)LSTM 模型參數(shù)進(jìn)行優(yōu)化。
4) 利用優(yōu)化后的參數(shù)建立LSTM 模型和訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型。
5) 將訓(xùn)練集和測(cè)試集數(shù)據(jù)來(lái)對(duì)建立好的模型進(jìn)行實(shí)驗(yàn)和驗(yàn)證,并通過(guò)模型評(píng)價(jià)指標(biāo)來(lái)評(píng)價(jià)模型的預(yù)測(cè)效果。
1.2.4 模型評(píng)價(jià)標(biāo)準(zhǔn)
通過(guò)平均絕對(duì)誤差 (Mean Absolute Error,MAE)、平均絕對(duì)百分比誤差 (Mean Absolute Percentage Error, MAPE)、均方根絕對(duì)誤差 (Root Mean Square Error, RMSE)和決定系數(shù) (Coefficient of Determination,又稱R2值) 對(duì)各個(gè)模型的預(yù)測(cè)效果進(jìn)行評(píng)判其表達(dá)式如式 (4)、 (5)、 (6) 和 (7) 所示:
式中:yi表示實(shí)際值;xi表示預(yù)測(cè)值;表示實(shí)際值的平均值;n表示樣本個(gè)數(shù)。當(dāng)MAE、MAPE和RMSE 越小時(shí),所建模型的預(yù)測(cè)效果越好;R2值越接近1,表明模型對(duì)數(shù)據(jù)的擬合程度越高。
1.2.5 基本麻雀搜索算法
在麻雀[23-26]捕食過(guò)程中,分為偵察者和跟蹤者兩個(gè)群體。偵察者負(fù)責(zé)在整個(gè)區(qū)域進(jìn)行覓食和引導(dǎo)跟蹤者覓食的方向,而跟蹤者負(fù)責(zé)追隨偵察者進(jìn)行覓食。當(dāng)危險(xiǎn)來(lái)臨時(shí),麻雀種群會(huì)做出反捕食行為。
在每次迭代的過(guò)程中,偵察者的位置更新如下:
式中:t表示迭代的次數(shù);表示迭代t次時(shí)第i只麻雀的第j維數(shù)的值;表示迭代t+1 次時(shí)第i只麻雀的第j維數(shù)的值; itermax表示迭代次數(shù)最多的一個(gè)常數(shù);α為介于0~1 的一個(gè)隨機(jī)數(shù);R2表示報(bào)警值,范圍在 0~1;ST 表示安全閾值,范圍在0.5~1;Q是一個(gè)服從正態(tài)分布的隨機(jī)數(shù);L表示1 ×d的矩陣,其中,d矩陣的元素全為1。
跟蹤者的位置更新如下:
式中:Q是一個(gè)服從正態(tài)分布的隨機(jī)數(shù);Xp表示偵察者處于一個(gè)最佳的位置;是在迭代t+1 時(shí)點(diǎn)上的全局最優(yōu)解;而表示當(dāng)前處于全局最差的位置;A是一個(gè)1 ×d的矩陣,里面的元素隨機(jī)分配為1 或?1,并且滿足A+=AT(AAT)?1;n代表麻雀的數(shù)量,當(dāng)i>n/2 表示適應(yīng)值比較差的第i個(gè)跟蹤者覓食能力低,捕獲的食物比較少;otherwise代表其他情況。
當(dāng)危險(xiǎn)來(lái)臨時(shí),麻雀會(huì)做出預(yù)警行為,其預(yù)警者位置更新如下:
式中:β表示步長(zhǎng)控制參數(shù),是一個(gè)均值為0、方差為1 的正態(tài)隨機(jī)分布;K是一個(gè)隨機(jī)數(shù),其范圍是 ?1~1,表示麻雀移動(dòng)方向的步長(zhǎng)控制系數(shù);fi表示當(dāng)前麻雀的適應(yīng)值;fg則是當(dāng)前全局的最佳適應(yīng)值;fw表示當(dāng)前全局的最差適應(yīng)值;ε是一個(gè)極小的常數(shù),避免分母出現(xiàn)0 的情況。
1.2.6 增強(qiáng)型麻雀搜索算法
1.2.6.1 Circle 混沌映射初始化種群
混沌映射[27]是指在非線性系統(tǒng)中產(chǎn)生混沌行為的一種數(shù)學(xué)映射,常見(jiàn)的混沌映射方法有Logistic 混沌映射、Henon 混沌映射、Tent 混沌映射和Circle 混沌映射,不同的混沌映射有其自身的特點(diǎn),由于Circle 混沌[23]算法易于實(shí)現(xiàn),且具有周期性和可控性,其表達(dá)式如下:
式中:mod 代表取余;xi表示當(dāng)前迭代的值;xi+1表示下一個(gè)步驟迭代的值?;镜腟SA 算法是采用隨機(jī)生成的方式來(lái)初始化種群,這就導(dǎo)致了分布不均勻的問(wèn)題,為此,可以使用Circle 混沌映射的方式來(lái)初始化種群。
1.2.6.2 正弦余弦算法對(duì)偵察者位置優(yōu)化
麻雀搜索算法中偵察者位置更新主要依賴于個(gè)體之間的位置調(diào)整和信息共享,這也就導(dǎo)致了偵察者無(wú)法探索整個(gè)搜索空間,難以跳出局部最優(yōu)解。針對(duì)該問(wèn)題,引入了正弦余弦算法[28]對(duì)麻雀搜索算法中的偵察者位置進(jìn)行更新,在該算法中,加入了非線性正弦學(xué)習(xí)因子如公式 (12) 所示,優(yōu)化后的偵察者位置如公式 (13) 所示:
式中:ωmin和ωmax表示慣性權(quán)重的最小和最大值;ω表示適應(yīng)權(quán)重值;itermax表示迭代次數(shù)最多的一個(gè)常數(shù);r1為 0~2π 內(nèi)的隨機(jī)數(shù);r2是 0~2 內(nèi)的隨機(jī)數(shù);Xbest表示群體中最佳的位置; Xti,j表示迭代t次時(shí)第i個(gè)麻雀的第j維數(shù)的值。
1.2.6.3 Levy 飛行策略對(duì)跟蹤者位置優(yōu)化
由于在麻雀搜索算法中,跟蹤者的位置更新主要依賴于當(dāng)前最佳位置和全局最佳位置,使得算法在搜索空間中的多樣性不足,從而限制了算法的全局搜索能力。并且當(dāng)全局最佳位置附近存在較多的最優(yōu)解時(shí),算法容易陷入局部最優(yōu)解而無(wú)法跳出。為此,本文提出通過(guò)引入Levy 策略[29-30]對(duì)跟蹤者的位置進(jìn)行更新,Levy[31]步長(zhǎng)向量生成公式如下:
式中:S為飛行路徑;Γ 為 gamma 函數(shù);β取值為1.5;σ代表正態(tài)分布中的方差;u和v是符合正態(tài)分布的隨機(jī)數(shù),uN(0,σ2) ,vN(0,1),則跟蹤者位置更新公式如下:
增強(qiáng)型麻雀搜索算法具體流程如下:
1) 設(shè)置參數(shù):設(shè)置最大的迭代次數(shù),麻雀的種群數(shù)量,每個(gè)維度上的變量最小值,每個(gè)維度上的變量最大值。
2) 初始化麻雀種群位置、優(yōu)化全局最優(yōu)個(gè)體和最優(yōu)適應(yīng)度,計(jì)算每個(gè)個(gè)體的適應(yīng)度并且對(duì)其進(jìn)行排序。
3) 在每次迭代的過(guò)程中,利用公式 (13) 更新偵察者的位置,實(shí)現(xiàn)對(duì)全局的搜索,并且進(jìn)行邊界檢查。
4) 使用公式 (16) 更新跟蹤者位置,使得跟蹤者不斷靠近偵察者位置。
5) 如果預(yù)警者發(fā)現(xiàn)危險(xiǎn),則通過(guò)公式遠(yuǎn)離危險(xiǎn)位置。
6) 在麻雀搜索食物之后,對(duì)麻雀?jìng)€(gè)體的最優(yōu)適應(yīng)度值進(jìn)行排序。
7) 更新全局最優(yōu)解和最佳適應(yīng)度。
8) 進(jìn)入循環(huán)迭代,轉(zhuǎn)至步驟3)。
9) 判斷是否符合中止條件,若符合,則輸出全局最優(yōu)解和最佳適應(yīng)度。若不符合,回到步驟3) 重新開(kāi)始計(jì)算。
為了驗(yàn)證增強(qiáng)型麻雀搜索算法在求解優(yōu)化過(guò)程中的可行性和優(yōu)越性,將ESSA 與SSA、GWO、MPA、WOA 算法在5 種基準(zhǔn)函數(shù)上進(jìn)行測(cè)試對(duì)比。
使用Matlab 2019b 軟件對(duì)5 種不同的算法進(jìn)行對(duì)比實(shí)驗(yàn),為了避免實(shí)驗(yàn)出現(xiàn)的偶然性造成誤差,并增加實(shí)驗(yàn)的準(zhǔn)確性,選取5 種基準(zhǔn)測(cè)試函數(shù)分別獨(dú)立運(yùn)行30 次,取平均值和標(biāo)準(zhǔn)差作為實(shí)驗(yàn)的評(píng)價(jià)標(biāo)準(zhǔn)。實(shí)驗(yàn)采用的基準(zhǔn)測(cè)試函數(shù)如表2 所示,F(xiàn)1和F2為高維單峰函數(shù),F(xiàn)3和F4為高維多峰函數(shù),F(xiàn)5為低維多峰函數(shù)。種群大小為40 個(gè),最大迭代次數(shù)為100 次。實(shí)驗(yàn)結(jié)果如表3 所示,優(yōu)化測(cè)試函數(shù)收斂曲線對(duì)比如圖6 所示。
圖6 優(yōu)化測(cè)試函數(shù)收斂曲線對(duì)比Fig. 6 Comparison of convergence curves for improved test functions
表2 基準(zhǔn)測(cè)試函數(shù)Table 2 Process of benchmarking
表3 基準(zhǔn)函數(shù)優(yōu)化結(jié)果對(duì)比Table 3 Comparison of benchmark function optimization results
根據(jù)表2 中各種算法的最優(yōu)值 (Ave) 和標(biāo)準(zhǔn)差(Std) ,可以看出ESSA 算法盡管在低維多峰函數(shù)上的性能差異和其他算法相差無(wú)幾,但是在高維單峰、高維多峰函數(shù)上的性能均優(yōu)于其他算法。由圖6 也可以明顯看出,ESSA 算法在收斂性和優(yōu)化結(jié)果方面比其他4 種算法的表現(xiàn)更佳。針對(duì)F1和F2高維單峰函數(shù)的收斂情況,不論迭代次數(shù)增加到何種程度,使用ESSA 算法獲得的最優(yōu)值始終優(yōu)于其他算法。此外,在經(jīng)過(guò)100 次迭代后,ESSA算法獲得的最優(yōu)值數(shù)量級(jí)明顯高于其他算法。對(duì)于F3和F4高維多峰函數(shù)而言,ESSA 算法的最優(yōu)值優(yōu)于WOA 和MPA 算法,且最優(yōu)值幾乎是后兩種算法的2 倍。這表明ESSA 算法在處理高維多峰函數(shù)時(shí)優(yōu)勢(shì)明顯。在F5低維多峰函數(shù)中,雖然ESSA 算法的最優(yōu)值相對(duì)于其他算法沒(méi)有明顯的優(yōu)越性,但仍取得了顯著的改進(jìn)效果。
綜上,可以得出ESSA 算法在收斂結(jié)果和優(yōu)化效果方面比其他算法表現(xiàn)出色,為進(jìn)一步研究和應(yīng)用ESSA 算法提供了有力的支持。
2.2.1 實(shí)驗(yàn)設(shè)置
為了驗(yàn)證ESSA 算法對(duì)LSTM 模型參數(shù)改進(jìn)的效果最佳,選取基本的SSA 算法、GWO 算法、MPA算法、WOA 算法分別對(duì)LSTM 模型改進(jìn)進(jìn)行對(duì)比。為了保證實(shí)驗(yàn)的準(zhǔn)確性和算法對(duì)比結(jié)果的可信度,實(shí)驗(yàn)均采用Matlab 2019b 軟件進(jìn)行,幾種算法的實(shí)驗(yàn)參數(shù)一致,且每種算法的仿真實(shí)驗(yàn)獨(dú)立運(yùn)行10 次然后取平均值。在實(shí)驗(yàn)過(guò)程中,每種算法中尋找最優(yōu)解隱藏層的神經(jīng)個(gè)數(shù)范圍均設(shè)置為0~100,初始速率范圍設(shè)置為 0~0.2。
2.2.2 優(yōu)化對(duì)比
表4 是實(shí)驗(yàn)設(shè)置的主要參數(shù),各算法獨(dú)立運(yùn)行10 次優(yōu)化后的平均預(yù)測(cè)率結(jié)果對(duì)比如表5 所示。各算法實(shí)驗(yàn)得出的平均絕對(duì)誤差 、均方根誤差、平均絕對(duì)百分比誤差和決定系數(shù)的評(píng)價(jià)指標(biāo)如圖7 所示。根據(jù)實(shí)驗(yàn)所得的平均絕對(duì)百分比誤差,得到ESSA、SSA、GWO、MPA 和WOA 算法優(yōu)化的預(yù)測(cè)率收斂曲線如圖8 所示。
圖7 模型評(píng)價(jià)指標(biāo)Fig. 7 Indicators for model evaluation
表4 參數(shù)設(shè)置Table 4 Settings of parameters
表5 預(yù)測(cè)率結(jié)果對(duì)比Table 5 Comparison of predicted rate
從表5 可以直觀的看出,在同樣的實(shí)驗(yàn)環(huán)境和參數(shù)下,ESSA 算法對(duì)于優(yōu)化改進(jìn)LSTM 模型參數(shù)得出來(lái)的預(yù)測(cè)率具有明顯的效果。ESSA 算法優(yōu)化改進(jìn)效果略好于基本的SSA 算法,但是由ESSA 算法改進(jìn)得出的預(yù)測(cè)率準(zhǔn)確性遠(yuǎn)遠(yuǎn)大于GWO、MPA 和WOA 算法所改進(jìn)的。
從圖7 可以清晰地看出,ESSA 算法在MAE、RMSE 和MAPE 指標(biāo)方面均表現(xiàn)出優(yōu)于其他4 種算法的結(jié)果。此外,雖然SSA 擬合的效果所對(duì)應(yīng)的R2值也接近1,但是稍遜于ESSA,這進(jìn)一步說(shuō)明了ESSA 算法在預(yù)測(cè)準(zhǔn)確率方面表現(xiàn)出卓越的效果,即ESSA 算法具有最佳的預(yù)測(cè)性能。
由圖8 可以看出,ESSA 算法在初始迭代階段就避免了陷入局部最優(yōu)解的問(wèn)題,因?yàn)樵诔跏嫉鷷r(shí)預(yù)測(cè)準(zhǔn)確率顯著提高,且在大約10 次迭代后便達(dá)到最優(yōu)解。相比之下,SSA 算法在初始迭代時(shí)的預(yù)測(cè)準(zhǔn)確率雖然遠(yuǎn)高于MPA 算法,但在第80 次迭代時(shí)已經(jīng)陷入了局部最優(yōu)解。從GWO 算法的結(jié)果可以看出,隨著迭代次數(shù)的增加,預(yù)測(cè)準(zhǔn)確率趨于穩(wěn)定,約70 次迭代后達(dá)到穩(wěn)定效果。然而,與ESSA 和SSA 算法相比,GWO 算法的最終結(jié)果并不理想。WOA 算法在初始迭代階段的預(yù)測(cè)效果較差,但隨著迭代次數(shù)的增加也趨于穩(wěn)定,明顯可以觀察到該算法的最終效果低于其他算法。
通過(guò)ESSA 算法對(duì)LSTM 模型參數(shù)尋優(yōu),可以得到隱藏層的神經(jīng)個(gè)數(shù)為17,初始學(xué)習(xí)速率為0.008 6。多種算法優(yōu)化曲線對(duì)比如圖9-a 和圖9-b所示。
圖8 預(yù)測(cè)率收斂曲線Fig. 8 Convergence curve of prediction rate
圖9 多種算法優(yōu)化曲線對(duì)比Fig. 9 Comparison of optimization curves for multiple algorithms
根據(jù)各種算法的仿真實(shí)驗(yàn)結(jié)果,可以看出ESSA 算法具有收斂速度快、強(qiáng)大的跳出局部最優(yōu)解的能力等特點(diǎn)。通過(guò)對(duì)比各種算法對(duì)LSTM 模型優(yōu)化后的曲線,可以發(fā)現(xiàn)ESSA 算法優(yōu)于其他算法,因此,將ESSA 算法用于LSTM 模型參數(shù)改進(jìn),不僅能很好地獲得具體的參數(shù)值,而且能實(shí)現(xiàn)最佳的優(yōu)化效果。這種方法避免了在模型中盲目設(shè)定參數(shù)而耗費(fèi)大量時(shí)間和精力,并且當(dāng)模型中特征向量的維度和數(shù)據(jù)量發(fā)生變化時(shí),運(yùn)用該算法對(duì)模型進(jìn)行優(yōu)化,可以迅速、準(zhǔn)確地獲取具體的模型參數(shù),無(wú)需根據(jù)人工經(jīng)驗(yàn)進(jìn)行多次實(shí)驗(yàn)得出參數(shù)值再進(jìn)行比較。將ESSA 算法與LSTM 模型相結(jié)合,可充分發(fā)揮兩者的優(yōu)勢(shì),實(shí)現(xiàn)更精確的預(yù)測(cè)。這種方法不僅能提高預(yù)測(cè)的準(zhǔn)確率,還減少了參數(shù)調(diào)整的復(fù)雜性,使得模型的優(yōu)化過(guò)程更加高效。對(duì)溶氧預(yù)測(cè)優(yōu)化研究,不僅適用于養(yǎng)殖工船場(chǎng)景,也適用于如預(yù)測(cè)某水域某個(gè)水質(zhì)參數(shù)的其他場(chǎng)景,可為其他領(lǐng)域的相關(guān)研究提供參考。
針對(duì)養(yǎng)殖工船水質(zhì)參數(shù)溶解氧預(yù)測(cè)及其精確性,本文提出了一種利用ESSA 算法對(duì)LSTM模型參數(shù)作優(yōu)化改進(jìn)的方法,以實(shí)現(xiàn)高效的預(yù)測(cè)效果。首先,該算法在基本的麻雀算法中加入了Circle 混沌映射進(jìn)行種群初始化,加入正弦余弦算法和Levy 飛行策略分別對(duì)偵察者位置、跟蹤者位置更新,提升了算法的全局探索和局部?jī)?yōu)化問(wèn)題;然后,與其他改進(jìn)算法對(duì)不同形態(tài)的基準(zhǔn)函數(shù)進(jìn)行優(yōu)化求解,驗(yàn)證了ESSA 算法在搜索能力、收斂性、穩(wěn)定性等方面均具有明顯的優(yōu)勢(shì);最后,在相同的實(shí)驗(yàn)條件和參數(shù)下,將ESSA 算法與其他算法進(jìn)行對(duì)比實(shí)驗(yàn)。結(jié)果顯示ESSA 算法優(yōu)化模型后的預(yù)測(cè)精度優(yōu)于其他算法,能很快跳出局部最優(yōu),具有很好的穩(wěn)定性。
采用ESSA 算法對(duì)LSTM 模型進(jìn)行參數(shù)優(yōu)化,明顯縮減了參數(shù)設(shè)置的盲目性和時(shí)間成本,提高了優(yōu)化效率和預(yù)測(cè)準(zhǔn)確率。這種方法結(jié)合了現(xiàn)代優(yōu)化算法與深度學(xué)習(xí)模型的優(yōu)勢(shì),實(shí)現(xiàn)了對(duì)LSTM 模型參數(shù)的尋優(yōu)。在實(shí)驗(yàn)過(guò)程中,該算法在全局探索和局部?jī)?yōu)化方面均表現(xiàn)出色,達(dá)到了實(shí)驗(yàn)?zāi)康?。不過(guò),該算法在應(yīng)用于特定類型數(shù)據(jù)方面的實(shí)驗(yàn)時(shí)存在一定的缺陷,后期需進(jìn)一步考慮算法的通用性,以確保其在不同數(shù)據(jù)分布和特性下的魯棒性;此外,還發(fā)現(xiàn)在獲取實(shí)驗(yàn)結(jié)果過(guò)程中需要較長(zhǎng)時(shí)間取得最優(yōu)解,后續(xù)將持續(xù)優(yōu)化算法,以提高計(jì)算效率,減少時(shí)間成本。