張運鋒
(廣州城建職業(yè)學(xué)院,廣東 廣州 510900)
中國電信網(wǎng)2021年報告指出,我國網(wǎng)民規(guī)模已經(jīng)近10億人,互聯(lián)網(wǎng)范圍已經(jīng)擴大到72.4%,手機上網(wǎng)規(guī)模擴大到9.8億人[1-2],逐步實現(xiàn)了數(shù)字化社會發(fā)展,隨著新冠疫情的暴發(fā),線上辦公、線上授課及線上交易等層出不窮,網(wǎng)絡(luò)運行保證了企業(yè)、社會的正常發(fā)展與穩(wěn)定運行。隨著網(wǎng)絡(luò)數(shù)量的復(fù)雜程度逐漸增加,網(wǎng)絡(luò)故障發(fā)生概率也逐漸提升,因此,網(wǎng)絡(luò)故障診斷對于穩(wěn)定計算機網(wǎng)絡(luò)的發(fā)展具有重要意義[3-4]。
傳統(tǒng)的計算機故障診斷方法主要包括專家診斷等人工方式,但是現(xiàn)階段其已經(jīng)無法滿足大范圍計算機網(wǎng)絡(luò)故障的需求,因此,亟需人工智能網(wǎng)絡(luò)技術(shù)進行計算機故障診斷[5]。BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)是目前應(yīng)用場景最多,較為廣泛的人工神經(jīng)網(wǎng)絡(luò)之一[6]?;贐P神經(jīng)網(wǎng)絡(luò),可實現(xiàn)對其他行業(yè)輸出進行預(yù)測效果分析,上述研究對于計算機網(wǎng)絡(luò)故障診斷的預(yù)測分析都起到了重要的推動作用。雖然神經(jīng)網(wǎng)絡(luò)可以解決一些復(fù)雜的、非線性映射問題,但是它也存在一些缺點,如過擬合、容易陷入局部最優(yōu)解及收斂速度慢等問題,因此,利用遺傳算法、粒子群和蟻群算法等用于優(yōu)化初始權(quán)重和閾值,更有利于提高模型學(xué)習(xí)效率并進行全局優(yōu)化[7-9]。
本研究基于遺傳算法優(yōu)化建立GA-BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,并與傳統(tǒng)的BP預(yù)測模型訓(xùn)練前后的精度、預(yù)測誤差進行對比分析,研究結(jié)果對于計算機故障診斷的整體管理措施調(diào)整及決策具有重要的指導(dǎo)意義。
在進行試驗數(shù)據(jù)采集時,考慮到不同的計算機故障類型與數(shù)據(jù)本身的均衡性,本研究共進行了24天、共210 h的數(shù)據(jù)采集,計算機故障采集信息如表1—2所示。
表1 計算機故障信息采集表
表2 計算機數(shù)據(jù)采集情況
遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)計算流程如下:
(1)首先導(dǎo)入數(shù)據(jù),并對數(shù)據(jù)進行預(yù)處理;(2)其次,初始化種群并計算個體適應(yīng)度值,進行種群選擇、交叉、變異,并進行迭代,(3)最后,滿足迭代條件后找到最優(yōu)位置,計算最優(yōu)權(quán)值閾值,重新帶入BP網(wǎng)絡(luò)種,進行訓(xùn)練和預(yù)測分析。
(1)
GA是目前應(yīng)用最為廣泛的一種求解優(yōu)化問題的自適應(yīng)啟發(fā)式的搜索算法,它模仿了自然界的“物競天擇,優(yōu)勝劣汰”的生物進化機制,算法步驟如下。
(1)確定神經(jīng)網(wǎng)絡(luò)拓撲。
(2)獲得初始種群:通過對輸入層進行數(shù)據(jù)預(yù)處理,設(shè)置種群數(shù)量,主要包括網(wǎng)絡(luò)模型的權(quán)值及閾值。
(3)適應(yīng)度函數(shù)F的設(shè)置公式為:
(2)
(4)選擇運算:選擇操作是指通過一定概率從原始種群中選出優(yōu)秀樣本,通過繁殖產(chǎn)生下一代樣本數(shù)據(jù),個體選擇的概率為:
(3)
其中Fi為個體I的種群適應(yīng)度值,N為種群數(shù)量。
(5)交叉運算:交叉運算是指從種群中隨機選擇兩個樣本,通過交換和組合,產(chǎn)生適應(yīng)性強的新個體,兩個個體ak、al在j處交叉操作如式(4)和(5):
akj=akj(1-b)+alj
(4)
alj=alj(1-b)+akj
(5)
(6)變異運算:通過種群變異可以保持種群的多樣性,從種群中隨機選取一個個體,選取個體的一部分進行變異操作,從而產(chǎn)生更好的個體。個體ai在j處發(fā)生變異,形成一個新的個體aij如式(6):
(6)
其中amax、amin為aij的邊界條件,r2為隨機數(shù),g是迭代次數(shù),Gmax是最大進化次數(shù)。
(7)計算新生成種群中個體的適應(yīng)度函數(shù)。如果適應(yīng)度函數(shù)滿足要求或進化次數(shù)達到最大值,則進化完成。
(8)通過GA優(yōu)化,給BP網(wǎng)絡(luò)初始權(quán)重和閾值,滿足終止條件后得到預(yù)測結(jié)果。
為定量評估GA優(yōu)化的神經(jīng)網(wǎng)絡(luò)預(yù)測模型的有效性和準確性,采用指標(biāo)RMSE(均方根誤差)、MAE(平均絕對誤差)和MAPE(平均絕對百分比誤差)評估模型,計算公式如下:
(7)
(8)
(9)
對2種預(yù)測模型的預(yù)測結(jié)果進行量化,并利用模型評價指標(biāo)對模型進行對比分析(見表3)。與傳統(tǒng)的BP預(yù)測模型相比,GA-BP模型的誤差都有所降低,說明GA-BP模型預(yù)測精度提升。
表3 BP神經(jīng)網(wǎng)絡(luò)和GA-BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測性能分析
不同模型的預(yù)測誤差分布如圖1所示,X軸代表實測值與預(yù)測值之間的誤差值,Y軸表示訓(xùn)練集的預(yù)測樣本。以分布誤差為0的分界線,向兩端擴散增大,0軸表示真實值與預(yù)測值結(jié)果一致,越接近0,代表預(yù)測值與實測值的差值越小,模型的預(yù)測精度越高。從圖1可以看出,與BP模型相比,GA-BP預(yù)測模型的誤差直方圖誤差接近0的個數(shù)更多且誤差更小,其他組合模型在零區(qū)間分布數(shù)量較小,誤差較大,說明模型預(yù)測精度較低。
圖1 不同神經(jīng)網(wǎng)絡(luò)模型預(yù)測誤差分布
(1)與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型預(yù)測相比,利用遺傳算法優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,對BP神經(jīng)網(wǎng)絡(luò)模型的隱層節(jié)點數(shù)和學(xué)習(xí)率進行優(yōu)化,克服了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型參數(shù)選擇的盲目性和不確定性,提高了搜索精度、收斂速度和模型的預(yù)測穩(wěn)定性。
(2)將BP預(yù)測模型和GA-BP神經(jīng)網(wǎng)絡(luò)模型進行計算機網(wǎng)絡(luò)故障預(yù)測分析,GA-BP在計算機網(wǎng)絡(luò)故障預(yù)測比其他神經(jīng)網(wǎng)絡(luò)模型表現(xiàn)出更好的預(yù)測性能。經(jīng)過不斷迭代訓(xùn)練,GA-BP網(wǎng)絡(luò)模型的預(yù)測精度R2達到0.96;與傳統(tǒng)的BP預(yù)測模型相比,GA-BP模型的RMSE降低了67.41%,MAPE降低了67.58%,MAE降低了67.73%,預(yù)測值與試驗值之間的擬合程度價高。這一研究結(jié)果為計算機網(wǎng)絡(luò)故障的預(yù)測提供一種新的思路和方法。
(3)在本研究中,通過遺傳算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)應(yīng)用于計算機網(wǎng)絡(luò)故障預(yù)測,預(yù)測結(jié)果更為準確。除遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)的外,今后會更加注重不同模型的對比,以便對不同模型之間的預(yù)測性能進行對比分析,將更有利于對計算機故障發(fā)生實施動態(tài)調(diào)控與技術(shù)決策。