張敏,李曉明,辛玲玲,董昊男
(國網(wǎng)甘肅省電力公司,甘肅蘭州 730030)
果蠅優(yōu)化算法是從仿生學(xué)角度提出的新型群體智能優(yōu)化算法,該算法根據(jù)果蠅覓食行為,推演出了一套完善的數(shù)值求解方法,既能縮短數(shù)據(jù)排查所需的時(shí)間,也可大幅提升數(shù)值解的應(yīng)用可行性[1]。LSTM是一種簡單的長短期記憶網(wǎng)絡(luò)結(jié)構(gòu),附屬于傳統(tǒng)的時(shí)間循環(huán)型神經(jīng)網(wǎng)絡(luò)之上,其目的在于解決數(shù)據(jù)信息參量之間的長期依賴問題,并且在應(yīng)用過程中,要求所有網(wǎng)絡(luò)模塊都必須保持鏈?zhǔn)竭B接的存在形式[2]。在一個(gè)標(biāo)準(zhǔn)的網(wǎng)絡(luò)結(jié)構(gòu)體中,重復(fù)出現(xiàn)的LSTM 模塊之間僅依靠小型神經(jīng)結(jié)構(gòu)體相連。
異常用電是一種極為嚴(yán)重的錯(cuò)誤電量消耗行為,包括擅自改變用電類別、擅自超過合同約定容量用電、擅自遷移電能計(jì)量裝置等多種表現(xiàn)形式,在不同的電網(wǎng)環(huán)境中,異常用電行為帶來的負(fù)面影響也不同[3]。近年來,隨著電信號(hào)輸出量的不斷增大,用戶用電負(fù)荷量始終呈現(xiàn)相對集中的表現(xiàn)狀態(tài),在此情況下,因電信號(hào)堆積而造成的異常用電行為問題也更加明顯[4]。為解決上述問題,將果蠅優(yōu)化算法與LSTM 網(wǎng)絡(luò)結(jié)構(gòu)融合起來,并以此為基礎(chǔ),設(shè)計(jì)一種新型的用戶異常用電行為預(yù)測模型。
果蠅算法對于LSTM 網(wǎng)絡(luò)的優(yōu)化思路在于可根據(jù)用戶異常用電行為數(shù)據(jù),控制群體果蠅節(jié)點(diǎn)的步進(jìn)尋優(yōu)程度,一般可以分為如下幾個(gè)步驟:
1)初始化預(yù)設(shè)
初始化預(yù)設(shè)就是設(shè)定群體果蠅的初始化行為參數(shù),包含數(shù)據(jù)迭代次數(shù)、群體大小、起始位置等指標(biāo)參量[5]。設(shè)i代表果蠅群體節(jié)點(diǎn)的定義系數(shù),X(i)代表果蠅群體的實(shí)時(shí)行進(jìn)距離,在果蠅隊(duì)列項(xiàng)為λ的情況下,聯(lián)立上述物理量,可將X(i) 表達(dá)式定義為:
其中,x0代表群體果蠅的行進(jìn)起點(diǎn)坐標(biāo),xi代表群體果蠅的行進(jìn)終點(diǎn)坐標(biāo)。
2)移動(dòng)
移動(dòng)就是在群體果蠅節(jié)點(diǎn)中選擇數(shù)據(jù)濃度最高的個(gè)體,在記錄該節(jié)點(diǎn)所處位置后,按照步長值結(jié)果,設(shè)定數(shù)據(jù)信息的實(shí)際傳輸速率[6]。
3)迭代
重復(fù)上述操作,直到數(shù)據(jù)濃度滿足所設(shè)定的最大迭代次數(shù)值。設(shè)n表示數(shù)據(jù)信息的實(shí)際迭代次數(shù),yi代表果蠅群體節(jié)點(diǎn)定義系數(shù)為i時(shí)的數(shù)據(jù)濃度量,i代表數(shù)據(jù)濃度特征值,具體計(jì)算公式如下:
根據(jù)迭代與初始化預(yù)設(shè)結(jié)果的真實(shí)性,可判斷用戶異常用電數(shù)據(jù)在果蠅算法作用下的傳輸行為能力。
完成果蠅算法的初始化配置后,需要根據(jù)用戶異常用電行為的表現(xiàn)形式,對相關(guān)用電數(shù)據(jù)進(jìn)行初步加工,也就是用電數(shù)據(jù)的預(yù)處理[7-8]。LSTM 網(wǎng)絡(luò)可在分離提取用電數(shù)據(jù)后,根據(jù)算法坐標(biāo)系內(nèi)決策節(jié)點(diǎn)的排列方式,獲取數(shù)據(jù)信息參量的時(shí)序序列模型,并以此為基礎(chǔ),實(shí)現(xiàn)對預(yù)處理數(shù)據(jù)結(jié)果的有效判別。為了保障果蠅算法對于LSTM 網(wǎng)絡(luò)的優(yōu)化作用能力,在執(zhí)行用電數(shù)據(jù)預(yù)處理步驟時(shí),必須控制X(i)表達(dá)式、σ(i)表達(dá)式的數(shù)值結(jié)果始終大于零。設(shè)φ代表果蠅算法的理想優(yōu)化標(biāo)度值,f代表LSTM 網(wǎng)絡(luò)的穩(wěn)定性系數(shù),ΔP代表用戶異常用電行為數(shù)據(jù)的單位傳輸量,聯(lián)立式(1)、式(2),可將用電數(shù)據(jù)的預(yù)處理結(jié)果表示為:
根據(jù)用戶異常用電行為數(shù)據(jù)傳輸量水平的不同,數(shù)據(jù)信息的預(yù)處理結(jié)果也會(huì)發(fā)生相應(yīng)的改變。
根據(jù)用戶異常用電行為,選取LSTM 超參數(shù),需要在果蠅算法的基礎(chǔ)上,確定信息參量在節(jié)點(diǎn)集合體中的濃度衰減情況。首先,根據(jù)LSTM 網(wǎng)絡(luò)中用戶異常用電行為數(shù)據(jù)的覆蓋現(xiàn)狀,確定果蠅算法的優(yōu)化更新速率,從而將不同的超參數(shù)直接賦值到個(gè)體果蠅節(jié)點(diǎn)上[9]。其次,判斷個(gè)體果蠅節(jié)點(diǎn)在LSTM 網(wǎng)絡(luò)中所代表的超參數(shù)適應(yīng)度水平,并分別計(jì)算個(gè)體節(jié)點(diǎn)處的數(shù)據(jù)量濃度。最后,按照個(gè)體果蠅節(jié)點(diǎn)所屬的步長值序列,得到準(zhǔn)確的LSTM 超參數(shù)計(jì)算結(jié)果[10]。設(shè)代表用戶異常用電行為數(shù)據(jù)的備選特征值,β代表單位時(shí)間內(nèi)的果蠅算法優(yōu)化執(zhí)行次數(shù),聯(lián)立式(3),可將LSTM 超參數(shù)計(jì)算結(jié)果表示為:
其中,s代表LSTM 網(wǎng)絡(luò)對于果蠅算法的基本適應(yīng)度數(shù)值,n代表LSTM 網(wǎng)絡(luò)的迭代權(quán)限值。在LSTM 網(wǎng)絡(luò)中,由于果蠅算法的存在,用戶異常用電行為數(shù)據(jù)總是能夠保持相對集中的傳輸表現(xiàn)形式。
在LSTM 網(wǎng)絡(luò)中,為獲得較為理想的用戶異常用電行為預(yù)測結(jié)果,需要根據(jù)異常數(shù)據(jù)信息量的存在形式,確定預(yù)測模型的實(shí)際應(yīng)用價(jià)值,且在此過程中,應(yīng)利用相關(guān)已知條件,選取未知的評(píng)價(jià)指標(biāo)參量[11]。在實(shí)時(shí)選取指令時(shí),必須判斷用戶異常用電行為所屬類型,一般來說,由改變用電類別、超出額定用電量等行為帶來的異常用電數(shù)據(jù)累積量較大,而由遷移電能計(jì)量裝置所帶來的異常用電數(shù)據(jù)累積量相對較小[12]。對于選取預(yù)測評(píng)價(jià)指標(biāo)而言,若不能掌握異常用電行為所屬形式,不但會(huì)造成預(yù)測結(jié)果出現(xiàn)偏差,也會(huì)使果蠅算法的優(yōu)化應(yīng)用能力大打折扣。設(shè)A0代表異常用電數(shù)據(jù)的初始判別量,Am代表異常用電數(shù)據(jù)的實(shí)時(shí)判別量,m為既定的數(shù)據(jù)信息判別條件,聯(lián)立式(4),可將用戶異常用電行為預(yù)測模型的評(píng)價(jià)指標(biāo)選取結(jié)果表示為:
式中,Dmax代表最大的異常用電數(shù)據(jù)篩查系數(shù),k代表LSTM 網(wǎng)絡(luò)中的數(shù)據(jù)信息量篩查條件。為突出果蠅算法的優(yōu)化應(yīng)用能力,在實(shí)際應(yīng)用過程中,用戶異常用電行為數(shù)據(jù)評(píng)價(jià)指標(biāo)的選取應(yīng)以真實(shí)性作為主要參考標(biāo)準(zhǔn)。
缺失值是指因人為原因或機(jī)械原因造成的某項(xiàng)樣本數(shù)據(jù)嚴(yán)重缺失的情況,在預(yù)測處理過程中,若不能準(zhǔn)確掌握樣本數(shù)據(jù)的實(shí)時(shí)缺失情況,勢必會(huì)影響用戶異常用電行為數(shù)據(jù)的傳輸能力,從而造成數(shù)據(jù)信息缺口量繼續(xù)增大[13-14]。為解決此問題,果蠅算法通過優(yōu)化LSTM 網(wǎng)絡(luò)的方式,為所選取評(píng)價(jià)指標(biāo)提供一個(gè)相對穩(wěn)定的預(yù)測背景環(huán)境,并可在不斷融合用戶異常用電行為數(shù)據(jù)的同時(shí),從中提取出具有明顯缺失特征的信息參量,并將其獨(dú)立存儲(chǔ)于既定的網(wǎng)絡(luò)結(jié)構(gòu)體模塊之中。設(shè)ξ代表用戶異常用電行為數(shù)據(jù)的實(shí)時(shí)融合系數(shù),代表異常用電數(shù)據(jù)信息在LSTM 網(wǎng)絡(luò)中的存儲(chǔ)量均值,代表缺失量篩查條件,聯(lián)立上述物理量,可將LSTM 網(wǎng)絡(luò)中異常用電數(shù)據(jù)的缺失值計(jì)算結(jié)果表示為:
如果待預(yù)測的數(shù)據(jù)樣本中存在大量的缺失值參量,則需針對相關(guān)數(shù)據(jù)信息參量進(jìn)行初步剔除處理,再按照缺失值計(jì)算公式,對后續(xù)的用戶異常用電行為預(yù)測指令進(jìn)行妥善安排。
決策參數(shù)能夠決定電信號(hào)訓(xùn)練指令的執(zhí)行與應(yīng)用能力,若依照數(shù)據(jù)樣本條件,對用戶異常用電行為信息量進(jìn)行預(yù)測,則應(yīng)將決策參數(shù)作為關(guān)鍵的數(shù)值考核指標(biāo)[15-16]。假定在已知缺失值計(jì)算量的情況下,決策參數(shù)的數(shù)值結(jié)果只能在極大值bmax、極小值bmin之間不斷波動(dòng),且在已知LSTM 網(wǎng)絡(luò)中果蠅算法優(yōu)化作業(yè)能力的情況下,可認(rèn)為待預(yù)測的異常電量數(shù)據(jù)越多,決策參數(shù)的數(shù)值結(jié)果越靠近極大值方向。設(shè)W1、W2代表兩個(gè)不同的電信號(hào)訓(xùn)練強(qiáng)度值,在上述物理量的支持下,聯(lián)立式(6),可將決策參數(shù)表達(dá)式定義為:
其中,代表用戶異常用電行為數(shù)據(jù)的預(yù)測考核系數(shù)值,θ代表用電數(shù)據(jù)缺失值的標(biāo)準(zhǔn)計(jì)算項(xiàng)系數(shù)。至此,完成相關(guān)指標(biāo)參量的計(jì)算與處理,在果蠅算法優(yōu)化LSTM 原理的支持下,實(shí)現(xiàn)用戶異常用電行為預(yù)測模型的順利應(yīng)用。
按照果蠅算法優(yōu)化LSTM 原則對用戶異常用電數(shù)據(jù)進(jìn)行選取(如圖1 所示),在圈定果蠅群體范圍的條件下,將滿足個(gè)體果蠅定義標(biāo)準(zhǔn)的數(shù)據(jù)作為實(shí)驗(yàn)組變量,將不滿足個(gè)體果蠅定義標(biāo)準(zhǔn)的數(shù)據(jù)作為對照組變量(非果蠅算法優(yōu)化LSTM 的用戶異常用電數(shù)據(jù))[17-19]。
圖1 用戶異常用電數(shù)據(jù)選取
在集中負(fù)荷情況下,將時(shí)間區(qū)段劃分出10 min、20 min、30 min、40 min、50 min 五個(gè)節(jié)點(diǎn)位置,并在每一節(jié)點(diǎn)處,分別對用戶異常用電行為數(shù)據(jù)進(jìn)行提取,如圖2、圖3 所示。
圖2 集中負(fù)荷情況下的橫向用電行為選取
圖3 集中負(fù)荷情況下的縱向用電行為選取
將每一節(jié)點(diǎn)處輸出的用戶異常用電行為數(shù)據(jù)都看作一個(gè)獨(dú)立的電信號(hào),記錄這些電信號(hào)在用戶用電集中負(fù)荷時(shí)所需消耗的訓(xùn)練時(shí)長,詳細(xì)實(shí)驗(yàn)結(jié)果如表1 所示。一般來說,電信號(hào)訓(xùn)練時(shí)間越長,與之對應(yīng)的用戶異常用電行為堆積現(xiàn)象也就越明顯。
分析表1 可知,在橫向用電負(fù)荷量、縱向用電負(fù)荷量數(shù)值均保持一致的情況下,隨實(shí)驗(yàn)時(shí)間的延長,實(shí)驗(yàn)組電信號(hào)訓(xùn)練1 000 次所需的消耗時(shí)間始終小于對照組,從第10 min 到第50 min,二者之間的差值依次為11.93 s、2.82 s、2.55 s、3.13 s、2.17 s。整個(gè)實(shí)驗(yàn)過程中,實(shí)驗(yàn)組電信號(hào)訓(xùn)練1 000 次所需的消耗時(shí)間均值為412.24 s,與對照組均值416.76 s 相比,下降了4.52 s。
表1 電信號(hào)訓(xùn)練時(shí)間
綜上可知,隨著果蠅算法優(yōu)化LSTM 理論的應(yīng)用,集中負(fù)荷情況下電信號(hào)數(shù)據(jù)所需的訓(xùn)練時(shí)間長度明顯縮短,不但解決了電信號(hào)堆積的問題,也可更為準(zhǔn)確地對用戶異常用電行為進(jìn)行預(yù)測。
文中提出了基于果蠅算法優(yōu)化LSTM 的用戶異常用電行為預(yù)測模型,通過初始化標(biāo)準(zhǔn)算法的方式,得到理想化的數(shù)據(jù)信息預(yù)處理結(jié)果,再聯(lián)合LSTM 超參數(shù)指標(biāo),選取異常用電行為預(yù)測所需的數(shù)據(jù)信息參量,由于缺失值系數(shù)項(xiàng)的存在,決策參數(shù)能夠影響最終電信號(hào)訓(xùn)練指令的實(shí)施強(qiáng)度,這也是該模型在用戶用電負(fù)荷量較為集中的情況下,可以直接解決因電信號(hào)堆積而造成的異常用電行為問題的主要原因。