張朝輝,羅 煒,林康照,秦冠軍,金巖磊,丁 笠,周 宇
(1.中國南方電網(wǎng)有限責任公司超高壓輸電公司廣州局,廣州 510663;2.南京南瑞繼保電氣有限公司,南京 211102;3.南京航空航天大學計算機科學與技術(shù)學院,南京 211106)
隨著國內(nèi)經(jīng)濟的迅猛增長,國民用電需求也在快速增長。與之相對應(yīng)的,中國的超、特高壓輸變電技術(shù)也正式走向了完善和成熟。在高壓輸電技術(shù)日趨成熟的前提下,如何做到精益求精,對超、特高壓輸變電工程安全性、穩(wěn)定性和智能化的要求越來越高,成為一個急需面對的嚴峻問題。目前直流輸電正朝著高電壓大容量的技術(shù)方向發(fā)展,直流輸電的長距離輸電等方面優(yōu)勢明顯,但也會出現(xiàn)一些關(guān)鍵設(shè)備由于故障造成的直流系統(tǒng)非正常停運,對電力系統(tǒng)造成的影響越來越大[1]。因此,提高對直流關(guān)鍵設(shè)備的感知程度,對電網(wǎng)中關(guān)鍵設(shè)備存在的潛在故障隱患進行提前預(yù)判采取相應(yīng)的對策,將故障消滅在萌芽階段,對降低直流系統(tǒng)非正常停運風險并保證供電可靠性具有重要的意義。
合并單元裝置為直流控制保護系統(tǒng)提供真實有效的電流或電平信息,是直流關(guān)鍵設(shè)備,是直流測量裝置的重要組成部件[2]。合并單元裝置用于接收直流測量裝置的數(shù)字采樣信號,合并各直流測量裝置的采樣數(shù)據(jù)并進行組幀,然后通過光纖介質(zhì)按照標準通信協(xié)議分別傳輸?shù)街绷骺刂票Wo等設(shè)備。同時,它還要通過供能光纖為直流測量裝置的遠端模塊(Remote terminal unit,RTU)提供激光能量作為其工作電源。在運行時,如果出現(xiàn)激光器驅(qū)動電流高、激光器溫度高或者接收數(shù)據(jù)電平低的情況,會導(dǎo)致直流測量出現(xiàn)偏差,造成直流非正常停運[3]。
當前,針對合并單元裝置的運行狀態(tài)存在一些監(jiān)視措施,但大多是利用已有經(jīng)驗來設(shè)置合并單元設(shè)置閾值。當合并單元裝置中某些數(shù)據(jù)超過或低于已設(shè)閾值時,系統(tǒng)發(fā)出告警信號。這種方式僅能區(qū)分系統(tǒng)的“健康”和“不健康”狀態(tài),對處于中間區(qū)域的“亞健康”狀態(tài)無法識別并及時預(yù)警。除此之外,此方式缺少對監(jiān)視數(shù)據(jù)進行充分的挖掘和分析,不能及時發(fā)現(xiàn)隱藏在電網(wǎng)時序數(shù)據(jù)中的信息和趨勢。鑒于此,考慮到監(jiān)視數(shù)據(jù)具有時序性,本文提出利用時序分析方法對監(jiān)測數(shù)據(jù)進行時序分析并預(yù)測未來值從而達到評估合并單元設(shè)備狀態(tài)的目的。而且,考慮到合并單元激光器電平是合并單元的關(guān)鍵參數(shù)之一,著重根據(jù)合并單元激光器驅(qū)動電平的監(jiān)視數(shù)據(jù)進行合并單元設(shè)備狀態(tài)的預(yù)測研究,以期創(chuàng)建預(yù)測電網(wǎng)時序數(shù)據(jù)模型,挖掘數(shù)據(jù)中的隱藏信息和趨勢,降低維護成本,提高故障排查效率,分析和掌握設(shè)備狀態(tài)信息,實現(xiàn)合并單元設(shè)備及時預(yù)警[4]。
國內(nèi)外研究學者提出很多基于時序數(shù)據(jù)的分析方法[5-8]。這些方法經(jīng)歷了從傳統(tǒng)的時序模型到基于機器學習的模型,以及從單一模型到組合模型的發(fā)展,都對時間序列數(shù)據(jù)進行分析,根據(jù)時間序列體現(xiàn)出的趨勢、規(guī)律和方向?qū)罄m(xù)過程進行擴展和總結(jié),進而預(yù)測下一段時間內(nèi)的數(shù)據(jù)水平。
傳統(tǒng)的時間序列分析方法有很多種。1927年數(shù)學家Yule提出自回歸(Autoregressive,AR)模型,根據(jù)之前已經(jīng)存在的數(shù)據(jù)來預(yù)測未來下一時間點。1931年Walker提出滑動平均(Moving average,MA)模型和自回歸滑動平均(Autoregressive moving average,ARMA)模型。MA模型是一種根據(jù)時序數(shù)據(jù)通過計算移項、時間序列的平均值來體現(xiàn)數(shù)據(jù)長期趨勢的方法。相較于AR模型和MA模型,ARMA模型在譜估計和譜分辨率方面表現(xiàn)更為優(yōu)異,與其相對應(yīng)的參數(shù)估算也較為復(fù)雜。上述3種模型的構(gòu)建均以平穩(wěn)時間序列為前提,而差分整合移動平均自回歸(Autoregressive integrated moving average,ARIMA)模型的優(yōu)點在于可以對非平穩(wěn)的時序數(shù)據(jù)建模進行時序分析預(yù)測[9-10]。
時間序列預(yù)測研究與機器學習方法中的回歸分析關(guān)系密切。機器學習方法中包括了常見的支持向量機(Support vector machine,SVM)[11]、貝葉斯網(wǎng)絡(luò)[12]等,矩陣分解等方法也常用在時間序列數(shù)據(jù)的分析預(yù)測方面,并取得了不錯的效果。Kim[13]采用SVM對股票價格指數(shù)加以預(yù)測取得了很好的效果;Tay和Cao[14]也將SVM應(yīng)用在金融時間序列數(shù)據(jù)方面進行預(yù)測;Das和Ghosh[15-16]提出將時空信息融合到貝葉斯網(wǎng)絡(luò),對氣象領(lǐng)域的時間序列數(shù)據(jù)進行預(yù)測;在應(yīng)對高維度時間序列時,一般的時序分析模型往往難以應(yīng)對,因此Yu等[17]提出一種時間正則矩陣分解技術(shù),可以很好地解決此問題,而且在包含了噪聲數(shù)據(jù)的時間序列數(shù)據(jù)方面展現(xiàn)了良好的魯棒性。
近年來,隨著深度學習的不斷深入發(fā)展以及廣泛應(yīng)用,它在時間序列預(yù)測方面也是有效的[18-20],尤其是循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent neural networks,RNN)的使用。RNN可以解決時間上的延續(xù)性問題[21]。雖然RNN將整個時間序列信息轉(zhuǎn)換成一個向量,但始終存在一個無法解決的問題,就是時序數(shù)據(jù)在時序長度不斷增加的情況下,RNN的記憶能力與時序長短成反比而不斷減弱,最終效果也就不甚明顯,由于存在如此缺陷,會導(dǎo)致RNN無法克服自身存在的長期依賴的問題[22]。長短期記憶網(wǎng)絡(luò)(Long short-term memory,LSTM)由Schmidhuber在1997年提出,其目的就是為了彌補RNN的不足之處。它引入了一個上下文向量,進而在解碼過程中可以選取最相關(guān)的信息,因此非常適合用于時序數(shù)據(jù)分析,構(gòu)建預(yù)測模型。
但無論是傳統(tǒng)時序分析方法中的ARIMA模型、機器學習方法中的SVM、還是深度學習中的LSTM神經(jīng)網(wǎng)絡(luò),沒有一種特定的單一模型能夠統(tǒng)一對電網(wǎng)時間序列數(shù)據(jù)做出最好的預(yù)測,因此組合模型應(yīng)運而生。組合模型可以彌補單個預(yù)測的缺點,受益于單個預(yù)測之間的相互作用以及各個模型的多樣性,在減少單一模型使用風險的同時又能夠提升預(yù)測精度。在組合預(yù)測模型中,如何分配每個單一預(yù)測模型的權(quán)重系數(shù)是提高預(yù)測準確性的關(guān)鍵。大多數(shù)研究采用相對簡單的等權(quán)平均組合預(yù)測法和均方根誤差組合預(yù)測法。等權(quán)平均組合預(yù)測法中的各個模型同等重要,即所有權(quán)重都相等,沒有給預(yù)測更準確的單一模型分配更多的權(quán)重,即沒有優(yōu)選的概念,而均方根誤差組合預(yù)測法存在權(quán)值不穩(wěn)定的問題??紤]到蛙跳算法(Shuffled frog leaping algorithm,SFLA)具有很強的全局收斂性和局部搜索細致等優(yōu)點[23],因此,選取SFLA求得組合模型中各個模型的較優(yōu)權(quán)重值,在各個單一模型基礎(chǔ)上綜合優(yōu)化進而提高預(yù)測準確性。
合并單元設(shè)備狀態(tài)研究與數(shù)據(jù)息息相關(guān)??紤]到合并單元激光器驅(qū)動電平是合并單元設(shè)備的一個關(guān)鍵參數(shù),本文根據(jù)合并單元激光器驅(qū)動電平的監(jiān)視數(shù)據(jù)進行合并單元設(shè)備狀態(tài)的預(yù)測研究。
本工作數(shù)據(jù)來源于中國南方電網(wǎng)從2017年9月到2019年8月的超高壓換流站設(shè)備合并單元激光器驅(qū)動電平數(shù)據(jù)記錄。
考慮到要分析數(shù)據(jù)的時序性和趨勢性特征,而初始數(shù)據(jù)是散亂分布于數(shù)據(jù)庫中的,因此需要以下一系列的數(shù)據(jù)預(yù)處理來構(gòu)建一個干凈的數(shù)據(jù)集。
(1)數(shù)據(jù)存取高效性保證:為了保證高速、有效地對數(shù)據(jù)進行劃分、篩選和清洗,將所有數(shù)據(jù)從數(shù)據(jù)庫中導(dǎo)出,并以JSON或者CSV文件格式存儲。
(2)數(shù)據(jù)時序性保證:鑒于合并單元設(shè)備數(shù)量眾多,需要對每臺設(shè)備的監(jiān)視數(shù)據(jù)進行分析,為了分析每臺設(shè)備隨時間變化的運行狀態(tài),需要對數(shù)據(jù)按設(shè)備進行劃分,并按時間節(jié)點對每臺設(shè)備的監(jiān)視數(shù)據(jù)進行排序,確保數(shù)據(jù)的有效性和時序性。
(3)冗余數(shù)據(jù)濾除:在所有監(jiān)視數(shù)據(jù)中存在冗余數(shù)據(jù),即存在因為停電、故障等原因造成的某個時間段內(nèi)數(shù)據(jù)值缺失的問題,因此,需要將這些無效數(shù)據(jù)進行清洗和過濾,進而確保所收集數(shù)據(jù)的真實性和有效性。
在獲得干凈的數(shù)據(jù)集后,可以對監(jiān)測到的合并單元激光器驅(qū)動電平數(shù)據(jù)進行趨勢分析。
為了更好地分析合并單元激光器驅(qū)動電平數(shù)據(jù)隨時間變化的趨勢性和規(guī)律性,分別按天、周對合并單元激光器驅(qū)動電平數(shù)據(jù)進行隨機抽樣,分析其規(guī)律性和趨勢變化。
2.2.1 一天內(nèi)數(shù)據(jù)分析
對過濾后的數(shù)據(jù)集進行隨機抽樣,選取3天的合并單元激光器電平數(shù)據(jù)進行分析,其采集數(shù)據(jù)隨時間的變化如圖1所示,其中3個分圖分別描繪了在一天時間內(nèi)合并單元激光器驅(qū)動電平的變化趨勢。
從圖1可以分析出,合并單元激光器驅(qū)動電平在正常工作情況下,其值會趨于保持在一個穩(wěn)定范圍內(nèi),會有隨機的波動,但值的波動幅度較小,且驅(qū)動電平值均在正常值范圍之內(nèi)變化。
2.2.2 一周內(nèi)數(shù)據(jù)分析
對過濾后的數(shù)據(jù)集進行隨機抽樣,選取了3周的驅(qū)動電平數(shù)據(jù)進行分析,結(jié)果如圖2所示,其中3個分圖分別描繪了在3周時間內(nèi)合并單元中激光器驅(qū)動電平的變化趨勢。
從圖2可以分析出,激光器驅(qū)動電平在正常工作情況下,其值依舊會趨于保持在一個穩(wěn)定范圍內(nèi),會有隨機的波動,但值的波動幅度不大,且驅(qū)動電平值均在正常值范圍之內(nèi)變化。為進一步確定采集到的激光器驅(qū)動電平數(shù)據(jù)是否為一個平穩(wěn)時間序列,可采用計算均值、標準差等方式。
對處理好的合并單元激光器電平數(shù)據(jù),選取、確定一些時序性分析方法,嘗試建立預(yù)測模型,對合并單元設(shè)備狀態(tài)進行組合模型預(yù)測分析。
組合模型的原理是分別對單一時序預(yù)測模型預(yù)測結(jié)果進行再處理,首先采取一定的方法計算后得到適當?shù)臋?quán)重,然后對各個模型的預(yù)測結(jié)果加權(quán)平均計算,以最終得到的結(jié)果作為最終預(yù)測結(jié)果。組合模型可以在多個單一模型預(yù)測結(jié)果的基礎(chǔ)上綜合優(yōu)化,降低單一模型不適用的風險,提高預(yù)測精度。本文選擇將傳統(tǒng)的預(yù)測模型分別和SVM、LSTM神經(jīng)網(wǎng)絡(luò)構(gòu)建兩個組合預(yù)測模型對電網(wǎng)數(shù)據(jù)進行實驗,分析挖掘數(shù)據(jù)內(nèi)在的規(guī)律,組合模型的基本原理為
式中:yi(i=1,2,…,n)為真實電量時序數(shù)據(jù);ypj(j=1,2,…,k)為第j個模型的預(yù)測值;Wj為第j個模型權(quán)重的估計值,滿足和wj≥0;yp為組合預(yù)測值。
本方法進行預(yù)測的基本原理是基于誤差平方和最小的固定權(quán)系數(shù)進行組合預(yù)測,即
本文采用SFLA算法對式(2)進行優(yōu)化,即誤差平方和取得最小值時,得出相應(yīng)權(quán)重系數(shù),并賦值給式(1),從而獲得最優(yōu)組合預(yù)測值。
(1)ARMA模型。ARMA模型進行時序數(shù)據(jù)分析的首要條件是數(shù)據(jù)平穩(wěn)性,它是由AR模型與MA模型兩個傳統(tǒng)時序模型改進結(jié)合兩者優(yōu)點而構(gòu)成的模型。假設(shè)一個隨機過程在時間的維度上,通過計算其均值和方差值,如果兩者的計算結(jié)果都是固定不變的數(shù)值,滿足這樣條件的隨機時間序列即為平穩(wěn)的。ARMA模型可表示為
式中:p、q分別代表了ARMA模型的階數(shù),簡記為ARMA(p,q),即時序預(yù)測值Yt是現(xiàn)在和過去的誤差或沖擊值εt以及在此之前的時間序列Yt-1的線性組合。
(2)ARIMA模型。ARIMA模型是針對不滿足平穩(wěn)性條件的時間序列建模。通過差分將非平穩(wěn)的時間序列進行平穩(wěn)化。ARIMA模型本質(zhì)上可以也能看作AR模型與MA模型的組合,但和ARMA模型有所區(qū)別。ARIMA模型可表示為
式中:L代表滯后算子;d表示對非平穩(wěn)時序數(shù)據(jù)經(jīng)過d次差分后得到的平穩(wěn)的時序數(shù)據(jù)。
(3)SVM模型。SVM模型是以統(tǒng)計學理論為基礎(chǔ)的學習方法,在高維數(shù)據(jù)處理方面有較強優(yōu)勢,而且可以在參數(shù)少、樣本小的條件下具有很好的泛化能力。從理論上分析只存在唯一的全局最優(yōu)解,其泛化能力在小樣本集合條件下有更好的體現(xiàn)。SVM模型的性能由誤差懲罰因子C和核函數(shù)中的參數(shù)決定。誤差懲罰因子的作用在于確定數(shù)據(jù)子空間時調(diào)節(jié)置信區(qū)間范圍。本文選用徑向基函數(shù)作為核函數(shù),其參數(shù)σ為徑向基半徑。在構(gòu)建支持向量機模型時,需要綜合衡量之后合理地選擇支持向量機的參數(shù),提高模型的學習和泛化能力。
(4)LSTM神經(jīng)網(wǎng)絡(luò)。LSTM模型具有記憶長短期信息的能力,可以從過去的數(shù)據(jù)中挖掘有用信息來分析未來變化的規(guī)律。LSTM網(wǎng)絡(luò)可以解決梯度消失不能進行很好反饋的問題。根本原因在于LSTM網(wǎng)絡(luò)采用記憶塊取代傳統(tǒng)的RNN的隱含節(jié)點,從而能夠更好地學習時序數(shù)據(jù)內(nèi)在長期依賴關(guān)系。LSTM神經(jīng)網(wǎng)絡(luò)模型在訓(xùn)練時涉及到許多超參數(shù)的設(shè)定,設(shè)神經(jīng)元數(shù)量為m,時間步長T,批數(shù)據(jù)大小batch size,迭代次數(shù)epoch輪。神經(jīng)元個數(shù)決定了神經(jīng)網(wǎng)絡(luò)對時序數(shù)據(jù)的擬合程度,時間步長和批數(shù)據(jù)大小決定了模型訓(xùn)練的結(jié)果,選擇適應(yīng)性矩估計(Adaptive moment estimation,ADAM)優(yōu)化器對參數(shù)進行優(yōu)化調(diào)整。
(5)SFLA算法?;驹硎牵涸贒維搜索空間內(nèi),隨機產(chǎn)生一只青蛙種群。Xi=(xi1,xi2,…,xid)表示種群的第i只青蛙個體,并按照適應(yīng)度進行非遞增排序,然后將種群按照一定方法分為s個子群。其方法為第一只青蛙分配到第一個子群,第二只青蛙分配到第二個子群,第s只青蛙分配到第s個子群,值得注意的是第s+1只青蛙會重新分配到第一個子群,以此類推,直到青蛙分配完畢。
在每個子群,適應(yīng)度最優(yōu)的青蛙個體設(shè)為Xbest,適應(yīng)度最差的青蛙個體設(shè)為Xworst。對整個青蛙群體而言,一定存在適應(yīng)度最優(yōu)的青蛙個體,記為Xg。對從第一個子群開始對每個子群進行局部搜索,最終搜到第s個子群,在這個過程中,按照以下更新策略迭代每個子群中最差的個體。
式中:rand()表示范圍大于零小于1的隨機數(shù),Dmax為青蛙個體可以移動的最大步長。如果經(jīng)過更新迭代后,計算出的最新的Xworst個體優(yōu)于原來的Xworst個體,則取代原子種群中最差的青蛙個體,否則就用Xg代替Xbest重新進行更新,如果其適應(yīng)度仍沒有改進,則隨機產(chǎn)生一個X'worst取代原有的Xworst。不斷執(zhí)行上述步驟,直到完成所有更新。當子群體全部經(jīng)過局部搜索后,將青蛙個體進行混合運算,重新劃分子群,進行局部搜索,直到迭代次數(shù)完成為止。
(1)算術(shù)平均值,表示為
(2)方差,表示為
(3)均方根誤差,表示為
隨機選取一臺合并單元設(shè)備從2020年5月1日到5月30日的數(shù)據(jù)進行實驗分析評估,電平數(shù)據(jù)采樣的時間間隔為5 min,數(shù)據(jù)的趨勢變化如圖3所示。從圖3可以看出,合并單元在正常工作狀態(tài)下,激光器驅(qū)動電平趨于平穩(wěn),波動幅度較小,其算術(shù)平均值趨近于一個常量,方差值亦趨近于0。此外,運用迪基-福勒檢驗進行單位根校驗[25],計算得到p值小于0.01,說明此時間序列在超過99%的置信水平下是顯著的,即數(shù)據(jù)是時間平穩(wěn)序列,不需要經(jīng)過差分運算就可以建模。
圖3 激光器驅(qū)動電平一個月內(nèi)數(shù)據(jù)變化圖Fig.3 Data change diagram of laser drive level within one month
本文方法中的參數(shù)設(shè)置:基于激光器驅(qū)動電平的數(shù)據(jù)是時間平穩(wěn)序列,先建立ARIMA(1,0,2)模型,確定模型參數(shù),進行預(yù)測。將懲罰因子C設(shè)為10,用徑向基函數(shù)(Radial basis function,RBF)作為進行預(yù)測。優(yōu)化誤差懲罰因子C和核函數(shù)能夠很好提升SVM的性能,LSTM神經(jīng)網(wǎng)絡(luò)的神經(jīng)元數(shù)量m=128,批數(shù)據(jù)大小batch size=32,迭代次數(shù)epoch=10。SFLA算法的群體數(shù)為150,子群數(shù)s=5,子群迭代次數(shù)設(shè)為50,混合迭代總數(shù)1 000。
將提出的基于SFLA算法優(yōu)化的ARIMA(1,0,2)和SVM組合模型方法與等權(quán)組合模型方法、ARIMA及SVM的預(yù)測結(jié)果進行比較,驗證SFLA算法優(yōu)化后組合模型的有效性。從圖4可以看出,采用SFLA算法優(yōu)化組合模型所預(yù)測的曲線與ARIMA(1,0,2)和SVM預(yù)測曲線相比,在合并單元驅(qū)動電平數(shù)據(jù)發(fā)生變化上更加接近真實電平曲線。
圖4 ARIMA、SVM、SFLA預(yù)測模型的預(yù)測結(jié)果Fig.4 Prediction results of ARIMA,SVM and SFLA models
表1通過均方根誤差指標評估組合模型質(zhì)量,SFLA算法優(yōu)化組合模型的均方根誤差為3.12,優(yōu)于單一的ARIMA模型和SVM模型。說明基于SFLA算法優(yōu)化組合預(yù)測模型比單一模型更加適合應(yīng)用在電網(wǎng)中電平預(yù)測,獲得的預(yù)測效果更好。
表1 SFLA優(yōu)化組合模型與ARIMA、SVM模型的性能對比Table 1 Performance comparison among ARIMA,SVM models and the combined model optimized by SFLA
將提出的基于SFLA算法優(yōu)化的ARIMA(1,0,2)和LSTM神經(jīng)網(wǎng)絡(luò)組合模型方法與等權(quán)組合模型方法,ARIMA(1,0,2)及LSTM神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果進行比較,驗證優(yōu)化后組合模型的有效性。從圖5中可以看出,采用SFLA算法優(yōu)化組合模型所預(yù)測的曲線比ARIMA(1,2)和LSTM預(yù)測曲線相比更加接近真實電平曲線。ARMA(1,0,2)可以很好擬合真實電平在運行過程中變化的曲線,但SFLA算法優(yōu)化組合模型可以在ARIMA(1,0,2)模型的基礎(chǔ)上進一步提升擬合精度。
圖5 ARIMA、LSTM、SFLA預(yù)測模型的預(yù)測結(jié)果Fig.5 Prediction results of ARIMA,LSTM and SFLA models
表2說明,經(jīng)過SFLA算法優(yōu)化的ARIMA-LSTM組合在預(yù)測模型的均方誤差和均方根誤差上均優(yōu)于單一模型,組合模型可以結(jié)合兩個模型的優(yōu)點提高預(yù)測精度,在電平數(shù)據(jù)預(yù)測中獲得更好的效果。
表2 SFLA優(yōu)化組合模型與ARIMA、LSTM模型的性能對比Table 2 Performance comparison among ARIMA,LSTM models and the combined model optimized by SFLA
為了比較SFLA算法優(yōu)化后的ARMA-SVM組合模型和SFLA算法優(yōu)化后的ARMA-LSTM組合模型,確定哪個組合模型更適合電網(wǎng)數(shù)據(jù)預(yù)測,將其進行單獨對比,結(jié)果如圖6所示。從圖6可以看出,經(jīng)過SFLA算法優(yōu)化的ARIMA-LSTM組合模型明顯優(yōu)于ARIMA-SVM模型。
圖6 SFLA優(yōu)化后不同組合預(yù)測模型的預(yù)測結(jié)果Fig.6 Prediction results of different combination prediction models after SFLA algorithm optimization
表3進一步說明ARIMA-LSTM組合模型適合電網(wǎng)中的電量預(yù)測,主要原因是LSTM神經(jīng)網(wǎng)絡(luò)屬于深度學習方法,和淺層機器學習方法算法相比具有更好的非線性能力和泛化能力。SVM在訓(xùn)練集樣本學習到擬合效果較好的映射關(guān)系,在實際應(yīng)用中面對新數(shù)據(jù),其預(yù)測效果并不理想,其原因是淺層機器學習模型的泛化能力較差。而深度學習則通過多層連接和權(quán)值共享的網(wǎng)絡(luò)結(jié)構(gòu)增強了模型的泛化性能。
表3 兩種SFLA優(yōu)化組合模型性能對比Table 3 Performance comparison between two combined models optimized by SFLA
為了進一步比較SFLA算法對組合模型優(yōu)化的性能,將經(jīng)過SFLA算法優(yōu)化后的ARIMA-LSTM組合模型與基于ARIMA和LSTM兩個單一模型形成的等權(quán)組合模型和方差-協(xié)方差組合模型進行對比,結(jié)果如圖7所示。從圖7中可以發(fā)現(xiàn),3組組合模型都能很好擬合電平的變化趨勢。采用SFLA算法優(yōu)化組合模型所預(yù)測的曲線與另外兩個組合模型形成的曲線比較接近,是因為通過SFLA算法經(jīng)過一系列計算之后,計算出的權(quán)值和另外兩個組合模型的權(quán)值比較接近。經(jīng)局部SFLA算法優(yōu)化后的模型能夠更好地反應(yīng)真實數(shù)據(jù)。
圖7 不同組合模型預(yù)測結(jié)果Fig.7 Prediction results of different prediction models
從表4中計算的均方根誤差和均方誤差說明,經(jīng)過SFLA算法優(yōu)化的ARIMA-LSTM組合預(yù)測模型各項指標均優(yōu)于ARIMA-LSTM等權(quán)組合模型和方差-協(xié)方差組合模型,SFLA算法對組合模型的優(yōu)化效果更好。
表4 不同優(yōu)化方法的組合模型性能對比Table 4 Performance comparison among different optimized methods for combined models
采用SFLA算法對組合模型進行優(yōu)化,綜合改進組合模型ARIMA-SVM和ARIMA-LSTM中各自的優(yōu)點,在單一模型的基礎(chǔ)上進一步提升預(yù)測精度。更好地處理時序序列數(shù)據(jù)預(yù)測的隨機性因素,與單一模型相比,在降低模型選擇風險的同時提高預(yù)測精度。
SFLA算法具有很強的全局搜索性和局部搜索仔細的特點。采用SFLA算法確定組合預(yù)測模型中每個模型的權(quán)重系數(shù),相比較等權(quán)組合模型中各個模型權(quán)重都相等,沒有優(yōu)選的概念,而均方根誤差組合預(yù)測法存在權(quán)值不穩(wěn)定的問題,能夠進一步提高預(yù)測精度。
本文對ARMA和SVM組合模型進行優(yōu)化,將其應(yīng)用在電網(wǎng)中的電平預(yù)測,精度比單一模型和等權(quán)組合模型有所提高,為電網(wǎng)中的電平預(yù)測提供了一種行之有效的預(yù)測方法。