鄭建柏
(國網(wǎng)福建省電力公司廈門供電公司,福建 廈門 361000)
基于樸素貝葉斯和支持向量機的短期負(fù)荷預(yù)測
鄭建柏
(國網(wǎng)福建省電力公司廈門供電公司,福建 廈門 361000)
樸素貝葉斯是一種簡單而高效的分類算法,可與支持向量機結(jié)合組成一種新的組合模型,以便供電企業(yè)在電力供應(yīng)不足時對重點大用戶的負(fù)荷進行預(yù)測。結(jié)果表明:組合模型的有序用電短期負(fù)荷預(yù)測結(jié)果準(zhǔn)確率較高。
樸素貝葉斯;支持向量機;有序用電;負(fù)荷預(yù)測
在迎峰度夏期間,供電企業(yè)經(jīng)常面臨局部地區(qū)電力供應(yīng)不足,短期內(nèi)用戶的負(fù)荷情況是制定有序用電方案的重要依據(jù)。為了讓有序用電方案科學(xué)合理,在供電緊張時盡可能減少對用戶正常用電影響,需要盡可能準(zhǔn)確地取得用戶負(fù)荷預(yù)測數(shù)據(jù)。
用戶負(fù)荷預(yù)測就是在充分考慮用戶的生產(chǎn)情況、自然條件與社會條件的情況下,研究或利用一套系統(tǒng)的處理過去和未來負(fù)荷的數(shù)據(jù)方法,在滿足一定精度的要求下,確定未來特定時刻的負(fù)荷值。負(fù)荷預(yù)測經(jīng)歷了從依賴調(diào)度員的經(jīng)驗到自動化、智能化轉(zhuǎn)變的過程;近年來人工智能技術(shù)被引入負(fù)荷預(yù)測領(lǐng)域,與傳統(tǒng)負(fù)荷預(yù)測方法相比,雖然提高了預(yù)測準(zhǔn)確率,但由于負(fù)荷預(yù)測的復(fù)雜性,預(yù)測結(jié)果往往無法滿足實際生產(chǎn)需要。
貝葉斯分類是一種基于統(tǒng)計方法的分類模型,對于解決復(fù)雜系統(tǒng)不確定因素引起的故障分類問題具有很大優(yōu)勢,被認(rèn)為是目前不確定知識表達和推理領(lǐng)域最有效的理論模型之一,其中樸素貝葉斯分類器以簡單的結(jié)構(gòu)和良好的性能受到人們的關(guān)注?;诟怕式y(tǒng)計的貝葉斯分類方法對樣本數(shù)量要求較高,而在實際應(yīng)用中常常難以獲得大量樣本,因此會嚴(yán)重影響其分類性能,較難滿足實際分類需要。
支持向量機(簡稱SVM)是一種以統(tǒng)計學(xué)理論為基礎(chǔ),針對有限樣本的一種通用學(xué)習(xí)方法,能有效解決小樣本、高維數(shù)、非線性等問題,并克服人工神經(jīng)網(wǎng)絡(luò)存在局部最優(yōu)等缺點,大大提高了學(xué)習(xí)方法的泛函能力。鑒于SVM能在訓(xùn)練樣本很少的情況下很好地達到分類推廣的目的,國內(nèi)外學(xué)者已開始在負(fù)荷預(yù)測領(lǐng)域進行SVM方法的應(yīng)用研究。
根據(jù)有序用電工作對負(fù)荷預(yù)測的需要,提出用支持向量機來改進貝葉斯分類器的算法,建立一種基于樸素貝葉斯和支持向量機的變壓器故障診斷模型,并用廈門供電公司重點用戶的負(fù)荷數(shù)據(jù)進行驗證分析,結(jié)果表明新模型取得了令人滿意的效果。
貝葉斯分類是一種典型的基于統(tǒng)計方法的分類模型,它通過對訓(xùn)練集的學(xué)習(xí)而歸納出分類器,并以此對沒有分類的數(shù)據(jù)進行分類。
樸素貝葉斯分類器是基于貝葉斯公式的分類器,當(dāng)訓(xùn)練集D的所有實例都完整時,通過對實例出現(xiàn)頻率的統(tǒng)計,求出給定類變量C條件下各個屬性變量Xi的條件概率。理論上,條件變量滿足條件獨立下它是最優(yōu)的。
由貝葉斯公式可知:
通過訓(xùn)練集D獲得P(C),P(X1|C),…,P(Xn|C)的值,對給定的屬性值X1,…,Xn,使最大)的C值便是X1,…,Xn所屬的類。
類變量取第k個值Ck的先驗概率為:
其中:NCk為類變量取Ck的樣本數(shù);N為樣本總數(shù)。
用似然概率作為各屬性節(jié)點的條件概率估計值,其計算公式為:
支持向量機是Vapnik等根據(jù)統(tǒng)計學(xué)習(xí)理論中的結(jié)構(gòu)風(fēng)險最小化原則提出的,最初是用來解決模式識別問題。支持向量機用于模式識別的基本思想是構(gòu)造一個超平面作為決策平面,使2類模式之間的間距最大。對于線性可分的訓(xùn)練樣本:(xi,yi),xi∈Rn,yi∈{+1,-1},i=1,…,n,可構(gòu)造最優(yōu)分類超平面使得這2類樣本完全分開(見圖1)。
最優(yōu)分類方程為:x·w+b=0。
為此需求解下列二次規(guī)劃問題:
使分類間隔最大就是對推廣能力的控制,這是SVM的核心思想之一。求解最優(yōu)分類面問題實際上就是利用Lagrange優(yōu)化方法將其轉(zhuǎn)化為對偶問題,即:
圖1 SVM線最優(yōu)分類面
最終得到?jīng)Q策函數(shù)是:
對非線性可分的情況,還可采用核函數(shù)的方法,即通過核函數(shù)映射使之轉(zhuǎn)化為在高維特征空間中構(gòu)造線性分類超平面的問題。輸入空間的樣本做非線性變換,不同的支持向量代入支持向量機的決策函數(shù),最終支持向量機的非線性分類決策函數(shù)表示為:
樸素貝葉斯分類器結(jié)構(gòu)簡單,實現(xiàn)多分類的性能較好,在多個領(lǐng)域得到廣泛的應(yīng)用。但在有序用電的負(fù)荷預(yù)測時,難以大量獲取同類樣本,樣本的缺乏給樸素貝葉斯分類造成了很大的影響。支持向量機已被證明在小樣本情況下表現(xiàn)突出,并成功應(yīng)用于多個分類領(lǐng)域。因此考慮引進支持向量機來改進樸素貝葉斯模型,解決某些類別因樣本較少而誤判的可能。建立一種基于樸素貝葉斯和支持向量機的組合模型,該模型可應(yīng)用于有序用電時的負(fù)荷預(yù)測中。
樸素貝葉斯(NB)和支持向量機(SVM)相結(jié)合的基本原理是:若類別ci,cj的樣本較少,就將這2類合并成1類cij,作為樸素貝葉斯分類器的1個輸出類,這樣對于小樣本情況下樸素貝葉斯分類器分類效果比較差的問題能夠有效解決。若某條信息通過樸素貝葉斯分類器計算的分類結(jié)果為cij,就將該信息輸入支持向量機,并將類別ci,cj對應(yīng)的樣本作為支持向量機的訓(xùn)練樣本,最后可以得到該信息的確切分類,實驗原理如圖2所示。
圖2 基于樸素貝葉斯和支持向量機組合模型
在有序用電中,大用戶的負(fù)荷情況對整體負(fù)荷影響最大,因此需重點關(guān)注大用戶的負(fù)荷走勢,尤其是每天負(fù)荷高峰期(11:00和14:00)的負(fù)荷極值是否超過允許最大負(fù)荷。
選取廈門供電公司用重點大用戶電負(fù)荷最高的前50戶,對其在2012—2014年3年間夏季負(fù)荷最高月每天96點負(fù)荷數(shù)據(jù)和氣象數(shù)據(jù)進行整理,保留有效數(shù)據(jù)共1 280條,將這些數(shù)據(jù)作為訓(xùn)練樣本。在組合模型中經(jīng)參數(shù)優(yōu)化,得到參數(shù)修正后的組合預(yù)測模型。
在2015年的有序用電期間,將廈門供電公司負(fù)荷最高的50戶用電數(shù)據(jù)、氣象數(shù)據(jù)輸入組合預(yù)測模型,重點預(yù)測明日負(fù)荷與今日負(fù)荷的對比情況,分為“高、低、平”3類進行分類預(yù)測。預(yù)測準(zhǔn)確率達到98 %,而且預(yù)測速度在10 s以內(nèi)。實驗結(jié)果表明:利用樸素貝葉斯和支持向量機的組合模型進行有序用電短期負(fù)荷預(yù)測,這種方法是可行的、實用的。
本文針對有序用電工作中對短期負(fù)荷預(yù)測的需求,在對常用的樸素貝葉斯分類算法進行研究之后,提出用支持向量機分類器進行改進,解決了其在小樣本情況下分類效果不好的問題。通過運用組合模型對用戶用電負(fù)荷進行診斷,收到了令人滿意的診斷效果,表明了該方法的有效性和實用性。
1 朱永利,吳立增,李雪玉.貝葉斯分類器與粗糙集相結(jié)合的變壓器綜合故障診斷[J].電機工程學(xué)報,2005,25(10):159-165.
2 王 多,王維洲,靳 丹,等.基于貝葉斯網(wǎng)絡(luò)的連鎖故障概率模型[J].電力安全技術(shù),2011,13(7):36-38.
2016-07-14。
鄭建柏(1981-),男,計量管理高級師,主要從事電力營銷計量管理工作,email:wellzheng@126.com。