孫豐杰,王承民,謝 寧
(上海交通大學(xué) 電子信息與電氣工程學(xué)院,上海 200240)
智能電網(wǎng)是利用現(xiàn)代網(wǎng)絡(luò)信息技術(shù)等實現(xiàn)電網(wǎng)設(shè)備間的數(shù)據(jù)信息交換,從而實現(xiàn)電網(wǎng)實時自動化控制、智能調(diào)節(jié)、在線決策分析等功能的新型電網(wǎng)[1]。
智能電網(wǎng)的建設(shè)積累了海量數(shù)據(jù)資源,目前電力公司“用數(shù)據(jù)管理企業(yè),用信息驅(qū)動業(yè)務(wù)”的需求日益迫切。而智能電網(wǎng)大數(shù)據(jù)具有4V特征,即數(shù)量大(Volume)、種類多(Variety)、速度快(Velocity)、價值密度低(Value)。傳統(tǒng)的數(shù)據(jù)處理方法已經(jīng)難以滿足需求,因此學(xué)者們提出了一系列大數(shù)據(jù)挖掘算法。
關(guān)聯(lián)規(guī)則挖掘算法由Agrawal等在文獻[2]中首先提出,該方法從大量歷史數(shù)據(jù)中尋找頻繁項或?qū)傩灾g的關(guān)聯(lián)性?,F(xiàn)有的關(guān)聯(lián)規(guī)則挖掘方法主要是Apriori算法及頻繁模式樹FP-Tree(Frequent Pattern-Tree)算法[3-4]。Apriori算法的主要缺點是需要尋找大量的侯選項目集,當(dāng)數(shù)據(jù)庫較大時,存在組合爆炸問題,同時,Apriori算法需要多次掃描數(shù)據(jù)庫,增加了計算的負擔(dān)。
針對Apriori算法的缺點,J. Han提出了利用FP-Tree產(chǎn)生頻繁項集的方法[5-6]。FP-Tree算法將提供頻繁項集的數(shù)據(jù)庫壓縮到FP-Tree上,然后從初始后綴模式開始,構(gòu)造條件模式基,再形成條件FP-Tree,并遞歸地在該樹上進行挖掘,其主要優(yōu)點體現(xiàn)在:不需要產(chǎn)生候選項,僅需要構(gòu)造FP-Tree和條件FP-Tree,通過遞歸地訪問FP-Tree產(chǎn)生頻繁模式;對事務(wù)數(shù)據(jù)庫僅需2次遍歷,第1次遍歷產(chǎn)生頻繁1-項集,第2次遍歷用于創(chuàng)建FP-Tree,從而極大地降低了訪問數(shù)據(jù)庫的次數(shù)。FP-Tree算法存在的主要問題為:挖掘過程中需要不斷遞歸地生成“樹”,增加了時空復(fù)雜度;FP-Tree和條件FP-Tree每次都需要雙向遍歷數(shù)據(jù)庫,因此難以處理數(shù)據(jù)庫更新、維護問題。
鑒于目前FP-Tree關(guān)聯(lián)規(guī)則挖掘算法存在的問題,本文將提供頻繁項集的數(shù)據(jù)壓縮到FP-network上,通過形成關(guān)聯(lián)矩陣,進行計算機存儲和挖掘。本文方法繼承了FP-Tree模型無需產(chǎn)生候選項以及不重復(fù)掃描數(shù)據(jù)庫的優(yōu)點,同時克服了FP-Tree模型生成復(fù)雜及更新、維護困難的缺點,特別適用于智能電網(wǎng)大型數(shù)據(jù)庫,挖掘智能電網(wǎng)中的復(fù)雜規(guī)律。
電力系統(tǒng)的數(shù)據(jù)庫通常是事務(wù)和項目之間的關(guān)聯(lián),如表1所示的事務(wù)數(shù)據(jù)庫,其中第1列為事務(wù)編號,第2列為項目集合,即事務(wù)包含哪些項目,項目集合為{I1,I2,I3,I4,I5}。
表1 事務(wù)數(shù)據(jù)庫列表Table 1 Transaction database table
根據(jù)表1,建立傳統(tǒng)的FP-Tree模型如圖1所示。由圖1可見,樹的生成過程十分復(fù)雜。此外,圖1所示的FP-Tree模型將提供頻繁項的數(shù)據(jù)庫壓縮到一個有向樹狀圖上,所以存在維護、更新困難的缺點。為了避免這些缺點,本文提出了無向的FP-network模型。
圖1 FP-Tree示意圖Fig.1 Schematic diagram of FP-Tree
首先定義以下概念。
a. 弧容量:掃描事務(wù)數(shù)據(jù)庫,第i條弧出現(xiàn)的次數(shù),記作ai。
b. 節(jié)點頻數(shù):掃描事務(wù)數(shù)據(jù)庫,節(jié)點j出現(xiàn)的次數(shù),記為fj。
c. 節(jié)點負容量:掃描每條事務(wù),節(jié)點j最后被掃描的次數(shù),記為nj。
以表1為例,建立FP-network模型的過程為如下。
a. 將各個項目作為網(wǎng)絡(luò)中的節(jié)點,將每個事物作為網(wǎng)絡(luò)中的路徑。
c. 按照上述原則依次掃描其他事務(wù),所建立的FP-network如圖2所示。
圖2 FP-network示意圖Fig.2 Schematic diagram of FP-network
圖2所示的FP-network有以下特點。
a. 不同于FP-Tree,F(xiàn)P-network是無向圖,且同一項目對應(yīng)圖中唯一節(jié)點(FP-Tree中同一項目可能對應(yīng)多個節(jié)點)。
b. 弧容量之和等于所有節(jié)點頻數(shù)與節(jié)點負容量的和,即:
(1)
其中,n為弧的數(shù)目;m為節(jié)點數(shù)目。
c. FP-network可能會將某些事務(wù)數(shù)量擴大。如對于項目I5而言,有2個事務(wù)與其相關(guān)聯(lián),分別為{I1,I2,I3,I5}和{I1,I2,I5}。但是圖2中,節(jié)點I5可以找到4條路徑,分別為{I1,I2,I3,I5}、{I1,I2,I5}、{I1,I3,I5}、{I2,I5},而后2條路徑實際上并不存在。
為了避免上述網(wǎng)絡(luò)圖形式的缺點,F(xiàn)P-network的計算機存儲采取事務(wù)(路徑)-項目(節(jié)點)關(guān)聯(lián)矩陣表示方式,即T=f(B,I)。仍以表1為例,有:
其中,T為事務(wù)集合;I為項目集合;矩陣B為事務(wù)-項目關(guān)聯(lián)矩陣,其元素bij(i=1,2…,9;j=1,2,…,5)可以定義為:對于事務(wù)i,如果與項目j相關(guān)聯(lián),則bij=1 ,否則bij=0。對于大數(shù)據(jù)而言,通常事務(wù)數(shù)目遠大于項目數(shù)目,因此生成關(guān)聯(lián)矩陣的時間復(fù)雜度近似為O(事務(wù)數(shù)目),并且對數(shù)據(jù)庫的存儲可以轉(zhuǎn)換為存儲矩陣布爾矩陣B和I,極大地節(jié)省了內(nèi)存。
利用FP-network算法可以方便地實現(xiàn)關(guān)聯(lián)規(guī)則的挖掘,具體步驟如下。
a. 給定最小支持度閾值Smin。
b. 掃描數(shù)據(jù)庫,如果fj c. 從nk為非零的第k個節(jié)點開始挖掘。 d. 只保留矩陣B中bik=1的節(jié)點k所有路徑集合I(I={i丨bik=1}),僅保留節(jié)點k之前的節(jié)點信息,形成新的矩陣B、I。 e. 如果|nk|≥Smin,則節(jié)點k作為一個頻繁項集的元素之一,否則不進行任何處理。刪去此節(jié)點信息,形成新的矩陣B、I。轉(zhuǎn)到步驟b,此過程持續(xù)至所有nk為非零的節(jié)點挖掘完為止。 如表1示例,取Smin為2,因I1—I5的節(jié)點頻數(shù)均不小于2,故保留所有節(jié)點信息。首先從節(jié)點I3開始挖掘,矩陣B對應(yīng)節(jié)點I3的列為第3列,其中元素為1的是第3、5、6、7、8、9行,保留這些信息得到新的矩陣。 將I3作為一個頻繁項集的元素,并得到新的矩陣: 則I2也作為此頻繁項集的元素;再重復(fù)一次,可得此頻繁項集為{I1,I2,I3},且其所有子集(包括一項和兩項)也是頻繁項集。 同理從節(jié)點I4進行挖掘,其頻繁項集為{I2,I4};從節(jié)點I5進行挖掘,其頻繁項集為{I1,I2,I5}。至此,挖掘結(jié)束,所挖掘出來的頻繁項集及其所有子集構(gòu)成了頻繁項集的集合。 FP-Tree模型的一個關(guān)鍵缺點是維護和更新困難,因為當(dāng)新數(shù)據(jù)加入、原數(shù)據(jù)庫更新或者改變支持度閾值時,F(xiàn)P-Tree算法需要重新掃描數(shù)據(jù)庫來生成FP-Tree和條件FP-Tree。但是FP-network模型不存在這個問題,因為FP-network是以關(guān)聯(lián)矩陣的形式保存的,而事務(wù)-項目關(guān)聯(lián)矩陣中節(jié)點的順序是任意的。例如,若調(diào)換節(jié)點I5和I1的順序,可以將上述事務(wù)-項目關(guān)聯(lián)矩陣做如下調(diào)整: 所產(chǎn)生的FP-network如圖3所示。 圖3 更新后的FP-network示意圖Fig.3 Schematic diagram of updated FP-network 上述FP-network的關(guān)聯(lián)規(guī)則挖掘首先從I3進行挖掘,得到頻繁項目模式為{I2,I3,I1};然后,從節(jié)點I4開始挖掘,得到頻繁項集為{I2,I4};最后從節(jié)點I1進行挖掘,得到頻繁項目模式為{I5,I2,I1}。至此挖掘結(jié)束,F(xiàn)P-network不需要重新掃描數(shù)據(jù)庫,只需要對矩陣進行操作,但仍然與上述結(jié)果相同。這說明FP-network模型與節(jié)點的排列順序無關(guān),克服了FP-Tree算法更新維護困難的缺點: a. 添加新的事務(wù)數(shù)據(jù)時,只需在矩陣B增加新的第j行和第i列,并改變相應(yīng)的fj、nj; b. 改變支持度閾值Smin時,無需對矩陣進行任何處理,可直接在原矩陣上進行關(guān)聯(lián)規(guī)則挖掘。 綜上所述,F(xiàn)P-network算法與目前主要的關(guān)聯(lián)規(guī)則挖掘算法Apriori、FP-Tree的比較如表2所示。 表2 關(guān)聯(lián)規(guī)則挖掘算法的比較Table 2 Comparison among association mining algorithms 為了進一步驗證所提FP-network算法的優(yōu)越性以及展示FP-network算法如何應(yīng)用于智能電網(wǎng)大數(shù)據(jù)分析,本文采用操作系統(tǒng)為Windows 10、內(nèi)存為4 GB、CPU為Intel(R)Core(TM)i5-4430CPU@3.00GHz的實驗環(huán)境,借助Anaconda平臺,使用python語言開發(fā),實現(xiàn)Apriori、FP-Tree、FP-network算法的實驗測試。 以關(guān)聯(lián)規(guī)則挖掘在輸電線路故障分析領(lǐng)域的應(yīng)用為例進行算例分析。采用某省電力公司大數(shù)據(jù)平臺提供的輸電線路故障信息,原始信息系統(tǒng)數(shù)據(jù)量龐大,達到TB級,但由于價值密度低,所以對2010 —2017年線路故障歷史數(shù)據(jù)進行預(yù)處理(除噪、清洗、過濾等),得到1 276條有效信息,形成線路典型故障事務(wù)數(shù)據(jù)庫,其中部分樣本如表3所示。為滿足算法測試需求,復(fù)制真實事務(wù)信息,可得到包含12 760條信息和127 600條信息的事務(wù)數(shù)據(jù)庫。 對于數(shù)據(jù)庫的“時間”屬性,需要進行離散處理,鑒于實際分析需要,可忽略年份信息:T1表示春季(3—5月);T2表示夏季(6—8月);T3表示秋季(9—11月);T4表示冬季(12月至次年2月)。其他屬性本身就是離散變量,定義了一系列字母變量來代替,預(yù)處理后的結(jié)果如表4所示。 在相同的實驗環(huán)境下,取Smin=0.5%,分別測試Apriori、FP-Tree、FP-network算法在不同數(shù)據(jù)庫規(guī)模下的運行速率,結(jié)果如圖4所示。 由于圖4可見,F(xiàn)P-network算法的運行速率要優(yōu)于其他2種算法,且數(shù)據(jù)庫規(guī)模越大,其他2種算法,尤其是Apriori的運行時間呈指數(shù)增長,使得FP-network優(yōu)勢更加明顯。 表3 線路典型故障事務(wù)數(shù)據(jù)庫Table 3 Transaction database of typical line faults 表4 預(yù)處理后的事務(wù)數(shù)據(jù)表Table 4 Transaction database after preprocessing 圖4 不同數(shù)據(jù)庫規(guī)模下的算法執(zhí)行時間Fig.4 Executive time of algorithms with different database scales 圖5 不同最小支持度下的算法執(zhí)行時間Fig.5 Executive time of algorithm with different min_sups 改變支持度不會改變事務(wù)數(shù)據(jù)庫的規(guī)模,但是會改變頻繁項集的規(guī)模。采用包含127 600條信息的數(shù)據(jù)庫測試不同支持度下的算法性能不同最小支持度下的算法執(zhí)行時間,結(jié)果如圖5所示。由圖可見:在不同支持度下,F(xiàn)P-network算法的運行速率均優(yōu)于另外2種算法;調(diào)低最小支持度(min_sup)后,3種算法的執(zhí)行時間都有所增加,F(xiàn)P-network算法與其他2種算法的差距愈加明顯。此外,F(xiàn)P-network算法可以較好地應(yīng)對支持度的變化,運行速率變化幅度較小。 空間復(fù)雜度是對算法在運行過程中臨時占用存儲空間大小的量度,包括程序代碼所占用的空間、輸入數(shù)據(jù)所占用的空間和輔助變量所占用的空間。其中,輸入數(shù)據(jù)所占用的空間不隨算法的不同而改變;程序代碼所占用的空間與算法書寫的長短成正比。對于Apriori、FP-Tree、FP-network算法而言,存儲算法本身的空間僅kB級,相較MB、GB級的數(shù)據(jù)庫其差異可忽略不計;算法空間復(fù)雜度的對比重點在于輔助變量所占用的空間。利用memory_profiler模塊,監(jiān)控算法執(zhí)行過程中所占用的最大內(nèi)存,結(jié)果如圖6所示。 圖6 不同數(shù)據(jù)庫規(guī)模下算法執(zhí)行過程中占用的最大內(nèi)存Fig.6 Maximum memory in execution of algorithms with different database scales 由圖6可見,Apriori算法需要存儲大量候選集,F(xiàn)P-Tree算法需要存儲條件樹,并需要進出棧操作,占用內(nèi)存較大,F(xiàn)P-network算法占用內(nèi)存空間遠小于這2種算法,特別是在數(shù)據(jù)庫規(guī)模較大時優(yōu)勢更加明顯。綜上所述,F(xiàn)P-network算法在處理大型數(shù)據(jù)庫或強實時性問題時性能優(yōu)勢明顯,適合電力系統(tǒng)大數(shù)據(jù)分析。因此,取Smin=0.5%,對故障信息數(shù)據(jù)庫進行分析,得到所有頻繁項集,進一步挖掘關(guān)聯(lián)規(guī)則,結(jié)果如圖7所示,圖中連線的粗細表示關(guān)聯(lián)程度的強弱。 圖7 關(guān)聯(lián)規(guī)則挖掘結(jié)果圖Fig.7 Results of association rules mining 如圖7所示,得到的關(guān)聯(lián)規(guī)則有上百條,但是并非所有的關(guān)聯(lián)規(guī)則都是有價值的。有些規(guī)則關(guān)聯(lián)性十分弱,有些關(guān)聯(lián)性并沒有實際的意義。通過計算規(guī)則置信度(如式(2)所示),篩選出置信度不低于75%的規(guī)則,得到部分結(jié)果如表5所示。 (2) 其中,support(·)表示支持度。 表5 關(guān)聯(lián)規(guī)則挖掘結(jié)果Table 5 Results of association rules mining 結(jié)合實際電力知識背景,利用上述挖掘結(jié)果可以分析該省的線路故障情況,找到電網(wǎng)中存在的薄弱環(huán)節(jié),并針對這些薄弱環(huán)節(jié)提出改進措施和方案: a. 從規(guī)則1可知,該省中部地區(qū)220kV線路在3—5月份因為導(dǎo)線及地線舞動造成嚴(yán)重影響,因此應(yīng)做好春季線路舞動預(yù)防措施; 圖8 智能電網(wǎng)“數(shù)據(jù)系統(tǒng)業(yè)務(wù)”圖Fig.8 Diagram of “Big data-System-Business” in smart grid b. 從規(guī)則2可知,該省南部地區(qū)在6 —8月因外力破壞(如違規(guī)施工)造成導(dǎo)線及地線故障較多,因此相關(guān)部門要采取措施杜絕違規(guī)施工; c. 從規(guī)則3可知,該省500kV的線路故障大多是絕緣子故障,主要集中在中部地區(qū)的12月至次年2月,因此檢修部門可以在冬季有針對性地對中部地區(qū)多加巡查; d. 從規(guī)則4可知,該省東部地區(qū)的110kV線路故障大多數(shù)是導(dǎo)線及地線故障,因此相關(guān)部門要優(yōu)化脆弱地區(qū)的線路布局等; e. 從規(guī)則5可知,該省線路覆冰故障主要集中在3—5月份,并以中部地區(qū)的500kV線路居多,因此中部地區(qū)應(yīng)在該月份加強對500kV線路的監(jiān)測,及時對覆冰進行融化處理。 如第3節(jié)所示,F(xiàn)P-network可以挖掘多維屬性間的關(guān)聯(lián)規(guī)則,除輸電線路故障分析領(lǐng)域外,其在智能電網(wǎng)中的應(yīng)用十分廣泛。智能電網(wǎng)大數(shù)據(jù)的來源大致可分為電網(wǎng)外部和電網(wǎng)內(nèi)部2類。電網(wǎng)外部的數(shù)據(jù)來源包括但不限于互聯(lián)網(wǎng)信息系統(tǒng)、充電設(shè)施管理系統(tǒng)、氣象監(jiān)測系統(tǒng)、地理信息系統(tǒng)(GIS)等;電網(wǎng)內(nèi)部的數(shù)據(jù)來源主要包括用電信息采集系統(tǒng)、設(shè)備運維管理系統(tǒng)(PMS)、企業(yè)資源計劃(ERP)系統(tǒng)、SCADA系統(tǒng)、D5000系統(tǒng)、95589客服系統(tǒng)、營銷系統(tǒng)等[7-8]。不同的系統(tǒng)存儲著不同的數(shù)據(jù)信息,同時也對應(yīng)著不同的業(yè)務(wù)部門和業(yè)務(wù)需求。 因此,本文將智能電網(wǎng)中常用的數(shù)據(jù)和信息系統(tǒng)進行了梳理,建立“數(shù)據(jù)-系統(tǒng)-業(yè)務(wù)”體系,如圖8所示。通過圖8所示體系,數(shù)據(jù)的來源和流向一目了然,既可以利用數(shù)據(jù)來驅(qū)動業(yè)務(wù)發(fā)展,也可以基于業(yè)務(wù)流程和需求進行數(shù)據(jù)挖掘分析。因此基于智能電網(wǎng)“數(shù)據(jù)-系統(tǒng)-業(yè)務(wù)”體系,F(xiàn)P-network算法在智能電網(wǎng)中的應(yīng)用可以根據(jù)業(yè)務(wù)需求分為三大類[9]:面向用戶服務(wù)、面向電力公司管理、面向政府決策。本文限于篇幅,著重介紹以下應(yīng)用[10-14]。 a. 用戶用電行為分析。 配用電環(huán)節(jié)要做到智能化,需要基于海量用戶用電特征數(shù)據(jù),如用電類別、時間、客戶、行業(yè)、電壓等級、氣象、峰谷負荷等進行分析。通過FP-network算法挖掘不同用電行為特征間的關(guān)聯(lián)規(guī)則,描述用電行為模式,實現(xiàn)面向用戶服務(wù)的用電管理、有序用電,面向電力公司的臺區(qū)負荷預(yù)測、用電調(diào)度,面向政府的工業(yè)發(fā)展趨勢預(yù)測、電價制定等高級應(yīng)用。 b. 電力系統(tǒng)故障分析。 電力系統(tǒng)的故障數(shù)據(jù)由用電信息采集系統(tǒng)、PMS、檢修運維系統(tǒng)、ERP系統(tǒng)、GIS、氣象信息系統(tǒng)(MIS)等組成,通常包括故障時間、地點、天氣、故障類型、故障元件、損失、保護開關(guān)動作、恢復(fù)時間等一系列屬性,通過FP-network充分挖掘歷史數(shù)據(jù)多維屬性間的關(guān)聯(lián)關(guān)系,可以發(fā)現(xiàn)故障產(chǎn)生的規(guī)律,用于識別電網(wǎng)的薄弱環(huán)節(jié)、制訂檢修計劃以及故障預(yù)警等,避免類似故障的再發(fā)生。 圖9 FP-network在故障分析應(yīng)用的流程圖Fig.9 Flowchart of FP-network application in fault analysis c. 電力市場營銷策略。 電力公司營銷的數(shù)據(jù)庫由售電量、交易電價、用戶種類、氣象信息、客戶關(guān)系、客戶滿意度等所組成,應(yīng)用FT-network,描述各種影響電量銷售的外部因素與售電量、交易電價等之間的關(guān)聯(lián)特征,可以進行需求預(yù)測、銷售及收入預(yù)測,掌握營銷業(yè)務(wù)重點工作,為電力市場營銷提供輔助的決策信息。 d. 風(fēng)光運行優(yōu)化。 通過對風(fēng)光發(fā)電系統(tǒng)歷史運行數(shù)據(jù)的分析,可得特定工況下氣象數(shù)據(jù)(風(fēng)速、光照強度、溫度等)與機組性能間的關(guān)聯(lián)關(guān)系,從而對機組性能(可靠性、經(jīng)濟性、安全性等)進行客觀、正確評估,輔助實現(xiàn)風(fēng)電準(zhǔn)確預(yù)測、風(fēng)電場規(guī)劃、制訂出力調(diào)度計劃等。 FP-network在智能電網(wǎng)的應(yīng)用流程的步驟主要有數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、關(guān)聯(lián)規(guī)則分析及結(jié)果展示。其中,數(shù)據(jù)預(yù)處理包括噪聲清洗、數(shù)據(jù)離散化處理、缺失值填補等。圖9以電力系統(tǒng)故障分析為例說明應(yīng)用的具體流程。 鑒于智能電網(wǎng)大數(shù)據(jù)發(fā)展的需要和目前關(guān)聯(lián)規(guī)則挖掘算法存在的缺點,本文建立了適合智能電網(wǎng)應(yīng)用的FP-network模型。所得到的主要結(jié)論如下: a. FP-network模型與FP-Tree模型相類似,將關(guān)聯(lián)規(guī)則挖掘所需要的數(shù)據(jù)壓縮到一個圖上,但是FP-network圖擴大了存儲的事務(wù)規(guī)模,實際挖掘時需要以矩陣形式進行存儲; b. 與FP-Tree模型相同,F(xiàn)P-network模型同樣只能處理分類變量(即離散變量),因此需要預(yù)先對事務(wù)數(shù)據(jù)進行離散化; c. FP-network模型只需掃描1次原數(shù)據(jù)庫,且以矩陣形式存儲,尤其對于智能電網(wǎng)大型數(shù)據(jù)庫而言,大幅降低了時間和空間的復(fù)雜度; d. FP-network模型方便被挖掘數(shù)據(jù)的更新和維護,因此提高了關(guān)聯(lián)規(guī)則挖掘算法的效率; e. FP-network模型適合挖掘智能電網(wǎng)大數(shù)據(jù),應(yīng)用范圍包括但不限于故障分析、營銷策略制訂、用電負荷研究、風(fēng)電運行優(yōu)化等。 參考文獻: [1] 彭小圣,鄧迪元,程時杰,等. 面向智能電網(wǎng)應(yīng)用的電力大數(shù)據(jù)關(guān)鍵技術(shù)[J]. 中國電機工程學(xué)報,2015,35(3):503-511. PENG Xiaosheng,DENG Diyuan,CHENG Shijie,et al. Key technologies of electric power big data and its application prospects in smart grid[J]. Proceedings of the CSEE,2015,35(3):503-511. [2] 宋亞奇,周國亮,朱永利. 智能電網(wǎng)大數(shù)據(jù)處理技術(shù)現(xiàn)狀與挑戰(zhàn)[J]. 電網(wǎng)技術(shù),2013,37(4):927-935. SONG Yaqi,ZHOU Guoliang,ZHU Yongli. Present status and challenges of big data processing in smart grid[J]. Power System Technology,2013,37(4):927-935. [3] AGRAWAL R,IMIELISKI T,SWAMI A. Mining association rules between sets of items in large databases[J]. Acm Sigmod Record,1993,22(2):207-216. [4] HAN T,KAMBER M. Data mining:concepts and techniques[M]. Beijing:Higher Education Press,2001:143-177. [5] SAVASMR A,OMICCINSKI E,NAVATHC S. An efficient algorithm for mining association rules[C]∥The 21th International Conference on VLDB. Zurich,Switzerland:Morgan Kaufmann Publishers Inc.,1995:432-444. [6] HAN J,PEI J,YIN Y. Mining frequent patterns without candidate generation[C]∥The 2000 ACM SIGMOD on Management of Data(SIGMOD 2000). Dallas,Texas,USA:ACM,2000:1-12. [7] TSENGV S,SHIE B E,WU C,et al. Efficient algorithms for mining high utility item sets from transactional databases[J]. IEEE Tran-sactions on Knowledge and Data Engineering(TKDE),2013,25(8):1772-1786. [8] 王守相,葛磊蛟,王凱. 智能配電系統(tǒng)的內(nèi)涵及其關(guān)鍵技術(shù)[J]. 電力自動化設(shè)備,2016,36(6):1-6. WANG Shouxiang,GE Leijiao,WANG Kai. Main contents and key technologies of smart distribution system[J]. Electric Power Automation Equipment,2016,36(6):1-6. [9] 張東霞,苗新,劉麗平,等. 智能電網(wǎng)大數(shù)據(jù)技術(shù)發(fā)展研究[J]. 中國電機工程學(xué)報,2015,35(1):2-12. ZHANG Dongxia,MIAO Xin,LIU Liping,et al. Research on deve-lopment strategy for smart grid big data[J]. Proceedings of the CSEE,2015,35(1):2-12. [10] 薛振宇,胡航海,宋毅,等. 基于大數(shù)據(jù)分析的縣公司綜合評價策略[J]. 電力自動化設(shè)備,2017,37(9):199-204. XUE Zhenyu,HU Hanghai,SONG Yi,et al. Comprehensive evaluation based on big data analysis for county electric power company[J]. Electric Power Automation Equipment,2017,37(9):199-204. [11] 郝然,艾芊,肖斐. 基于多元大數(shù)據(jù)平臺的用電行為分析構(gòu)架研究[J]. 電力自動化設(shè)備,2017,37(8):20-27. HAO Ran,AI Qian,XIAO Fei. Architecture based on multivariate big data platform for analyzing electricity consumption behavior[J]. Electric Power Automation Equipment,2017,37(9):20-27. [12] 葛磊蛟,王守相,瞿海妮. 智能配用電大數(shù)據(jù)存儲架構(gòu)設(shè)計[J]. 電力自動化設(shè)備,2016,36(6):194-202. GE Leijiao,WANG Shouxiang,ZHAI Haini. Design of storage framework for big data of SPDU[J]. Electric Power Automation Equipment,2016,36(6):194-202. [13] 徐青山,王文帝,林章歲,等. 面向行業(yè)大數(shù)據(jù)特征挖掘的電力經(jīng)理指數(shù)指標(biāo)體系的建立與應(yīng)用[J]. 電力自動化設(shè)備,2015,25(7):15-21. XU Qingshan,WANG Wendi,LIN Zhangsui,et al. Establishment and application of EMI indicator system orienting to massive industrial data mining[J]. Electric Power Automation Equipment,2015,25(7):15-21. [14] 王德文,孫志偉. 電力用戶側(cè)大數(shù)據(jù)分析與并行負荷預(yù)測[J]. 中國電機工程學(xué)報,2015,35(3):527-537. WANG Dewen,SUN Zhiwei. Big data analysis and parallel load forecasting of electric power user side[J]. Proceedings of the CSEE,2015,35(3):527-537.2 關(guān)聯(lián)規(guī)則挖掘算法的比較
3 算例分析
4 在智能電網(wǎng)中的其他應(yīng)用
5 結(jié)論