江疆,彭澤武,蘇華權(quán)
(廣東電網(wǎng)有限責(zé)任公司, 廣東, 廣州 510000)
電網(wǎng)智能化的發(fā)展,使得行業(yè)動態(tài)、氣象信息、工商用戶等跨行業(yè)數(shù)據(jù)大量融合,并呈現(xiàn)高容量、快速性、多樣性等大數(shù)據(jù)特征[1]。同時,跨行業(yè)數(shù)據(jù)為HMSD,存在大量非結(jié)構(gòu)化數(shù)據(jù),無法用傳統(tǒng)數(shù)據(jù)分析方法進(jìn)行準(zhǔn)確的不良數(shù)據(jù)分析,影響電網(wǎng)穩(wěn)定運行和規(guī)劃,也降低了數(shù)據(jù)的安全性[2],限制電網(wǎng)智能化的發(fā)展。有學(xué)者認(rèn)為,電網(wǎng)智能化發(fā)展的目的是滿足應(yīng)用場景需求,所以從負(fù)荷預(yù)測、運行狀態(tài)、電能質(zhì)量檢測角度出發(fā)[3],分析大數(shù)據(jù)下HMSD,可以提高不良數(shù)據(jù)的識別準(zhǔn)確性。也有學(xué)者認(rèn)為,大數(shù)據(jù)中的HMSD價值較低,且非結(jié)構(gòu)化數(shù)據(jù)比例較高[4],可以通過提取特征值的方式,提高HMSD的價值,并減少數(shù)據(jù)的處理量?;谏鲜霰尘?,本文利用Metropolis接受準(zhǔn)則進(jìn)行特征值的分析,從應(yīng)用場景的角度分析HMSD,以提高不良數(shù)據(jù)的辨識準(zhǔn)確度。
電網(wǎng)大數(shù)據(jù)HMSD有兩方面特點,一方面是海量、低價值和多樣性數(shù)據(jù),且非結(jié)構(gòu)化數(shù)據(jù)比例>50%;另一方面,數(shù)據(jù)多源性,且為動態(tài)獲取方式,數(shù)據(jù)結(jié)構(gòu)如圖1所示。
圖1 HMSD數(shù)據(jù)描述
由圖1可知,HMSD數(shù)據(jù)的來源多樣,是跨行業(yè)數(shù)據(jù)的綜合,需要通過計算、觀察和測量等方式獲得[5]。HMSD數(shù)據(jù)的結(jié)構(gòu)以非結(jié)構(gòu)化、結(jié)構(gòu)化形式為主,且與EMS、PMS和GIS等數(shù)據(jù)源聯(lián)合,形成海量的大數(shù)據(jù)。HMSD要從應(yīng)用場景出發(fā),結(jié)合配電網(wǎng)負(fù)荷、電網(wǎng)運行、電能質(zhì)量等角度分析,實現(xiàn)不良數(shù)據(jù)的高效檢出。
電網(wǎng)信息化、電力需求影響因素多樣化,使得大數(shù)據(jù)特征日益凸顯,傳統(tǒng)用電分析方法無法完全適用各種場景需求。遺傳算法、粒子群算法、支持向量等智能預(yù)測算法可以滿足體量大、類型多的電網(wǎng)大數(shù)據(jù)需求,實現(xiàn)電網(wǎng)負(fù)荷、電網(wǎng)運行、電能質(zhì)量的預(yù)測分析。下面對電網(wǎng)應(yīng)用場景的參數(shù)進(jìn)行設(shè)定[6]。
(2) 假設(shè)N為HMSD中的任意數(shù)據(jù),i為數(shù)據(jù)來源的行業(yè),j為數(shù)據(jù)的結(jié)構(gòu)類型(結(jié)構(gòu)化數(shù)據(jù)=1,否則=0),k為數(shù)據(jù)的獲取方式(定性方法獲取=1,定量方法獲取=2,綜合獲取方式=0),l為數(shù)據(jù)安全監(jiān)測裝置(注:1~5等級,數(shù)值越高等級越高),m為場景中智能信息采集裝置,那么信息采集項可以描述為Ni,j,k,l,m,i,j,k,l,m=(1,2,…,n),n為自然數(shù)。
(3) 適用場景為單位,將類似的行業(yè)來源、結(jié)構(gòu)類型、獲取方法、安全監(jiān)測等級和采集裝置的數(shù)據(jù)劃分到同一應(yīng)用場景中。
(4) 所有場景的信息均由電網(wǎng)智慧中心集中分析,在預(yù)測準(zhǔn)確性、預(yù)測時間和安全等級的條件約束下,對獲得的數(shù)據(jù)按照相關(guān)權(quán)重、閾值進(jìn)行排列。
(5) 任何場景中的數(shù)據(jù)采集時間、數(shù)據(jù)安全等級相同或類似[7]。
(6) 場景分析的穩(wěn)定性,要采用傅里葉級數(shù)的方法,減少設(shè)備、人員和其他非抗拒因素的干擾。
(1)
其中,P為場景分析描述的抗干擾能力,t為抗干擾測量時間,y為數(shù)據(jù)加密程度,z為傳輸距離,z為傳輸安全等級,ξ為干擾系數(shù)。
不同場景采集的數(shù)據(jù)資料需要先進(jìn)行k-means處理,處理公式如式(2)
(2)
其中,S為聚類的范圍,即數(shù)據(jù)聚類的程度,其值越小說明聚類效果越好,I為場景采集的數(shù)據(jù)信息,i為信息的編號。另外,S可以用相似度J代替,以此提高計算的效率。為了簡化流程,可以利用某一數(shù)據(jù)出現(xiàn)的頻率進(jìn)行權(quán)重判斷,即依據(jù)以往歷史數(shù)據(jù),或者電網(wǎng)數(shù)據(jù)庫中的數(shù)據(jù)頻率,判斷場景設(shè)備采集到的數(shù)據(jù)閾值,其計算公式如式(3)
(3)
其中,Gij為j設(shè)備采集i信息的次數(shù),Gi為i信息在電網(wǎng)數(shù)據(jù)庫中出現(xiàn)的次數(shù),Gj為j設(shè)備發(fā)送信息的頻率,wi為i信息的閾值。
電網(wǎng)進(jìn)行大數(shù)據(jù)跨行業(yè)融合場景分析前,要對各場景依據(jù)相關(guān)標(biāo)準(zhǔn)進(jìn)行歸類與判斷。本文采用退火模擬算法的Metropolis接受準(zhǔn)則[8],如果應(yīng)用場景符合電網(wǎng)實際需要,則采集相關(guān)數(shù)據(jù),否則將不接受該場景數(shù)據(jù),并將所有設(shè)備處于“休眠”狀態(tài)。Metropolis接受準(zhǔn)則判斷節(jié)約了電網(wǎng)硬件資源,也減少了跨行業(yè)數(shù)據(jù)量[9]。
假設(shè)應(yīng)用場景所處狀態(tài)為Ti,則對其進(jìn)行Metropolis接受準(zhǔn)則分析,判斷該狀態(tài)是否需要改變,即由i狀態(tài)向i+1狀態(tài)改變,其計算公式如式(4)
(4)
其中,exp()為期望函數(shù),判斷是否要進(jìn)行狀態(tài)改變,R(T)為應(yīng)用場景狀態(tài)改變的結(jié)果函數(shù)。如果R(T)的結(jié)果處于0~0.5,說明狀態(tài)的改變程度較低,可以維持原有狀態(tài)。如果結(jié)果處于0.5~1之間,說明應(yīng)用場景需要改變,或者被“激活”、處于“休眠”。
應(yīng)用場景與跨行業(yè)數(shù)據(jù)的擬合分為[10]:局部擬合Pc、整體擬合Pm,從不同方面反映兩者的擬合情況,也是不良數(shù)據(jù)計算的前提。Pc、Pm值越大,代表數(shù)據(jù)擬合度越好。由于2.1中的Metropolis接受準(zhǔn)則限制,要求兩個數(shù)據(jù)均為最優(yōu),才能成為計算數(shù)據(jù),所以其計算公式如式(5)、式(6)
(5)
(6)
其中,N1,1,0,1為Pc的初始值,N1,1,1,0為Pm的初始值,Rmin為整個融合數(shù)據(jù)的最小值,Rc為局部最小值,Rm為整體最小值,φc為局部擬合系數(shù),φm為整體擬合系數(shù)。
不良數(shù)據(jù)計算前要構(gòu)建相應(yīng)的數(shù)據(jù)序列,本文采用適度函數(shù)來明確跨行業(yè)大數(shù)據(jù)與應(yīng)用場景之間的關(guān)系[11]。適度函數(shù)在預(yù)設(shè)精度、閾值約束的條件下,進(jìn)行多次迭代分析,引導(dǎo)算子向正方向計算,降低局部極值,“假特征值”的出現(xiàn)率[12],提高不良數(shù)據(jù)計算的準(zhǔn)確性,具體公式如下。
(7)
基于上述的數(shù)學(xué)描述,需要進(jìn)行以下幾方面的計算:
(1) 設(shè)置初始應(yīng)用場景C={c1,c2,…,ci}值,數(shù)據(jù)擬合(局部擬合Pc、整體擬合Pm)和計算精準(zhǔn)度的閾值,HMSD的數(shù)據(jù)Ni,j,k,l,m值,以及初始的Metropolis接受準(zhǔn)則;
(2) 對擬合后的數(shù)據(jù)進(jìn)行梯度200次迭代測試[13];
(3) 依據(jù)Metropolis接受準(zhǔn)則、約束條件,驗證計算結(jié)果,并將符合要求的結(jié)果納入到Total方案中,并計算整體方案的不良數(shù)據(jù)識別準(zhǔn)確度和計算時間[14];
(4) 判斷所有的數(shù)據(jù)i是否均被遍歷,則如果是則終止計算,否則轉(zhuǎn)入步驟(3);
(5) 最后輸出Total方案中的最小值,退出計算過程。
以2020年跨氣象、交通、電力行業(yè)、工商的大數(shù)據(jù)為例[15],分析風(fēng)力、太陽能、水利等應(yīng)用場景下電網(wǎng)負(fù)荷、電網(wǎng)運行、電能質(zhì)量數(shù)據(jù),確定其中不良數(shù)據(jù)的判別準(zhǔn)確率和時間。數(shù)據(jù)擬合(局部擬合Pc、整體擬合Pm)精度和計算精準(zhǔn)度設(shè)置為0.1,迭代次數(shù)200次,其中,數(shù)據(jù)采集裝置為電能表102,3個,電壓表209,2個,變壓器102個,服務(wù)器6臺,通信協(xié)議為TCP/IP、HTTP等,SQL數(shù)據(jù)庫4個,拓普瑞電網(wǎng)檢測系統(tǒng)6.0,數(shù)據(jù)傳輸密碼為64 Bit,光纖、Wi-Fi、GPS通信,信息安全等級3級,遵循2015年版《電網(wǎng)運行準(zhǔn)則》(GB/T 31464),IP地址為192.168.1.102~192.168.1.202。
通過k-means聚類和Metropolis接受準(zhǔn)則,對跨行業(yè)數(shù)據(jù)、應(yīng)用場景數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,并進(jìn)行150次迭代分析,得到數(shù)據(jù)擬合結(jié)果,如圖2所示。
圖2 應(yīng)用場景與跨行業(yè)數(shù)據(jù)的擬合結(jié)果
由上圖可知,大數(shù)據(jù)局部擬合、應(yīng)用場景局部擬合較高,均>95%,而整體擬合較低,但是也>90%,說明整體擬合較高,也符合k-means聚類和Metropolis接受準(zhǔn)則設(shè)置的閾值10%的要求。
電網(wǎng)大數(shù)據(jù)跨行業(yè)數(shù)據(jù)融合應(yīng)用場景分析的關(guān)鍵指標(biāo)是電網(wǎng)負(fù)荷判斷xi,電網(wǎng)運行狀態(tài)判斷xj,電能質(zhì)量判斷xk,3個指標(biāo)中不良數(shù)據(jù)的辨識精準(zhǔn)度,直接決定整個模型有效性。通過MATLAB仿真分析可知,上述3項指標(biāo)中不良數(shù)據(jù)的識別精準(zhǔn)度均>95%,而初設(shè)閾值和《電網(wǎng)運行準(zhǔn)則》中的要求為0.1,所以仿真結(jié)果較佳,結(jié)果如圖3所示。
圖3 不良數(shù)據(jù)的辨識精準(zhǔn)度
跨行業(yè)數(shù)據(jù)融合的特點是數(shù)據(jù)具有大數(shù)據(jù)特征,數(shù)據(jù)處理量大,處理復(fù)雜度高,所以不良數(shù)據(jù)的辨識時間是另一個驗證指標(biāo)。結(jié)果顯示,電網(wǎng)負(fù)荷判斷xi,電網(wǎng)運行狀態(tài)判斷xj,電能質(zhì)量判斷xk中不良數(shù)據(jù)的辨識時間均<7 s,電能質(zhì)量、負(fù)荷判斷中不良數(shù)據(jù)的辨識時間<4 s,主要是由于運行的計算過程相對復(fù)雜。但是,整體的不良數(shù)據(jù)的辨識時間,均符合《電網(wǎng)運行準(zhǔn)則》中的要求,結(jié)果如圖4所示。
圖4 不良數(shù)據(jù)的辨識時間
電網(wǎng)智能化的快速發(fā)展,使得跨行業(yè)數(shù)據(jù)融合越來越多,諸如,氣象、交通、電力行業(yè)、工商等[16],且數(shù)據(jù)量、復(fù)雜度等方面呈現(xiàn)大數(shù)據(jù)特征[17],使得傳統(tǒng)的分析方法無法滿足相關(guān)場景分析的要求,致使不良數(shù)據(jù)辨識準(zhǔn)確率大幅下降[18]。本文提出的一種基于k-means聚類和Metropolis接受準(zhǔn)則的分析方法,通過對跨行業(yè)數(shù)據(jù)、應(yīng)用場景數(shù)據(jù)標(biāo)準(zhǔn)化處理,得到精度為0.1的擬合數(shù)據(jù)。然后,利用遺傳算法和迭代計算,得到電網(wǎng)負(fù)荷判斷xi,電網(wǎng)運行狀態(tài)判斷xj,電能質(zhì)量判斷xk等指標(biāo)的不良數(shù)據(jù)辨識率。MATLAB仿真結(jié)果顯示:3項指標(biāo)中不良數(shù)據(jù)的識別精準(zhǔn)度均>95%,而初設(shè)閾值和《電網(wǎng)運行準(zhǔn)則》中的要求為0.1。同時,3項指標(biāo)中不良數(shù)據(jù)的辨識時間均<7 s,且電能質(zhì)量、負(fù)荷判斷中不良數(shù)據(jù)的辨識時間<4 s,整體判斷結(jié)果較佳。