余旭陽(yáng),嚴(yán)慧峰,向 穎,徐秀敏
(1.國(guó)網(wǎng)湖南省電力有限公司 發(fā)展策劃部,長(zhǎng)沙 410007;2.北京國(guó)電通網(wǎng)絡(luò)技術(shù)有限公司 規(guī)劃與計(jì)劃管理業(yè)務(wù)事業(yè)部,北京 100085)
隨著物聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,電網(wǎng)規(guī)模持續(xù)增加,電網(wǎng)數(shù)據(jù)呈爆炸式增長(zhǎng)[1-2]。因此,如何在大規(guī)模的電網(wǎng)數(shù)據(jù)中獲取有效且準(zhǔn)確的電網(wǎng)數(shù)據(jù)成為當(dāng)前研究的熱點(diǎn),國(guó)內(nèi)有相關(guān)專(zhuān)家針對(duì)該方面的內(nèi)容進(jìn)行了大量研究。陳容等[3]在已有固定位寬并行算法基礎(chǔ)上,通過(guò)公式遞歸法進(jìn)行并行計(jì)算,完成循環(huán)冗余校驗(yàn)。朱智燊等[4]主要采用信道對(duì)Modbus數(shù)據(jù)進(jìn)行哈希檢驗(yàn)。由于以上兩種算法未能對(duì)采集到的電力數(shù)據(jù)進(jìn)行聚類(lèi)處理,導(dǎo)致校驗(yàn)結(jié)果不理想、用時(shí)增加等問(wèn)題。為此,筆者提出一種變負(fù)荷模式下電力多級(jí)冗余數(shù)據(jù)精細(xì)化校驗(yàn)算法,經(jīng)實(shí)驗(yàn)測(cè)試證明,所提算法不僅能有效降低校驗(yàn)用時(shí)、誤差以及額外存儲(chǔ)開(kāi)銷(xiāo),同時(shí)還能有效提升查全率,得到了滿意的校驗(yàn)結(jié)果。
電力系統(tǒng)可劃分為數(shù)據(jù)中心,中間站,用戶端3部分。
一個(gè)數(shù)據(jù)中心站同時(shí)對(duì)應(yīng)多個(gè)中間站,每個(gè)中間站又對(duì)應(yīng)多個(gè)用戶。電力數(shù)據(jù)將不間斷地在用戶處形成,用戶i對(duì)應(yīng)的中間站每間隔一個(gè)時(shí)間段t將采集一次用戶的電力數(shù)據(jù)ui,同時(shí)將全部的電力數(shù)據(jù)在本地進(jìn)行緩存。一個(gè)中間站對(duì)應(yīng)N個(gè)用戶,則中間站在t時(shí)刻采集的電力數(shù)據(jù)為f=[u1,u2,…,uNt]T,因此經(jīng)過(guò)M個(gè)t時(shí)間間隔,中間站將當(dāng)前緩存的電力數(shù)據(jù)發(fā)送至數(shù)據(jù)中心,對(duì)應(yīng)的計(jì)算式為
(1)
其中F表示在第i采樣時(shí)刻的電力數(shù)據(jù);N表示用戶總數(shù);M表示采樣總間隔。
在對(duì)電力數(shù)據(jù)監(jiān)測(cè)過(guò)程中,鄰近時(shí)刻的監(jiān)測(cè)數(shù)據(jù)具有較強(qiáng)的關(guān)聯(lián)性。以下主要通過(guò)數(shù)據(jù)的相關(guān)性完成數(shù)據(jù)采集[5-6]。
稀疏性是壓縮感知理論的基礎(chǔ),通過(guò)信號(hào)的可稀疏性判定能否恢復(fù)原始數(shù)據(jù)。其中,電力數(shù)據(jù)主要包含以下幾個(gè)步驟。
1) 電力數(shù)據(jù)壓縮。當(dāng)接收到原始電力數(shù)據(jù)對(duì)應(yīng)的狀態(tài)信號(hào)f,進(jìn)而借助測(cè)量矩陣Φ得到對(duì)應(yīng)的觀測(cè)信號(hào)y=Φf。
2) 電力數(shù)據(jù)存儲(chǔ)或傳輸。將經(jīng)過(guò)壓縮處理的觀測(cè)信號(hào)y進(jìn)行存儲(chǔ)或傳輸。
3) 數(shù)據(jù)恢復(fù)階段。接收端接收到的觀測(cè)信號(hào)為y=Φf,通過(guò)測(cè)量矩陣和稀疏字典將其轉(zhuǎn)換為稀疏信號(hào),進(jìn)而達(dá)到恢復(fù)數(shù)據(jù)的目的。
稀疏矩陣是電力狀態(tài)信息進(jìn)行稀疏化的轉(zhuǎn)換矩陣,獲取對(duì)應(yīng)的電力狀態(tài)數(shù)據(jù)f=[u1,u2,…,uN],經(jīng)過(guò)稀疏化處理獲取稀疏向量,最終得到稀疏矩陣。
設(shè)電力數(shù)據(jù)為F,通過(guò)
(2)
(3)
測(cè)量矩陣在進(jìn)行數(shù)據(jù)壓縮以及重構(gòu)過(guò)程中都需要使用,設(shè)Φ表示測(cè)量矩陣。優(yōu)先通過(guò)Φ對(duì)電力信號(hào)f進(jìn)行壓縮處理,獲取對(duì)應(yīng)的觀測(cè)信號(hào)y。結(jié)合壓縮感知理論可以有效恢復(fù)原始電力數(shù)據(jù)。其中Φ和ψ兩者之間的相關(guān)系數(shù)為
(4)
(5)
譜聚類(lèi)是一種全新的聚類(lèi)算法,主要用于數(shù)據(jù)聚類(lèi)優(yōu)化[9-10]。其中譜聚類(lèi)能準(zhǔn)確識(shí)別不同形狀的簇,同時(shí)還能獲取比較滿意的聚類(lèi)結(jié)果。其中譜聚類(lèi)主要包含以下幾個(gè)步驟。
1) 構(gòu)建數(shù)據(jù)樣本集關(guān)系屬性對(duì)應(yīng)的矩陣R。
2) 計(jì)算R的前k個(gè)特征值,組成特征向量集,進(jìn)而構(gòu)建對(duì)應(yīng)的向量空間S。
3) 通過(guò)聚類(lèi)方法對(duì)S中的電力數(shù)據(jù)進(jìn)行聚類(lèi)處理,同時(shí)將得到的聚類(lèi)結(jié)果映射到對(duì)應(yīng)的空間中。
由于不同類(lèi)型的電力數(shù)據(jù)結(jié)構(gòu)是完全不同的,需要優(yōu)先通過(guò)NJW(Ng-Jordan-Weiss)算法對(duì)前k個(gè)特征向量組成的子空間進(jìn)行聚類(lèi)處理。同時(shí),給出特征向量空間S形成的詳細(xì)操作步驟。
1) 建立原始電力數(shù)據(jù)的相似度矩陣W,矩陣內(nèi)的元素Wij為
(6)
其中d2(xi,xj)表示兩個(gè)樣本之間的歐氏距離;σ表示樣本的尺度參數(shù)。
2) 構(gòu)建標(biāo)準(zhǔn)的Laplacian矩陣Lsym。
3) 設(shè)定參數(shù)M的具體取值范圍。
4) 在上述操作基礎(chǔ)上,對(duì)M個(gè)特征值對(duì)應(yīng)的特征向量矩陣進(jìn)行求解,進(jìn)而形成矩陣Y,將其應(yīng)用于S中。
由于已有的K-means算法對(duì)初始中心的選取十分敏感,不能得到全局最優(yōu),導(dǎo)致NJW算法的穩(wěn)定性下降。為此,引入遺傳算法[11-12],最終完成電力數(shù)據(jù)聚類(lèi),詳細(xì)操作步驟如下。
對(duì)簇心序列進(jìn)行實(shí)數(shù)編碼,通過(guò)隨機(jī)分配方式形成初始種群,對(duì)每個(gè)樣本進(jìn)行編號(hào),根據(jù)編號(hào)將其劃分到對(duì)應(yīng)的簇中。重復(fù)以上操作步驟,直至完成種群的初始化處理。
遺傳聚類(lèi)算法的目標(biāo)函數(shù)T和K-means算法需要保持一致,即兩者的總類(lèi)內(nèi)方差相同。利用
(7)
給出具體的適應(yīng)度函數(shù)計(jì)算過(guò)程。其中Ti表示種群中第i個(gè)個(gè)體對(duì)應(yīng)的目標(biāo)函數(shù)取值;Tmin和Tmax分別表示最小和最大的目標(biāo)函數(shù)值;α表示個(gè)體的淘汰加速度指數(shù)。
考慮到基因個(gè)體的無(wú)序性,為有效防止個(gè)體之間出現(xiàn)錯(cuò)誤匹配,需要對(duì)全部個(gè)體進(jìn)行排序,選取距離最近的基因進(jìn)行一一匹配。以下給出詳細(xì)步驟。
形成兩個(gè)個(gè)體之間對(duì)應(yīng)基因位的距離矩陣D如下
(8)
其中Dij表示兩個(gè)不同個(gè)體之間的歐氏距離。
獲取矩陣D中最小元素,同時(shí)對(duì)其進(jìn)行基因配對(duì),將矩陣的第i列和第j列元素的取值全部設(shè)為0。獲取矩陣中的最小非零元素,將對(duì)應(yīng)的基因進(jìn)行匹配,該行對(duì)應(yīng)的元素取值設(shè)為0。重復(fù)以上操作步驟,直至全部個(gè)體完成基因配對(duì)為止。
當(dāng)種群中的全部個(gè)體經(jīng)過(guò)交叉和變異等相關(guān)操作后,需要計(jì)算初始樣本集V和各類(lèi)序列之間的距離,通過(guò)最近距離原則確定類(lèi)心,將新的個(gè)體設(shè)定為此次迭代的最終結(jié)果,同時(shí)將其代入到下一次的迭代中。
在上述分析基礎(chǔ)上,得到以下遺傳聚類(lèi)優(yōu)化算法操作步驟[13-14]。
1) 將特征向量矩陣按照行進(jìn)行劃分,形成聚類(lèi)空間特征樣本集,同時(shí)對(duì)不同的個(gè)體進(jìn)行編碼,形成初始種群。
2) 計(jì)算初始種群的適應(yīng)度函數(shù),設(shè)定迭代次數(shù)。
3) 結(jié)合遺傳算法對(duì)第i代種群進(jìn)行選擇以及交叉等相關(guān)操作,進(jìn)而獲取全新的種群。
4) 判斷迭代次數(shù)是否達(dá)到設(shè)定的標(biāo)準(zhǔn),假設(shè)達(dá)到,則返回至步驟3);反之,則停止迭代,同時(shí)選擇種群中適應(yīng)度取值最大的個(gè)體設(shè)定為最終的聚類(lèi)結(jié)果。
5) 將初始特征樣本集按照離最終結(jié)果距離的遠(yuǎn)近[15]進(jìn)行編號(hào),獲取特征向量空間對(duì)應(yīng)的聚類(lèi)劃分結(jié)果。
綜合評(píng)價(jià)是客觀地對(duì)評(píng)價(jià)對(duì)象進(jìn)行合理全面的評(píng)價(jià)。其中,可通過(guò)數(shù)學(xué)模型將多個(gè)評(píng)價(jià)指標(biāo)經(jīng)過(guò)一系列操作整合成一個(gè)綜合評(píng)價(jià)值,對(duì)應(yīng)的函數(shù)如下
yxy=f(ω,x)
(9)
其中yxy表示綜合評(píng)價(jià)值;ω表示評(píng)價(jià)指標(biāo)的權(quán)重向量。
針對(duì)實(shí)際問(wèn)題,需要對(duì)各個(gè)評(píng)價(jià)對(duì)象的相關(guān)因素進(jìn)行分解,進(jìn)而構(gòu)建判斷矩陣。逐一對(duì)矩陣中的各項(xiàng)評(píng)價(jià)指標(biāo)進(jìn)行測(cè)試,得到判斷矩陣如下
(10)
通過(guò)層次分析法的相關(guān)原理,能準(zhǔn)確推導(dǎo)出判斷矩陣各列的和,同時(shí)借助計(jì)算得到判斷矩陣的系數(shù)矩陣
(11)
求解矩陣中的特征根和特征向量,同時(shí)對(duì)其一一進(jìn)行檢驗(yàn),判斷矩陣是否需要修改或重建。其中,一致性檢驗(yàn)指標(biāo)為
(12)
其中λmax表示矩陣中最大的特征根。
根據(jù)電網(wǎng)數(shù)據(jù)的類(lèi)別劃分,可構(gòu)建對(duì)應(yīng)的指標(biāo)模型。在變負(fù)荷模式下,對(duì)全部電力多級(jí)冗余數(shù)據(jù)進(jìn)行合理性檢驗(yàn),判斷數(shù)值是否在合理的范圍內(nèi),是否出現(xiàn)較大的偏差。分析不同類(lèi)型電力數(shù)據(jù)的相關(guān)性,制定對(duì)應(yīng)的相關(guān)性標(biāo)準(zhǔn),得到對(duì)應(yīng)的評(píng)價(jià)指標(biāo)。通過(guò)評(píng)價(jià)指標(biāo)對(duì)不同的電力數(shù)據(jù)進(jìn)行打分,同時(shí)制定對(duì)應(yīng)的電力多級(jí)冗余數(shù)據(jù)精細(xì)化校驗(yàn)準(zhǔn)則。通過(guò)制定的精細(xì)化校驗(yàn)準(zhǔn)則一一對(duì)電力多級(jí)冗余數(shù)據(jù)進(jìn)行校驗(yàn),將冗余數(shù)據(jù)剔除。
為驗(yàn)證所提變負(fù)荷模式下電力多級(jí)冗余數(shù)據(jù)精細(xì)化校驗(yàn)算法的綜合有效性,實(shí)驗(yàn)選取2019年H城市的電網(wǎng)數(shù)據(jù)作為測(cè)試數(shù)據(jù)。
1) 查全率。分析每個(gè)算法在不同時(shí)段的查全率變化情況,對(duì)應(yīng)的公式如下
(13)
圖1給出了3種算法的查全率對(duì)比結(jié)果。
從圖1可以看出,所提算法的查全率處于比較穩(wěn)定的狀態(tài),而另外兩種算法的查全率則呈直線下降趨勢(shì),充分說(shuō)明所提算法能準(zhǔn)確檢測(cè)出多級(jí)電力數(shù)據(jù)中的冗余數(shù)據(jù)。
圖1 不同算法的查全率對(duì)比結(jié)果 圖2 不同算法的額外存儲(chǔ)開(kāi)銷(xiāo)對(duì)比結(jié)果Fig.1 Comparison results of recall of different algorithms Fig.2 Comparison results of extra storage overhead of different algorithms
2) 額外存儲(chǔ)開(kāi)銷(xiāo)。實(shí)驗(yàn)對(duì)比了3種不同算法的額外存儲(chǔ)開(kāi)銷(xiāo),結(jié)果如圖2所示。
從圖2可知,隨著劃分長(zhǎng)度的持續(xù)增加,每個(gè)算法的額外存儲(chǔ)開(kāi)銷(xiāo)開(kāi)始呈直線下降趨勢(shì)。但相比另外兩種算法,所提算法的額外存儲(chǔ)開(kāi)銷(xiāo)明顯更低,充分驗(yàn)證了所提算法的優(yōu)越性。
3) 精細(xì)化校驗(yàn)性能測(cè)試。為進(jìn)一步驗(yàn)證所提算法的優(yōu)越性,測(cè)試對(duì)比3種不同算法的校驗(yàn)結(jié)果如表1所示。
表1 不同算法的精細(xì)化校驗(yàn)結(jié)果對(duì)比Tab.1 Comparison of refined verification results of different algorithms (%)
從表1可知,所提算法的精細(xì)化校驗(yàn)誤差明顯低于另外兩種算法,主要是因?yàn)樗崴惴ㄔ谶M(jìn)行校驗(yàn)前期,對(duì)采集到的全部電力數(shù)據(jù)進(jìn)行了聚類(lèi)處理,根據(jù)聚類(lèi)結(jié)果可以更好地完成精細(xì)化校驗(yàn),全面提升電力多級(jí)冗余數(shù)據(jù)精細(xì)化校驗(yàn)結(jié)果的準(zhǔn)確性。
4) 精細(xì)化校驗(yàn)用時(shí)。實(shí)驗(yàn)對(duì)比了3種不同算法的精細(xì)化校驗(yàn)用時(shí),結(jié)果如圖3所示。
圖3 不同算法的精細(xì)化校驗(yàn)用時(shí)對(duì)比結(jié)果Fig.3 Comparison results of fine check time of different algorithms
從圖3可知,所提算法的用時(shí)明顯低于另外兩種算法,說(shuō)明所提算法能以較快的速度完成校驗(yàn),充分驗(yàn)證了所提算法的優(yōu)越性。
筆者針對(duì)傳統(tǒng)算法存在的不足,設(shè)計(jì)并提出一種變負(fù)荷模式下電力多級(jí)冗余數(shù)據(jù)精細(xì)化校驗(yàn)算法。經(jīng)實(shí)驗(yàn)測(cè)試證明,所提算法能有效提升查全率,降低額外存儲(chǔ)開(kāi)銷(xiāo)和精細(xì)化校驗(yàn)用時(shí),得到了更加準(zhǔn)確的校驗(yàn)結(jié)果。