基于多源感知的電力工程數(shù)據(jù)信息處理與識別技術(shù)研究

2023-02-23 03:31:12張文靜

電子設(shè)計工程 2023年4期

陳明，張文靜，趙杰

（國網(wǎng)河北省電力有限公司，河北石家莊 050021）

隨著信息技術(shù)的不斷發(fā)展，利用數(shù)據(jù)處理與識別技術(shù)實現(xiàn)對電力工程數(shù)據(jù)的智能化信息感知能力是當(dāng)前學(xué)術(shù)界的共識。因此，提升數(shù)據(jù)采集的效率和準確率成為了當(dāng)下研究熱點[1-3]。國家電網(wǎng)公司出臺相關(guān)政策，鼓勵結(jié)合電力工程業(yè)務(wù)需求、挖掘基建過程價值，實現(xiàn)基建業(yè)務(wù)數(shù)字化、智能化，以提高電力工程基建管理水平。在電力工程實施過程中，對產(chǎn)生的數(shù)據(jù)進行多源感知，形成以電力測量為代表的時序參量以及以圖像為代表的圖像參量，進而構(gòu)成電力工程多源感知參量[4-6]。將二者進行融合，使其互補增強，提升電力數(shù)據(jù)感知準確性。從多源感知數(shù)據(jù)融合角度看，融合參量包括三個層級，各個層級在適用范圍上依次遞增。由于各個參量的表示形式不同，數(shù)據(jù)融合的難度較大，目前雖然已經(jīng)具備了一定的技術(shù)基礎(chǔ)，但其在進行跨類融合與分析處理能力上仍有不足，且異構(gòu)數(shù)據(jù)之間的電力工程數(shù)據(jù)融合問題仍亟需進一步地深入研究[7-9]。

該文研究了基于多源感知的電力工程數(shù)據(jù)信息處理與識別技術(shù)，通過構(gòu)建多參量數(shù)據(jù)融合模型，對樣本數(shù)據(jù)進行綜合處理。算例分析結(jié)果表明，該文提出的技術(shù)方案能夠有效提高數(shù)據(jù)感知結(jié)果的精確度，同時具有良好的容錯性能，從而助力電力工程基建的信息化建設(shè)。

1 多源感知及其融合模式

1.1 數(shù)據(jù)預(yù)處理

電力工程的數(shù)據(jù)處理影響整個工程進度，數(shù)據(jù)的分析與處理是整個工程的重要工作，關(guān)系整個電力工程的安全性。數(shù)據(jù)預(yù)處理是多源感知的前提，數(shù)據(jù)的處理精度決定著多源感知數(shù)據(jù)融合的決策成敗[10-11]。針對電力工程產(chǎn)生的多源數(shù)據(jù)，首先進行數(shù)據(jù)相關(guān)性分析，將其結(jié)果作為數(shù)據(jù)融合的輸入。由于采集到的數(shù)據(jù)信息種類多樣，為防止數(shù)據(jù)采集結(jié)果產(chǎn)生誤差，對選取信息進行降噪處理，剔除異常數(shù)據(jù)并提高采集信息的真實度。同時為進行數(shù)據(jù)感知，處理后得到的數(shù)據(jù)必須具有連續(xù)性、有效性、一致性，其通過以下三個步驟進行處理：

1）采用遍歷算法篩選異常數(shù)據(jù)，消除隨機誤差，并對異常數(shù)據(jù)進行補償；

2）對所有數(shù)據(jù)信息進行特征提取，同時提取出采樣時間與補充的數(shù)據(jù)，從而確保數(shù)據(jù)連續(xù)性；

3）為確保數(shù)據(jù)的一致性，對一維數(shù)據(jù)進行擴展化處理，擴展化算法的原理如下：

假設(shè)樣本總數(shù)為M，有三個子樣本集：G1,G2,…,GM；K1,K2,…,KM；L1,L2,…,LM，則樣本j可用下式表示：

綜合式（1）-（3），可得Yj為：

1.2 多源感知模式分析

電力工程多源參量融合模式如圖1 所示，其按照數(shù)據(jù)級、特征級、決策級三個層次劃分，各個層次均包含數(shù)據(jù)關(guān)聯(lián)、特征融合、目標感知等內(nèi)容[12-14]。

圖1 多源參量融合模式

數(shù)據(jù)級是最基本的融合層級，對各類參數(shù)進行融合與特征提取，構(gòu)建多源感知數(shù)據(jù)參量；特征級為中間融合層級，需要對數(shù)據(jù)特征進行分析，并解釋各個參數(shù)；決策層作為最高層級的融合，需對數(shù)據(jù)進行獨立感知，根據(jù)預(yù)設(shè)的準則進行融合，也是最主要的融合方法[15-16]。

2 多源融合框架與信息識別

2.1 整體框架

以數(shù)據(jù)信息輸入為參量，從實際需求出發(fā)分類回歸輸出?；谔卣魅诤咸攸c確定各個參數(shù)的特征信息，并進行數(shù)據(jù)融合。最終進行目標信息數(shù)據(jù)感知，建立的多源感知數(shù)據(jù)融合框架，如圖2所示。

圖2 多源感知數(shù)據(jù)融合框架

針對時序電量，將所有數(shù)據(jù)排列為m行n列的矩陣，并轉(zhuǎn)換為非線性混沌系統(tǒng)圖，用特征形式表示。然后，基于卷積神經(jīng)網(wǎng)絡(luò)進行特征提取，對于工程圖像數(shù)據(jù)，采用更加成熟的網(wǎng)絡(luò)進行特征提取，基于改進Faster R-CNN 將全連接層的所有數(shù)據(jù)信息輸出到網(wǎng)絡(luò)參數(shù)中。

2.2 數(shù)據(jù)模型訓(xùn)練

電力工程多源感知融合模型訓(xùn)練過程如下：

1）輸入時序參量，訓(xùn)練所有感知網(wǎng)絡(luò)數(shù)據(jù)參數(shù)，輸出形式為數(shù)據(jù)回歸；

2）輸入與圖像相關(guān)的各類參數(shù)，利用訓(xùn)練集數(shù)據(jù)對網(wǎng)絡(luò)進行訓(xùn)練，通過改進的Faster R-CNN 算法模型完成數(shù)據(jù)感知后輸出結(jié)果；

3）對所有的數(shù)據(jù)目標感知網(wǎng)絡(luò)進行綜合分類，基于分類結(jié)果，再對各個層次和部分的數(shù)據(jù)進行融合，綜合構(gòu)建出網(wǎng)絡(luò)融合模型；

4）固定特征參數(shù)，輸入序列參數(shù)，輸出回歸結(jié)果。

對于電力工程的分類數(shù)據(jù)，通過Softmax 輸入數(shù)據(jù)源頭的信息類別，以最小損失進行電力工程數(shù)據(jù)的訓(xùn)練。其誤差滿足預(yù)期目標即可，如下式所示：

式中，L(θ) 為當(dāng)輸入變量為θ時對應(yīng)的概率，θ=[θ1,θ2,…,θm]為電力工程采集到的數(shù)據(jù)序列，其值隨著訓(xùn)練網(wǎng)絡(luò)模型的變化而變化。

此外，損失函數(shù)Y可表示為：

式中，M為數(shù)據(jù)樣本總數(shù)，αi表示樣本數(shù)據(jù)的預(yù)測值，表示數(shù)據(jù)樣本的真實值。

當(dāng)誤差滿足預(yù)定值時，可停止迭代，并輸出數(shù)據(jù)。因此，所采用的方均誤差函數(shù)可表示為：

式中，θi表示電力工程數(shù)據(jù)輸入值，f(θi)表示預(yù)測函數(shù)對應(yīng)的函數(shù)值，αi表示電力工程數(shù)據(jù)的真實值。

2.3 特征提取

由于采集到的電力工程數(shù)據(jù)信息為遞歸圖，其具有典型的非線性特征，時間與圖像數(shù)據(jù)為多源信息，需要進行特征同化。因此，采用多參量遞歸方法對電力工程數(shù)據(jù)信息進行特征提取。具體流程如下：

1）假設(shè)采集到的電力工程數(shù)據(jù)時序量為xi(tj)，為了使得所有信息具有相同的時序性，令采集時刻相同的數(shù)據(jù)信息排列成相同的序列。

2）對所有數(shù)據(jù)信息進行歸一化處理，歸一化公式如下：

式中，為歸一化之后的形式，θi為i類時序參量，maxθi、minθi分別為時序參量對應(yīng)的最大值和最小值。

3）計算遞歸矩陣，構(gòu)建空間向量并確定遞歸元素。假設(shè)遞歸矩陣為Mn×n，則其中的元素為：

4）將所有的數(shù)據(jù)信息匯總，并以其為輸入值，繪制出電力工程數(shù)據(jù)多參量遞歸圖。

得到遞歸圖后，假設(shè)相關(guān)的參數(shù)：令s為步長、p為填充層數(shù)、非線性函數(shù)用ReLU 表示。建立卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3 所示。

圖3 多源感知數(shù)據(jù)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

2.4 數(shù)據(jù)應(yīng)用

數(shù)據(jù)融合以服務(wù)電力工程技經(jīng)現(xiàn)場業(yè)務(wù)管控為重點，采用物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)等技術(shù)為不同層級、崗位的基建管理人員提供專屬定制化的業(yè)務(wù)系統(tǒng)與移動應(yīng)用。對技經(jīng)專業(yè)現(xiàn)場管理流程、應(yīng)用進行標準化、精細化地設(shè)計及實現(xiàn)，將服務(wù)對象重心從傳統(tǒng)的建設(shè)管理單位轉(zhuǎn)移到參建單位和工程現(xiàn)場，從而推動基建技經(jīng)業(yè)務(wù)從管理型向服務(wù)型的轉(zhuǎn)變，實現(xiàn)業(yè)務(wù)數(shù)據(jù)化管理。利用信息化、數(shù)據(jù)化手段，創(chuàng)建造價管理的線上數(shù)據(jù)上報、審批、歸集及數(shù)據(jù)分析展示等功能。以線上訂單管理模式設(shè)計費用上報、審核場景，實現(xiàn)平臺的資料數(shù)字化歸檔，最大程度降低人為因素造成的數(shù)據(jù)不準確情況?，F(xiàn)場造價人員組織落實現(xiàn)場造價管理要求，承擔(dān)所轄電力工程現(xiàn)場造價管理工作。在計算機終端提交相關(guān)會議紀要、管理過程資料、現(xiàn)場影像資料等，平臺自動推送建設(shè)管理單位。該單位可采取計算機終端審批，當(dāng)審批完成后各參建單位可查看并進行保存。

3 算例分析

該算例模擬電力工程基建現(xiàn)場，以實際工程數(shù)據(jù)為數(shù)據(jù)樣本。采用主從結(jié)構(gòu)，以NameNode 作為主服務(wù)器來管理文件命名和數(shù)據(jù)訪問系統(tǒng)。分別對時序和圖像融合的感知模型進行訓(xùn)練與測試，通過對感知模型綜合性能參數(shù)的對比分析，驗證其容錯性。

對電力工程現(xiàn)場情況預(yù)警并對現(xiàn)場圖像進行感知，使用準確率與平均召回率作為評價指標。以某次工程基建為數(shù)據(jù)基礎(chǔ)，根據(jù)工程現(xiàn)場設(shè)施情況，并對每個類別進行感知。采集的信息包括溫度、濕度、風(fēng)速、圖像參量等，每隔20 min 采集一次。為使采集到的信息得到補充和增強，以時序參量與圖像參量作為輸入，對感知模型進行仿真。從精確性和容錯性的角度進行對比分析，得到三種感知模型的精確性測試結(jié)果，如表1 所示。從表中可以看出，多源融合模型由于單獨輸入?yún)⒘?，其平均準確率（AP）達到83.76%，而平均召回率（AR）則達到了90.14%。

表1 精確性對比分析

為進一步驗證所述方法的準確率，對選取的時序參量與圖像參量進行異常處理，以不同程度的數(shù)據(jù)丟失作為時序參量的異常變化；以遮擋或模糊處理作為圖像參量的異常變化。將上述參數(shù)作為數(shù)據(jù)輸入，得到的容錯性驗證結(jié)果如表2 所示。從表中可以看出，將數(shù)據(jù)輸入?yún)⒘窟M行異常處理之后，融合參量對應(yīng)的平均準確率較圖像參量高10.86%，平均召回率提升8.46%。

表2 容錯性驗證結(jié)果

采用三種算法對電力工程數(shù)據(jù)進行處理，并對比分析三種方法與所提方法的標準誤差（R）與絕對誤差（M），其結(jié)果如表3 所示。從表中可看出，采用該文方法進行數(shù)據(jù)處理的標準誤差與絕對誤差均有所降低，其更能反映原始數(shù)據(jù)的真實性。

表3 幾種算法的誤差對比

4 結(jié)束語

在電力工程的實施過程中會產(chǎn)生大量的異構(gòu)多參量數(shù)據(jù)，然而由于缺乏深度融合手段，導(dǎo)致了數(shù)據(jù)信息處理與分析不足、數(shù)據(jù)利用率低等問題的出現(xiàn)。該文基于多源感知技術(shù)提出了一套電力工程數(shù)據(jù)信息處理與識別方法，采用融合時序參量與圖像參量的多參量框架，從數(shù)據(jù)角度分析數(shù)據(jù)融合模式的優(yōu)缺點，利用卷積神經(jīng)網(wǎng)絡(luò)對圖像信息進行特征提取。通過模型優(yōu)化設(shè)計和數(shù)據(jù)融合，實現(xiàn)目標信息的數(shù)據(jù)感知，以增強不同參量之間的互補性，從而有效提高電力工程數(shù)據(jù)感知與處理的精確性及容錯率。