陳 明,張文靜,趙 杰
(國網(wǎng)河北省電力有限公司,河北石家莊 050021)
隨著信息技術(shù)的不斷發(fā)展,利用數(shù)據(jù)處理與識 別技術(shù)實現(xiàn)對電力工程數(shù)據(jù)的智能化信息感知能力是當(dāng)前學(xué)術(shù)界的共識。因此,提升數(shù)據(jù)采集的效率和準確率成為了當(dāng)下研究熱點[1-3]。國家電網(wǎng)公司出臺相關(guān)政策,鼓勵結(jié)合電力工程業(yè)務(wù)需求、挖掘基建過程價值,實現(xiàn)基建業(yè)務(wù)數(shù)字化、智能化,以提高電力工程基建管理水平。在電力工程實施過程中,對產(chǎn)生的數(shù)據(jù)進行多源感知,形成以電力測量為代表的時序參量以及以圖像為代表的圖像參量,進而構(gòu)成電力工程多源感知參量[4-6]。將二者進行融合,使其互補增強,提升電力數(shù)據(jù)感知準確性。從多源感知數(shù)據(jù)融合角度看,融合參量包括三個層級,各個層級在適用范圍上依次遞增。由于各個參量的表示形式不同,數(shù)據(jù)融合的難度較大,目前雖然已經(jīng)具備了一定的技術(shù)基礎(chǔ),但其在進行跨類融合與分析處理能力上仍有不足,且異構(gòu)數(shù)據(jù)之間的電力工程數(shù)據(jù)融合問題仍亟需進一步地深入研究[7-9]。
該文研究了基于多源感知的電力工程數(shù)據(jù)信息處理與識別技術(shù),通過構(gòu)建多參量數(shù)據(jù)融合模型,對樣本數(shù)據(jù)進行綜合處理。算例分析結(jié)果表明,該文提出的技術(shù)方案能夠有效提高數(shù)據(jù)感知結(jié)果的精確度,同時具有良好的容錯性能,從而助力電力工程基建的信息化建設(shè)。
電力工程的數(shù)據(jù)處理影響整個工程進度,數(shù)據(jù)的分析與處理是整個工程的重要工作,關(guān)系整個電力工程的安全性。數(shù)據(jù)預(yù)處理是多源感知的前提,數(shù)據(jù)的處理精度決定著多源感知數(shù)據(jù)融合的決策成敗[10-11]。針對電力工程產(chǎn)生的多源數(shù)據(jù),首先進行數(shù)據(jù)相關(guān)性分析,將其結(jié)果作為數(shù)據(jù)融合的輸入。由于采集到的數(shù)據(jù)信息種類多樣,為防止數(shù)據(jù)采集結(jié)果產(chǎn)生誤差,對選取信息進行降噪處理,剔除異常數(shù)據(jù)并提高采集信息的真實度。同時為進行數(shù)據(jù)感知,處理后得到的數(shù)據(jù)必須具有連續(xù)性、有效性、一致性,其通過以下三個步驟進行處理:
1)采用遍歷算法篩選異常數(shù)據(jù),消除隨機誤差,并對異常數(shù)據(jù)進行補償;
2)對所有數(shù)據(jù)信息進行特征提取,同時提取出采樣時間與補充的數(shù)據(jù),從而確保數(shù)據(jù)連續(xù)性;
3)為確保數(shù)據(jù)的一致性,對一維數(shù)據(jù)進行擴展化處理,擴展化算法的原理如下:
假設(shè)樣本總數(shù)為M,有三個子樣本集:G1,G2,…,GM;K1,K2,…,KM;L1,L2,…,LM,則樣本j可用下式表示:
綜合式(1)-(3),可得Yj為:
電力工程多源參量融合模式如圖1 所示,其按照數(shù)據(jù)級、特征級、決策級三個層次劃分,各個層次均包含數(shù)據(jù)關(guān)聯(lián)、特征融合、目標感知等內(nèi)容[12-14]。
圖1 多源參量融合模式
數(shù)據(jù)級是最基本的融合層級,對各類參數(shù)進行融合與特征提取,構(gòu)建多源感知數(shù)據(jù)參量;特征級為中間融合層級,需要對數(shù)據(jù)特征進行分析,并解釋各個參數(shù);決策層作為最高層級的融合,需對數(shù)據(jù)進行獨立感知,根據(jù)預(yù)設(shè)的準則進行融合,也是最主要的融合方法[15-16]。
以數(shù)據(jù)信息輸入為參量,從實際需求出發(fā)分類回歸輸出?;谔卣魅诤咸攸c確定各個參數(shù)的特征信息,并進行數(shù)據(jù)融合。最終進行目標信息數(shù)據(jù)感知,建立的多源感知數(shù)據(jù)融合框架,如圖2所示。
圖2 多源感知數(shù)據(jù)融合框架
針對時序電量,將所有數(shù)據(jù)排列為m行n列的矩陣,并轉(zhuǎn)換為非線性混沌系統(tǒng)圖,用特征形式表示。然后,基于卷積神經(jīng)網(wǎng)絡(luò)進行特征提取,對于工程圖像數(shù)據(jù),采用更加成熟的網(wǎng)絡(luò)進行特征提取,基于改進Faster R-CNN 將全連接層的所有數(shù)據(jù)信息輸出到網(wǎng)絡(luò)參數(shù)中。
電力工程多源感知融合模型訓(xùn)練過程如下:
1)輸入時序參量,訓(xùn)練所有感知網(wǎng)絡(luò)數(shù)據(jù)參數(shù),輸出形式為數(shù)據(jù)回歸;
2)輸入與圖像相關(guān)的各類參數(shù),利用訓(xùn)練集數(shù)據(jù)對網(wǎng)絡(luò)進行訓(xùn)練,通過改進的Faster R-CNN 算法模型完成數(shù)據(jù)感知后輸出結(jié)果;
3)對所有的數(shù)據(jù)目標感知網(wǎng)絡(luò)進行綜合分類,基于分類結(jié)果,再對各個層次和部分的數(shù)據(jù)進行融合,綜合構(gòu)建出網(wǎng)絡(luò)融合模型;
4)固定特征參數(shù),輸入序列參數(shù),輸出回歸結(jié)果。
對于電力工程的分類數(shù)據(jù),通過Softmax 輸入數(shù)據(jù)源頭的信息類別,以最小損失進行電力工程數(shù)據(jù)的訓(xùn)練。其誤差滿足預(yù)期目標即可,如下式所示:
式中,L(θ) 為當(dāng)輸入變量為θ時對應(yīng)的概率,θ=[θ1,θ2,…,θm]為電力工程采集到的數(shù)據(jù)序列,其值隨著訓(xùn)練網(wǎng)絡(luò)模型的變化而變化。
此外,損失函數(shù)Y可表示為:
式中,M為數(shù)據(jù)樣本總數(shù),αi表示樣本數(shù)據(jù)的預(yù)測值,表示數(shù)據(jù)樣本的真實值。
當(dāng)誤差滿足預(yù)定值時,可停止迭代,并輸出數(shù)據(jù)。因此,所采用的方均誤差函數(shù)可表示為:
式中,θi表示電力工程數(shù)據(jù)輸入值,f(θi)表示預(yù)測函數(shù)對應(yīng)的函數(shù)值,αi表示電力工程數(shù)據(jù)的真實值。
由于采集到的電力工程數(shù)據(jù)信息為遞歸圖,其具有典型的非線性特征,時間與圖像數(shù)據(jù)為多源信息,需要進行特征同化。因此,采用多參量遞歸方法對電力工程數(shù)據(jù)信息進行特征提取。具體流程如下:
1)假設(shè)采集到的電力工程數(shù)據(jù)時序量為xi(tj),為了使得所有信息具有相同的時序性,令采集時刻相同的數(shù)據(jù)信息排列成相同的序列。
2)對所有數(shù)據(jù)信息進行歸一化處理,歸一化公式如下:
式中,為歸一化之后的形式,θi為i類時序參量,maxθi、minθi分別為時序參量對應(yīng)的最大值和最小值。
3)計算遞歸矩陣,構(gòu)建空間向量并確定遞歸元素。假設(shè)遞歸矩陣為Mn×n,則其中的元素為:
4)將所有的數(shù)據(jù)信息匯總,并以其為輸入值,繪制出電力工程數(shù)據(jù)多參量遞歸圖。
得到遞歸圖后,假設(shè)相關(guān)的參數(shù):令s為步長、p為填充層數(shù)、非線性函數(shù)用ReLU 表示。建立卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3 所示。
圖3 多源感知數(shù)據(jù)卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
數(shù)據(jù)融合以服務(wù)電力工程技經(jīng)現(xiàn)場業(yè)務(wù)管控為重點,采用物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)等技術(shù)為不同層級、崗位的基建管理人員提供專屬定制化的業(yè)務(wù)系統(tǒng)與移動應(yīng)用。對技經(jīng)專業(yè)現(xiàn)場管理流程、應(yīng)用進行標準化、精細化地設(shè)計及實現(xiàn),將服務(wù)對象重心從傳統(tǒng)的建設(shè)管理單位轉(zhuǎn)移到參建單位和工程現(xiàn)場,從而推動基建技經(jīng)業(yè)務(wù)從管理型向服務(wù)型的轉(zhuǎn)變,實現(xiàn)業(yè)務(wù)數(shù)據(jù)化管理。利用信息化、數(shù)據(jù)化手段,創(chuàng)建造價管理的線上數(shù)據(jù)上報、審批、歸集及數(shù)據(jù)分析展示等功能。以線上訂單管理模式設(shè)計費用上報、審核場景,實現(xiàn)平臺的資料數(shù)字化歸檔,最大程度降低人為因素造成的數(shù)據(jù)不準確情況?,F(xiàn)場造價人員組織落實現(xiàn)場造價管理要求,承擔(dān)所轄電力工程現(xiàn)場造價管理工作。在計算機終端提交相關(guān)會議紀要、管理過程資料、現(xiàn)場影像資料等,平臺自動推送建設(shè)管理單位。該單位可采取計算機終端審批,當(dāng)審批完成后各參建單位可查看并進行保存。
該算例模擬電力工程基建現(xiàn)場,以實際工程數(shù)據(jù)為數(shù)據(jù)樣本。采用主從結(jié)構(gòu),以NameNode 作為主服務(wù)器來管理文件命名和數(shù)據(jù)訪問系統(tǒng)。分別對時序和圖像融合的感知模型進行訓(xùn)練與測試,通過對感知模型綜合性能參數(shù)的對比分析,驗證其容錯性。
對電力工程現(xiàn)場情況預(yù)警并對現(xiàn)場圖像進行感知,使用準確率與平均召回率作為評價指標。以某次工程基建為數(shù)據(jù)基礎(chǔ),根據(jù)工程現(xiàn)場設(shè)施情況,并對每個類別進行感知。采集的信息包括溫度、濕度、風(fēng)速、圖像參量等,每隔20 min 采集一次。為使采集到的信息得到補充和增強,以時序參量與圖像參量作為輸入,對感知模型進行仿真。從精確性和容錯性的角度進行對比分析,得到三種感知模型的精確性測試結(jié)果,如表1 所示。從表中可以看出,多源融合模型由于單獨輸入?yún)⒘?,其平均準確率(AP)達到83.76%,而平均召回率(AR)則達到了90.14%。
表1 精確性對比分析
為進一步驗證所述方法的準確率,對選取的時序參量與圖像參量進行異常處理,以不同程度的數(shù)據(jù)丟失作為時序參量的異常變化;以遮擋或模糊處理作為圖像參量的異常變化。將上述參數(shù)作為數(shù)據(jù)輸入,得到的容錯性驗證結(jié)果如表2 所示。從表中可以看出,將數(shù)據(jù)輸入?yún)⒘窟M行異常處理之后,融合參量對應(yīng)的平均準確率較圖像參量高10.86%,平均召回率提升8.46%。
表2 容錯性驗證結(jié)果
采用三種算法對電力工程數(shù)據(jù)進行處理,并對比分析三種方法與所提方法的標準誤差(R)與絕對誤差(M),其結(jié)果如表3 所示。從表中可看出,采用該文方法進行數(shù)據(jù)處理的標準誤差與絕對誤差均有所降低,其更能反映原始數(shù)據(jù)的真實性。
表3 幾種算法的誤差對比
在電力工程的實施過程中會產(chǎn)生大量的異構(gòu)多參量數(shù)據(jù),然而由于缺乏深度融合手段,導(dǎo)致了數(shù)據(jù)信息處理與分析不足、數(shù)據(jù)利用率低等問題的出現(xiàn)。該文基于多源感知技術(shù)提出了一套電力工程數(shù)據(jù)信息處理與識別方法,采用融合時序參量與圖像參量的多參量框架,從數(shù)據(jù)角度分析數(shù)據(jù)融合模式的優(yōu)缺點,利用卷積神經(jīng)網(wǎng)絡(luò)對圖像信息進行特征提取。通過模型優(yōu)化設(shè)計和數(shù)據(jù)融合,實現(xiàn)目標信息的數(shù)據(jù)感知,以增強不同參量之間的互補性,從而有效提高電力工程數(shù)據(jù)感知與處理的精確性及容錯率。