張建軍
(國能大渡河大崗山發(fā)電有限公司,四川 雅安 625400)
工作票主要用于記錄變電站的設(shè)備檢修、運(yùn)行、施工等方面信息,是電氣設(shè)備檢修的關(guān)鍵憑據(jù),具有保障電力安全和電力工作人員安全的作用[1].因此,各個變電站都有電力設(shè)備管理人員填寫工作票,記錄變電站所有電力設(shè)備信息[2].電力行業(yè)是關(guān)系到國家發(fā)展和社會正常運(yùn)行的基礎(chǔ)產(chǎn)業(yè)和公共事業(yè),一直以來我國十分重視變電站建設(shè),不斷提升全國電網(wǎng)規(guī)模以滿足人們用電需求的增長[3].傳統(tǒng)的天然氣、煤炭、石油等能源已經(jīng)難以滿足全國變電站供電需求,基于此,相關(guān)學(xué)者提出使用水資源作為變電站供電能源,通過建立水力發(fā)電站(簡稱水電站)將水的位能和動能轉(zhuǎn)化為動能,滿足變電站供電能源需求[4].然而,水電站的電力設(shè)備相較傳統(tǒng)變電站的電力設(shè)備,需要更多配備水工建筑物和水利機(jī)械等水電站專用設(shè)備,所以,水電站需要管理的電力設(shè)備明顯多于傳統(tǒng)變電站,若此時還采用傳統(tǒng)人工填寫工作票的方式管理電力設(shè)備,新建水電站激增的電力設(shè)備會給工作人員添加更多煩瑣的工作,也增添了設(shè)備管理難度和失誤率[5].因此,亟需研究適合水電站工作票的管理方法.
目前國內(nèi)外已經(jīng)研究出VIRGO專家系統(tǒng)、EOSES、慧源電子工作票系統(tǒng)、UT-2000、基于圖形化的系統(tǒng)、AS-5000、UT-GZP工作票系統(tǒng)、Net 1.08等.然而這些工作票管控系統(tǒng)在管控工作票時,存在存取類別混亂問題,在影響電力設(shè)備管控人員管控電力設(shè)備效率的同時,還可能造成電力設(shè)備工作票填寫錯誤等問題[6].基于此,相關(guān)學(xué)者在國內(nèi)外研究成果的基礎(chǔ)上,提出如下觀點:文獻(xiàn)[7]將檢修工作票作為研究對象,引入分層有限狀態(tài)機(jī)確定工作票狀態(tài),并根據(jù)這一狀態(tài)設(shè)計相應(yīng)的防誤管控體系.文獻(xiàn)[8]以移動終端為載體,結(jié)合NFC、無線傳感器等先進(jìn)技術(shù),為水電站技術(shù)人員進(jìn)行現(xiàn)場操作和狀態(tài)分析提供智能化手段,實現(xiàn)了水電站運(yùn)行過程中工作票的實時管理.上述學(xué)者研究的工作票管控方法在管控工作票存取時,存在工作票存取準(zhǔn)確率低、存取收斂速度慢的問題,為此提出基于深度學(xué)習(xí)的水電站工作票存取管控體系構(gòu)建.
水電站工作票在存票之前,需要將取出的工作票按照特定的編制編寫工作票,在建立工作票管控體系模型之前,需要先編制工作票關(guān)鍵項規(guī)則和推理機(jī)制.
1.1.1 水電站工作票編制規(guī)則根據(jù)水電站工作票在水電站中的主要作用,以及水電站的電氣設(shè)備類型,設(shè)計了如下述內(nèi)容所示的工作票編制規(guī)則:
(1) 確定編制工作票設(shè)備類型,如母線、開關(guān)、變壓器等;
(2) 設(shè)計電氣設(shè)備任務(wù);
(3) 填寫電氣設(shè)備接線形式,如母線的單接線、雙接線等;
(4) 制定電氣設(shè)備子任務(wù),如母線的母聯(lián)開關(guān)轉(zhuǎn)運(yùn)行、所有開關(guān)熱備用等;
(5) 選擇子任務(wù)的子任務(wù),如母線開關(guān)中的旁路開關(guān);
(6) 判斷電氣設(shè)備的初始狀態(tài)和目標(biāo)狀態(tài)[9].
上述6步即為工作表填寫規(guī)則庫,只有按照上述6步填寫的工作票,才能成功存入工作票管控系統(tǒng)中.
1.1.2 水電站工作票推理機(jī)制以此次研究設(shè)計的工作票編寫規(guī)則為依據(jù),制定的工作票推理機(jī)制如下:
(1) 接取水電站電氣設(shè)備檢修任務(wù);
(2) 根據(jù)水電站檢修電氣設(shè)備制定推理機(jī)制.a.判斷電氣設(shè)備是否停電;b.若停電,檢查電氣設(shè)備停電原因;c.查看電氣設(shè)備是否裝接地線,懸掛標(biāo)識牌.
(3) 根據(jù)推理機(jī)制,通過電氣設(shè)備拓?fù)潢P(guān)系、工作票編寫規(guī)則庫操作推理項;
(4) 完成水電站工作票編寫.
當(dāng)完成工作票編寫后,劃分工作票類別.
在此次研究設(shè)置的工作票編制下,依據(jù)工作票記錄的水電站電氣設(shè)備信息類別,如母線、變壓器等電氣設(shè)備類別,短路、斷路等電氣設(shè)備故障類別,劃分水電站工作票類別.
由于水電站工作票的功用固定,因此其在使用過程中,會存在高頻率的領(lǐng)域性詞匯,如停電、短路、斷路等,為此,將這些高頻率詞匯作為工作票領(lǐng)域本體特征.引入N-gram特征模型提取工作票中存在的重復(fù)性詞語組合,根據(jù)N-gram特征模型中N值的大小生成gram.然而,這一領(lǐng)域知識提取過程效率偏低,為了提高工作票領(lǐng)域知識提取效率,使用LZW數(shù)據(jù)壓縮算法,將工作票領(lǐng)域知識轉(zhuǎn)化為一個字符串表,并不斷將新發(fā)現(xiàn)的領(lǐng)域知識加入字符串中,直至字符串表中不再新增領(lǐng)域知識,停止數(shù)據(jù)壓縮過程.最后,使用多模式匹配算法構(gòu)建有限狀態(tài)模式匹配自動機(jī),確定工作票領(lǐng)域知識使用頻率[10].
在頻率篩選的基礎(chǔ)上,計算工作票領(lǐng)域知識的互信息和剩余逆文檔頻率,挖掘多頻率詞匯中包含的工作票術(shù)語,則有:
(1)
式(1)中:ξ表示短語;a、e共同表示一個詞語;ω表示詞匯或短語出現(xiàn)頻率;H表示互信息;P表示剩余逆文檔頻率;N表示工作票數(shù)量;exp表示取經(jīng)驗值;M表示包含某個短語的工作票數(shù)量.
從式(1)中可以看出,H值和P值越大,所選擇的工作票詞匯屬于工作票領(lǐng)域知識的可能性越高[11].
根據(jù)式(1)所篩選出的工作票領(lǐng)域本體特征詞匯,使用向量空間模型表示工作票領(lǐng)域本體特征,則有:
(2)
式(2)中:υ表示工作票領(lǐng)域本體特征詞匯;W表示υ在工作票領(lǐng)域本體特征中的權(quán)重;α表示指數(shù)因子;κ表示工作票領(lǐng)域本體特征詞匯數(shù)量;χi表示第i個關(guān)鍵詞匯.
依據(jù)式(2)計算得到的W(υ)值,采用Euclidean距離計算工作票相似性,有:
(3)
式(3)中:υi和υj分別表示第i個和第j個工作票領(lǐng)域本體特征詞匯,且υi≠υj;D表示υi與υj之間的距離[12].從式(3)中可以看出,D(υi,υj)值越小,工作票與工作票之間的相似性越高.
按照上述3個公式計算過程,重復(fù)計算工作票之間的距離,并將工作票之間存在相同距離的工作票劃分為同一類別,實現(xiàn)工作票分類.
在式(1)~式(3)劃分的水電站工作票類別結(jié)果,以深度學(xué)習(xí)算法結(jié)構(gòu)為依據(jù),建立的水電站工作票存取管控模型,共包括輸入層、隱藏層、全連接隱藏層和輸出層4層,其在運(yùn)算的過程中,會依據(jù)水電站工作票數(shù)量劃分不同層次域.在模型輸入層中,一次性輸入34個工作票樣本,進(jìn)行工作票存取管控;隱藏層和全連接隱藏層神經(jīng)元個數(shù)共設(shè)置為69個;輸出層神經(jīng)元個數(shù)設(shè)置為2個,即依據(jù)隱藏層和全連接隱藏層神經(jīng)元迭代訓(xùn)練結(jié)果,得到存入或取出操作狀態(tài)值.因此,此次研究建立的管控模型屬于全連接結(jié)構(gòu).基于此次研究建立的水電站工作票存取管控模型,設(shè)置的模型訓(xùn)練步驟如下.
1.3.1 標(biāo)準(zhǔn)化工作票樣本標(biāo)準(zhǔn)化處理水電站工作票,并將工作票本身的數(shù)據(jù)范圍壓縮至[-1,+1]之間,則工作票標(biāo)準(zhǔn)化處理公式如下式所示:
(4)
式(4)中:u'表示標(biāo)準(zhǔn)化處理后的工作票;ui表示第i個工作票樣本;min(u)表示工作票樣本中存在的最小值;max(u)表示工作票樣本中存在的最大值.
只有按照式(4)標(biāo)準(zhǔn)化處理后的工作票樣本,才能作為模型訓(xùn)練的輸入層輸入樣本,否則會直接影響模型訓(xùn)練輸出結(jié)果精度.
1.3.2 設(shè)定模型激活函數(shù)及神經(jīng)元節(jié)點輸出值此次研究建立的管控模型以深度學(xué)習(xí)算法為依據(jù),設(shè)定模型激活函數(shù).考慮模型網(wǎng)絡(luò)節(jié)點及輸出值數(shù)量,激活函數(shù)為:
,
(5)
式(5)中,f(u)表示激活函數(shù).
在式(5)所示的激活函數(shù)作用下,工作票樣本在隱藏層、全連接隱藏層、輸出層的神經(jīng)元節(jié)點輸出值分別為:
(6)
式(6)中:ζ表示神經(jīng)元輸出值;n=34表示輸入層R輸入的樣本數(shù);Yj表示隱藏層第j個神經(jīng)元;Ri表示輸入層第i個神經(jīng)元;wRY表示R與Y之間的連接權(quán)值;bj表示Yj的偏置;Qk表示全連接隱藏層第k個神經(jīng)元;bk表示Qk的偏置;Ch表示輸出層第h個神經(jīng)元;wYQ表示Y與Q之間的連接權(quán)值;wQC表示Q與C之間的連接權(quán)值;bh表示Ch的偏置.
如式(6)所示的各層輸出計算方程,其在運(yùn)算時,會在模型隱藏層和全連接隱藏層傳播誤差,導(dǎo)致模型最終管控結(jié)果彌散,難以達(dá)到穩(wěn)定的狀態(tài)[13].因此,需要在式(6)的基礎(chǔ)上,設(shè)定模型訓(xùn)練過程,降低模型各層輸出誤差.
1.3.3 模型訓(xùn)練此次研究訓(xùn)練模型將單一訓(xùn)練一層,并將上一層的訓(xùn)練結(jié)果作為輸入[14],基于此,設(shè)定的模型訓(xùn)練過程如下:
(1) 計算預(yù)訓(xùn)練連接權(quán)值w和偏置向量b,則有:
(7)
式(7)中:?表示求導(dǎo)符號;f(w,b,u)表示目標(biāo)函數(shù);γ表示訓(xùn)練誤差;l=1,2,3,4表示模型中的任意一層;c表示模型激活值.
(2)采用式(7)計算得到的w和b值初始化模型;
(3)根據(jù)式(6)計算樣本輸出值;
(4)計算樣本輸出層誤差γ:
(8)
式(8)中,?l表示式(6)計算樣本得到的梯度項;ε表示網(wǎng)絡(luò)閾值.
(5)反向訓(xùn)練模型.將式(8)計算得到的誤差逆向傳播,作為上一隱藏層神經(jīng)元梯度項;
(6)重復(fù)第5步計算過程,直至完成所有隱藏層誤差計算;
(7)更新所有權(quán)值矩陣,則有:
(9)
式(9)中:μ表示模型學(xué)習(xí)速率;d表示模型迭代訓(xùn)練步驟[15].
上述7步訓(xùn)練過程,即完成對水電站工作票存取過程的迭代訓(xùn)練.綜合上述內(nèi)容,將工作票編制及劃分的工作票類別作為工作票存取管控前提,以深度學(xué)習(xí)算法為基礎(chǔ),設(shè)計模型訓(xùn)練過程和參數(shù),實現(xiàn)工作票存取管控.
選擇文獻(xiàn)[7]方法和文獻(xiàn)[8]方法作為此次實驗的對比方法,將水電站工作票作為此次實驗研究對象,在TensorFlow深度學(xué)習(xí)框架中,驗證此次研究構(gòu)建的基于深度學(xué)習(xí)的水電站工作票存取管控體系.
此次實驗選擇的水電站工作票來自某區(qū)域的水電站工作票操作系統(tǒng)數(shù)據(jù)庫,共包括66 007個樣本、63類標(biāo)識、形式穩(wěn)定、用詞標(biāo)準(zhǔn)統(tǒng)一、屬于實時監(jiān)測類的系統(tǒng)智能歷史工作票數(shù)據(jù)集和43 337個樣本、95類標(biāo)識、形式自由、存在錯誤、屬于自然語言描述類的用戶手工操作生成的歷史工作票數(shù)據(jù)集兩種.基于此,此次實驗選擇的用戶手工操作生成的歷史工作票數(shù)據(jù)集管控難度更大.根據(jù)此次實驗選擇的實驗數(shù)據(jù)集,將兩個數(shù)據(jù)集劃分為訓(xùn)練數(shù)據(jù)集樣本和測試數(shù)據(jù)集樣本,作為3組管控體系輸入數(shù)據(jù).
2.2.1 模型管控準(zhǔn)確性對比采用此次實驗選擇的3組管控體系分別管控水電站工作票存取過程,并在管控工作票存取的過程中,檢測3組管控體系管控水電票存取結(jié)果與水電票實際存取結(jié)果是否一致,以此來計算3組管控體系模型在不同迭代次數(shù)下管控工作票存取準(zhǔn)確性,其得到的管控結(jié)果如表1所示.
表1 工作票存取管控準(zhǔn)確性對比表(%)
從圖1中可以看出,除文獻(xiàn)[7]方法外,文獻(xiàn)[8]方法和研究管控體系的準(zhǔn)確性均隨著迭代次數(shù)的增加而提高,但是,當(dāng)?shù)螖?shù)達(dá)到最大時,此次研究的管控體系管控水電站工作票存取準(zhǔn)確率相較此次實驗選擇的兩組管控體系分別高6.5%、38.5%、21%、42.11%.由此可見,此次研究的管控體系在管控水電站工作票存取時,具有較高的工作票存取管控準(zhǔn)確性.
2.2.2 模型收斂速度對比在準(zhǔn)確性實驗的基礎(chǔ)上,統(tǒng)計3組管控體系管控水電站工作票存取收斂速度,其統(tǒng)計結(jié)果如圖1所示.
從圖1中可以看出,研究方法在訓(xùn)練管控體系模型算法的訓(xùn)練樣本數(shù)達(dá)到2 000時,在訓(xùn)練過程中產(chǎn)生的訓(xùn)練誤差函數(shù)值就已經(jīng)完全收斂,而文獻(xiàn)[8]方法訓(xùn)練樣本數(shù)則需要達(dá)到4 000,文獻(xiàn)[7]方法訓(xùn)練樣本數(shù)則需要達(dá)到8 000.由此可見,此次研究的管控體系具有較快的收斂速度.
2.2.3 模型預(yù)設(shè)閾值對模型準(zhǔn)確性影響將此次實驗選擇的3組管控體系管控水電站工作票存取模型算法閾值設(shè)為[0,1],在設(shè)置閾值之間,隨機(jī)選取不同大小的閾值數(shù),比較3組管控體系管控不同數(shù)據(jù)集存取數(shù)據(jù)準(zhǔn)確率,其實驗結(jié)果如圖2所示.
從圖2中可以看出,3組管控體系在管控系統(tǒng)智能歷史工作票數(shù)據(jù)集存取時,其預(yù)設(shè)閾值對工作票存取管控準(zhǔn)確率影響不明顯,但是對于用戶手工操作生成的歷史工作票數(shù)據(jù)集存取管控準(zhǔn)確率影響十分明顯.但是,研究管控體系管控兩個工作票數(shù)據(jù)集存取的預(yù)設(shè)閾值為0.8時,管控準(zhǔn)確率達(dá)到最高,其準(zhǔn)確率分別為100%和90%;文獻(xiàn)[8]方法管控兩個工作票數(shù)據(jù)集存取的預(yù)設(shè)閾值為0.8時,管控準(zhǔn)確率達(dá)到最高,其準(zhǔn)確率分別為93.5%和69%;文獻(xiàn)[7]方法管控兩個工作票數(shù)據(jù)集存取的預(yù)設(shè)閾值為0.16時,管控準(zhǔn)確率達(dá)到最高,其準(zhǔn)確率分別為61.5%和47.89%.由此可見,設(shè)置合適的預(yù)設(shè)閾值,就可以得到最優(yōu)的管控準(zhǔn)確率,但是研究管控體系在最優(yōu)閾值下的管控準(zhǔn)確率相較此次實驗選擇的兩組管控體系分別高6.5%、38.5%、21%、42.11%.
綜合上述3組實驗結(jié)果可知,此次研究管控體系只要設(shè)置了合適的閾值,其在管控存取票時,就具有較高管控準(zhǔn)確率和較快的訓(xùn)練收斂速度.
本文研究充分利用深度學(xué)習(xí)算法設(shè)計水電站工作票存取管控體系模型,提高管控體系管控工作票存取準(zhǔn)確率和誤差收斂速度.經(jīng)實驗驗證,文中研究的管控體系模型的預(yù)訓(xùn)練十分重要,可以直接影響管控體系管控操作票存取準(zhǔn)確率和誤差收斂速度.在今后的研究中,還需深入研究深度學(xué)習(xí)的預(yù)訓(xùn)練步驟,進(jìn)一步提高工作票存取管控準(zhǔn)確性.