陳東海,王 猛,吳昱浩,楊 淇
(國網(wǎng)寧波供電公司,浙江寧波 315000)
tesseract 訓練引擎碼源由C#、C++兩種語言混編而成,在編譯過程中,所有接口函數(shù)直接存儲于baseapi.h 文件中。一般來說,一個tesseract 訓練引擎碼只能處理一類Image 信息,且隨著應用時間的延長,已被讀取數(shù)據(jù)指標會占據(jù)原信息文件的傳輸位置,不但會避免傳輸數(shù)據(jù)文件出現(xiàn)過量堆積情況,也可建立一個信息參量與另一個信息參量之間的函數(shù)連接,加強數(shù)據(jù)與數(shù)據(jù)之間的聯(lián)系緊密性[1-2]。在智能電網(wǎng)、電力體系等應用環(huán)境中,電壓信號、電流信號等特征指標可作為tesseract 訓練引擎的傳輸對象,且隨著數(shù)據(jù)讀取指令的執(zhí)行,這些文件信息可直接存儲于既定數(shù)據(jù)庫主機中,以供其他編譯碼源的調取與利用。
電力告警信號是指能夠描述錯誤電信號傳輸行為的指標參量,在智能配網(wǎng)環(huán)境中,電網(wǎng)主機對于告警信號特征的識別準確性直接決定電網(wǎng)體系的應用穩(wěn)定性。傳統(tǒng)多特征組合識別方法通過電力告警信號特征逐級分析的方式,建立核心信號標記節(jié)點與下級信號標記節(jié)點之間的物理連接關系,再借助已知編碼原則,確定特征信號參量的位數(shù)識別結果[3]。然而,與該方法匹配的電力告警信號峭度指標極值差水平較高,不利于增強電網(wǎng)主機對于告警信號特征的識別準確性。為解決上述問題,設計基于tesseract 訓練的新型電力告警信號特征識別方法。
在tesseract 引擎支持下,電力告警信號的字符標記主要由tesseract 訓練環(huán)境布局、字符行區(qū)域識別、字符列區(qū)域識別三部分組成。
訓練環(huán)境布局是tesseract 引擎碼源設計的關鍵環(huán)節(jié),可將既定電力告警信號特征聚集在同一數(shù)據(jù)信息存儲環(huán)節(jié)中,并可按照既定調用函數(shù),將信息參量分割為多個應用模式,一部分可供電力主機體系直接調取;另一部分則能夠為行、列區(qū)域提供可識別的備選字符信息[4-5]。
規(guī)定第一個tesseract 引擎碼源的定義系數(shù)項為u1,第n個tesseract 引擎碼源的定義系數(shù)項為un,且標記節(jié)點n的取值結果始終大于1。規(guī)定由式(1)決定的tesseract 引擎標記行為恒成立,則認為電力告警信號特征的訓練環(huán)境布局原則始終滿足式(2):
式中,e表示tesseract 引擎碼源標記系數(shù),β表示電力告警信號的訓練特征值,w1表示第一個tesseract 引擎碼篩查系數(shù),wn表示第n個tesseract 引擎碼篩查系數(shù),p表示tesseract 引擎中的數(shù)據(jù)信息行為項。環(huán)境布局形式?jīng)Q定了tesseract 訓練引擎的應用能力,一般來說,待識別的電力告警信號特征量越多,tesseract 訓練環(huán)境對于數(shù)據(jù)信息參量的容納能力也越強。
字符行區(qū)域是以行分布系數(shù)為基礎劃分的電力告警信號特征識別區(qū)域,在識別取樣過程中,行區(qū)域覆蓋面積越大,則表示tesseract 訓練引擎的橫向布局能力越強,反之則越弱[6]。字符行區(qū)域識別可以理解為對電力告警信號特征行區(qū)域環(huán)境的規(guī)劃,在配電網(wǎng)環(huán)境中,由于信號傳輸特征的不同,與之匹配的數(shù)據(jù)訓練方式也有所不同,這也是導致電網(wǎng)主機對于告警信號特征識別結果出現(xiàn)明顯差異性的主要原因[7-8]。
設ΔS表示tesseract 訓練環(huán)境的行區(qū)域跨度量,r表示電力告警信號特征的行區(qū)域跨度系數(shù),qr表示行區(qū)域跨度系數(shù)取值為r時的告警信號特征值,m、d表示兩個不同的行區(qū)域字符節(jié)點標記系數(shù),聯(lián)立式(2),可將字符行區(qū)域識別結果SR表示為:
若以tesseract 訓練布局環(huán)境為背景,則可認為行區(qū)域識別結果直接決定了電力告警信號特征的橫向傳輸能力。
字符列區(qū)域是以列分布系數(shù)為基礎劃分的電力告警信號特征識別區(qū)域,在識別取樣過程中,列區(qū)域覆蓋面積越大,則表示tesseract 訓練引擎的縱向布局能力越強,反之則越弱。字符列區(qū)域識別可以理解為是對電力告警信號特征列區(qū)域環(huán)境的規(guī)劃,在配電網(wǎng)環(huán)境中,與每一列電力告警信號特征所匹配的實時傳輸行為有所不同,此時為充分激發(fā)tesseract訓練引擎的應用能力,應對電力告警信號特征所屬的列區(qū)域環(huán)境進行嚴格規(guī)劃與部署[9-10]。
設ΔD表示tesseract 訓練環(huán)境的列區(qū)域跨度量,i表示電力告警信號特征的列區(qū)域跨度系數(shù),qi表示列區(qū)域跨度系數(shù)取值為i時的告警信號特征值,c表示列區(qū)域字符節(jié)點標記系數(shù),可將字符列區(qū)域識別結果DR表示為:
若以tesseract 訓練布局環(huán)境為背景,則可認為列區(qū)域識別結果直接決定電力告警信號特征的縱向傳輸能力。
在tesseract 訓練布局環(huán)境中,電力告警信號特征提取行為能夠決定特征參量識別結果準確性,對不同數(shù)據(jù)信息指標,與之相關的信號特征提取結果也會有所不同[11-12]。在不考慮其他干擾條件的情況下,電力告警信號特征提取結果同時受到數(shù)據(jù)信息傳輸變化量、特征指標判別條件兩項物理量的直接影響。
數(shù)據(jù)信息傳輸變化量可表示為ΔG,在單位判別時間內,該項物理指標取值結果越大,電網(wǎng)主機能識別到告警信號特征值也就越多。特征指標判別條件可表示為χ,若單純以tesseract 訓練引擎作為干擾項影響條件,則可認為該項物理指標的取值結果將直接影響電網(wǎng)主機對于電力告警信號特征的識別與處理能力。在上述物理量的支持下,聯(lián)立式(4),可將信號特征提取表達式定義為:
其中,z表示電力告警信號特征的傳輸干擾項,λ表示tesseract 訓練引擎對于電力告警信號的判別系數(shù)。假設tesseract 訓練引擎的應用穩(wěn)定性不會發(fā)生改變,則可認為信號特征提取條件能夠直接影響電網(wǎng)主機對于告警信號特征指標的識別。
識別閾值也稱為tesseract 訓練引擎對電力告警信號特征所設置的識別判斷權限,在已知信號特征提取結果情況下,該門限指標的取值結果越大,電網(wǎng)主機對于告警信號特征的準確識別能力也就越強,反之則越弱[13-14]。
設vmax表示電力告警信號特征在tesseract 訓練引擎中傳輸速率的最大值,vmin表示傳輸速率的最小值,在實際應用過程中,不等式(vmax-vmin)>1 恒成立。規(guī)定j表示一個既定的信號特征標記條件,?j表示該條件下電力告警信號特征的預設實值結果,在上述物理量的支持下,聯(lián)立式(5),可將識別閾值表達式定義為:
式中,k表示已知的特征數(shù)據(jù)判別項指標。通常情況下,在tesseract 訓練引擎的支持下,指標k的取值結果始終不會大于自然常數(shù)e。
暫態(tài)行為處理是電力告警信號特征識別方法設計的末尾執(zhí)行環(huán)節(jié),在tesseract 訓練環(huán)境中,電網(wǎng)主機可以通過規(guī)劃電力告警信號特征存儲區(qū)間的方式,確定暫態(tài)識別行為的實際執(zhí)行能力[15-16]。
設xα表示電力告警信號暫態(tài)行為標記系數(shù)為α時待識別特征指標參量,xˉ表示待識別特征指標參量的平均值,α表示信號特征參量的實際識別權限,b表示實時系數(shù)項,φ表示既定的信號數(shù)據(jù)識別特征值。在上述物理量的支持下,聯(lián)立式(6),可將暫態(tài)行為處理結果表示為:
為驗證基于tesseract 訓練的電力告警信號特征識別方法實際應用價值,設計如下對比實驗。通過人工干預方式模擬電力告警信號的傳輸行為,選取兩臺配置完全相同的電網(wǎng)主機作為實驗對象,其中實驗組主機配置基于tesseract 訓練的特征識別方法,對照組主機配置多特征組合識別方法。具體的實驗環(huán)境配置流程如圖1 所示。
圖1 實驗環(huán)境配置流程圖
電力告警信號峭度指標極值差能夠反映電網(wǎng)主機對告警信號特征識別準確性,一般來說,極值差水平越低,表示電網(wǎng)主機對于告警信號特征的識別準確性越強,反之則越弱。表1 記錄電力告警信號峭度指標極值差的理想數(shù)值水平。
表1 電力告警信號峭度極值差的理想數(shù)值
分析表1可知,隨著實驗時間的延長,峭度指標極大值、極小值均表現(xiàn)出不斷波動的數(shù)值變化趨勢。當時間取值為20 min時,峭度極值差的數(shù)值水平最大,達到了13.4°/V,當時間取值為40 min時,峭度極值差的數(shù)值水平最小,達到了7.5°/V,二者差值為5.9°/V。
圖2 為實驗組、對照組電力告警信號峭度指標極大值的實驗數(shù)值結果。
圖2 電力告警信號峭度指標極大值
圖3 為實驗組、對照組電力告警信號峭度指標極小值的實驗數(shù)值結果。
圖3 電力告警信號峭度指標極小值
對照圖2、圖3,計算實驗組、對照組電力告警信號峭度指標的實際極值差結果,具體數(shù)值如表2所示。
表2 電力告警信號峭度極值差的實際數(shù)值
對比表1、表2 可知,當時間取值為50 min 時,實驗組電力告警信號峭度極值差達到最大值8.3 °/V,與理想最大值13.4°/V 相比,下降了5.1°/V。當時間取值為40 min 時,對照組電力告警信號峭度極值差達到最大值21.8°/V,與理想最大值13.4°/V 相比,上升了8.4°/V。
與多特征組合識別方法相比,新型識別方法在tesseract 訓練引擎作用下,分別對字符行區(qū)域與列區(qū)域進行準確識別,通過閾值判別方式完成暫態(tài)行為處理。從實用性角度來看,隨著這種新型識別方法應用,電力告警信號峭度極值差的實際數(shù)值水平得到了較好控制,符合增強電網(wǎng)主機對于告警信號特征識別準確性的實際應用需求。