• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      相似歷史數(shù)據(jù)段高效查找方法研究*

      2022-04-07 03:43:16龐向坤張緒輝
      計算機與數(shù)字工程 2022年3期
      關鍵詞:歷史數(shù)據(jù)二進制相似性

      龐向坤 高 嵩 張緒輝 顏 慶

      (國網(wǎng)山東省電力公司電力科學研究院 濟南 250002)

      1 引言

      隨著新能源發(fā)電規(guī)模不斷擴大,其間歇性、波動性等為電網(wǎng)穩(wěn)定運行帶來了日益嚴峻的挑戰(zhàn)。由于火電機組實發(fā)功率具有高度的可調節(jié)性,其對電網(wǎng)多類型機組協(xié)調及穩(wěn)定運行發(fā)揮日益突出的支撐作用。因此,提高火電機組的平穩(wěn)運行水平,在一定意義上說就是保障新能源消納,促進了電網(wǎng)多類型機組協(xié)調和穩(wěn)定運行。

      火電機組運行過程中,經(jīng)常出現(xiàn)運行異常導致機組降負荷情況發(fā)生,降低了火電機組負荷調節(jié)能力。關于火電機組運行異常監(jiān)控已經(jīng)有眾多的研究結果[1~5],但在發(fā)現(xiàn)生產(chǎn)異常后,及時找出發(fā)現(xiàn)異常根源,提高異常處理效率,則是保障機組恢復生產(chǎn)能力的重要環(huán)節(jié),目前相關研究結果較少。

      當前,火力發(fā)電生產(chǎn)過程的信息化和智能化建設不斷深入,海量生產(chǎn)過程數(shù)據(jù)被采集并存儲。鑒于歷史數(shù)據(jù)中包含有豐富的可用信息,因此,歷史數(shù)據(jù)挖掘得到的信息,既可以用于火力發(fā)電過程管理與優(yōu)化,也可以應用于火力發(fā)電過程監(jiān)控等,對于提高火力發(fā)電生產(chǎn)效益和安全性等具有重要的意義,如文獻[6~9]均從數(shù)據(jù)挖掘方法出發(fā),來分析生產(chǎn)過程異?;蚬收显?。但是由于歷史數(shù)據(jù)的維度急劇升高且受噪聲影響,查找歷史數(shù)據(jù)相似數(shù)據(jù)段主要面臨查詢效率不高和準確性較低的問題。

      為了提高歷史數(shù)據(jù)查詢效率和準確性,近年來研發(fā)的技術方法主要是通過簡化數(shù)據(jù)結構保留主要特征,實現(xiàn)降低原始數(shù)據(jù)維度的目的。文獻[10]提出一種基于分段聚合近似(PAA)的時間序列早期分類方法,運用PAA 對時間序列樣本進行維數(shù)約簡。文獻[11]提出了符號聚合近似轉換(SAX)技術,主要是基于分段聚合近似(PAA)技術進行數(shù)據(jù)化簡并離散化,將各個數(shù)據(jù)段用其均值表示,然后采用預設斷點將PAA 系數(shù)轉換為SAX 符號。文獻[12]定義了極值噪聲和轉折點,在此基礎上提出了基于轉折點的分段線性表示方法。文獻[13]提出了剪輯技術或定極限技術,實現(xiàn)對數(shù)據(jù)的壓縮。文獻[14]提出基于形態(tài)特征的時間序列符號聚合近似方法,綜合考慮分段序列的均值和數(shù)據(jù)分布的形態(tài)特征,并且通過論域轉化對它們實現(xiàn)符號轉化。文獻[15]針對PAA 算法對每一區(qū)間都平均對待所存在的不足,提出一種基于小波熵的時間序列分段聚合近似表示(PAA_WE)方法。

      雖然上述方法均存在其應用場景,但是也存在一定的不足。例如,PAA技術雖然可以降低數(shù)據(jù)維度,但沒有考慮數(shù)據(jù)段的趨勢信息。在充分借鑒國內外現(xiàn)有相似數(shù)據(jù)段查找方法的基礎上,本文采用了一種新型的數(shù)據(jù)表示方法,該方法將原歷史數(shù)據(jù)轉換為二進制表示形式,采用分段聚合近似(PAA)方法和擴展的剪輯技術合并了原歷史數(shù)據(jù)的趨勢和數(shù)值信息,實現(xiàn)了數(shù)據(jù)降維,提高了相似特征數(shù)據(jù)段查找效率和精度。

      2 所提方法

      本文以實現(xiàn)異常根源診斷為目的,充分利用所選取的目標數(shù)據(jù)集中各段數(shù)據(jù)的異常根源信息,當生產(chǎn)運行過程中異常狀況出現(xiàn)時,通過查找當前異常數(shù)據(jù)段在目標數(shù)據(jù)集中的相似數(shù)據(jù)段,以其中的異常數(shù)據(jù)段為參考,確定當前運行異常的出現(xiàn)的根源。

      2.1 時間序列的符號表示

      本文采用了一種數(shù)據(jù)的二進制表示方法[16],該方法是將給定的數(shù)據(jù)序列數(shù)據(jù)轉換成長度為2ω的布爾符號表示序列,此處ω表示數(shù)據(jù)序列PAA的分段數(shù)。在布爾符號表示過程中,每一個PAA子段采用兩位布爾數(shù)表示,其第一位布爾數(shù)值表示數(shù)據(jù)幅值信息,通過比較數(shù)據(jù)段前幅值與其均值得到;第二位布爾數(shù)值表示趨勢信息,通過比較數(shù)據(jù)段前數(shù)值與最近點的位置得到。對歷史運行數(shù)據(jù)X,以單步滑動窗口法得到X的子序列X[i],然后采用PAA 方法對X[i]進行分段,對每個子數(shù)據(jù)段按如下方式進行其趨勢和數(shù)值信息的符號轉換[16]:

      式(1)、(2)中,xˉk為時間序列X分段后第k子數(shù)據(jù)段的樣本均值,Xˉi為X[i]的均值;式(3)中,xˉk+1為時間序列X分段后第k+1 個子數(shù)據(jù)段的樣本均值,即xˉk+1=(xk+1+xk+2)/2。

      數(shù)據(jù)二進制符號表示后,對以相應結果進行融合,數(shù)據(jù)幅值信息均以二進制序列奇數(shù)位表示,趨勢信息均以二進制序列偶數(shù)位表示,X[i]對應的二進制序列以B[i]表示,B[i]={b(i·ω+1),b(i·ω+2),…,b(i·ω+ω)},具體轉換過程如圖1示例。

      圖1 數(shù)據(jù)序列轉換為二進制序列過程示意圖

      2.2 形成目標數(shù)據(jù)集

      完成二進制數(shù)據(jù)轉換后,得到BC和B[i] ,i∈[1,N-1],為了篩選出相關性較高的子數(shù)據(jù)段,可以指定相似性閾值ε,將BC和B[i]相似性大于閾值ε的子序列對應的X[i]提取出來,形成目標數(shù)據(jù)集。

      二進制數(shù)據(jù)序列BC和B[i]的相似性采用符號相似系數(shù)度量,在此,BC={bc(1),bc(2),…,bc(ω)},B[i]={b(i·ω+1),b(i·ω+2),…,b(i·ω+ω)},其符號相關系數(shù)計算公式如下:

      式(3)中,α和β分別是對數(shù)值信息和趨勢信息所加的權重,滿足0 <α,β<1。α和β的取值可根據(jù)需要查找的異常數(shù)據(jù)段的特征進行選擇。式(3)中,分子分別為二進制序列的奇數(shù)位和偶數(shù)位的漢明距離[17]。式(3)中,符號⊕表示布爾異或運算,且ρb的取值范圍為[0,1]。

      最后,將ρb(i)大于閾值ε的X[i]提取出來,設共有L組滿足條件,則組成的時間序列候選集,候選集Cs中的數(shù)據(jù)維數(shù)將遠小于,因此將大幅度縮小相似數(shù)據(jù)段查找范圍,使得查找速度大幅提高。為了避免單步滑窗提取X[i]所帶來的ρb(i)在X局部取過多較大值,造成候選數(shù)據(jù)集維數(shù)過高的問題,選取ρb(i)大于閾值ε時,應滿足任意兩個選定的相關系數(shù)ρb(i)和ρb(j)之間滿足 ||i-j>ω2。

      2.3 確定相似異常數(shù)據(jù)段

      采用二進制序列表示原數(shù)據(jù),必然造成式(3)中的相似性計算結果較為寬泛,因此需要對候選集中數(shù)據(jù)進一步與當前異常數(shù)據(jù)進行相似性分析。

      對Xl[i]={x(i·ω+1),x(i·ω+2),…,x(i·ω+ω)},其與的皮爾遜相關系數(shù)計算公式如下:

      對于式(6)中得到的計算結果,按從大到小的順序進行排序,相關系數(shù)越大則時間序列的相似程度越高,實現(xiàn)查找相似時間序列的目標。

      3 仿真案例

      為了驗證所述方法的準確性和高效性,分別構造仿真案例予以說明。仿真過程中,采用MATLAB M語言實現(xiàn)該算法,使用的計算機中央處理器(CPU)為Intel 酷睿I5-4200M,主頻2.5GHz(最大睿頻3.1GHz),運行內存為4GB,操作系統(tǒng)為Windows 7 64位旗艦版。

      3.1 準確性驗證仿真

      首先,構造子數(shù)據(jù)段長度和幅值隨機的仿真數(shù)據(jù),所構造數(shù)據(jù)的總長度為N=18000,數(shù)據(jù)趨勢如圖2 所示。將所構造的仿真數(shù)據(jù)看作是歷史數(shù)據(jù)X,為了驗證算法的有效性,以圖2 中是紅色數(shù)據(jù)段作為當前異常數(shù)據(jù)段XC,具體如圖3所示,將兩段綠色數(shù)據(jù)段設定為與紅色數(shù)據(jù)段高度相似的數(shù)據(jù)段。

      圖2 所構造的仿真數(shù)據(jù)趨勢曲線

      圖3 當前仿真數(shù)據(jù)圖

      將仿真數(shù)據(jù)X與當前異常數(shù)據(jù)段XC二進制符號轉換,根據(jù)式(2)和式(3)對每個子序列X[i]的數(shù)值信息和趨勢信息分別進行符號轉換后進行合并,得到BC和B[i]。根據(jù)式(3)計算每個序列對(BC,B[i])之間的相關系數(shù)ρb(i),設ε=0.7,按照該閾值篩選二進制子序列。依據(jù)所選的二進制子序列,提取仿真數(shù)據(jù)X對應的數(shù)據(jù)段形成候選集Cs。

      依據(jù)式(6)計算候選集Cs中每個子數(shù)據(jù)段與XC的皮爾遜相關系數(shù),且設定皮爾遜相關系數(shù)的閾值為0.99,選出最終相似的時間序列對,并按相似性數(shù)值進行降序排列。在此,選擇相似性最高的前三組作為最終選擇的數(shù)據(jù)段,結果如圖4 所示,其中圖4(a)為當前異常數(shù)據(jù)段XC本身,即圖2 中的紅色數(shù)據(jù)段,圖4(b)為圖4中的第二個綠色數(shù)據(jù)段,圖4(c)為圖4中的第一個綠色數(shù)據(jù)段。

      圖4 結果集中的時間序列對

      由本仿真案例所查找到的相似數(shù)據(jù)段和仿真數(shù)據(jù)段的設計結構可知,本文所述的方法能夠準確查找出相似數(shù)據(jù)段。

      3.2 高效性仿真驗證

      為了驗證所述方法的高效性,在此通過構造不同長度的仿真數(shù)據(jù),分別以本文所述方法和皮爾遜相關系數(shù)直接查找相似數(shù)據(jù)段方法做耗時對比驗證,結果如表1所示。

      表1 所提方法與皮爾森相關系數(shù)的效率比較

      通過對比仿真結果可知,在相同標準下,本文所述的方法在查詢速度上有大幅度提高。

      4 結語

      當前新能源大規(guī)模并網(wǎng)條件下,電網(wǎng)需要在多類型機組協(xié)調下運行,火電機組對電網(wǎng)多類型機組協(xié)調發(fā)揮至關重要的作用。在該背景下,本文研究了用以機組運行異常根源診斷的歷史數(shù)據(jù)相似數(shù)據(jù)段查找技術。通過計算當前異常數(shù)據(jù)段與原過程數(shù)據(jù)的二進制相似系數(shù),形成目標數(shù)據(jù)集,進而通過皮爾遜相關系數(shù)查找目標數(shù)據(jù)集中與當前異常數(shù)據(jù)段高度相似的異常數(shù)據(jù)段,實現(xiàn)相似數(shù)據(jù)段查找的目的。通過仿真表明,該方法具有良好的準確性和高效性,對提火電機組運行水平以支撐電網(wǎng)多類型機組協(xié)調運行具有一定的意義。

      猜你喜歡
      歷史數(shù)據(jù)二進制相似性
      基于充電策略估算動力電池容量的方法
      汽車電器(2025年1期)2025-02-03 00:00:00
      一類上三角算子矩陣的相似性與酉相似性
      用二進制解一道高中數(shù)學聯(lián)賽數(shù)論題
      基于設備PF性能曲線和設備歷史數(shù)據(jù)實現(xiàn)CBM的一個應用模型探討
      智能制造(2021年4期)2021-11-04 08:54:36
      基于故障歷史數(shù)據(jù)和BP神經(jīng)網(wǎng)絡的接地選線方案研究
      淺析當代中西方繪畫的相似性
      河北畫報(2020年8期)2020-10-27 02:54:20
      有趣的進度
      二進制在競賽題中的應用
      基于Hadoop技術實現(xiàn)銀行歷史數(shù)據(jù)線上化研究
      低滲透黏土中氯離子彌散作用離心模擬相似性
      昌邑市| 水城县| 平定县| 苏州市| 汝南县| 都昌县| 桑植县| 宜州市| 锦屏县| 布尔津县| 元朗区| 迁西县| 延庆县| 铁力市| 青阳县| 枞阳县| 福安市| 奉贤区| 偃师市| 平潭县| 安西县| 香格里拉县| 桑日县| 宣汉县| 郑州市| 高碑店市| 民乐县| 神农架林区| 龙口市| 邢台县| 白玉县| 彰武县| 合阳县| 苍山县| 务川| 沙雅县| 西峡县| 延边| 登封市| 蒲江县| 东光县|