• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      電站歷史數(shù)據(jù)缺失值填補(bǔ)策略研究

      2017-02-07 09:00:55李建強(qiáng)潘文凱陳星旭李世博
      電力科學(xué)與工程 2017年1期
      關(guān)鍵詞:方根電站聚類(lèi)

      李建強(qiáng),趙 凱,潘文凱,陳星旭,李世博

      (華北電力大學(xué) 能源動(dòng)力與機(jī)械工程學(xué)院,河北保定071003)

      電站歷史數(shù)據(jù)缺失值填補(bǔ)策略研究

      李建強(qiáng),趙 凱,潘文凱,陳星旭,李世博

      (華北電力大學(xué) 能源動(dòng)力與機(jī)械工程學(xué)院,河北保定071003)

      針對(duì)電站數(shù)據(jù)庫(kù)存在數(shù)據(jù)缺失的問(wèn)題,提出了改進(jìn)的模糊聚類(lèi)缺失值填補(bǔ)算法,即支持向量回歸與遺傳算法優(yōu)化的模糊聚類(lèi)填補(bǔ)算法(SVR-OCSFCM)。對(duì)某600MW燃煤機(jī)組運(yùn)行數(shù)據(jù)用支持向量機(jī)回歸算法(SVR)、模糊聚類(lèi)優(yōu)化補(bǔ)全策略(OCS-FCM)與SVR-OCSFCM三種方法分別進(jìn)行單屬性和多屬性缺失值填補(bǔ)實(shí)驗(yàn),實(shí)驗(yàn)表明:同屬性缺失時(shí),算法性能隨缺失率增加而降低,相同缺失率時(shí)填補(bǔ)性能隨缺失屬性的增加而降低;SVR-OCSFCM由支持向量回歸和模糊聚類(lèi)算法共同約束估計(jì)值,具有較好的準(zhǔn)確性和有效性,缺失值填補(bǔ)性能優(yōu)于SVR和OCS-FCM算法,且對(duì)多屬性缺失數(shù)據(jù)填補(bǔ)具有較好的填補(bǔ)效果。

      缺失值;數(shù)據(jù)填補(bǔ);電站;模糊聚類(lèi)

      0 引言

      隨著電力工業(yè)的發(fā)展,電站過(guò)程數(shù)據(jù)庫(kù)復(fù)雜程度與數(shù)據(jù)量越來(lái)越大,促進(jìn)了數(shù)據(jù)挖掘在電站優(yōu)化中的應(yīng)用[1-2],數(shù)據(jù)預(yù)處理作為其不可或缺的基礎(chǔ)性工作,越來(lái)越受到重視。針對(duì)各實(shí)際領(lǐng)域的不同特點(diǎn)涌現(xiàn)出了不同的數(shù)據(jù)預(yù)處理思想與工具。就目前階段來(lái)看,數(shù)據(jù)預(yù)處理技術(shù)中研究最多的是“臟數(shù)據(jù)”的清理問(wèn)題,數(shù)據(jù)清理的主要方向集中在數(shù)據(jù)缺失值處理、噪聲數(shù)據(jù)的平滑處理以及異常數(shù)據(jù)的篩選處理等。數(shù)據(jù)缺失問(wèn)題在基于傳感器采集數(shù)據(jù)的發(fā)電廠普遍存在,嚴(yán)重阻礙了數(shù)據(jù)分析及挖掘在電站優(yōu)化領(lǐng)域的發(fā)展[3-5]。

      電站數(shù)據(jù)采集、存儲(chǔ)系統(tǒng)組成復(fù)雜,測(cè)點(diǎn)工作環(huán)境惡劣等多方原因能夠造成數(shù)據(jù)的缺失,主要分為:傳感器故障、數(shù)據(jù)傳輸故障、數(shù)據(jù)存儲(chǔ)故障、人的主觀因素等。數(shù)據(jù)的不完整性給數(shù)據(jù)挖掘過(guò)程、數(shù)據(jù)分析和研究帶來(lái)了重重困難,這些不完整的數(shù)據(jù)會(huì)導(dǎo)致分析結(jié)果發(fā)生偏置,建立錯(cuò)誤的數(shù)據(jù)挖掘模型,導(dǎo)致不準(zhǔn)確的挖掘結(jié)果,甚至?xí)`導(dǎo)用戶的決策,導(dǎo)致經(jīng)濟(jì)損失。

      針對(duì)電站歷史數(shù)據(jù)的缺失值處理問(wèn)題,很多研究者提出了面向不同方向的多種有效方法。文獻(xiàn)[6]基于線性插值原理對(duì)較短時(shí)間內(nèi)平穩(wěn)運(yùn)行過(guò)程的缺失數(shù)據(jù)進(jìn)行填補(bǔ),針對(duì)不穩(wěn)定工況采用遺傳自適應(yīng)加權(quán)類(lèi)平均值填補(bǔ)算法。文獻(xiàn)[7]采用粗糙集方法處理電站故障診斷系統(tǒng)中信號(hào)缺失問(wèn)題。文獻(xiàn)[8]運(yùn)用EM(PCA)算法處理燃燒系統(tǒng)中的缺失數(shù)據(jù),對(duì)不同缺失率的數(shù)據(jù)進(jìn)行了填補(bǔ),由于此算法的目的是減少缺失數(shù)據(jù)對(duì)數(shù)據(jù)空間重構(gòu)的影響,對(duì)缺失數(shù)據(jù)值本身的預(yù)測(cè)不是十分精確。

      電站歷史數(shù)據(jù)屬性參數(shù)眾多,缺失數(shù)據(jù)分布廣泛,以上研究一般用于單屬性數(shù)據(jù)缺失的處理,針對(duì)多屬性缺失數(shù)據(jù)涉及很少或應(yīng)用于多屬性缺失數(shù)據(jù)時(shí)性能下降明顯的問(wèn)題,本文提出了改進(jìn)的模糊聚類(lèi)缺失值填補(bǔ)算法,算法利用模糊聚類(lèi)優(yōu)化補(bǔ)全策略和支持向量回歸填補(bǔ)算法共同約束缺失數(shù)據(jù)的估計(jì)值,并利用遺傳算法尋找最優(yōu)模糊聚類(lèi)數(shù)c、模糊因子m的值,最終得到填補(bǔ)效果較理想的完整數(shù)據(jù)集。對(duì)某600 MW燃煤機(jī)組運(yùn)行數(shù)據(jù)進(jìn)行單屬性與多屬性缺失值填補(bǔ)實(shí)驗(yàn),結(jié)果表明該算法可以實(shí)現(xiàn)多屬性缺失值的填補(bǔ),驗(yàn)證了該方法的準(zhǔn)確性與有效性。

      1 改進(jìn)的模糊聚類(lèi)缺失值填補(bǔ)算法

      1.1 OCS-FCM算法

      將模糊C均值聚類(lèi)算法(FCM)應(yīng)用在缺失值填補(bǔ)中有4種策略[9],分別為:完整數(shù)據(jù)策略(Whole Data Strategy,WDS)、局部距離策略(Partial Distance Strategy,PDS)、優(yōu)化補(bǔ)全策略(Optimal Completion Strategy,OCS)以及最近模型策略(Nearest Prototype Strategy,NPS)。

      (1)完整數(shù)據(jù)策略。對(duì)缺失數(shù)據(jù)的處理方式屬于刪除法,其基本原理是當(dāng)數(shù)據(jù)集中的缺失值數(shù)量較少時(shí)采取刪除樣本的方法進(jìn)行聚類(lèi)。但這種方法會(huì)造成信息的丟失。

      (2)局部距離策略。僅忽略缺失樣本中的缺失屬性,對(duì)缺失樣本中的完整屬性按比例進(jìn)行樣本與聚類(lèi)中心的距離。該算法與經(jīng)典FCM算法收斂性一致。

      (3)優(yōu)化補(bǔ)全策略。將缺失數(shù)據(jù)的填補(bǔ)看作優(yōu)化問(wèn)題,在迭代過(guò)程中給出缺失數(shù)據(jù)的估計(jì)值,其收斂性與經(jīng)典FCM算法收斂性一致。

      (4)最近模型策略。在每次迭代中將缺失數(shù)據(jù)用距離最臨近的數(shù)據(jù)代替。

      經(jīng)過(guò)理論分析及數(shù)據(jù)實(shí)驗(yàn)確定了OCS-FCM算法對(duì)缺失數(shù)據(jù)填補(bǔ)效果最佳[9],首先介紹OCS-FCM算法的基本原理。

      假設(shè)數(shù)據(jù)樣本集合為X={x1,x2,x3,…,xn},其中xk為X數(shù)據(jù)集中第k個(gè)s維的數(shù)據(jù)向量;xkj為xk向量中第j個(gè)值,1≤j≤s,1≤k≤n。數(shù)據(jù)集合X中包含缺失值,以NA表示,令:

      (1)

      XM為缺失值數(shù)據(jù)集;M為缺失值的個(gè)數(shù)。舉例說(shuō)明,令s=2,n=4,數(shù)據(jù)集設(shè)為:

      (2)

      則Xm={x12,x41,x43}。

      OCS-FCM算法可以總結(jié)為以下步驟:

      初始化:確定模糊因子m,聚類(lèi)數(shù)目c,最大迭代次數(shù)tmax或收斂閾值ε并且滿足:10,模糊因子m被證明在[1.5,2.5]區(qū)間時(shí)聚類(lèi)算法表現(xiàn)最好[10],m一般取值為2。初始化缺失值XM,初始化聚類(lèi)中心V0。

      步驟一:計(jì)算(更新)隸屬度矩陣U,

      (3)

      隸屬度矩陣U滿足條件:

      (4)

      步驟二:更新聚類(lèi)中心V,

      (5)

      步驟三:若‖v(r+1)-v(r)‖<ε成立或達(dá)到最大迭代次數(shù),則算法停止,否則轉(zhuǎn)到步驟四。

      步驟四:計(jì)算缺失數(shù)據(jù)的填補(bǔ)值。

      (6)

      步驟五:令r=r+1,轉(zhuǎn)到步驟一。

      可以看出,OCS-FCM算法運(yùn)行中會(huì)對(duì)缺失數(shù)據(jù)進(jìn)行估計(jì),得到補(bǔ)全的數(shù)據(jù)集。

      1.2 改進(jìn)的OCS-FCM算法

      在本文的模型中,模糊聚類(lèi)算法用來(lái)區(qū)分缺失數(shù)據(jù)之間的差異并依據(jù)它們的特性對(duì)這些數(shù)據(jù)進(jìn)行分類(lèi),應(yīng)用OCS-FCM算法對(duì)缺失數(shù)據(jù)進(jìn)行估計(jì)并進(jìn)行模糊聚類(lèi),這使得補(bǔ)全后相似的數(shù)據(jù)聚成一簇。然后在每個(gè)類(lèi)別中分別以未缺失數(shù)據(jù)為訓(xùn)練集對(duì)支持向量回歸算法進(jìn)行訓(xùn)練,在相似數(shù)據(jù)集中支持向量回歸算法有更優(yōu)的學(xué)習(xí)能力[11],訓(xùn)練后的支持向量回歸分別對(duì)各類(lèi)中的缺失數(shù)據(jù)進(jìn)行估計(jì),遺傳算法優(yōu)化聚類(lèi)參數(shù)c、m,最終得到最優(yōu)的缺失數(shù)據(jù)估計(jì)值。缺失數(shù)據(jù)填補(bǔ)模型設(shè)計(jì)如圖1所示。

      支持向量回歸與遺傳算法優(yōu)化的模糊聚類(lèi)填補(bǔ)算法運(yùn)行步驟為:

      (1)設(shè)置c、m初始值,應(yīng)用OCS-FCM算法對(duì)數(shù)據(jù)集進(jìn)行缺失值填補(bǔ)。填補(bǔ)結(jié)果記為X。

      (2)在所得的各聚類(lèi)空間中分別應(yīng)用支持向量回歸估計(jì)缺失值。該過(guò)程中聚類(lèi)空間內(nèi)的完整數(shù)據(jù)作為訓(xùn)練集訓(xùn)練支持向量回歸算法,缺失數(shù)據(jù)作為估計(jì)目標(biāo)進(jìn)行填補(bǔ),填補(bǔ)結(jié)果記為Y。

      (3)對(duì)參數(shù)c、m應(yīng)用遺傳算法優(yōu)化并重復(fù)(1)、(2)兩步驟,計(jì)算誤差函數(shù)Eerror=(X-Y)2,誤差函數(shù)最小時(shí)對(duì)應(yīng)的c、m為最優(yōu)分類(lèi)參數(shù)。取此時(shí)X與Y的平均值作為最優(yōu)填補(bǔ)值。

      (4)應(yīng)用最優(yōu)填補(bǔ)值,獲得完整數(shù)據(jù)集。

      圖1 SVR-OCSFCM算法填補(bǔ)缺失值過(guò)程

      2 單屬性缺失值填補(bǔ)實(shí)驗(yàn)

      實(shí)驗(yàn)對(duì)象為某600 MW燃煤發(fā)電機(jī)組,從SIS數(shù)據(jù)庫(kù)中選取負(fù)荷、省煤器出口氧量、凝汽器真空和供電煤耗為數(shù)據(jù)集,采樣時(shí)間間隔為1 min。在原始數(shù)據(jù)中通過(guò)刪除含缺失值的行構(gòu)造不含缺失值的完整數(shù)據(jù)集,最終確定數(shù)據(jù)集包含1 000組數(shù)據(jù)。數(shù)據(jù)集部分?jǐn)?shù)據(jù)如表1所示。

      電站運(yùn)行數(shù)據(jù)測(cè)點(diǎn)眾多,各屬性數(shù)據(jù)數(shù)量級(jí)、量綱不同,因此需要對(duì)數(shù)據(jù)進(jìn)行歸一化處理,將數(shù)值范圍變換為[0,1],以提高算法的泛化能力,提高收斂速度,避免對(duì)度量單位選擇的依賴性[12]。歸一化公式為:

      (7)

      本文采取均方根誤差(Root Mean Square Error,ERMSE)和填補(bǔ)準(zhǔn)確度(Accuracy,A)去評(píng)價(jià)提出的算法的優(yōu)越性,均方根誤差是缺失值填補(bǔ)研究中應(yīng)用最廣泛的評(píng)價(jià)標(biāo)準(zhǔn),其函數(shù)如下:

      表1 數(shù)據(jù)集樣本

      (8)

      式中:xr為真實(shí)值;xi為算法的填補(bǔ)值;n為缺失值的數(shù)目;ERMSE值越小說(shuō)明算法填補(bǔ)質(zhì)量越高[13]。

      填補(bǔ)準(zhǔn)確度A評(píng)價(jià)函數(shù)能夠計(jì)算出填補(bǔ)值中符合容忍度要求的值所占的比例,其函數(shù)如下:

      (9)

      式中:n為缺失值數(shù)量;nt為正確估計(jì)值數(shù)量,指在容忍度范圍內(nèi)的填補(bǔ)值數(shù)量。本文將容忍度設(shè)置為10%,即填補(bǔ)值在真實(shí)值的±10%誤差范圍內(nèi)時(shí)此填補(bǔ)值被視為正確估計(jì)值。

      首先根據(jù)情況選定缺失屬性,通過(guò)隨機(jī)刪除的方法構(gòu)造缺失率分別為1%、3%、5%、10%、15%、20%、25%和30%的缺失數(shù)據(jù)集。在不同缺失率下分別應(yīng)用OCS-FCM、SVR和SVR-OCSFCM三種算法進(jìn)行實(shí)驗(yàn),并對(duì)各算法得到的實(shí)驗(yàn)結(jié)果根據(jù)均方根誤差和填補(bǔ)準(zhǔn)確度進(jìn)行分析比較。

      以省煤器出口氧量為填補(bǔ)目標(biāo),構(gòu)造各比率的缺失數(shù)據(jù)集,測(cè)試三種算法的性能。為充分表現(xiàn)各算法的性能,用隨機(jī)生成缺失值的方式為每個(gè)缺失率構(gòu)造10個(gè)缺失數(shù)據(jù)集,算法應(yīng)用于各個(gè)數(shù)據(jù)集所得結(jié)果取平均值作為最終的實(shí)驗(yàn)結(jié)果,綜合各實(shí)驗(yàn)結(jié)果進(jìn)行分析對(duì)比。

      從圖2中可以看出SVR-OCSFCM算法在所有缺失率下均方根誤差均最小,填補(bǔ)效果最優(yōu),隨缺失率的增加,均方根誤差增大。從算法原理上看,SVR-OCSFCM由支持向量回歸和模糊聚類(lèi)算法共同約束估計(jì)值,缺失值填補(bǔ)性能提高,均方根誤差降低。

      圖2 各算法填補(bǔ)結(jié)果的均方根誤差

      缺失值填補(bǔ)準(zhǔn)確度隨缺失率的增大而降低,如圖3所示,當(dāng)缺失率為1%時(shí),三種算法的填補(bǔ)準(zhǔn)確率都能達(dá)到60%以上,說(shuō)明在缺失少量數(shù)據(jù)時(shí)各算法填補(bǔ)性能均較好。缺失率在3%~15%時(shí)SVR算法填補(bǔ)準(zhǔn)確率明顯優(yōu)于OCS-FCM算法,缺失率大于15%時(shí)SVR與OCS-FCM算法的填補(bǔ)準(zhǔn)確率相差不大。在所有缺失情況下,SVR-OCSFCM填補(bǔ)效果都明顯好于另兩種算法。

      圖3 不同算法填補(bǔ)結(jié)果的準(zhǔn)確度

      從以上均方根誤差與填補(bǔ)準(zhǔn)確率分析可知,SVR-OCSFCM填補(bǔ)效果優(yōu)于另兩種算法,為更加直觀展示該算法實(shí)際填補(bǔ)效果,構(gòu)造缺失率為10%,且包括多段連續(xù)缺失的數(shù)據(jù)集,應(yīng)用SVR-OCSFCM算法進(jìn)行填補(bǔ)。圖4為其中一段連續(xù)缺失27組數(shù)據(jù)的填補(bǔ)結(jié)果與真實(shí)值的對(duì)比結(jié)果,可看出填補(bǔ)值與真實(shí)值相關(guān)度較高,滿足數(shù)據(jù)填補(bǔ)要求。

      圖4 SVR-OCSFCM算法填補(bǔ)結(jié)果與真實(shí)值對(duì)比

      3 多屬性缺失值填補(bǔ)實(shí)驗(yàn)

      由SVR-OCSFCM算法的原理分析可知,步驟(1)中OCS-FCM算法能夠在多屬性數(shù)據(jù)缺失的情況下對(duì)缺失值進(jìn)行估計(jì);步驟(2)中支持向量回歸算法依次以各缺失參數(shù)為目標(biāo)屬性進(jìn)行算法訓(xùn)練以及缺失值填補(bǔ),因此SVR-OCSFCM算法能夠應(yīng)用于多屬性缺失數(shù)據(jù)的同步填補(bǔ)。

      原始數(shù)據(jù)集共有4個(gè)屬性參數(shù),多屬性缺失值填補(bǔ)實(shí)驗(yàn)中設(shè)定氧量、供電煤耗為兩屬性缺失,設(shè)定氧量、供電煤耗和凝汽器真空為三屬性缺失,以及四屬性缺失。按各缺失率構(gòu)造實(shí)驗(yàn)數(shù)據(jù),應(yīng)用SVR-OCSFCM算法進(jìn)行缺失值填補(bǔ)實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如圖5所示??梢钥闯鰡螌傩匀笔闆r下均方根誤差最小,隨缺失屬性的增加均方根誤差增大;但兩屬性缺失與三屬性缺失情況下均方根誤差增加不明顯,且低缺失率下與單屬性缺失相差不大;四屬性缺失情況下均方根誤差明顯大于其余三種情況;但在缺失率較低時(shí)(小于3%)四種缺失情況的均方根誤差都較低(0.05至0.15之間),且增大不明顯。

      圖5 多屬性缺失值填補(bǔ)均方根誤差

      如圖6所示,相同缺失率時(shí)填補(bǔ)準(zhǔn)確度隨缺失屬性的增加而降低。缺失率低時(shí)各屬性缺失填補(bǔ)準(zhǔn)確度較高:缺失率為1%,填補(bǔ)準(zhǔn)確度均高于58%;缺失率為3%,填補(bǔ)準(zhǔn)確度均高于47%。

      圖6 多屬性缺失值填補(bǔ)準(zhǔn)確度

      從算法機(jī)理上分析,缺失屬性的增多使得步驟(1)中OCS-FCM算法需要估計(jì)的屬性數(shù)據(jù)增加,輔助屬性減少,造成聚類(lèi)結(jié)果準(zhǔn)確性降低,當(dāng)數(shù)據(jù)集中各屬性都存在缺失且缺失數(shù)據(jù)大時(shí),聚類(lèi)結(jié)果更加偏離真實(shí)情況。缺失屬性的增加使得缺失值在數(shù)據(jù)集分布更廣泛,聚類(lèi)結(jié)果中完整數(shù)據(jù)組減少,即支持向量回歸訓(xùn)練數(shù)據(jù)減少導(dǎo)致學(xué)習(xí)能力下降,對(duì)缺失數(shù)據(jù)估計(jì)準(zhǔn)確性降低。綜合來(lái)看,缺失屬性多且卻缺失率高時(shí)SVR-OCSFCM算法填補(bǔ)效果變差,但缺失屬性多缺失率較低時(shí)仍然可以較好的填補(bǔ)缺失值。

      在實(shí)際應(yīng)用中多屬性缺失值填補(bǔ)方法具有很大的優(yōu)勢(shì),面對(duì)龐大的含缺失數(shù)據(jù)的數(shù)據(jù)庫(kù)多屬性同步填補(bǔ)方法能夠節(jié)省用戶大量的人力、物力以及時(shí)間,能夠明顯提高數(shù)據(jù)預(yù)處理速度。

      4 結(jié)論

      本文闡述了數(shù)據(jù)缺失值相關(guān)的理論,包括缺失數(shù)據(jù)產(chǎn)生的原因及缺失數(shù)據(jù)處理的必要性,介紹了模糊聚類(lèi)優(yōu)化補(bǔ)全策略,為提高缺失值填補(bǔ)效率,根據(jù)電站數(shù)據(jù)的缺失值分布特點(diǎn),提出了支持向量回歸與遺傳算法優(yōu)化的模糊聚類(lèi)填補(bǔ)算法。模糊聚類(lèi)算法用來(lái)區(qū)分缺失數(shù)據(jù)之間的差異并依據(jù)它們的特性對(duì)這些數(shù)據(jù)進(jìn)行分類(lèi),應(yīng)用OCS-FCM算法對(duì)缺失數(shù)據(jù)進(jìn)行估計(jì)并進(jìn)行模糊聚類(lèi),在每個(gè)類(lèi)別中分別以未缺失數(shù)據(jù)為訓(xùn)練集對(duì)支持向量回歸算法進(jìn)行訓(xùn)練,訓(xùn)練后的支持向量回歸分別對(duì)各類(lèi)中的缺失數(shù)據(jù)進(jìn)行估計(jì),最終得到最優(yōu)的缺失數(shù)據(jù)估計(jì)值。

      對(duì)某600MW燃煤機(jī)組運(yùn)行數(shù)據(jù)用SVR、OCS-FCM與SVR-OCSFCM三種方法分別進(jìn)行單屬性與多屬性缺失值填補(bǔ)實(shí)驗(yàn),結(jié)果表明同屬性缺失時(shí),算法性能隨缺失率增加而降低,同缺失率時(shí)填補(bǔ)性能隨缺失屬性的增加而降低;相對(duì)于其他兩種算法,SVR-OCSFCM算法有更好的填補(bǔ)效果,驗(yàn)證了該算法的填補(bǔ)準(zhǔn)確性和有效性。

      [1] 王禹朋,閻維平,祝云飛,等.支持向量機(jī)理論與遺傳算法相結(jié)合的300MW機(jī)組鍋爐多目標(biāo)燃燒優(yōu)化[J].熱力發(fā)電,2015,44(10):91-96.

      [2] 余廷芳,李鵬輝.基于神經(jīng)網(wǎng)絡(luò)的NO_x燃煤鍋爐排放預(yù)測(cè)及優(yōu)化[J].熱力發(fā)電,2015,44(4):112-115.

      [3] 郝勝宣,宋宏,周曉峰.一種基于雙聚類(lèi)的缺失數(shù)據(jù)填補(bǔ)方法[J].計(jì)算機(jī)應(yīng)用研究,2015,32(3):674-678.

      [4] 武森,馮小東,單志廣.基于不完備數(shù)據(jù)聚類(lèi)的缺失數(shù)據(jù)填補(bǔ)方法[J].計(jì)算機(jī)學(xué)報(bào),2012,35(8):1726-1738.

      [5] 韋鋼,王飛,張永健,等.負(fù)荷預(yù)測(cè)中歷史數(shù)據(jù)缺損處理[J].電力科學(xué)與工程,2004,20(1):16-19.

      [6] 任志偉,黃景濤,羅威,等.電站鍋爐缺失數(shù)據(jù)的遺傳自適應(yīng)填補(bǔ)方法[J].蘭州理工大學(xué)學(xué)報(bào),2013,39(2):75-79.

      [7] 于剛,徐治皋.電站故障診斷系統(tǒng)中信號(hào)缺失處理的粗糙集方法[J].華東電力,2004,32(6):1-4.

      [8] 張清宇,嚴(yán)建華,倪明江,等.實(shí)時(shí)燃燒診斷系統(tǒng)中缺失數(shù)據(jù)的處理[J].動(dòng)力工程學(xué)報(bào),2004,24(2):222-226.

      [9] HATHAWAY R J,BEZDEK J C.Fuzzy c-means clustering of incomplete data[J].IEEE Transactions on Systems Man & Cybernetics Part B Cyberneties.2001,31(5):735-744.

      [10] BEZDEK J C.Pattern recognition with fuzzy objective function algorithms [M].Plenum Press,1981.

      [11] NIU D,LIU D,WU D D.A soft computing system for day-ahead electricity price forecasting[J].Applied Soft Computing.2010,10(3):868-875.

      [12] HAN J,KAMBER M,PEI J.Data mining:concepts and techniques[M].Elsevier,2011:23-26.

      [13] 卜范玉,陳志奎,張清辰.基于聚類(lèi)和自動(dòng)編碼機(jī)的缺失數(shù)據(jù)填充算法[J].計(jì)算機(jī)工程與應(yīng)用,2015,51(18):13-17.

      Research on the Strategy of Missing Data Impuataion in Power Plant

      LI Jianqiang,ZHAO Kai,PAN Wenkai,CHEN Xingxu,LI Shibo

      (School of Energy Power and Mechanical Engineering,North China Electric Power University,Baoding 071003,China)

      An improved fuzzy clustering algorithm for the missing data imputation was presented for the problem of data missing in database of the power plant,which is the fuzzy clustering fill algorithm that optimized by the support vector regression and genetic algorithm (SVR-OCSFCM).The missing data imputation of a single attribute and multiple attributes for a 600 MW coal-fired unit was tested by using the support vector regression (SVR),optimal completion strategy of fuzzy clustering algorithm and SVR-OCSFCM.The results show that the performance of the algorithm of the same deleted attribute degrades with the increase of the deletion rate,and the performance of the algorithm at the same deletion rate degrades with the increase of the deleted attribute.SVR-OCSFCM constrains the estimation value by the support vector regression and fuzzy clustering algorithm,which makes the system safer and more efficient.The performance of SVR-OCSFCM is better than that of SVR and OCS-FCM,which has a good filling effect on the imputation of multiple attribute missing data.

      missing data; data imputation; power station; fuzzy clustering algorithm

      10.3969/j.ISSN.1672-0792.2017.01.008

      2016-09-05。

      中央高?;究蒲袠I(yè)務(wù)費(fèi)專(zhuān)項(xiàng)基金(916021007)。

      TP274.2

      1672-0792(2017)01-0043-06

      李建強(qiáng)(1976-),男,副教授,博士,主要從事數(shù)據(jù)挖掘在電站優(yōu)化運(yùn)行方面的研究工作。

      猜你喜歡
      方根電站聚類(lèi)
      方根拓展探究
      三峽電站再創(chuàng)新高
      低影響開(kāi)發(fā)(LID)在光伏電站中的應(yīng)用
      基于DBSACN聚類(lèi)算法的XML文檔聚類(lèi)
      均方根嵌入式容積粒子PHD 多目標(biāo)跟蹤方法
      揭開(kāi)心算方根之謎
      基于改進(jìn)的遺傳算法的模糊聚類(lèi)算法
      一種層次初始的聚類(lèi)個(gè)數(shù)自適應(yīng)的聚類(lèi)方法研究
      數(shù)學(xué)魔術(shù)
      自適應(yīng)確定K-means算法的聚類(lèi)數(shù):以遙感圖像聚類(lèi)為例
      沽源县| 甘南县| 隆回县| 河间市| 铅山县| 柳州市| 昆明市| 中山市| 三穗县| 伊通| 垦利县| 新泰市| 尤溪县| 伊川县| 永修县| 海安县| 通道| 开远市| 长白| 新密市| 额济纳旗| 育儿| 宣威市| 临沧市| 平果县| 鸡东县| 和田县| 万宁市| 滨海县| 武功县| 鄯善县| 安远县| 神木县| 南雄市| 崇文区| 龙口市| 东源县| 安塞县| 永泰县| 南充市| 张家港市|