• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      數(shù)據(jù)挖掘技術(shù)及其在建筑節(jié)能中的應(yīng)用①

      2017-12-30 07:18:35張運(yùn)楚韓懷寶楊紅娟楊崇濤王兆斌
      關(guān)鍵詞:建筑節(jié)能數(shù)據(jù)挖掘關(guān)聯(lián)

      張運(yùn)楚, 韓懷寶, 楊紅娟, 楊崇濤, 王兆斌

      1(山東建筑大學(xué) 信息與電氣工程學(xué)院,濟(jì)南 250101)2(山東省智能建筑技術(shù)重點(diǎn)實(shí)驗(yàn)室,濟(jì)南 250101)

      數(shù)據(jù)挖掘技術(shù)及其在建筑節(jié)能中的應(yīng)用①

      張運(yùn)楚1,2, 韓懷寶1, 楊紅娟1,2, 楊崇濤1, 王兆斌1

      1(山東建筑大學(xué) 信息與電氣工程學(xué)院,濟(jì)南 250101)2(山東省智能建筑技術(shù)重點(diǎn)實(shí)驗(yàn)室,濟(jì)南 250101)

      人類社會(huì)發(fā)展中的每次技術(shù)進(jìn)步都會(huì)催生一系列新的產(chǎn)品和服務(wù),但同時(shí)也導(dǎo)致資源和能源消耗的劇增.技術(shù)的進(jìn)步雖然提高了資源和能源的利用效率,但這種人均能耗不斷遞增的發(fā)展模式不可持續(xù).建筑節(jié)能除了關(guān)注供應(yīng)側(cè)的能效外,合理的導(dǎo)需求側(cè)用能是實(shí)現(xiàn)建筑節(jié)能的關(guān)鍵.要實(shí)現(xiàn)建筑節(jié)能模式由供應(yīng)側(cè)到需求側(cè)的轉(zhuǎn)變,就必須恰當(dāng)描述特定室內(nèi)環(huán)境下的用能特征,才能從需求側(cè)評估建筑能耗的合理性,進(jìn)而精確辨識(shí)能源浪費(fèi)的原因.建筑物自動(dòng)化系統(tǒng)和物聯(lián)網(wǎng)技術(shù)的快速發(fā)展與普及,獲取了大量特定室內(nèi)環(huán)境下的用能特征數(shù)據(jù),利用數(shù)據(jù)挖掘技術(shù)可以從這些低密度價(jià)值的建筑運(yùn)維數(shù)據(jù)中萃取節(jié)能線索和策略.本文簡述了數(shù)據(jù)挖掘技術(shù),綜述了各種挖掘方法在建筑節(jié)能中的應(yīng)用,并展望了發(fā)展趨勢.

      數(shù)據(jù)挖掘;算法;能耗分析;建筑節(jié)能;關(guān)聯(lián)挖掘;分類;聚類;神經(jīng)網(wǎng)絡(luò)

      隨著建筑行業(yè)的快速發(fā)展,建筑能耗問題越來越突出.建筑能耗在總能耗中的占比不斷上升,對能源造成巨大壓力.建筑運(yùn)行能耗作為建筑能耗的主要組成部分,浪費(fèi)尤為嚴(yán)重.據(jù)統(tǒng)計(jì),建筑運(yùn)行使用能耗占建筑生命周期總能耗的80%~90%[1,2].因此,實(shí)行建筑節(jié)能是發(fā)展資源節(jié)約型社會(huì)、實(shí)現(xiàn)經(jīng)濟(jì)的可持續(xù)發(fā)展的必要途徑.如何從龐大的數(shù)據(jù)與信息中快速、高效的提取出蘊(yùn)藏在其中的有用知識(shí),發(fā)現(xiàn)能源使用過程中的漏洞,使建筑用能更加合理高效,已成為行業(yè)面臨的關(guān)鍵問題.

      常用的建筑能耗數(shù)據(jù)分析方法主要是通過模擬軟件建模的方法定性、定量的分析建筑能耗指標(biāo),如DeST、EnergyPlus、DOE-2、TRNSYS、PKPMCHEC等能耗模擬軟件,該方法需要豐富的專業(yè)知識(shí)并建立精確的數(shù)學(xué)模型.但是,模擬假定的參數(shù)并不能反映實(shí)際運(yùn)行過程中的能耗,而且很多實(shí)際情況難以模擬[3].基于數(shù)據(jù)挖掘(Data Mining,DM)的能耗數(shù)據(jù)分析方法可以在沒有假設(shè)前提的情況下挖掘信息,其對于知識(shí)的發(fā)現(xiàn)是未知的、非直覺的、甚至是違背常理的.隨著建筑能耗數(shù)據(jù)的大量累積,數(shù)據(jù)挖掘在能耗分析中的作用越發(fā)凸顯.

      數(shù)據(jù)挖掘是一門交叉性學(xué)科,是從大數(shù)據(jù)中通過算法發(fā)現(xiàn)潛在有用知識(shí)的過程.它通過統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、專家系統(tǒng)、模式識(shí)別等方法和數(shù)據(jù)庫技術(shù)搜索隱藏的信息和規(guī)律,在工業(yè)、商業(yè)等各個(gè)領(lǐng)域已得到廣泛應(yīng)用.本文首先介紹了數(shù)據(jù)挖掘技術(shù)的主要方法,分析了數(shù)據(jù)挖掘技術(shù)在建筑節(jié)能中的典型應(yīng)用,最后展望了數(shù)據(jù)挖掘在建筑節(jié)能中的應(yīng)用前景.

      1 數(shù)據(jù)挖掘概述

      數(shù)據(jù)挖掘也常稱為數(shù)據(jù)庫知識(shí)發(fā)現(xiàn)(Knowledge Discovery in Database,KDD),是指從大量不完全、含噪、模糊、隨機(jī)的數(shù)據(jù)中,提取隱含在其中事先未知的潛在有用信息和知識(shí)的過程[4].簡言之,數(shù)據(jù)挖掘就是從存放在數(shù)據(jù)庫的大量數(shù)據(jù)中挖掘有用知識(shí)的過程.不同于專家系統(tǒng)僅僅對已有知識(shí)進(jìn)行學(xué)習(xí),數(shù)據(jù)挖掘可以從數(shù)據(jù)庫中發(fā)現(xiàn)隱含的新知識(shí),其挖掘的知識(shí)是未知的.通過數(shù)據(jù)挖掘可以發(fā)現(xiàn)數(shù)據(jù)庫中數(shù)據(jù)間隱藏的內(nèi)在關(guān)系,其挖掘的知識(shí)可用于歷史數(shù)據(jù)評價(jià)、發(fā)展趨勢預(yù)測、過程控制、信息管理并對決策產(chǎn)生影響.與一般數(shù)據(jù)分析處理技術(shù)相比,數(shù)據(jù)挖掘有以下特點(diǎn)[5]:(1)海量性,數(shù)據(jù)挖掘的數(shù)據(jù)源是海量的;(2)可用性,數(shù)據(jù)挖掘的知識(shí)是有用的,挖掘結(jié)果可用于行為指導(dǎo)和趨勢預(yù)測;(3)相對性,數(shù)據(jù)挖掘不是發(fā)現(xiàn)新的自然科學(xué)定理或數(shù)學(xué)公式,它發(fā)現(xiàn)的知識(shí)的相對的,有特定條件約束的,面向特定領(lǐng)域的.

      數(shù)據(jù)挖掘是數(shù)據(jù)庫技術(shù)與機(jī)器學(xué)習(xí)技術(shù)的結(jié)合,許多方法與機(jī)器學(xué)習(xí)方法相似.常用的數(shù)據(jù)挖掘方法主要包括關(guān)聯(lián)分析、線性回歸、分類分析、聚類分析、神經(jīng)網(wǎng)絡(luò)方法等.

      1.1 關(guān)聯(lián)挖掘(Association Mining)

      關(guān)聯(lián)挖掘也稱關(guān)聯(lián)規(guī)則挖掘(Association Rule Mining),是一種用于發(fā)現(xiàn)數(shù)據(jù)項(xiàng)后集間的依賴關(guān)系和關(guān)聯(lián)關(guān)系的數(shù)據(jù)挖掘方法.關(guān)聯(lián)規(guī)則是一種描述事件同時(shí)出現(xiàn)的規(guī)律和模式的方法,其描述了事件間同時(shí)出現(xiàn)的概率關(guān)系,推理所得結(jié)論并不具備因果關(guān)系.關(guān)聯(lián)挖掘方法通過設(shè)定最小支持度和最小置信度閾值來判定數(shù)據(jù)或信息間的關(guān)系,高于該閾值的關(guān)聯(lián)規(guī)則是我們感興趣的.關(guān)聯(lián)分析代表性算法有Apriori算法,FP-Tree算法及后期的一些改進(jìn)算法[6].

      1.2 多元線性回歸模型(Multivariable Linear Regression Model)

      多元線性回歸模型用于描述多個(gè)自變量與因變量間的相關(guān)關(guān)系.實(shí)際問題中,因變量的變化往往受到多個(gè)自變量的影響,當(dāng)自變量與因變量間呈線性關(guān)系時(shí),可用線性回歸模型研究.線性回歸模型常用于對歷史數(shù)據(jù)的分析、預(yù)測未來趨勢等.

      1.3 分類(Classification)

      分類屬于一種特殊的預(yù)測方法,通過對訓(xùn)練集中樣本特征或?qū)傩缘奶崛?、?xùn)練,建立特征的描述函數(shù)或模型,通過模型預(yù)測新數(shù)據(jù)所屬的類別.常用的分類方法包括決策樹法(Decision Tree)、支持向量機(jī)(Support Vector Machine,SVM)等.

      決策樹是經(jīng)典的分類方法,它通過自頂向下遞歸的方式構(gòu)造決策樹,是以實(shí)例為基礎(chǔ)的歸納學(xué)習(xí)方法.決策樹是一個(gè)預(yù)測模型,代表對象屬性和對象值間的映射關(guān)系,其結(jié)果為單一輸出.ID3算法、C4.5算法是有代表性的決策樹算法[7].支持向量機(jī)是一種通過尋求結(jié)構(gòu)風(fēng)險(xiǎn)最小化來提高學(xué)習(xí)機(jī)泛化能力的分類方法,通過在特征空間中找出最優(yōu)分類超平面使類間隔最大化.SVM分類結(jié)果由少數(shù)支持向量決定,因此具有較好的適應(yīng)能力與魯棒性,分類準(zhǔn)確度也較高.常用的支持向量機(jī)有LS-SVM,模糊SVM,多分類SVM等[8].

      1.4 聚類(Clustering)

      聚類是將具有較高相似度的類或簇聚集在一起,相異的類或簇分離開來的過程.相似度是基于描述對象的屬性值來計(jì)算的,距離是常用的度量方式.同一簇中的對象具有較高的相似度,可以被當(dāng)作一個(gè)整體對待.聚類屬于無監(jiān)督學(xué)習(xí)方法,按聚類原理的不同通??蓪⒕垲惙譃?劃分方法、層次方法、基于密度的方法、基于網(wǎng)格的方法、基于模型的方法等[9].

      1.5 神經(jīng)網(wǎng)絡(luò)(Neural Network)

      神經(jīng)網(wǎng)絡(luò)是模擬人腦工作過程而抽象出的數(shù)學(xué)模型.神經(jīng)網(wǎng)絡(luò)是由多個(gè)神經(jīng)元(節(jié)點(diǎn))組成的信息處理系統(tǒng),每個(gè)神經(jīng)元都是基本處理單元節(jié)點(diǎn),節(jié)點(diǎn)間的連接代表連接該信號(hào)的加權(quán)值或權(quán)重值.該過程可看作m維輸入到n維輸出的映射,神經(jīng)網(wǎng)絡(luò)的性能可由輸出的期望值與實(shí)際值間的差來衡量.常用的神經(jīng)網(wǎng)絡(luò)有BP(Back Propagation)網(wǎng)絡(luò),RBF(Radial Basis Function)網(wǎng)絡(luò)等.

      2 數(shù)據(jù)挖掘在建筑節(jié)能中的應(yīng)用

      公共建筑內(nèi)設(shè)備種類及數(shù)量繁多,產(chǎn)生海量的能耗數(shù)據(jù).隨著國家出臺(tái)相關(guān)規(guī)定需對建筑用能建立能耗監(jiān)測系統(tǒng),對空調(diào)、照明插座、動(dòng)力等實(shí)行分項(xiàng)計(jì)量后,積累了大量的建筑能耗數(shù)據(jù).量大、高維是這些數(shù)據(jù)的主要特點(diǎn),傳統(tǒng)的數(shù)據(jù)分析方法不能很好的發(fā)現(xiàn)其中蘊(yùn)藏的知識(shí),而數(shù)據(jù)挖掘技術(shù)能很好的解決此類問題.用數(shù)據(jù)挖掘發(fā)現(xiàn)建筑能耗知識(shí)的過程可分為四步:(1)數(shù)據(jù)收集和預(yù)處理;(2)建立能耗數(shù)據(jù)挖掘模型;(3)挖掘結(jié)果評估;(4)模型的應(yīng)用.

      2.1 關(guān)聯(lián)分析的應(yīng)用

      挖掘能耗數(shù)據(jù)背后隱藏的能耗使用特征是實(shí)現(xiàn)建筑節(jié)能的重要方向.關(guān)聯(lián)挖掘是一種典型的關(guān)聯(lián)分析方法,可以有效的發(fā)現(xiàn)能耗數(shù)據(jù)間的聯(lián)動(dòng)關(guān)系及推理影響能耗指標(biāo)產(chǎn)生的因素.關(guān)聯(lián)挖掘方法通過最小支持度(Min_sup)和最小置信度(Min_conf)閾值來判定數(shù)據(jù)或信息間的關(guān)系,閾值由用戶事先設(shè)定.AM過程即為尋找滿足高于Min_sup和Min_conf的強(qiáng)關(guān)聯(lián)規(guī)則過程.該過程可分為兩步:1)找出所有頻繁項(xiàng)集,即滿足的sup(X)≥Min_sup所有項(xiàng)集;2)找出強(qiáng)關(guān)聯(lián)規(guī)則,即頻繁項(xiàng)集即中滿足conf(X)≥Min_conf的關(guān)聯(lián)規(guī)則.

      2.1.1 Apriori的應(yīng)用

      Apriori是一種典型的迭代型關(guān)聯(lián)挖掘方法,最早由R Agrawal[10]提出,后來的很多算法都是基于該思想.Apriori方法通過迭代搜索頻繁項(xiàng)集發(fā)現(xiàn)強(qiáng)關(guān)聯(lián)規(guī)則.蘇江奪[11]將Apriori算法應(yīng)用到校園分項(xiàng)用電系統(tǒng)數(shù)據(jù)分析中,分析某分項(xiàng)能耗變化與其他分項(xiàng)能耗變化間的耦合關(guān)系.首先將校園分項(xiàng)能耗分為8個(gè)分項(xiàng),通過閾值比例和數(shù)據(jù)轉(zhuǎn)化將能耗浮點(diǎn)數(shù)據(jù)轉(zhuǎn)化成變化趨勢型的符號(hào)數(shù)據(jù)(上升↑,下降↓和不變-);然后設(shè)定最小支持度Min_sup、最小置信度Min_conf和其他相關(guān)配置參數(shù);最后通過校園平臺(tái)分項(xiàng)能耗記錄和Apriori算法搜索頻繁項(xiàng)集,發(fā)現(xiàn)了多條強(qiáng)關(guān)聯(lián)規(guī)則(如結(jié)果顯示空調(diào)末端用電、照明插座用電與其他分項(xiàng)用電存在耦合關(guān)系),推理結(jié)論可為校園能源的管理改善提供參考依據(jù).張春杰[12]通過Apriori算法生成的強(qiáng)關(guān)聯(lián)規(guī)則發(fā)現(xiàn)了午休前后空調(diào)系統(tǒng)存在的不合理運(yùn)行問題,改善這些問題可以實(shí)現(xiàn)節(jié)能且提高空調(diào)系統(tǒng)運(yùn)行效率.

      將Apriori算法應(yīng)用到建筑能耗數(shù)據(jù)分析中,優(yōu)勢是思路簡單、過程循序漸進(jìn),缺點(diǎn)是如果數(shù)據(jù)庫太大需要掃描次數(shù)太多,且迭代過程中產(chǎn)生的候選集較大導(dǎo)致運(yùn)算量大,運(yùn)行時(shí)間較長.

      2.1.2 FP-growth的應(yīng)用

      針對Apriori算法固有的缺點(diǎn),Han J等人[13]提出了FP-growth算法,該算法通過構(gòu)建FP_tree找到頻繁項(xiàng)集.FP-growth算法與Apriori算法相比的改進(jìn):1)主要掃描兩次數(shù)據(jù)庫,避免了多次掃描浪費(fèi)時(shí)間;2)無需產(chǎn)生候選集,僅需構(gòu)造FP_tree即可產(chǎn)生頻繁模式.

      S Lin[14]等將FP-growth算法用于挖掘建筑分項(xiàng)數(shù)據(jù)間的關(guān)聯(lián).數(shù)據(jù)集合包括建筑總能耗(低、中、高),空調(diào)能耗(低、中、高),空調(diào)狀態(tài)(開、關(guān)),溫度(低、中、高),以天為單位生成記錄,通過30條記錄產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則.結(jié)果表明空調(diào)系統(tǒng)能耗跟建筑總能耗、空調(diào)系統(tǒng)分單元間能耗、溫度與空調(diào)系統(tǒng)能耗、溫度與建筑總能耗間存在相關(guān)關(guān)系.Yu Z[15]通過FP-growth算法發(fā)現(xiàn)住宅建筑中的不節(jié)能行為.試驗(yàn)中的項(xiàng)集包括各種負(fù)荷(熱水、燈、廚房、冰箱、娛樂、家務(wù)等)、室外氣象參數(shù)(溫度、相對濕度、風(fēng)速、光照情況)、建筑自身參數(shù)(面積、熱損失系數(shù))等,通過產(chǎn)生的關(guān)聯(lián)規(guī)則發(fā)現(xiàn)用戶在日常生活中的不節(jié)能行為.類似的研究還有通過FP-growth算法發(fā)現(xiàn)空調(diào)系統(tǒng)新風(fēng)處理機(jī)組運(yùn)行中的耗能行為[16].

      2.2 多元線性回歸的應(yīng)用

      多元線性回歸就是根據(jù)已知變量,利用最小二乘法求回歸系數(shù),建立自變量與因變量間線性關(guān)系的過程.線性回歸是一種廣泛應(yīng)用的節(jié)能分析模型,可用于能耗預(yù)測、能耗影響因素分析等方面.對于自變量的選擇通常遵循幾個(gè)原則:

      (1)自變量與因變量間成顯著的線性相關(guān)關(guān)系;

      (2)自變量間應(yīng)具有互斥性,或者相關(guān)程度很小;

      (3)自變量數(shù)據(jù)容易測量.

      文獻(xiàn)[17]利用線性回歸分析尋找能耗數(shù)據(jù)與影響因素間的關(guān)系.首先通過研究尋找與電能耗變化最為緊密的影響因素(室內(nèi)外溫差、日均開燈時(shí)長、人均照度、使用人數(shù)等)建立回歸模型;然后驗(yàn)證模型的準(zhǔn)確性,移除非線性變量.該模型分析結(jié)果可結(jié)合未來影響因素指標(biāo)預(yù)測未來一段時(shí)間的電能需求量.文獻(xiàn)[18]提出一種基于多元線性回歸的建筑能耗分析與預(yù)測模型,因變量選擇為天然氣和電能耗,自變量為建筑類型、年代、占地面積、居住人數(shù)等參數(shù),通過模型分析出對能耗影響顯著的因素.文獻(xiàn)[19,20]在建筑初始設(shè)計(jì)階段通過回歸模型定量預(yù)測建筑能耗,結(jié)果可為節(jié)能建筑設(shè)計(jì)提供參考依據(jù).

      2.3 分類的應(yīng)用

      分類屬于典型的有監(jiān)督學(xué)習(xí)方法,其過程可分為兩步:1)訓(xùn)練:訓(xùn)練集→特征提取→訓(xùn)練→分類器;2)分類:新數(shù)據(jù)→特征提取→分類.

      2.3.1 決策樹的應(yīng)用

      決策樹是一種樹形結(jié)構(gòu),由根節(jié)點(diǎn)、內(nèi)部節(jié)點(diǎn)和葉節(jié)點(diǎn)組成.內(nèi)部節(jié)點(diǎn)表示屬性,每條分支表示一個(gè)輸出測試,葉節(jié)點(diǎn)代表實(shí)例所屬類別.決策樹通過計(jì)算熵(entropy)和信息增益確定屬性間的關(guān)系構(gòu)建決策樹,信息增益最大的屬性作為分支節(jié)點(diǎn)屬性.文獻(xiàn)[21]將決策樹方法用于建筑用能需求建模.首先將屬性按區(qū)間劃分,如溫度(high/low)、熱損失系數(shù)(high/low)、室內(nèi)人員數(shù)量(是否≤2)、能耗來源(供熱等)等,輸出為能耗密度(high/low),然后通過公式計(jì)算樣本數(shù)據(jù)的信息熵、信息增益,信息增益最大的屬性作為分支節(jié)點(diǎn)判斷屬性,通過逐級向下計(jì)算直到輸出結(jié)束,構(gòu)建的決策樹可用于預(yù)測建筑能耗密度及能耗需求.文獻(xiàn)[22]通過建立能耗模式判定樹與離群點(diǎn)分析,判斷實(shí)時(shí)能耗數(shù)據(jù)的模式,監(jiān)測能耗是否存在異常.

      2.3.2 SVM的應(yīng)用

      SVM具有泛化能力強(qiáng)、全局最優(yōu)、對維數(shù)不敏感等優(yōu)點(diǎn),可成功應(yīng)用于負(fù)荷預(yù)測.經(jīng)典的SVM方法是一種二分類方法,而在實(shí)際的數(shù)據(jù)挖掘應(yīng)用中,一般要解決的是多分類問題,所以后期提出了SVM改進(jìn)方法來解決實(shí)際問題,最小二乘支持向量機(jī)(LS-SVM)就是一個(gè)典型的改進(jìn)算法.

      LS-SVM是SVM的一種變形算法,通過非線性變換將負(fù)荷樣本映射到高維空間,在該空間上尋找負(fù)荷預(yù)測回歸函數(shù)并建立LS-SVM模型,從而進(jìn)行負(fù)荷預(yù)測.文獻(xiàn)[23]將LS-SVM用于空調(diào)負(fù)荷預(yù)測中.首先通過確定與負(fù)荷密切相關(guān)的因素,選擇輸入變量類型;然后將與預(yù)測量密切相關(guān)的影響因素(歷史負(fù)荷數(shù)據(jù)、氣象因素等)從輸入空間映射到特征空間構(gòu)造最優(yōu)線性回歸函數(shù),利用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則并通過入Lagrange函數(shù)求目標(biāo)函數(shù)最小值訓(xùn)練LS-SVM模型參數(shù),最后通過測試樣本驗(yàn)證該模型的準(zhǔn)確性.針對原始輸入變量存在的明顯粗糙性,文獻(xiàn)[24]通過粗糙集(Rough Sets,RS)屬性簡約尋找與預(yù)測負(fù)荷密切相關(guān)且最少的輸入變量,提高了該算法的運(yùn)行效率.類似基于SVM的改進(jìn)方法在建筑節(jié)能中的應(yīng)用還有回歸型支持向量機(jī)[25],灰色模型支持向量機(jī)[26]等.

      2.4 聚類的應(yīng)用

      聚類分析法的優(yōu)勢在于不需要考慮分類結(jié)構(gòu),只需考慮數(shù)據(jù)本身的特征,即通過數(shù)據(jù)間的相似度實(shí)現(xiàn)分類.聚類結(jié)果可用于能耗預(yù)測、基準(zhǔn)評價(jià)、運(yùn)行優(yōu)化等.常用的聚類方法有K-均值(K-means)算法、Chameleon算法、DBSCAN算法等.

      文獻(xiàn)[27]使用合成聚類方法(Agglomerative Hierarchical Clustering,AHC)分析一周中相似能耗狀況.聚類流程為:特征向量生成→特征向量轉(zhuǎn)換→分成7類→移除離群點(diǎn)→找出相似類.基本思想為:首先將每個(gè)特征向量看成一個(gè)單獨(dú)的類,然后利用制定的規(guī)則進(jìn)行合并,直到類的數(shù)后減到指定的數(shù)后為止.特征向量為可以描述能耗情況的參數(shù),如日均能耗量,日能耗峰值.文中通過異化系數(shù)描述類之間的不相似度并作為是否聚為同一類的標(biāo)準(zhǔn);通過終止規(guī)則決定是否合并最近的類.聚類結(jié)果可用于發(fā)現(xiàn)能耗異常點(diǎn)并制定節(jié)能控制策略.文獻(xiàn)[28]采用基于Weka平臺(tái)的Chameleon算法建立面向公共建筑能耗運(yùn)行優(yōu)化的聚類模型.首先使用K-均值把與某個(gè)點(diǎn)最近的k個(gè)點(diǎn)撿起來形成若干小簇,然后通過簇間的互聯(lián)性和緊密性決定是否合并簇.將該方法應(yīng)用到商場和辦公建筑的能耗聚類中,求得每個(gè)簇的平均能耗和能耗分布率并將其作為節(jié)能評價(jià)指標(biāo),可為節(jié)能提供決策依據(jù).

      與其他數(shù)據(jù)挖掘方法相比,聚類不需要太多的專家領(lǐng)域知識(shí)和復(fù)雜的公式計(jì)算,只從數(shù)據(jù)自身處理的角度考慮,且能獲得不錯(cuò)的分析效果.聚類沒有一個(gè)客觀的正確與否評價(jià)標(biāo)準(zhǔn).分類或關(guān)聯(lián)分析可通過測試數(shù)據(jù)檢驗(yàn)其正確性,但由于聚類屬于無監(jiān)督學(xué)習(xí),分成幾類是可變的,可以通過是否能有效應(yīng)用于數(shù)據(jù)挖掘?qū)嵗衼韺ζ湓u估.

      2.5 神經(jīng)網(wǎng)絡(luò)的應(yīng)用

      神經(jīng)網(wǎng)絡(luò)的非線性適應(yīng)性信息處理能力、并行處理、容錯(cuò)性等優(yōu)勢使其克服了其他智能方法的缺陷,已被廣泛應(yīng)用于能源預(yù)測等方面.將神經(jīng)網(wǎng)絡(luò)用于分析建筑能耗指標(biāo)的基本思路為:首先通過特征提取,找出對能耗指標(biāo)較為敏感的參數(shù)作為神經(jīng)網(wǎng)絡(luò)的輸入量,能耗指標(biāo)作為輸出;然后劃分訓(xùn)練樣本集并對網(wǎng)絡(luò)訓(xùn)練,當(dāng)達(dá)到所設(shè)置的訓(xùn)練精度時(shí)訓(xùn)練結(jié)束.訓(xùn)練完成后的網(wǎng)絡(luò)對于每一個(gè)輸入量都可將其劃歸到最接近的類中.

      BP神經(jīng)網(wǎng)絡(luò)是一種常用的方法,已廣泛應(yīng)用于能耗指標(biāo)評價(jià)和能耗預(yù)測等領(lǐng)域中.文獻(xiàn)[29]系統(tǒng)性闡述了基于神經(jīng)網(wǎng)絡(luò)的建筑節(jié)能評價(jià)體系,包括建筑節(jié)能因素分析及神經(jīng)網(wǎng)絡(luò)在建筑節(jié)能評價(jià)中的應(yīng)用.文獻(xiàn)[30]將BP神經(jīng)網(wǎng)絡(luò)用于構(gòu)建公共建筑能耗分析模型.首先選取溫度、濕度、天氣特征、是否是正常工作日作為敏感輸入量,建筑能耗值為輸出;設(shè)置網(wǎng)絡(luò)連接權(quán)值、閾值、誤差函數(shù)、目標(biāo)值、學(xué)習(xí)次數(shù)等參數(shù);訓(xùn)練中通過不斷調(diào)整參數(shù)直到達(dá)到設(shè)置的精度為止.實(shí)驗(yàn)結(jié)果表明基于BP神經(jīng)網(wǎng)絡(luò)應(yīng)用于公共建筑能耗分析準(zhǔn)確率較高.文獻(xiàn)[31]采用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行建筑負(fù)荷預(yù)測,輸出量為空調(diào)年耗電量和實(shí)際單位面積耗電量,結(jié)果證明了BP神經(jīng)網(wǎng)絡(luò)用于建筑能耗預(yù)測的可行性.

      其他的神經(jīng)網(wǎng)絡(luò)方法在建筑節(jié)能指標(biāo)分析中也有廣泛應(yīng)用.文獻(xiàn)[32]采用基于粒子群優(yōu)化的RBF神經(jīng)網(wǎng)絡(luò)方法設(shè)置日能耗報(bào)警閾值,完善了能耗監(jiān)測平臺(tái)的報(bào)警功能;文獻(xiàn)[33]提出了一種基于PCA(Principal Component Analysis)和RBF的建筑能耗預(yù)測模型,按貢獻(xiàn)率提取主成分并作為神經(jīng)網(wǎng)絡(luò)輸入,結(jié)果表明該方法可有效提高預(yù)測精度;文獻(xiàn)[34]將能耗基準(zhǔn)評價(jià)法與人工神經(jīng)網(wǎng)絡(luò)結(jié)合用于預(yù)測能源利用指數(shù)EUI(Energy Use Index),發(fā)現(xiàn)了與EUI變化密切相關(guān)的因素.

      基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘方法的優(yōu)點(diǎn):1)非線性擬合能力強(qiáng),能映射復(fù)雜的非線性關(guān)系;2)對噪聲數(shù)據(jù)有較強(qiáng)的魯棒性;3)準(zhǔn)確率高,學(xué)習(xí)規(guī)則簡單;4)學(xué)習(xí)能力強(qiáng),分布處理能力強(qiáng).缺點(diǎn):1)由于不能觀察學(xué)習(xí)過程,因此欠缺解釋推理過程和輸出結(jié)果的能力;2)對冗余和不完整數(shù)據(jù)挖掘結(jié)果存在異常;3)容易訓(xùn)練過度;4)系統(tǒng)參數(shù)多,學(xué)習(xí)時(shí)間長.常用的基于神經(jīng)網(wǎng)絡(luò)的挖掘方法有基于自組織神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘、基于模糊神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘等.

      3 數(shù)據(jù)挖掘在建筑節(jié)能中的發(fā)展趨勢

      除去無法調(diào)控的室外氣象條件之外,影響建筑運(yùn)行能耗的因素大致可分為兩類:一類是與使用人員相關(guān)的需求側(cè),主要包括室內(nèi)人員密度及其變化,室內(nèi)人員對建筑空間的使用時(shí)間和行為,以及室內(nèi)人員對室內(nèi)環(huán)境的要求和自主調(diào)控意識(shí)等;另一類是與建筑系統(tǒng)相關(guān),通常把建筑本體以及為建筑提供室內(nèi)舒適環(huán)境的各系統(tǒng)(照明系統(tǒng)、空調(diào)供暖和通風(fēng)系統(tǒng)等)看作一個(gè)整體,稱為建筑系統(tǒng),這個(gè)系統(tǒng)的后的是為人類活動(dòng)提供舒適的室內(nèi)環(huán)境,其影響建筑運(yùn)行能耗的因素主要包括建筑本體空間形態(tài)、維護(hù)結(jié)構(gòu)熱工性能、系統(tǒng)設(shè)備的能效等性能參數(shù),還包括各系統(tǒng)根據(jù)室內(nèi)需求做出的各種運(yùn)行調(diào)控策略,調(diào)控策略是否得當(dāng)影響供應(yīng)系統(tǒng)的整體效率.

      要實(shí)現(xiàn)建筑節(jié)能模式由供應(yīng)側(cè)到需求側(cè)的轉(zhuǎn)變,就必須恰當(dāng)描述特定室內(nèi)環(huán)境下的用能特征,才能從需求側(cè)評估建筑能耗的合理性,進(jìn)而精確辨識(shí)能源浪費(fèi)的原因.這就需要解決以下三個(gè)問題:(1)能耗感知(energy consumption sensing),獲取必要的空間粒度和時(shí)間粒度能耗數(shù)據(jù),得到室內(nèi)空間能量蹤跡.(2)環(huán)境感知(environments sensing),獲取溫度、濕度、噪聲、空氣質(zhì)量、照度等影響用戶舒適感的各種室內(nèi)環(huán)境狀態(tài)參數(shù),以及室外氣象參數(shù).(3)情景感知(context awareness),采集能源消耗時(shí)室內(nèi)特定空間的人員分布及行為狀態(tài),獲取用戶蹤跡(Occupants footprint).

      由于存在既要滿足眾多使用者對舒適的需求,同時(shí)又要滿足能耗最小化這一相互矛盾的目標(biāo),使得建筑能耗管理問題變得愈發(fā)復(fù)雜.通過獲取能耗、環(huán)境和情景這三類室內(nèi)空間狀態(tài),將能量蹤跡和用戶蹤跡信息融合,可以為能耗統(tǒng)計(jì)、能源審計(jì)、節(jié)能管理、節(jié)能改造和行為節(jié)能等提供有效的技術(shù)支持.

      隨著數(shù)據(jù)挖掘技術(shù)的發(fā)展,將數(shù)據(jù)庫技術(shù)、人工智能、統(tǒng)計(jì)學(xué)等應(yīng)用到建筑節(jié)能中有廣闊的發(fā)展前景.由于數(shù)據(jù)挖掘中單個(gè)算法具有缺點(diǎn)和局限性,對于數(shù)據(jù)挖掘算法的改進(jìn)和多算法組合可以彌補(bǔ)傳統(tǒng)算法的缺陷,也是數(shù)據(jù)挖掘技術(shù)的發(fā)展方向.另外,通過對電力公司的能源數(shù)據(jù)以及其他各類第三方數(shù)據(jù)進(jìn)行深入分析和挖掘,結(jié)合行為科學(xué)、云計(jì)算技術(shù)、大數(shù)據(jù)分析,進(jìn)而為用戶提供一整套適合于其生活方式的節(jié)能建議,也是一種發(fā)展趨勢.

      4 結(jié)語

      本文首先介紹了數(shù)據(jù)挖掘技術(shù),針對應(yīng)用較廣泛的挖掘方法作了介紹,然后介紹了數(shù)據(jù)挖掘典型方法在建筑節(jié)能中的應(yīng)用,最后對數(shù)據(jù)挖掘技術(shù)在建筑節(jié)能中的應(yīng)用發(fā)展作了展望.

      隨著建筑設(shè)備和建筑耗能的增加,建筑能耗數(shù)據(jù)海量化是不可避免的,如何從大數(shù)據(jù)中挖掘出有用的信息,為建筑節(jié)能提供參考依據(jù)是建筑行業(yè)的發(fā)展方向,同時(shí)為數(shù)據(jù)挖掘技術(shù)提供了用武之地.數(shù)據(jù)挖掘和建筑節(jié)能技術(shù)在我國的發(fā)展還較為落后,將數(shù)據(jù)挖掘技術(shù)應(yīng)用到建筑節(jié)能中還有很長的路要走.

      1 清華大學(xué)建筑節(jié)能研究中心.中國建筑節(jié)能年度發(fā)展研究報(bào)告2015.北京:中國建筑工業(yè)出版社,2015.

      2 Ramesh T,Prakash R,Shukla KK.Life cycle energy analysis of buildings:An overview.Energy and Buildings,2010,42(10):1592–1600.[doi:10.1016/j.enbuild.2010.05.007]

      3 李驥,鄒瑜,魏崢.建筑能耗模擬軟件的特點(diǎn)及應(yīng)用中存在的問題.建筑科學(xué),2010,26(2):24–28,79.

      4 Han J,Kamber M.數(shù)據(jù)挖掘:概念與技術(shù).范明,孟小峰譯.北京:機(jī)械工業(yè)出版社,2007.

      5 張敏,李亞非.數(shù)據(jù)挖掘綜述.江蘇科技信息:學(xué)術(shù)研究,2010,(2):83–84.

      6 王愛平,王占鳳,陶嗣干,等.數(shù)據(jù)挖掘中常用關(guān)聯(lián)規(guī)則挖掘算法.計(jì)算機(jī)技術(shù)與發(fā)展,2010,20(4):105–108.

      7 杜麗英.基于數(shù)據(jù)挖掘的決策樹算法分析.吉林建筑工程學(xué)院學(xué)報(bào),2014,31(5):48–50.

      8 汪海燕,黎建輝,楊風(fēng)雷.支持向量機(jī)理論及算法研究綜述.計(jì)算機(jī)應(yīng)用研究,2014,31(5):1281–1286.

      9 賀玲,吳玲達(dá),蔡益朝.數(shù)據(jù)挖掘中的聚類算法綜述.計(jì)算機(jī)應(yīng)用研究,2007,24(1):10–13.

      10 Agrawal R,Imieliński T,Swami A.Mining association rules between sets of items in large databases.ACM SIGMOD Record,1993,22(2):207–216.[doi:10.1145/170036]

      11 蘇江奪.基于關(guān)聯(lián)規(guī)則挖掘的節(jié)能系統(tǒng)用電分項(xiàng)關(guān)聯(lián)耦合分析的研究與實(shí)現(xiàn)[碩士學(xué)位論文].廣州:華南理工大學(xué),2013.

      12 張春杰.基于Apriori算法的校園空調(diào)的節(jié)能研究[碩士學(xué)位論文].杭州:杭州電子科技大學(xué),2014.

      13 Han JW,Pei J,Yin YW.Mining frequent patterns without candidate generation.ACM SIGMOD Record,2000,29(2):1–12.[doi:10.1145/335191]

      14 Lin SF,Hao C,Li DD,et al.Comprehensive energy efficiency analysis of buildings based on FP-growth association rules.International Journal of Electrical Energy,2015,3(3):197–202.

      15 Yu Z,Haghighat F,Fung BCM,et al.A methodology for identifying and improving occupant behavior in residential buildings.Energy,2011,36(11):6596–6608.[doi:10.1016/j.energy.2011.09.002]

      16 Yu Z,Haghighat F,Fung BCM,et al.A novel methodology for knowledge discovery through mining associations between building operational data.Energy and Buildings,2012,47:430–440.[doi:10.1016/j.enbuild.2011.12.018]

      17 聶子航,于學(xué)軍.基于多元線性回歸的辦公建筑電力能耗評估預(yù)測模型的設(shè)計(jì).電子設(shè)計(jì)工程,2016,24(3):40–43,46.

      18 樊麗軍.基于多元線性回歸模型的建筑能耗預(yù)測與建筑節(jié)能分析.湘潭大學(xué)自然科學(xué)學(xué)報(bào),2016,38(1):123–126.

      19 Asadi S,Amiri SS,Mottahedi M.On the development of multi-linear regression analysis to assess energy consumption in the early stages of building design.Energy and Buildings,2014,(85):246–255.

      20 Hygh JS,DeCarolis JF,Hill DB,et al.Multivariate regression as an energy assessment tool in early building design.Building and Environment,2012,57:165–175.[doi:10.1016/j.buildenv.2012.04.021]

      21 Yu Z,Haghighat F,Fung BCM,et al.A decision tree method for building energy demand modeling.Energy and Buildings,2010,42(10):1637–1646.[doi:10.1016/j.enbuild.2010.04.006]

      22 卿曉霞,肖丹,王波.能耗實(shí)時(shí)監(jiān)測的數(shù)據(jù)挖掘方法.重慶大學(xué)學(xué)報(bào),2012,35(7):133–137.[doi:10.11835/j.issn.1000-582X.2012.07.023]

      23 唐莉,唐中華,靳俊杰.最小二乘支持向量機(jī)(LS-SVM)在短期空調(diào)負(fù)荷預(yù)測中的應(yīng)用.建筑節(jié)能,2013,(2):56–58.

      24 耿艷,韓學(xué)山,韓力.基于最小二乘支持向量機(jī)的短期負(fù)荷預(yù)測.電網(wǎng)技術(shù),2008,32(18):72–76.

      25 李建,陳烈,茅林明.支持向量機(jī)在建筑能耗預(yù)測中的應(yīng)用.建筑節(jié)能,2014,(12):77–80.[doi:10.3969/j.issn.1673-7237.2014.12.020]

      26 唐杰明,劉俊勇,楊可,等.基于灰色模型和最小二乘支持向量機(jī)的電力短期負(fù)荷組合預(yù)測.電網(wǎng)技術(shù),2009,33(3):63–68.

      27 Seem JE.Pattern recognition algorithm for determining days of the week with similar energy consumption profiles.Energy and Buildings,2005,37(2):127–139.[doi:10.1016/j.enbuild.2004.04.004]

      28 劉文鳳.數(shù)據(jù)挖掘在公共建筑能耗分析中的應(yīng)用研究[碩士學(xué)位論文].重慶:重慶大學(xué),2010.

      29 盧德華.基于人工神經(jīng)網(wǎng)絡(luò)的建筑節(jié)能體系綜合評價(jià).建設(shè)科技,2007,(9):64–65.

      30 劉長俊.基于遺傳BP神經(jīng)網(wǎng)絡(luò)技術(shù)的大型公建能耗分析模型的研究與應(yīng)用[碩士學(xué)位論文].南寧:廣西大學(xué),2012.

      31 蔣毅.建筑能耗的統(tǒng)計(jì)平臺(tái)及其基于BP神經(jīng)網(wǎng)絡(luò)預(yù)測方法的研究[碩士學(xué)位論文].廣州:華南理工大學(xué),2012.

      32 徐聰麒.基于粒子群優(yōu)化的RBF網(wǎng)絡(luò)在節(jié)約型校園能耗監(jiān)管平臺(tái)中的應(yīng)用研究[碩士學(xué)位論文].南寧:廣西大學(xué),2012.

      33 戴坤成,王貴評,趙超.基于PCA與RBF的建筑能耗預(yù)測建模.福州大學(xué)學(xué)報(bào)(自然科學(xué)版),2015,43(4):512–516.[doi:10.7631/issn.1000-2243.2015.04.0512]

      34Yalcintas M.An energy benchmarking model based on artificial neural network method with a case example for tropical climates.International Journal of Energy Research,2006,30(14):1158–1174.[doi:10.1002/(ISSN)1099-114X]

      Data Mining Technology and Its Application in Building Energy Efficiency

      ZHANG Yun-Chu1,2,HAN Huai-Bao1,YANG Hong-Juan1,2,YANG Chong-Tao1,WANG Zhao-Bin11(School of Information and Electrical Engineering,Shandong Jianzhu University,Jinan 250101,China)2(Shandong Provincial Key Laboratory of Intelligent Buildings Technology,Jinan 250101,China)

      Every technological advance in the development of human society will lead to a series of new products and services,but at the same time,it will lead to a sharp increase in the consumption of resources and energy.Although the progress of technology has improved the efficiency of resource and energy use,the development mode of increasing per capita energy consumption is not sustainable.In addition to the supply side of energy efficiency,a reasonable guide to demand side can be the key used to achieve building energy efficiency.To achieve the change of building energy-saving mode from the supply side to the demand side,we must properly describe the energy by using characteristics in a specific indoor environment,and assess the reasonableness of building energy consumption from the demand side,then identify accurately the reason of energy waste.Along with the rapid development of building automation system and IOT technology,a large amount of building energy consumption data with specific indoor environment features are acquired,then we can use data mining technology to extract energy saving clues and strategies from these low density value building daily operation data.This paper briefly introduces the data mining technology,and summarizes the application of various mining methods in building energy saving,and prospects of its development trend.

      data mining;algorithm;building energy consumption analysis;building energy efficiency;association mining;classification;clustering;neural network

      張運(yùn)楚,韓懷寶,楊紅娟,楊崇濤,王兆斌.數(shù)據(jù)挖掘技術(shù)及其在建筑節(jié)能中的應(yīng)用.計(jì)算機(jī)系統(tǒng)應(yīng)用,2017,26(9):151–157.http://www.c-sa.org.cn/1003-3254/5869.html

      ① 基金項(xiàng)后:國家自然科學(xué)基金青年基金(61303087)

      2016-12-06;采用時(shí)間:2016-12-22

      猜你喜歡
      建筑節(jié)能數(shù)據(jù)挖掘關(guān)聯(lián)
      土木工程中建筑節(jié)能的重要性簡述
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
      現(xiàn)代建筑節(jié)能環(huán)保技術(shù)的應(yīng)用
      奇趣搭配
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      智趣
      讀者(2017年5期)2017-02-15 18:04:18
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      2015年建筑節(jié)能實(shí)施的新標(biāo)準(zhǔn)
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      嘉祥县| 南通市| 西城区| 宝鸡市| 绥宁县| 霸州市| 嘉峪关市| 马山县| 武平县| 大邑县| 右玉县| 大足县| 佛教| 宿州市| 九江市| 临桂县| 子洲县| 平顺县| 德清县| 马鞍山市| 龙口市| 西平县| 防城港市| 江城| 横峰县| 双辽市| 新建县| 苍南县| 杭锦后旗| 调兵山市| 长岭县| 朝阳县| 柳河县| 湘潭县| 固始县| 连云港市| 如皋市| 永修县| 宜章县| 克东县| 桂平市|