姬 穎, 連會會, 陳永保, 謝靜超, 劉加平
(1.北京工業(yè)大學城建學部, 北京 100124; 2.北京工業(yè)大學綠色建筑環(huán)境與節(jié)能技術北京市重點實驗室, 北京 100124;3.上海理工大學能源與動力工程學院, 上海 200093)
我國承諾到2030年前停止增加二氧化碳排放,爭取2060年前實現(xiàn)碳中和[1]. 我國公共建筑能耗及碳排放量呈增長趨勢,截至2019年,公共建筑運行碳排放量為6.5億t(以CO2計),占建筑運行總碳排放量的30%,碳排放強度高達48 kg/m2[2]. 設計優(yōu)化、運行優(yōu)化和節(jié)能改造都是公共建筑節(jié)能減排的主要途徑. 合理的能耗預測是上述工作的重要環(huán)節(jié),對公共建筑供需匹配和建筑能源系統(tǒng)智能控制有重要意義[3-4].
建筑能耗預測方法可分為能耗指標法、能耗模擬法和數(shù)據(jù)挖掘法. 能耗指標法是一種靜態(tài)的能耗估算方法[5];模擬法應用專業(yè)軟件,可計算動態(tài)能耗,結果準確,針對性強,但輸入參數(shù)煩瑣且建筑幾何模型確定后往往無法更改[6];數(shù)據(jù)挖掘法又包括回歸分析法、時間序列法、人工智能法. 相比之下,人工智能法具有計算速度快、適用條件多樣等優(yōu)點[7-8],但是大多數(shù)算法需要用到長時間歷史數(shù)據(jù)進行訓練,受到數(shù)據(jù)樣本的限制.
Kawashima等[9]于1995年比較了傳統(tǒng)機器學習方法和神經網絡模型對冰蓄冷系統(tǒng)未來24 h逐時負荷的預測精度,表明人工神經網絡模型的相對誤差最低. 朱俊丞等[10]綜述了傳統(tǒng)機器學習算法、人工神經網絡算法和深度學習算法在電力系統(tǒng)負荷預測領域應用,指出深度學習算法效果更優(yōu). 高英博[11]基于支持向量機算法、長短期記憶神經網絡算法和XGBoost(eXtreme Gradient Boosting)算法建立能耗預測模型,并在4棟公建內進行試驗,指出模型均有良好的預測效果. Wang等[12]用12個數(shù)據(jù)驅動模型(7個淺層學習、2個深度學習和3個啟發(fā)式方法)預測建筑負荷,對比表明XGBoost算法和長短期記憶神經網絡算法的負荷預測效果最好;針對長期預測,XGBoost模型預測效果更好一些. 綜上可知,對于建筑能耗長期預測,XGBoost算法效果更好,但該算法仍存在一定的局限性,如模型訓練過程中,因訓練數(shù)據(jù)量和特征維度過大或過小會導致模型的過擬合或欠擬合現(xiàn)象.
目前,把建筑歷史能耗數(shù)據(jù)作為訓練集來建立預測模型已經可以取得很好的精度. 然而,在建筑歷史能耗數(shù)據(jù)未知的情況下,僅依靠建筑自身特征、運行狀況和氣象參數(shù)來建立的模型的精度并不理想[13]. 同濟大學許鵬團隊等發(fā)起的“能耗偵探”建筑能耗預測競賽,100個參賽隊伍,在不知建筑歷史能耗數(shù)據(jù)的情況下,最優(yōu)隊伍的模型預測準確性在30%左右[14]. Neto等[15]采集了1座實際建筑的54條樣本建立模型,驗證結果誤差為21%. Massana等[16]選用4座實際建筑,采集了87 920條樣本建立模型,驗證結果誤差為16.35%.
在上述分析基礎上,本研究提出構建一種基于龐大算例變量提取的辦公建筑能耗預測模型. 試圖擺脫模擬軟件物理建模和長時間歷史數(shù)據(jù)獲取需求的限制,并且保證良好的預測精度. 下面對該模型的研究方法、建立流程和應用效果進行詳細闡述. 本研究模型建立和驗證基于Python實現(xiàn),并應用于北京市某辦公建筑.
如圖1所示,通過文獻調研和現(xiàn)有模擬軟件分析,得到建筑能耗的影響因素集,利用EnergyPlus中已搭建好的物理模型,采用控制變量法逐一離散化地改變影響因素取值,獲得模擬樣本數(shù)據(jù),每一條樣本數(shù)據(jù)包含所有影響因素的取值和計算得到的冷、熱負荷值和能耗值,最終得到模擬樣本數(shù)據(jù)庫. 利用搭建的數(shù)據(jù)庫,采用輕量級梯度提升機(light gradient boosting machine,LightGBM)算法篩選出關鍵負荷影響因素并構建負荷預測模型. 結合EnergyPlus中空調設備能耗計算模型,實現(xiàn)只需要輸入一些關鍵的建筑信息就可以預測建筑全年能耗的目標,并用實際建筑數(shù)據(jù)對模型進行驗證.
圖1 研究技術路線圖Fig.1 Framework of this study
通過文獻調研和EnergyPlus需要用的設置參數(shù)匯總[17-18],得到影響建筑能耗的因素分為以下5類:建筑基本信息,主要包括體形系數(shù)、建筑面積、高度、窗墻比、圍護結構熱工性能等;外部氣象條件,主要包括溫度、濕度、風速、太陽輻射水平等;用能系統(tǒng)性能參數(shù),如照明功率密度、冷機COP、水泵效率等;室內環(huán)境控制條件,包括室內溫度、濕度、新風量等;時間表,包括照明和設備時間表. 本研究旨在預測辦公建筑的能耗,輸出變量為逐時能耗數(shù)據(jù). 該調研得到的重要因素可為構建模型數(shù)據(jù)庫奠定基礎.
為保證預測模型具有較好的精度及適用性,本研究選擇業(yè)界認可、應用廣泛的EnergyPlus軟件構建模型的數(shù)據(jù)庫,應用Python調用EnergyPlus中已搭建的物理模型,采用控制變量法逐一等間距離散化地改變主要建筑參數(shù),生成6 000個建筑算例,覆蓋不同幾何特征的建筑形態(tài),共生成1 048 575條模擬數(shù)據(jù)樣本,每一條數(shù)據(jù)形式為同一時刻下所有輸入變量和輸出變量的具體數(shù)值,所有模擬數(shù)據(jù)樣本構成模擬數(shù)據(jù)庫. 該方法不僅可以保證模型的多樣性,還可以保證訓練數(shù)據(jù)的數(shù)量和質量. 實現(xiàn)流程如圖2所示.
圖2 模擬數(shù)據(jù)庫生成路徑Fig.2 Generation process of the simulated database
1.2.1 模型原理介紹
GBDT(gradient boosting decision tree)算法是被廣泛使用的一種算法,XGBoost是該算法的典型框架,但當特征維度較高、數(shù)據(jù)量大時,存在效率和可擴展性的問題,主要原因是對于每一個特征的每一個分裂點,都需要遍歷全部數(shù)據(jù)計算信息增益,這一過程在空間和時間上有很大的開銷[19]. 針對該不足,微軟團隊于2016年提出LightGBM模型,LightGBM是實現(xiàn)梯度提升決策樹算法的新型框架之一,具有準確率高、處理數(shù)據(jù)量大等優(yōu)點. 該算法核心內容為
(1)
式中:f(x)為訓練樣本對應的目標值;Q為基學習器的個數(shù);αq為第q個基學習器的權重系數(shù);x為訓練樣本;θq為學習器分類的參數(shù);T(x,θq)為參與學習訓練的第q個基學習器.
損失函數(shù)和訓練數(shù)據(jù)確定之后,算法的訓練過程即為求解損失函數(shù)極小值的優(yōu)化問題,其目標函數(shù)為
(2)
式中:H為樣本個數(shù);h為樣本序號;yh為數(shù)據(jù)的實際數(shù)值;f(xy)為第h個樣本對應的目標值;L(yh,f(xh))為第h個樣本的損失函數(shù)值.
GBM為基于梯度下降算法得到的提升樹模,在每一次加入新的子模型后,保證選取的損失函數(shù)不斷朝向信息含量次高的變量梯度減小,即
L(Fj(x),Y) (3) 式中:L(Fj(x),Y)、L(Fj-1(x),Y)分別為第j次和第j-1次迭代的損失函數(shù)值;Fj(x)、Fj-1(x)分別為第j次和第j-1次樣本對應的目標值;Y為樣本真實目標值. LightGBM算法主要改進在于引入直方圖算法和帶深度限制的按葉子生長(Leaf-wise)策略[20].直方圖算法是將連續(xù)的浮點特征離散成k個離散值,并構造寬度為k的直方圖,然后遍歷訓練數(shù)據(jù),統(tǒng)計每個離散值在直方圖中的累計統(tǒng)計量.在對特征選擇時,只需根據(jù)直方圖的離散值,遍歷尋找最優(yōu)的分割點,提高了模型的魯棒性和計算速度.Leaf-wise是一種更高效的策略,每次從當前所有葉子中,找到分裂增益最大的一個葉子,然后分裂,如此循環(huán),使得模型在保證精度的同時具有較小的計算代價.該方法在保證與傳統(tǒng)GBDT相同精度的同時訓練速度提高了20倍以上. 1.2.2 數(shù)據(jù)集的劃分方法 為避免模型在數(shù)據(jù)集訓練時過擬合,降低模型的泛化性能,訓練時按照制冷季和供暖季對原始數(shù)據(jù)進行均分的5折交叉驗證.5折交叉驗證是指將原始數(shù)據(jù)集隨機等分成5份,輪流將其中1份作為測試集,其余4份數(shù)據(jù)作為訓練集,如圖3所示.在每次試驗中計算正確率等評價指標,最終通過k次試驗后取評價指標的平均值來評估該模型的泛化能力[21]. 圖3 5折交叉驗證的原理示意圖Fig.3 Schematic diagram of 5-fold cross validation 合理地選取變量可直接提高負荷預測的準確性和實用性[22].根據(jù)1.1節(jié)的調研,從中篩選出30個影響負荷的因素,分別為面積、層數(shù)、體形系數(shù)、4個朝向的窗墻比、墻體比熱容、墻角線性透過率、墻體傳熱系數(shù)、樓板線性透過率、玻璃線性透過率、外墻太陽輻射吸收系數(shù)、屋頂傳熱系數(shù)、屋頂太陽輻射吸收系數(shù)、內遮陽開啟程度、窗戶太陽輻射得熱系數(shù)、窗戶傳熱系數(shù)、干球溫度、室外濕球溫度、風速、太陽散射輻射強度、太陽直射輻射強度、新風量、人員密度、照明功率密度、設備功率密度、供熱空調設定溫度、制冷空調設定溫度、運行時間表. 為簡化模型,應用LightGBM模型對變量的重要度進行分析,進一步篩選出24個變量,用于建筑全年負荷預測.其中,供熱空調設定溫度和制冷空調設定溫度分別影響建筑熱負荷和冷負荷. 圖4為冷負荷預測參數(shù)的重要度百分比累計圖.可以看出,在冷負荷預測中,影響最大的3個因素為干球溫度、新風量、制冷空調設定溫度.篩選出的23個因素影響度累計達94.52%. 圖4 影響冷負荷預測精度的參數(shù)重要度分布Fig.4 Parameter importance distribution of cooling load forecasting 圖5為熱負荷預測參數(shù)的重要度百分比累計圖.可以看出,熱負荷預測中,與夏季相同,干球溫度、新風量仍是影響度占前2位的因素,排名第3的為人員密度.篩選出的23個因素累計影響度占到了91.48%.綜上,得到影響負荷預測的特征變量,參考相關規(guī)范標準[23-25],得到模型輸入變量和取值范圍如表1所示,參數(shù)變量的取值范圍即模型數(shù)據(jù)庫覆蓋的參數(shù)區(qū)間,在該范圍內本模型適用. 圖5 影響熱負荷預測精度的參數(shù)重要度分布Fig.5 Parameter importance distribution of heating load forecasting 表1 建筑負荷影響因素篩選結果及取值范圍 基于龐大訓練數(shù)據(jù)庫,選取上述影響建筑負荷的特征變量,應用LightGBM算法,構建負荷預測模型. 本研究所開發(fā)的模型針對典型系統(tǒng)和設備形式,照明、設備和暖通空調模型均選自EnergyPlus. 照明和設備能耗根據(jù)照明功率密度和設備功率密度與相應建筑的面積的乘積計算得到. 暖通空調系統(tǒng)模型包括冷水機組+鍋爐、地源熱泵、空氣源熱泵等典型模型,空調系統(tǒng)能耗通過1.3節(jié)構建的模型預測的建筑負荷值計算得到.空調系統(tǒng)的能耗加照明和設備能耗即為建筑總能耗. 根據(jù)上述原理,應用Python編譯,實現(xiàn)能耗預測模型的建立,模型測試集的逐時平均相對誤差為95%. 本研究選取常見的能耗預測評估指標平均相對誤差(mean absolute percentage error,MAPE)來反映預測值與實際值之間的平均偏差[17, 26]. (4) 式中:PA和PF分別為實際能耗值和預測能耗值,kW·h;N是樣本的數(shù)量. 案例建筑為辦公建筑,位于北京市順義區(qū),建筑面積57 400 m2,共7層,制冷和制熱系統(tǒng)形式為地源熱泵機組+AHU,機組為螺桿式地源熱泵機組. 根據(jù)表1篩選的24個關鍵因素,在模型預測時獲取參數(shù)分以下3類:建筑客觀數(shù)據(jù)、氣象數(shù)據(jù)和運行時間表.建筑客觀數(shù)據(jù)包括幾何參數(shù)、圍護結構熱工參數(shù)、運行及使用數(shù)據(jù),該數(shù)據(jù)通過實際建筑采集得到;氣象數(shù)據(jù)中實測的建筑氣象參數(shù)是通過實驗室氣象站獲得,全年氣象數(shù)據(jù)選用標準年氣象數(shù)據(jù);運行時間表根據(jù)辦公建筑的使用特征劃分為工作日和周末,設定運行時間表后綴為“.xlsx”的文件,計算時直接調用該文件,時間表中的具體數(shù)值根據(jù)建筑實際運行狀況設定. 為驗證模型預測的精度,獲取了實測的建筑機組功率、全年月能耗賬單和建筑總能耗指標,數(shù)據(jù)由大廈持有方提供. 2.1.1 建筑客觀數(shù)據(jù) 建筑客觀數(shù)據(jù)包括建筑幾何參數(shù)、圍護結構熱工參數(shù)、運行及使用數(shù)據(jù),具體參數(shù)如表2所示. 表2 建筑模型輸入特征變量——建筑客觀參數(shù) 2.1.2 氣象參數(shù) 氣象參數(shù)包括干球溫度、濕球溫度、風速、太陽散射輻射強度和太陽直射輻射強度共5項指標.建筑室外天氣數(shù)據(jù)由于僅采集了北京2020年11月24日—2020年12月6日的氣象參數(shù)(見圖6、7),故在進行全年能耗模擬時,選用北京地區(qū)標準年的氣象參數(shù)(見圖8、9),實測的2020年參數(shù)用于冬季能耗驗證分析. 圖6 實測室外干球/濕球溫度Fig.6 Measured outdoor dry-bulb/wet-bulb temperature 圖7 實測太陽輻射照度Fig.7 Measured solar radiation 圖8 標準年室外干球/濕球溫度Fig.8 Typical annual outdoor dry-bulb/wet-bulb temperature 圖9 標準年室外太陽輻射照度Fig.9 Typical annual solar radiation 2.1.3 運行時間表 根據(jù)建筑的實際使用情況,時刻表設定結果如圖10所示. 圖10 建筑運行時間表Fig.10 Schedules 2.2.1 實測結果驗證 應用本研究建立的能耗預測模型,輸入實際采集氣象參數(shù)、時間表及其他特征變量,預測機組的能耗.該機組存在間歇運行情況,逐時功率波動不規(guī)律,故將模型預測的逐時值累計為逐日值,并與實際機組的運行能耗進行對比,如圖11所示.可以看出預測值與真實值基本一致,機組逐日平均相對誤差值為8.27%. 圖11 逐日機組能耗預測值與實測值對比Fig.11 Comparison of daily predicted and measured energy 2.2.2 全年模擬結果分析 選用本研究建立的能耗預測模型和北京標準年的氣象參數(shù),其他變量不變,預測建筑全年能耗值.預測得到,建筑的總能耗指標為36.25 kW·h/(m2·a);根據(jù)物業(yè)提供的電耗賬單,計算得到實際的建筑總能耗指標為35.20 kW·h/(m2·a),相對誤差為2.98%. 建筑逐月模擬能耗值與實際建筑的每月能耗賬單進行對比,如圖12所示.計算得到建筑逐月的平均相對誤差為10.37%. 圖12 逐月能耗預測值與月能耗賬單對比圖Fig.12 Comparison of monthly simulated energy consumption and energy consumption bill 本研究結合EnergyPlus中的物理模型和LightGBM算法提出了基于龐大算例特征提取的辦公建筑能耗計算方法.在實際建筑中進行應用和分析,得到如下結論: 1) 篩選出24個影響負荷的特征變量,并給出24個變量的取值范圍和影響權重,模型測試集的精度為95%. 2) 在北京某辦公建筑中應用效果展示,冬季機組逐日能耗預測平均相對誤差為8.27%;應用標準年氣象參數(shù)預測全年建筑能耗,能耗指標平均相對誤差為2.98%,逐月能耗預測平均相對誤差為10.37%. 3) 模型的訓練數(shù)據(jù)庫龐大,氣象參數(shù)、運行時間表、HVAC設備形式可靈活調用,且給出了特征變量影響權重和取值范圍,在建筑輸入參數(shù)未知的情況下,可參考給定的取值范圍.本方法擺脫了傳統(tǒng)模擬軟件物理建模和建筑歷史數(shù)據(jù)的限制,使用簡便、計算速度快、精度良好,具有普適性. 由于實際條件限制本研究未能對夏季工況和更多建筑進行實測驗證,今后我們將繼續(xù)開展研究工作.1.3 影響負荷的特征變量提取
1.4 能耗預測模型的建立
1.5 預測模型的評價方法
2 實例分析
2.1 數(shù)據(jù)獲取
2.2 模型預測結果分析
3 結論