鐘勝利,林堯林,黃興華
(1 上海工程技術(shù)大學(xué) 機(jī)械與汽車工程學(xué)院,上海 201620;2 上海理工大學(xué) 環(huán)境與建筑學(xué)院,上海 200093)
隨著經(jīng)濟(jì)的快速發(fā)展和人們生活水平的提高,人們對改善居住環(huán)境條件的需求不斷增加。然而,在建筑能耗日益增長的趨勢下,大多數(shù)建筑設(shè)計(jì)者及研究人員往往關(guān)注的是如何降低建筑能耗,卻忽略了室內(nèi)的環(huán)境質(zhì)量,這一現(xiàn)象容易產(chǎn)生病態(tài)建筑綜合征(SBS)[1]。不舒適小時(shí)數(shù)作為衡量建筑性能的重要指標(biāo)之一,受建筑圍護(hù)結(jié)構(gòu)傳熱系數(shù)、窗墻比、建筑表面太陽熱吸收率等諸多建筑熱物理參數(shù)的影響[2]。
目前,通過數(shù)據(jù)挖掘軟件與模型預(yù)測技術(shù),可以獲取影響不舒適小時(shí)數(shù)參數(shù)的基礎(chǔ)數(shù)據(jù),并建立相關(guān)預(yù)測模型,使設(shè)計(jì)者在建筑設(shè)計(jì)早期快速準(zhǔn)確的獲得室內(nèi)熱舒適情況,從而為居住者提供一個(gè)健康舒適的室內(nèi)環(huán)境。
關(guān)于利用逐步線性回歸方法建模和預(yù)測方面,蒲清平等[3]通過SPSS 軟件建立了居住建筑能耗預(yù)測的逐步線性回歸模型,并對模型的擬合效果進(jìn)行了檢驗(yàn)。結(jié)果表明,模型預(yù)測年能耗與實(shí)際統(tǒng)計(jì)年能耗符合度達(dá)95%左右,說明模型具有較高的預(yù)測精度和較好的擬合效果;Amiri 等[4]采用逐步線性回歸方法,建立了建筑能耗預(yù)測模型,并將預(yù)測與模擬結(jié)果進(jìn)行對比分析。結(jié)果表明,二者之間的誤差是可以接受的,同時(shí)指出該方法簡單,能夠準(zhǔn)確快速地對建筑能耗進(jìn)行預(yù)測;Braun 等[5]利用逐步回歸方法,分別建立了燃?xì)庀暮碗娏ο念A(yù)測模型,并將預(yù)測值與實(shí)際值進(jìn)行了比較。結(jié)果表明,兩個(gè)模型的預(yù)測值都是令人滿意的;Hygh 等[6]采用逐步線性回歸的方法,建立了4 個(gè)城市不同氣候區(qū)供熱、制冷以及總能耗的預(yù)測模型,并與EnergyPlus 模擬結(jié)果比較。結(jié)果顯示,預(yù)測數(shù)據(jù)與模擬結(jié)果吻合較好,同時(shí)也表明在設(shè)計(jì)初期,線性回歸可以作為一種有效的簡化模型來代替能耗模擬模型。
在熱舒適性建模與預(yù)測方面,孫斌等[7]利用BP網(wǎng)絡(luò)、GA-BP 網(wǎng)絡(luò)、RBF 網(wǎng)絡(luò)及Elman 網(wǎng)絡(luò),分別建立了熱舒適性指標(biāo)預(yù)測模型。結(jié)果表明,GA-BP 神經(jīng)網(wǎng)絡(luò)的預(yù)測性能最佳,并指出其對權(quán)值和閾值的優(yōu)化是以訓(xùn)練時(shí)間為代價(jià)的;喻偉等[2]考慮到14 個(gè)變量對建筑能耗和室內(nèi)熱舒適狀況的影響,并建立了GA-BP 網(wǎng)絡(luò)模型。通過對樣本數(shù)據(jù)進(jìn)行訓(xùn)練和測試,驗(yàn)證了該模型具有較高的預(yù)測精度,同時(shí)表明人工神經(jīng)網(wǎng)絡(luò)預(yù)測精度受樣本數(shù)據(jù)的影響;陸燁等[8]采用PSO-RBF 的方法,建立了PMV 指標(biāo)預(yù)測模型,實(shí)現(xiàn)了對PMV 指標(biāo)的智能預(yù)測,并通過仿真計(jì)算表明,PSO-RBF 網(wǎng)絡(luò)的預(yù)測誤差精度提高了79.5%,小于RBF 網(wǎng)絡(luò);朱嬋等[9]提出了一種基于改進(jìn)的禁忌遺傳算法神經(jīng)網(wǎng)絡(luò)的熱舒適度預(yù)測模型(TGA-BPNN),通過仿真實(shí)驗(yàn)并與BP 神經(jīng)網(wǎng)絡(luò)及遺傳神經(jīng)網(wǎng)絡(luò)相比,TGA-BPNN 可以進(jìn)一步提升模型預(yù)測的準(zhǔn)確性,同時(shí)表明采用此方法存在算法運(yùn)行時(shí)間長、空間復(fù)雜度大以及效率低等不足。
綜上所述可以發(fā)現(xiàn),利用逐步回歸方法進(jìn)行預(yù)測主要是針對建筑能耗,而對熱舒適性等建筑環(huán)境領(lǐng)域的研究很少?;貧w模型不僅結(jié)構(gòu)簡單,而且可以達(dá)到準(zhǔn)確可靠的預(yù)測效果。而對于熱舒適性的預(yù)測普遍采用神經(jīng)網(wǎng)絡(luò)。然而,利用傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測時(shí),其預(yù)測結(jié)果誤差往往取決于樣本數(shù)據(jù)。大部分文獻(xiàn)都采用算法與神經(jīng)網(wǎng)絡(luò)結(jié)合的方式,來提高預(yù)測精度。但其結(jié)構(gòu)復(fù)雜程度會(huì)隨之增加,算法運(yùn)行效率也會(huì)有所下降,即耗時(shí)又耗力。因此,本文采用逐步回歸方法,建立了集成PVT-M 建筑的不舒適度小時(shí)數(shù)預(yù)測模型,并對模型的準(zhǔn)確度以及預(yù)測變量的重要性進(jìn)行了分析。
本文選取的居住建筑位于上海市,典型氣候特征為夏季悶熱,冬季濕冷。該氣候區(qū)的建筑物必須滿足夏季防熱、通風(fēng)降溫要求,冬季應(yīng)兼顧防寒取暖需求。
利用DesignBuilder 建立了建筑模型,如圖1 所示。建筑面積100 m2,高度4m,為了建筑在冬季能獲得更多的太陽輻射獲得熱量,建筑朝向采用了該地區(qū)最佳的南偏東15°方位。建筑采用光伏板、相變材料和特朗伯集熱墻(Trombe wall)結(jié)構(gòu)。光伏板布置在屋頂,主要提供室內(nèi)用電設(shè)備的能源消耗;建筑南向?yàn)閹в邢嘧儾牧系奶乩什療釅?,分為?nèi)層、中間層和外層3 層。內(nèi)層墻體結(jié)構(gòu)為面磚層、XPS 保溫層、混凝土層、相變材料層、石膏抹灰層,墻體上開了兩個(gè)通風(fēng)孔,其主要作用是結(jié)合中間層的空氣腔來實(shí)現(xiàn)建筑的自然通風(fēng),從而降低室內(nèi)的冷熱負(fù)荷,外層為玻璃幕墻。其它3 面墻體都設(shè)置了外窗,且采取了遮陽措施。
圖1 建筑模型圖Fig.1 Building model diagram
1.2.1 自變量
本文選取的34 個(gè)參數(shù)變量都是查閱相關(guān)文獻(xiàn)以及規(guī)范標(biāo)準(zhǔn)獲取的,參數(shù)涉及窗墻比、保溫層厚度、混凝土厚度、太陽熱吸收率、外窗類型、遮陽類型、夏季室內(nèi)空調(diào)和冬季室內(nèi)采暖溫度設(shè)定值、相變材料的類型、厚度以及相變溫度、光伏板的傾角和面積、Trombe 墻的空腔厚度、幕墻厚度和通風(fēng)口面積等。具體變量類型及取值范圍見表1。
表1 中:G1-G16 表示16 種不同的外窗類型;L1-L9 表示9 種不同長度厚10 cm 的懸挑混凝土板;P1-P5 表示5 種不同的相變材料;W6-W10 表示5 種不同厚度的玻璃幕墻,這些變量均屬于離散型變量。
1.2.2 因變量
本文選取的目標(biāo)函數(shù)為不舒適度小時(shí)數(shù),可分為夏季不舒適度小時(shí)數(shù)和冬季不舒適度小時(shí)數(shù),其數(shù)學(xué)表達(dá)式為[10]:
式中,T1為全年高于26 ℃的室內(nèi)空氣溫度,T2為全年低于18℃的室內(nèi)空氣溫度。
表1 變量類型及數(shù)值范圍Tab.1 Variable type and numeric range
充足的樣本量是保證預(yù)測模型穩(wěn)定性和準(zhǔn)確性的關(guān)鍵。為了建立不舒適度小時(shí)數(shù)預(yù)測模型,需要建立一個(gè)以建筑設(shè)計(jì)參數(shù)為輸入,以不舒適度小時(shí)數(shù)為輸出的數(shù)據(jù)庫。本文采用了20 世紀(jì)40 年代由S.Ulam 提出的蒙特卡洛抽樣方法(MCM)[11],MCM是一種隨機(jī)模擬抽樣方法,其工作原理如下:
(1)構(gòu)造或描述概率過程;
(2)實(shí)現(xiàn)從已知概率分布抽樣;
(3)建立各種估計(jì)量。
利用該方法對選取的34 個(gè)變量進(jìn)行抽樣,最終確定了1 000 個(gè)樣本。通過仿真軟件DesignBuilder對樣本進(jìn)行模擬,來獲取不舒適度小時(shí)數(shù)。
線性回歸分析方法已被普遍應(yīng)用于不同建筑的性能預(yù)測。S.Asadi 等[12]發(fā)現(xiàn)多元線性回歸模型在建筑設(shè)計(jì)階段的早期應(yīng)用,可以提高能源效率和減少排放。逐步線性回歸模型(SLR)屬于線性回歸的一種,由于變量個(gè)數(shù)和回歸模型的復(fù)雜性會(huì)對模型擬合優(yōu)度產(chǎn)生顯著影響,逐步線性回歸可以采用正向選擇和逆向淘汰相結(jié)合的方法實(shí)現(xiàn)自動(dòng)選擇自變量,從而確定自變量對因變量的影響程度大小。其模型描述如下:
式中,β0為回歸常數(shù),β1,β2,β3,…,βp為回歸系數(shù),通過最小二乘法確定回歸系數(shù),使平方和誤差最小。
利用IBM SPSS Modeler 數(shù)據(jù)挖掘軟件建立了不舒適度小時(shí)數(shù)逐步回歸模型,模型結(jié)構(gòu)如圖2 所示。采用步進(jìn)(條件:當(dāng)候選變量中最大F值的概率≤0.05時(shí),引入相應(yīng)變量;在引入方程的變量中,最小F值的概率≥0.1 時(shí),則剔除該變量)的方法,選擇進(jìn)入或除去的自變量。在34 個(gè)建筑設(shè)計(jì)參數(shù)中,逐步回歸方法建立的不舒適度小時(shí)數(shù)回歸模型保留了22 個(gè)參數(shù)。
圖2 逐步回歸模型結(jié)構(gòu)圖Fig.2 Stepwise regression model structure diagram
在回歸模型中,一般P≤0.05 則認(rèn)為具有顯著性,根據(jù)未標(biāo)準(zhǔn)化系數(shù)B值可以得到式(3)所示的不舒適度小時(shí)數(shù)回歸方程。不舒適度小時(shí)數(shù)回歸模型變量的回歸系數(shù)以及顯著性P值見表2。從表中可以看出,不舒適度小時(shí)數(shù)回歸模型的變量回歸系數(shù)所對應(yīng)的P <0.05,說明模型的自變量和因變量之間有明顯的線性關(guān)系,建立的回歸方程是有效的。
在進(jìn)行線性回歸分析時(shí),共線性會(huì)使參數(shù)估計(jì)不穩(wěn)定。方差膨脹因子(VIF)可以檢測多重共線性,它和容差(Tolerance)互為倒數(shù)關(guān)系,當(dāng)VIF≥10時(shí),說明變量之間有嚴(yán)重的多重共線性,其值越接近1,變量之間多重共線性越弱。從表2 統(tǒng)計(jì)的數(shù)值來看,不舒適度小時(shí)數(shù)回歸模型相關(guān)變量的VIF 均在1 附近,說明這些變量之間共線性較弱。
表2 逐步回歸系數(shù)Tab.2 Stepwise regression coefficient
回歸方程的擬合優(yōu)度檢驗(yàn),是檢驗(yàn)樣本數(shù)據(jù)聚集在樣本回歸直線周圍的密集程度,從而判斷回歸方程對樣本數(shù)據(jù)的代表程度。擬合優(yōu)度檢驗(yàn)一般采用調(diào)整決定系數(shù)R2實(shí)現(xiàn),該統(tǒng)計(jì)量的值越接近于1,擬合優(yōu)度越好,R2可由式(4)-式(8)計(jì)算得到。
式中,SSreg為回歸平方和;SSres為殘差平方和;SStot為總平方和;yi為真實(shí)值;fi為預(yù)測值;y-為平均值。
不舒適度小時(shí)數(shù)模擬值與SLR 預(yù)測值的回歸如圖3 所示??梢钥闯?,模擬和預(yù)測的數(shù)據(jù)結(jié)果有很好的一致性,不舒適度小時(shí)數(shù)回歸模型的R2為0.845,顯示出較好的擬合效果。
圖3 不舒適度小時(shí)數(shù)模擬值與SLR 預(yù)測值回歸圖Fig.3 Regression diagram of simulated value of discomfort degree hour and SLR predicted value
一個(gè)好的線性回歸模型必須滿足相關(guān)的所有假設(shè),其中包括線性、獨(dú)立性、正態(tài)性、方差齊性等。圖4 給出了不舒適度小時(shí)數(shù)回歸模型的標(biāo)準(zhǔn)化殘差正態(tài)概率P-P 圖。由圖可見,所有的點(diǎn)都比較靠近對角線,且結(jié)合殘差統(tǒng)計(jì)表3 得到的不舒適度小時(shí)數(shù)回歸的標(biāo)準(zhǔn)偏差為0.989(<2),說明回歸模型的殘差是呈正態(tài)分布的。
圖4 不舒適度小時(shí)數(shù)標(biāo)準(zhǔn)化殘差正態(tài)概率P-P 圖Fig.4 P-P graph of standardized residual normal probability of discomfort degree hour
表3 不舒適度小時(shí)數(shù)殘差統(tǒng)計(jì)表Tab.3 Residual statistical table of discomfort degree hour
為了評價(jià)不舒適度小時(shí)數(shù)逐步回歸模型的準(zhǔn)確度,采用相對誤差(RE)這一指標(biāo)來進(jìn)行衡量,其數(shù)學(xué)表達(dá)式如下:
式中,RP為利用SPSS 軟件線性回歸的預(yù)測值,RS是利用DesignBuilder 仿真軟件的計(jì)算值。
表4 給出了1 000 組預(yù)測樣本數(shù)據(jù)的相對誤差范圍。由此可見,利用SLR 方法預(yù)測的不舒適度小時(shí)數(shù)最大值和最小值分別為5741.61 和3791.59,相對誤差的最大值和最小值分別為16.03 和-10.32,再結(jié)合圖5 統(tǒng)計(jì)的不舒適度小時(shí)數(shù)相對誤差分層梯度范圍可以得出:相對誤差范圍在10%-20%的樣本只有8 組,占樣本總數(shù)的0.8%,絕大多數(shù)樣本相對誤差范圍小于10%,其中相對誤差小于2.5%更是達(dá)到了一半以上,說明利用SLR 能達(dá)到對不舒適度小時(shí)數(shù)較好的預(yù)測效果。
表4 不舒適度小時(shí)數(shù)相對誤差范圍Tab.4 Relative error range of discomfort degree hour
圖5 不舒適度小時(shí)數(shù)相對誤差分層梯度范圍Fig.5 Relative error stratified gradient range of discomfort degree hour
依據(jù)表2 中列出的22 個(gè)參數(shù)變量,為了分析每個(gè)自變量對不舒適度小時(shí)數(shù)的影響程度大小,采用單個(gè)自變量標(biāo)準(zhǔn)化系數(shù)值的絕對值與方程相關(guān)的所有自變量的絕對值和的比值作為評價(jià)標(biāo)準(zhǔn)。
通過表2 的標(biāo)準(zhǔn)化系數(shù),可以計(jì)算得到每個(gè)自變量所占比例大小,其統(tǒng)計(jì)結(jié)果如圖6 所示。從圖中可以看出,夏季室內(nèi)空調(diào)溫度對不舒適度小時(shí)數(shù)的影響程度最大,其次為冬季室內(nèi)采暖溫度和東向窗墻比。前三者標(biāo)準(zhǔn)回歸系數(shù)所占比值分別為26.4%、14.8%和11.9%,PCM類型和光伏傾角對不舒適度小時(shí)數(shù)的影響程度最小,所占比例只有1%。
圖6 預(yù)測變量影響程度大小Fig.6 The degree of influence of predictive variables
本文利用逐步回歸方法,建立了集成PVT-M建筑不舒適度小時(shí)數(shù)模型。通過對模型分析,可以得到以下結(jié)論:
(1)在選取的34 個(gè)設(shè)計(jì)變量中,利用逐步回歸方法建立的不舒適度小時(shí)數(shù)回歸方程中保留了22 個(gè)參數(shù),同時(shí)通過顯著性P 值驗(yàn)證了方程的有效性。
(2)在模型擬合優(yōu)度方面,不舒適度小時(shí)數(shù)SLR 模型的回歸系數(shù)為0.845,說明計(jì)算數(shù)據(jù)與預(yù)測數(shù)據(jù)之間具有較高的線性擬合度。
(3)在回歸模型誤差方面,相對誤差范圍小于2.5%的樣本數(shù)占半數(shù)以上,只有極少一部分樣本相對誤差范圍較大,說明SLR 是一種可行的模型預(yù)測方法,能實(shí)現(xiàn)對不舒適度小時(shí)數(shù)的準(zhǔn)確預(yù)測。
(4)在預(yù)測變量重要性方面,對不舒適度小時(shí)數(shù)影響程度最大的為夏季室內(nèi)空調(diào)溫度,影響程度最小的為PCM 類型和光伏傾角。