國(guó)家燃?xì)庥镁弋a(chǎn)品質(zhì)量監(jiān)督檢驗(yàn)中心(佛山) 張明偉
熱效率是燃?xì)庠罘浅V匾臒峁ば阅苤笜?biāo),因而國(guó)家強(qiáng)制要求檢測(cè)燃?xì)庠畹臒嵝?。熱效率的檢測(cè)會(huì)受到燃?xì)鉄嶂怠⑷細(xì)鉁囟纫约皽y(cè)量環(huán)境的溫度等因素的影響。理想的外在條件是采用燃?xì)獾臉?biāo)準(zhǔn)熱值,測(cè)試環(huán)境和燃?xì)鉁囟染跇?biāo)準(zhǔn)狀態(tài)下。但是在實(shí)際的測(cè)試過(guò)程中,滿足這樣的條件是存在一定困難的,因此國(guó)家標(biāo)準(zhǔn)GB16410-2007中,允許這些外在影響因素可以在一定范圍內(nèi)變化。從檢測(cè)的角度,需要了解這些外在因素對(duì)燃?xì)庠顭嵝实挠绊懗潭?,提出高精度測(cè)量燃?xì)庠畹男路椒ā?/p>
另一方面,在不同的季節(jié)測(cè)量的同一款燃?xì)庠畹臒嵝蕰?huì)有較大的波動(dòng),這種波動(dòng)對(duì)于燃?xì)庠钛邪l(fā)具有較大的干擾性,無(wú)法確認(rèn)燃?xì)庠顭嵝实淖兓莵?lái)自外在因素還是燃?xì)庠畹淖陨斫Y(jié)構(gòu)。因而,也需要了解外在因素對(duì)燃?xì)庠顭嵝蕼y(cè)量的影響規(guī)律。
建立物理模型來(lái)分析這些外在因素的變化是困難的,因?yàn)槟壳吧袩o(wú)法建立一個(gè)較為準(zhǔn)確的物理模型來(lái)計(jì)算燃?xì)庠畹臒嵝??;诖罅康娜細(xì)庠顭嵝实臏y(cè)試數(shù)據(jù),可以采用機(jī)器學(xué)習(xí)的方法,通過(guò)數(shù)據(jù)挖掘的方式對(duì)外在環(huán)境因素的影響進(jìn)行分析。隨機(jī)森林算法(Rondom forest algorithm)是一種集成機(jī)器學(xué)習(xí)算法,隨機(jī)森林由很多的樹(shù)組成,每一棵樹(shù)之間沒(méi)有關(guān)聯(lián)。采用自助采樣法帶來(lái)的樣本擾動(dòng)和對(duì)屬性隨機(jī)抽取帶來(lái)的屬性擾動(dòng),使得作為隨機(jī)森林基學(xué)習(xí)器的樹(shù)具有“多樣性”。隨機(jī)森林可以用于分類和回歸,具有計(jì)算開(kāi)銷小、泛化性能強(qiáng)、可以擬合復(fù)雜的非線性函數(shù)等諸多優(yōu)點(diǎn)。
本文利用實(shí)驗(yàn)數(shù)據(jù)通過(guò)隨機(jī)森林算法的學(xué)習(xí)和驗(yàn)證,建立外部因素的熱負(fù)荷和熱效率的關(guān)系模型,并通過(guò)模型進(jìn)行影響因素重要性分析。
2.1.1 構(gòu)建模型
實(shí)驗(yàn)獲得的485組數(shù)據(jù)中,數(shù)據(jù)集的75%的劃分為訓(xùn)練集,其余25%劃分為測(cè)試集。特征為室溫波動(dòng)、燃?xì)鉁囟炔▌?dòng)和低熱值波動(dòng),標(biāo)記為熱效率。采用隨機(jī)森林機(jī)器學(xué)習(xí)算法,使用交叉驗(yàn)證法得到最優(yōu)參數(shù)。訓(xùn)練得到熱效率預(yù)測(cè)模型,探究三個(gè)外部因素(室溫、燃?xì)鉁囟群偷蜔嶂担?duì)熱效率的影響。
2.1.2 模型分析
測(cè)試集和訓(xùn)練集熱效率預(yù)測(cè)值與實(shí)際值的關(guān)系、模型預(yù)報(bào)熱效率的絕對(duì)誤差和相對(duì)誤差分別如圖2-1、2-2和2-3所示。
圖2-1 模型測(cè)試集和訓(xùn)練集熱效率預(yù)測(cè)值與實(shí)際值關(guān)系
圖2-2 模型熱效率預(yù)報(bào)的絕對(duì)誤差
圖2-3 模型熱效率預(yù)報(bào)的相對(duì)誤差
輸出顯示,測(cè)試數(shù)據(jù)熱效率平均絕對(duì)誤差為1.147%,訓(xùn)練數(shù)據(jù)熱效率平均絕對(duì)誤差為0.549%。統(tǒng)計(jì)結(jié)果表明,對(duì)于熱效率絕對(duì)誤差[-2,2]%內(nèi),占所有數(shù)據(jù)集的97.13%;對(duì)于熱效率相對(duì)誤差[-0.03,0.03]內(nèi),占所有數(shù)據(jù)集的97.13%,這些表明模型性能良好。
此外,對(duì)于三個(gè)輸入特征:室溫波動(dòng)、燃?xì)鉁囟炔▌?dòng)和低熱值波動(dòng),特征重要度分別為0.26725、0.28533和0.44742。
根據(jù)建立的模型,進(jìn)行了影響因素的特征重要程度分析,分析結(jié)果如圖2-4所示。從圖2-4可以看到,對(duì)熱效率影響的重要程度最大的是燃?xì)獾蜔嶂档牟▌?dòng),其次是燃?xì)鉁囟炔▌?dòng),最后才是室溫波動(dòng)。
圖2-4 三個(gè)熱效率預(yù)測(cè)模型中的特征重要程度
利用所建立的數(shù)據(jù)模型,對(duì)室溫、燃?xì)鉁囟群偷蜔嶂祵?duì)熱效率的影響進(jìn)行了單變量分析。
燃?xì)鉄嶂?、燃?xì)鉁囟纫约笆覝貙?duì)熱效率的單變量影響分別如圖2-5、2-6、2-7所示。
燃?xì)鉄嶂祵?duì)燃?xì)庠顭嵝实挠绊懛浅o@著,一般地,采用高熱值燃?xì)鉁y(cè)量的熱效率要低于采用低熱值燃?xì)獾臏y(cè)量結(jié)果。因此在進(jìn)行燃?xì)庠顭嵝蕼y(cè)量,如果有條件,盡量保證燃?xì)鉄嶂档姆€(wěn)定。
燃?xì)鉁囟仍?8-22℃范圍內(nèi),對(duì)燃?xì)庠顭嵝实臋z測(cè)影響非常劇烈,這個(gè)區(qū)域是檢測(cè)燃?xì)庠畹闹饕細(xì)鉁囟葏^(qū)域。因而燃?xì)鉁囟鹊木_測(cè)定對(duì)燃?xì)庠顭嵝蕶z測(cè)精度意義重大。
觀察到,隨室溫增加,熱效率波動(dòng)下降,22℃之后又波動(dòng)上升;隨燃?xì)鉁囟仍黾樱瑹嵝什▌?dòng)較大,整體呈增加趨勢(shì),最后趨于平緩;隨低熱值增加,熱效率波動(dòng)下降。
圖2-5 低熱值與熱效率關(guān)系
圖2-6 燃?xì)鉁囟扰c熱效率關(guān)系
圖2-7 室溫與熱效率關(guān)系
(1)隨機(jī)森林算法適用于研究環(huán)境、氣源條件對(duì)燃?xì)庠顭嶝?fù)荷和熱效率的影響。利用隨機(jī)森林算法可以成功地建立室溫、燃?xì)鉁囟?、低熱值與燃?xì)庠顭嵝实年P(guān)系模型,模型能夠較好地預(yù)報(bào)熱效率。
(2)在室溫、燃?xì)鉁囟取⒌蜔嶂等齻€(gè)因素中,對(duì)熱負(fù)荷影響重要程度為低熱值>室溫>燃?xì)鉁囟龋粚?duì)熱效率影響重要程度為低熱值>燃?xì)鉁囟龋臼覝亍?/p>
(3)在燃?xì)庠畹臒嵝蕶z測(cè)中盡量保持燃?xì)鉄嶂档姆€(wěn)定,提高燃?xì)鉁囟鹊臏y(cè)量精度可以提高燃?xì)庠顭嵝实臏y(cè)量精度。