王煜林,周登極,郝佳瑞,黃大文
(上海交通大學(xué) 機(jī)械與動(dòng)力工程學(xué)院, 上海 200240)
壓縮機(jī)是燃?xì)廨啓C(jī)中的主要耗能部件.為實(shí)現(xiàn)壓縮機(jī)組的能耗監(jiān)測、提升壓縮機(jī)組控制策略,需要對其功率進(jìn)行準(zhǔn)確、實(shí)時(shí)的測量.壓縮機(jī)功率測量依靠扭矩儀實(shí)現(xiàn),其造價(jià)高昂且大型扭矩儀尚未實(shí)現(xiàn)國產(chǎn)化.同時(shí),為壓縮機(jī)安裝扭矩儀將增加壓縮機(jī)的軸系長度,降低系統(tǒng)的可靠性.因此,目前大多采用軟測量技術(shù)對壓縮機(jī)功率進(jìn)行計(jì)算.
軟測量是指對于系統(tǒng)中難以測量的重要變量,選擇一組既與該變量有密切聯(lián)系又容易測量的二次變量,通過構(gòu)造某種數(shù)學(xué)關(guān)系實(shí)現(xiàn)對該變量的估計(jì)[1].軟測量方法的研究目前有兩種方向,一種基于機(jī)理,一種基于數(shù)據(jù).基于機(jī)理的軟測量方法研究目標(biāo)系統(tǒng)的結(jié)構(gòu)及其運(yùn)行過程,并通過機(jī)理公式搭建目標(biāo)變量的計(jì)算模型以實(shí)現(xiàn)對變量的估計(jì).早在2005年便有研究通過對滑片式壓縮機(jī)的結(jié)構(gòu)和受力過程進(jìn)行分析,對其功率軟測量模型進(jìn)行改進(jìn)[2].近年來的研究通過分析不同工況下壓縮機(jī)的機(jī)理公式,已將其功率測量的相對誤差降低至2.74%[3].上述測量方法的優(yōu)勢在于其普適性,對于任意系統(tǒng),只要明確參數(shù)的計(jì)算機(jī)理,便可以對該參數(shù)進(jìn)行測量.但其計(jì)算速度較慢,其預(yù)測難以具備實(shí)時(shí)性.同時(shí),由于實(shí)際生產(chǎn)中的多種環(huán)境擾動(dòng),機(jī)理模型的準(zhǔn)確率往往較低.
基于數(shù)據(jù)的軟測量方法直接根據(jù)系統(tǒng)的輸入輸出搭建機(jī)器學(xué)習(xí)模型,并使用已有數(shù)據(jù)對模型進(jìn)行訓(xùn)練擬合,從而使模型具備對未知輸入的預(yù)測能力.文獻(xiàn)[4]中提出一種使用等度量映射算法的軟測量建模方法.文獻(xiàn)[5]中使用改進(jìn)的徑向基(RBF)神經(jīng)網(wǎng)絡(luò)搭建軟測量模型對污水中的化學(xué)需氧量進(jìn)行計(jì)算,并將測量的相對誤差降低至1.25%以內(nèi).相比于基于機(jī)理的方法,基于數(shù)據(jù)的軟測量方法擁有更高的準(zhǔn)確率和計(jì)算效率,其無需具備對象的先驗(yàn)知識(shí),而根據(jù)對象的輸入輸出直接建模,在解決高度非線性和嚴(yán)重不確定性系統(tǒng)的測量上具有巨大潛力[6].但是,機(jī)器學(xué)習(xí)模型本身對數(shù)據(jù)集的依賴程度較大,模型的準(zhǔn)確率極大程度上取決于數(shù)據(jù)集的泛化能力,而許多工業(yè)系統(tǒng)中由于生產(chǎn)需要、測量手段單一等問題,高泛化性的數(shù)據(jù)集往往難以獲取.對數(shù)據(jù)集較大的依賴性限制了基于數(shù)據(jù)的軟測量方法在較多場合的應(yīng)用.
為彌補(bǔ)兩種軟測量方法的不足,文獻(xiàn)[7]中提出一種融合機(jī)理模型和數(shù)據(jù)的軟測量方法,其使用機(jī)理模型對目標(biāo)參數(shù)進(jìn)行計(jì)算,并使用神經(jīng)網(wǎng)絡(luò)作為補(bǔ)償器對測量結(jié)果進(jìn)行矯正,取得了優(yōu)于機(jī)理模型的測量結(jié)果.然而,由于該方法中的主要計(jì)算模塊仍為機(jī)理模型,其運(yùn)行效率并未得到有效提高;同時(shí),由于該方法的結(jié)果仍然依賴于神經(jīng)網(wǎng)絡(luò)的矯正,雖然能夠在一定程度上降低軟測量對數(shù)據(jù)集的依賴程度,但其準(zhǔn)確率仍然低于傳統(tǒng)基于數(shù)據(jù)的軟測量方法.
基于以上研究現(xiàn)狀,本文提出一種基于可解釋神經(jīng)網(wǎng)絡(luò)的壓縮機(jī)功率軟測量方法,將機(jī)理關(guān)系預(yù)置于神經(jīng)網(wǎng)絡(luò)之中,不但能使軟測量模型具備神經(jīng)網(wǎng)絡(luò)模型的快速性以及準(zhǔn)確性,而且能降低模型對數(shù)據(jù)集的依賴程度.在對壓縮機(jī)功率的測量中,搭建3種軟測量模型,分別為反向傳播(BP)神經(jīng)網(wǎng)絡(luò)模型和兩種融入不同程度機(jī)理的可解釋神經(jīng)網(wǎng)絡(luò)模型,并對比三者在不同泛化能力數(shù)據(jù)集上的表現(xiàn),驗(yàn)證了可解釋神經(jīng)網(wǎng)絡(luò)模型在壓縮機(jī)功率測量上的有效性.
BP神經(jīng)網(wǎng)絡(luò)是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),亦是應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)之一.逆向傳播算法可參考文獻(xiàn)[8],本文僅對網(wǎng)絡(luò)前饋結(jié)構(gòu)進(jìn)行簡述.
一個(gè)多層BP神經(jīng)網(wǎng)絡(luò)前饋結(jié)構(gòu)包括輸入層、輸出層和若干隱藏層.每層的任意節(jié)點(diǎn)和下一層的所有節(jié)點(diǎn)相連,連接權(quán)重組成權(quán)值矩陣w.網(wǎng)絡(luò)相鄰兩層之間的前向傳遞關(guān)系如下式所示:
(1)
BP神經(jīng)網(wǎng)絡(luò)的輸入、輸出根據(jù)實(shí)際系統(tǒng)的輸入、輸出參數(shù)確定.實(shí)驗(yàn)中,測得5組與壓縮機(jī)功率PC相關(guān)的二次變量分別為壓縮機(jī)轉(zhuǎn)速n, 壓縮機(jī)進(jìn)口溫度Tin,壓縮機(jī)出口溫度Tout,壓縮機(jī)進(jìn)口壓強(qiáng)pin,壓縮機(jī)出口壓強(qiáng)pout,作為神經(jīng)網(wǎng)絡(luò)的輸入.
根據(jù)模型的輸入、輸出,搭建BP神經(jīng)網(wǎng)絡(luò)模型.將該模型作為模型A,其結(jié)構(gòu)如圖1所示.
圖1 模型A前饋結(jié)構(gòu)Fig.1 Feed-forward structure of Model A
機(jī)理BP神經(jīng)網(wǎng)絡(luò)模型的搭建在模型A的基礎(chǔ)上進(jìn)行,并融入壓縮機(jī)的部分機(jī)理公式.根據(jù)能量守恒可知,若壓縮機(jī)損耗不計(jì),壓縮機(jī)功率等于壓縮機(jī)中氣體質(zhì)量流量和單位質(zhì)量氣體焓增的乘積,則有:
PC=qm(hout-hin)
(2)
式中:qm為壓縮機(jī)氣體質(zhì)量流量;hin為壓縮機(jī)進(jìn)口氣體比焓;hout為壓縮機(jī)出口氣體比焓.
氣體質(zhì)量流量取決于壓縮機(jī)轉(zhuǎn)速和入口氣體的熱力學(xué)狀態(tài).因此,可以得到如下函數(shù)關(guān)系f1:
qm=f1(n,pin,Tin)
(3)
壓縮機(jī)中單位質(zhì)量的氣體焓增取決于進(jìn)出口氣體的熱力學(xué)狀態(tài),氣體的熱力學(xué)狀態(tài)可由氣體的溫度、壓強(qiáng)、比體積中任意二者決定.因此,可以得到如下函數(shù)關(guān)系:
hout-hin=f2(pin,pout,Tin,Tout)
(4)
Δh=hout-hin
(5)
PC=f1(n,pin,Tin)f2(pin,pout,Tin,Tout)
(6)
根據(jù)式(6)在神經(jīng)網(wǎng)絡(luò)模型中融入乘法運(yùn)算,搭建可解釋神經(jīng)網(wǎng)絡(luò)模型,作為模型B,其網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示.
圖2 模型B前饋結(jié)構(gòu)Fig.2 Feed-forward structure of Model B
上述可解釋神經(jīng)網(wǎng)絡(luò)模型由兩部分組成,一部分以轉(zhuǎn)速、壓縮機(jī)進(jìn)口氣體的溫度、壓力作為輸入,計(jì)算壓縮機(jī)中的氣體流量;另一部分以壓縮機(jī)進(jìn)出口氣體狀態(tài)作為輸入,計(jì)算壓縮機(jī)中單位質(zhì)量氣體的焓變.將這兩部分計(jì)算結(jié)果相乘并作為模型最終的輸出.
由于壓縮機(jī)在實(shí)際運(yùn)行過程中,其損耗不可忽略,引入壓縮機(jī)效率ηC,可表示為
ηCPC=qmΔh
(7)
壓縮機(jī)的運(yùn)行效率ηC可由壓氣機(jī)的壓比πC和折合轉(zhuǎn)速nC確定,詳細(xì)推導(dǎo)過程參考文獻(xiàn)[10],可表示為
(8)
(9)
可以得到如下函數(shù)關(guān)系:
ηC=f3(πC,n,Tin)
(10)
壓縮機(jī)功率計(jì)算公式可改寫為
(11)
依照上述機(jī)理,在模型B中增加效率計(jì)算模塊,得到模型C,其結(jié)構(gòu)如圖3所示.
圖3 模型C前饋結(jié)構(gòu)Fig.3 Feed-forward structure of Model C
相比于模型B,模型C新增了一部分網(wǎng)絡(luò)結(jié)構(gòu),用于計(jì)算壓縮機(jī)的效率.該部分網(wǎng)絡(luò)將pin、pout整合為壓比,與Tin、n共同作為輸入計(jì)算得到效率.由于反向傳播過程中除法的求導(dǎo)過程較為繁瑣,令該部分網(wǎng)絡(luò)計(jì)算效率的倒數(shù)1/ηC,并將其結(jié)果和qm、Δh相乘,最終獲得壓縮機(jī)的輸入功率.
綜上所述,實(shí)驗(yàn)中搭建了3種軟測量模型.其中,模型A為BP神經(jīng)網(wǎng)絡(luò)模型;模型B為融入少量機(jī)理的可解釋神經(jīng)網(wǎng)絡(luò)模型;模型C為融入較多機(jī)理的可解釋神經(jīng)網(wǎng)絡(luò)模型.
實(shí)驗(yàn)數(shù)據(jù)來源于一臺(tái)PCL803型號(hào)壓縮機(jī).采用美國KOP-FLEX高性能扭矩儀聯(lián)軸器,連接于動(dòng)力渦輪和壓縮機(jī)中間,用于功率測量.實(shí)驗(yàn)中,令壓縮機(jī)持續(xù)運(yùn)行8.5 h,每隔1 s進(jìn)行一次功率采樣,并記錄相應(yīng)的壓縮機(jī)轉(zhuǎn)速、進(jìn)出口溫度及壓力.實(shí)驗(yàn)共測得 30 602 組時(shí)序數(shù)據(jù).數(shù)據(jù)集中,PC隨時(shí)間t的變化曲線如圖4所示.
圖4 數(shù)據(jù)集中壓縮機(jī)功率隨時(shí)間的變化曲線Fig.4 Compressor power versus time in dataset
首先,使用前2.1×104個(gè)時(shí)間節(jié)點(diǎn)的數(shù)據(jù)(以下簡稱為數(shù)據(jù)集(D)1)作為訓(xùn)練集訓(xùn)練模型A、B、C,并對后 9 602 個(gè)時(shí)間節(jié)點(diǎn)的功率進(jìn)行預(yù)測.數(shù)據(jù)集1作為訓(xùn)練集幾乎包括了所有可能產(chǎn)生的功率數(shù)值,能夠保證數(shù)據(jù)集的泛化能力.該組研究的目的在于驗(yàn)證機(jī)理BP神經(jīng)網(wǎng)絡(luò)模型的有效性,同時(shí)為可解釋神經(jīng)網(wǎng)絡(luò)模型在泛化性較差數(shù)據(jù)集上的預(yù)測結(jié)果提供對照.
降低數(shù)據(jù)集的泛化能力,僅使用前1.8×104個(gè)時(shí)間節(jié)點(diǎn)的數(shù)據(jù)(以下簡稱為數(shù)據(jù)集2)作為訓(xùn)練集訓(xùn)練模型A、B、C,以驗(yàn)證可解釋神經(jīng)網(wǎng)絡(luò)模型在泛化性較差數(shù)據(jù)集上的有效性.實(shí)驗(yàn)中,設(shè)定訓(xùn)練簇大小為300,最大迭代次數(shù)為400,采用Adam算法[11]對模型進(jìn)行優(yōu)化,以模型在驗(yàn)證集上的誤差趨于穩(wěn)定作為收斂依據(jù).采用均方根誤差(RMSE),平均絕對誤差(MAE)作為模型準(zhǔn)確率評價(jià)依據(jù).其計(jì)算公式如下所示:
(12)
(13)
表1 模型參數(shù)設(shè)置Tab.1 Setting of model parameters
模型A、B、C在數(shù)據(jù)集1和2上的擬合及預(yù)測結(jié)果如圖5~7所示;表2所示為壓縮機(jī)輸入功率預(yù)測值.由于數(shù)據(jù)集1的泛化性良好,A、B、C模型在數(shù)據(jù)集1上具有相似的、良好的表現(xiàn),其均方根誤差、平均絕對誤差均在1%以下.其中,模型C在測試集上的均方根誤差為0.94%,相比模型A降低了1.1%;平均絕對誤差為0.49%,相比模型A降低了41.0%.3種模型的功率預(yù)測曲線和實(shí)際曲線基本重合,僅在某些功率突變的時(shí)間段內(nèi)有小幅度的偏離.
表2 壓縮機(jī)輸入功率預(yù)測準(zhǔn)確率Tab.2 Accuracy of input power prediction of compressor
圖5 模型A在D1和D2上的訓(xùn)練及其預(yù)測曲線Fig.5 Training and prediction curves of Model A on D1 and D2
而在泛化性較差的數(shù)據(jù)集2上,模型A、B、C的預(yù)測偏差均有一定程度的增加,但模型B和C具有遠(yuǎn)好于模型A的預(yù)測表現(xiàn).其中,模型C在測試集上的均方根誤差為1.28%,相比模型A降低了79.8%;平均絕對誤差為0.73%,相比模型A降低了86.1%.而對于僅融入較少機(jī)理的模型B,其表現(xiàn)雖然不及模型C,但也展現(xiàn)出遠(yuǎn)好于模型A的預(yù)測能力.在實(shí)際預(yù)測曲線上也可以看到,模型A在預(yù)測1.9×104~2.7×104時(shí)間段以及2.9×104~3×104時(shí)間段內(nèi)的功率變化時(shí)產(chǎn)生了較大的偏差,而模型C在各個(gè)時(shí)間段上的預(yù)測結(jié)果均良好.
圖6 模型B在數(shù)據(jù)集1和 2上的訓(xùn)練及預(yù)測曲線Fig.6 Training and prediction curves of Model B on D1 and D2
圖7 模型C在數(shù)據(jù)集1和 2上的訓(xùn)練及預(yù)測曲線Fig.7 Training and prediction curves of Model C on D1 and D2
綜合以上實(shí)驗(yàn)結(jié)果,認(rèn)為可解釋神經(jīng)網(wǎng)絡(luò)模型在使用泛化性良好的數(shù)據(jù)集訓(xùn)練時(shí),具有不弱于BP神經(jīng)網(wǎng)絡(luò)模型的準(zhǔn)確率和穩(wěn)定性;在使用泛化性較差的數(shù)據(jù)集進(jìn)行訓(xùn)練時(shí),可解釋神經(jīng)網(wǎng)絡(luò)模型相比BP神經(jīng)網(wǎng)絡(luò)模型具有更強(qiáng)的預(yù)測能力.基于可解釋神經(jīng)網(wǎng)絡(luò)的軟測量模型,不但具有傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型的準(zhǔn)確性和高效性,同時(shí)還降低了模型訓(xùn)練過程對數(shù)據(jù)集的依賴程度,是一種有效的壓縮機(jī)功率軟測量方法.
本文提出一種基于可解釋神經(jīng)網(wǎng)絡(luò)的壓縮機(jī)功率軟測量方法并對其進(jìn)行驗(yàn)證.搭建了BP神經(jīng)網(wǎng)絡(luò)模型和融入不同程度機(jī)理的可解釋模型,并基于壓縮機(jī)實(shí)際運(yùn)行數(shù)據(jù)構(gòu)建不同泛化性的數(shù)據(jù)集對模型進(jìn)行訓(xùn)練和測試,以驗(yàn)證可解釋模型在壓縮機(jī)功率軟測量上的可行性.通過對模型的準(zhǔn)確率加以評估和比較,獲得以下結(jié)論.
(1) BP神經(jīng)網(wǎng)絡(luò)模型和融入不同程度機(jī)理的可解釋神經(jīng)網(wǎng)絡(luò)模型在壓縮機(jī)功率測量上表現(xiàn)良好,在數(shù)據(jù)集泛化能力得到保證的情況下,模型在測試集上的誤差均在1%以下.可解釋神經(jīng)網(wǎng)絡(luò)相比BP神經(jīng)網(wǎng)絡(luò),在準(zhǔn)確率方面有微小幅度的提高.該方法能夠?qū)嚎s機(jī)功率進(jìn)行有效測量.
(2) 當(dāng)數(shù)據(jù)集的泛化能力較差時(shí),可解釋神經(jīng)網(wǎng)絡(luò)在壓縮機(jī)功率測量方面具有較大的優(yōu)勢,且其準(zhǔn)確率和融入機(jī)理與實(shí)際的契合程度呈正相關(guān).機(jī)理約束降低了訓(xùn)練過程對數(shù)據(jù)集的依賴程度,使得該軟測量方法具有更強(qiáng)的適應(yīng)性.
(3) 可解釋神經(jīng)網(wǎng)絡(luò)模型降低了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型對數(shù)據(jù)集的依賴程度,在許多工業(yè)數(shù)據(jù)不易獲取、數(shù)據(jù)集泛化能力難以評估的場合中,該方法可以使用泛化性較低的數(shù)據(jù)集訓(xùn)練出高準(zhǔn)確率的模型,具有良好的應(yīng)用價(jià)值.