王俊凱,喬 非,祝 軍,倪嘉呈
(同濟大學 電子與信息工程學院,上海 201804)
燒結是鋼鐵企業(yè)中耗能最大的工序之一,研究燒結工序節(jié)能降耗意義重大.同時,燒結為高爐煉鐵提供主要原料,與后續(xù)生產(chǎn)的產(chǎn)量、質量以及能源消耗有著密切關系,因而研究和預測燒結礦的物理化學指標具有重要意義.
從能耗預測的角度來看,燒結工序中固體燃料消耗占到75%~80%,是燒結降耗的一個主要方向[1].然而目前相關研究還非常匱乏,僅有利用BPNN[2-3],RBFN[4]為代表的方法通過歷史數(shù)據(jù)挖掘輸入?yún)?shù)與能耗之間的關系,仍存在建模方法精度不高、模型訓練時間長的問題.從性能指標預測角度來看,這些指標可以分為生產(chǎn)指標、質量指標和化學指標三類.這方面的研究相對較多,大致也可分為機理建模、專家系統(tǒng)和數(shù)據(jù)挖掘三類.機理模型往往存在較多前提假設,導致與實際脫節(jié)嚴重,并且在描述復雜過程和對象時無能為力.專家系統(tǒng)也存在模型精度有限、推廣性不強的缺點.針對燒結過程具有非線性、大滯后、參數(shù)眾多且耦合嚴重的特點,應用基于數(shù)據(jù)的方法進行相關問題的建模和分析正被廣泛接受.目前,BP(back propagation)神經(jīng)網(wǎng)絡[5]、模糊神經(jīng)網(wǎng)絡[6]、灰色神經(jīng)網(wǎng)絡[7]等方法已有應用.神經(jīng)網(wǎng)絡的參數(shù)確定是影響模型精度的關鍵問題,故又有自適應遺傳神經(jīng)網(wǎng)絡[8]等方法用于網(wǎng)絡參數(shù)調(diào)整.然而,已有的這些研究存在以下幾個問題:①預測指標偏少,未考慮固體能耗、成品率等重要指標;②輸入層參數(shù)考慮不足,未考慮主要的操作參數(shù)和設備參數(shù);③訓練速度慢,容易陷入局部極小,對學習參數(shù)的選擇敏感.
針對以上問題,本文基于回歸型支持向量機方法研究了燒結礦能耗及性能指標的預測模型,探究了2種建模模式,在獲取典型鋼鐵企業(yè)燒結生產(chǎn)歷史數(shù)據(jù)的基礎上,從預測精度和時間效率上比較了其與多種建模方法效果的優(yōu)劣,對模型預測結果進行分析探討.
SVR算法的主要思想是:在傳統(tǒng)支持向量機分類的基礎上引入了不敏感損失函數(shù)(ε),尋找一個最優(yōu)分類面使得所有訓練樣本離該最優(yōu)分類面的誤差最?。?].
設含有l(wèi)個訓練樣本的訓練集樣本對為,其中,xi是第i個訓練樣本的輸入列向量表示d維實數(shù);yi∈R為相應的輸出值.
設在高維特征空間中建立的線性回歸函數(shù)為
式中:f(x)為回歸函數(shù)返回的預測值;Φ()x為非線性映射函數(shù);ω,b為系數(shù).
定義ε線性不敏感損失函數(shù)
其中,y={yi|i=1,2,…,l}為樣本的真實值.
式中:C為懲罰因子,C越大表示對訓練誤差大于ε的樣本懲罰越大,ε規(guī)定了回歸函數(shù)的誤差要求,ε越小表示回歸函數(shù)的誤差越小.
引入拉格朗日函數(shù),該問題即可轉換為對偶形式求解,即
式中,αi和是針對式(3)2個約束條件構造的拉格朗日乘子,核函數(shù)
SVR模型只需確定核函數(shù)類型及其參數(shù)和懲罰因子即可,故相比BP神經(jīng)網(wǎng)絡而言參數(shù)個數(shù)少,無需反復湊試,容易確定.
在燒結能耗及性能指標的預測中,常用的預測方法包括:多元線性回歸、BP神經(jīng)網(wǎng)絡、RBF(radical basis function)網(wǎng) 絡、ELM (extreme learning machine)[10]等.這些方法大致可分為兩類,對于線性回歸、SVR(support vector macline for regression)等回歸方法,每個回歸模型只能對一個指標進行預測,即只能建立多輸入單輸出模型,稱為MISO模式,如圖1a所示.對MISO模式,若要建立多個輸出的預測模型,則要根據(jù)輸出個數(shù)建立相應個數(shù)的MISO模型.而對于BP,RBF,ELM等神經(jīng)網(wǎng)絡,則可以直接建立多輸入多輸出模型,稱為MIMO模式,如圖1b所示.本文針對這2類建模模式分別建立相應模型并測試驗證,比較模式內(nèi)和模式間不同方法的預測精度和時間效率.
圖1 預測建模模式Fig.1 Modes of predictive modeling
建模過程一般分為以下5步,如圖2所示.
圖2 基于SVR預測建模過程Fig.2 Predictive modeling process based on SVR
步驟1:輸入輸出量提取.影響燒結工序能耗及性能指標的因素多種多樣且關系復雜.不僅混合料配比值、溶劑添加量等與燒結能耗和性能指標有密切聯(lián)系,一些操作參數(shù)如料層厚度、點火溫度和狀態(tài)參數(shù)如風箱負壓等也與燒結礦的產(chǎn)量、質量及能耗密不可分.
步驟2:數(shù)據(jù)清理.歷史數(shù)據(jù)中異常值對模型的精度影響很大,因而離群點檢測是很重要的一步.這里采用基于密度的方法進行離群點檢測.
步驟3:數(shù)據(jù)歸約與轉化.將原料加入量歸一化,轉換成0~1之間的數(shù)據(jù),所有原料配比之和為1.將生產(chǎn)參數(shù)數(shù)據(jù)轉化為0~1之間的歸一化數(shù)據(jù),以消除單位和數(shù)量級對于模型精度的影響.
步驟4:訓練網(wǎng)絡建立模型.將數(shù)據(jù)分為訓練集與測試集,確定核函數(shù)類型及其參數(shù)和懲罰因子C的大小,并用訓練集數(shù)據(jù)訓練SVR模型.
步驟5:測試網(wǎng)絡對比結果.用測試集測試模型精度,得到測試結果后先反歸一化處理,再比較預測值與真實值之間的誤差.采用4項指標對模型進行評價,分別是平均相對誤差emean、最大相對誤差emax、均方差Emse、決定系數(shù)R2.
式中:m為測試集樣本個數(shù);yk(k=1,2,…,m)為第k個樣本的真實值;yk(k=1,2,…,m)為第k個樣本的預測值.
以某年產(chǎn)650萬t鋼規(guī)模的鋼鐵聯(lián)合企業(yè)為例,選取2010年1~5月的122組燒結生產(chǎn)歷史數(shù)據(jù)進行分析建模,仿真試驗在MATLAB 2013a平臺上進行.
(1)變量選擇.輸入變量分為3類:原料參數(shù)、狀態(tài)參數(shù)和操作參數(shù).本例中共有26個輸入,其中原料參數(shù)包含8種原料的配比值,狀態(tài)參數(shù)包括南北兩側各7個風箱的負壓值,操作參數(shù)包括2個點火嘴的溫度以及料層厚度和臺車速度.輸出變量也有3類:生產(chǎn)指標、質量指標和化學指標.本例中共11個,其中生產(chǎn)指標包括固體能耗(solid energy consumption,SEC)和 成 品 率 (rate of finished products,RFP);質量指標主要指轉股指數(shù)(drum index,DI);化學指標則是7種化學成分的質量分數(shù)(全鐵TFe、氧化亞鐵FeO、氧化硅SiO2、氧化鈣CaO、氧化鎂 MgO、氧化鋁Al2O3、硫分S對應的質量分數(shù)分別為wTFe,wFeO,wSiO2,wCaO,wMgO,wAl2O3和wS)和堿度(R).因而,需建立11個SVR子模型.
(2)數(shù)據(jù)清理.為了清除數(shù)據(jù)中的噪聲,采用基于密度的方法檢測離群點,獲得較為干凈的113條樣本.為使結果與文獻[3]具有可比性,再從113條樣本中隨機選擇105條,其中90條作為訓練集,15條作為測試集.
(3)數(shù)據(jù)歸約.對原始數(shù)據(jù)進行歸一化處理,規(guī)范到[0.2,0.8]區(qū)間.歸一化公式如下:
式中:Qi為各輸入變量的第i個值;Qmax,Qmin分別為該輸入變量中的最大值和最小值;x~i為歸一化后該輸入變量的第i個量;a,c為參數(shù),這里a=0.6,c=(1-a)/2.
(4)創(chuàng)建模型.采用RBF核函數(shù),懲罰因子C和RBF核函數(shù)中的方差g通過交叉驗證法獲得.為了減少計算時間,當模型性能相同時優(yōu)先選擇C比較小的參數(shù)組合.
(5)測試網(wǎng)絡.SVR模型訓練完成后,利用15個測試樣本對模型進行測試驗證,反歸一化,記錄每個輸出變量的平均相對誤差、最大相對誤差、均方差、決定系數(shù)等性能指標.
研究不同的模型模式下多種預測方法的性能,對于MISO模式,采用多元線性回歸(LR)、多輸入單輸出BP神經(jīng)網(wǎng)絡(BP_MISO)作對比;對于MIMO模式,采用了多輸入多輸出BP神經(jīng)網(wǎng)絡(BP_MIMO)和RBF以及ELM等方法進行比較.需要說明的是,為使各試驗結果具有說服力,對于其他對照模型,已通過多次湊試將模型參數(shù)調(diào)至最佳狀態(tài).例如,對于BP_MISO模型,每個子模型隱層節(jié)點個數(shù)為10,隱層采用Sigmoid傳輸函數(shù),輸出層采用線性傳輸函數(shù),學習速率為0.05,訓練精度為0.001,最大訓練次數(shù)為5 000次,采用LM訓練函數(shù),動量因子取0.9.ELM模型隱層節(jié)點數(shù)為15,采用Sigmoid傳輸函數(shù).RBF網(wǎng)絡模型中徑向基函數(shù)擴展速度取0.3.同時,每種模型都運行10次,取每個指標的平均值作為最終結果.
(1)MISO模式模型結果.如表1所示,從相對誤差來看,SVR預測平均相對誤差均在5%以內(nèi),除了硫分質量分數(shù)預測誤差達到4.78%外,其余指標均在2%以內(nèi),最低僅為0.18%,較線性回歸和BP網(wǎng)絡預測精度高.從均方差來看,線性回歸各指標存在較大波動,原因在于某些指標與輸入因素間線性關系不大;BP和SVR模型中各指標均方差則相對平穩(wěn),這與兩者出色的非線性擬合能力有關,其中SVR各指標均方差均維持在較低水平,表現(xiàn)出更優(yōu)的性能.從決定系數(shù)也可以看出,SVR中絕大多數(shù)指標優(yōu)于其他2種方法.
表1 MISO模式模型測試結果比較Tab.1 Comparison of testing results between MISO models
(2)MIMO模式模型結果比較.如表2所示,BP_MIMO是文獻[3]中提出的方法,從相對誤差來看,三者平均相對誤差基本都在3%以內(nèi),只有硫分質量分數(shù)相對誤差偏高,這是因其實際數(shù)值較小的緣故.三者的誤差相差不大,這也說明3種神經(jīng)網(wǎng)絡都對解決該類問題具有較好的效果.從均方差和決定系數(shù)來看,ELM略優(yōu)于其他兩者.
表2 MIMO模式模型測試結果比較Tab.2 Comparison of testing results between MIMO models
(3)模式間對比分析.比較MISO和MIMO模式模型中性能表現(xiàn)最好的SVR和極限學習機模型,如圖3所示,從這2項主要指標來看,SVR和ELM都取得了較好的性能,SVR有8個指標仍略優(yōu)于ELM,例如SEC提升了0.60%,TFe質量分數(shù)提升了0.06%,F(xiàn)eO質量分數(shù)提升了0.89%.值得一提的是,S質量分數(shù)的預測在6種方法中僅SVR方法的平均相對誤差在5%內(nèi).
(4)時間效率分析.如圖4所示,線性回歸方法訓練時間和測試時間最短,但模型效果不佳;2種BP神經(jīng)網(wǎng)絡都存在訓練時間長的問題;RBF和ELM時間效率都較好,其中ELM網(wǎng)絡因不用調(diào)整神經(jīng)元的連接權值和神經(jīng)元閾值而學習速度更快.SVR模型雖然需要建立11個子模型,但因其拓撲結構由支持向量決定,避免了傳統(tǒng)神經(jīng)網(wǎng)絡需要反復試湊確定網(wǎng)絡結構的問題,其訓練時間略遜于線性回歸和
圖3 SVR和ELM試驗結果對比Fig.3 Comparison of results between SVR and ELM
圖4 6種預測模型訓練時間與測試時間比較Fig.4 Comparison of training and test time between six predictive models
ELM,而測試時間僅次于線性回歸法,比ELM優(yōu).
將回歸型支持向量機應用于鋼鐵企業(yè)燒結能耗及性能指標預測模型研究中,該模型較好地實現(xiàn)了基于實際生產(chǎn)數(shù)據(jù)預測燒結能耗及其性能指標的功能,通過多種模型的比較研究表明,SVR在該領域的應用取得了較好的模型精度和時間效率,這一模型可以與燒結配料優(yōu)化模型結合,通過優(yōu)化配料方案預測未來能耗值,如果能耗未能達到預期目標,再調(diào)整優(yōu)化模型中的約束,生成新的優(yōu)化解集,如此迭代,直至找到滿意的配料比,這也是今后的一個研究方向.
[1] 王社斌,許并社.鋼鐵生產(chǎn)節(jié)能減排技術[M].北京:化學工業(yè)出版社,2008.
WANG Shebin,XU Bingshe.Technology of energy saving and emission reduction for iron and steel production[M].Beijing:Chemical Industry Press,2008.
[2] 韓慶虹,金永龍.人工神經(jīng)網(wǎng)絡在燒結固體燃耗預測中的應用[J].冶金能源,2005,24(2):9.
HAN Qinghong, JIN Yonglong, ZHANG Junhong.Application of neural networks in the prediction of solid fuel consumption in sintering process[J].Energy for Metallurgical Industry,2005,24(2):9.
[3] 孟輝,喬非,李莉.基于BP神經(jīng)網(wǎng)絡的燒結能耗預測模型[J].機械工程師,2012(2):45.
MENG Hui,QIAO Fei,LI Li.Predictive model of energy consumption in sintering process based on BP neural network[J].Mechanical Engineer,2012(2):45.
[4] 馮朝輝,張華,王艷紅.燒結工序能耗預測與優(yōu)化研究[J].燒結球團,2012,37(6):13.
FENG Zhaohui,ZHANG Hua,WANG Yanhong.Study on prediction and optimization of sintering process energy consumption[J].Sintering and Pelletizing,2012,37(6):13.
[5] 王煒,陳畏林,賈斌,等.基于線性規(guī)劃和神經(jīng)網(wǎng)絡的優(yōu)化燒結配料系統(tǒng)開發(fā)[J].燒結球團,2006,31(1):27.
WANG Wei,CHEN Weilin,JIA Bin,etal.A sinter feed proportion optimum system based on linear programming and neural network[J].Sintering and Pelletizing,2006,31 (1):27.
[6] ER Mengjoo,LIAO Jun,LIN Jianya.Fuzzy neural networksbased quality prediction system for sintering process[J].IEEE Transactions on Fuzzy Systems,2000,8(3):314.
[7] 鮑雅萍,馬金元,宋強.基于灰色神經(jīng)網(wǎng)絡的燒結礦堿度組合預測[J].控制理論與應用,2008,25(4):791.
BAO Yaping, MA Jinyuan,SONG Qiang.Combination forecasting of sintered ore alkalinity based on grey neural network[J].Control Theory and Application,2008,25(4):791.
[8] 劉勇,程武山,孫鑫.基于自適應遺傳神經(jīng)網(wǎng)絡的燒結礦化學成分超前預報模型[J].燒結球團,2005,6(12):16.
LIU Yong,CHENG Wushan,SUN Xin.A prediction model of sinter chemistry based on adaptive genetic-neural network[J].Sintering and Pelletizing,2005,6(12):16.
[9] Shevad S K, Keerthi S S, Bhattacharyya C,etal.Improvements to the SMO Algorithm for SVM Regression[J].IEEE Transactions on Neural Networks,2000,11(5):1188.
[10] Sun Z L,Choi T M,Au K F,etal.Sales forecasting using extreme learning machine with applications in fashion retailing[J].Decision Support Systems,2008,46:411.