潘艷秋,張超陽,李鵬飛,俞 路
(大連理工大學化工學院,遼寧 大連 116024)
2022年,工業(yè)和信息化部印發(fā)了《“十四五”推動石化化工行業(yè)高質量發(fā)展的指導意見》,指出石化化工行業(yè)要推動產業(yè)結構調整、加快改造提升、提高行業(yè)競爭能力[1]。煉化企業(yè)可以通過信息智能化轉型來開發(fā)提升產業(yè)競爭力的核心技術,助力煉化企業(yè)實現(xiàn)高效綠色化的增質提效[2-3]。
催化重整是生產石化原料和提升汽油質量的重要手段[4],全球約27%的汽油來自重整汽油、70%以上的芳烴來自重整芳烴、50%以上的煉油用氫來自重整產氫[5]。目前,針對催化重整裝置的研究以對裝置各單元進行建模和過程優(yōu)化為主,如王連山等[6]針對某煉油廠連續(xù)催化重整過程提出了一種38集總組分動力學模型,并應用序列二次規(guī)劃法(SQP)進行優(yōu)化求解,最終可將芳烴收率提高0.17%。宋舉業(yè)等[7]以中國石化洛陽分公司1.2 Mt/a連續(xù)催化重整裝置為背景,建立了C4/C5分離流程模型,并對塔底溫度和進料溫度進行優(yōu)化,實現(xiàn)降本增效達450萬元/a。Askari等[8]利用Aspen HYSYS軟件對煉油廠催化重整裝置進行模擬,考察了原料組成、反應溫度、反應壓力對最終產品分布和汽油辛烷值的影響,結果表明該動力學模型準確,模擬方法有效。
由于催化重整加工過程機理十分復雜,重整裝置具有時滯性強,操作參數(shù)高非線性、強耦合性特點,因而構建與實際運行狀況高度一致的機理模型難度很大。隨著互聯(lián)網技術和大數(shù)據(jù)技術的快速發(fā)展,以神經網絡為代表的數(shù)據(jù)驅動建模技術成為化工過程機理研究的重要手段[9]。例如,王杰等[10]以某煉化企業(yè)運行數(shù)據(jù)為基礎,結合最大信息系數(shù)(MIC)法和Pearson相關系數(shù)法篩選出22個變量,基于BP神經網絡建立了汽油研究法辛烷值(RON)預測模型,并采用遺傳算法(GA)對模型參數(shù)進行優(yōu)化,使重整汽油RON損失降低了25%。石翠翠等[11]針對特征變量存在高度非線性和冗余的特點,提出了一種基于偏最小二乘回歸(PLS)和互信息(MI)組合降維的改進天牛須搜索算法(RSBAS)優(yōu)化的BP神經網絡模型(PLS-MI-RSBASBP),用于S Zorb裝置汽油辛烷值預測。結果表明,相較于普通BP神經網絡模型,該模型的預測性能更優(yōu)秀。
然而,針對催化重整裝置的數(shù)據(jù)驅動建模研究目前仍鮮有報道?;诖?本課題以國內某煉油廠催化重整裝置實際運行數(shù)據(jù)為基礎,通過設置數(shù)據(jù)篩選和處理規(guī)則構建BP神經網絡數(shù)據(jù)驅動模型,用以預測重整裝置苯產品中甲苯和非芳烴含量;進而通過實際應用效果對該模型進行評價,為后續(xù)全裝置實時優(yōu)化與平臺模型集成提供技術支撐。
以某煉油廠連續(xù)催化重整裝置為對象,按每1 h采集1次數(shù)據(jù)的頻率,連續(xù)采集了其運行45 d的實時數(shù)據(jù),共計1 000組數(shù)據(jù)。每組數(shù)據(jù)均包括流股流量、系統(tǒng)溫度、流股組成共3類60個變量參數(shù)。其中部分關鍵數(shù)據(jù)如表1所示。由于通過實時監(jiān)測系統(tǒng)獲取的裝置操作數(shù)據(jù)經常存在隨機誤差、儀表故障、記錄錯誤等問題,而且部分變量間存在高度相關性,不能直接用于數(shù)據(jù)建模,因此需要進行數(shù)據(jù)處理以提高數(shù)據(jù)質量。
表1 部分變量數(shù)據(jù)采集結果
(1)數(shù)據(jù)初篩:①剔除恒為零的數(shù)據(jù);②保留能夠代表裝置運行狀況的變量。初篩后每組數(shù)據(jù)由60個變量減少為30個變量。
(2)顯著誤差校正:由于裝置實時運行數(shù)據(jù)樣本為正態(tài)分布或近似正態(tài)分布,故依據(jù)拉依達準則[12]進行數(shù)據(jù)顯著誤差檢測和校正。
數(shù)據(jù)樣本中不同變量的量綱和數(shù)據(jù)量級不同,無法直接用于建模分析,故采用線性無量綱法[13]中的極值法對數(shù)據(jù)樣本進行無量綱化處理,在盡可能縮小各變量數(shù)據(jù)間數(shù)量級差異的同時保持變異系數(shù)盡量不變[14]。數(shù)據(jù)無量綱標準化處理方法見式(1)。
(1)
式中:x為原數(shù)據(jù);x′為標準化后的數(shù)據(jù);xmax與xmin分別為原數(shù)據(jù)的最大值與最小值。
基于重整裝置運行過程的復雜性,裝置實時變量數(shù)據(jù)之間存在高度非線性關系和強相關性。為避免冗余變量加大模型的計算量及模型臃腫性,需要篩選出與目標變量具有強相關性的變量作為模型輸入變量。由于輸入變量之間也存在強相關性,所以需要去除輸入變量之間具有強相關性的變量,保證數(shù)據(jù)的高質量。常見的變量相關性分析方法有Pearson,Spearman,Kendall,MIC等[15],其中MIC方法適用范圍更廣、計算復雜度較低、魯棒性較高[16-18],更適用于催化重整裝置的變量相關性分析。MIC方法基于隨機變量的n個觀測值來計算,見式(2)。
(2)
式中:a、b分別是網格劃分數(shù)量;B為最大網格數(shù),式中B=n0.6[18];X,Y為基于網格的兩個離散變量;I(X,Y)為互信息。其中,0≤MIC≤1;當MIC(X,Y)=0時,說明兩個變量相互獨立;當MIC(X,Y)=1時,說明兩個變量線性相關。
1.3.1輸入變量與目標輸出變量間相關性分析
采用MIC法計算初步篩選后28個輸入變量與2個目標變量間的相關性,結果如表2所示。其中MIC1和MIC2為各輸入變量分別與目標輸出變量1、2的MIC分析結果。
表2 輸入變量與目標變量的相關性
為了盡可能地保留關鍵變量,以所有MIC計算結果的平均值作為分界線對變量進行取舍。由表2可知,輸入變量與輸出變量1、2的相關性均值分別為0.238 2和0.198 4,而對兩個輸出變量的平均均值為0.233 3。因此,舍去相關性小于0.233 3的15個輸入變量[15,19],保留高于平均均值的13個變量,進行變量間相關性計算。
1.3.2輸入變量間相關性分析
同樣,采用MIC方法對上述13個輸入變量進行相關性分析,結果見圖1。
圖1 輸入變量間相關性分析結果
由圖1可知,變量6(裝置產氫流量)與多個變量間相關性系數(shù)較大(≥0.8),說明其相關性較高,故舍去變量6[20-21]。最終,共保留12個輸入變量用于建模,見表3。
表3 相關性分析后優(yōu)選的輸入變量
BP神經網絡具有很強的非線性擬合能力,對具有復雜運行狀況和數(shù)據(jù)強非線性特點的連續(xù)催化重整裝置建模尤為適用[22]。采用性能優(yōu)異的B-R訓練算法[23],將上述預處理好的數(shù)據(jù)樣本按照70%,15%,15%的比例隨機劃分為訓練集、驗證集、測試集3組,訓練集和驗證集數(shù)據(jù)樣本用于模型參數(shù)的訓練,測試集數(shù)據(jù)樣本用于驗證模型的泛化能力。
2.1.1隱含層數(shù)的確定
在隱含層數(shù)分別為1~5、每層神經元數(shù)分別設置為6,8,10的情況下[23],選擇回歸系數(shù)R和均方根誤差RMSE作為評價指標,回歸系數(shù)R越大,說明模型的預測值越接近真實值,表示模型越精確;均方根誤差RMSE越小,表明計算值與真實值誤差越小,采用多次計算、對結果求平均值的方法評價不同模型結構對神經網絡模型預測精度的影響,結果如圖2所示。
由圖2(a)可知:對于目標變量苯產品中非芳烴組分含量,當隱含層神經元數(shù)為6、隱含層數(shù)為3時,獲得最大的R和最小的RMSE;當隱含層神經元數(shù)為8或10、隱含層數(shù)為3時,獲得較大的R和較小的RMSE(效果僅次于隱含層數(shù)為4時)。由圖2(b)可知:當隱含層數(shù)為3,隱含層神經元數(shù)分別取6,8,10時,均獲得最大的R和最小的RMSE。綜合考慮隱含層數(shù)對兩個目標變量的影響,神經網絡模型隱含層數(shù)選擇3為宜。
2.1.2神經元數(shù)的確定
依次使用公式經驗法和反復試驗法來確定模型隱含層的神經元數(shù)和最佳神經網絡結構[24]。隱含層神經元數(shù)由式(3)計算。
(3)
式中:Nhid為隱含層神經元數(shù);Nin為輸入層神經元數(shù);Nout為輸出層神經元數(shù)。
輸入變量數(shù)為12、輸出目標變量數(shù)為2,由式(3)可初步確定Nhid=6。在此基礎上,將每層神經元數(shù)范圍擴展為4~8個,探討神經元數(shù)不同對模擬結果的影響。在優(yōu)化隱含層數(shù)為3條件下計算共獲得125種組合結構模型的模擬結果,每種組合計算200次,其均值如表4所示。由表4可知,3層隱含層的神經元數(shù)分別為8,6,8時(第115組計算結果),模型回歸效果最好。最終,優(yōu)化得到的BP網絡模型結構為(12,8×6×8,2)。
表4 不同神經元組合計算結果
基于上述優(yōu)化的BP網絡模型結構進行訓練,由測試集數(shù)據(jù)樣本得到模型性能結果,見表5。由表5可知:①對于產品苯中非芳烴含量與甲苯含量,模型預測結果的回歸系數(shù)分別為0.872 1和0.901 2,說明模型預測值與真實值一致性較好,該模型能夠很好地預測裝置運行的波動性;②二者的均方根誤差分別為0.012 4和0.046 3,表明預測值與真實值偏差較小;③二者平均相對誤差(MRE)分別為1.036%和3.312%,表明所建模型預測結果的準確性良好,能夠滿足化工裝置控制精度要求。
圖3為采集數(shù)據(jù)裝置運行的真實值與所建神經網絡模型預測值的對比結果。由圖3可以看出,隨著裝置運行時間的增加,預測模擬值與裝置真實值的變化趨勢相同且吻合良好,表明所建模型的預測結果具有較高的準確性,達到了利用該模型預測裝置產品中非芳烴含量和甲苯含量的目的,可以用于后續(xù)優(yōu)化工作。
圖3 苯產品中非芳烴和甲苯含量模擬值與真實值變化趨勢對比
結合現(xiàn)場裝置參數(shù)調節(jié)難度和操作參數(shù)對產品質量(苯產品中非芳烴和甲苯含量)影響程度的大小,選取易于調控、對產品質量影響程度較大的5個參數(shù)進行優(yōu)化分析,并確定參數(shù)優(yōu)化合理區(qū)間,見表6。除待優(yōu)化輸入變量外,其他輸入變量采用2.1節(jié)預處理后變量數(shù)據(jù)的平均值。
表6 優(yōu)化參數(shù)及其變化范圍
采用帶精英策略的遺傳算法NSGA-Ⅱ對上述變量參數(shù)進行優(yōu)化求解,求解器參數(shù)設置:最優(yōu)個體系數(shù)為0.3,種群規(guī)模為200,最大進化代數(shù)為500,停止代數(shù)為200,適應度函數(shù)偏差為1×10-4,其他參數(shù)設置為函數(shù)默認值。輸入變量參數(shù)的變化范圍介于變量變化下限與上限之間,優(yōu)化目標為苯產品中非芳烴質量分數(shù)(y1)和/或甲苯質量分數(shù)(y2)最小。變量優(yōu)化結果見圖4,圖中點N代表催化重整裝置正常操作點,點A、點B、點C分別為優(yōu)化后的操作點。優(yōu)化后的輸入變量和目標函數(shù)如表7所示。
圖4 多目標優(yōu)化最優(yōu)解集
表7 最優(yōu)解優(yōu)化變量及目標函數(shù)
由圖4可以看出,對催化重整裝置苯產品質量優(yōu)化的方案有3種:①為最大程度降低產品中非芳烴含量,則選擇操作點A工況,此時產品中非芳烴質量分數(shù)降低40.12%,但甲苯含量有所增加;②為保持甲苯含量不增加的同時降低非芳烴含量,則選擇操作點B工況,此時產品中非芳烴質量分數(shù)降低36.85%;③為同時降低苯產品中非芳烴和甲苯的含量,則選擇最佳操作點C工況,此時苯產品中非芳烴和甲苯的質量分數(shù)分別降低24.38%和82.58%。從以上分析可知,可通過改變相關操作參數(shù)實現(xiàn)提高苯產品質量的目的,方案③對應的操作點C工況對提高苯產品質量的效果最佳。
(1)基于催化重整裝置的實時數(shù)據(jù),建立了實時數(shù)據(jù)處理規(guī)則,將采集到的60個變量簡化至14個,在保證數(shù)據(jù)完整性和準確性的同時,降低了數(shù)據(jù)的維度,為后續(xù)建模提供了簡約的數(shù)據(jù)集。
(2)基于處理后的數(shù)據(jù)集,建立了苯產品質量的預測模型,當模型輸入變量為12個,輸出變量為2個,隱含層為3層,3層隱含層的神經元數(shù)分別為8,6,8時模型的預測結果最優(yōu),因此優(yōu)化的模型結構為(12,8×6×8,2)。
(3)經過模型訓練和驗證,對于苯產品中的非芳烴含量與甲苯含量,模型預測結果的回歸系數(shù)(R)分別為0.872 1和0.901 2;二者的均方根誤差分別為0.012 4和0.046 3,平均相對誤差(MRE)分別為1.036%和3.312%,表明所建模型預測值與真實值一致性較好,預測精度較高。
(4)采用帶精英策略的遺傳算法NSGA-Ⅱ對影響產品質量較大的5個操作變量進行優(yōu)化,優(yōu)化后的工況下,苯產品中非芳烴和甲苯質量分數(shù)分別可降低24.38%和82.58%,說明所建模型可用于裝置的產品質量預測和調控,有利于現(xiàn)代工廠智能化建設。