• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于XGBoost和改進灰狼優(yōu)化算法的催化裂化汽油精制裝置的辛烷值損失模型分析

      2022-01-14 02:27:48陳延展任紫暢成艾國
      石油學(xué)報(石油加工) 2022年1期
      關(guān)鍵詞:辛烷值灰狼汽油

      陳延展,胡 浩,任紫暢,成艾國

      (湖南大學(xué) 機械與運載工程學(xué)院,湖南 長沙 410000)

      汽油是小型車輛的主要燃料,其燃燒產(chǎn)生的尾氣排放對大氣環(huán)境有重要影響。為此,世界各國都制定了日益嚴(yán)格的汽油質(zhì)量標(biāo)準(zhǔn)。研究法辛烷值(RON)是反映汽油燃燒性能的最重要指標(biāo),并作為汽油的商品牌號(例如89#、92#、95#)?,F(xiàn)有技術(shù)在對催化裂化汽油進行脫硫和降烯烴過程中,普遍降低了汽油辛烷值[1]。辛烷值每降低1個單位,相當(dāng)于損失約150 CNY/t[2]。以一個1000 kt/a催化裂化汽油精制裝置為例,若能降低RON損失0.3個單位,其經(jīng)濟效益將達到45×106CNY。因此,研究汽油的辛烷值,對于保護大氣環(huán)境和提高工廠經(jīng)濟效益具有重要意義。

      實驗測定是目前獲取汽油辛烷值數(shù)據(jù)的最有效方法。根據(jù)ASTM D2699[3]和ASTM D2700[4]的規(guī)定,辛烷值分為研究法辛烷值(RON)和馬達法辛烷值(MON)2種。通過實驗測定來改善調(diào)試汽油樣品的辛烷值從而確定其最佳配比,不僅需要昂貴的實驗儀器及設(shè)備,還需要花費大量的時間及試劑樣品[5]。因此,有必要開展汽油辛烷值的理論預(yù)測研究,建立可靠的理論預(yù)測模型,彌補實驗方法的缺陷與不足。

      目前,分析化學(xué)法是文獻中預(yù)測汽油辛烷值的常見方法。Ghosh等[6]通過色譜分析法來預(yù)測汽油辛烷值,平均誤差值約為4~7個單位。Kardamakis等[7]則通過近紅外光譜法對汽油辛烷值進行預(yù)測研究。分析化學(xué)法的缺陷在于同樣需要用到相應(yīng)分析測試儀器,其運轉(zhuǎn)、維護費用較高,且耗時耗力。因此,采用各種理論算法來建立汽油辛烷值的預(yù)測模型受到廣泛關(guān)注。

      目前為止,基于各種理論方法的汽油辛烷值的化工過程建模一般是通過數(shù)據(jù)關(guān)聯(lián)或機理建模的方法來實現(xiàn)的,取得了一定的成果。但是由于煉油工藝過程的復(fù)雜性以及設(shè)備的多樣性,它們的操作變量(控制變量)之間具有高度非線性和相互強耦聯(lián)的關(guān)系,而且傳統(tǒng)的數(shù)據(jù)關(guān)聯(lián)模型中變量相對較少、機理建模對原料的分析要求較高,對過程優(yōu)化的響應(yīng)不及時,所以效果并不理想。基于此,筆者利用某石化企業(yè)催化裂化汽油精制裝置采集的大量歷史數(shù)據(jù),通過機器學(xué)習(xí)技術(shù)建立汽油研究法辛烷值(RON)損失預(yù)測模型,揭示相應(yīng)的操作變量及其影響規(guī)律;并提出一種改進的差分灰狼優(yōu)化算法對影響汽油辛烷值損失的操作變量進行優(yōu)化,以盡量減少汽油精制過程中的辛烷值損失,為石化企業(yè)和運營商提供決策分析。

      1 模型及算法介紹

      XGBoost(Extreme gradient boosting)是由Zhou等[8]提出的一種支持并行計算的梯度提升樹模型,近些年該模型憑借突出的效率和較高的預(yù)測精度被廣泛應(yīng)用于Kaggle機器學(xué)習(xí)競賽中。實際上XGBoost是一種改進的GBDT(Gradient boosting decision tree)算法[9],兩者本質(zhì)上均由許多用于回歸和分類的決策樹組成,但是XGBoost在以下方面對GBDT算法進行了改進:(1)對于損失函數(shù),GBDT算法只使用了一階泰勒展開,而XGBoost則增加了二階泰勒展開;(2)XGBoost在目標(biāo)函數(shù)中構(gòu)造了正則懲罰項[8]以降低模型復(fù)雜度,從而防止模型過擬合。XGBoost模型的結(jié)構(gòu)如圖1所示。

      圖1 XGBoost算法示意圖Fig.1 Schematic of XGBoost algorithm

      對于一個給定的有n個樣本的數(shù)據(jù)集D={(xi,yi)}(i=1,2…,n),其中xi表示第i個樣本的特征值集合,yi表示第i個樣本的標(biāo)簽值,則基于數(shù)據(jù)集D訓(xùn)練出的具有K個基學(xué)習(xí)器的XGBoost預(yù)測模型為:

      (1)

      F={f(x)=ωq(x)}

      (2)

      (3)

      在對訓(xùn)練數(shù)據(jù)進行學(xué)習(xí)時,每次在保留原有模型不變的基礎(chǔ)上,加入一個新函數(shù)ft,觀察對應(yīng)的目標(biāo)函數(shù)J(ft),若加入的新函數(shù)能使目標(biāo)函數(shù)盡可能減到最小,則把該函數(shù)加到模型中。此時目標(biāo)函數(shù)表示為:

      (4)

      (5)

      式中:L代表損失函數(shù);Ω(ft)則表示模型的復(fù)雜度;T表示葉節(jié)點數(shù);γ和λ表示懲罰項的權(quán)重系數(shù)。之后對目標(biāo)函數(shù)進行二階泰勒展開得到如下近似目標(biāo)函數(shù):Tt為t次迭代后的葉節(jié)點數(shù)。

      (6)

      (7)

      (8)

      式中:gi和hi是關(guān)于損失函數(shù)L的一階導(dǎo)數(shù)和二階導(dǎo)數(shù)。綜上所述,最終求得的目標(biāo)函數(shù)形式如下:

      (9)

      (10)

      (11)

      2 特征工程

      實驗數(shù)據(jù)集來源于某石化企業(yè)催化裂化汽油精制裝置運行4年所采集到的325個樣本數(shù)據(jù),其中每個數(shù)據(jù)樣本都包含7個原料性質(zhì)、2個待生吸附劑性質(zhì)、2個再生吸附劑性質(zhì)、2個產(chǎn)品性質(zhì)等變量以及另外354個操作變量,共計367個特征變量。表1中僅列出367個變量中的前30個具體信息(由于變量太多,此次降為30個)。由于367個特征變量中存在大量的冗余變量,不利于汽油辛烷值損失值預(yù)測模型的建立和求解,所以利用特征工程篩選出建模的主要變量,特征工程的總體流程如圖2所示。

      表1 影響汽油辛烷值損失的特征變量Table 1 Characteristic variables affecting octane loss in gasoline

      MIC—Maximum mutual information coefficient method圖2 特征工程的主要變量選取流程圖Fig.2 Flow chart for selection of key variables

      由圖2可知:首先需要對數(shù)據(jù)集進行歸一化處理,由于各特征的數(shù)值量綱之間存在較大差異,數(shù)據(jù)歸一化可以使所有特征具有零均值和同一階數(shù)上的方差,以方便后續(xù)的機器學(xué)習(xí)模型訓(xùn)練;然后運用方差閾值法的思想進行特征的粗略篩選,計算數(shù)據(jù)特征的方差值,剔除方差較低的特征,得到剔除后的前100個變量特征;然后分別利用Pearson相關(guān)系數(shù)法、最大互信息系數(shù)(MIC)法和基于隨機森林的特征選擇法對各特征進行重要度計算;最終利用3種特征選擇方法的融合進行變量特征的精確篩選。Pearson系數(shù)法僅反映不同變量之間的線性關(guān)系,最大互信息法能同時反映變量間的線性和非線性關(guān)系,基于隨機森林的特征重要度排序方法以包裹式的特征選取方式進行特征重要度計算??紤]到選取的特征應(yīng)具有獨立性、代表性的要求,因此,按照Pearson系數(shù)法權(quán)重∶最大互信息系數(shù)法權(quán)重∶隨機森林法權(quán)重比為2∶3∶5進行特征重要度的融合。各類方法對于特征變量的重要度排序如圖3所示。

      圖3 各方法的特征重要度排序Fig.3 Feature importance ranking sequence of each method(a)Pearson method;(b)Maxmium mutual information coefficient method;(c)Random forest method;(d)Weight coefficient method

      基于權(quán)重法融合結(jié)果的前25項特征的重要度之和占所有特征重要度之和的95%以上,故從得到的前100個特征中選取前25個特征作為建模的主要特征,其特征變量如表2所示。

      表2 建模選取的主要特征變量Table 2 Main characteristic variables

      3 模型應(yīng)用與結(jié)果分析

      以特征工程后的催化裂化汽油精制裝置歷史運行數(shù)據(jù)為訓(xùn)練集,分別采用多個機器學(xué)習(xí)模型建立汽油辛烷值損失值與25個主要特征變量之間的映射函數(shù),并在測試集上利用各種評價指標(biāo)進行模型對比,從而驗證XGBoost模型的預(yù)測性能。

      3.1 模型評價指標(biāo)

      (12)

      (13)

      (14)

      3.2 實驗分析與模型對比

      基于催化裂化汽油精制裝置歷史運行數(shù)據(jù)分別訓(xùn)練了XGBoost汽油辛烷值損失值預(yù)測模型和其他機器學(xué)習(xí)模型,如線性回歸模型[10]、K近鄰模型[11]、支持向量機(SVM)[12]、決策樹(DT)[13]和隨機森林(RF)[14]等。實驗平臺為AMD Ryzen 74800H with Radeon Graphics(2.90 GHz),配置了16.0 GB的RAM內(nèi)存和8 GB的GTX 1070Ti顯卡。其中SVM、DT和RF等模型均在python的第三方庫scikit-learn中實現(xiàn)。表3給出了上述10個機器學(xué)習(xí)模型對于汽油辛烷值(RON)損失值的預(yù)測精度、訓(xùn)練時間和測試時間。

      由表3可見,后6個模型的R2均超過0.97而具有很高的預(yù)測精度,并且其中模型RF和XGBoost的R2均高達0.99以上,遠超其他模型。表現(xiàn)最為突出的XGBoost模型R2值更是高達0.9981,并且MAE和RMSE均處在所有模型的最低值。然而2種線性模型LR和Linear-SVM的預(yù)測精度都很差,其R2均在0.95左右,證明了汽油RON損失值與25 個特征變量之間存在明顯的非線性關(guān)系。其他模型DT和KNN的預(yù)測精度則處于中等水平。

      表3 不同汽油辛烷值(RON)損失值預(yù)測模型的對比Table 3 Comparison of different RON loss value prediction models

      XGBoost模型預(yù)測的汽油辛烷值損失值與真實值的對比曲線如圖4所示。由圖4可以看出XGBoost模型的擬合效果很好,兩條曲線幾乎完全重合。為了進一步說明XGBoost模型的擬合效果,圖5繪制了測試集數(shù)據(jù)中汽油辛烷值損失的真實值與XGBoost模型預(yù)測值之間的散點分布,散點越接近直線則表示模型的預(yù)測能力越強[15]。從圖5可以直觀看出該模型具有良好的汽油辛烷值預(yù)測能力。

      圖4 XGBoost模型汽油辛烷值(RON)損失預(yù)測值與真實值對比Fig.4 Comparison of RON loss predicted values by XGBoost model and actual values

      圖5 XGBoost模型汽油辛烷值(RON)預(yù)測值與真實值的散點分布Fig.5 Distribution of RON loss predicted values by XGBoost model and actual values

      綜上所述,XGBoost模型的R2最高,并且訓(xùn)練時間、預(yù)測時間、MAE以及RMSE均相對較小。所以XGBoost模型在預(yù)測汽油辛烷值損失值的問題上比其他模型更加有效,筆者最終采用XGBoost模型預(yù)測汽油辛烷值的損失值。

      4 基于改進差分灰狼算法的汽油辛烷值損失優(yōu)化模型

      為盡可能降低汽油辛烷值損失,同時由于國六車用汽油標(biāo)準(zhǔn)要求硫質(zhì)量分數(shù)不大于5 μg/g,為了保證汽油產(chǎn)品脫硫效果,對數(shù)據(jù)樣本的25個特征變量進行優(yōu)化,建立了一種單目標(biāo)優(yōu)化模型。約束條件包括硫含量、操作變量的取值范圍等。為了建立硫質(zhì)量分數(shù)不大于5 μg/g的約束條件,同樣采用XGBoost建立了硫含量與這些操作變量的映射函數(shù)關(guān)系,并作為限制條件求解。由于該優(yōu)化模型的變量有25個,維度較高,筆者提出了一種改進的差分灰狼優(yōu)化算法進行求解,可以較大提高模型的求解精度和效率。結(jié)果表明模型的建立與求解過程是合理的。具體的求解思路如圖6所示。

      圖6 基于改進的差分灰狼優(yōu)化算法的汽油辛烷值(RON)損失優(yōu)化模型的建立與求解過程Fig.6 Establishment and solution of RON loss optimization model

      4.1 模型建立

      由數(shù)據(jù)可知,大多數(shù)樣本的汽油辛烷值損失還是偏大的,有必要對其特征變量進行優(yōu)化來減少其損失值。因此,建立了一個優(yōu)化模型,并在保證硫質(zhì)量分數(shù)不大于5 μg/g的條件下,分別對這325個樣本對應(yīng)的操作條件進行優(yōu)化求解。具體的建模過程如下:

      目標(biāo)函數(shù):使辛烷值損失最小,采用XGBoost的汽油辛烷值損失與主要操作變量的映射函數(shù),用f(X)來表示,其中X=[X1,X2,X3,…,XM](M=25),代表影響汽油辛烷值損失的25個主要操作變量,并且下標(biāo)與表2中的排序一一對應(yīng)。

      min(f(X))

      (15)

      硫含量的約束條件:利用XGBoost建立硫含量與25個主要操作變量的映射函數(shù),即利用主要操作變量預(yù)測硫含量,用g(X)表示,并使得其質(zhì)量分數(shù)不大于5 μg/g。

      操作變量的約束條件:每個操作變量的取值范圍如表4所示。于是,最終的優(yōu)化模型如下:

      表4 影響汽油辛烷值損失的25個主要操作變量的取值范圍Table 4 25 main operational variables affecting RON loss

      min(f(X))

      (16)

      4.2 改進的差分灰狼優(yōu)化算法設(shè)計

      對于優(yōu)化問題,傳統(tǒng)的數(shù)學(xué)規(guī)劃方法在求解過程中難以實現(xiàn)全局最優(yōu),且收斂性差。目前,基于種群迭代的智能優(yōu)化算法由于其較快的求解速率在工程上得到了廣泛應(yīng)用?;依莾?yōu)化(Gray Wolf Optimizer,GWO)[16]算法作為一種較新的智能優(yōu)化算法,憑借其結(jié)構(gòu)簡單、需要調(diào)節(jié)的參數(shù)較少和較好的魯棒性的特點,也得到了許多學(xué)者的關(guān)注。但是,與其他智能優(yōu)化算法類似,基本的灰狼優(yōu)化算法也存在著一些缺點,比如對于高維問題容易陷入局部最優(yōu)、求解精度不高等。針對此問題,筆者提出了一種改進的差分灰狼優(yōu)化算法來對模型進行求解。

      4.2.1 基本灰狼優(yōu)化算法

      GWO算法是借鑒大自然中狼群捕食行為和社會領(lǐng)導(dǎo)階層分工的思想而提出的一種新型智能優(yōu)化算法。在一個小型灰狼群體中,有3個最優(yōu)的個體,分別為α狼、β狼和δ狼,它們處于金字塔的上層,其他狼聽從這些狼的指揮。

      這些灰狼在追逐和包圍獵物過程可以抽象為一個數(shù)學(xué)模型,提出了以下公式:

      (17)

      (18)

      (19)

      (20)

      (21)

      (22)

      (23)

      (24)

      式中:umax為最大迭代次數(shù);其他灰狼個體根據(jù)α、β和δ的位置分別更新各自的位置。

      4.2.2 灰狼算法的改進策略

      (1)基于sigmoid函數(shù)的收斂因子調(diào)整

      根據(jù)前面灰狼算法的機理分析可知,A值的大小代表灰狼包圍獵物時的范圍,A越大說明包圍圈越大,反之包圍圈越小,即代表了灰狼的全局勘探和局部精細搜索的能力。而A的取值是隨收斂因子a變化的。也就說明了收斂因子影響著灰狼算法的全局搜索和局部搜索能力。然而,在基本的GWO中,收斂因子是線性遞減的,這種搜索策略在實際尋優(yōu)過程難以適應(yīng)實際情況。為了使得灰狼在開始階段搜索的范圍較廣,并在結(jié)束階段能夠在很小的范圍內(nèi)進行精細搜索,采用sigmod函數(shù)來控制收斂因子的取值,可以使算法的全局勘探和局部搜索能力更強,其收斂因子的更新策略如公式(25)所示,采用這種策略,既有利于加快收斂速率,又能使算法在迭代末期獲得最優(yōu)值。

      (25)

      (2)基于差分變異策略的個體更新

      在基本的GWO算法中,由式(24)可以看出,群體中其他灰狼個體的更新是由α狼、β狼和δ狼這3種狼的位置決定的。如果這3種狼陷入了局部最優(yōu)解的周圍,會導(dǎo)致其他狼的個體的多樣性減少,從而使得算法出現(xiàn)早熟現(xiàn)象,無法跳出局部最優(yōu)的包圍圈,求解效果會變得較差。為了解決這一問題,可以引入變異操作算子,使得算法避免這種陷入局部最優(yōu)的狀況。常見的變異算子有高斯變異、柯西變異等。

      受到差分進化算法的啟發(fā),筆者采用差分變異算子來對其他狼的位置進行調(diào)整。即利用當(dāng)前灰狼個體、最優(yōu)灰狼個體和隨機選擇的灰狼個體進行隨機差分選擇進行位置更新,其表達式如下:

      (26)

      4.2.3 改進差分灰狼優(yōu)化算法的步驟

      4.3 模型求解與結(jié)果分析

      根據(jù)325個樣本數(shù)據(jù)的操作變量的原始值,分別對改進的差分灰狼優(yōu)化算法進行初始化,通過優(yōu)化算法的不斷迭代可以求解每個數(shù)據(jù)樣本對應(yīng)的主要變量優(yōu)化后的操作條件。表5列出了第1個樣本優(yōu)化前后的操作變量和汽油辛烷值損失值的數(shù)據(jù),同時還給出了硫含量的值。由表5可以發(fā)現(xiàn)硫質(zhì)量分數(shù)在5 μg/g以下,滿足國六車用汽油標(biāo)準(zhǔn)要求的硫含量取值范圍。

      表5 第1個樣本操作變量和汽油辛烷值損失優(yōu)化前后結(jié)果Table 5 Operation variables of the first sample and RON loss before and after optimization

      為了進一步驗證改進差分灰狼優(yōu)化算法的效果,對數(shù)據(jù)集前325個樣本優(yōu)化前后的辛烷值損失值大小進行了可視化,如圖7所示。由圖7可知,325個樣本中辛烷值損失值的初始值都較大,大部分超過了1,而優(yōu)化后的值卻在0.4上下波動,證明了改進的差分灰狼算法很大程度上降低了汽油辛烷值損失值,這進一步說明了所建立的模型和設(shè)計的算法的有效性。

      圖7 325個樣本辛烷值損失值優(yōu)化前后結(jié)果對比Fig.7 Result comparison before and after optimization of RON loss of 325 samples

      除此之外,筆者還計算了優(yōu)化后的汽油辛烷值損失值的降幅,其計算公式為:

      采用上述公式對圖7中所有樣本的降幅進行了計算,表6給出了汽油辛烷值損失值降幅的區(qū)間范圍。由表6可以看出,辛烷值損失降幅在30%以下的只有3個樣本,大多數(shù)樣本的損失降幅在60%~80%之間,這也證明優(yōu)化的效果很好

      表6 優(yōu)化后的汽油辛烷值(RON)損失降幅分布Table 6 RON loss range after optimization

      4.4 算法有效性分析

      為了驗證所提出的改進差分灰狼優(yōu)化算法的有效性,分別與差分算法(Differential Evolution Algorithm,DE)和灰狼算法進行了對比,結(jié)果見圖8。

      本實驗采用python編程實現(xiàn),電腦的處理器為:AMD Ryzen 74800H with Radeon Graphics(2.90 GHz),內(nèi)存(RAM)為16 GB,優(yōu)化1個訓(xùn)練樣本所花費的時間為28 s,效率比較高。

      由圖8可知,所提出的改進算法在收斂速率和求解精度上均是最優(yōu)的,這進一步驗證了算法的有效性。

      GWO—Gray wolf optimizer;DE—Differential evolution algorithm圖8 3種優(yōu)化算法的迭代曲線Fig.8 Iterative curve diagrams of three optimization algorithms

      5 結(jié) 論

      基于機器學(xué)習(xí)算法XGBoost建立汽油辛烷值損失值與主要特征變量之間的映射函數(shù),并提出一種改進的差分灰狼算法建立關(guān)于汽油辛烷值損失值最小的單目標(biāo)優(yōu)化模型,最終得出的結(jié)論如下:

      (1)分別采用Pearson系數(shù)、最大互信息系數(shù)和隨機森林特征選擇法計算來篩選主要特征變量,并利用權(quán)重法對各特征重要度進行融合,有效避免了單一特征評價方法的局限性;

      (2)采用XGBoost和多種流行的機器學(xué)習(xí)模型分別預(yù)測汽油辛烷值損失,其中XGBoost算法的RMSE值、MAE值和R2系數(shù)分別為1.3197、0.3581和0.9981,通過對比分析證明XGBoost算法的預(yù)測性能最佳;

      (3)針對具有高維變量的優(yōu)化問題,提出了一種改進的差分灰狼優(yōu)化算法,利用該算法可以將數(shù)據(jù)樣本的辛烷值損失降低至0.4左右。分別與差分進化算法和基本灰狼優(yōu)化算法進行對比,發(fā)現(xiàn)改進的算法在求解速率和精度上有了一定的提升。

      建立的降低汽油辛烷值損失模型可以盡量減少汽油精制過程中的辛烷值損失,為化工企業(yè)和運營商提供決策分析。但是此研究沒有考慮到實際工業(yè)生產(chǎn)過程中汽油辛烷值損失預(yù)測的實時性,未來的研究可以圍繞在線極限學(xué)習(xí)機模型對汽油辛烷值進行預(yù)測,以提高汽油的生產(chǎn)質(zhì)量與效率。

      猜你喜歡
      辛烷值灰狼汽油
      揚州市查處一起非法經(jīng)營汽油案
      黨建+經(jīng)營催化汽油提效
      質(zhì)量比改變壓縮比的辛烷值測定機
      軟件(2020年3期)2020-04-20 01:45:24
      PNNL開發(fā)車載分離技術(shù)將乙醇從汽油中分離出來使辛烷值隨需變化
      谷谷雞和小灰狼
      小太陽畫報(2019年1期)2019-06-11 10:29:48
      灰狼的大大噴嚏
      研究法辛烷值和馬達法辛烷值對直噴汽油機性能的影響
      汽車文摘(2016年8期)2016-12-07 01:05:40
      灰狼和老虎
      快樂語文(2016年15期)2016-11-07 09:46:31
      大數(shù)據(jù)是“原油”,不是“汽油”
      聲屏世界(2015年8期)2015-02-28 15:20:26
      灰狼的幸福
      讀寫算(中)(2015年6期)2015-02-27 08:47:14
      青河县| 白河县| 洪雅县| 清水河县| 内乡县| 高淳县| 广西| 连江县| 克什克腾旗| 莒南县| 卢湾区| 广河县| 晋宁县| 进贤县| 丹阳市| 赤水市| 沁阳市| 焦作市| 城步| 山东省| 河北区| 宜都市| 平昌县| 纳雍县| 苍溪县| 错那县| 德令哈市| 颍上县| 靖安县| 漳平市| 廊坊市| 荃湾区| 栾川县| 云南省| 焦作市| 尼玛县| 承德县| 临沂市| 柯坪县| 宁化县| 许昌县|