蘇 曼 ,陳夕松 ,段 佳
(1.東南大學(xué)自動(dòng)化學(xué)院,江蘇南京 210096;2.南京富島信息工程有限公司,江蘇南京 210061)
在成品油分析領(lǐng)域,近紅外光譜分析技術(shù)相較傳統(tǒng)實(shí)驗(yàn)化驗(yàn)分析方法具有成熟、快速、無損等優(yōu)點(diǎn),近年來應(yīng)用廣泛[1,2]。采用該技術(shù)預(yù)測(cè)成品油性質(zhì)時(shí),首先要建立與待測(cè)樣本性質(zhì)接近的校正集,通過對(duì)校正集樣品光譜和性質(zhì)參數(shù)進(jìn)行關(guān)聯(lián)建立模型后,再預(yù)測(cè)待測(cè)樣本的性質(zhì)[3-5]。在工業(yè)生產(chǎn)中,待測(cè)樣品往往會(huì)隨時(shí)間發(fā)生變化。例如煉化企業(yè)生產(chǎn)的成品油,在更換原油或改變加工工藝后,油品性質(zhì)會(huì)有不同程度的改變。因此在一段時(shí)間后,新樣本的分布會(huì)偏離原模型校正集樣本的分布區(qū)域。當(dāng)待測(cè)樣本周圍分布的校正集樣本較少,即與待測(cè)樣本相似的樣本數(shù)較少時(shí),模型預(yù)測(cè)效果將變差。這會(huì)影響煉化企業(yè)生產(chǎn)控制,難以保證產(chǎn)品質(zhì)量和效益[6]。因此需要不斷對(duì)模型的校正集進(jìn)行維護(hù)更新,以保證模型的預(yù)測(cè)精度。
關(guān)于近紅外光譜模型校正集維護(hù)技術(shù)的研究目前還相對(duì)較少。文獻(xiàn)[7]利用RPLS算法預(yù)測(cè)不同類型土壤樣品的速效磷和速效鉀含量,在預(yù)測(cè)過程中對(duì)模型的回歸系數(shù)進(jìn)行遞歸更新,從而不斷獲取待測(cè)樣品中出現(xiàn)的新的有效信息。但是該方法在樣本性質(zhì)出現(xiàn)較大偏移時(shí)作用不明顯。文獻(xiàn)[8]研究了煙葉4種成分的近紅外模型的維護(hù),通過觀察不同年份煙葉4種成分的光譜主成分空間分布圖判定是否需要更新模型,但是沒有提出系統(tǒng)的、可實(shí)施的判斷方法。
為解決成品油模型校正集更新問題,本文設(shè)計(jì)一種自動(dòng)維護(hù)校正集的方法。該方法以新樣本在校正集中相似樣本數(shù)量來判斷新樣本是否處于稀疏區(qū),并將稀疏區(qū)的樣本自動(dòng)添加到校正集。首先對(duì)樣本進(jìn)行光譜預(yù)處理,然后進(jìn)行主成分分析。在主成分分布圖中以新樣本為中心,根據(jù)貢獻(xiàn)率由高到低選擇前n個(gè)得分向量,建立n維空間上的固定框。統(tǒng)計(jì)框內(nèi)相似樣本數(shù)量,若大于閾值,則判斷新油樣處于密集區(qū),不必添加到校正集;若小于閾值,則認(rèn)為新油樣處于稀疏區(qū),繼續(xù)判斷新樣本是否為異常樣本。若不是異常樣本,則自動(dòng)將新樣本添加到校正集。流程(見圖1),具體步驟如下:
(1)測(cè)定樣本的近紅外光譜,對(duì)新樣本和校正集中樣本的光譜數(shù)據(jù)進(jìn)行常規(guī)預(yù)處理,包括譜圖截取、基線校正和矢量歸一化[7]。全譜計(jì)算工作量很大,且有些光譜區(qū)域樣品的光譜信息很弱,因此在建立校正模型之前需要進(jìn)行譜圖截取以選擇合適的波段。基線校正主要用來消除基線的漂移,其中兩點(diǎn)法基線校正后的吸光度通過式(1)計(jì)算:
式中:xi為汽油在近紅外光譜區(qū)的波數(shù);kxi+b為過兩基點(diǎn)的直線方程,其中k為該直線斜率,b為該直線截距;yi表示原譜圖在波數(shù)xi下的吸光度;表示基線校正后的譜圖在波數(shù)xi下的吸光度。
歸一化用于消除光程變化或樣品的稀釋等變化對(duì)光譜的影響,其中矢量歸一化采用式(2)計(jì)算:)
式中:Xij是第i個(gè)樣本在波數(shù)j下的吸光度;指第i個(gè)樣本的吸光度平均值;m是波數(shù)點(diǎn)的個(gè)數(shù);表示矢量歸一化之后的第i個(gè)樣本在波數(shù)j下的吸光度。
(2)采用主成分分析,對(duì)預(yù)處理后的光譜數(shù)據(jù)進(jìn)行特征提取。主成分分析通過將原始特征空間進(jìn)行變換,使少數(shù)幾個(gè)新變量是原變量的特征組合,以消除原光譜信息中相互重疊的部分,同時(shí)能盡可能多地表達(dá)原變量的數(shù)據(jù)特征,實(shí)現(xiàn)數(shù)據(jù)降維。在主成分分析結(jié)果中選取得分矩陣的前n個(gè)列向量,繪制n維主成分分布圖。n取2或3,在n=2時(shí),選取前兩個(gè)得分向量繪制二維主成分分布圖;當(dāng)n=3時(shí),選取前三個(gè)得分向量繪制三維主成分分布圖,通過分布圖便于判斷樣本是否處于稀疏區(qū)。
(3)在主成分分布圖中以新樣本為中心,建立n維的固定框,框內(nèi)樣本為校正集中與新樣本相似的樣本。主成分分析結(jié)果中第一主成分代表吸光度矩陣變異最大的方向,第二主成分次之,以此類推。因此按照各主成分包含的信息量大小,設(shè)置固定框不同維度上的比例,包含信息量較大的主成分所占比例較大。如當(dāng)n=3時(shí),設(shè)計(jì)三維立體框圖的長(zhǎng)寬高比為3:2:1。然后統(tǒng)計(jì)n維框內(nèi)相似樣本數(shù)量,與閾值比較,判斷樣本是否處于密集區(qū)。若相似樣本數(shù)量大于閾值則新樣本處于密集區(qū),不添加到校正集,避免校正集樣本冗余,返回步驟(1);否則繼續(xù)判斷該樣本是否為異常樣本,轉(zhuǎn)步驟(4)。
(4)判斷新樣本是否為異常樣本,如是異常樣本,則不添加到校正集,返回步驟(1),否則轉(zhuǎn)步驟(5)。本方法中以杠桿值h為指標(biāo)判斷新樣本是否為異常樣本,并將杠桿值大于3 k/m的樣品視作杠桿值偏高,放入預(yù)備庫(kù)做進(jìn)一步觀察;杠桿值小于3 k/m的樣品為正常樣品。h的計(jì)算方法如式(3):
式中:x為新樣本光譜主成分得分向量;V為校正集光譜主成分得分矩陣的協(xié)方差矩陣;m為校正集樣本數(shù)量;k為變量數(shù)。
因?yàn)楣I(yè)中生產(chǎn)的成品油性質(zhì)是逐漸變化的,若某一油品與最近一段時(shí)間生產(chǎn)的油品都有較大差異,則該油品為異常樣本。此類樣本參與建模,其光譜會(huì)對(duì)用于建模的一個(gè)或多個(gè)光譜變量有顯著貢獻(xiàn),進(jìn)而對(duì)回歸結(jié)果產(chǎn)生強(qiáng)烈影響,降低模型的穩(wěn)健性。因此當(dāng)新油樣杠桿值偏大時(shí),先將其放入預(yù)備庫(kù),觀察鄰近時(shí)間的油樣。若鄰近時(shí)間內(nèi)只有個(gè)別油樣杠桿值偏大,則新油樣為異常樣本,將其剔除。若鄰近時(shí)間內(nèi)采樣油樣杠桿值都偏大,說明近期油樣產(chǎn)生較大變化,新油樣雖然杠桿值偏大,但不應(yīng)判斷為異常樣本。
(5)自動(dòng)將新樣本添加到模型校正集,結(jié)束本次模型維護(hù)。
圖1 自動(dòng)添加校正集樣本方法的實(shí)施流程
儀器:ABB MB-3600型傅里葉變換近紅外光譜儀,光程長(zhǎng)度為0.5 mm的常壓樣品池,光譜采集范圍為3 700 cm-1~14 750 cm-1。本文的實(shí)驗(yàn)過程軟件均通過Matlab編程實(shí)現(xiàn)。
樣品:本案例以95#汽油的終餾點(diǎn)為例,依據(jù)汽油的近紅外光譜建立預(yù)測(cè)模型。原模型校正集A由某煉化企業(yè)在2015年1月至2017年11月期間生產(chǎn)的296個(gè)95#汽油樣本組成。依據(jù)本文設(shè)計(jì)的模型校正集維護(hù)方法,向校正集A中添加2017年12月至2018年5月的部分汽油采樣,建立新的校正集B。選取2017年7月至2018年5月的112個(gè)樣本進(jìn)行終餾點(diǎn)預(yù)測(cè),說明自動(dòng)添加校正集樣本對(duì)模型預(yù)測(cè)精度的影響。
采用近紅外光譜儀掃描汽油樣本,獲得樣本的近紅外光譜數(shù)據(jù)。全譜段建模計(jì)算量較大,本案例僅截取近紅外光譜信息量較大的4 000 cm-1~4 800 cm-1波數(shù)段的吸光度數(shù)據(jù)進(jìn)行建模。因?yàn)闃悠返慕t外光譜常常受到儀器高頻噪聲、基線漂移等因素的影響,因此首先進(jìn)行光譜預(yù)處理。本案例中對(duì)截取的光譜數(shù)據(jù)做兩點(diǎn)法基線校正和矢量歸一化,在一定程度上可以去除原始近紅外光譜中包含的噪聲和干擾信號(hào)。
對(duì)預(yù)處理后的樣本光譜數(shù)據(jù)進(jìn)行主成分分析,將原始的數(shù)據(jù)做降維處理,提取原光譜的特征變量并消除原光譜變量間的多重共線性。案例中截取的4 000 cm-1~4 800 cm-1波數(shù)段的原始光譜為208維吸光度數(shù)據(jù),經(jīng)主成分分析后的得分矩陣中,前2個(gè)得分向量的累計(jì)貢獻(xiàn)率達(dá)到85%以上,已經(jīng)涵蓋原光譜的大部分信息。因此選取主成分分析結(jié)果中得分矩陣的前二維列向量,繪制二維主成分分布圖,觀察油樣分布情況。
以2016至2017年間油樣的二維主成分分布為例(見圖2),2016年全年采樣的79個(gè)95#油樣以“*”表示,2017年全年采樣的158個(gè)95#油樣以“·”表示。圖2中可以明顯區(qū)分出2016年和2017年的油樣分布區(qū)域,證明工業(yè)生產(chǎn)的成品油樣隨時(shí)間發(fā)生較大變化。
因?yàn)樵诠I(yè)生產(chǎn)中每過一段時(shí)間,可能會(huì)更換原油或改變加工工藝,這些均會(huì)導(dǎo)致生產(chǎn)的成品油樣性質(zhì)組成發(fā)生較大變化。新樣本的分布偏離原模型校正集樣本的分布區(qū)域,使原校正集中很少存在分布在新的待測(cè)樣本周圍的相似樣本,不利于建模。尤其是采用相似樣本建模的方法,模型預(yù)測(cè)精度會(huì)受到很大影響。因此在建立模型時(shí)需要對(duì)校正集進(jìn)行定期維護(hù),識(shí)別出處于稀疏區(qū)的新樣本,并自動(dòng)添加到校正集中,以及時(shí)適應(yīng)油樣變化,提高模型穩(wěn)健性。
本案例中以主成分分析結(jié)果的前3個(gè)得分向量判斷相似樣本,通過建立三維空間上的立體框判斷新樣本是否處于稀疏區(qū)。前三維得分向量的累計(jì)貢獻(xiàn)率已經(jīng)超過90%,基本可以表征樣本的光譜信息。其中第一主成分包含光譜信息量最大,第二主成分次之,第三主成分最小。因此依據(jù)各向量貢獻(xiàn)率大小,設(shè)置立體框的長(zhǎng)為0.3,寬為0.2,高為0.1。結(jié)合本模型校正集樣本數(shù)量和樣本分布情況,設(shè)置相似樣本閾值為50。
圖2 2016-2017年間95#汽油樣本主成分分布圖
圖3 (a) 稀疏區(qū)樣本分布示例圖
圖3 (b) 密集區(qū)樣本分布示例圖
對(duì)2016年12月至2017年5月采樣的61個(gè)95#汽油樣本分別進(jìn)行判斷,觀察每個(gè)樣本在原校正集中的分布區(qū)域。
如果以新樣本為中心建立的立體框中相似樣本數(shù)量少于50,則判定樣本處于稀疏區(qū)。說明近期油樣發(fā)生較大變化,使新樣本的分布偏離原模型校正集樣本的分布區(qū)域,或該樣本測(cè)量有問題屬于異常樣本。接下來將該樣本放入預(yù)備庫(kù),繼續(xù)判斷是否為異常樣本。為便于觀察,以二維分布圖示意(見圖3(a))。
如果以新樣本為中心建立的立體框中相似樣本數(shù)量大于50,則判定樣本處于密集區(qū),說明近期油樣并未發(fā)生明顯變化,因此不將該樣本添加到校正集,避免校正集樣品出現(xiàn)冗余,降低模型計(jì)算速度。返回步驟(1),繼續(xù)測(cè)量其他樣本(見圖3(b))。
對(duì)2017年12月至2018年5月采樣的61個(gè)汽油樣本判斷結(jié)果為:其中有15個(gè)新樣本變化不大,仍處于原校正集樣品密集區(qū)域,沒有添加到校正集中,另外46個(gè)樣本處于原校正集樣品稀疏區(qū)域,繼續(xù)判斷是否為異常樣本。
然后以杠桿值h為指標(biāo)判斷樣本是否為異常樣本,并設(shè)置閾值9/m,其中m為此時(shí)校正集中樣本數(shù)量。若新樣本杠桿值低于閾值,則認(rèn)為該樣本屬于正常樣本,直接添加到校正集;若新樣本杠桿值高于閾值,則該樣本可能為異常樣本,先將其放入預(yù)備庫(kù)。對(duì)每一個(gè)放入預(yù)備庫(kù)的樣品,觀察其后7天采樣樣本的杠桿值。若鄰近7天內(nèi)采樣油樣杠桿值都偏大,說明近期油樣產(chǎn)生較大變化,并非該油樣出現(xiàn)異常,因此仍將其添加到校正集。若鄰近7天內(nèi)只有個(gè)別油樣杠桿值大于閾值,則該油樣為異常樣本,剔出預(yù)備庫(kù),且不加入到模型校正集中,避免對(duì)模型精度和穩(wěn)健性造成影響。
經(jīng)過主成分分析判斷位于原校正集樣品稀疏區(qū)域的46個(gè)樣本中,有2個(gè)樣本為異常樣本,將其剔除,并提示報(bào)警,其余44個(gè)樣本被添加到校正集中。
通過比較添加校正集樣本前后模型預(yù)測(cè)精度的變化,說明本文設(shè)計(jì)的校正集自動(dòng)維護(hù)方法的有效性。
校正集A由某煉化企業(yè)在2015年1月至2017年11月期間生產(chǎn)的296個(gè)某成品油樣本組成。逐步更新校正集A,將2017年12月至2018年5月的成品油采樣中處于稀疏區(qū)的44個(gè)非異常樣本自動(dòng)添加進(jìn)校正集A,最終形成校正集B。
基于校正集A和逐步更新得到的校正集B分別建立模型,對(duì)2017年7月至2018年5月的112個(gè)樣本的終餾點(diǎn)性質(zhì)進(jìn)行預(yù)測(cè)。
首先獲取待測(cè)樣本和校正集樣本的近紅外光譜,截取近紅外光譜信息量較大的4 000 cm-1~4 800 cm-1波數(shù)段的吸光度數(shù)據(jù)進(jìn)行建模。再對(duì)截取后的光譜數(shù)據(jù)做兩點(diǎn)法基線校正和矢量歸一化,消除基線漂移和光程變化或樣品的稀釋等變化對(duì)光譜的影響。然后進(jìn)行主成分分析,對(duì)原始的數(shù)據(jù)降維處理提取特征變量,并消除原光譜變量間的多重共線性。在主成分分布圖中,以新樣本為中心,建立三維立體框,框內(nèi)樣本即為待測(cè)樣本的相似樣本。最后基于相似樣本采用局部偏最小二乘法建立成品油性質(zhì)預(yù)測(cè)模型,對(duì)112個(gè)待測(cè)成品油樣本的終餾點(diǎn)進(jìn)行預(yù)測(cè)。
基于校正集A建立成品油性質(zhì)預(yù)測(cè)模型,預(yù)測(cè)結(jié)果(見表1)。
表1 原模型預(yù)測(cè)結(jié)果
基于維護(hù)后的校正集B建立成品油性質(zhì)預(yù)測(cè)模型,預(yù)測(cè)結(jié)果(見表2)。
表2 新模型預(yù)測(cè)結(jié)果
針對(duì)95#汽油的終餾點(diǎn),國(guó)家標(biāo)準(zhǔn)規(guī)定測(cè)量的重復(fù)性誤差為3℃,再現(xiàn)性誤差為5℃。此處將基于該汽油近紅外光譜建立模型預(yù)測(cè)結(jié)果和化驗(yàn)值的偏差與國(guó)家測(cè)量標(biāo)準(zhǔn)中該汽油終餾點(diǎn)性質(zhì)的重復(fù)性誤差和再現(xiàn)性誤差進(jìn)行比較,以體現(xiàn)模型預(yù)測(cè)精度。
對(duì)表1和表2中的數(shù)據(jù)進(jìn)行統(tǒng)計(jì),校正集維護(hù)前后建立模型的預(yù)測(cè)精度比較(見表3)。
表3 原模型和新模型比較
由表3中數(shù)據(jù)可知,在添加校正集樣本,建立新模型后,112個(gè)預(yù)測(cè)樣本中預(yù)測(cè)偏差低于重復(fù)性誤差,處于[0,3]范圍內(nèi)的樣本數(shù)量增加7個(gè),占比提高至99%。同時(shí)預(yù)測(cè)偏差高于再現(xiàn)性誤差,處于[5,+∞]范圍內(nèi)的樣本數(shù)量減少2個(gè),占比降低至1%。樣本總體預(yù)測(cè)偏差降低,預(yù)測(cè)精度顯著提高。
針對(duì)煉化企業(yè)生產(chǎn)中隨時(shí)間推移,成品油性質(zhì)會(huì)發(fā)生不同程度變化的情況,設(shè)計(jì)一種自動(dòng)維護(hù)模型校正集的方法。該方法可有效避免基于近紅外光譜的成品油性質(zhì)預(yù)測(cè)模型中,建模一段時(shí)間后因新樣本偏離原校正集樣本分布區(qū)域,導(dǎo)致模型預(yù)測(cè)精度降低的問題。該方法能夠提高成品油近紅外光譜建模的預(yù)測(cè)精度,保證模型穩(wěn)健性,控制生產(chǎn)、確保油品質(zhì)量具有重要應(yīng)用價(jià)值。本文提出的方法對(duì)其他基于近紅外光譜的性質(zhì)分析模型維護(hù)也具有較好的借鑒意義。
我國(guó)學(xué)者研發(fā)出可捕集二氧化碳的新型吸附劑
記者19日從南京工業(yè)大學(xué)了解到,該校劉曉勤、孫林兵教授課題組研發(fā)出一種智能吸附劑,實(shí)現(xiàn)了對(duì)二氧化碳的低能耗、可控式捕集,有望大幅降低工業(yè)過程中氣體分離的能耗。相關(guān)成果近日發(fā)表在化學(xué)領(lǐng)域國(guó)際知名期刊《德國(guó)應(yīng)用化學(xué)》上。
據(jù)論文第一作者、南工大博士生江耀介紹,在工業(yè)上的吸附分離操作中,傳統(tǒng)吸附劑通常需要在變溫或變壓條件下實(shí)現(xiàn)其循環(huán)使用過程。“也就是在常溫下吸附、升溫時(shí)脫附;或者加壓下吸附,減壓后脫附,缺點(diǎn)是這兩種辦法往往能耗較高?!苯f。
“我們嘗試選用光能這種綠色清潔能源作為替代?!睂O林兵教授告訴記者,自然界存在一些具有“光響應(yīng)性”的特殊物質(zhì),能夠在不同波段光的照射下產(chǎn)生結(jié)構(gòu)變化,發(fā)揮吸附作用,偶氮苯分子就是其中之一。
“我們希望將這種光響應(yīng)性能與活性物合理配比,協(xié)同實(shí)現(xiàn)對(duì)二氧化碳的可控性捕集。”孫林兵說,基于這個(gè)想法,課題組先是構(gòu)建了一種具備光響應(yīng)性的“金屬-有機(jī)”框架,再引入可吸附二氧化碳的活性位點(diǎn),在不同光照條件下對(duì)活性位點(diǎn)進(jìn)行調(diào)試,最終實(shí)現(xiàn)了對(duì)二氧化碳的可控性捕集。
“這種協(xié)同機(jī)制相較于傳統(tǒng)的變溫、變壓吸附大大降低了能耗?!苯f,新型吸附劑將來可應(yīng)用于充滿二氧化碳的工業(yè)煙道,助力節(jié)能減排。
(摘自寧夏日?qǐng)?bào)第21823期)