姚志湘,孫增強,粟 暉,袁洪福
1. 廣西科技大學(xué)廣西糖資源綠色加工重點實驗室,廣西 柳州 545006 2. 北京化工大學(xué)材料科學(xué)與工程學(xué)院,北京 100029 3. 廣西科技大學(xué)生物與化學(xué)工程學(xué)院,廣西 柳州 545006
通過向量角轉(zhuǎn)換校正拉曼光譜中乘性干擾
姚志湘1, 3,孫增強1, 3,粟 暉1, 3,袁洪福2
1. 廣西科技大學(xué)廣西糖資源綠色加工重點實驗室,廣西 柳州 545006 2. 北京化工大學(xué)材料科學(xué)與工程學(xué)院,北京 100029 3. 廣西科技大學(xué)生物與化學(xué)工程學(xué)院,廣西 柳州 545006
拉曼光譜強度與物質(zhì)量存在的線性關(guān)系會受到許多復(fù)雜因素破壞,包括激發(fā)光源、聚焦、散射、折射等,導(dǎo)致定量效果不佳。各種因素的干擾效應(yīng),總體上分成加性和乘性效應(yīng),而消除乘性效應(yīng)的難度會更大一些。光譜序列信號可視為向量,信號強度對應(yīng)向量的模量,而體現(xiàn)向量本質(zhì)的方向?qū)傩圆粫苣A孔兓挠绊?。根?jù)這一原理,利用向量的方向確定性,將信號的強度度量轉(zhuǎn)換成空間角度度量,建立了一種消除乘性效應(yīng)的方法。首先,選擇一個與待定量組分相近而與背景空間近似正交的基準(zhǔn)向量,并定義移動窗口; 然后,計算移動窗口內(nèi)的光譜向量與基準(zhǔn)向量的夾角,所得值存儲為矩陣,完成角度描述轉(zhuǎn)換。角度矩陣消除了乘性效應(yīng)的干擾,而定量關(guān)系仍然近似線性,只要將該矩陣的秩滿足多元統(tǒng)計建模要求,就可以用于多元校正,并得到良好結(jié)果。研究采用甲醇-乙醇-異丙醇混合體系,驗證了消除乘性效應(yīng)后改進的定量效果,對于積分時間波動的預(yù)測值與實際值,直接PLS方法的相關(guān)系數(shù)r為0.911 9,預(yù)測標(biāo)準(zhǔn)偏差(RMSEP)為0.110 2; 采用MSC預(yù)處理的r為0.906 0,RMSEP為0.100 8; 而本文提出的VAPLS的r為0.998 7,RMSEP為0.015 2。結(jié)果表明向量角轉(zhuǎn)換度量處理后,光譜的乘性干擾得到了有效校正,拉曼定量分析準(zhǔn)確性得到了提高。
拉曼光譜; 乘性效應(yīng); 散射校正; 向量角轉(zhuǎn)換
確定條件下,拉曼散射光強度與組分濃度呈線性關(guān)系,此為拉曼光譜定量基礎(chǔ)[1]。但是拉曼光譜測量實際存在多種影響定量準(zhǔn)確的因素,根據(jù)對光譜強度的影響,可分為加性和乘性的。常見的基線漂移、噪聲等為加性效應(yīng),而光源穩(wěn)定性、樣品的透射和散射、聚焦,積分時間變動,甚至于折射率隨液體樣品濃度變化等則屬于乘性效應(yīng),使得拉曼強度與被測組分濃度之間不再是簡單的線性關(guān)系[2]。常用的乘性校正方法有標(biāo)準(zhǔn)正態(tài)變量變換(standard normal variate transformation, SNV)和多元散射校正(也稱乘性散射校正,multiplicative scatter correction, MSC)[3]; SNV假設(shè)所有變量具有相同的標(biāo)準(zhǔn)偏差,而MSC假設(shè)乘性和加性變化遠(yuǎn)大于樣品濃度或化學(xué)性質(zhì)變化[4],這些假設(shè)對于組分性質(zhì)變化較寬的樣品處理效果可能變差,文獻表明SNV和MSC處理結(jié)果相似[5]。此外,擴展多元散射校正方法(extended MSC, EMSC)需要樣品中所有對光譜有貢獻的為純物質(zhì)光譜,限制了應(yīng)用[6],也有文獻證明MSC處理后,拉曼光譜反而出現(xiàn)明顯的背景傾向[7]。張倩暄等、Chen等[8]對EMSC進行了改進,陳增萍等[10-11]提出了光程長評估與校正算法(optical path length estimation and correction, OPLEC),進一步又提出了乘性效應(yīng)模型(multiplicative effects model, MEM)進行散射校正,上述方法可以消除乘性效應(yīng),但原理和步驟都比較復(fù)雜。
傳統(tǒng)上,光譜分析直接關(guān)聯(lián)光譜強度與待測性質(zhì),建立光譜強度與預(yù)測性質(zhì)的定量關(guān)系。本文提出不將光譜強度與預(yù)測性質(zhì)直接關(guān)聯(lián),而是轉(zhuǎn)化為向量間的夾角余弦后,再進行多變量計算,以避免針對于強度的乘性干擾,改善定量結(jié)果。
1.1 原理
確定組成的體系,其光譜與組分濃度間關(guān)系表示為
y=Xc+e
(1)
式中,y是測量到的光譜,由體系n個組分純物質(zhì)光譜X=[x1,x2, …,xn],和各組分濃度c=(c1,c2, …,cn)混合貢獻而成,同時還疊加了隨機誤差e。
但是拉曼光譜測量容易受到乘性效應(yīng)影響,難以嚴(yán)格重復(fù),導(dǎo)致強度不穩(wěn)定。這些影響歸納到模型中,以乘性因子b,加性因子d代入式(1)
y=bXc+d+e
(2)
式(2)中加性因子d和隨機誤差e可采用一階導(dǎo)數(shù)平滑和低通濾波、重復(fù)平均等方法消除或降低,這些方法原理清晰,可方便地預(yù)處理光譜數(shù)據(jù)[11]。
式(2)的校正關(guān)鍵在于消除乘性因子b,為此引入向量角概念。離散的光譜測量點,可以表達為序列數(shù)組,可視為數(shù)據(jù)空間內(nèi)的向量[12]。向量模(長度)表示測量強度,而向量方向決定于體系的構(gòu)成,表達為空間中與確定坐標(biāo)的夾角[13]。乘性因子b導(dǎo)致強度變化,即改變了向量模,但體系構(gòu)成未改變,故而向量方向不變,即向量角不隨模改變。
如果采用向量角替代向量模描述體系,就能消除乘性因子b。如圖1,a和b共同構(gòu)成向量S,當(dāng)a和b等比例縮小時,S′與S在方向上不發(fā)生改變; 而只有在a與b的比例發(fā)生變化時,其共同構(gòu)成的向量才會發(fā)生方向變化,向量角與體系構(gòu)成比例具有函數(shù)關(guān)系,該函數(shù)與向量模無關(guān)。
Fig.1 The relationship between system components and vector direction
向量角的描述和計算如圖2所示,空間中的固定向量a與隨組成變化的向量S存在夾角θ,可用點積式(3)計算
(3)
如果S受到乘性因子b影響變?yōu)镾′,即
S′=bS
(4)
將式(4)代入式(3),有
(5)
表明向量角描述不受乘性因子b影響。
進一步,基于向量角描述的定量不能破壞測量值與預(yù)測值的基本線性關(guān)系。由式(3)和圖2可知,S由背景向量d和預(yù)測向量f構(gòu)成,如果將S和d,f的模量歸一化,那么S由含量分別為c和cb的f和d構(gòu)成,即
S=cf+cbd
(6)
(7)
如果參照向量a與背景d呈正交關(guān)系,那么有
(8)
Fig.2 The relationship between the analyte contents and vector angle
式(8)中,a,S,f均為單位模量向量,其中a,f是確定向量,因此可以改寫成
cosθ=k1c
(9)
而實際情況下,要確定與d完全正交的a比較困難,同時多變量情況下d存在一定幅度的波動。因此,對于選擇了近似正交的參照向量a和相對穩(wěn)定的多變量背景的情況,cosθ可近似保持與c的線性關(guān)系,即在一定值域范圍內(nèi)存在如下關(guān)系
cosθ≈k1c+k2
(10)
1.2 數(shù)據(jù)處理方法
根據(jù)上述原理,首先選取合適的參比向量a,用于計算量測向量S與其夾角。參比向量應(yīng)該與背景正交,但與被測組分不正交或相近; 選擇被測組分占優(yōu)分布的空間,進行奇異值分解(SVD)或主成分分解(PCA),其第一主分量可近似滿足這一要求。
然后,將量測信號及參比向量數(shù)據(jù)劃分到若干區(qū)間,每個區(qū)間為對應(yīng)的子向量對,計算向量對之間的夾角余弦,形成數(shù)組[cos(θ1), cos(θ2), …, cos(θm)],m為劃分的區(qū)間數(shù); 多組光譜轉(zhuǎn)化為向量角矩陣Θ=[cos(θi1), cos(θi2), …, cos(θim)],i=(1,N),N表示樣本個數(shù)。相應(yīng)的組分含量矩陣為Q=[Q1,Q2, …,QN]T,模型近似加和矩陣為R=[R1,R2, …,Rm],偏差ε。則式(1)和式(2)轉(zhuǎn)為
Θ=QR+ε
(11)
原始量測矩陣向量角轉(zhuǎn)化后,新矩陣的秩不小于體系組分?jǐn)?shù),即滿足多元統(tǒng)計分析的秩要求,就能采用PLS建立多元模型,預(yù)測被測組分含量。如果量測存在加性干擾,在執(zhí)行上述乘性校正處理前,就應(yīng)該加以去除。
2.1 儀器和試劑
拉曼光譜儀(QE65000,美國Ocean optics),激光器(MTS-785-MD600N,美國Mars Electronics); 光纖探頭(BAC100-785-OEM,美國Ocean optics)。
無水乙醇(分析純); 甲醇(分析純); 異丙醇(分析純)。
2.2 方法
2.2.1 系列樣品配制
準(zhǔn)確量取不同體積的乙醇10 mL容量瓶,加入體積各不相同的異丙醇后,以甲醇定容得到乙醇體積分?jǐn)?shù)5%~90%范圍的系列樣品共30個。
2.2.2 拉曼光譜采集
樣品置于光程1 cm石英比色皿,固定拉曼探頭與比色皿的間距。以兩種方式采集光譜,一是固定積分時間1 s,分別采集30個樣品的拉曼光譜; 二是調(diào)整積分時間(積分時間范圍1~10 s),采集處于儀器最佳信噪比和線性范圍內(nèi)的光譜。
3.1 數(shù)據(jù)處理
如圖3,選取751~1 600和2 601~3 150 cm-1兩段光譜建模,以降低光譜中不含或僅含少量信息的區(qū)域?qū)δP偷母蓴_[14]。選擇乙醇含量高于80%的4個樣本進行SVD分解,將第一分量作為參比向量。將參比向量和樣品光譜的300個數(shù)據(jù)劃分到30個子區(qū)間,分別計算對應(yīng)的夾角余弦值,構(gòu)成尺寸為30×30的矩陣Θ。使用累計方差貢獻率確定矩陣Θ的主成分?jǐn)?shù)(化學(xué)秩)為3,與體系實際包括甲醇、乙醇、異丙醇3種組分的情況一致,并且矩陣秩滿足多元建模要求。
Fig.3 Raman spectra of methanol/ethanol/ isopropyl and their mixture
3.2 定量分析
按照乙醇含量分布,從30組樣本中選20組作為校正集,其余作為驗證集。固定積分時間1 s,由于測量條件確定,沒有顯著的乘性效應(yīng),采用PLS、向量角+PLS(Vector angle+PLS, VAPLS)的結(jié)果如表1和圖4所示。
調(diào)整樣品測量的積分時間,可以使測量結(jié)果有較好的信噪比和線性響應(yīng),第二種測量方式下,積分時間處于1~10 s不等,因此信號包含了乘性干擾,采用PLS,MSC+PLS和VAPLS分別處理的結(jié)果如表2和圖5。
表3對比了兩種測量方式PLS和經(jīng)過VAPLS處理后的預(yù)測結(jié)果,乘性效應(yīng)顯著時,直接PLS結(jié)果誤差顯著,而MSC處理后的PLS,RMSEP略微降低,但預(yù)測值與實際值的相關(guān)性變差; VAPLS則保持了穩(wěn)定而理想的定量效果。由于測量信噪比的改善,VAPLS在變動積分時間測量的結(jié)果甚至優(yōu)于固定積分時間測量。
Table 1 Analytical result of ethanol content by different methods at 1S as integration time
Fig.4 The result of ethanol content by PLS and unvarying integration time (1 s)
Fig.5 The result of ethanol content by PLS,MSC+PLS VAPLS at an and VAPLS at varying integration time (1 ~10 s)
使用MSC這種經(jīng)驗選取的方法進行乘性效應(yīng)校正時,參數(shù)選擇非常重要,如果參數(shù)選擇不合適或MSC假設(shè)不成立,如表2和表3,反而破壞了原始數(shù)據(jù)間的近似線性關(guān)系,導(dǎo)致模型預(yù)測能力降低,無法保證校正效果。PLS建?;跍y量值與預(yù)測值之間的線性關(guān)系,未經(jīng)校正的拉曼光譜,其強度波動降低或破壞了線性關(guān)系。拉曼光譜的測量方式無法避免散射和折射的影響,在固定測量條件的預(yù)測結(jié)果中,可以看出規(guī)律性誤差,對于高/低含量,誤差明顯,說明僅僅約束測量條件,無法避免乘性效應(yīng)誤差。
Table 2 Analytical result of ethanol content by different methods at 1~10 s as integration time
Table 3 Analytical result of different methods
通過向量角轉(zhuǎn)換校正乘性效應(yīng),利用了向量角不受乘性效應(yīng)影響的特性,重構(gòu)線性關(guān)系,雖然不是完全嚴(yán)格,但從實驗結(jié)果可以看出,其損失的準(zhǔn)確性通過消除乘性效應(yīng)得到彌補,因調(diào)整參數(shù)改善的信噪比和儀器線性響應(yīng),又進一步提高了預(yù)測精度。
拉曼光譜定量一直受到散射和折射影響,現(xiàn)有方法或效果有限或通常比較復(fù)雜。VAPLS方法將光譜數(shù)據(jù)視為向量,通過向量角轉(zhuǎn)換消除因散射和折射引起的乘性干擾,滿足多元分析所需的線性條件。實驗結(jié)果表明有效改善了定量效果,原理簡單、易于理解,數(shù)據(jù)處理過程便于模塊化,對于過程分析和在線監(jiān)測等難以保證可重復(fù)分析條件的應(yīng)用場合,將具有廣泛的應(yīng)用價值。
[1] HU Jun, HU Ji-ming(胡 軍, 胡繼明). Chinese Journal of Analytical Chemistry(分析化學(xué)), 2000, 28(6): 764.
[2] WANG Shu-xia, LI Li-mei, ZHONG Li-jing, et al(王淑霞, 李麗梅, 仲利靜, 等). Journal of Analytical Science(分析科學(xué)學(xué)報), 2011, 27(6): 782.
[3] Bakeev K D. Process Analytical Technology. 2nd ed. NJ: A John Wiley & Sons, Ltd. 2010. 372.
[4] CHU Xiao-li(褚小立). Molecular Spectroscopy Analytical Technology Combined with Chemometrics and Its Applications(化學(xué)計量學(xué)方法與分子光譜分析技術(shù)). Beijing: Chemical Industry Press(北京: 化學(xué)工業(yè)出版社), 2011. 48.
[5] Blanco M, Coello J, Montoliu I, et al. Analytica Chimica Acta, 2001, 434: 126.
[6] Jin Jingwei, Chen Zengping, Li Limei, et al. Analytical Chemistry, 2012, 84, 321.
[7] Iversen J A, Berg R W, Ahring B K. Anal. Bioanal. Chem., 2014, 406: 4915.
[8] Chen Y C, Thennadil S N. Analytica Chimica Acta, 2012, 746: 38.
[9] Yang Jing, Chen Zeng Ping, Zhang Juan, et al. Chemometrics and Intelligent Laboratory System, 2013, 126: 6.
[10] Song Mi, Chen Zeng Ping, Chen Yao, et al. Talanta, 2014, 125: 348.
[11] HU Ai-qin, YUAN Hong-fu, SONG Chun-feng, et al(胡愛琴, 袁洪福, 宋春風(fēng). 等). Spectroscopy and Spectral Analysis(光譜學(xué)與光譜分析), 2014, 34(10): 2606.
[12] YAO Zhi-xiang,SU Hui(姚志湘, 粟 暉). CN102306236A.2012-01-04.
[13] Bai T J, Bai A A. Acta Ecologica Sinica, 2002, 22(6): 950.
[14] CHU Xiao-li, YUAN Hong- fu, LU Wan-zhen(褚小立, 袁洪福, 陸婉珍). Progress in Chemistry(化學(xué)進展), 2004, 16(4): 535.
Correction Multiplicative Effects in Raman Spectra through Vector Angle Transformation
YAO Zhi-xiang1,3, SUN Zeng-qiang1, 3, SU Hui1, 3, YUAN Hong-fu2
1. Guangxi Key Laboratory of Sugar Resources Green Processing,Guangxi University of Science and Technology,Liuzhou 545006, China 2. College of Materials Science and Engineering, Beijing University of Chemical Technology, Beijing 100029, China 3. College of Biological and Chemical Engineering, Guangxi University of Science and Technology, Liuzhou 545006, China
The linear relationship between the Raman spectral intensity and the analyte amount is frequently disrupted for a variety of complex reasons, which include these variations in laser source, focusing effect, sample scattering and refracting, so that causes poor quantitative results. As a whole, these disturbing effects can be divided to be additive and multiplicative, and the multiplicative effects are generally more difficult to be eliminated. A spectrum is a series data, also can be treated as a vector. In principle, unstable motions in spectrum intensity/amplitude corresponding to the module shifts for a vector, doesn’t impact the vector direction which is the essence of the vector, so it is reasonable to rewrite the data form on module to on space angle for the same measurement. This thesis employed a data transformation to eliminate the multiplicative effects within spectra, i. e., the spectrum signal on its amplitude has been transformed to be on the vector angles. The first step of the transformation is the selection of a stand vector which is near to the analyte and almost orthogonal to the background within the sample space; and the next step is to define a moving window, then to find out the angle between the sample vector (i. e. the transformed spectrum) and the stand vector within the window; while the window is moved along the spectrum data series, the transformation for vector angle (VA) series has been finished. The thesis has proved that an approximate linear quantitative relationship has been remained in the VA series. Multivariate calibration need full rank matrix which is combined by spectrum from variety samples, and variety VA series also can combine a full rank VA matrix, so the approximate linear VA matrix still perfectly meeting the demand for multivariate calibration. A mixed system consisted by methanol-ethanol-isopropanol has been employed to verify the eliminations to the multiplicative effects. These measuring values of the system are obtained at different Raman integral times and have remarkable multiplicative effects. In predicting results, the correlation coefficient (r) and the root mean squared error of prediction (RMSEP) from class PLS respectively are 0.911 9 and 0.110 2, and 0.906 0 and 0.100 8 are for the preprocessing by multiplicative scatter correction (MSC). In contrast,rand RMSEP under the VAPLS, presented by this thesis, respectively are 0.998 7 and 0.015 2 and are significantly better than others. The VAPLS has eliminated the multiplicative effects of Raman spectra and improved the accuracy of Raman quantitative analysis and it owes to the preprocessing of the vector angle transformation.
Raman spectrum; Multiplicative effects; Scatter correction; Vector angle transformation
Oct. 13, 2014; accepted Feb. 4, 2015)
2014-10-13,
2015-02-04
國家科技支撐計劃課題(2011BAE11B00), 廣西自然科學(xué)基金項目(2014GXNSFAA118056),廣西科技計劃項目(桂科攻 1355010-15)資助
姚志湘,1968 年生,廣西科技大學(xué)廣西糖資源綠色加工重點實驗室教授 e-mail: zxyao@21cn.com
O657.37
A
10.3964/j.issn.1000-0593(2016)02-0419-05