張 平,張振宇,吳志生
(1.中國(guó)刑事警察學(xué)院 法化學(xué)系,遼寧 沈陽(yáng)110035;2.北京中醫(yī)藥大學(xué),北京100102)
鑒定科學(xué)Research Paper
近紅外光譜法鑒定簽字筆字跡形成時(shí)間的化學(xué)計(jì)量學(xué)模型的建立
張 平1,張振宇1,吳志生2
(1.中國(guó)刑事警察學(xué)院 法化學(xué)系,遼寧 沈陽(yáng)110035;2.北京中醫(yī)藥大學(xué),北京100102)
目的 隨著偽造文件犯罪的日益增多,常用的字跡形成時(shí)間鑒定方法難以做到快速、無(wú)損。采用近紅外光譜分析技術(shù),結(jié)合化學(xué)計(jì)量學(xué),以達(dá)到對(duì)簽字筆字跡形成時(shí)間進(jìn)行準(zhǔn)確、快速、無(wú)損分析的目的。方法 對(duì)40個(gè)黑色真彩簽字筆字跡樣本進(jìn)行近紅外光譜數(shù)據(jù)采集,并運(yùn)用相關(guān)模型進(jìn)行預(yù)處理。建立字跡形成時(shí)間與近紅外光譜數(shù)據(jù)之間的多元分析模型,并用相對(duì)分析誤差 (RPD)來(lái)評(píng)價(jià)模型的預(yù)測(cè)能力。結(jié)果 應(yīng)用多元散射校正(MSC)預(yù)處理方法所建模型最佳,其各項(xiàng)校正標(biāo)準(zhǔn)偏差與RPD均符合行業(yè)認(rèn)定范圍,所建模型具有可行性。結(jié)論 近紅外光譜技術(shù)可對(duì)不同形成時(shí)間的黑色真彩簽字筆字跡進(jìn)行準(zhǔn)確定量分析,為字跡的形成時(shí)間的鑒定提供了一種綜合性參考方法。
近紅外光譜;字跡形成時(shí)間;偏最小二乘法
簽字筆最早起源于1984年日本櫻花株式會(huì)社研制開(kāi)發(fā)的Ballsigll產(chǎn)品和1988年日本Pentel株式會(huì)社推出的Hybird新產(chǎn)品[1],20世紀(jì)90年代由中國(guó)廣東引進(jìn)技術(shù)并開(kāi)始大量生產(chǎn)。簽字筆墨水成分主要由溶劑、著色劑、表面活性劑和其他添加劑等組成。由于書(shū)寫(xiě)順暢、色澤鮮艷、不易褪色等特點(diǎn),簽字筆已成為人們?nèi)粘I钪凶畛S玫臅?shū)寫(xiě)工具。隨著社會(huì)經(jīng)濟(jì)的不斷發(fā)展,偽造文件、合同的犯罪日益增多,特別是民事案件中,文件的形成時(shí)間鑒定爭(zhēng)議最為集中、矛盾最多[2]。因此,如何快速、準(zhǔn)確、無(wú)損地鑒定文件中字跡的形成時(shí)間已成為司法鑒定工作者研究的一項(xiàng)重要課題。
近紅外光譜技術(shù)(Near-Infrared Spectroscopy,NIR)是一種典型的快速無(wú)損分析技術(shù),自20世紀(jì)80年代引入到我國(guó)用于農(nóng)產(chǎn)品的質(zhì)量分析,現(xiàn)已經(jīng)廣泛應(yīng)用于石油化工、食品、煙草、藥物和臨床醫(yī)學(xué)各個(gè)領(lǐng)域。將其與化學(xué)計(jì)量學(xué)方法相結(jié)合,可為諸多領(lǐng)域的生產(chǎn)質(zhì)量控制提供一種高效的檢測(cè)手段。
本文采用近紅外光譜技術(shù)對(duì)用黑色真彩GEIE550簽字筆書(shū)寫(xiě)的不同時(shí)間的字跡樣本進(jìn)行近紅外光譜采集,對(duì)采集到的原始光譜數(shù)據(jù)進(jìn)行Savitzky-Golay卷積平滑法(SG)、標(biāo)準(zhǔn)正則變換(SNV)、多元散射校正(MSC),以及Normalize等光譜預(yù)處理,建立了字跡形成時(shí)間與其近紅外光譜數(shù)據(jù)之間的偏最小二乘(PLS)近紅外定量校正模型,并運(yùn)用RPD來(lái)評(píng)價(jià)模型的預(yù)測(cè)能力,以期達(dá)到測(cè)定簽字筆字跡形成時(shí)間的目的。
近紅外光譜是指波長(zhǎng)在780~2 500 nm(波數(shù)為4 000~12500 cm-1)之間的電磁波。近紅外光譜屬于分子振動(dòng)光譜,產(chǎn)生于共價(jià)化學(xué)鍵非諧能級(jí)振動(dòng),是非諧振動(dòng)的倍頻和組合頻。對(duì)于含氫基團(tuán),如含C-H,O-H,N-H的物質(zhì)都會(huì)產(chǎn)生近紅外吸收。有機(jī)物以及部分無(wú)機(jī)物分子中各種含氫基團(tuán)在受到近紅外線照射時(shí),被激發(fā)產(chǎn)生共振,同時(shí)吸收一部分光的能量,通過(guò)測(cè)量其對(duì)光的吸收情況,可以得到極為復(fù)雜的近紅外圖譜,這種圖譜表示被測(cè)物質(zhì)的特征。不同物質(zhì)在近紅外區(qū)域有豐富的吸收光譜,每種成分都有特定的光譜特征。因此,近紅外光譜能反映物質(zhì)的組成和結(jié)構(gòu)信息,從而可以作為獲取化學(xué)信息的一種有效手段。
各種書(shū)寫(xiě)材料經(jīng)書(shū)寫(xiě)工具寫(xiě)到紙上后,由于改變了書(shū)寫(xiě)材料存在的條件,使其直接暴露在空氣中或光線下,隨著時(shí)間的推移,書(shū)寫(xiě)材料本身就會(huì)發(fā)生某些物理、化學(xué)性質(zhì)的變化,這種變化的程度與書(shū)寫(xiě)時(shí)間的長(zhǎng)短相對(duì)應(yīng)。測(cè)出這種變化并能掌握其變化規(guī)律,就可以利用這一特征判斷文字的書(shū)寫(xiě)時(shí)間。
2.1 材料、儀器
由黑色真彩GEIE550簽字筆書(shū)寫(xiě)的8組不同書(shū)寫(xiě)時(shí)間字跡樣本,每組字跡樣本的時(shí)間間隔為90 d,每組字跡樣本中包含2個(gè)漢字樣本和3個(gè)數(shù)字樣本,實(shí)驗(yàn)共計(jì)40個(gè)樣本。
XL410近紅外光譜儀及其漫反射光纖(AXSUN公司,美國(guó)生產(chǎn));Unscrambler數(shù)據(jù)分析軟件(version9.6,挪威CAMO軟件公司);MATLAB(version7.0,美國(guó)Math Works公司)。
2.2 方法
2.2.1 樣本的制備
本實(shí)驗(yàn)中用黑色真彩簽字筆在白色A4打印紙上書(shū)寫(xiě)文字和數(shù)字,正常避光條件下保存。8組不同形成時(shí)間的簽字筆字跡形成時(shí)間分別為90、180、270、360、450、540、630、720 d。
2.2.2 NIR光譜的采集
采用漫反射模式采集簽字筆字跡光譜,光譜掃描范圍為1 350~1 800 nm,掃描間隔為0.5 nm,掃描頻率為64次/s。對(duì)所選取的每個(gè)實(shí)驗(yàn)樣本進(jìn)行6個(gè)不同位置的光譜采集,位置選取的標(biāo)準(zhǔn)為起筆位置、收筆位置、墨跡輕重程度不同的位置及墨跡交叉的位置等,40個(gè)樣品共計(jì)采集240條光譜,采集的原始近紅外光譜譜圖(圖1)。
圖1 簽字筆字跡的原始近紅外光譜
2.2.3 樣本集的劃分
采用 Kennard-Stone法(K-S)劃分240個(gè)樣本集,劃分后的校正集和驗(yàn)證集分別為160個(gè)和80個(gè)。其中,校正集用于建立近紅外光譜數(shù)據(jù)與形成時(shí)間關(guān)系數(shù)據(jù)模型,驗(yàn)證集用于模型的驗(yàn)證。
2.2.4 光譜的預(yù)處理
為消除近紅外光譜的基線漂移、非線性以及光譜的低重復(fù)性[3]的影響,本文采用Savitzky-Golay卷積平滑法(SG)、標(biāo)準(zhǔn)正則變換(SNV)、多元散射校正(MSC),以及歸一法(Normalize)四種方法對(duì)采集所得的光譜進(jìn)行預(yù)處理。SG卷積是一種加權(quán)平均法,此處理方法可消除近紅外光譜中含有的噪聲;SNV主要用來(lái)消除固體顆粒大小、表面散射以及光程變化對(duì)NIR漫反射光譜的影響;MSC主要用來(lái)消除顆粒分布不均勻及顆粒大小產(chǎn)生的散射影響,在固體漫反射和漿狀物透(反)射光譜中應(yīng)用較為廣泛;Normalize可以消除因微小光程差異帶來(lái)的光譜變動(dòng),在NIR光譜分析中常用的歸一化法為矢量分析法。
2.2.5 定量分析模型的建立
將經(jīng)過(guò)預(yù)處理的近紅外光譜數(shù)據(jù)與其形成時(shí)間建立全波段偏最小二乘(PLS)模型[4],采用交叉驗(yàn)證方法確定模型的主因子數(shù)。校正集的統(tǒng)計(jì)參數(shù)包括交叉驗(yàn)證校正標(biāo)準(zhǔn)偏差(RMSECV)、校正標(biāo)準(zhǔn)偏差(RMSEC)和校正集決定系數(shù)R2cal;驗(yàn)證集的統(tǒng)計(jì)參數(shù)包括預(yù)測(cè)標(biāo)準(zhǔn)偏差(RMSEP)和預(yù)測(cè)集決定系數(shù)R2pre。其中,RMSECV、RMSEC的值越小,表明所建模型的質(zhì)量越高,RMSEP的值越小,表明模型的預(yù)測(cè)能力越強(qiáng),R2越接近于1,表明準(zhǔn)確性越高。此外,也可以采用相對(duì)分析誤差[5-6](Residual Predictive Deviation,RPD)來(lái)評(píng)價(jià)模型的預(yù)測(cè)能力,RPD值越大,所對(duì)應(yīng)的校正模型的預(yù)測(cè)性能越好,當(dāng)RPD值大于2.5時(shí),表明模型的定量分析具有可行性。
其中yi,actual為第 i個(gè)樣品參考方法的測(cè)定值;yi,perdicted為用所建模型對(duì)校正集中第i個(gè)樣品的近紅外光譜方法預(yù)測(cè)值;n為校正集的樣品數(shù)。
其中,yi,actual為第 i樣品參考方法的測(cè)定值;yi,perdicted為校正集交互驗(yàn)證過(guò)程中第i個(gè)樣品的近紅外光譜方法預(yù)測(cè)值;n為校正集的樣品數(shù)。
其中,yi,actual為第 i樣品參考方法的測(cè)定值;yi,perdicted為驗(yàn)證集預(yù)測(cè)過(guò)程中第i樣品的近紅外光譜方法預(yù)測(cè)值;m為驗(yàn)正集的樣品數(shù)。
其中,yi,actual為第 i樣品參考方法的測(cè)定值;yi,perdicted為校正集或驗(yàn)證集所有樣品參考方法測(cè)定的平均值;yactual為校正集或驗(yàn)證集預(yù)測(cè)過(guò)程中第i樣品的近紅外光譜方法預(yù)測(cè)值;n為校正集或驗(yàn)證集的樣品數(shù)。
其中,Ci為驗(yàn)證集樣本參考方法的平均值;n為驗(yàn)證集的樣品數(shù)。
本文采用了SG卷積平滑、標(biāo)準(zhǔn)正則變換、多元散射校正和歸一化方法對(duì)采集的240個(gè)樣本的近紅外光譜進(jìn)行光譜預(yù)處理,來(lái)探討不同方法對(duì)模型性能的影響。表1給出各預(yù)處理方法所建立的模型的性能指標(biāo)值,其中RMSECV值越小,R2越接近于1,RPD值越大表明模型性能越好。圖2為不同預(yù)處理方法的預(yù)測(cè)殘差平方和(PRESS)的值,通過(guò)考察主因子數(shù)對(duì)預(yù)測(cè)殘差平方和(PRESS)的影響,當(dāng)曲線中趨于穩(wěn)定的主因子數(shù)越多,且模型建立選取的主因子數(shù)越少,證明模型的性能越高。綜合以上標(biāo)準(zhǔn),可優(yōu)選出最佳的預(yù)處理方法。結(jié)果表明,表1中采用多元散射校正(MSC)預(yù)處理方法所得RMSECV值為78.484,R2cal為0.9207,R2pre為0.8843,RPD為2.958,主因子數(shù)為7。因此,采用MSC處理后的光譜建立PLS模型具有可行性,可得出簽字筆字跡在形成時(shí)間上存在規(guī)律性,可由此測(cè)定簽字筆字跡的形成時(shí)間。
表1 不同光譜預(yù)處理方法的定量模型的性能指標(biāo)
圖2 不同預(yù)處理方法的PRESS值
本文采用近紅外光譜技術(shù)對(duì)用黑色真彩GEIE550簽字筆書(shū)寫(xiě)的不同形成時(shí)間的字跡樣本進(jìn)行了近紅外光譜采集,并建立了其形成時(shí)間與近紅外光譜數(shù)據(jù)的偏最小二乘定量模型,所得模型的R2pre為0.8843,表明字跡在不同時(shí)間的變化中存在規(guī)律性。同時(shí),采用RPD來(lái)評(píng)價(jià)模型的預(yù)測(cè)能力,其RPD值達(dá)到2.958,說(shuō)明其模型的定量分析具有可行性。近紅外光譜法可對(duì)字跡樣本進(jìn)行快速、無(wú)損的檢驗(yàn),但在實(shí)際應(yīng)用前,還應(yīng)該對(duì)該方法進(jìn)行進(jìn)一步的改進(jìn),有必要擴(kuò)充樣本集的數(shù)量及范圍,以提高模型的穩(wěn)定性,對(duì)建模方法進(jìn)行進(jìn)一步的升級(jí)與完善,對(duì)模型在文檢應(yīng)用中的各項(xiàng)指標(biāo)進(jìn)行討論并作出明確的規(guī)定,以提高模型的適應(yīng)性,為今后的字跡檢驗(yàn)提供一種綜合的研究方法。
[1]李彪.簽字筆墨水字跡形成時(shí)間研究綜述[J].法庭科學(xué),2012,(4):95-98.
[2]籍康,趙杰.共焦顯微拉曼光譜對(duì)簽字筆字跡形成時(shí)間的研究[J].南京師大學(xué)報(bào),2010,33(4):68-71.
[3]Devos O,Ruckebusch C,Durand A,et al.Support V ector machine(SNV)in N ear I nfrared(NIR)S pectroscopy:Focus on P arameters O ptimization and M odel I nterpretation[J].Chemometrics and Intelligent Laboratory System,2009,96(1):27-33.
[4]白雁,李珊,王星,等.近紅外光譜法快速測(cè)定金銀花中綠原酸的含量[J].中國(guó)實(shí)驗(yàn)方劑學(xué)雜志,2011,(5):66-69.
[5]Chan C,Chu C,Mok D K,et al.Analysis of B erberine and T otal alkaoid C ontent in Cortex Phellodendri by N ear infrared S pectroscopy(NIRS)C ompared with H igh-P erformance L iquid C hromatography C oupled with U ltra-V isible S pectrometric D etection[J].Analytica Chimica Acta,2007,592(2):121-131.
[6]Joubert E,Manley M,Botha M.Use of NIRS for Quantification of Mangiferin and Hesperidin Contents of Dried Green Honeybush(Cyclopia genistoides)P lant M ateria[J].JAgric Food Chem,2006,54,(15):5279-5283.
(本文編輯:張清華)
Chem ometric M odel for Dating Gel Ink Entries by Near Infrared Spectroscopy
ZHANG Ping1,ZHANG Zhen-yu1,WU Zhi-sheng2
(1.NationalPolice University ofChina,Shengyang110035,China;2.Beijing University ofChineseMedicine,Beijing100102,China)
Objective With the increasing number of forged documents,the commonly used methods for dating ink entries is difficult to achieve fast and non-destructive analysis.In this study,a near-infrared spectroscopy method combined with chemometricswas established for the accurate,fast and non-destructive analysis of the age of gel ink entries.M ethod The near-infrared spectra of 40 black gel ink sampleswere collected and pre-treated with relevantmodels.Multivariate analysis models describing the relationship between ink ages and near-infrared spectra were established.The relative prediction error(RPD)was used to evaluate the prediction ability of the models.Result The model developed by the multiple scattering correction(MSC)method was the best,and the calibration standard deviation and RPD were acceptable.The model is feasible.Conclusion Near-infrared spectroscopy can analyze the black gel ink entries written at different time accurately and quantitatively,which provides a referencemethod for ink dating.
near-infrared spectroscopy;ink dating;partial least squares
DF794.2
A
10.3969/j.issn.1671-2072.2017.03.011
1671-2072-(2017)03-0061-04
2016-11-17
國(guó)家“十三五”重點(diǎn)研發(fā)計(jì)劃課題(2016YFC0800705)
張平(1992—),女,碩士研究生,主要從事微量物證研究。E-mail:1449967207@qq.com。
張振宇(1960—),男,教授,主要從事微量物證研究。E-mail:ccpczzy@163.com。