張清華,楊 旭,羅儀文,孫其然,王雅晨,施少培,徐 徹
(司法部司法鑒定科學(xué)技術(shù)研究所,上海200063)
打印文件的偽造與篡改在各類案件中時有發(fā)生,其來源與真?zhèn)蔚蔫b別已成為法庭科學(xué)領(lǐng)域的重要研究內(nèi)容。墨粉作為激光打印文件的重要組成部分,其化學(xué)組成主要為樹脂、染料、電荷調(diào)節(jié)劑、輔助添加劑、磁粉/載體等[1]。不同廠家、不同型號的打印機(jī)所使用的墨粉化學(xué)成分及相對含量存在一定差異,通過分析墨粉的化學(xué)組成從而判斷打印文件的來源具有良好的有效性[2]。
紅外光譜法分析墨粉,最初采用的是溴化鉀壓片傅里葉變換紅外分析技術(shù)[3],隨著顯微紅外技術(shù)的發(fā)展顯微紅外光譜法成為常用分析方法[4]。由于墨粉是一種由樹脂、染料等多種物質(zhì)組成的混合物,采用紅外光譜分析獲得是多組分混合光譜信息,在傳統(tǒng)比對檢驗(yàn)中難以確定不同墨粉差異的規(guī)律性特征?;瘜W(xué)計量學(xué)[5-6]是一種集化學(xué)、統(tǒng)計學(xué)、線性代數(shù)及計算機(jī)技術(shù)為一體的化學(xué)信息處理方法,廣泛應(yīng)用于化學(xué)信息的整合、提取與再分析,從而揭示樣本間的相關(guān)關(guān)系與本質(zhì)差異,國內(nèi)采用紅外光譜技術(shù)結(jié)合化學(xué)計量學(xué)方法來研究墨粉及打印機(jī)種類的研究還未見報道。
本文采用顯微紅外光譜技術(shù)結(jié)合化學(xué)計量學(xué)方法對不同品牌、不同型號的激光打印原裝黑色墨粉進(jìn)行比較分析,根據(jù)特征信息的提取探討不同墨粉間的本質(zhì)差異,同時針對黑白與彩色激光打印原裝黑色墨粉的光譜特征進(jìn)行總結(jié),為墨粉的進(jìn)一步區(qū)分與鑒別提供依據(jù)。
Nicolet Continum iN10顯微紅外光譜儀(美國Thermal-Fisher公司),配有150X紅外顯微鏡,MCT/A檢測器;EZ4D顯微鏡(德國Leica公司)。
收集市售10個品牌不同型號激光打印機(jī)共31臺,其中16臺為黑白激光打印機(jī),15臺為彩色激光打印機(jī),打印機(jī)信息見表1。
表1 不同品牌、不同型號激光打印機(jī)信息列表
采用1.1表1中的激光打印機(jī)分別打印制備31份樣品材料,其中彩色激光打印機(jī)選用灰度打印模式。將兩片2 mm厚石英玻璃置于待測樣本兩側(cè),采用預(yù)熱到200℃的電熨斗加熱2 min,使墨粉轉(zhuǎn)移到石英玻璃后利用手術(shù)刀片刮取適量墨粉進(jìn)行金剛石壓片顯微紅外光譜分析。
顯微紅外光譜儀器,常溫透射模式,掃描范圍為4000~400 cm-1,分辨率16 cm-1,累計掃描次數(shù)64次。
1.4.1 主成分分析
主成分分析(Principal Component Analysis,PCA)[5,7]是一種常用的多元統(tǒng)計分析方法,通常用于數(shù)據(jù)信息的提取或者變量維數(shù)的壓縮。其基本原理是將一組相關(guān)變量通過線性變換后得到一組維數(shù)不變而相互正交的變量,即為主成分。主成分根據(jù)信息量的多少依次排序,前幾個主成分包含了絕大部分的信息,選擇前幾個主成分進(jìn)行數(shù)據(jù)再分析不會導(dǎo)致主要信息的丟失。主成分分析過程的實(shí)現(xiàn),常選用奇異值分解(Singular Value Decomposition,SVD)[8],它主要基于如下線性代數(shù)原理:對任意的n×m階量測數(shù)據(jù)矩陣X(其中n為樣本數(shù),m為變量數(shù),且n>m)分解為三個矩陣的乘積:
其中S收集了所有特征值,U和Vt分別為每個特征值對應(yīng)的特征變量所組成的標(biāo)準(zhǔn)列正交與標(biāo)準(zhǔn)行正交矩陣,記 T=US,P=V,有
在多元統(tǒng)計分析方法中,T和P通常稱為得分矩陣與載荷矩陣。當(dāng)X為訓(xùn)練集數(shù)據(jù)Xtrain時,T與P分別記為Ttrain、Ptrain。Ttrain前幾列收集了訓(xùn)練集數(shù)據(jù)的大部分信息,選擇前兩列或者三列數(shù)據(jù)做得分投影圖,構(gòu)建標(biāo)準(zhǔn)投影空間可以直觀的實(shí)現(xiàn)訓(xùn)練集樣本 “物以類聚”的效果;而載荷矩陣Ptrain前幾列值反映了原有變量在分類過程中的相關(guān)關(guān)系,其絕對值的大小反映了原有變量對于聚類貢獻(xiàn)率的大小。當(dāng)X為測試集數(shù)據(jù)Xtest時,根據(jù)線性代數(shù)運(yùn)算法則有
其中Ttest表示測試集數(shù)據(jù)的得分矩陣,選擇相應(yīng)的得分值投影到標(biāo)準(zhǔn)投影空間從而實(shí)現(xiàn)測試集數(shù)據(jù)的投影預(yù)報。
1.4.2 系統(tǒng)聚類法
系統(tǒng)聚類法(Hierarchical cluster analysis,HCA)[9]是一種經(jīng)典的多元統(tǒng)計分析方法。其基本思路是:首先將所有n個樣本各自看做一個類,即共有n類;其次計算n類樣本之間的距離,把距離最小的兩類合并為一類,并計算出新類的坐標(biāo)值,再用相同的方法合并距離相近的類,重復(fù)此過程,直到所有分類歸為一類為止。系統(tǒng)聚類通常采用圖形的形式來表達(dá)聚類過程,稱為聚類圖。實(shí)現(xiàn)系統(tǒng)聚類最關(guān)鍵的是計算樣本間與類間距離,樣本間的距離計算方法有:歐式距離、馬氏距離、曼哈坦距離,藪爾格距離,本文選用的是最常用的歐式距離法,其公式如下:
式中A,B分別代表兩個樣本,DAB為兩樣本間的距離,m為變量數(shù)。類間距計算有:平均距離法、重心距離法、最短距離法以及最小距離法,本文選擇的是最短距離法,其定義Gi與Gj兩類樣本間的距離為:
式中dab為樣本xa與xb之間的距離。
根據(jù)激光打印機(jī)原裝黑色墨粉紅外光譜的主要差異,31個樣品可分為兩類(見表2):第I類為 S7、S8、S29 3臺黑白激光打印機(jī)與S19、S20 2臺彩色激光打印機(jī),其墨粉的紅外光譜整體相似,均反映了1 608 cm-1,1 583 cm-1,1 510 cm-1處苯環(huán)對位取代后的骨架振動,831 cm-1處對位取代苯環(huán)上相鄰兩個氫原子的C-H面外彎曲振動,1 721 cm-1處羰基伸縮振動,731 cm-1,1 272 cm-1處對苯二甲酸的特征吸收,1 249 cm-1處芳香-脂肪醚Ar-O-C的反對稱伸縮振動以及1 115 cm-1處C-O對稱伸縮振動(見圖1)。第II類包括13臺黑白激光打印機(jī)與13臺彩色激光打印機(jī),其墨粉的紅外光譜與第I類墨粉的紅外光譜不同,主要表現(xiàn)為755 cm-1,699 cm-1處的苯環(huán)單取代吸收;1 602 cm-1,1 160 cm-1,1 494 cm-1,1 451 cm-1處的苯環(huán)骨架振動吸收譜帶以及1725cm-1處的羰基伸縮振動吸收(見圖2)。
根據(jù)以上實(shí)驗(yàn)結(jié)果,所有墨粉樣品的紅外光譜主要反映了樹脂的紅外特征吸收,這是由墨粉本身的性質(zhì)所決定的:樹脂作為墨粉的重要組成部分,是一類有較強(qiáng)的紅外特征吸收的有機(jī)物,并且在墨粉組成中占有較高比例(約為60%~80%)。另外,兩類墨粉樣品紅外光譜間的差異主要源于不同的樹脂,第I類墨粉使用的樹脂是聚對苯二甲酸/環(huán)氧樹脂,而第II類墨粉為聚苯乙烯/甲基丙烯酸甲酯樹脂。兩類樹脂均是生產(chǎn)黑白與彩色激光打印墨粉的常用原料,因此難以通過墨粉樹脂的種類實(shí)現(xiàn)黑白與彩色激光打印機(jī)的區(qū)分。
表2 基于樹脂種類的原裝墨粉分類表
圖1 聚對苯二甲酸/環(huán)氧樹脂類墨粉紅外光譜圖
圖2 聚苯乙烯/甲基丙烯酸甲酯類墨粉紅外光譜圖
根據(jù)不同的顯影方式,墨粉具有雙組份和單組份之分,雙組份墨粉除含有顯影碳粉外還需要載體(通常為鐵屑)作為起電劑,而單組份墨粉又分為單組份磁性墨粉與非磁性墨粉,單組分磁性墨粉中含有黑色的鐵氧化物,在墨粉的生產(chǎn)使用過程中具有染色與運(yùn)載墨粉的功能[1,10]。
實(shí)驗(yàn)表明,樣本 S1~S6、S21、S24~S26、S28、S30 與S31共13臺黑白激光打印機(jī)墨粉的紅外光譜在568cm-1處有一中等強(qiáng)度的鐵氧化物寬峰,表明此類墨粉為單組份磁性墨粉;其余3臺黑白激光打印機(jī)和15臺彩色激光打印機(jī)墨粉的紅外光譜中未出現(xiàn)鐵氧化物的特征吸收峰,表明相應(yīng)墨粉為雙組份或者單組份非磁性墨粉。
對于黑白激光打印機(jī),S7,S8和S29(見圖 1)與其余13臺黑白激光打印機(jī)(見圖2-a)墨粉紅外光譜存在明顯差異,前者基線斜率較低(起點(diǎn)透射率通常高于30%),主要表現(xiàn)為聚對苯二甲酸/環(huán)氧樹脂特征吸收,同時在568 cm-1處未發(fā)現(xiàn)鐵氧化物的紅外吸收峰;后者基線斜率偏高(起點(diǎn)透射率通常低于30%),主要表現(xiàn)為聚苯乙烯/甲基丙烯酸甲酯特征吸收,同時在568 cm-1處檢出有鐵氧化物的特征吸收。對于彩色激光打印機(jī),S19、S20號打印機(jī)墨粉主要為聚對苯二甲酸/環(huán)氧樹脂類墨粉,其余13臺打印機(jī)墨粉主要為聚苯乙烯/甲基丙烯酸甲酯類墨粉,就整體而言彩色激光打印墨粉的紅外光譜基線斜率偏低,同時不含有鐵氧化物特征吸收。因此,在檢案過程中可以依據(jù)墨粉紅外光譜基線斜率的大小、樹脂成分以及是否檢出鐵氧化物特征吸收峰綜合判斷激光打印機(jī)的類型:若墨粉紅外光譜基線的斜率偏高,且檢出有鐵氧化物吸收峰,則該樣品為黑白激光打印形成;若墨粉紅外光譜基線斜率較低,樹脂為聚苯乙烯/甲基丙烯酸甲酯,并且未檢出鐵氧化物特征吸收,則該樣品為彩色激光打印形成;若墨粉紅外光譜基線斜率較低,樹脂為聚對苯二甲酸/環(huán)氧樹脂,并且未檢出鐵氧化物特征吸收,則無法判斷該樣品為黑白還是彩色激光打印形成,比如S7、S8、S29三臺黑白激光打印機(jī)與S19、S20兩臺彩色激光打印機(jī)的墨粉紅外光譜較為相似,難以通過紅外光譜的直接比較分析實(shí)現(xiàn)其區(qū)分與識別,如圖1所示。
2.4.1 基線校正
理想情況下,待測樣品沒有吸收的光譜區(qū)域被視為整張光譜的基線,基線的透過率應(yīng)該是100%,即吸光度為0。但是在實(shí)際檢測中由于受樣品粒徑、壓片厚度、雜質(zhì)等光散射光吸收的影響,使光譜基線出現(xiàn)傾斜現(xiàn)象。為了比較分析墨粉的本質(zhì)差異,本文采用多項式曲線擬合法[11]對樣本的紅外光譜進(jìn)行基線校正(見圖3),校正后譜峰位置沒有發(fā)生變化,而傾斜程度獲得明顯改善,有利于后續(xù)數(shù)據(jù)分析與信息提取。
圖3 基線校正前后的墨粉紅外光譜圖
2.4.2 不同型號打印機(jī)原裝墨粉的PCA投影分析
在31個樣本中隨機(jī)選擇25個樣本作為訓(xùn)練集數(shù)據(jù),其余6個樣本作為測試集數(shù)據(jù)。采用自編軟件中的PCA方法對基線校正、標(biāo)準(zhǔn)正態(tài)變量變換(Standard Normal Variate Transform,SNV)后的訓(xùn)練集數(shù)據(jù)進(jìn)行主成分分析,提取前兩個主成分構(gòu)建標(biāo)準(zhǔn)投影空間(圖4A),不同樹脂成分的墨粉樣本聚類效果明顯,但是黑白與彩色激光打印墨粉未能獲得良好區(qū)分;當(dāng)選擇前三個主成分構(gòu)建標(biāo)準(zhǔn)投影空間時,發(fā)現(xiàn)不同樹脂成分墨粉獲得良好區(qū)分的同時,同種樹脂成分的黑白與彩色激光打印墨粉也獲得了良好區(qū)分,包括直接比較分析不能區(qū)分的S7、S8、S29黑白激光打印墨粉與S19、S20彩色激光打印墨粉(見圖4B)。
圖4 不同激光打印墨粉的得分投影圖
選擇載荷矩陣前三個主成分?jǐn)?shù)據(jù)分別對波數(shù)做圖(見圖5A,B,C)。第一主成分提取信息主要源于聚苯乙烯/甲基丙烯酸甲酯的光譜信息;第二主成分信息主要表現(xiàn)為聚對苯二甲酸/環(huán)氧樹脂的特征吸收;第三主成分主要為568cm-1處鐵氧化物的光譜信息,它是區(qū)分黑白與彩色激光打印墨粉的關(guān)鍵組分。前三個主成分總共解釋了63.3%的方差,剩余信息基本為噪聲信息(見圖5D)。
圖5 不同激光打印墨粉的載荷曲線圖
6個測試集樣本經(jīng)基線校正與SNV數(shù)據(jù)變換后投影到三維標(biāo)準(zhǔn)投影空間(見圖6),投影預(yù)報結(jié)果準(zhǔn)確,表明采用主成分投影預(yù)報方法能夠快速直觀區(qū)分黑白與彩色激光打印墨粉。
圖6 測試集墨粉樣本的投影預(yù)報
2.4.3 不同型號打印機(jī)原裝墨粉的HCA分析
主成分分析能夠直觀的反映墨粉樣本的整體分類關(guān)系,為了更進(jìn)一步研究各樣本間的距離關(guān)系,以主成分分析得分值為基礎(chǔ)采用系統(tǒng)聚類法構(gòu)建不同種類墨粉樣本間的聚類圖(見圖7)。所有現(xiàn)有樣本形成了三個大類:聚苯乙烯/甲基丙烯酸甲酯樹脂類黑白激光打印墨粉樣本為一類;聚苯乙烯/甲基丙烯酸甲酯樹脂類彩色激光打印墨粉為另一類;聚對苯二甲酸/環(huán)氧樹脂類黑白與彩色激光打印墨粉,由于紅外光譜較為相似,整體歸為一類,就局部而言兩者距離各自相近,形成 S19、S20(彩色激光打?。┡c S7、S8、S29(黑白激光打?。﹥蓚€子類,與主成分聚類效果分布一致。
圖7 不同激光打印機(jī)墨粉的系統(tǒng)聚類圖
本文采用紅外光譜法研究了31臺不同品牌、不同型號激光打印機(jī)原裝黑色墨粉間的光譜差異。根據(jù)墨粉紅外光譜圖的比較分析,實(shí)現(xiàn)了聚對苯二甲酸/環(huán)氧樹脂類墨粉與聚苯乙烯/甲基丙烯酸甲酯樹脂類墨粉的區(qū)分與識別;采用主成分分析結(jié)合系統(tǒng)聚類法完成了同種樹脂不同激光打印類型墨粉的聚類分析與建模預(yù)報,方法可行、結(jié)果準(zhǔn)確可靠。
參考文獻(xiàn):
[1]張志才,靜電復(fù)印技術(shù)與設(shè)備[M].北京:中國計量出版社,1999:26.
[2]Cantu,A.A.,Analytical Methods For Detecting Fraudulent Documents.Analytical Chemistry,1991,63(17):847A-854A.
[3]Egan,W.J.,et al.,F(xiàn)orensic discrimination of photocopy and printer toners II.Discriminant analysis applied to infrared reflection-absorption spectroscopy[J].Analytical&Bioanalytical Chemistry,2003,376(8):1279-1285.
[4]Almeida Assis,A.C.,et al.,Diamond cell Fourier transform infrared spectroscopy transmittance analysis of black toners on questioned documents[J].Forensic Science International,2012,214(1-3):59-66.
[5]梁逸曾.復(fù)雜體系儀器分析-白、灰、黑分析體系及其多變量解析方法[M].北京:化學(xué)工業(yè)出版社,2012:
[6]許祿,邵學(xué)廣.化學(xué)計量學(xué)方法[M].第2版.北京:科學(xué)出版社,2004.
[7]Billard,L.E.Diday.Principal Component Analysis,in Symbolic Data Analysis[J].John Wiley&Sons,Ltd.2007:145-187.
[8]Jackson,J.E.Singular Value Decomposition:Multidimensional Scaling I,in A User's Guide to Principal Components.John Wiley&Sons,Inc,2004:189-232.
[9]Murtagh,F(xiàn).,P.Contreras.Algorithms for hierarchical clustering:an overview[J].Wiley Interdisciplinary Reviews:Data Mining and Knowledge Discovery,2012,2(1):86-97.
[10]王英強(qiáng),馮計民,汪聰慧.傅立葉變換紅外光譜法檢驗(yàn)靜電復(fù)印墨粉[J].刑事技術(shù),2004,(4):3-7.
[11]馮昕韡,朱仲良,沈夢潔,等.基于多項式擬合的拉曼光譜基線漂移校正方法[J].計算機(jī)與應(yīng)用化學(xué),2009,(6):759-762.