劉克新,姜紅,段斌,劉峰
基于多元分析的食用油油桶差分拉曼光譜的分類研究
劉克新1,姜紅1,段斌2,劉峰2
(1.中國人民公安大學(xué),北京 100038;2.南京簡智儀器設(shè)備有限公司,南京 210049)
對縱火類案件現(xiàn)場所遺留食用油油桶物證進行快速無損檢驗及區(qū)分,為公安機關(guān)偵查破案提供線索。采用最新的差分拉曼光譜技術(shù)對26個食用油油桶及桶蓋,共計52個樣品進行檢驗。首先,通過傳統(tǒng)譜圖分析對2類樣品進行初步分類,同時,結(jié)合多元分析,對桶蓋進行分層聚類,對桶身再利用Gap statistic算法確定值的基礎(chǔ)上K-means聚類分析。成功將桶蓋分為了3類,桶身分為3類,且對桶蓋和桶身所得分類結(jié)果都與已知樣品所屬類別一致。此方法可對食用油油桶進行快速無損檢驗及區(qū)分,為現(xiàn)場遺留有食用油油桶的縱火案件偵破提供一定的幫助。
差分拉曼光譜;食用油;油桶;聚類分析;Gap statistic
當(dāng)今社會,塑料制品已廣泛地應(yīng)用于人們社會生活的方方面面。利用塑料制品進行犯罪或者輔助犯罪的案件也逐漸增多[1]。食用油桶由于其易獲得性以及廉價性,常被不法分子當(dāng)作容器以攜帶各種助燃劑。由于各種因素的影響,塑料油桶常常被犯罪分子或丟棄或遺棄在現(xiàn)場,因此偵查人員在進行現(xiàn)場勘查時常常能夠提取到此類重要物證。通過對塑料油桶的檢驗鑒定,可以確定油桶底品牌、型號,以縮小偵查范圍,為偵查破案提供線索。食用油油桶分為桶身和桶蓋2部分,由于犯罪分子的警惕性,桶身極有可能被犯罪分子帶走,因此文中在對桶身檢測的同時,對桶蓋也進行了檢驗。桶身的主要材料是聚對苯二甲酸乙二醇酯(PET),桶蓋的主要材料是聚乙烯(PE)[2]。常見的塑料物證檢測方法主要有紅外光譜法[3]、X射線熒光光譜法[4]、裂解氣相色譜-質(zhì)譜法[5]等。相對于上述方法,拉曼光譜具有無損、快速、簡單和無需樣品準備等優(yōu)點[6-9],但其本身信號弱,抗干擾能力差,且對于熒光性強的物質(zhì)檢測能力較差。差分拉曼光譜在繼承拉曼光譜優(yōu)點的同時,很好地克服了上述缺點,是一種優(yōu)良的現(xiàn)場快速檢測方法[10-13]。
文中通過對26個不同品牌、型號的食用油油桶桶身和桶蓋進行差分拉曼光譜檢測,獲得52組光譜數(shù)據(jù),先根據(jù)譜圖特征峰對樣本進行初步分類,但此過程費時費力,為減少人工,實現(xiàn)分類的自動化,快速準確地確定油桶所屬品牌和型號,文中利用多元分析的方法,通過SPSS、Origin、Matlab軟件,對2組數(shù)據(jù)分別進行分層聚類和K-means聚類。
生活中收集的26種不同種類的食用油油桶桶身及桶蓋,見表1。
主要儀器:SSR—5000型便攜式差分拉曼光譜儀(南京簡智儀器設(shè)備有限公司)。
參數(shù)設(shè)置:選用2種激發(fā)波長,分別為784 nm和785 nm;激光功率為440 mW,積分時間為10 s;連續(xù)監(jiān)測5次,連續(xù)監(jiān)測時間間隔為2 s。
對收集到的食用油油桶桶身與桶蓋分別用無水乙醇進行擦拭,風(fēng)干。
隨機選取1#桶蓋和13#桶身,分別在相同條件下,對同一部位,利用差分拉曼光譜儀進行5次重復(fù)性實驗。
表1 食用油油桶樣品表
Tab.1 Samples of edible oil barrel
根據(jù)相同條件下對1#桶蓋和13#桶身的5次重復(fù)性實驗,分別可以得出2種樣品的差分拉曼光譜圖。由圖1和圖2可以看出,2種樣品5次實驗所得譜圖峰數(shù)、峰位相同,峰形基本一致,表明差分拉曼光譜儀檢驗食用油油桶和桶蓋重復(fù)性良好,可使用其進行檢測。
圖1 1#桶蓋的差分拉曼光譜圖
圖2 13#桶身的差分拉曼光譜圖
通過對26個樣品桶蓋與油桶差分拉曼譜圖的對比分析,發(fā)現(xiàn)桶蓋其主要成分都是聚乙烯(PE),桶身主要成分都是聚對苯二甲酸乙二醇酯(PET)。
2.2.1 桶蓋差分拉曼光譜分析
以15#桶蓋為例,其最強峰出現(xiàn)在1433、1288、1121、1053 cm?1附近(見圖3)。其中1433 cm?1處振動峰由碳原子與氫原子間非對稱彎曲振動引起,1288 cm?1處振動峰由碳與氫原子間搖擺振動引起,1121 cm?1處振動峰由碳原子間對稱伸縮振動引起,1053 cm?1處振動峰由碳原子間的非對稱伸縮振動引起。
2.2.2 桶身差分拉曼光譜分析
以9#油桶為例,發(fā)現(xiàn)其最強峰出現(xiàn)在1720、1608、1087、849、624 cm?1附近(見圖4)。其中1716 cm?1處振動峰由苯環(huán)內(nèi)碳原子間非對稱伸縮振動引起,1602 cm?1處振動峰由羧基內(nèi)碳氧原子間伸縮振動引起,1091 cm?1處振動峰由苯環(huán)與羧基間相連的3個碳原子間伸縮振動引起,858 cm?1處振動峰由苯環(huán)與2個羧基間相連的碳原子間伸縮振動引起,633 cm?1處振動峰由苯環(huán)內(nèi)碳原子間對稱彎曲振動引起。
圖3 15#桶蓋的差分拉曼光譜圖
圖4 9#桶身的差分拉曼光譜圖
2類樣品的譜圖中除了具有各自主要成分聚丙烯與聚對苯二甲酸乙二醇酯的特征峰之外,還有其他振動峰,這說明樣品中除其主成分外還存在其他物質(zhì)。這些物質(zhì)是塑料在生產(chǎn)過程中為改善其性質(zhì)或降低其成本而加入的增塑劑、著色劑、填料、熱穩(wěn)定劑 等[7]。根據(jù)桶蓋譜圖中是否存在1410 cm?1振動峰,可以將油桶分為2類,同時24#樣品既在1410 cm?1處沒有振動峰,且1410 cm?1振動峰與1161 cm?1振動峰強度之比明顯遠大于其他樣品,需單獨歸為一類,因此根據(jù)桶蓋的明顯譜圖特征可以將油桶分為3類,見表2。根據(jù)桶身是否在1280 cm?1處存在振動峰,可以將樣品分為2類,見表3。
通過譜圖以及數(shù)據(jù)分析,從桶蓋光譜信息中提取出7組具有代表性的振動峰峰值數(shù)據(jù),從油桶光譜信息中提取出11組具有代表性的振動峰峰值數(shù)據(jù)。為消除實驗過程中因人為操作所引起的不同樣品譜圖總體強度之間的差異,對桶蓋單個樣品內(nèi)部7組數(shù)據(jù),兩兩之間求比值,得到21組數(shù)據(jù)。對所提取的油桶數(shù)據(jù)利用origin 2019b采用除以最大值的方法歸一化到區(qū)間[0,1]。
表2 桶蓋的分類
Tab.2 Classification of bungs
表3 桶身的分類
Tab.3 Classification of barrels
對經(jīng)過數(shù)據(jù)處理后的26個樣品的桶蓋數(shù)據(jù)利用SPSS 26進行分層聚類。采用組間質(zhì)心聚類度量類間距離,選擇平方歐氏距離作為計算樣品間距離。聚類結(jié)果見圖5,當(dāng)測度距離為1時,樣本可以分為3類,第1類包括口福牌食用油(1#、2#、3#、4#、26#)、長壽花食用油(9#、10#、11#)、龍大食用油(產(chǎn)地山東煙臺13#)、胡姬花食用油(14#、15#)、金龍魚食用油(16#、17#)、福臨門花生油及古法花生油(20#、21#)、天下五谷食用油(22#)、海皇牌食用油(25#、26#);第2類包括魯花食用油(5#、6#、7#、8#)、龍大花生油(產(chǎn)地山東聊城)(12#)、福臨門大豆油(18#、19#)、香滿園食用油(23#,);第3類為西王牌食用油(24#)。
圖5 樣品聚類譜系圖
對經(jīng)過標準化處理的油桶數(shù)據(jù),利用K-means算法進行聚類。K-means算法的關(guān)鍵點在于值的確定[14]。在K-mean算法確定值的問題里,可以使用手肘法,也可以用Gap statistic 算法。肘部法則無法自動化地選出最佳的值,且有時并不是那么清晰,因此斯坦福大學(xué)的Robert等教授提出了Gap Statistic方法[15]。
Gap Statistic的定義:
基本思路:引入?yún)⒖嫉臏y值,這個參考值可以由Monte Carlo采樣的方法獲得。
式中:為sampling的次數(shù)。為了修正MC帶來的誤差,通過計算標準差S來矯正Gap Statistic。
設(shè)置參考數(shù)據(jù)集為1000,最大聚類數(shù)Max為10,利用Matlab實現(xiàn)代碼運行,確定值。由圖6可以看出,當(dāng)值選擇3時Gap值最大,為最佳值。利用K-means聚類分析,設(shè)置值為3,得到聚類結(jié)果見表4。K-means算法所得樣品分類結(jié)果與表3所得初步分類結(jié)果存在極大的趨同性。表4(K-means所得分類結(jié)果)中的Ⅲ類與表3(初步分類結(jié)果)中Ⅱ類完全相同,表4中的Ⅰ、Ⅱ類是對表3中Ⅰ類進一步細分,且符合已知樣品類別。
圖6 Gap(k)曲線
表4 桶身的分類
Tab.4 Classification of barrels
文中利用差分拉曼光譜技術(shù),對所收集的26個食用油油桶及桶蓋,共計52個樣本分別進行快速無損檢驗,通過譜圖分析對比,將桶蓋初步分為3類,將桶身初步分為2類。結(jié)合多元統(tǒng)計學(xué)的方法,對譜圖信息進行特征提取,利用分層聚類分析對桶蓋進行分類,通過Gap statistic算法確定值,對桶身利用K-means算法進行聚類,兩者分類結(jié)果均符合已知樣品已知類別。能夠?qū)Σ煌放婆c型號的食用油油桶進行準確區(qū)分。
差分拉曼光譜結(jié)合多元分析的方法快速無損,可為現(xiàn)場留有食用油油桶的實際案件中的公安偵查工作確定食用油油桶所屬品牌和型號提供一定的參考,提供偵查線索,縮小偵查范圍。筆者將進一步收集更多樣品,嘗試多種其他方法,以期對食用油油桶進行更加科學(xué)簡便分類。
[1] 姜紅, 朱曉晗, 何歆沂, 等. 差分拉曼光譜法對塑料瓶的鑒別分析[J]. 中國測試, 2020, 46(8): 76-79.
JIANG Hong, ZHU Xiao-han, HE Xin-yi, et al. Differential Raman Analysis of Plastic Bottles[J]. China Measurement & Testing Technology, 2020, 46(8): 76-79.
[2] 董鹍, 饒之帆, 楊曉云, 等. 幾種塑料的拉曼光譜檢測[J]. 塑料工業(yè), 2011, 39(6): 67-70.
DONG Kun, RAO Zhi-fan, YANG Xiao-yun, et al. Determination of Several Plastic by Raman Spectroscopy[J]. China Plastics Industry, 2011, 39(6): 67-70.
[3] ANDRADY A L. The Plastic in Microplastics: A Review[J]. Marine Pollution Bulletin, 2017, 119(1): 12-22.
[4] HENDRICKSON E, MINOR E C, SCHREINER K. Microplastic Abundance and Composition in Western Lake Superior as Determined via Microscopy, Pyr-GC/MS, and FTIR[J]. Environmental Science & Technology, 2018, 52(4): 1787-1796.
[5] MAI Lei, BAO Lian-jun, SHI Lei, et al. A Review of Methods for Measuring Microplastics in Aquatic Environments[J]. Environmental Science and Pollution Research, 2018, 25(12): 11319-11332.
[6] TURNER A. Cadmium Pigments in Consumer Products and Their Health Risks[J]. The Science of the Total Environment, 2019, 657: 1409-1418.
[7] 林福華. 拉曼光譜技術(shù)在聚合物分析中的應(yīng)用[J]. 塑料工業(yè), 2018, 46(6): 132-135.
LIN Fu-hua. Application of Raman Spectroscopy in Polymer Analysis[J]. China Plastics Industry, 2018, 46(6): 132-135.
[8] ZHAO Ying, LIN Jun-feng, LIU Jia, et al. Study on the Method of Identifying Waste Plastic Materials Based on Raman Spectroscopy[J]. Spectroscopy and Spectral Analysis, 2021, 41(1): 122-126.
[9] SHCHEBLANOV N S, MANTISI B, UMARI P, et al. Detailed Analysis Of Plastic Shear in the Raman Spectra of SiO2Glass[J]. Journal of Non-Crystalline Sobung, 2015, 428: 6-19.
[10] 張進, 姜紅, 劉峰, 等. 基于差分拉曼光譜的煙盒外包裝薄膜檢驗研究[J/OL].中國測試: 1-9 [2021- 03-23]. .http://kns.cnki.net/kcms/detail/51.1714.TB.20200827.1023.002.html.
ZHANG Jin, JIANG Hong, LIU Feng, et al. Study on Inspection of Cigarette Packaging Film Based on Differential Raman Spectroscopy[J/OL]. China Test: 1-9[2021-03-23]. http://kns.cnki.net/kcms/detail/51. 1714.TB.20200827.1023.002.html.
[11] 張進, 姜紅, 段斌, 等. 差分拉曼光譜結(jié)合化學(xué)計量學(xué)對口紅的檢驗研究[J/OL]. 激光與光電子學(xué)進展: 1-13[2021-03-23].http://kns.cnki.net/kcms/detail/31. 1690.TN.20210107.1716.006.html.
ZHANG Jin, JIANG Hong, DUAN Bin, et al. Differential Raman Spectroscopy Combined with Stoichiometry for the Detection of Mouth Red[J/OL]. Laser and Optoelectronics Progress: 1-13[2021-03-23]. http://kns.cnki.net/kcms/detail/31.1690.TN.20210107.1716.006.html.
[12] SHAMEEM K M M, CHOUDHARI K S, BANKAPUR A, et al. A Hybrid LIBS-Raman System Combined with Chemometrics: An Efficient Tool for Plastic Identification and Sorting[J]. Analytical and Bioanalytical Chemistry, 2017, 409(13): 3299-3308.
[13] KLISI?SKA-KOPACZ A, ?YD?BA-KOPCZY?SKA B, CZARNECKA M, et al. Raman Spectroscopy as a Powerful Technique for the Identification of Polymers Used in Cast Sculptures from Museum Collections[J]. Journal of Raman Spectroscopy, 2019, 50(2): 213-221.
[14] LANKERS M. Applications in: Environmental Analytics (Fine Particles)[J]. Physical Sciences Reviews, 2019, 4(6): 16-22.
[15] 諸葛越. 百面機器學(xué)習(xí)[M]. 北京: 人民郵電出版社, 2018: 113-115.
ZHUGE Yue. Heterogeneous Machine Learning[M]. Beijing: People's Posts and Telecommunications Press, 2018: 113-115.
[16] 王俊豐. 基于深度學(xué)習(xí)的多說話人語音分離技術(shù)研究與實現(xiàn)[D]. 北京: 中國電子科技集團公司電子科學(xué)研究院, 2020: 46-47.
WANG Jun-feng. Research and Implementation of Multi-Speaker Speech Separation Technology Based on Deep Learning[D]. Beijing: Electronic Science Research Institute of China Electronics Science and Technology Group Corporation, 2020: 46-47.
Classification of Differential Raman Spectra of Edible Oil Barrel Based on Multivariate Analysis
LIU Ke-xin1, JIANG Hong1, DUAN Bin2, LIU Feng2
(1.People's Public Security University of China, Beijing 100038, China; 2.Nanjing Jianzhi Instrument and Equipment Co., Ltd., Nanjing 210049, China)
The work aims to conduct rapid non-destructive inspection and differentiation of the physical evidence of edible oil barrels left on the scene of arson cases, and provide clues for the public security organs to investigate and solve the case. A total of 52 samples of 26 pairs of edible oil barrels and bungs were tested by the latest differential Raman spectroscopy technology. Firstly, the two types of samples were preliminarily classified through traditional spectral analysis. At the same time, combined with multivariate analysis, hierarchical clustering was performed to the bungs and K-means cluster analysis was carried out to the barrels based on the Gap statistic algorithm to determine thevalue. The bungs and barrels were successfully divided into 3 categories, respectively. The classification results were consistent with the category of the known samples. Through this method, the rapid non-destructive inspection and differentiation of edible oil barrels can be performed, which provides certain help for the detection of arson cases where edible oil barrels are left on the scene.
differential Raman spectroscopy; edible oil barrel; cluster analysis; Gap statistic
TB489
A
1001-3563(2022)03-0129-06
10.19554/j.cnki.1001-3563.2022.03.016
2021-08-23
中國人民公安大學(xué)2021年度基科費重點項目(2021JKF212);南京簡智儀器設(shè)備有限公司技術(shù)合作項目(20191218)
劉克新(1998—),男,中國人民公安大學(xué)碩士生,主攻微量物證及理化檢驗。
姜紅(1963—),女,中國人民公安大學(xué)教授,主要研究方向為微量物證分析。