姚曦煜,梁歡,陳凱,候華毅,陳相柏
(1.武漢工程大學 光電信息與能源工程學院,湖北 武漢 430205;2.武漢工程大學 興發(fā)礦業(yè)學院,湖北 武漢 430205)
磷礦是多種精細磷化工的物質基礎[1],也是我國重要的戰(zhàn)略資源。礦石中P2O5的含量決定磷礦品位[2],我國的磷礦大多為中低品位[3]。當前測定磷礦石品位的方法主要有常規(guī)化學分析法、紅外光譜法、核磁共振法、X射線、等離子體質譜法等[4]。但大部分方法不能對大量樣品進行快速檢測和滿足礦下檢測的需要。尋找一種快速有效的磷礦品位鑒別和分類方法,提高選礦效率,對我國工業(yè)和農業(yè)可持續(xù)發(fā)展具有重要意義。
拉曼光譜作為一種分子指紋分析技術可獲得樣品的物理化學信息,具有快速、準確、無損、無需對樣品進行復雜前處理等優(yōu)點,已廣泛應用于物理、化學、材料等領域[5-7]。
磷礦高品位樣品A(P2O531.25%)、B(P2O529.06%),中品位樣品C(P2O522.08%)和低品位樣品D(P2O53.29%)。實驗前對樣品進行過濾和壓片處理,并采用60目的篩網(wǎng)對磷礦粉末進行過濾,稱取250 mg采用壓片機進行壓片。
Nanobase XperRam200共聚焦顯微拉曼光譜系統(tǒng),激光器波長為532 nm,功率為100 mW,光譜掃描范圍為200~1 950 cm-1,掃描時間為30 s。
在保證測量面平整的前提下,對每面由內圈到外圈均勻選取50個點進行光譜檢測收集,每種樣品測得100個點的拉曼光譜,并使用硅片對所測光譜進行校準,共測得400組磷礦光譜。
1.3.1 基線校正 為降低拉曼光譜的背景噪聲干擾,對拉曼光譜進行平滑和基線校正處理。本研究選擇Savitzky-Golay(SG)卷積法對拉曼光譜進行多項式為2階的8點平滑處理。平滑后采用自適應迭代懲罰最小二乘法[8](airPLS)算法進行基線校正,與其他校正方法相比,airPLS 具有一定的優(yōu)勢,包括不需要預知干擾信息,其通過迭代改變擬合基線和原始信號之間的誤差平方和的權重,適應性地利用預先擬合的基線和原始信號間的差異,獲得基線估計量。Savitzky-Golay(SG)卷積法平滑采用Origin 2017進行,airPLS基線校正的程序采用MATLAB 2016b實現(xiàn)。
1.3.2 分類模型 對平滑和基線校正后的拉曼光譜數(shù)據(jù)進行PCA和HCA分析,建立判別模型。主成分分析(PCA)屬于無監(jiān)督模式,在保留原始主要信息變量的前提下,PCA將多指標的問題轉化為少數(shù)幾個綜合性指標的問題[9],降維不但能簡化模型,還可以有效剔除與所測化學成分不相關或相關性小變量,使模型更加準確和穩(wěn)定,并反映樣本的聚類情況。
系統(tǒng)聚類法(HCA)是以分類依據(jù)的條件作為指標或變量,根據(jù)待分析的樣品所表現(xiàn)的變量特征,按樣本之間的距離相似系數(shù)進行度量,距離近的相似度高的聚為一類,反之不聚為一類。最后把聚類結果形象系統(tǒng)地用樹狀圖表示出來。運用HCA的離差平方和法(ward’s linage rule)[10]根據(jù)分割距離歐式距離(m維空間兩點之間的真實距離)的平方把磷礦樣品分成不同數(shù)量的集群。
PCA和HCA分析使用SIMCA 14.1軟件進行。
3種預處理方式下的4種磷礦的拉曼光譜見圖1。
3.4 護士在靜脈輸液過程中職業(yè)防護的執(zhí)行現(xiàn)狀表2顯示,29名護士不會正確處理化療藥物藥液溢出;137名護士不會正確處理化療藥液濺到皮膚或眼內的情況;188名護士在進行高危操作時不戴手套;152名護士在被污染銳器刺破是不會向上級匯報;還有102名護士在操作中雙手回套針帽;72名護士不會正確使用銳器盒分離針頭,而89.5%護士在操作中遇到銳器盒針頭滿溢的情況。這些情況說明護士在化療藥物防護、預防針刺傷、職業(yè)暴露后的處理等操作環(huán)節(jié)上自我防護行為不足。
圖1 3種預處理方式下的4種磷礦的拉曼光譜圖Fig.1 Raman spectra of four kinds of phosphoriteunder three kinds of spectral pretreatmentsa.SG平滑+airPLS基線校正后;b.SG平滑+airPLS基線校正+一階導數(shù);c.SG平滑+airPLS基線校正+二階導數(shù)
圖1(b)和1(c)分別是在圖(a)中的5組光譜平均后的一階導數(shù)和二階導數(shù)兩種預處理后的光譜。從圖中看出,經過導數(shù)處理的光譜,部分特征峰消失,但4種磷礦樣品在960 cm-1左右仍然呈現(xiàn)一個較強峰。所以在磷礦的研究中,V1(PO4)對稱伸縮振動的拉曼信號往往用來區(qū)分不同種類或者品位的磷礦石[2]。除此之外,在圖(b)中,樣品A(P2O531.25%)的一階導數(shù)光譜中還存在無序碳的特征峰(1 333,1 572 cm-1),但在二階導數(shù)光譜中,該特征峰消失。樣品B(P2O529.06%)的白云石的特征峰在一階導數(shù)和二階導數(shù)光譜中都存在,是該樣品與其它3種樣品的重要區(qū)別之一。
4種不同品位磷礦之中,磷礦品位越高,含有其它雜質越少,光譜峰位更清晰。磷礦品位降低,所含雜質增加,光譜峰位、寬度和強度隨著雜質的比例不同也會發(fā)生改變,因此不同種類磷礦樣本僅從光譜上直接區(qū)分存在難度,而通過把拉曼光譜和化學計量學相結合,能夠尋找檢測變量之間的隱藏關系[14],達到對不同品位磷礦聚類的目的。
2.2.1 4種品位磷礦進行PCA分析 如圖1所示,由于存在一定背景噪聲和內部成分復雜的特點同一磷礦樣品的5個不同測量點之間光譜也存在差異,直接使用磷礦原始光譜數(shù)據(jù)矩陣建立PCA模型會影響聚類效果,因此,先將單種品位的磷礦樣品100組原始光譜數(shù)據(jù)中按照測量點位的順序,每5組光譜取平均,獲得平均光譜20組,用來表征該類樣品,4種品位磷礦共80組平均光譜構成新的樣本矩陣,并經過3種不同預處理方式消除背景噪聲,進行主成分分析,得到主成分得分圖,如圖2所示。前3個主成分的方差貢獻度見表1。
圖2 3種預處理方式后PCA分析得分圖Fig.2 PCA analysis score plot after three pretreatmentsa.SG平滑+airPLS基線校正PC1 VS PC2得分圖;b.SG平滑+airPLS基線校正+一階求導后PC1 VS PC2得分圖;c.SG平滑+airPLS基線校正+二階求導后PC1 VS PC2得分圖
2.2.1.1 SG平滑+airPLS基線校正 由表1和圖2(a)可知,經過SG平滑+airPLS基線校正,前3個主成分累計貢獻度達到83.8%,4種磷礦存在明顯分開的趨勢,且各自聚集,但聚集程度略有差異,樣品D(P2O53.29%)樣本點較為分散,其它3種樣品相對較好。另外,樣本之間也有一些交叉的情況,樣本A(P2O531.25%)和樣本B(P2O529.06%)部分交叉和重疊,分析原因,是由于二者品位值差異較小,光譜相近造成。除此之外,可以看到在第1主成分(PC1)上4種品位的磷礦樣品按照P2O5的濃度從低到高從左到右依次排列。
表1 不同預處理方式下PCA分析前3個主成分方差貢獻Table 1 The variance contribution of the first threePCs in PCA analysis principal component underdifferent pretreatment methods
2.2.1.2 SG平滑+airPLS基線校正+一階導數(shù) 由表1可知,使用去SG平滑+airPLS基線校正+一階導數(shù)后的光譜數(shù)據(jù)的PCA模型中,前三個主成分所反映的原始光譜信息由83.8%下降到42.6%,與圖1(b)現(xiàn)象一致,求導后存在部分信息丟失和缺損[15]。圖2(b)顯示,在SG平滑和airPLS基線校正的基礎上,經一階導數(shù)處理后,采用PC1和PC2兩個主成分時,4類磷礦樣品分布在各自的區(qū)域內,且不同磷礦樣品在分布的區(qū)域范圍內點的離散程度較小。與圖2(a)相同,在第1主成分(PC1)上,4種磷礦仍然是按照品位值的從低到高從左到右依次排列。
2.2.1.3 SG平滑+airPLS基線校正+二階導數(shù) 在SG平滑和airPLS基線校正的基礎上,二階導數(shù)后模型對光譜數(shù)據(jù)的解釋度相比一階導數(shù)損失更大,前3個主成分所保留的原始光譜信息僅為25.1%,信息損失了將近3/4。雖然分類效果較好,如圖2(c)所示,但此預處理方法不合適。
2.2.2 4種磷礦進行HCA分析 對光譜數(shù)據(jù)進行降維后,既能反映大部分原始光譜的信息,同時模型中各樣本點之間歐式距離的大小能夠反映每個樣本點的差異程度[16-17]。使用降維后的光譜數(shù)據(jù)能有效壓縮參加計算歐氏距離的變量數(shù)[18]。因此,通過對3種光譜預處理方法處理后的PCA模型取其主成分得分數(shù)據(jù)進行HCA分析嘗試后,我們發(fā)現(xiàn)對原始光譜進行SG平滑+airPLS基線校正+一階導數(shù)處理后,既能在降維后保留較多的原始信息同時又有較好的聚類效果,選取該模型中對原光譜信息累計解釋度為58.8%的前9個主成分的得分數(shù)據(jù)矩陣,選擇離差平方和法(Ward’s linage rule)進行相似度聚類生成樹狀圖,如圖3所示。其中編號1~20對應樣品A(P2O531.25%),20~40對應樣品B(P2O529.06%),40~60對應樣品C(P2O522.08%),60~80對應樣品D(P2O53.29%)。
表2 磷礦樣本系統(tǒng)聚類分組情況Table 2 Hierarchy clustering groups of phosphorite samples
由圖3和表2可知,80組磷礦樣品被分成 5組,除一個3.29%的樣品被單獨分到一類外,其余79組數(shù)據(jù)均以100%的準確度得到了分類。通過離差平方和法,使用磷礦SG平滑+airPLS基線校正+一階導數(shù)處理后PCA模型中前9個主成分得分矩陣建立的HCA樹狀圖,分類效果準確率達到了98.75%,成功實現(xiàn)了對4種磷礦的分類。
研究了3類品位磷礦樣品的拉曼光譜特性,并提出了一種將測得的4種磷礦樣品的光譜信息進行平滑和基線校正后,結合化學計量學磷礦進行快速鑒別和分類的新方法。結果表明,盡管同種磷礦樣本不同點位之間的光譜存在差異,但是在采用5點的平均原始光譜SG平滑+基線校正、原始光譜SG平滑+基線校正+一階導數(shù)兩種預處理的PCA模型中,既保持了較高的原始信息,各磷礦樣本點也有著較好的聚類效果,且品位信息在第1主成分上呈現(xiàn)規(guī)律分布。采用SG平滑+基線校正+一階導數(shù)光譜預處理方法后,進行主成分分析,得到的前9個主成分得分數(shù)據(jù)矩陣利用ward法進行HCA分析,在事先不知道樣品分組的情況下,成功將4種磷礦樣本分開,準確率為98.75%。拉曼光譜技術具有樣品前處理簡單,無損、快速及準確的鑒別,其結合化學計量學為磷礦品位鑒定和分類提供了一種新方法。使用便攜式拉曼光譜儀,具有現(xiàn)場快速檢測應用的前景。然而,由于磷礦種類繁多,且成礦機理和性質不同,在本次研究中的采集的樣本數(shù)量有限,后續(xù)將加大樣品采集數(shù)量建立數(shù)據(jù)庫,并采取其他更高級的分類算法,為磷礦品位鑒定和分類提供更多的信息。