殷賢華,劉 昱,賀 微,奉慕霖,石玉林
(1.桂林電子科技大學 電子工程與自動化學院,桂林 541004;2.廣西自動檢測技術與儀器重點實驗室,桂林 541004)
丁腈橡膠(nitrile butadiene rubber,NBR)、氯丁橡膠(chloroprene rubber,CR)、丁基橡膠(isobutylene isoprene rubber,IIR)和丁苯橡膠(styrene butadiene rubb-er,SBR)是4種使用比較廣泛的通用橡膠,主要用來制造各種輪胎和一般橡膠制品。2-硫醇基苯并噻唑(2-mercaptobenzothiazole,MBT)是橡膠工業(yè)中廣泛使用的硫化促進劑,常常作為其它硫化促進劑的母體原料[1];一硫化四甲基秋蘭姆(tetramethyl thiuram monosulfide,TMTM)可以降低硫化橡膠的拉伸強度,適用于工程車輛[2];4,4′-二硫代二嗎啉(4,4-dithiodimorpholine,DTDM)可以使硫化膠拉伸強度和耐疲勞性能平衡,同時耐熱、耐老化性能也比較好,適用于小轎車[3]。隨著橡膠工業(yè)的發(fā)展,對橡膠及其助劑的有效檢測具有重要的研究意義。目前主要的檢測方法有氣相色譜法、燃效實驗法和紅外光譜法等,由于這些方法耗時且準確性低,無法高效地實現(xiàn)橡膠材料的區(qū)分,尋找一種高效無損的檢測方法至關重要。
太赫茲(terahertz,THz)波作為一種頻率處于0.1THz~10THz之間的電磁輻射[4],其量子能量低、散射效應較弱,對環(huán)境輻射不敏感[5],基于太赫茲技術的時域光譜(terahertz time-domain spectroscopy,THz-TDS)系統(tǒng)逐漸應用在許多領域。橡膠及多數(shù)助劑屬于高分子化合物,在太赫茲波段的吸收和諧振很強,顯示出“指紋”特性[6],這使得基于太赫茲的橡膠及其助劑的檢測研究成為可能[7]。近年來,國內外學者針對橡膠及其助劑的太赫茲吸收特性展開了研究[8-10]。研究結果表明,部分橡膠及助劑在太赫茲波段展現(xiàn)出獨有的吸收特性,具有一定的研究意義。目前的研究中主要針對橡膠和添加劑在太赫茲頻段的吸收特性,卻很少使用具體的算法來對吸收峰接近或者重疊的橡膠或者助劑建立分類模型。所以,通過太赫茲檢測技術進行吸收峰相似的橡膠和助劑的精確分類識別具有重要意義。
支持向量機(support vector machines,SVM)作為經(jīng)典的分類算法,成功地應用在各種分類場景[11-13]。但是在SVM模型中,其懲罰參量C和徑向基核函數(shù)參量σREF對分類結果影響較大,如何優(yōu)化這兩個參量,關系到分類模型的優(yōu)劣[14]。粒子群算法(particle swarm optimization,PSO)作為一種群體智能尋優(yōu)算法,在工程計算中廣泛應用。部分學者將PSO應用在SVM的參量尋優(yōu),實現(xiàn)了相對較好的效果[15-16]。本文中針對PSO容易陷入局部最優(yōu)、搜索范圍窄的缺點,將隨機權重策略和異步學習因子同時引入到PSO算法中,提出改進的粒子群算法(majorization particle swarm optimization,MPSO)。針對物理特性相似、特征吸收峰相近的橡膠和硫化促進劑,將MPSO與SVM結合建立精確分類模型,提高橡膠和硫化促進劑的識別準確率。
實驗中以NBR,CR,IIR和SBR 4種常用的硫化橡膠,以及MBT,TMTM和DTDM 3種硫化促進劑為實驗對象。選用的4種硫化橡膠由國家橡膠及橡膠制品質量監(jiān)督中心(廣西)提供,為純度為94%以上的原生橡膠粉末經(jīng)過混煉、返煉、硫化3步制作而成,然后對橡膠質檢所提供的橡膠樣片裁剪成滿足實驗系統(tǒng)測試要求的實驗樣片;3種硫化促進劑購于東莞市百億塑料制品有限公司(純度均在96%以上),首先按照設計好的樣本配置比例進行稱量,然后將樣本在研缽中進行充分的研磨混合,最后利用壓片機在49000N的壓力下壓制成片。每個樣片厚度 1mm 左右,直徑 12mm 左右,重量約180mg。每種樣片制作了36個實驗樣品,其中4種硫化橡膠共144個實驗樣品,3種硫化促進劑共108個實驗樣品。為減少空氣水分對實驗樣品的影響,樣本壓制前后,分別將原材料和壓制好的樣片放入YB-1A真空恒溫干燥箱中在50℃下干燥2h左右。實驗樣品具體信息見表1所示。
Table 1 Types and quantities of experimental sample set 1 and set 2
實驗設備主要由飛秒激光器(德國TOPTICA公司生產(chǎn))和太赫茲時域光譜系統(tǒng)(美國Zomega公司生產(chǎn))組成。其中飛秒激光器進光功率約為120mW,脈沖持續(xù)時間為100fs,中心波長為780nm,重復頻率為80MHz。實驗時,將室內溫度控制在25℃左右,為減少空氣濕度對實驗的影響,將THz-TDS實驗箱中充入干燥空氣,使箱內空氣濕度降到1%以內,具體的設備原理圖見參考文獻[17]。
THz-TDS檢測的主要目標是獲得表征材料特征的宏觀光學常數(shù),一般包括復折射率、電導率和吸收系數(shù)等。利用透射式THz-TDS在獲得參考信號Eref(T)和樣品信號Esam(T)后,經(jīng)過傅里葉變換得到對應的頻域信號Eref(ω)和Esam(ω),其中,T表示時間,ω為太赫茲波振動的角頻率。吸光度表示太赫茲波被材料吸收的程度,其為無量綱的相對量。使用吸光度來描述樣品的吸收特性,可以減少樣本厚度不均勻對光譜分析產(chǎn)生的影響。吸光度A(ω)的計算公式如下所示[18]:
(1)
粒子群算法[19]作為一種群智能優(yōu)化算法,因其優(yōu)良的尋優(yōu)特性,被應用在各種工程實踐中。PSO的數(shù)學原理為[20]:假設存在一個n維搜索空間,由m個粒子組成的種群X={x1,x2,…,xm},其中第i個粒子的位置xi和速度vi表示為:
(2)
假設第i個粒子搜索到的最優(yōu)位置為pi=(pi1,pi2,…,pin)T,種群的全局最優(yōu)位置為pg=(pg1,pg2,…,pgn)T,那么第d維的粒子xi的速率和位置更新公式如下所示:
vid(t+1)=wvid(t)+c1r1(pid(t)-xid(t))+
c2r2(pgd(t)-xid(t))
(3)
xid(t+1)=xid(t)+xid(t+1)
(4)
式中,d=1,2,…,n,表示粒子維數(shù);i=1,2,…,m,表示第i個粒子;t表示當前迭代次數(shù),t+1表示下一代迭代數(shù);w表示慣性權重,c1和c2表示學習因子;r1和r2表示[0,1]上服從均勻分布的偽隨機數(shù)。
面對PSO算法容易出現(xiàn)陷入局部極值或者過早停止收斂的現(xiàn)象,將隨機權重策略和異步學習因子加入到PSO算法中。隨機權重策略的引入有兩個優(yōu)點:首先,如果在進化初期接近最好點,隨機權重策略可能產(chǎn)生相對較小的w值,加快算法的收斂速度。另外,w的隨機生成可以有效避免迭代初期最優(yōu)值的錯失,提高尋優(yōu)的準確率。w的描述如下式所示:
(5)
式中,N(0,1)表示標準正太分布的隨機數(shù),r(0,1)表示0~1之間的隨機數(shù),μ表示均值,μmin和μmax分別表示均值μ可以取到的最小值和最大值,σ表示均方差。
面對PSO算法固定學習因子帶來的收斂速度慢、尋優(yōu)范圍窄的權限,將隨著迭代而變化的學習因子(異步學習因子)引入到PSO中可以增強了迭代初始階段的全局搜索能力,有利于收斂到全局最優(yōu)。異步學習因子的變化公式為:
(6)
(7)
式中,c1,begin和c2,begin表示學習因子初值,c1,end和c2,end表示學習因子終值,tmax表示最大迭代次數(shù)。
通過MPSO與SVM的結合,提出改進的粒子群優(yōu)化支持向量機(MPSO-SVM)分類模型。以分類準確率作為適應度函數(shù)對SVM的懲罰參量C和徑向基核函數(shù)參量σREF進行迭代尋優(yōu),從而提高SVM模型的分類正確率。MPSO-SVM的基本流程如圖1所示。
Fig.1 Basic process of MPSO-SVM
迭代開始前對基本參量進行初始化:學習因子初值設置為2.5,學習因子終值設置為0.5,均值μmax取為0.8,均值μmin取為0.5,方差σ取為0.2,tmax取為100,種群數(shù)量設置為20,懲罰因子C和核函數(shù)參量σREF的初值范圍設置為[10-2,102];
混淆矩陣作為一種機器學習中經(jīng)典的可視化指標,可以較直觀地衡量一個分類器分類的準確程度。混淆矩陣行對應的類別表示樣本的真實類別,每一行的實驗樣本總數(shù)為該行對應的類別的真實樣本數(shù);各列類別為預測類別,每一列的實驗樣本總數(shù)為預測為該類的樣本總數(shù)[21]。其中,基于混淆矩陣的查全率(recall ratio)R和查準率(precision ratio)P是兩個比較常用的指標,其計算公式如下所示:
(8)
(9)
式中,查全率Rh表示被模型正確預測為第h類的實驗樣本數(shù)與第h類實驗樣本真實數(shù)量之比,衡量分類模型識別相關種類能力的尺度;查準率Ph表示被模型正確預測為第h類的實驗樣本數(shù)與被模型預測為第h類的實驗樣本總數(shù)之比,表示模型識別某個種類的精確度;Nhh,Nhj,Njh分別表示混淆矩陣中第h行第h列、第h行第j列、第j行第h列所對應的數(shù)值。
本研究中利用太赫茲時域光譜系統(tǒng)分別對NBR,CR,IIR和SBR 4種硫化橡膠,以及MBT,DTDM和TMTM 3種硫化促進劑進行多次測量取平均后,分別得到7種物質的純凈物吸光度圖譜,如圖2a和圖2b所示。
Fig.2 Absorbance spectrum of different substancesa—four kinds of vulcanized rubber b—three kinds of vulcanization accelerators
由于不同物質分子振動模式的不同,各物質在太赫茲頻段顯示出特有的“指紋”特性,使得不同物質在不同頻率點具有特定的吸收峰。從圖2a可以看出,在0.3THz~1.6THz頻段內,4種硫化橡膠具有各自獨特的特征吸收峰:丁腈橡膠(NBR)在0.92THz,1.22THz和1.39THz處有3個的特征吸收峰;氯丁橡膠(CR)在1.24THz和1.39THz處具有兩個明顯的特征吸收峰;丁基橡膠(IIR)在1.08THz和1.48THz處存在兩個特征吸收峰;丁苯橡膠(SBR)在1.09THz和1.52THz處有明顯特征吸收峰。從圖2b可以看出,3種硫化促進劑的特征吸收峰較明顯,DTDM在1.51THz處有明顯的特征吸收峰,MBT在0.92THz和1.40THz處存在特征吸收峰,TMTM在1.48THz處存在一個明顯的特征吸收峰。
可以看出,4種硫化橡膠的特征吸收峰位置較接近,如果受噪聲或者誤差的影響,吸收峰存在偏移而發(fā)生重疊,則很難對4種橡膠做出準確判斷;3種硫化促進劑中,MBT的吸收峰較獨特,可以明顯區(qū)分,但是DTDM和TMTM的吸收峰位置接近,難以直觀地準確區(qū)分。所以針對4種硫化橡膠和3種硫化促進劑,需要借用一定的分類算法來進行建模區(qū)分。
為了更加準確地對4種硫化橡膠和3種硫化促進劑進行分類,采用MPSO-SVM來進行精確分類識別。如表1所示,4種硫化橡膠144個樣本數(shù)據(jù)中,96個樣本數(shù)據(jù)進行模型訓練,48個樣本數(shù)據(jù)進行測試;3種硫化促進劑108個樣本數(shù)據(jù)中,72個樣本數(shù)據(jù)進行模型訓練,48個樣本數(shù)據(jù)進行測試。針對以上數(shù)據(jù)集,利用SVM、PSO-SVM和MPSO-SVM 3種模型進行分類識別。首先,以分類正確率作為適應度,通過算法對支持向量機的參量進行尋優(yōu),結果如表2所示。
Table 2 Selection results of SVM model parameters based on three algorithm
基于表2中的參量,3種模型分類結果的混淆矩陣如圖3和圖4所示。
Fig.3 Confusion matrix of classification results for four kinds of vulcanized rubbera—classification results of SVM b—classification results of PSO-SVM c—classification results of MPSO-SVM
Fig.4 Confusion matrix of classification results of three kinds of vulcanization acceleratorsa—classification results of SVM b—classification results of PSO-SVM c—classification results of MPSO-SVM
圖3是3種算法針對4類硫化橡膠分類得到的混淆矩陣。圖中,1,2,3,4依次對應NBR,CR,IIR和SBR 4種硫化橡膠。從圖3a中可以看出,SVM算法的誤判集中在第1類橡膠和第4類橡膠上,其中7個第1類橡膠被錯分到第2類,1個第1類橡膠被誤判為第3類橡膠,以及3個第4類橡膠被誤判為第3類橡膠;從圖3b中可以看出,PSO-SVM算法的分類結果較好,誤判主要集中在第1類上,將8個第1類橡膠分到了第2類和1個第1類橡膠分到了第4類,將1個第3類錯分為第4類;從圖3c中可以看出,誤判率主要集中在第1類上,將8個第1類分到了第2類和1個第1類分到了第4類。整體而言,誤判率主要集中在第1類橡膠上,主要原因是第1類橡膠和第2類橡膠的特征吸收峰位置很接近,其中1.39THz處的吸收峰發(fā)生重疊是主要影響誤判的原因。
圖4是3種算法針對3類硫化促進劑分類得到的混淆矩陣。圖中,1,2,3依次對應DTDM,MBT和TMTM3種硫化促進劑。從圖4中可以看出,相較于4類硫化橡膠,3類硫化促進劑的分類結果更好。從圖4a中可以看出,SVM算法的誤判主要集中在第1類和第3類,其中1個第1類和1個第3類互相誤判;從圖4b中可以看出,PSO-SVM的分類結果比較好,僅將1個第3類誤判為第2類;從圖4c中可以看出,MPSO-SVM的誤判率為零,3類硫化促進劑可以全部正確分類,效果最好。
進一步定量評判分類結果,由混淆矩陣計算出set 1和set 2數(shù)據(jù)集分類結果的查全率和查準率,如表3所示。從表中可以看出,針對set 1數(shù)據(jù)集,MPSO-SVM識別CR,IIR和SBR的查全率均為100%,在NBR橡膠的查全率僅為25%,低于SVM;對于查準率,MPSO-SVM針對NBR和SBR可以精確分類,在CR的分類精準度上略低于SVM。針對set 2數(shù)據(jù)集,MPSO-SVM的查全率和查準率均為100%,效果最佳。
Table 3 The recall and precision of the classification results for the three algorithms
保持set 1和set 2訓練集和測試集的樣本不變,將SVM,PSO-SVM和MPSO-SVM 3種方法分別運行20次,得到訓練集和測試集的平均準確率如表4所示。從表中可以看出,3種方法針對兩個不同的數(shù)據(jù)集的結果中,MPSO-SVM算法的綜合正確率更高;本文中的算法在Intel(R) Core(TM) i5-4210U CPU 1.70GHz、內存為4GB的電腦配置環(huán)境下運行,相比PSO-SVM算法,該算法的分類識別時間更短,效率更高。
Table 4 Comprehensive evaluation of three algorithms after running 20 times
本研究中以4類常見的硫化橡膠和3類常用橡膠硫化促進劑為實驗對象,通過改進的粒子群算法與支持向量回歸機相結合,建立分類識別模型。研究結果表明,粒子群算法與隨機權重策略和異步學習因子的結合可以較好地對支持向量機的懲罰參量和核函數(shù)參量進行尋優(yōu),從而有效提高分類模型的識別準確率,相比于SVM和PSO-SVM算法,MPSO-SVM算法的識別準確率更高,為基于太赫茲時域光譜技術的物質檢測分析提供了新的參考方法,具有重要的參考價值。