張 瑩,褚 娜
(1.武漢理工大學(xué) 物流工程學(xué)院,湖北 武漢 430063;2.港口物流技術(shù)與裝備教育部工程研究中心,湖北 武漢 430063)
在生產(chǎn)過程的質(zhì)量管控中,控制圖作為統(tǒng)計(jì)過程控制(SPC)的一種基本工具常被用來監(jiān)控過程中的異常波動(dòng)。傳統(tǒng)控制圖是通過圖上的樣本點(diǎn)數(shù)據(jù)是否超過上下控制限來判斷過程是否異常,無法判斷生產(chǎn)過程異常的原因,近來控制圖模式識(shí)別的研究在質(zhì)量管控中得到了很多學(xué)者的關(guān)注,它是通過識(shí)別異常數(shù)據(jù)自身的規(guī)律,進(jìn)而根據(jù)專家知識(shí)庫找到對(duì)應(yīng)異常數(shù)據(jù)模式產(chǎn)生的原因,并尋找相應(yīng)的糾正措施。例如港口的配煤,主要是由多品種的煤炭按照一定比例混合。將控制圖模式識(shí)別運(yùn)用于港口的配煤中,當(dāng)發(fā)生異常時(shí)識(shí)別出異常原因,提醒操作人員及時(shí)調(diào)整異常工序,能夠有效的降低生產(chǎn)成本,促進(jìn)港口經(jīng)濟(jì)發(fā)展和環(huán)境效益提升。
關(guān)于控制圖模式識(shí)別的研究,一般先利用小波變換對(duì)數(shù)據(jù)進(jìn)行特征提取。然后選擇合適的識(shí)別分類器進(jìn)行控制圖模式識(shí)別。在識(shí)別分類器的選擇中,機(jī)器學(xué)習(xí)的方法被廣泛應(yīng)用于控制圖模式識(shí)別中。Addeh,等提出蜜蜂算法對(duì)高數(shù)目徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)進(jìn)行參數(shù)尋優(yōu),提高了泛化能力和網(wǎng)絡(luò)識(shí)別精度。Zan,等提出一維卷積神經(jīng)網(wǎng)絡(luò),該模型的識(shí)別精度、收斂速度和迭代時(shí)間明顯優(yōu)于傳統(tǒng)的多層感知器模型。劉貝貝,等指出了概率神經(jīng)網(wǎng)絡(luò)的控制圖模式識(shí)別性能主要取決于對(duì)平滑因子的設(shè)定,利用粒子群算法對(duì)平滑系數(shù)進(jìn)行尋優(yōu)。而神經(jīng)網(wǎng)絡(luò)對(duì)于小樣本數(shù)據(jù)沒有較好的泛化性,網(wǎng)絡(luò)結(jié)構(gòu)也相對(duì)復(fù)雜,易于過擬合。Cuentas,等提出由于支持向量機(jī)具有優(yōu)異的泛化性能,在統(tǒng)計(jì)過程控制應(yīng)用中取得了顯著的效果。宋李俊,等提出了融合特征提取和支持向量機(jī)控制圖異常模式識(shí)別方法,實(shí)驗(yàn)表明對(duì)于小樣本也有較好的識(shí)別性能。Zhou,等提出了混合核函數(shù)的模糊支持向量機(jī)的方法,對(duì)比概率神經(jīng)網(wǎng)絡(luò)和多層感知網(wǎng)絡(luò)等具有良好的性能。他們將該模型運(yùn)用到連桿部件的生產(chǎn)中,表明該方法在實(shí)際應(yīng)用中具有較好的效果。蔣兆,等提出了一種基于遺傳算法對(duì)多核函數(shù)最小二乘支持向量機(jī)中參數(shù)進(jìn)行優(yōu)化的識(shí)別模型,利用仿真實(shí)驗(yàn)證明了該識(shí)別模型在小批量生產(chǎn)中具有應(yīng)用價(jià)值。
另一方面,為了改善監(jiān)測(cè)模型識(shí)別精度不高、容易陷入局部?jī)?yōu)化的問題,許多學(xué)者采用AdaBoost算法對(duì)多個(gè)支持向量機(jī)進(jìn)行集成。Jin,等提出了基于Relief算法和AdaBoost-SVM的內(nèi)部裂紋缺陷檢測(cè)方法,對(duì)比常用分類器具有更好的識(shí)別性能和泛化能力。呂鋒,等提出一種基于多重提升的荷爾蒙遺傳SVM集成學(xué)習(xí)方法,并將其應(yīng)用于網(wǎng)絡(luò)故障診斷,提高故障分類準(zhǔn)確率。Bhosle,等提出了混合鄰近算法和徑向基函數(shù)核支持向量機(jī)作為AdaBoost的弱分類器,識(shí)別乳房X線照片為良性或惡性,提高早期識(shí)別乳腺癌的效率。Zheng,等將AdaBoost-SVM方法應(yīng)用到變換器功率晶體管的故障診斷,提高了故障診斷的精度??梢钥闯鯯VM作為AdaBoost的弱分類器,在故障診斷、圖像識(shí)別等領(lǐng)域具有較強(qiáng)的應(yīng)用價(jià)值,受到了學(xué)者們的普遍關(guān)注。但是AdaBoost集成算法中每個(gè)弱分類器的權(quán)重依賴于自身分類誤差,并且一味地提高錯(cuò)誤樣本的權(quán)重,這些缺點(diǎn)降低了模型的識(shí)別率。
綜合目前已有研究發(fā)現(xiàn),AdaBoost和SVM結(jié)合的算法在模式識(shí)別領(lǐng)域已有研究,但在統(tǒng)計(jì)過程控制中,尤其針對(duì)控制圖異常模式識(shí)別的研究中,還沒有考慮將該算法引入進(jìn)來。為了更好地對(duì)產(chǎn)品質(zhì)量進(jìn)行控制,本文采用AdaBoost-SVM 模型對(duì)控制圖進(jìn)行異常模式識(shí)別,為了提高質(zhì)量檢測(cè)效率,本文針對(duì)SVM 識(shí)別精度不高、容易陷入局部?jī)?yōu)化,AdaBoost 算法更新權(quán)重不足的問題,進(jìn)一步提出了基于改進(jìn)的AdaBoost-SVM 的控制圖模式識(shí)別方法,并研究其監(jiān)測(cè)效率。最后將該模型運(yùn)用于港口配煤模擬實(shí)驗(yàn)中,對(duì)其關(guān)鍵質(zhì)量特性進(jìn)行監(jiān)測(cè),以提高煤炭質(zhì)量,降低生產(chǎn)成本。
傳統(tǒng)控制圖通過判斷樣本點(diǎn)是否超過上下控制限來監(jiān)測(cè)生產(chǎn)過程的狀態(tài),而對(duì)部分過程異常因素的監(jiān)控靈敏度不高并且無法識(shí)別具體的異常模式。在實(shí)際生產(chǎn)過程中需要及時(shí)報(bào)警并快速地找出過程異常的原因,調(diào)整相應(yīng)的工序,避免造成生產(chǎn)損失。由此可見,控制圖異常模式識(shí)別對(duì)于生產(chǎn)制造企業(yè)產(chǎn)品的質(zhì)量控制和診斷具有重要意義。美國西部電氣公司總結(jié)了控制圖模式(CCP)的相關(guān)概念,并對(duì)控制圖模式的類型進(jìn)行了探討和分析。目前基于控制圖模式識(shí)別診斷的研究,主要以6種基本模式為主,分別為:正常、周期、上升趨勢(shì)、下降趨勢(shì)、向上階躍、向下階躍模式。
本文提出了基于AdaBoost-SVM的控制圖異常模式識(shí)別,其主要步驟為數(shù)據(jù)預(yù)處理、參數(shù)優(yōu)化和模式識(shí)別,如圖1所示。在數(shù)據(jù)預(yù)處理時(shí),先運(yùn)用小波分析將監(jiān)測(cè)到的數(shù)據(jù)進(jìn)行小波分解和重構(gòu),消除噪音對(duì)抽樣數(shù)據(jù)的影響;其次利用網(wǎng)格搜索和交叉驗(yàn)證法對(duì)SVM中的參數(shù)進(jìn)行尋優(yōu);最后運(yùn)用SVM作為AdaBoost的弱分類器,集成強(qiáng)分類器進(jìn)行控制圖異常模式識(shí)別。具體仿真步驟如下:
第一步:生成仿真數(shù)據(jù)。通過蒙特卡羅模擬生成六種控制圖模式數(shù)據(jù)。
第二步:數(shù)據(jù)預(yù)處理。選擇合適的小波函數(shù),通過小波變化進(jìn)行分解和系數(shù)重構(gòu),達(dá)到消除噪音的目的。
第三步:參數(shù)優(yōu)化。利用網(wǎng)格搜索和交叉驗(yàn)證對(duì)SVM中的參數(shù)懲罰因子c和核參數(shù)g進(jìn)行尋優(yōu)。
其次,可以舉一些優(yōu)秀的“阿姨”的例子,展示給她們看,這個(gè)職業(yè)可以到達(dá)的高度和狀態(tài),為阿姨樹立學(xué)習(xí)的榜樣。可以將國內(nèi)外家政服務(wù)人員的學(xué)習(xí)和教育經(jīng)歷展示給阿姨看,英國、菲律賓等家政培訓(xùn)課程和學(xué)員學(xué)習(xí)情況,都可介紹給阿姨看,目的是希望阿姨認(rèn)識(shí)到,這個(gè)工作不像她們想象的那樣簡(jiǎn)單,有很多方面可以做得更好,但必須經(jīng)過艱苦的學(xué)習(xí)和自我改變。
第四步:模式識(shí)別。利用改進(jìn)的AdaBoost-SVM模型進(jìn)行控制圖模式識(shí)別。
圖1 基于改進(jìn)的AdabBoost-SVM的控制圖模式識(shí)別框架
在SVM 中,選擇合適的核函數(shù)和參數(shù)值對(duì)SVM 的學(xué)習(xí)能力來說非常重要。徑向基函數(shù)(RBF)作為核函數(shù)具有很強(qiáng)的學(xué)習(xí)能力,能夠快速的解決非線性問題,在模式識(shí)別、故障診斷等許多問題的研究中表現(xiàn)出很好的性能。核參數(shù)g 和懲罰因子c 的選取對(duì)SVM 的性能影響較大。如果g 值選取不當(dāng),會(huì)出現(xiàn)“過學(xué)習(xí)”或“欠學(xué)習(xí)”現(xiàn)象;而懲罰因子c 越高,越容易過擬合,c 越小,越容易欠擬合。因此,本文將選擇RBF 函數(shù)作為SVM 的核函數(shù),采用網(wǎng)格搜索和交叉驗(yàn)證法尋找合適的懲罰因子和核參數(shù)。
交叉驗(yàn)證的基本思想是將數(shù)據(jù)集分割成N份,使用其中的1份作為測(cè)試集,剩余的N-1份作為訓(xùn)練集,并將訓(xùn)練好的模型用于測(cè)試集上。網(wǎng)格搜索的基本原理是將SVM中參數(shù)c和g分別劃分一個(gè)區(qū)間范圍,并計(jì)算出對(duì)應(yīng)各參數(shù)變量值組合的準(zhǔn)確率,逐一擇優(yōu),以得到該區(qū)間內(nèi)的最佳參數(shù)組合值。因此本文將利用交叉驗(yàn)證法檢驗(yàn)每組(c,g)的準(zhǔn)確率,具體步驟如下:
第一步:設(shè)置參數(shù)范圍。取g=[-x,x],c=[-y,y],并設(shè)置步長為L。
第二步:采用k折交叉驗(yàn)證方法。將訓(xùn)練集劃分為k份,選其中k-1份數(shù)據(jù)用于模型的訓(xùn)練,留下一份數(shù)據(jù)作為測(cè)試集。重復(fù)上述步驟k次,可得k次分類準(zhǔn)確率,取其平均值作為該組參數(shù)(c,g)的分類準(zhǔn)確率。
第三步:選取最優(yōu)參數(shù)組合。遍歷網(wǎng)格上所有的參數(shù)組合,選取分類準(zhǔn)確率最大的一組參數(shù)組合。
AdaBoost 算法的原理是在迭代過程中賦予多個(gè)弱分類器不同的權(quán)重,得到一個(gè)強(qiáng)分類器。傳統(tǒng)的AdaBoost算法存在明顯的不足,在迭代過程中對(duì)錯(cuò)誤樣本賦予較大的權(quán)重,正確樣本賦予較小的權(quán)重,容易導(dǎo)致錯(cuò)誤樣本權(quán)重?zé)o限的增加,正確樣本被忽視,影響樣本訓(xùn)練效果?;诖瞬蛔?,本文對(duì)AdaBoost算法進(jìn)行改進(jìn):(1)更新弱分類器權(quán)重時(shí),僅考慮弱分類器訓(xùn)練誤差率,未考慮樣本權(quán)重分布情況。R反應(yīng)了樣本權(quán)重分布情況,R越大說明被正確分類樣本越多;反之說明被錯(cuò)誤分類樣本越多。加入k*exp(R),使R越小,弱分類器權(quán)重越小。(2)更新訓(xùn)練樣本權(quán)重時(shí),為了改善對(duì)錯(cuò)誤樣本的過度關(guān)注,加入l 調(diào)節(jié)因子,減少錯(cuò)誤樣本權(quán)重增長速度和正確樣本權(quán)重減緩速度。本文提出的改進(jìn)AdaBoost-SVM 識(shí)別模型,其具體的訓(xùn)練步驟如下:
}(x,y),(x,y),...,(x,y) ,其中x是樣本特征向量,y是樣本對(duì)應(yīng)的類別標(biāo)簽,輸入初始迭代次數(shù)t=1,總迭代次數(shù)T。
在實(shí)際生產(chǎn)中存在著噪聲干擾,因此將隨機(jī)因素作為噪聲加入正常控制圖模式中,各種異常因素加入相應(yīng)的異??刂茍D模式中。為了更加貼合實(shí)際,提高分類模型的泛化能力,在每種控制圖異常模式中設(shè)置不同程度的偏移,保證數(shù)據(jù)的多樣性。對(duì)采用蒙特卡羅仿真產(chǎn)生的不同模式下的樣本數(shù)據(jù)進(jìn)行研究,詳細(xì)的樣本點(diǎn)數(shù)據(jù)公式描述如下:
其中y(t)表示t時(shí)刻的工序質(zhì)量值,q(t)表示t時(shí)刻的隨機(jī)因素,x(t)表示t時(shí)刻的異常干擾因素。表1給出了控制圖的六種模式以及相應(yīng)的模式表達(dá)式,為了討論方便,不失一般性,此處取μ=0、σ=1。本文一共生成1 080組數(shù)據(jù)(即6種模式,每種模式180組),每組數(shù)據(jù)包含10 個(gè)特征值,即一共生成1 080*10 的數(shù)據(jù)集。其中取720*10為訓(xùn)練集(每種模式120組);取360*10為測(cè)試集(每種模式60組)。各模式下的具體參數(shù)設(shè)置見表1。
表1 每種模式的參數(shù)設(shè)置
為了更好地對(duì)控制圖數(shù)據(jù)進(jìn)行模式識(shí)別,利用小波分析進(jìn)行特征提取,消除數(shù)據(jù)中包含的噪音,其方法是通過提取少量的數(shù)據(jù)來代表控制圖模式數(shù)據(jù)中的數(shù)據(jù)變化趨勢(shì)。本文采用db3小波函數(shù)來對(duì)控制圖模式數(shù)據(jù)進(jìn)行分解,將低頻近似系數(shù)與小波重構(gòu)數(shù)據(jù)的形狀特征相結(jié)合,作為控制圖模式數(shù)據(jù)的特征。將預(yù)處理好的數(shù)據(jù),放入采用SVM作為改進(jìn)的Ada-Boost弱分類器識(shí)別器的識(shí)別模型中,其中SVM的參數(shù)優(yōu)化是通過網(wǎng)格搜索法和交叉驗(yàn)證法對(duì)懲罰因子c和核參數(shù)g進(jìn)行參數(shù)尋優(yōu)。方法如下:設(shè)置c和g的范圍都是[2,2],對(duì)該范圍內(nèi)的參數(shù)進(jìn)行網(wǎng)格搜索和5折交叉驗(yàn)證,得到最優(yōu)的參數(shù)組合是[16,12.125 7],訓(xùn)練集的準(zhǔn)確率為96.805 6%。
本文將用預(yù)處理好的數(shù)據(jù),取每種模式的60組數(shù)據(jù)作為測(cè)試集,即一共生成360*10的測(cè)試集。設(shè)置對(duì)照試驗(yàn),對(duì)比各種算法的識(shí)別性能:(1)BP神經(jīng)網(wǎng)絡(luò)的輸入層神經(jīng)元為10,隱含層個(gè)數(shù)為2。(2)采用參數(shù)優(yōu)化后的SVM分類器進(jìn)行模式識(shí)別。(3)采用方法一中的BP神經(jīng)網(wǎng)絡(luò)作為AdaBoost的弱分類器進(jìn)行模式識(shí)別。(4)采用參數(shù)優(yōu)化后的SVM分類器作為AdaBoost的弱分類器進(jìn)行模式識(shí)別。(5)利用本文提出的改進(jìn)后的AdaBoost-SVM進(jìn)行模式識(shí)別。測(cè)試結(jié)果見表2。
表2 每種識(shí)別方法的識(shí)別率(%)
對(duì)表2的結(jié)果分析如下:(1)BP神經(jīng)網(wǎng)絡(luò)對(duì)六種控制圖模式的平均識(shí)別率為81.67%左右,而單獨(dú)使用SVM的平均識(shí)別率為89.44%。相比于傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)分類方案,SVM訓(xùn)練的時(shí)間雖然比神經(jīng)網(wǎng)絡(luò)慢,但是其性能卻表現(xiàn)得更好。
(2)對(duì)比單一分類器,集成分類器識(shí)別率更高。說明將多個(gè)弱分類器集成為強(qiáng)分類器,對(duì)提高控制圖模式識(shí)別率有一定的價(jià)值。
(3)可以看出,使用改進(jìn)后的AdaBoost-SVM集成分類器相比AdaBoost-SVM 集成分類器,每種模式的識(shí)別率得到了大大的提升。改進(jìn)后的AdaBoost-SVM集成分類器平均識(shí)別率達(dá)到97.78%。
對(duì)比發(fā)現(xiàn)識(shí)別性能有明顯的提高,綜上所述,在控制圖數(shù)據(jù)相同的情況下,對(duì)比單一的分類器和集成分類器,發(fā)現(xiàn)集成SVM算法對(duì)于控制圖模式識(shí)別有一定的價(jià)值,本文進(jìn)一步提出的改進(jìn)AdaBoost-SVM 算法具有較高的準(zhǔn)確率。
本文將AdaBoost-SVM控制圖識(shí)別模型應(yīng)用于物流港口配煤中。在散貨碼頭物流裝備實(shí)驗(yàn)室中進(jìn)行模擬實(shí)驗(yàn),假設(shè)需要生成的混配煤的物料比例為1:2,實(shí)驗(yàn)過程由斗輪取料機(jī)取料到各皮帶機(jī)上運(yùn)輸,最后通過斗料機(jī)進(jìn)行混合生成混煤。設(shè)置兩條皮帶機(jī)均以1m/s勻速運(yùn)行,抽樣檢測(cè)5組60s內(nèi)各皮帶機(jī)上物料的質(zhì)量,計(jì)算得到的各皮帶運(yùn)輸機(jī)的瞬時(shí)流量作為配煤工藝的關(guān)鍵質(zhì)量特性,采用均值控制圖進(jìn)行控制圖模式識(shí)別。主要的監(jiān)測(cè)流程是:將瞬時(shí)流量輸入到本文的模型進(jìn)行識(shí)別,判斷配煤的過程狀態(tài)。如果處于正常狀態(tài)則繼續(xù)生產(chǎn);處于異常狀態(tài)則進(jìn)一步判斷異常的模式,發(fā)出報(bào)警并根據(jù)專家知識(shí)庫對(duì)應(yīng)異常模式下的原因調(diào)整工序。
模擬實(shí)驗(yàn)中,人為的加入干擾因素導(dǎo)致各皮帶機(jī)瞬時(shí)流量出現(xiàn)偏移。實(shí)驗(yàn)設(shè)置皮帶機(jī)一在運(yùn)輸物料前,從第45個(gè)采樣點(diǎn)開始,周期性的改變斗輪取料機(jī)取料量;在第20-26個(gè)采樣點(diǎn)時(shí),皮帶機(jī)二前端放置一張紙片,改變此處皮帶張力,使其出現(xiàn)向上階躍異常模式。將采集的數(shù)據(jù)放入AdaBoost-SVM 模型中,進(jìn)一步測(cè)試本文模型在實(shí)際生產(chǎn)環(huán)境中的可行性。如圖2所示,對(duì)兩個(gè)皮帶機(jī)的瞬時(shí)流量繪制均值控制圖,瞬時(shí)流量要求分別是W=(4±0.3)kg/s、Q=(8±0.3)kg/s。將采集到的數(shù)據(jù)點(diǎn)采用與仿真實(shí)驗(yàn)相同的窗口寬度(n=10)在控制圖上移動(dòng)取值,分別得到51和42個(gè)樣本。將樣本輸入到訓(xùn)練好的模型中進(jìn)行特征提取和模式識(shí)別,結(jié)果如圖3所示。
圖2 皮帶運(yùn)輸機(jī)瞬時(shí)流量控制圖
圖3 瞬時(shí)流量模式識(shí)別
將瞬時(shí)流量作為關(guān)鍵質(zhì)量特性輸入到控制圖在線監(jiān)測(cè)系統(tǒng)中。當(dāng)皮帶運(yùn)輸機(jī)一的控制圖在第45個(gè)點(diǎn)監(jiān)測(cè)到異常時(shí),將其輸入到改進(jìn)的AdaBoost-SVM模型識(shí)別異常模式,運(yùn)用模型識(shí)別出在49-60個(gè)點(diǎn)時(shí)為周期模式,此時(shí)識(shí)別模型的性能指標(biāo)ARL=5;當(dāng)皮帶運(yùn)輸機(jī)二的控制圖在第20個(gè)點(diǎn)監(jiān)測(cè)到異常時(shí),將其輸入到改進(jìn)的AdaBoost-SVM 模型識(shí)別異常模式,運(yùn)用模型識(shí)別出在23-26個(gè)點(diǎn)時(shí)為向上階躍模式,此時(shí)ARL=4。上述實(shí)驗(yàn)中ARL的值均小于質(zhì)量管理體系手冊(cè)中規(guī)定的25,識(shí)別性能較好,能及時(shí)報(bào)警,且識(shí)別異常模式與實(shí)際的實(shí)驗(yàn)設(shè)計(jì)相符。改進(jìn)后的Ada-Boost-SVM模型識(shí)別與實(shí)際模擬實(shí)驗(yàn)情況吻合,由此可以說明,改進(jìn)的AdaBoost-SVM 模型在實(shí)際生產(chǎn)過程中對(duì)監(jiān)測(cè)到異常狀態(tài),并及時(shí)調(diào)整工藝規(guī)則和實(shí)施糾正預(yù)防措施都具有應(yīng)用價(jià)值。
通過對(duì)關(guān)鍵工序質(zhì)量特性進(jìn)行控制圖異常模式識(shí)別,在線監(jiān)測(cè)產(chǎn)品生產(chǎn)過程中的狀態(tài)。本文主要通過小波分析對(duì)蒙特卡羅仿真數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理后,將處理好的數(shù)據(jù)放入?yún)?shù)優(yōu)化后的SVM 中,最后將SVM作為AdaBoost的弱分類器進(jìn)行模式識(shí)別。為了比較識(shí)別的效果,設(shè)置對(duì)照實(shí)驗(yàn)結(jié)果表明:對(duì)比單一使用SVM和BP神經(jīng)網(wǎng)絡(luò),發(fā)現(xiàn)SVM相比BP神經(jīng)網(wǎng)絡(luò)具有較高的識(shí)別準(zhǔn)確率;將單一分類器和集成分類器相比較,結(jié)果表明在每種模式下集成分類器具有更好的識(shí)別性能,平均識(shí)別率達(dá)到96%以上;改進(jìn)后的AdaBoost-SVM分類器相比傳統(tǒng)集成分類器,控制圖模式識(shí)別率進(jìn)一步提高,達(dá)到97.78%。最后通過對(duì)皮帶機(jī)瞬時(shí)流量進(jìn)行監(jiān)測(cè),得出的結(jié)果和實(shí)際的模擬實(shí)驗(yàn)相同,進(jìn)一步證明了在實(shí)際生產(chǎn)中的應(yīng)用價(jià)值。