吳琪文,周學(xué)良,吳瑤
(湖北汽車工業(yè)學(xué)院 機(jī)械工程學(xué)院,湖北 十堰 442002)
刀具作為機(jī)械加工過程最終的執(zhí)行者,其狀態(tài)直接影響加工的效率、質(zhì)量、成本、能耗以及工件的表面質(zhì)量,因此有效監(jiān)測刀具的狀態(tài)是加快生產(chǎn)過程智能化的關(guān)鍵技術(shù)之一[1]。刀具狀態(tài)監(jiān)測方法分為直接監(jiān)測法和間接監(jiān)測法,直接監(jiān)測法通過顯微鏡、射線法等直接測量刀具的磨損量,間接監(jiān)測法通過加工過程中的傳感器信息側(cè)面反映刀具的狀態(tài),相比之下間接測量法對(duì)加工過程干擾更小,應(yīng)用更加廣泛。間接測量法通常是提取傳感器信號(hào)中的相關(guān)特征來表征刀具狀態(tài),進(jìn)而通過分類模型識(shí)別刀具狀態(tài),因此特征提取的方法和分類模型會(huì)直接影響監(jiān)測結(jié)果的準(zhǔn)確性[2]。在信號(hào)采集與特征提取方面,首先是分析提取時(shí)域、頻域以及時(shí)頻域中的基礎(chǔ)特征,篩選出強(qiáng)相關(guān)特征來減少高維特征中的冗余信息,因此特征的質(zhì)量直接關(guān)系到后續(xù)模型識(shí)別的準(zhǔn)確性。面對(duì)工業(yè)加工中數(shù)據(jù)量大難儲(chǔ)存等問題,Akbari[3]通過研究主軸電流信號(hào)的諧波畸變,發(fā)現(xiàn)通過峰值和均方差2組時(shí)域特征能及時(shí)反映刀具狀態(tài)的變化;Sun[4]等通過分析聲發(fā)射信號(hào)在頻域上的變化,抽取出特定的頻率分量來表征刀具的狀態(tài),能有效監(jiān)測刀具的磨損狀態(tài);安華等[5]基于振動(dòng)信號(hào)建立深層的稀疏自編碼器模型得到降維特征,然后手動(dòng)分析篩選出敏感特征作為后續(xù)模型的輸入,通過實(shí)驗(yàn)驗(yàn)證了其可行性。綜上所述,不同信號(hào)中能有效表征刀具磨損狀態(tài)的敏感特征不同,因此針對(duì)不同信號(hào)種類選擇不同的刀具特征,才能增強(qiáng)后續(xù)模型模式識(shí)別的穩(wěn)定性和魯棒性。這些方法需要人工提取特征、選擇特征,不能確保提取和選擇出最優(yōu)的特征組合,導(dǎo)致對(duì)刀具狀態(tài)識(shí)別的精度有一定影響。在模式識(shí)別方面,常用的特征分類方法有支持向量機(jī)(support vector machine,SVM)、反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neural network,BPNN)、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)等。深度學(xué)習(xí)技術(shù)在刀具狀態(tài)監(jiān)測領(lǐng)域中的應(yīng)用廣泛,并取得了相應(yīng)的成果[6-9]?;谏疃葘W(xué)習(xí)方法的刀具狀態(tài)監(jiān)測中,CNN因其較強(qiáng)的特征提取能力,被廣泛用作監(jiān)測的基礎(chǔ)模型[10-12]。曹大理等[11]利用多層連接的方式構(gòu)建較深的CNN結(jié)構(gòu)來挖掘特征中的細(xì)節(jié)信息。Duro等[13]通過搭建聲發(fā)射傳感器信號(hào)框架以提供最佳信號(hào),并通過CNN學(xué)習(xí)刀具磨損失效的過程來增強(qiáng)刀具監(jiān)測系統(tǒng)的有效性。深度學(xué)習(xí)方法在刀具狀態(tài)監(jiān)測領(lǐng)域取得一定的成果,但現(xiàn)有研究大多是將1維信號(hào)2維化后再提取特征,導(dǎo)致模型忽略了信號(hào)中原有的時(shí)序信息,造成識(shí)別精度不高。為了充分利用CNN的特征提取能力,兼顧1維信號(hào)中的時(shí)序信息,文中提出新型刀具狀態(tài)監(jiān)測模型CNN-ABiGRU(convolutional neural networkattention and bidirectional gated recurrent unit)。通過提取信號(hào)的局部特征增強(qiáng)其時(shí)序特性并降低維度,結(jié)合一維卷積神經(jīng)網(wǎng)絡(luò)和雙向門控循環(huán)單元網(wǎng)絡(luò)構(gòu)建監(jiān)測模型,并在模型中引入注意力機(jī)制合理分配對(duì)不同時(shí)段信號(hào)特征的注意力,以增強(qiáng)模型的學(xué)習(xí)能力,提高刀具磨損狀態(tài)監(jiān)測的準(zhǔn)確性。
基于CNN-ABiGRU模型的刀具磨損狀態(tài)監(jiān)測流程如圖1所示。將在線采集到的傳感器信號(hào)(振動(dòng)信號(hào)和聲發(fā)射信號(hào))經(jīng)局部特征提取得到的時(shí)序特征作為模型的輸入,通過對(duì)刀具磨損過程的不斷學(xué)習(xí)更新至1組最優(yōu)網(wǎng)絡(luò)參數(shù),最終達(dá)到對(duì)加工過程中的刀具實(shí)時(shí)監(jiān)測其磨損狀態(tài)的目的。
圖1 刀具磨損狀態(tài)監(jiān)測流程
采集到的原始信號(hào)通常呈現(xiàn)低信噪比,若將伴隨大量噪聲的信號(hào)直接作為模型的輸入會(huì)導(dǎo)致模型識(shí)別精度低,因此需要有效的特征提取方法來減少高維特征中的冗余信息。傳統(tǒng)的特征提取方法通常是對(duì)整個(gè)信號(hào)序列提取特征,可能會(huì)導(dǎo)致信號(hào)中的局部信息被忽略,因此將原始信號(hào)分段后提取其局部特征。傳統(tǒng)特征提取和局部特征提取對(duì)比如圖2所示。
圖2 不同的特征提取方法對(duì)比圖
信號(hào)分段表達(dá)式為
式中:y為原始時(shí)間序列;yi為分段后的數(shù)據(jù)。對(duì)分段后的數(shù)據(jù)分別提取不同域中的特征,特征種類如表1所示。經(jīng)局部特征提取得到的特征維度為(T,m×n),T為信號(hào)分段后的段數(shù),n為原始信號(hào)中傳感器數(shù)量,m為局部特征數(shù)量。
表1 局部特征
在刀具磨損狀態(tài)監(jiān)測問題中,由于局部特征提取后的數(shù)據(jù)之間有時(shí)序相關(guān)性的特點(diǎn),在處理數(shù)據(jù)的時(shí)候需要考慮數(shù)據(jù)之間的時(shí)序依賴性。GRU可以對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行編碼并學(xué)習(xí)其中的變化規(guī)律,時(shí)序卷積網(wǎng)絡(luò)能在不同的時(shí)間層次上提取特征[14]。為了增強(qiáng)模型對(duì)刀具磨損過程的學(xué)習(xí)能力,將時(shí)序卷積網(wǎng)絡(luò)和雙向門控循環(huán)單元網(wǎng)絡(luò)作為模型的2個(gè)分支學(xué)習(xí)不同特征來識(shí)別刀具磨損狀態(tài),模型結(jié)構(gòu)如圖3所示。
圖3 CNN-ABiGRU網(wǎng)絡(luò)結(jié)構(gòu)
在時(shí)序卷積網(wǎng)絡(luò)分支中,通過不同大小的卷積塊進(jìn)一步抽取輸入數(shù)據(jù)中的高級(jí)特征。每個(gè)基本的卷積塊由一維卷積層和批量歸一化層組成。卷積塊中的卷積層主要通過卷積核經(jīng)過卷積運(yùn)算生成特征圖,然后將特征圖通過激活函數(shù)計(jì)算后作為卷積層輸出的特征。卷積運(yùn)算及激活函數(shù)表示為
式中:xi和yi分別為批量歸一化層的輸入和輸出;γi為尺度因子;βi為平移因子。γi和βi均為模型參數(shù),在訓(xùn)練時(shí)能夠被更新。
在時(shí)序卷積網(wǎng)絡(luò)分支中,疊加3個(gè)卷積塊構(gòu)建時(shí)序卷積網(wǎng)絡(luò)分支,如圖3所示。3個(gè)卷積塊中卷積核尺寸分別設(shè)置為(2,2,2),卷積核的數(shù)量分別設(shè)置為(16,8,4),在最后1個(gè)卷積塊后添加池化層和展平層來打平時(shí)序卷積網(wǎng)絡(luò)分支的輸出,便于merge層的連接。使用同樣的數(shù)據(jù)集進(jìn)行卷積操作,卷積層層數(shù)對(duì)識(shí)別精度的影響如圖4所示,可以看出采用3層的卷積層操作分類效果最好。
圖4 不同卷積層層數(shù)下準(zhǔn)確率的變化
在雙向門控循環(huán)單元網(wǎng)絡(luò)分支中,以GRU為基礎(chǔ)模型,構(gòu)建雙層雙向GRU網(wǎng)絡(luò)從正向和反向?qū)W習(xí)刀具磨損過程中的變化規(guī)律。GRU內(nèi)部結(jié)構(gòu)見圖5,xt表示在t時(shí)間步時(shí)輸入的向量,ht表示在t時(shí)間步時(shí)的隱藏狀態(tài),h?t表示在t時(shí)間步上的候選隱藏狀態(tài)。更新門zt控制GRU單元內(nèi)部的狀態(tài)是否需要更新以及內(nèi)部單元需要更新的數(shù)量;重置門rt確定在t時(shí)間步需要忽略的信息量,以控制傳遞到下一狀態(tài)中的內(nèi)容。GRU單元內(nèi)部運(yùn)算方式為
圖5 GRU單元內(nèi)部結(jié)構(gòu)
式中:Wxr和Whr為重置門的權(quán)重向量;Wxz和Whz為更新門的權(quán)重向量;Wxh和Whh為候選隱藏狀態(tài)的權(quán)重向量;br、bz、bh為偏置向量??紤]到刀具狀態(tài)特征序列的長度,單向GRU網(wǎng)絡(luò)在長序列上容易產(chǎn)生遺忘,因此構(gòu)造雙向GRU網(wǎng)絡(luò)從正向和反向?qū)W習(xí)以預(yù)測刀具磨損狀態(tài)。正向GRU輸出隱藏狀態(tài)為,反向GRU輸出隱藏狀態(tài)為h←t,在t時(shí)間步輸出2個(gè)隱藏狀態(tài)的總和Pt:
同時(shí)在雙向GRU網(wǎng)絡(luò)后添加注意力機(jī)制層增強(qiáng)模型的學(xué)習(xí)能力,注意力機(jī)制層對(duì)每個(gè)輸入計(jì)算相應(yīng)的權(quán)重,然后加權(quán)求和,實(shí)現(xiàn)對(duì)整個(gè)輸入序列數(shù)據(jù)中重要特征的聚焦,注意力機(jī)制運(yùn)算過程為
式中:v為輸入Pt經(jīng)注意力分配后的輸出;Pt為Bi-GRU層輸出的隱藏特征;αt為Pt的注意力權(quán)重向量;ut為Pt經(jīng)加權(quán)運(yùn)算后的tanh函數(shù)壓縮值;us為訓(xùn)練過程中產(chǎn)生的中間向量;Ws、bs分別為訓(xùn)練過程中的權(quán)重矩陣和偏置向量。
模型訓(xùn)練過程中需要通過損失函數(shù)來衡量模型輸出的預(yù)測值和真實(shí)值之間的差距,作為反向傳播更新網(wǎng)絡(luò)權(quán)重參數(shù)的依據(jù)。采用交叉熵?fù)p失函數(shù)對(duì)刀具狀態(tài)進(jìn)行分類,表達(dá)式為
式中:L為損失函數(shù)值;M為類別的數(shù)量;yic為第i個(gè)樣本計(jì)算出的標(biāo)簽值,當(dāng)樣本i屬于c類時(shí)取1,否則取0;pic為樣本i屬于c類的預(yù)測概率。為了最小化損失函數(shù),在反向傳播更新過程中選用Adam優(yōu)化器來更新網(wǎng)絡(luò)權(quán)重,根據(jù)訓(xùn)練數(shù)據(jù)不斷迭代更新網(wǎng)絡(luò)的權(quán)重,有效避免局部最優(yōu)解的同時(shí)占用最少的內(nèi)存[15]。
采用PHM2010競賽數(shù)據(jù)集進(jìn)行實(shí)驗(yàn)驗(yàn)證。數(shù)據(jù)集的實(shí)驗(yàn)設(shè)備是Roders Tech RFM760數(shù)控銑床,切削材料為HRC52不銹鋼。傳感器安裝示意圖和實(shí)驗(yàn)平臺(tái)如圖6所示,加工參數(shù)如表2所示。數(shù)據(jù)采集系統(tǒng)為NIDAQ數(shù)據(jù)采集卡,通過PCB9265B力傳感器采集X、Y、Z向切削力信號(hào),通過Kistler8636C振動(dòng)加速度傳感器采集X、Y、Z向振動(dòng)信號(hào),采樣頻率為50kHz,最終獲得7種傳感器信號(hào)。
圖6 銑削實(shí)驗(yàn)平臺(tái)搭建
表2 銑削實(shí)驗(yàn)切削參數(shù)
實(shí)驗(yàn)中采集了6把銑刀(C1~C6)在相同加工條件下磨損過程的信號(hào)與磨損值,每把刀具銑削315次,每次銑削完成后分別測量銑刀3個(gè)切削刃的磨損值。構(gòu)建數(shù)據(jù)集時(shí),把C1、C4、C6加工時(shí)采集的振動(dòng)信號(hào)和聲發(fā)射信號(hào)作為數(shù)據(jù)集,并根據(jù)后刀面磨損值劃分磨損階段,作為標(biāo)簽數(shù)據(jù)。其中2把刀具的數(shù)據(jù)用于模型的訓(xùn)練集和驗(yàn)證集,剩余1把刀具的數(shù)據(jù)作為模型的測試集且進(jìn)行交叉驗(yàn)證。刀具的磨損狀態(tài)分為初期磨損、正常磨損以及急劇磨損,如表3所示。為便于模型訓(xùn)練和測試,將后刀面磨損值經(jīng)過one-hot編碼轉(zhuǎn)換為刀具磨損狀態(tài)。
表3 刀具磨損狀態(tài)標(biāo)簽
CNN-ABiGRU網(wǎng)絡(luò)及其對(duì)比模型基于Tensor-Flow2.0 框架搭建,實(shí)驗(yàn)使用的處理器為Intel i7 10TH,顯卡為NVIDIA GTX1650Ti。首先將銑削加工過程中采集到的三向振動(dòng)信號(hào)和聲發(fā)射信號(hào)分段處理,得到315段等長的信號(hào);然后將分段后的信號(hào)按照表1進(jìn)行局部特征提取,得到維度為(315,36)的局部特征(4種傳感器信號(hào)×9種特征);最后將提取到的局部特征輸入到CNN-ABiGRU模型中進(jìn)行訓(xùn)練和測試,采用Adam算法反向傳播更新模型的權(quán)重使損失函數(shù)值收斂到最小。訓(xùn)練過程中設(shè)置批處理數(shù)量為32,迭代次數(shù)為200,Adam算法的學(xué)習(xí)率為0.001。CNN-ABiGRU網(wǎng)絡(luò)模型在C1、C4、C6測試集上的準(zhǔn)確率和損失值如圖7所示,可以看出:模型識(shí)別準(zhǔn)確率隨迭代次數(shù)的增加不斷升高最終趨于穩(wěn)定,且模型在不同測試集上的準(zhǔn)確率均能穩(wěn)定在90%以上,損失值均穩(wěn)定在0.6 以下,表明網(wǎng)絡(luò)處于收斂狀態(tài)且未出現(xiàn)過擬合現(xiàn)象。圖8顯示模型在不同測試集上預(yù)測的表現(xiàn),可看出預(yù)測未知測試集時(shí)的精度較高。
圖7 CNN-ABiGRU模型的準(zhǔn)確率及損失值
圖8 CNN-ABiGRU模型的分類結(jié)果混淆矩陣
為驗(yàn)證模型的有效性,選取常用的深度學(xué)習(xí)方法卷積神經(jīng)網(wǎng)絡(luò)和未增加注意力機(jī)制的BiGRU網(wǎng)絡(luò)對(duì)比驗(yàn)證,CNN模型的具體參數(shù)見文獻(xiàn)[16],將BiGRU網(wǎng)絡(luò)的隱藏單元數(shù)設(shè)置為16,損失函數(shù)與優(yōu)化算法的參數(shù)設(shè)置與CNN-BiGRU一致。對(duì)比結(jié)果如圖9~10所示:CNN和BiGRU網(wǎng)絡(luò)模型在收斂過程中準(zhǔn)確率的振蕩幅度都相對(duì)較大,且2個(gè)對(duì)比模型在不同測試集上的準(zhǔn)確率只有75%左右,側(cè)面反映出模型的魯棒性和泛化能力較差。雖然對(duì)比模型具有基礎(chǔ)的預(yù)測能力,但由于模型結(jié)構(gòu)的限制,網(wǎng)絡(luò)內(nèi)部結(jié)構(gòu)設(shè)計(jì)對(duì)模型泛化能力和預(yù)測精度影響較大。CNN-ABiGRU模型預(yù)測精度優(yōu)于CNN和BiGRU網(wǎng)絡(luò)模型,原因在于較深的網(wǎng)絡(luò)結(jié)構(gòu)能更有效地學(xué)習(xí)刀具磨損失效過程中的特征變化規(guī)律,同時(shí)因?yàn)樽⒁饬C(jī)制的引入讓模型在學(xué)習(xí)過程中對(duì)重要的特征信息更加聚焦,使模型在收斂過程中較穩(wěn)定,體現(xiàn)了較好的識(shí)別精度和魯棒性。
圖9 CNN模型的準(zhǔn)確率
圖10 BiGRU模型的準(zhǔn)確率
為進(jìn)一步驗(yàn)證模型的有效性,選取機(jī)器學(xué)習(xí)中常用的分類算法支持向量分類(support vector classification,SVC)設(shè)計(jì)對(duì)比試驗(yàn)。SVC對(duì)比模型中使用的數(shù)據(jù)集與前文相同,選取RBF作為分類核函數(shù),懲罰系數(shù)設(shè)為0.8,gamma值設(shè)為2,對(duì)比預(yù)測結(jié)果如表4所示,可以看出:在預(yù)測精度方面,CNNABiGRU模型比另外2種對(duì)比模型更有優(yōu)勢。
表4 模型預(yù)測結(jié)果對(duì)比
文中建立了基于CNN-ABiGRU的實(shí)時(shí)刀具磨損狀態(tài)監(jiān)測模型,應(yīng)用于銑刀的磨損失效過程當(dāng)中。針對(duì)原始信號(hào)中信噪比較低的特點(diǎn),增加了局部特征提取步驟來降低信號(hào)當(dāng)中的冗余信息,以便增強(qiáng)模型識(shí)別刀具磨損狀態(tài)的準(zhǔn)確性。文中提出的CNN-ABiGRU模型通過門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)分支學(xué)習(xí)時(shí)間序列數(shù)據(jù)中的變化規(guī)律,通過一維時(shí)序卷積網(wǎng)絡(luò)分支在不同時(shí)間層次上提取特征,最終獲得較高的識(shí)別精度。在相同的數(shù)據(jù)集上,與常用的深度學(xué)習(xí)方法和機(jī)器學(xué)習(xí)方法相對(duì)比,結(jié)果顯示,文中所提出的模型具有更高的準(zhǔn)確率。實(shí)際加工過程中加工過程的種類多樣,目前只在單一工況下銑削加工數(shù)據(jù)集上進(jìn)行了驗(yàn)證。后續(xù)將考慮模型在車削等加工方式上的應(yīng)用以及在多工況或變工況下的應(yīng)用,進(jìn)一步提高模型的泛化能力。