孫為釗, 周 俊
(上海工程技術(shù)大學(xué) 機(jī)械與汽車工程學(xué)院,上海 201620)
近年來, 隨著產(chǎn)業(yè)改革的深入進(jìn)行, 以往追求數(shù)量的運(yùn)營(yíng)方式已經(jīng)無法適應(yīng)現(xiàn)代需求, 企業(yè)紛紛從追求數(shù)量的模式轉(zhuǎn)變到追求數(shù)量和質(zhì)量并重的模式.為了提高零件的產(chǎn)量以及質(zhì)量需要精確掌握磨削時(shí)的溫度,在溫度過高時(shí)及時(shí)采取措施, 減少損失.
磨削加工是現(xiàn)代機(jī)械制造業(yè)中實(shí)現(xiàn)精密加工和超精密加工的基本工藝技術(shù).通過磨削加工可以得到滿意的尺寸精度、形狀精度、表面質(zhì)量等.由于磨削過程持續(xù)的時(shí)間較短以及加工的金屬層較薄, 磨削過程中產(chǎn)生的熱量大部分會(huì)集中在磨削區(qū)內(nèi), 在工件表面形成局部高溫, 當(dāng)溫度在超過某一臨界值, 就會(huì)引起表面熱損傷, 從而降低零件的使用性能和可靠性, 所以磨削溫度是衡量磨削加工質(zhì)量好壞的一個(gè)重要指標(biāo).磨削過程具有非線性、強(qiáng)耦合、多變量等特點(diǎn), 傳統(tǒng)獲得磨削溫度的方式一般為熱電偶測(cè)量法以及使用熱源計(jì)算結(jié)合有限元法獲得.使用熱電偶法來測(cè)量磨削溫度簡(jiǎn)單方便、成本低廉, 但是會(huì)破壞工件的整體性, 造成熱量傳導(dǎo)與實(shí)體工件有差異, 影響測(cè)量精度.使用熱源計(jì)算結(jié)合有限元法存在較多缺點(diǎn), 熱源計(jì)算的影響因素過多, 計(jì)算復(fù)雜, 有限元法的耗時(shí)較長(zhǎng).
AlphaGo 的出現(xiàn), 引起了人工智能以及深度學(xué)習(xí)的熱潮.深度學(xué)習(xí)的本質(zhì)是通過多層次的特征映射從聲音、圖片、文字等輸入數(shù)據(jù)中提取有助于理解數(shù)據(jù)本身含義的有效特征表示, 深度學(xué)習(xí)方法的目的是尋找原始數(shù)據(jù)之間的關(guān)系.目前基于數(shù)據(jù)驅(qū)動(dòng)的磨削溫度預(yù)測(cè)研究已經(jīng)展開, 馬占龍等[1]利用BP 算法對(duì)磨削溫度進(jìn)行了預(yù)測(cè), 所得結(jié)果與實(shí)驗(yàn)結(jié)果比較接近.蔣天一等[2]利用改進(jìn)型BP 神經(jīng)網(wǎng)絡(luò)對(duì)球面磨削的最高溫度進(jìn)行了預(yù)測(cè), 所得結(jié)果較傳統(tǒng)的單一BP 神經(jīng)網(wǎng)絡(luò)有了較大提升.馬生彪[3]利用RBF 和BP 神經(jīng)網(wǎng)絡(luò)分別對(duì)磨削溫度進(jìn)行了預(yù)測(cè)并進(jìn)行了比較, 結(jié)果表明,RBF 神經(jīng)網(wǎng)絡(luò)的誤差和訓(xùn)練次數(shù)均低于BP 神經(jīng)網(wǎng)絡(luò),證明了RBF 網(wǎng)絡(luò)比BP 神經(jīng)網(wǎng)絡(luò)更具優(yōu)越性.彭遠(yuǎn)志[4]使用了改進(jìn)型BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)了大平面砂輪磨削齒面的溫度, 準(zhǔn)確的反映了實(shí)際齒面磨削溫度.Liu CJ 等[5]使用PSO-BP (粒子群優(yōu)化BP 神經(jīng)網(wǎng)絡(luò))、GD-BP (用梯度下降法訓(xùn)練的B P 神經(jīng)網(wǎng)絡(luò))、L M-B P (用Levenberg-Marquardt 算法訓(xùn)練的BP 神經(jīng)網(wǎng)絡(luò)) 3 種方式預(yù)測(cè)鈦基材料的磨削溫度, 結(jié)果表明PSO-BP 在預(yù)測(cè)精度方面比其它兩種方式更高.Odior AO[6]提出了一種利用神經(jīng)網(wǎng)絡(luò)和模糊技術(shù)進(jìn)行磨削過程的控制系統(tǒng),使用神經(jīng)模糊模型來控制磨削過程, 使得磨削過程在可接受的溫度水平下獲得最大的輸出功率, 最大金屬去除率, 不會(huì)導(dǎo)致工件燒傷.
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)作為深度學(xué)習(xí)的核心算法模型, 以其強(qiáng)大的特征提取能力在圖像識(shí)別、語(yǔ)音分析、自然語(yǔ)言處理等領(lǐng)域取得了突破性進(jìn)展, 但在機(jī)械加工方面的應(yīng)用研究仍然不多.本文提出基于CNN 的磨削溫度預(yù)測(cè)模型,希望能夠提高預(yù)測(cè)精度, 對(duì)CNN 預(yù)測(cè)模型應(yīng)用到實(shí)際生產(chǎn)加工中有一定的理論指導(dǎo)作用.
CNN 來源于生物的視覺系統(tǒng)結(jié)構(gòu)對(duì)局部信息進(jìn)行感知并進(jìn)行分層理解的模仿, 在逐層提取不同的低級(jí)特征之后, 最終將低級(jí)特征結(jié)合成為高級(jí)特征.與傳統(tǒng)全連接形成大量參數(shù)以及手動(dòng)提取特征的方式不同,CNN 能夠自動(dòng)提取特征并采用權(quán)值共享來降低網(wǎng)絡(luò)訓(xùn)練復(fù)雜度以及確保預(yù)測(cè)準(zhǔn)確性.
CNN 包含了一個(gè)特征抽取器, 特征抽取器主要包括卷積和池化操作.卷積層是卷積神經(jīng)網(wǎng)絡(luò)的核心層,主要用于提取特征.輸入圖像和卷積核的對(duì)應(yīng)位置元素相乘再求和, 即得到輸入數(shù)據(jù)的特征圖.在卷積層,前一層的矩陣作為輸入, 與卷積核進(jìn)行卷積運(yùn)算.池化層是對(duì)卷積層提取的特征進(jìn)行下采樣, 以達(dá)到降維的目的.池化層一般位于卷積層的下一層, 兩者總是成對(duì)出現(xiàn).卷積及池化輸出公式分別為:
在反向傳播階段, 神經(jīng)網(wǎng)絡(luò)主要完成誤差計(jì)算以及卷積層權(quán)值的更新.卷積神經(jīng)網(wǎng)絡(luò)的主要工作是使預(yù)測(cè)輸出值 O 與仿真值之間的Loss 函數(shù) L(W )值最小,這樣預(yù)測(cè)輸出值與仿真值才能更接近, 預(yù)測(cè)精度才能更高.本文采用隨機(jī)梯度下降算法更新權(quán)值參數(shù), 梯度下降算法公式為:
式中, WL為待優(yōu)化的權(quán)值; LW(X(i))為預(yù)測(cè)值和仿真值之間的誤差損失函數(shù); D 為樣本總個(gè)數(shù); λ為正則化系數(shù); r (W) 是對(duì)應(yīng)權(quán)值矩陣的正則化函數(shù); Δ Wt+1為 t+1次迭代時(shí)更新的權(quán)值; μ為權(quán)重衰減因子; η為學(xué)習(xí)率.
一般二維平面磨削熱源計(jì)算模型可表示為[7,8]:
式中, ls為接觸弧長(zhǎng); Ft為切向磨削力; Rw為熱量分配比; Vs為砂輪速度; b 為磨削寬度.
熱源計(jì)算公式(5)得到的結(jié)果是磨削區(qū)瞬時(shí)發(fā)熱量, 需將其輸入仿真軟件, 由仿真軟件計(jì)算才能得出磨削溫度值.將所獲得的大量溫度數(shù)據(jù)收集起來之后, 當(dāng)做訓(xùn)練樣本來來訓(xùn)練預(yù)測(cè)模型并預(yù)測(cè)磨削溫度.因此很多科研人員不再使用解析法或有限元法轉(zhuǎn)而研究使用BP 神經(jīng)網(wǎng)絡(luò)來預(yù)測(cè)磨削溫度.BP 神經(jīng)網(wǎng)絡(luò)是由輸入層、隱層和輸出層組成的多層前饋網(wǎng)絡(luò).層與層之間采用全連接的方式連接.由于BP 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型存在預(yù)測(cè)時(shí)間長(zhǎng), 模型不易收斂, 容易陷入局部極小值等缺點(diǎn), 無法適應(yīng)實(shí)際生產(chǎn)過程.其它傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)也如BP 神經(jīng)網(wǎng)絡(luò)一樣存在預(yù)測(cè)精度較差, 預(yù)測(cè)時(shí)間長(zhǎng)等缺點(diǎn), 為了克服傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的缺點(diǎn), 本文提出的基于CNN 的磨削溫度預(yù)測(cè)模型的預(yù)測(cè)精度高于BP 神經(jīng)網(wǎng)絡(luò), 這說明了CNN 模型克服了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的缺點(diǎn), 并達(dá)到很高的精度.
卷積神經(jīng)網(wǎng)絡(luò)因其局部連接、權(quán)值全局共享以及池化操作, 極大的降低了網(wǎng)絡(luò)的復(fù)雜度, 并且大大縮減了參數(shù)數(shù)量.在機(jī)械加工過程中, 變量之間存在復(fù)雜的非線性關(guān)系, 很難通過數(shù)學(xué)模型來準(zhǔn)確反映變量之間的關(guān)系.CNN 因?qū)ζ揭啤⑴で?、縮放具有一定的不變性而具有很強(qiáng)的泛化能力被廣泛應(yīng)用到各行各業(yè)中,并且取得豐碩的成果.本文將CNN 引入到磨削溫度的預(yù)測(cè)中, 使用經(jīng)典的LeNet-5 模型來建立磨削溫度預(yù)測(cè)模型, 其結(jié)構(gòu)如圖1 所示.
圖1 CNN 結(jié)構(gòu)圖
輸入層為影響磨削溫度的相關(guān)影響因素構(gòu)成, 如砂輪速度、磨削深度、進(jìn)給速度、磨削時(shí)間、接觸面積等, 這些影響因素構(gòu)成一維輸入矩陣.然而二維矩陣比一維矩陣具有更加豐富的信息特性, 能夠提取更多有效特征.將圖片中的每一個(gè)像素點(diǎn)看成一個(gè)值, 那么圖片就相當(dāng)于二維矩陣數(shù)據(jù).利用Tensorflow 框架中的reshape 命令將影響因數(shù)作為像素點(diǎn)填入16×16 的二維矩陣中, 使之成為二維圖像數(shù)據(jù), 轉(zhuǎn)變過程如圖2所示[9].二維矩陣從輸入層到卷積層, 由5×5 的卷積核進(jìn)行特征提取, 然后到池化層進(jìn)行下采樣來降低數(shù)據(jù)維度, 減少計(jì)算量.常用的池化方法有最大池化、均值池化, 本文建立的模型采用最大池化, 最大池化能有效保留大部分信息.在幾對(duì)卷積層和池化層之后與全連接層相連.全連接層將前面的低級(jí)特征進(jìn)行補(bǔ)充融合形成高級(jí)特征, 傳遞給輸出層, 在輸出層采用回歸模型得到預(yù)測(cè)結(jié)果.
圖2 數(shù)據(jù)轉(zhuǎn)換示意圖
激活函數(shù)將非線性特性引入網(wǎng)絡(luò)中, 使神經(jīng)網(wǎng)絡(luò)具有非線性, 避免了神經(jīng)網(wǎng)絡(luò)只是單純的線性組合, 使得神經(jīng)網(wǎng)絡(luò)在理論上可以擬合任何的函數(shù).常見激活函數(shù)如下: Sigmoid 函數(shù)、Tanh 函數(shù)和ReLU 函數(shù)等.本文選用ReLU 作為激活函數(shù), 其函數(shù)表達(dá)式如下:
式中, f 為激勵(lì)函數(shù); m ax(·)為 求最大值函數(shù); x為輸入變量.
Sigmoid 函數(shù)容易出現(xiàn)梯度消失現(xiàn)象, 導(dǎo)致深層網(wǎng)絡(luò)很難訓(xùn)練, 并且收斂緩慢, 最后存在冪運(yùn)算, 計(jì)算耗時(shí).Tanh 也存在梯度消失和冪運(yùn)算問題.ReLU 函數(shù)梯度不會(huì)飽和, 解決了梯度消失問題緩解了Sigmoid 和Tanh 函數(shù)的梯度消失和冪運(yùn)算問題, 計(jì)算復(fù)雜度低, 不需要進(jìn)行指數(shù)運(yùn)算, 使部分神經(jīng)元不進(jìn)行輸出(值為0), 從而使得網(wǎng)絡(luò)更加具有稀疏性, 緩解了過擬合問題的發(fā)生.
在制造工程領(lǐng)域中, 應(yīng)用計(jì)算機(jī)模擬磨削過程是有限元法的強(qiáng)力的應(yīng)用方式之一.因此, 越來越多的研究者應(yīng)用有限元技術(shù)研究磨削過程.有限元法無論是使用宏觀還是微觀的模型都對(duì)分析磨削溫度有很好的研究?jī)r(jià)值[10].Tahvilian AM 等[11]利用使用3D 瞬態(tài)熱有限元模擬工件中的溫度分布.并用使用柔性機(jī)器人進(jìn)行磨削實(shí)驗(yàn).結(jié)果表明, 模擬結(jié)果與測(cè)量溫度之間具有良好的一致性.Wang ZX 等[12]采用6 種不同類型的熱源模擬鈦合金的磨削溫度場(chǎng), 并與實(shí)驗(yàn)結(jié)果進(jìn)行對(duì)比,結(jié)果表明三角形分布熱源的模擬結(jié)果與實(shí)驗(yàn)結(jié)果吻合較好.
本文采用熱源計(jì)算模型及有限元法結(jié)合方式進(jìn)行了3000 組仿真, 將每一次仿真的數(shù)據(jù)收集起來得到3000 組數(shù)據(jù).每組數(shù)據(jù)由砂輪速度、磨削深度、進(jìn)給速度、磨削時(shí)間、接觸面積、材料導(dǎo)熱系數(shù)、材料密度、材料比熱容、切向力以及傳熱比例這10 個(gè)數(shù)據(jù)組成.其中砂輪速度、磨削深度、進(jìn)給速度、切向力以及傳熱作為熱源計(jì)算參數(shù), 磨削時(shí)間、接觸面積、材料導(dǎo)熱系數(shù)、材料密度及材料比熱容為有限元仿真必要參數(shù).用從有限元法仿真中收集的數(shù)據(jù)假設(shè)為實(shí)際值對(duì)CNN 模型進(jìn)行訓(xùn)練及測(cè)試, 有限元仿真模型結(jié)果如圖3 所示.
選用鈦合金作為主要材料, 在各種磨削參數(shù)組合下的得到的溫度仿真數(shù)據(jù), 其中訓(xùn)練樣本數(shù)量為3000,測(cè)試樣本數(shù)量為25.實(shí)驗(yàn)的軟件環(huán)境為Windows 10操作系統(tǒng), 處理器為Inter i7-8750H, 內(nèi)存為16 GB DDR4.利用Google 開源深度學(xué)習(xí)工具TensorFlow 編寫相應(yīng)的仿真程序.
選取2 層深度的CNN 訓(xùn)練模型得到的Loss 動(dòng)手術(shù)值作為參考, 得到的Loss 值與訓(xùn)練次數(shù)關(guān)系如圖4所示.
圖3 有限元仿真結(jié)果
圖4 損失值隨訓(xùn)練次數(shù)的變化示意圖
從圖4 中可以看出模型訓(xùn)練1000 次以后趨于穩(wěn)定, 模型的Loss 值基本不變.將25 個(gè)測(cè)試樣本輸入CNN預(yù)測(cè)模型得到的結(jié)果如圖5 所示以及部分?jǐn)?shù)據(jù)如表1所示.圖5 中分別將BP 模型、1 層深度CNN 模型、2 層深度CNN 模型、3 層深度CNN 模型的預(yù)測(cè)值與仿真值進(jìn)行了對(duì)比, 從圖中可知, 3 種CNN 模型比BP 模型預(yù)測(cè)結(jié)果的精度提高較多, 并且在3 種CNN模型中, 隨著深度的增加, 預(yù)測(cè)結(jié)果的精度依次有比較明顯的提升.這是因?yàn)锽P 神經(jīng)網(wǎng)絡(luò)是全連接神經(jīng)網(wǎng)絡(luò), 且設(shè)置的隱藏層數(shù)較少, 所以預(yù)測(cè)效果較差, 如果將BP 神經(jīng)網(wǎng)絡(luò)的隱藏層數(shù)設(shè)置的較多, 則需要訓(xùn)練的參數(shù)會(huì)變得非常多, 模型訓(xùn)練的時(shí)間會(huì)變的很長(zhǎng).卷積神經(jīng)網(wǎng)絡(luò)因其局部連接、參數(shù)共享以及池化操作的特性, 相比于BP 神經(jīng)網(wǎng)絡(luò)需要訓(xùn)練的參數(shù)少很多, 并且相對(duì)誤差最高為3.14%高于1 層CNN 預(yù)測(cè)模型的1.53%.3 層深度CNN 模型的平均相對(duì)誤差最低, 僅為0.42%.由于平均相對(duì)誤差越低, 模型精度越高, 所以BP 神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)精度最低, 3 層深度CNN 模型的預(yù)測(cè)精度最高.在CNN 模型中, 隨著卷積-池化層數(shù)增加, 預(yù)測(cè)精度也有很明顯的提升, 表明了CNN 模型深度越深, 非線性擬合能力越強(qiáng), 且適用于磨削溫度預(yù)測(cè).能夠獲得絕大部分有用信息, 所以卷積神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)時(shí)間短并且精度較高.卷積神經(jīng)網(wǎng)絡(luò)隨著層數(shù)的增加, 卷積-池化層的數(shù)量相應(yīng)的增加, 提取的特征也越來越多, 預(yù)測(cè)精度也越來越高但是當(dāng)卷積-池化層數(shù)量達(dá)到一定程度時(shí), 精度達(dá)到極限, 再增加層數(shù)也無法得到更精確的結(jié)果.其中, n 層深度CNN (n=1, 2,3)中的n 表示n 對(duì)卷積層和池化層.
4 種模型的平均相對(duì)誤差見表2, BP 模型的平均
圖5 4 種模型預(yù)測(cè)值與仿真值對(duì)比
表1 部分預(yù)測(cè)數(shù)據(jù)與仿真數(shù)據(jù)對(duì)比表
表2 4 種模型的平均相對(duì)誤差
本文利用TensorFlow 深度學(xué)習(xí)框架建立了基于CNN 的磨削溫度預(yù)測(cè)模型, 希望能提高磨削溫度預(yù)測(cè)精度.現(xiàn)在得出如下結(jié)論:
(1)使用神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)磨削溫度能夠獲得較高的準(zhǔn)確度和精確度.
(2)卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)平均相對(duì)誤差低于BP 神經(jīng)網(wǎng)絡(luò)誤差, 且卷積神經(jīng)網(wǎng)絡(luò)層數(shù)越深獲得的預(yù)測(cè)值誤差越小.
(3)使用兩層深度的卷積神經(jīng)網(wǎng)絡(luò)足夠獲得準(zhǔn)確的預(yù)測(cè)溫度值, 無需使用更深層次的卷積神經(jīng)網(wǎng)絡(luò)模型.