林江豪 吳宗澤 李嘉俊 謝勝利③
①(廣東工業(yè)大學(xué)自動(dòng)化學(xué)院 廣州 510006)
②(廣東外語外貿(mào)大學(xué)語言工程與計(jì)算實(shí)驗(yàn)室 廣州 510006)
③(廣東工業(yè)大學(xué)粵港澳離散制造智能化聯(lián)合實(shí)驗(yàn)室 廣州 510006)
塑料制品具有質(zhì)量輕、絕緣和耐腐蝕等優(yōu)點(diǎn),已廣泛應(yīng)用于航空航天、高鐵、通信、新能源、物流和日常生活等多個(gè)領(lǐng)域。注塑產(chǎn)品的質(zhì)量容易受注塑機(jī)工藝參數(shù)設(shè)定、模具狀態(tài)等諸多因素的影響。產(chǎn)品質(zhì)量預(yù)測(cè)可應(yīng)用于實(shí)際注塑工業(yè)場(chǎng)景中的缺陷自動(dòng)發(fā)現(xiàn),及時(shí)停止缺陷產(chǎn)品生產(chǎn),降低生產(chǎn)損失,因此要求模型結(jié)構(gòu)簡(jiǎn)單、計(jì)算效率高,以滿足快速的系統(tǒng)響應(yīng),實(shí)現(xiàn)產(chǎn)品缺陷的實(shí)時(shí)預(yù)警。同時(shí),要求模型具有穩(wěn)健性,確保缺陷預(yù)警的真實(shí)性,降低系統(tǒng)漏報(bào)、錯(cuò)報(bào)造成的生產(chǎn)損失。
常見的注塑產(chǎn)品質(zhì)量缺陷有產(chǎn)品縮水、變形等多種。在現(xiàn)有的注塑產(chǎn)品質(zhì)量預(yù)測(cè)研究中,主要選擇如寬度、厚度和質(zhì)量作為模型的預(yù)測(cè)目標(biāo),采用回歸預(yù)測(cè)的方法來解決。傳統(tǒng)的基于機(jī)器學(xué)習(xí)的方法主要有支持向量機(jī)(Support Vector Machines,SVM)[1]、最近鄰算法(K-Nearest Neighbor,KNN)[2]、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)[2–5]、輕量梯度提升機(jī)(Light Gradient Boosting Machine, LightGBM)[6,7]等。近年來以神經(jīng)網(wǎng)絡(luò)方法為主,Ogorodnyk等人[2]提出了采用多層感知機(jī)(MultiLayer Perceptron, MLP)來實(shí)現(xiàn)產(chǎn)品寬度和厚度的預(yù)測(cè)方法。文獻(xiàn)[3,4]采用反向傳播(Back Propagation, BP)網(wǎng)絡(luò)來進(jìn)行質(zhì)量參數(shù)的建模。文獻(xiàn)[5]結(jié)合徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò)模型和多島遺傳算法(Multi-Island Genetic Algorithm MIGA)對(duì)注塑過程的最優(yōu)參數(shù)尋找進(jìn)行建模。文獻(xiàn)[6,7]對(duì)LightGBM算法優(yōu)化過程進(jìn)行改進(jìn),實(shí)現(xiàn)更精準(zhǔn)的注塑成型產(chǎn)品質(zhì)量預(yù)測(cè)模型。傳統(tǒng)機(jī)器學(xué)習(xí)的模型比較簡(jiǎn)潔,滿足了實(shí)時(shí)計(jì)算的需求。然而,實(shí)際生產(chǎn)過程中,容易出現(xiàn)訓(xùn)練數(shù)據(jù)以外的離群點(diǎn),屬于典型的零樣本或者小樣本的問題,傳統(tǒng)機(jī)器學(xué)習(xí)方法難以解決,表現(xiàn)出模型泛化能力不足的缺陷,而對(duì)離群點(diǎn)的預(yù)測(cè)是產(chǎn)品質(zhì)量檢測(cè)的核心。
隨著基于深度學(xué)習(xí)的計(jì)算視覺技術(shù)發(fā)展,利用電荷耦合器件(Charged Coupled Device, CCD)圖像傳感器采集產(chǎn)品外觀的多角度圖像,基于深度神經(jīng)網(wǎng)絡(luò)模型構(gòu)建缺陷分類器是可行的,主要以卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks, CNN)[8,9]或CNN與如門控循環(huán)單元(Gated Recurrent Unit, GRU)[10]的其他深度神經(jīng)網(wǎng)絡(luò)結(jié)合作為產(chǎn)品缺陷圖像的特征提取器,進(jìn)而訓(xùn)練分類器來進(jìn)行注塑產(chǎn)品缺陷類別的自動(dòng)分類。基于深度學(xué)習(xí)的方法雖然保證了準(zhǔn)確率,但數(shù)據(jù)采集困難、特征提取復(fù)雜、不能針對(duì)生產(chǎn)場(chǎng)景靈活轉(zhuǎn)變,并且大規(guī)模的參數(shù)學(xué)習(xí),學(xué)習(xí)的時(shí)間成本非常高,屬于典型的數(shù)據(jù)饑餓模型,需要大量的標(biāo)注數(shù)據(jù)來進(jìn)行模型訓(xùn)練才能獲得穩(wěn)定而有效的模型,然而在實(shí)際工業(yè)應(yīng)用中獲得大規(guī)模的缺陷標(biāo)注數(shù)據(jù)顯然是不現(xiàn)實(shí)的。
綜合以上,現(xiàn)有基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的注塑產(chǎn)品質(zhì)量預(yù)測(cè)方法推動(dòng)了注塑行業(yè)智能化和自動(dòng)化,但模型仍存在泛化能力不足、靈活性不夠、訓(xùn)練成本高等缺陷。文獻(xiàn)[11]提出的寬度學(xué)習(xí)系統(tǒng)是基于隨機(jī)向量函數(shù)鏈接網(wǎng)絡(luò)的平行網(wǎng)絡(luò)(Random Vector Functional Link Neural Networks,RVFLNN),已被證明具有通用的逼近能力[12]。文獻(xiàn)[13]提出了采用最小p-Norm的方法優(yōu)化參數(shù)矩陣W,在擬合sinc函數(shù)實(shí)驗(yàn)發(fā)現(xiàn),在數(shù)據(jù)中的噪聲分布不確定情況下,調(diào)節(jié)p值可以保持模型良好的魯棒性。寬度學(xué)習(xí)具有結(jié)構(gòu)簡(jiǎn)單、訓(xùn)練速度快、泛化性能好等優(yōu)勢(shì)。因此,本文以注塑產(chǎn)品質(zhì)量的3維尺寸作為預(yù)測(cè)目標(biāo),提出一種基于寬度學(xué)習(xí)方法的注塑產(chǎn)品質(zhì)量預(yù)測(cè)模型,主要?jiǎng)?chuàng)新工作可概括為以下3個(gè)方面:
(1)提出一種基于BLS的注塑產(chǎn)品尺寸預(yù)測(cè)方法,通過引入p范數(shù)提升寬度學(xué)習(xí)系統(tǒng)(Broad Learning System, BLS)模型應(yīng)對(duì)異常數(shù)據(jù)和小樣本數(shù)據(jù)的能力,提升模型的魯棒性。
(2)介紹了一種基于相關(guān)系數(shù)矩陣的特征選擇方法。對(duì)高頻傳感器數(shù)據(jù)、spc數(shù)據(jù)、注塑機(jī)臺(tái)參數(shù)、產(chǎn)品質(zhì)量數(shù)據(jù)進(jìn)行預(yù)處理,利用相關(guān)系數(shù)進(jìn)行特征篩選,并計(jì)算衍化特征,最后獲得預(yù)測(cè)模型的輸入特征。
(3)在注塑成型工藝品尺寸預(yù)測(cè)數(shù)據(jù)中進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,本文所提方法確實(shí)能提高注塑產(chǎn)品尺寸預(yù)測(cè)的準(zhǔn)確性。在實(shí)際的注塑產(chǎn)品缺陷自動(dòng)發(fā)現(xiàn)中,能更好地預(yù)測(cè)小樣本異常尺寸。
本文其余部分組織如下:首先,在第2節(jié)主要介紹特征篩選的方法和結(jié)果。然后,在第3節(jié)提出基于最小p范數(shù)的寬度學(xué)習(xí)在注塑產(chǎn)品尺寸預(yù)測(cè)中的建模方法。接著,在第4節(jié)中對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行分析。最后第5節(jié)對(duì)全文工作進(jìn)行總結(jié)。
本文使用第4屆工業(yè)大數(shù)據(jù)競(jìng)賽題目《注塑成型工藝的虛擬量測(cè)和調(diào)機(jī)優(yōu)化》中任務(wù)A-虛擬量測(cè)的數(shù)據(jù)1)https://www.industrial-bigdata.com/Home,數(shù)據(jù)集提供了每個(gè)批次產(chǎn)品的生產(chǎn)過程數(shù)據(jù),以及工藝參數(shù)的調(diào)機(jī)記錄,并給出了每個(gè)模次生產(chǎn)的注塑產(chǎn)品的尺寸測(cè)量信息。數(shù)據(jù)的簡(jiǎn)單描述如下:
(1)傳感器高頻數(shù)據(jù)(data sensor):該數(shù)據(jù)來自于模溫機(jī)及模具傳感器采集的數(shù)據(jù),單個(gè)模次時(shí)長(zhǎng)為40~43 s,采樣頻率根據(jù)階段有20 Hz和50 Hz兩種,含有24個(gè)溫度、壓力等傳感器數(shù)據(jù),是連續(xù)的數(shù)據(jù)。
(2)成型機(jī)狀態(tài)數(shù)據(jù)(data spc):該數(shù)據(jù)來自成型機(jī)機(jī)臺(tái),均為表征成型過程中的一些狀態(tài)數(shù)據(jù),數(shù)據(jù)維度為86維。每個(gè)模次記錄1次數(shù)據(jù),數(shù)據(jù)是離散的。
(3)機(jī)臺(tái)工藝設(shè)定參數(shù)(data_set):注塑成型的81種工藝設(shè)定參數(shù),這部分?jǐn)?shù)據(jù)是在注塑機(jī)參數(shù)調(diào)整的時(shí)候產(chǎn)生,只在參數(shù)變化時(shí)記錄,屬于離散數(shù)據(jù)。
(4)產(chǎn)品測(cè)量尺寸(size data):每個(gè)模次產(chǎn)品的3維尺寸,記為size1, size2和size3。size1∈[299.85,300.15],size2∈[199.925,200.075] 和size3∈[199.925,200.075]分別是size1, size2和size3的合格范圍。數(shù)據(jù)統(tǒng)計(jì)顯示,異常數(shù)據(jù)占比非常低,高于上限的異常尺寸產(chǎn)品數(shù)量占比分別為2.73%, 11.86%和5.78%;低于下限的異常產(chǎn)品數(shù)量分別占比為0%, 2.01%和0.44%,屬于典型的不平衡小樣本數(shù)據(jù),符合實(shí)際生產(chǎn)環(huán)境中數(shù)據(jù)的采集特點(diǎn),模型計(jì)算結(jié)果更接近實(shí)際場(chǎng)景。
為了對(duì)特征數(shù)據(jù)降維,采用基于斯皮爾曼(spearman)相關(guān)性系數(shù)矩陣的特征篩選方法2)https://github.com/chuangwang1991/VirtualMeasurement molding,如圖1所示。對(duì)采集到的不同特征數(shù)據(jù)進(jìn)行處理,包括數(shù)據(jù)清理、合并和衍化特征計(jì)算。具體處理的過程:首先刪除data_sensor中存在空值和單一值的維度,計(jì)算每個(gè)模次中data_spc中傳感器采集數(shù)據(jù)的平均值作為整個(gè)周期的值,作為模型的基礎(chǔ)特征。將得到的基礎(chǔ)特征分別與每個(gè)目標(biāo)尺寸進(jìn)行斯皮爾曼相關(guān)性系數(shù)分析得到相關(guān)矩陣,并利用訓(xùn)練集和測(cè)試集的數(shù)據(jù)分布差異,選擇合適的基礎(chǔ)特征。接著,刪除data_set中的空值和單一值的維度,并計(jì)算衍化特征。隨后,計(jì)算每個(gè)調(diào)機(jī)段中各個(gè)size的衍化特征。最后,將提取到的各類特征鏈接起來,作為總的特征提取結(jié)果。
圖1 特征提取過程
經(jīng)過特征提取后,獲得size1, size2, size3對(duì)應(yīng)的模型特征如表1所示,其中“√”表示使用了該特征,“×”表示未使用該特征,最終的特征維數(shù)分別是21, 22和21,主要特征內(nèi)容為時(shí)間、壓力、溫度和速度這4類參數(shù)。
表1 特征選擇結(jié)果
注塑成型產(chǎn)品尺寸預(yù)測(cè)任務(wù)屬于回歸預(yù)測(cè)任務(wù),對(duì)傳感器高頻數(shù)據(jù)、spc數(shù)據(jù)、機(jī)臺(tái)工藝設(shè)定參數(shù)等數(shù)據(jù)進(jìn)行特征提取,得到特征矩陣X,X經(jīng)過BLS的特征層線性映射后,再通過增強(qiáng)層的非線性轉(zhuǎn)換,最后將特征層和增強(qiáng)層的輸出共同輸入到輸出層,得到BLS的預(yù)測(cè)結(jié)果。如圖2所示,BLS簡(jiǎn)化了隨機(jī)向量函數(shù)連接網(wǎng)絡(luò) (Random Vector Functional-Link Neural Network, RVFLNN)的網(wǎng)絡(luò)結(jié)構(gòu),將增強(qiáng)節(jié)點(diǎn)和特征節(jié)點(diǎn)并列到同一層,主要優(yōu)勢(shì)有:(1)增加隱藏層節(jié)點(diǎn)的數(shù)量,真正實(shí)現(xiàn)將網(wǎng)絡(luò)向?qū)挾确较驍U(kuò)展;(2)輸入數(shù)據(jù)經(jīng)過特征映射和增強(qiáng)映射兩次變換,增強(qiáng)了網(wǎng)絡(luò)的特征提取能力。
圖2 寬度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)
表2 基于BLS的產(chǎn)品尺寸預(yù)測(cè)模型訓(xùn)練
(1)支持向量機(jī)(SVM)[7]:能解決高維特征的回歸問題;僅依靠支持向量來決定超平面,無需依賴全部數(shù)據(jù);有多種核函數(shù)可以選擇,從而可以更靈活地解決各種非線性的回歸問題;在注塑成型質(zhì)量預(yù)測(cè)的小樣本數(shù)據(jù)中,具有更強(qiáng)的泛化能力。
(2) K近鄰(KNN)[6]:通過找出一個(gè)樣本的k個(gè)最近鄰居,將這些鄰居的某些屬性的平均值賦給該樣本,就可以得到該樣本對(duì)應(yīng)屬性的值,模型比較簡(jiǎn)單,無需估計(jì)參數(shù),重新訓(xùn)練代價(jià)低。
(3) 多層感知機(jī)(MLP)[6]:MLP是3層及以上的前饋神經(jīng)網(wǎng)絡(luò),層與層之間是全連接,利用激活函數(shù)來對(duì)節(jié)點(diǎn)信息進(jìn)行非線性激活,隱藏層的神經(jīng)元數(shù)量是可設(shè)置的,可采用誤差逆?zhèn)鞑シ椒▉磉M(jìn)行優(yōu)化。
選用均方誤差(Mean Squared Error, MSE)作為模型的評(píng)價(jià)標(biāo)準(zhǔn),如式(16)所示,MSE是將所有預(yù)測(cè)結(jié)果與實(shí)際結(jié)果之間誤差平方后求平均所得,常用于評(píng)估回歸模型的性能。
表3 基于pN-BLS的產(chǎn)品尺寸預(yù)測(cè)模型訓(xùn)練
4.3.1 SVM
對(duì)比了linear,rbf,poly和sigmoid 4種不同核函數(shù)在數(shù)據(jù)集上的表現(xiàn),發(fā)現(xiàn)核函數(shù)poly在size1,size2, size3 3個(gè)尺寸的回歸預(yù)測(cè)中,均可取得最小的MSE值。因此該文最終選擇poly作為SVM的核函數(shù),并設(shè)置核函數(shù)的度為3。
4.3.2 KNN
針對(duì)KNN模型,為了選擇合適的最近鄰數(shù)(nneighbors),通過設(shè)置n-neighbors從3~99,步進(jìn)為2,實(shí)驗(yàn)結(jié)果發(fā)現(xiàn)n-neighbors對(duì)size1,size2,size3預(yù)測(cè)的MSE具有相同的趨勢(shì),隨著n-neighbors逐步增加,MSE的值逐步變小,并趨向于穩(wěn)定。相比而言,size1對(duì)n-neighbors更敏感,n-neighbors對(duì)size3的影響最小,根據(jù)實(shí)驗(yàn)記過,最終設(shè)置nneighbors=99。
4.3.3 MLP
設(shè)計(jì)包含輸入層、隱藏層(N1) 、隱藏層(N2)、輸出層共4層結(jié)構(gòu)的MLP神經(jīng)網(wǎng)絡(luò),采用tanh激活函數(shù),設(shè)置alpha=1e-6。對(duì)隱藏層的最優(yōu)節(jié)點(diǎn)數(shù),采用網(wǎng)格搜索法來確定,設(shè)置每一個(gè)隱藏層的神經(jīng)元數(shù)3~101,步進(jìn)為2。實(shí)驗(yàn)結(jié)果發(fā)現(xiàn)N1<10時(shí),對(duì)size1,size2和size3的預(yù)測(cè)影響都比較大,說明了第1個(gè)隱藏層神經(jīng)元數(shù)需要盡量大一些,能更充分地學(xué)習(xí)輸入層的信息。通過搜索,最終確定預(yù)測(cè)size1,size2和size3的最優(yōu)N1和N2組合分別為(71,5),(83, 21),(43, 55)。
4.3.4 BLS
采用網(wǎng)格搜索法確定最優(yōu)(q,k,r)組合,特征層的特征組數(shù)q和特征節(jié)點(diǎn)數(shù)k的搜索范圍都是[2:1:1 1],增強(qiáng)層的節(jié)點(diǎn)數(shù)搜索范圍設(shè)置為[3:2:101],設(shè)置正則化參數(shù)λ=2?30。實(shí)驗(yàn)結(jié)果表明,size2對(duì) (q,k,r)的變化更為敏感,相比而言,size1和size3在r>20時(shí),更為穩(wěn)定。通過實(shí)驗(yàn)獲得(q,k,r)對(duì)size1,size2和size3的最優(yōu)組合分別是(8,10, 97),(10, 10, 95)和(9, 8, 93)。
選擇SVM, KNN, MLP, BLS和pN-BLS中p-norm值分別為0.1, 0.5, 1.0, 1.5, 2.0, 2.5, 3.0, 3.5, 4.0時(shí),模型的最優(yōu)預(yù)測(cè)結(jié)果,如表4為size1, size2,size3對(duì)應(yīng)的預(yù)測(cè)MSE值。從實(shí)驗(yàn)結(jié)果可以看出,相比SVM, KNN, MLP的預(yù)測(cè)結(jié)果,BLS和pN-BLS性能都有大幅度的提升,這說明了寬度學(xué)習(xí)方法可以有效地應(yīng)用于注塑產(chǎn)品的質(zhì)量預(yù)測(cè)。
表4 預(yù)測(cè)結(jié)果
對(duì)size1的預(yù)測(cè),普通的BLS在q=8, k=10,r=97時(shí)取得最優(yōu)的結(jié)果MSE=0.000548。在加入p進(jìn)一步約束異常值的影響后,pN-BLS比BLS的效果普遍要好,當(dāng)p=1.5, q=10, k=5, r=93時(shí),最小的MSE=0.000187,相比BLS有較大幅度的性能提升。對(duì)size2的預(yù)測(cè),當(dāng)p=1.5, q=6, k=10,r=69時(shí),pN-BLS預(yù)測(cè)的MSE=0.008483,取得最優(yōu)效果;在q=10, k=10, r=95時(shí)的BLS預(yù)測(cè)的MSE=0.010706,比pN-BLS略差。對(duì)size3的預(yù)測(cè),取p=1.5, q=10, k=2, r=89時(shí)pN-BLS的MSE=0.000178,而q=9, k=8, r=93時(shí)BLS預(yù)測(cè)結(jié)果的MSE=0.000385。綜合以上,p=1.5時(shí),pNBLS總能達(dá)到一個(gè)很小的MSE。本文提出方法的優(yōu)勢(shì)主要包括3個(gè)方面:(1)特征節(jié)點(diǎn)和增強(qiáng)節(jié)點(diǎn)能有效提取輸入數(shù)據(jù)的特征。(2)BLS能有效通過嶺回歸求解違逆矩陣,防止回歸模型過擬合。(3)p=范數(shù)的引入可有效提升BLS對(duì)抗復(fù)雜噪聲的干擾能力,提高模型的穩(wěn)定性。
理論上,只要設(shè)計(jì)合理的訓(xùn)練目標(biāo)函數(shù),模型的訓(xùn)練時(shí)間足夠長(zhǎng),模型都可以達(dá)到收斂效果。現(xiàn)有的研究為了體現(xiàn)算法的計(jì)算優(yōu)勢(shì),更多關(guān)注模型在訓(xùn)練時(shí)間訓(xùn)練上的優(yōu)勢(shì),而不是預(yù)測(cè)時(shí)間。然而,在注塑產(chǎn)品缺陷檢測(cè)應(yīng)用中,預(yù)測(cè)時(shí)間代表了模型的響應(yīng)速度,預(yù)測(cè)時(shí)間越短表示響應(yīng)越及時(shí),對(duì)工人及時(shí)發(fā)現(xiàn)缺陷產(chǎn)品,及時(shí)調(diào)整機(jī)器參數(shù),降低生產(chǎn)損失有重要的價(jià)值。因此,本文更關(guān)注的是預(yù)測(cè)時(shí)間,選擇每種模型中的最優(yōu)參數(shù),對(duì)比了不同模型在預(yù)測(cè)數(shù)據(jù)集上的時(shí)間表現(xiàn),結(jié)果如表5所示,與其他傳統(tǒng)學(xué)習(xí)方法相比,寬度學(xué)習(xí)方法在響應(yīng)速度上有顯著的優(yōu)勢(shì),特別是pN-BLS (p = 1.5)預(yù)測(cè)速度具有明顯的優(yōu)勢(shì)。主要原因是寬度學(xué)習(xí)的結(jié)構(gòu)優(yōu)勢(shì),通過矩陣計(jì)算的方法,能快速并行計(jì)算的大批量的輸入數(shù)據(jù)并得到預(yù)測(cè)結(jié)果,也說明了寬度學(xué)習(xí)的方法在注塑產(chǎn)品缺陷檢測(cè)中的應(yīng)用具有響應(yīng)速度快的優(yōu)勢(shì)。
表5 預(yù)測(cè)時(shí)間(s)
為了對(duì)比不同方法在實(shí)際的產(chǎn)品缺陷發(fā)現(xiàn)應(yīng)用中的效果,本文設(shè)置SVM, KNN, MLP, BLS和pN-BLS的最優(yōu)參數(shù),預(yù)測(cè)結(jié)果如圖3所示。
圖3中,綠色的線表示真實(shí)的尺寸數(shù)據(jù),藍(lán)色的線表示預(yù)測(cè)結(jié)果。兩條紅色虛線之間的屬于正常尺寸的注塑產(chǎn)品,兩條紅色以外的點(diǎn)表示尺寸不合格。紅色的“●”是真實(shí)數(shù)據(jù)中的不合格尺寸,黑色的“●”點(diǎn)表示預(yù)測(cè)到的不合格尺寸。綠色的“●”和藍(lán)色的“●”分別表示實(shí)際的合格尺寸和預(yù)測(cè)的合格尺寸。從中可以觀察到,BLS和pNBLS都與真實(shí)尺寸的曲線更接近,對(duì)于異常值的發(fā)現(xiàn)更精準(zhǔn)。觀察發(fā)現(xiàn)不同模型對(duì)高于上限的不合格尺寸預(yù)測(cè)比較準(zhǔn)確,對(duì)低于下限的尺寸預(yù)測(cè)要差一些。分析數(shù)據(jù)發(fā)現(xiàn),大部分的不合格尺寸都是超過上限,如3個(gè)尺寸數(shù)據(jù)中,只有size2存在少量的低于下限尺寸的不合格樣本。這種訓(xùn)練數(shù)據(jù)嚴(yán)重不平衡的現(xiàn)象,導(dǎo)致模型容易產(chǎn)生過擬合,影響了預(yù)測(cè)的準(zhǔn)確性。圖3中pN-BLS能更準(zhǔn)確預(yù)測(cè)出部分低于下限的不合格尺寸,說明在引入p范數(shù)后,pN-BLS能有效降低異常值對(duì)模型的影響,這對(duì)實(shí)際注塑產(chǎn)品缺陷檢測(cè)應(yīng)用是非常有價(jià)值的。
圖3 注塑產(chǎn)品異常尺寸預(yù)測(cè)結(jié)果
注塑產(chǎn)品缺陷自動(dòng)檢測(cè)一直以來都是注塑工業(yè)智能化發(fā)展的關(guān)注點(diǎn)。本文提出基于最小p范數(shù)寬度學(xué)習(xí)方法的注塑產(chǎn)品尺寸預(yù)測(cè)方法。首先,對(duì)采集到傳感器高頻數(shù)據(jù)、成型機(jī)狀態(tài)數(shù)據(jù)、機(jī)臺(tái)工藝設(shè)定參數(shù)和產(chǎn)品的3維尺寸進(jìn)行數(shù)據(jù)預(yù)處理,并計(jì)算了衍生特征,采用了相關(guān)系數(shù)矩陣進(jìn)行特征篩選,獲得3個(gè)尺寸對(duì)應(yīng)的最優(yōu)特征,實(shí)現(xiàn)對(duì)采集數(shù)據(jù)的特征選擇與降維。接著,采用pN-BLS模型對(duì)注塑產(chǎn)品的3維尺寸分別進(jìn)行回歸預(yù)測(cè),這種方法的輸入特征與預(yù)測(cè)的目標(biāo)尺寸之間是強(qiáng)相關(guān)的關(guān)系。最后,以SVM, KNN, MLP為基線模型,在第4屆工業(yè)大數(shù)據(jù)創(chuàng)新競(jìng)賽-賽題二注塑成型工藝的虛擬量測(cè)數(shù)據(jù)中,評(píng)估了不同模型參數(shù)對(duì)尺寸預(yù)測(cè)的影響,選擇最優(yōu)效果的參數(shù),進(jìn)行模型的對(duì)比驗(yàn)證,包括預(yù)測(cè)的MSE和預(yù)測(cè)時(shí)間。具體的結(jié)果可總結(jié)如下:
(1)訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集均是8300組。在訓(xùn)練數(shù)據(jù)中訓(xùn)練并評(píng)估獲得每種方法的最優(yōu)參數(shù)后,對(duì)比不同方法預(yù)測(cè)MSE發(fā)現(xiàn),BLS和pNBLS比SVM, KNN, MLP都有明顯的優(yōu)勢(shì)。pN-BLS對(duì)size1, size2和size3的預(yù)測(cè)MSE分別是0.000187(p=1.5, q=10,k=5,r=93),0.008483 (p=1.5, q=6,k=10, r=69)和0.000178 (p=1.5, q =10, k=2,r=89),與其他方法相比均有顯著的優(yōu)勢(shì)。說明了寬度學(xué)習(xí)方法可以有效應(yīng)用到注塑產(chǎn)品尺寸回歸預(yù)測(cè)中,p范數(shù)引入能優(yōu)化BLS在回歸預(yù)測(cè)任務(wù)中的應(yīng)用,能約束異常數(shù)據(jù)對(duì)BLS的影響。同時(shí),在模型預(yù)測(cè)響應(yīng)方面,pN-BLS的響應(yīng)速度最快。
(2)本研究還對(duì)比了不同方法在注塑產(chǎn)品質(zhì)量自動(dòng)檢測(cè)方面的應(yīng)用。結(jié)果發(fā)現(xiàn),BLS和pNBLS的預(yù)測(cè)曲線與實(shí)際的尺寸曲線要比其他方法要更接近。但是相比BLS而言,pN-BLS能更好應(yīng)對(duì)不平衡的訓(xùn)練數(shù)據(jù)的影響,對(duì)少樣本的不合格尺寸的預(yù)測(cè)效果比BLS要好,也說明了引入p范數(shù)可提升模型的魯棒性,這對(duì)注塑產(chǎn)品質(zhì)量異常檢測(cè)很有價(jià)值。
(3)通過特征篩選,最終選擇17個(gè)基礎(chǔ)特征,2個(gè)調(diào)機(jī)參數(shù)特征和4個(gè)衍生參數(shù),其中8個(gè)不同位置溫度傳感器特征,6個(gè)不同壓力傳感器的特征。從特征選擇結(jié)果來看,影響注塑成型產(chǎn)品質(zhì)量最關(guān)鍵的參數(shù)是溫度和壓力。在注塑產(chǎn)品缺陷自動(dòng)檢測(cè)實(shí)際應(yīng)用中,在其他注塑機(jī)上安裝傳感器采集數(shù)據(jù)時(shí),可重點(diǎn)采集溫度和壓力參數(shù),減少其他不必要的傳感器,降低采集成本和數(shù)據(jù)處理成本。當(dāng)注塑機(jī)出現(xiàn)產(chǎn)品缺陷時(shí),也應(yīng)該首先考慮溫度和壓力的設(shè)置問題,這對(duì)快速發(fā)現(xiàn)和解決生產(chǎn)問題是非常有價(jià)值的。