劉志偉,馬勁紅,陳偉,王文正
(1. 華北理工大學(xué) 冶金與能源學(xué)院,河北 唐山 063210;2. 現(xiàn)代冶金技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,河北 唐山 063210)
Q235鋼的生產(chǎn)需要經(jīng)過熔煉、熱處理、軋制等復(fù)雜的過程,力學(xué)性能往往難以優(yōu)化。傳統(tǒng)的力學(xué)性能優(yōu)化方法是通過結(jié)合理論與經(jīng)驗(yàn)探究軋制、成型等過程中復(fù)雜的物理機(jī)制,設(shè)計(jì)優(yōu)化材料的力學(xué)性能。目前對于金屬材料力學(xué)性能的預(yù)測方法可分為3種[1]:第一種是在實(shí)驗(yàn)設(shè)計(jì)和生產(chǎn)過程中整理出來的經(jīng)驗(yàn)?zāi)P汀4祟惸P屯炔桓?,且只對單一產(chǎn)品有效,泛化能力較差。第二種是變形機(jī)制、成型理論等基礎(chǔ)上開發(fā)的物理模型。此種模型偏理論化,實(shí)際中差異往往較大,需要理想化假設(shè),導(dǎo)致適用范圍過窄。第三種方法是神經(jīng)網(wǎng)絡(luò)智能學(xué)習(xí)算法。神經(jīng)網(wǎng)絡(luò)具有良好的收斂復(fù)雜非線性系統(tǒng)的特點(diǎn),可自發(fā)組織、學(xué)習(xí)及處理[2,3]。
目前,曾有很多學(xué)者對神經(jīng)網(wǎng)絡(luò)模型進(jìn)行改進(jìn)。Govindhasamya等[4]探討了隱含層層數(shù)和激活函數(shù)類型對BP網(wǎng)絡(luò)性能的影響。Shubhabrata等[5,6]將BP神經(jīng)網(wǎng)絡(luò)、模糊邏輯推理與遺傳算法結(jié)合,通過優(yōu)化BP學(xué)習(xí)算法的網(wǎng)絡(luò)結(jié)構(gòu),建立預(yù)測能力更強(qiáng)的神經(jīng)網(wǎng)絡(luò)模型,提高了模型對H型鋼力學(xué)性能的預(yù)測精度[7]。
利用BP神經(jīng)網(wǎng)絡(luò)自身的結(jié)構(gòu)特點(diǎn),研究了BP網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)中的重要因素—隱藏層節(jié)點(diǎn)數(shù)的選取方案。隱含層數(shù)確定后,隱含層上的神經(jīng)元會影響性能。如果神經(jīng)元數(shù)量過少,網(wǎng)絡(luò)難以達(dá)到預(yù)期訓(xùn)練結(jié)果,就會產(chǎn)生較大誤差。如果隱含層的神經(jīng)元太多,雖然網(wǎng)絡(luò)可以很好地學(xué)習(xí)并達(dá)到預(yù)期的精度,但它會產(chǎn)生過擬合并降低 BP 神經(jīng)網(wǎng)絡(luò)的泛化能力[8]。因此,已經(jīng)確定隱含層的神經(jīng)元數(shù)量后,目標(biāo)是讓網(wǎng)絡(luò)不僅能夠達(dá)到預(yù)期的效果,在增大誤差精度同時(shí)也具有較高的泛化性?;谀充撹F公司Q235鋼生產(chǎn)數(shù)據(jù)建立BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型,提出BP網(wǎng)絡(luò)隱含層節(jié)點(diǎn)數(shù)的選取方法。討論隱含層節(jié)點(diǎn)數(shù)與模型之間的規(guī)律,從訓(xùn)練步數(shù)和預(yù)測精度2個(gè)角度分析了最優(yōu)的隱含層節(jié)點(diǎn)數(shù)選取過程,并利用實(shí)際生產(chǎn)數(shù)據(jù)進(jìn)行驗(yàn)證和泛化能力測試。
與生物學(xué)習(xí)類似,利用BP網(wǎng)絡(luò)預(yù)測時(shí),同樣存在訓(xùn)練過程,使模型經(jīng)訓(xùn)練后具備預(yù)測能力。神經(jīng)網(wǎng)絡(luò)類似于具有生物神經(jīng)元的節(jié)點(diǎn)或神經(jīng)元的網(wǎng)絡(luò)。節(jié)點(diǎn)與加權(quán)相互連接且可調(diào)節(jié),因此神經(jīng)網(wǎng)絡(luò)具有良好的非線性映射能力。利用某鋼鐵實(shí)際生產(chǎn)數(shù)據(jù)集進(jìn)行網(wǎng)絡(luò)訓(xùn)練,擬合出此種加工工藝下合金元素和力學(xué)性能之間的關(guān)系。
BP網(wǎng)絡(luò)訓(xùn)練過程一般分為前饋和反饋2個(gè)過程。輸入層m個(gè)變量后,前饋到隱含層和輸出層。輸入層與隱含層、隱含層與輸出層均由權(quán)值和閾值連接。xi(i=1,2…,m)表示任一輸入量,隱含層有s個(gè)神經(jīng)元,yi(j=1,2…,s)表示隱含層的輸出量。則神經(jīng)網(wǎng)絡(luò)正向傳播過程可表示為[10-15]:
(1)
(2)
式中:激活函數(shù)為f;ω和v表示權(quán)值;γ和θ表示閾值;zk表示網(wǎng)絡(luò)的輸出量;輸出層有n個(gè)神經(jīng)元。式(1)和式(2)完成了xi(i=1,2…,m)到zk(k=1,2…,n)的映射,則誤差可表示為式(3):
(3)
式中:Mk(k=1,2…,n)表示輸出目標(biāo)值;δ為誤差。將公式(3)作為目標(biāo)函數(shù),誤差反饋傳播使目標(biāo)函數(shù)最小化。利用誤差對隱含層和輸出層之間的權(quán)重進(jìn)行反饋調(diào)整分別為:
(4)
(5)
式中:η為學(xué)習(xí)率;v'和θ'為調(diào)整后的權(quán)重。對于輸入層和輸出層之前權(quán)重ω和γ,同理可調(diào)整為ω'和閾值γ':
(6)
(7)
用于訓(xùn)練BP網(wǎng)絡(luò)模型的數(shù)據(jù)庫來自某鋼鐵公司100組實(shí)際生產(chǎn)的Q235鋼連續(xù)數(shù)據(jù)如表1所示,其中包括合金成分(C、Si、Mn、P、S、V、Nb、Ti、Cr、Ni、Cu、Sn、Mo、B)、碳當(dāng)量(CE)、屈服強(qiáng)度(YS)、抗拉強(qiáng)度(UTS)、延伸率(EL)。將100組數(shù)據(jù)分為3組:其中70組作為訓(xùn)練集,15組作為測試集,15組作為泛化能力驗(yàn)證集。
表1 某鋼鐵公司實(shí)際Q235生產(chǎn)數(shù)據(jù)
依據(jù)BP網(wǎng)絡(luò)的基本原理,建立一個(gè)輸入層、隱含層和輸出層構(gòu)成的3層BP網(wǎng)絡(luò)預(yù)測模型。依照表1,輸入變量為合金元素種類(C、Si、Mn、P、S、V、Nb、Ti、Cr、Ni、Cu、Sn、Mo、B)和碳當(dāng)量,輸出變量為3種力學(xué)性能指標(biāo)(屈服強(qiáng)度(YS)、抗拉強(qiáng)度(UTS)、延伸率(EL),因此將BP網(wǎng)絡(luò)輸入層和輸出層節(jié)點(diǎn)數(shù)分別確定為15和3,隱含層和輸出層的激活函數(shù)默認(rèn)為型函數(shù)(Tansig)和線性傳遞函數(shù)(Purelin)。以往的隱含層節(jié)點(diǎn)數(shù)確定方法:第一種是根據(jù)經(jīng)驗(yàn)確定節(jié)點(diǎn)數(shù)(Empirical method),如輸入神經(jīng)元個(gè)數(shù)與輸出神經(jīng)元個(gè)數(shù)之和的一半,即(m+n)/2;第二種為修剪法(Pruning method),初始建立足夠多的節(jié)點(diǎn)數(shù),在訓(xùn)練過程中,根據(jù)節(jié)點(diǎn)數(shù)的相關(guān)程度,刪除重復(fù)的節(jié)點(diǎn),此方案工作量巨大,該研究不采取此方法。因神經(jīng)網(wǎng)絡(luò)的訓(xùn)練精度不僅與網(wǎng)絡(luò)結(jié)構(gòu)相關(guān),同時(shí)與輸入的樣本數(shù)量息息相關(guān),因此提出利用樣本數(shù)量和修正系數(shù)對第一種經(jīng)驗(yàn)方法進(jìn)行修正,即公式(8):
(8)
式中:α為修正系數(shù)取0.1~0.5;Q為訓(xùn)練集樣本數(shù)70個(gè);m為輸出神經(jīng)元個(gè)數(shù);n為輸出神經(jīng)元個(gè)數(shù)。
從BP網(wǎng)絡(luò)自身特點(diǎn)及預(yù)測效果兩方面出發(fā),且由樣本的平均絕對百分比誤差(MAPE)來表示模型訓(xùn)練的精度,采用如下公式:
(9)
式(9)中,Q為測試集樣本數(shù)420個(gè);Xtest為測試集樣本;Xsim為輸出結(jié)果。當(dāng)MAPE值越小時(shí),說明模型精度越高;當(dāng)訓(xùn)練步數(shù)越小,說明模型訓(xùn)練效率越高。訓(xùn)練總次數(shù)即為網(wǎng)絡(luò)收斂到設(shè)定誤差時(shí)運(yùn)行的總步數(shù)(Epochs);相同訓(xùn)練次數(shù)下測試樣本的均方誤差值反映了測試集樣本預(yù)測值與目標(biāo)值的偏差。2個(gè)指標(biāo)反映了神經(jīng)網(wǎng)絡(luò)模型的性能,訓(xùn)練總次數(shù)小,說明模型運(yùn)行的時(shí)間越短、效率高;相同訓(xùn)練次數(shù)下測試樣本的均方誤差值小,說明模型的預(yù)測精度高。由此可制定如表2所示的實(shí)驗(yàn)對比方案:
表2 隱含層節(jié)點(diǎn)數(shù)的選取
圖1所示為修正系數(shù)的確定過程。根據(jù)測定,測試集輸出力學(xué)性能均在α為0.2時(shí),MAPE值最低,模型精度最高,對應(yīng)的隱含層節(jié)點(diǎn)數(shù)為12。根據(jù)圖1可知,模型的訓(xùn)練步數(shù)隨著α增大,呈現(xiàn)先下降再升高的趨勢。當(dāng)α為0.2、隱含層節(jié)點(diǎn)數(shù)為12時(shí),模型的訓(xùn)練步數(shù)最少,訓(xùn)練速度最快,訓(xùn)練步數(shù)為110步。
圖1 訓(xùn)練步數(shù)與α的關(guān)系
泛化能力是指機(jī)器學(xué)習(xí)算法對新樣本的適應(yīng)能力,適應(yīng)隱含在數(shù)據(jù)背后的規(guī)律,對具有同一規(guī)律的學(xué)習(xí)集以外的數(shù)據(jù),經(jīng)過訓(xùn)練的網(wǎng)絡(luò)也能給出合適的輸出,該能力稱為泛化能力。
通常情況下,通過測試MAPE值來評價(jià)機(jī)器學(xué)習(xí)方法的泛化能力。并非訓(xùn)練的次數(shù)越多越能得到正確的輸入輸出映射關(guān)系,網(wǎng)絡(luò)的性能還需用其泛化能力來衡量。利用剩余的15組數(shù)據(jù)進(jìn)行泛化能力測試,如圖2所示。
圖2 泛化能力測試過程中訓(xùn)練步數(shù)與α的關(guān)系
根據(jù)測定,當(dāng)α為0.2時(shí),MAPE值分別為6.5%、15.1%、11.2%,模型針對抗拉強(qiáng)度、屈服強(qiáng)度、延伸率3個(gè)指標(biāo)的預(yù)測精度仍然較高,達(dá)到最佳效果,且訓(xùn)練步數(shù)最少為116。表明該模型對同一來源的新數(shù)據(jù)也具有一定的準(zhǔn)確性和適用性。隱含層節(jié)點(diǎn)數(shù)的選取過程中,利用α因子作為指導(dǎo)可相對更快速地找到最優(yōu)值。
北京科技大學(xué)管克智、周紀(jì)華[16]利用高速變形凸輪試驗(yàn)機(jī)對多種鋼材進(jìn)行了高溫、高速變形抗力試驗(yàn),建立了常用的熱軋變形抗力結(jié)構(gòu)模型,如公式(10)所示。為了使變形抗力模型適應(yīng)計(jì)算機(jī)控制的要求,對鋼種數(shù)據(jù)進(jìn)行非線性回歸分析,得到如表3所示Q235鋼的回歸系數(shù)。
表3 Q235鋼變形抗力模型回歸系數(shù)
(10)
計(jì)算變形抗力,先在Excel表格中輸入?yún)?shù)變量數(shù)值,然后運(yùn)行MATLAB程序語言。最后系統(tǒng)自動計(jì)算出相應(yīng)的變形抗力結(jié)果,保存到指定位置。
部分代碼如下:
%% 變形抗力計(jì)算
%% 基本參數(shù)設(shè)定
H=xlsread('data.xlsx', 1, 'A2:A10000');
% sigma
x=x0.*exp(b1.*T+b2).*power((rp/10),(b.*T+b4)).*b6.*power((r/0.4),b5)-(b6-1).*r/0.4;
%% 寫入excel
%% 輸出結(jié)果
xlswrite('data.xlsx',x,1,s);
(1)在BP網(wǎng)絡(luò)模型中,隱含層節(jié)點(diǎn)數(shù)的選擇會對預(yù)測結(jié)果產(chǎn)生重要影響。從模型的效率和精度角度考慮,輸出3個(gè)力學(xué)性能指標(biāo)均在α為0.2時(shí),MAPE值最低,模型精度最高,對應(yīng)的隱含層節(jié)點(diǎn)數(shù)為12。BP網(wǎng)絡(luò)的效率最高,精度最高,模型的訓(xùn)練步數(shù)也最少,訓(xùn)練速度最快,訓(xùn)練步數(shù)為110步。
(2)通過泛化能力測試進(jìn)一步驗(yàn)證了此隱含層節(jié)點(diǎn)數(shù)下的BP網(wǎng)絡(luò)預(yù)測能力極佳。其中,抗拉強(qiáng)度、屈服強(qiáng)度、延伸率3個(gè)指標(biāo)的預(yù)測精度仍然較高,當(dāng)α為0.2時(shí),MAPE值分別為6.5%、15.1%、11.2%,達(dá)到最佳效果,且訓(xùn)練步數(shù)最少為116步。
(3)利用數(shù)學(xué)模型,MATLAB程序?qū)235鋼的變形抗力進(jìn)行了預(yù)測,為生產(chǎn)實(shí)踐提供新的方法。