• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于數(shù)學(xué)建模方法的礦石加工質(zhì)量預(yù)測(cè)研究

      2024-11-11 00:00:00周湘輝許凱

      摘要:本文基于數(shù)學(xué)建模方法對(duì)礦石加工質(zhì)量指標(biāo)進(jìn)行了預(yù)測(cè)研究。應(yīng)用兩個(gè)Excel附件數(shù)據(jù)表,將數(shù)據(jù)分為三種情形,運(yùn)用五類模型(線性回歸、隨機(jī)森林、決策樹、XGBoost、GBDT模型)對(duì)相關(guān)數(shù)據(jù)進(jìn)行了不同維度的數(shù)據(jù)預(yù)測(cè).為了得到模型的擬合精度,應(yīng)用了決策系數(shù)法對(duì)五類模型的預(yù)測(cè)效果進(jìn)行了定量分析,最終選擇決策樹與GBDT模型分別對(duì)礦石加工質(zhì)量指標(biāo)與礦石加工合格率進(jìn)行了預(yù)測(cè)研究.本研究通過實(shí)驗(yàn)驗(yàn)證了所提出模型的有效性和可行性,對(duì)于提升工業(yè)生產(chǎn)效率和產(chǎn)品質(zhì)量具有一定的實(shí)際應(yīng)用價(jià)值。

      關(guān)鍵詞:礦石加工;質(zhì)量與合格率;決策樹; GBDT算法

      中圖分類號(hào):O29 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1001-2443(2024)05-0401-06

      引言

      隨著礦產(chǎn)資源的逐漸枯竭和對(duì)高品質(zhì)礦石需求的不斷增長(zhǎng),礦石加工質(zhì)量控制成為礦業(yè)領(lǐng)域亟需解決的重要問題之一。礦石的質(zhì)量直接關(guān)系到后續(xù)冶煉和生產(chǎn)的效益,因此對(duì)礦石加工質(zhì)量進(jìn)行準(zhǔn)確預(yù)測(cè)和控制顯得尤為迫切。

      一般地,礦石加工質(zhì)量控制流程如圖1所示。礦石加工質(zhì)量控制的傳統(tǒng)方法主要依賴于經(jīng)驗(yàn)和試驗(yàn),這種方法在效率和準(zhǔn)確性上存在一定的局限性[1]。隨著數(shù)學(xué)建模技術(shù)與新方法的涌現(xiàn),其在解決實(shí)際問題中的應(yīng)用,逐漸受到各個(gè)領(lǐng)域的重視[2]。本研究旨在利用數(shù)學(xué)建模方法,通過對(duì)礦石樣本的大量數(shù)據(jù)進(jìn)行分析和挖掘,建立一個(gè)高效、精確的礦石加工質(zhì)量預(yù)測(cè)模型。

      在礦石加工質(zhì)量預(yù)測(cè)中,我們采用線性回歸模型、隨機(jī)森林模型、決策樹模型、XGBoost模型[3]以及GBDT模型,結(jié)合大量的實(shí)驗(yàn)數(shù)據(jù),建立一個(gè)多維度、不同影響因素的礦石加工質(zhì)量控制模型。通過該模型,我們能夠更全面、更準(zhǔn)確地了解礦石的特性與質(zhì)量,并提前預(yù)測(cè)加工后的質(zhì)量與礦石加工的合格率,從而可以更好地改進(jìn)與提高礦石加工工藝與相關(guān)流程等,以期為礦業(yè)領(lǐng)域的礦石加工質(zhì)量控制提供新的評(píng)價(jià)方法。

      通過本研究,我們期望能夠?yàn)榈V石加工行業(yè)提供一種基于數(shù)學(xué)建模方法的質(zhì)量控制手段,促進(jìn)礦產(chǎn)資源的可持續(xù)利用和礦業(yè)生產(chǎn)的智能化發(fā)展。

      1 數(shù)據(jù)來源與預(yù)處理

      本文研究的兩個(gè)附件1與附件2的Excel數(shù)據(jù)來源于“2022年第十九屆五一數(shù)學(xué)建模競(jìng)賽”題中的B題。其中附件1中有三個(gè)數(shù)表,第一個(gè)是系統(tǒng)溫度(包含系統(tǒng)I溫度和系統(tǒng)II溫度),第二個(gè)是產(chǎn)品質(zhì)量(包含四列數(shù)據(jù),分別是質(zhì)量指標(biāo)A、B、C、D),第三個(gè)是原礦參數(shù)(包含四列數(shù)據(jù),分別為原礦參數(shù)1、2、3、4)。附件2中的數(shù)據(jù)包含四個(gè)Excel數(shù)據(jù)表,分別是系統(tǒng)溫度、產(chǎn)品質(zhì)量、原礦參數(shù)、過程數(shù)據(jù)。根據(jù)研究的需要,我們應(yīng)用python的pandas庫中的concat、merge、groupby等函數(shù)將附件1與2中的數(shù)據(jù)進(jìn)行了相應(yīng)的合并處理與backfill填充。

      2 方法與模型

      2.1 決策系數(shù)

      我們知道,對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)的方法和數(shù)學(xué)模型有很多,例如回歸模型、灰色模型、神經(jīng)網(wǎng)絡(luò)模型、時(shí)間序列模型等[4]。我們也知道不同模型對(duì)數(shù)據(jù)的預(yù)測(cè)能力并不相同,究竟選擇哪一種模型來做數(shù)據(jù)的預(yù)測(cè)更合理、更準(zhǔn)確呢?注意到,對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè),其評(píng)估預(yù)測(cè)精度與擬合度的函數(shù),即決策系數(shù)公式R2,它能評(píng)估預(yù)測(cè)數(shù)據(jù)與真實(shí)數(shù)據(jù)之間的匹配程度,以此來幫助我們選擇最佳的預(yù)測(cè)模型,R2的數(shù)學(xué)公式如下:

      [R2=1-i=1n(yi-yi)2i=1n(yi-y)2=1-RSSi=1n(yi-y)2],

      其中[yi]表示數(shù)據(jù)真實(shí)值,[yi]表示數(shù)據(jù)的預(yù)測(cè)值,[y]表示數(shù)據(jù)的樣本均值;R2表示預(yù)測(cè)的數(shù)據(jù)與真實(shí)值的擬合度,其值介于0到1之間,若值越接近1,則表示模型所解釋的實(shí)際值越多,即說明該模型的解釋性能越好; RSS表示數(shù)據(jù)的殘差平方和[5]。

      2.2 決策樹模型原理

      決策樹模型簡(jiǎn)單直觀、易于理解和解釋,適用于離散型和連續(xù)型特征,對(duì)異常值和缺失數(shù)據(jù)具有較好的魯棒性[6]。決策樹由節(jié)點(diǎn)和邊組成,其中節(jié)點(diǎn)表示特征或?qū)傩?,邊表示特征的取值。根?jié)點(diǎn)代表最重要的特征,分支節(jié)點(diǎn)代表中間特征,葉節(jié)點(diǎn)代表最終的分類或回歸結(jié)果。決策樹的構(gòu)建包括特征選擇、節(jié)點(diǎn)分裂和停止條件。決策樹模型的最佳特征作為當(dāng)前節(jié)點(diǎn)的判別標(biāo)準(zhǔn),常用的方法包括信息增益、信息增益率、基尼系數(shù)等。該模型在節(jié)點(diǎn)分裂時(shí),算法將數(shù)據(jù)集選定的特征進(jìn)行劃分,生成子節(jié)點(diǎn)。在達(dá)到預(yù)定條件時(shí)停止分裂,其停止的條件可以是樹的深度達(dá)到一定值、節(jié)點(diǎn)中的樣本數(shù)小于閾值等。決策樹模型的核心思想是,在做預(yù)測(cè)問題時(shí),其算法是將輸入特征映射到數(shù)值輸出,即葉節(jié)點(diǎn)就包含預(yù)測(cè)的數(shù)據(jù)。

      2.3 GBDT原理與算法

      梯度提升決策樹(Gradient Boosting Decision Tree,即GBDT),是一種迭代的決策樹算法[7],它通過構(gòu)造一組弱的學(xué)習(xí)樹,并把多棵樹的結(jié)果累加作為最終的預(yù)測(cè)輸出。該算法將決策樹與集成思想進(jìn)行了有效結(jié)合。也就是將梯度提升樹和CART回歸樹結(jié)合起來,其主要思想是每一輪迭代使用一個(gè)新的CART回歸樹來擬合上一輪模型預(yù)測(cè)值與真實(shí)值的殘差。具體來說,是用損失函數(shù)的負(fù)梯度作為殘差近似值,每輪的CART回歸樹擬合這個(gè)殘差近似值。

      在GBDT算法的迭代中,假設(shè)前一輪迭代得到的強(qiáng)學(xué)習(xí)器是[ft-1(x)],損失函數(shù)是[L(y,ft-1(x))]。迭代的目標(biāo)是找到一個(gè)CART回歸樹模型的弱學(xué)習(xí)器[ht(x)],讓本輪的損失:

      [L(y,ft(x))=L(y,ft-1(x)+ht(x))]

      達(dá)到最小。也就是說,本輪迭代找到一個(gè)CART回歸樹,使本輪損失變得更小。由于GBDT選擇了平方損失,則損失函數(shù)可化簡(jiǎn)為:

      [L(y,ft-1(x)+ht(x))=(y-ft-1(x)-ht(x))2 =(r-ht(x))2,]

      其中[r=y-ft-1(x)],是當(dāng)前模型擬合數(shù)據(jù)的殘差。而GDBT算法每輪生成的CART回歸樹就是要擬合這個(gè)殘差。GBDT算法的一般步驟如下:

      (1)初始化[f0(x)=0];

      (2)對(duì)[m=1,2,…,M]及樣本序列數(shù)[i=1,2,…N],計(jì)算殘差

      [rmi=yi-fm-1(x), i=1,2,…N];

      (3)擬合殘差[rmi]中的強(qiáng)學(xué)習(xí)器[fm(x)],其更新如下

      [fm(x)=fm-1+hm(x)] ;

      (4)循環(huán)重復(fù)上面兩步算法,直到損失函數(shù)值小于閾值時(shí)停止,得到梯度提升樹,即[fM(x)=m=1Mhm(x)]。

      3 結(jié)果及其分析

      3.1 礦石加工質(zhì)量的預(yù)測(cè)結(jié)果及其分析

      數(shù)據(jù)表中的附件1有三個(gè)Excel數(shù)據(jù)表,其中溫度數(shù)據(jù)(系統(tǒng)I溫度與系統(tǒng)II溫度)是每隔一分鐘采樣一次溫度數(shù)據(jù),每天有1439個(gè)溫度數(shù)據(jù)值;礦石加工質(zhì)量指標(biāo)數(shù)據(jù)是每隔一小時(shí)采樣一次數(shù)據(jù)值,一天有24個(gè)指標(biāo)數(shù)據(jù)值;原礦參數(shù)是每天采樣一次數(shù)據(jù)值,即一天一個(gè)數(shù)據(jù)值。根據(jù)已有數(shù)據(jù)的特征,我們選取了2022年1月13日至2022年1月22日共計(jì)十天的數(shù)據(jù)來做礦石加工質(zhì)量預(yù)測(cè)。在給定的2022-01-23原礦參數(shù)(附件1)和系統(tǒng)設(shè)定溫度(如表1所示,假設(shè)系統(tǒng)溫度與調(diào)溫指令設(shè)定的溫度相同)下,其目標(biāo)是給出礦石加工產(chǎn)品質(zhì)量指標(biāo)的預(yù)測(cè)結(jié)果。

      由于在所給數(shù)據(jù)中,存在不確定因素的影響,在相同(或相近)的系統(tǒng)溫度下生產(chǎn)出來的礦石產(chǎn)品質(zhì)量可能有較大的差別,且三個(gè)數(shù)據(jù)表的維度不一樣,因此,我們分三種情形來預(yù)測(cè)礦石加工質(zhì)量指標(biāo),然后取這三種情形下的平均值作為最終礦石質(zhì)量指標(biāo)的預(yù)測(cè)值。

      情形1:基于系統(tǒng)I與系統(tǒng)II溫度、原礦參數(shù)為模型輸入變量(即自變量),以礦石加工質(zhì)量指標(biāo)A、B、C、D的每天一小時(shí)采樣數(shù)據(jù)(共計(jì)十天),一共240行數(shù)據(jù),然后進(jìn)行數(shù)據(jù)合并處理,其中,溫度數(shù)據(jù)以礦石質(zhì)量指標(biāo)時(shí)間點(diǎn)進(jìn)行采樣獲取,而原礦參數(shù)的空缺值則以fillback填充方式補(bǔ)齊。我們分別以礦石質(zhì)量指標(biāo)A、B、C、D的數(shù)據(jù)作為模型因變量(被解釋變量)。基于自變量和因變量數(shù)據(jù),對(duì)五個(gè)模型(線性模型、隨機(jī)森林、決策樹、XGBoost、GBDT)進(jìn)行訓(xùn)練,以礦石質(zhì)量指標(biāo)B為例,我們給出了真實(shí)值與預(yù)測(cè)值的對(duì)比圖(部分展示),如圖2所示。從該圖可看出,不同的模型,其預(yù)測(cè)的數(shù)據(jù)值有顯著差距。表2中以系統(tǒng)I溫度、系統(tǒng)II溫度以及原礦參數(shù)為自變量,而以礦石質(zhì)量指標(biāo)B為因變量訓(xùn)練五個(gè)模型得到的模型預(yù)測(cè)擬合度,即模型的決策系數(shù)值。從表2中看出,決策樹模型的擬合度最好,其值為0.9860,而線性回歸模型的擬合度最差,其值為0.1627。 因此,我們采用決策樹模型并訓(xùn)練之后再來預(yù)測(cè)礦石加工質(zhì)量指標(biāo)值。其中,以表1中設(shè)定溫度值以及原礦參數(shù)為自變量,應(yīng)用決策樹模型預(yù)測(cè)得到的礦石質(zhì)量指標(biāo),結(jié)果如表3所示。 把預(yù)測(cè)結(jié)果與以往數(shù)據(jù)對(duì)比可知,其預(yù)測(cè)效果理想。

      情形2:按照每天系統(tǒng)I溫度與系統(tǒng)II溫度每隔一分鐘觀測(cè)到的14229個(gè)樣本值以天(共10天)為單位的平均值溫度(十行數(shù)據(jù))為模型自變量,而以礦石加工質(zhì)量指標(biāo)B的數(shù)據(jù)為模型的因變量,以此來訓(xùn)練模型,得到了相應(yīng)模型對(duì)礦石質(zhì)量指標(biāo)B的預(yù)測(cè)值,方便起見,我們給出了數(shù)據(jù),如圖3所示。

      這五個(gè)模型的預(yù)測(cè)值與真實(shí)值具有一定的差距。為了看出它們對(duì)數(shù)據(jù)的預(yù)測(cè)精度,我們給出了這五個(gè)模型的決策系數(shù)值,如表4所示。從表4看出,其決策樹和GBDT模型的預(yù)測(cè)精度最好,達(dá)到了完全擬合的程度,其值為1,擬合最差的為線性回歸模型,其擬合精度只有0.4126。因此,我們基于表1中的指定兩個(gè)系統(tǒng)溫度值,應(yīng)用決策樹模型預(yù)測(cè)礦石加工質(zhì)量指標(biāo),其結(jié)果如表5所示。其預(yù)測(cè)結(jié)果數(shù)據(jù)對(duì)比以往相應(yīng)數(shù)據(jù)可知,其預(yù)測(cè)效果是理想的。

      情形3:在情形2的基礎(chǔ)上,將模型的自變量修改為系統(tǒng)I與II的溫度及礦石參數(shù)為五個(gè)模型的輸入自變量,而以礦石加工質(zhì)量指標(biāo)B數(shù)據(jù)為模型因變量進(jìn)行模型訓(xùn)練。由訓(xùn)練后的模型,我們得到礦石質(zhì)量指標(biāo)B的預(yù)測(cè)值,其結(jié)果如圖4所示,從該圖可看出,決策樹、XGBoost與GBDT模型所得到的預(yù)測(cè)值幾乎重合。與此同時(shí),我們還給出了模型的擬合精度值,見表6所示,其中擬合精度達(dá)到1的有決策樹和GBDT模型。基于表1中指定系統(tǒng)溫度值,我們應(yīng)用決策樹模型得到了礦石質(zhì)量預(yù)測(cè)值,如表7所示,其預(yù)測(cè)效果良好。

      在上述三種情形下,我們分別得到了在指定系統(tǒng)I和系統(tǒng)II溫度(表1所示)及其它因素影響下的礦石加工質(zhì)量預(yù)測(cè)值.基于表3、5、7,我們求其預(yù)測(cè)值的平均值得到了礦石質(zhì)量指標(biāo)的最終預(yù)測(cè)值,如表8所示。

      4.2 礦石加工質(zhì)量合格率預(yù)測(cè)結(jié)果及其分析

      過程數(shù)據(jù)是在礦石加工過程中檢測(cè)得到的(見圖1),可以反映原礦質(zhì)量.由于同一批次(天)的原礦質(zhì)量有差別,也可能造成在傳入相同或相近調(diào)溫指令后生產(chǎn)出來的產(chǎn)品質(zhì)量有差別。附件2的數(shù)據(jù)給出了該生產(chǎn)車間2022-01-25至2022-04-07的生產(chǎn)加工數(shù)據(jù)及過程數(shù)據(jù).其中表9給出了礦石產(chǎn)品的銷售條件,滿足銷售條件的產(chǎn)品視為合格產(chǎn)品,否則視為不合格產(chǎn)品。

      我們對(duì)數(shù)據(jù)表附件2中的數(shù)據(jù)進(jìn)行預(yù)處理,即選取系統(tǒng)I溫度、系統(tǒng)II溫度、原礦參數(shù)1至4和過程參數(shù)1至4作為GBDT模型輸入的自變量,而以礦石加工質(zhì)量合格率(合格率的計(jì)算公式為:合格率=合格產(chǎn)品數(shù)/產(chǎn)品總數(shù))作為模型因變量進(jìn)行模型訓(xùn)練,以此得到了礦石產(chǎn)品合格率的真實(shí)值與預(yù)測(cè)值的對(duì)比圖5。從圖5可看出,基于GBDT模型預(yù)測(cè)的數(shù)據(jù)和真實(shí)值之間的差距非常小,其擬合精度的決策系數(shù)為0.9919,其預(yù)測(cè)效果優(yōu)良。

      我們基于訓(xùn)練好的GBDT模型來預(yù)測(cè)礦石產(chǎn)品合格率。在給定的時(shí)間2022-04-08與2022-04-09的原礦參數(shù)、過程數(shù)據(jù)(附件2中的數(shù)據(jù))和系統(tǒng)設(shè)定溫度,即表10的第2列和第3列所示,我們應(yīng)用GBDT模型預(yù)測(cè)礦石加工質(zhì)量的合格率分別為0.4815與0.2375,如表10的第4列所示。根據(jù)預(yù)測(cè)值來看,給定兩個(gè)系統(tǒng)的設(shè)定溫度下,其礦石加工質(zhì)量的合格率并不高.這說明選擇好的礦石原料是礦石加工質(zhì)量的保證,而加工方法與工藝技術(shù)的改進(jìn)是提高礦石加工合格率的直接有效的手段。

      5 結(jié)語

      本文通過五個(gè)數(shù)學(xué)模型(線性回歸、隨機(jī)森林、決策樹、XGBoost、GBDT模型)以及決策系數(shù)方法研究了礦石加工質(zhì)量指標(biāo)的預(yù)測(cè)值與合格率問題。通過決策系數(shù)對(duì)模型的擬合精度大小,我們選擇了決策樹模型研究了基于給定系統(tǒng)溫度下的礦石加工質(zhì)量指標(biāo)的預(yù)測(cè)值,以及應(yīng)用GBDT模型對(duì)給定系統(tǒng)溫度下的礦石加工合格率進(jìn)行了預(yù)測(cè)。本文應(yīng)用的預(yù)測(cè)方法與所得結(jié)果,對(duì)實(shí)際應(yīng)用具有一定的參考價(jià)值。

      參考文獻(xiàn):

      [1] 李大潛. 現(xiàn)實(shí)世界的數(shù)學(xué)模型是數(shù)學(xué)的研究對(duì)象——介紹高爾斯《數(shù)學(xué)》[J]. 數(shù)學(xué)建模及其應(yīng)用,2023,12(1): 107-109.

      [2] FARID A, MARAT A, JOSHUA Z, KAMIL K, NAILYA S, WU D. On quantum methods for machine learning problems part I: quantum tools[J]. Big Data Mining and Analytics, 2020, 3: 41-45.

      [3] XIAO M, YIN M M, DING H, GENG X F, SHEN Y J, CHEN L Q. Modeling, analysis, and simulation of X-shape quasi-zero-stiffness-roller vibration isolators[J]. Applied Mathematics and Mechanics, 2022, 43(7): 1027-1044.

      [4] 劉 班. 數(shù)據(jù)挖掘及其Python 實(shí)現(xiàn)技術(shù)研究[J]. 信息通信, 2020, 9(213): 63-65.

      [5] 于曉虹, 徐海燕, 樓文高. 人口預(yù)測(cè)的投影尋蹤自回歸模型構(gòu)建與實(shí)證[J]. 統(tǒng)計(jì)與決策, 2022, 23(611): 38-41.

      [6] 陳春梅, 王正元, 屈娜. 人工智能優(yōu)化算法綜述[J]. 大學(xué), 2020, 26:71-72.

      [7] 劉向麗, 崔文泓. 一種基于決策樹的用于構(gòu)建量化策略的分類器[J]. 純粹數(shù)學(xué)與應(yīng)用數(shù)學(xué), 2023, 39(3): 339-349.

      Research on Quality Prediction of Ore Processing Based on Mathematical Modeling Methods

      ZHOU Xiang-hui, XU Kai

      (School of Mathematics and Statistics, Anhui Normal University, Wuhu 241002,China)

      Abstract: A prediction problem on the quality indicators of ore processing is studied by mathematical modeling methods. Two data tables of Excel attachment are used to divide the data into three types. Five models (linear regression, random forest, decision tree, XGBoost, GBDT model) are used to predict the relevant data from different dimensions. In order to obtain the fitting accuracy of the model, the method of decision coefficient is applied to quantitatively analyze the prediction effect of the five models. Naturally, the decision tree and GBDT models are selected to predict the quality indicators of ore processing and the qualification rate of ore processing, respectively. This study verifies the effectiveness and feasibility of the proposed models via experiments, which has certain practical application value for improving industrial production efficiency and product quality.

      Key words: ore processing; quality and qualification rate; decision tree; GBDT algorithm

      (責(zé)任編輯:馬乃玉)

      彝良县| 黔东| 阿坝| 新邵县| 丰台区| 永新县| 兴义市| 安徽省| 双柏县| 常德市| 寻乌县| 门头沟区| 化德县| 沙田区| 定边县| 邯郸县| 马边| 南安市| 沙河市| 万州区| 盐津县| 大埔县| 治多县| 枣阳市| 方山县| 观塘区| 怀柔区| 哈尔滨市| 江安县| 丰宁| 界首市| 定南县| 贵德县| 江川县| 松阳县| 哈巴河县| 彭阳县| 河南省| 葫芦岛市| 左云县| 麦盖提县|