• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于決策樹C4.5算法的制造過程質(zhì)量管理*

      2019-01-03 02:57:46吉衛(wèi)喜宋承軒
      組合機床與自動化加工技術 2018年12期
      關鍵詞:滾刀決策樹產(chǎn)品質(zhì)量

      周 濤,吉衛(wèi)喜,b,宋承軒

      (江南大學 a.機械工程學院;b.江蘇省食品先進制造裝備技術重點實驗室,江蘇 無錫 214122)

      0 引言

      隨著制造業(yè)的發(fā)展,企業(yè)之間的競爭愈加激烈,所以產(chǎn)品質(zhì)量水平成了企業(yè)競爭制勝因素,所以對產(chǎn)品制造過程的質(zhì)量嚴格管理成了保證產(chǎn)成品質(zhì)量的關鍵過程。目前,在制造管理過程常用的質(zhì)量管理方法為統(tǒng)計質(zhì)量控制(SPC),該方法只能通過控制圖反映加工過程產(chǎn)品質(zhì)量波動情況,判斷加工異常,卻并不能反映出具體影響因素[1]。隨著大數(shù)據(jù)的發(fā)展,產(chǎn)品生產(chǎn)過程的大量數(shù)據(jù)被保存下來,其中不乏許多生產(chǎn)過程不可測得卻對產(chǎn)品質(zhì)量有重要影響的工藝質(zhì)量數(shù)據(jù)。如何有效利用這些數(shù)據(jù),從歷史質(zhì)量數(shù)據(jù)中獲得關鍵質(zhì)量信息反饋于生產(chǎn)過程,改善產(chǎn)品質(zhì)量成為近年來的研究熱點,也越來越被企業(yè)決策者所關注。

      本文將研究基于決策樹數(shù)據(jù)挖掘方法的產(chǎn)品制造質(zhì)量管理方法,主要的目標為充分利用生產(chǎn)過程質(zhì)量數(shù)據(jù),建立產(chǎn)品質(zhì)量因素分析模型,挖掘生產(chǎn)過程參數(shù)對產(chǎn)品質(zhì)量的影響,找出隱藏的生產(chǎn)規(guī)律,用于對生產(chǎn)過程的質(zhì)量因素的預測,為質(zhì)量改進和車間調(diào)度提供決策支持。

      1 質(zhì)量分析模型

      采用決策樹算法進行質(zhì)量控制分析主要是對生產(chǎn)中積累的數(shù)據(jù)建立模型,能夠運用模型對產(chǎn)品質(zhì)量歷史數(shù)據(jù)進行統(tǒng)計、挖掘,找出質(zhì)量的影響因素,發(fā)現(xiàn)數(shù)據(jù)中潛藏的規(guī)律并反饋至生產(chǎn)過程,為企業(yè)持續(xù)改進質(zhì)量提供決策支持[2]。

      1.1 C4.5算法簡述

      決策樹分類是數(shù)據(jù)挖掘中監(jiān)督分類技術的一種,是通過一組無次序、無規(guī)則的實例中推理出決策樹表現(xiàn)實行的分類規(guī)則,該分類方法具有較好的通用性,可理解性強,目前已經(jīng)應用于很多分類問題當中,如網(wǎng)絡流量,質(zhì)量評價等[3]。C4.5算法的優(yōu)點是分類準確率高、速度快,而且采用信息增益比例來選擇屬性,避免了ID3算法中用信息增益選擇屬性會出現(xiàn)多值偏向的問題,并能夠完成對連續(xù)屬性離散化的處理,以及對不完整數(shù)據(jù)進行處理[4]。

      C4.5算法是數(shù)據(jù)挖掘的分類算法,因為其具有分類速度快、模型直觀易于理解、適用字符型變量的優(yōu)點,而且篩選不重要因素效果好,準確率較高,所以選用決策樹C4.5算法作為本文制造過程質(zhì)量數(shù)據(jù)挖掘處理方法。

      1.2 質(zhì)量決策樹模型

      設S是訓練樣本集,它包括n個類別的樣本,這些類別分別用C1,C2,……Cn表示,那么S的熵(期望信息)為:

      (1)

      式中,Pi表示類Ci的概率。如果將S中的n類訓練樣本看成n種不同的信息,那么S的熵表示對每一種信息編碼需要的平均比特數(shù),|S|×E(S)就表示對S進行編碼需要的比特數(shù),其中,∣S∣表示S中的樣本數(shù)目。樣本的熵越大,它的概率分布越均衡,樣本集的混雜程度就越高,所以熵是度量訓練集的不純度的,決策樹的分支原則是使劃分后的樣本子集越純越好,即熵越小越好。

      設屬性A將S劃分為m份,根據(jù)A劃分的子集的熵計算方法為:

      (2)

      其中,|Si|/S表示S的第i個子集占總樣本的權重;信息增益用于衡量熵的期望減少值,所以,屬性A對S的劃分獲得的信息增益為:

      G(A)=E(S)-E(A)

      (3)

      G(A)越大,說明選擇的測試屬性A對分類提供的信息越多。

      信息增益是一種衡量最優(yōu)分支屬性的有效函數(shù),但是它傾向于選擇具有大量不同取值的屬性,不能保證帶來良好的預測效果,因此需要新的指標來克服這種偏倚。分割信息量SI(A)可對這種偏倚進行補償,它反映的是屬性A本身的信息量,實際上它將信息增益進行了歸一化,其定義為:

      (4)

      再由式(3)、式(4)得出增益比例GR(A):

      (5)

      增益比例是信息增益與分割信息量的比值。對每個屬性依次計算出信息增益和信息增益比例,然后選取信息增益比例最大的屬性作為樹的根節(jié)點,依次展開根屬性的每一個屬性取值,遞歸形成決策樹。

      1.3 決策樹簡化

      基本的決策樹構造法沒有考慮噪聲,因此生成的決策樹完全與訓練樣本擬合,在有噪聲的情況下,完全擬合將導致過分擬合,即分類模型對訓練數(shù)據(jù)的完全擬合反而使分類模型對現(xiàn)實數(shù)據(jù)的分類預測性能降低[5]。為了使決策樹簡單直觀易于理解,采用后剪枝方法處理基本決策樹。剪枝是一種擬合-化簡的兩階段方法,它允許決策樹過度生長,再根據(jù)一定規(guī)則剪去多余的枝葉。

      2 模型實驗及分析

      本案例的研究數(shù)據(jù)來自某電梯零部件制造公司,以齒輪加工中滾齒加工質(zhì)量問題為案例進行研究。

      2.1 數(shù)據(jù)準備

      由于實際生產(chǎn)多樣、復雜性,導致車間采集到的原始數(shù)據(jù)無法直接使用,為提高決策樹模型的質(zhì)量,需要進行數(shù)據(jù)預處理。首先利用SQL Server2008數(shù)據(jù)庫將相關研究屬性整理到一張可數(shù)據(jù)挖掘用的表(QDM)內(nèi),相關查詢語句如下:

      Insert into QDM

      Select * from Documentinfo a left outer join

      Transmitinfo bOn a.docid=b.docid

      Where department=’質(zhì)量部’

      然后抽取研究對象,并對表QDM進行過濾、去噪處理。

      受數(shù)據(jù)挖掘算法時間和空間復雜度的影響,從采集的滾齒加工齒輪質(zhì)量歷史數(shù)據(jù)中抽取相應的特征屬性,獲得數(shù)據(jù)樣本,包括的特征屬性有:批次號、生產(chǎn)設備、班組、操作員工號、不良現(xiàn)象以及不良現(xiàn)象影響因素。部分數(shù)據(jù)集如表1所示。為基于決策樹的產(chǎn)品質(zhì)量分析提供數(shù)據(jù)支撐。

      表1 部分樣本數(shù)據(jù)

      2.2 決策樹模型建立

      用C4.5算法對抽取的數(shù)據(jù)集進行分類計算以獲得決策樹模型,具體計算過程如下。

      訓練集的目標屬性為缺陷原因,屬性值包括機床磨損、齒坯材質(zhì)、一次切削量、滾刀的選擇、滾刀安裝精度以及滾刀刃磨質(zhì)量。由公式(1),計算缺陷原因的熵值E(缺陷原因)為:

      E(缺陷原因)=2.639658688

      該公司滾齒加工的生產(chǎn)設備有三個型號,分別以Z1,Z2,Z3編號。根據(jù)三種設備在樣本集中的記錄數(shù),求得三種設備的權重分別為0.37、0.33、0.3。由公式(1)分別求出三種設備的信息熵:

      E(Z1)=2.522443772

      E(Z2)=2.594235594

      E(Z3)=2.661074065

      運用式(2)、式(3)可以求出生產(chǎn)設備的熵值和信息增益為:E(生產(chǎn)設備)=0.37E(Z1)+0.33E(Z2)+0.3E(Z3)=2.587724161;G(生產(chǎn)設備)=E(缺陷原因)-E(生產(chǎn)設備)=0.051934527。

      同理可得其他屬性的信息熵為:

      E(班次)=2.587724161

      E(操作員)=2.587724161

      E(缺陷名稱)=2.587724161

      各屬性的信息增益為:

      G(操作員)=0.080171688

      G(班次)=0.042480298

      G(缺陷名稱)=1.457623666

      運用式(4)計算各屬性分割信息量S:

      SI(生產(chǎn)設備)=1.579641206

      SI(操作員)=1.906181896

      SI(班次)=0.924818705

      SI(缺陷名稱)=2.413194108

      運用式(5),由以上求出的信息增益和分割信息量即可求出各屬性的增益比例:

      GR(生產(chǎn)設備)=0.03287742

      GR(操作員)=0.042058782

      GR(班次)=0.045933649

      GR(缺陷名稱)=0.604022553

      由上述計算結果可以看出缺陷名稱屬性的信息增益率明顯大于其他所有的屬性,所以選擇缺陷名稱屬性作為決策樹的根節(jié)點,構造決策樹。

      生成的完全決策樹對樣本分類時會產(chǎn)生“過度擬合”問題,因此必須對它進行化簡。本文通過采用后剪枝策略,從樹的葉子開始剪枝,逐步向根的方向剪,剪枝完成后,得到制造質(zhì)量分類決策樹,如圖1所示。

      圖1 質(zhì)量因素分析決策樹

      2.3 評估

      為了對決策模型有效性進行檢驗,從數(shù)據(jù)庫隨機抽取200條記錄來測試訓練后的模型,得出的混淆矩陣為:

      為了讓模型有效性更直觀,用決策準確率來表示模型的可正確分類概率,計算公式為:

      由混淆矩陣可計算出模型的準確率如表2所示。

      表2 缺陷原因決策準確率

      從表2來看,該模型對測試集數(shù)據(jù)的質(zhì)量因決策準確率達到了86.2%,從實際應用角度看,該模型方法具有良好的性能,可滿足公司決策需求。

      2.4 規(guī)則提取

      從決策樹圖1可以獲取如表3所示的規(guī)則。

      表3 決策樹提取規(guī)則

      在制造過程產(chǎn)品缺陷形成的因素涉及多方面,表面上難以分析,而基于數(shù)據(jù)挖掘決策樹提取的規(guī)則可以為質(zhì)量管理和車間決策人員提供一定的質(zhì)量性能控制預測和車間人員設備調(diào)度的參考依據(jù),幫助管理人員發(fā)現(xiàn)產(chǎn)品質(zhì)量問題的潛在原因,幫助企業(yè)持續(xù)改善產(chǎn)品質(zhì)量。例如對于常見的出面出棱的質(zhì)量問題,根據(jù)表中規(guī)則10~13,若是Z1號生產(chǎn)設備,則很大概率是滾刀刃磨不合格;若是在3號設備上生產(chǎn)的,主要原因是滾刀安裝精度有誤差;若是在Z2設備上由工號209或409員工操作,則是因為滾刀質(zhì)量不達標,是員工疏于檢查是否應該換刀,員工專業(yè)技能影響較??;若是員工384或237操作,則質(zhì)量問題是滾刀安裝精度有誤差,則需要對兩個操作員工進行專業(yè)技能培訓來提高一次生產(chǎn)合格率。所以總的來說,對于出現(xiàn)齒面出棱質(zhì)量問題,一要著眼于控制滾刀刃磨質(zhì)量;二要提高操作者專業(yè)技能,保證安裝滾刀時正確操作,保證各項指標;三要對Z1和Z3設備的主軸進行旋轉(zhuǎn)精度復查,修復調(diào)整滾刀主軸軸承,尤其是止推墊片。對于操作員409,其在設備Z2和Z3上工作時出現(xiàn)質(zhì)量問題次數(shù)較多,可能因為其對設備Z2、Z3熟悉度低,在以后的派工過程中,考慮將操作員409優(yōu)先派到設備Z1上工作。

      通過以上對模型和規(guī)則的分析討論,驗證了決策樹模型不只可用于預測質(zhì)量的合格與否,在尋找產(chǎn)品質(zhì)量隱含影響因素和決策質(zhì)量缺陷原因方面同樣可以發(fā)揮作用,所提取的規(guī)則可作為質(zhì)量管理和車間調(diào)度決策依據(jù)。同時,隨著后期對該模型的進一步研究完善以及制造企業(yè)信息化智能化程度的逐步深入,可將決策結果作為知識建立質(zhì)量診斷知識庫,進一步研究產(chǎn)品質(zhì)量影響因素智能診斷方法,為制造業(yè)質(zhì)量管理智能化添磚加瓦。

      3 結論

      本文根據(jù)企業(yè)實際需求,利用車間制造過程積累的質(zhì)量數(shù)據(jù),運用決策樹C4.5算法,分析了影響產(chǎn)品質(zhì)量的主要因素,建立了基于C4.5算法的制造質(zhì)量分析模型,為產(chǎn)品質(zhì)量問題的決策診斷提供了一種可行方案,同時為企業(yè)的產(chǎn)品質(zhì)量的持續(xù)改進和車間調(diào)度決策提供了一定程度的數(shù)據(jù)支持。經(jīng)實際數(shù)據(jù)檢測,該模型所達到的準確率可滿足公司質(zhì)量影響因素決策診斷的需求,所獲得的規(guī)則對生產(chǎn)有一定的指導作用,證明了模型的有效性。

      猜你喜歡
      滾刀決策樹產(chǎn)品質(zhì)量
      產(chǎn)品質(zhì)量監(jiān)督抽查的本質(zhì)與拓展
      超硬翅片滾刀加工在CNC磨床上的實現(xiàn)
      一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
      加強PPE流通領域產(chǎn)品質(zhì)量監(jiān)督
      勞動保護(2019年7期)2019-08-27 00:41:04
      決策樹和隨機森林方法在管理決策中的應用
      電子制作(2018年16期)2018-09-26 03:27:06
      “望聞問切”在產(chǎn)品質(zhì)量鑒定工作中的應用
      不同地應力下TBM盤形滾刀破巖特性
      滾刀式剪草機傳動方式的現(xiàn)狀和發(fā)展前景
      產(chǎn)品質(zhì)量好 認證不能少
      基于決策樹的出租車乘客出行目的識別
      石台县| 祥云县| 桐梓县| 烟台市| 阿克陶县| 灯塔市| 德阳市| 广州市| 铁岭县| 体育| 贺州市| 吐鲁番市| 巩留县| 凌海市| 洪泽县| 高要市| 五河县| 马公市| 江孜县| 军事| 定边县| 潍坊市| 娱乐| 安平县| 澎湖县| 长顺县| 密山市| 聂荣县| 广灵县| 广安市| 金寨县| 汝城县| 嘉祥县| 铜鼓县| 澎湖县| 岑巩县| 开鲁县| 尖扎县| 杭州市| 武宁县| 丹阳市|