梁志宇,王宏志,李建中,高宏
?
制造業(yè)中的大數(shù)據(jù)分析技術應用研究綜述
梁志宇,王宏志,李建中,高宏
(哈爾濱工業(yè)大學 計算機科學與技術學院,黑龍江 哈爾濱 150001)
信息技術的普及使制造業(yè)中積累了大量與生產、管理和運營相關的數(shù)據(jù),這些數(shù)據(jù)中隱藏著諸多有價值的知識,可以指導企業(yè)優(yōu)化管理流程、改進生產工藝、調整加工參數(shù)、診斷設備故障等,幫助制造業(yè)企業(yè)提高效率、降低成本,達到利潤最大化,并為實現(xiàn)智能制造打下基礎。然而,當前制造業(yè)中存在著數(shù)據(jù)量大、數(shù)據(jù)利用率低的矛盾,許多場景中的數(shù)據(jù)規(guī)模甚至已經超出傳統(tǒng)數(shù)據(jù)分析方法所能承受的極限。因此,越來越多的研究者致力于研究大數(shù)據(jù)分析在制造業(yè)中的應用,旨在通過大數(shù)據(jù)分析技術發(fā)掘蘊含在數(shù)據(jù)中的寶貴知識和財富。介紹了制造業(yè)大數(shù)據(jù)的概念和特征,討論了制造業(yè)大數(shù)據(jù)及其分析的特點和挑戰(zhàn),并從制造業(yè)產業(yè)鏈流程的角度出發(fā),將制造業(yè)概括為設計、生產、采購、銷售和售后五個階段,分別闡釋了每個階段的典型業(yè)務場景及需求,總結了大數(shù)據(jù)分析模型在這些業(yè)務場景中的應用方面的研究進展。最后,對大數(shù)據(jù)分析在制造業(yè)中的應用現(xiàn)狀做出了分析和評價,并討論了其中存在的問題和不足。
大數(shù)據(jù);制造業(yè);數(shù)據(jù)挖掘;工業(yè)流程;智能制造
制造業(yè)大數(shù)據(jù)是指在制造業(yè)領域中所產生的大數(shù)據(jù)。伴隨著工業(yè)自動化和信息化發(fā)展,信息技術滲透到了制造業(yè)產業(yè)鏈的各個環(huán)節(jié),條形碼、二維碼、RFID、工業(yè)傳感器、自動控制系統(tǒng)、ERP、CAX等技術在制造業(yè)中得到了廣泛的應用?;ヂ?lián)網、移動互聯(lián)網、物聯(lián)網等新一代信息技術與制造業(yè)的融合,使制造業(yè)各個環(huán)節(jié)產生的數(shù)據(jù)都可以被快速收集、存儲到信息系統(tǒng)中。隨著企業(yè)規(guī)模的擴大以及時間的積累,這些數(shù)據(jù)以空前的速度增長,使制造業(yè)進入“大數(shù)據(jù)時代”。例如,長虹集團有限公司等離子顯示板制造中,生產流程數(shù)據(jù)超過10000個參數(shù),每天產生3000萬條記錄,約10 GB[1];GE能源監(jiān)測和診斷中心每天從客戶收集10 G字節(jié)的數(shù)據(jù)[2]。在這些不斷產生和積累的海量數(shù)據(jù)中蘊含著大量有價值的潛在信息[3]。運用統(tǒng)計、機器學習、數(shù)據(jù)挖掘等大數(shù)據(jù)分析方法對制造業(yè)產生的數(shù)據(jù)進行分析,發(fā)掘其中蘊含的知識和規(guī)則[4],并基于這些知識和規(guī)則指導制造業(yè)的研發(fā)設計、生產制造、銷售售后、經營管理等過程,有助于改進生產方式、優(yōu)化管理流程、感知客戶需求、提升品牌價值,達到節(jié)約成本、提高效率、降低能耗的目的,使制造業(yè)逐步走向智能化[5]。
制造業(yè)大數(shù)據(jù)除了具有大數(shù)據(jù)共有的“5V”(即Volume、Velocity、Varity、Value和Veracity)特性[6],還具有諸多與制造業(yè)產業(yè)特性相關的特征,概括如下:
(1)數(shù)據(jù)來源多樣。由于制造業(yè)門類眾多,企業(yè)的大數(shù)據(jù)來自產品設計軟件、生產裝備運行過程、產品質量監(jiān)測設備、企業(yè)管理信息系統(tǒng)、供應鏈與銷售網絡等多種數(shù)據(jù)源。另一方面,由于制造業(yè)企業(yè)自動化程度不一致,大量中小企業(yè)未達到全自動化水平,存在人機協(xié)同工作,因此制造業(yè)中的大數(shù)據(jù)既有機器產生的數(shù)據(jù)(如實時感知數(shù)據(jù)),也有人工輸入的數(shù)據(jù)(如企業(yè)管理數(shù)據(jù)、供應鏈數(shù)據(jù))。大量自治數(shù)據(jù)源中存在數(shù)據(jù)不一致和沖突,加之制造過程復雜、數(shù)據(jù)量大、更新速度快,因而制造業(yè)中的數(shù)據(jù)產生錯誤的概率更大。
(2)數(shù)據(jù)質量低。由于制造業(yè)流程中各工序環(huán)境復雜,收集數(shù)據(jù)的傳感器或傳遞信息的無線網絡都有可能出錯而導致收集到的數(shù)據(jù)中存在較一般大數(shù)據(jù)中更多的噪音或缺失。
(3)數(shù)據(jù)蘊含信息復雜,耦合性不確定。由于制造業(yè)企業(yè)信息化水平參差不齊,以及不同行業(yè)生產過程的特性差異,生產環(huán)節(jié)各步驟之間可能存在不同程度的耦合,因此制造業(yè)中數(shù)據(jù)之間的關聯(lián)和相互影響較為普遍[3]。
(4)數(shù)據(jù)實時性高。生產線監(jiān)測數(shù)據(jù)(如設備運行狀態(tài)監(jiān)測數(shù)據(jù)和各工序生產狀況監(jiān)測數(shù)據(jù))等是連續(xù)采樣的時間序列數(shù)據(jù),具有時間標簽和嚴格的先后次序。而工業(yè)系統(tǒng)是典型的實時控制和實時信息處理系統(tǒng),生產線上的諸多環(huán)節(jié)具有嚴格的實時性約束,這決定了制造業(yè)中較大比例的數(shù)據(jù)是實時數(shù)據(jù)。
制造業(yè)大數(shù)據(jù)的特點決定了其分析任務具有如下特點:
(1)分析模型復雜多樣。制造業(yè)大數(shù)據(jù)分析注重特征背后的物理含義以及特征之間關聯(lián)性的機理,從而有效發(fā)現(xiàn)數(shù)據(jù)背后的意義。在制造業(yè)的不同領域,生產制造過程中原材料、工藝流程、產品形態(tài)不同,相應的數(shù)據(jù)類型、格式、規(guī)模上均存在差異,這導致不同的內涵和應用價值,因而制造業(yè)大數(shù)據(jù)的分析與具體領域密切相關,相應的分析模型也復雜多樣。
(2)數(shù)據(jù)質量要求高。數(shù)據(jù)的質量,會直接影響到分析結果的質量。而制造業(yè)對大數(shù)據(jù)分析結果的容錯能力較低。在工業(yè)環(huán)境中,一次失誤可能造成嚴重后果。因此,必須保證制造業(yè)大數(shù)據(jù)的質量。
(3)分析實時性要求高。制造業(yè)大數(shù)據(jù)的一些場景,如電子芯片自動化生產線的實時監(jiān)控和故障預警等,對數(shù)據(jù)處理的實時性要求很高,這些場景需要監(jiān)控數(shù)據(jù)的獲取及處理時間在秒級甚至毫秒級。
綜上所述,目前大數(shù)據(jù)分析在制造業(yè)中的應用面臨著如下挑戰(zhàn):
(1)如何提高數(shù)據(jù)質量;
(2)如何根據(jù)具體領域和應用場景設計合適的分析模型;
(3)如何設計滿足實時性要求的行之有效的分析算法;
(4)如何用大數(shù)據(jù)分析結果指導企業(yè)優(yōu)化管理和生產。
本文主要關注上述挑戰(zhàn)(2)和(3),即制造業(yè)具體領域和業(yè)務場景下的大數(shù)據(jù)分析模型和算法的應用方面的研究進展。制造業(yè)涉及行業(yè)眾多,實際工作場景千差萬別,但廣義上講,所有產品的制造流程都可劃分為設計、生產、采購、銷售和售后五個階段。因此,本文從上述五個階段出發(fā),分別闡述每個階段的主要任務場景和需要,以及大數(shù)據(jù)分析模型在各個場景中的應用方面的研究情況。
制造業(yè)流程中的設計階段在廣義上不僅包括產品本身的功能和外觀設計,還包括加工產品所需的工藝流程設計等。目前,大數(shù)據(jù)分析在設計階段的應用主要體現(xiàn)在工藝流程的參數(shù)優(yōu)化上。此外,在能效優(yōu)化、成本優(yōu)化、工藝標準優(yōu)化及智能設計等方面,大數(shù)據(jù)分析也能起到作用。
在冶金、化工、醫(yī)藥、食品加工等涉及復雜物理化學變化的工藝過程中,產品的質量和產率通常由多個參數(shù)確定,且各個參數(shù)彼此存在耦合關系,確定使產品質量、產率和能耗最優(yōu)化的輸入?yún)?shù)較為困難。傳統(tǒng)上,各個參數(shù)的設置一般都是依據(jù)經驗,或是經過大量的實驗得來,不僅費時費力,且難以找到優(yōu)化參數(shù)。而大數(shù)據(jù)分析方法,如關聯(lián)規(guī)則分析、回歸分析、決策樹、聚類、神經網絡等,可以從大量數(shù)據(jù)中提取出復雜過程隱含的規(guī)則。采用這些方法,建立模型對歷史生產數(shù)據(jù)進行分析,可以幫助找到最優(yōu)化的生產參數(shù),對生產參數(shù)的設計具有重要的參考價值。
文獻[7]中采用關聯(lián)規(guī)則分析并找出了制造過程中化學成分(如碳、錳、磷、硫)含量、出鋼溫度和軋制速度對最后產品的機械性能的影響;文獻[8]運用聚類分析算法對煉鋼廠脫硫數(shù)據(jù)進行分析,得到不同鐵水條件下的脫硫劑消耗情況,以此找到不同鐵水條件下脫硫效果最好的脫硫劑。文獻[9]運用前饋神經網絡和分類決策樹對玻璃鍍膜工藝進行建模,訓練好的模型可以根據(jù)給定參數(shù)預測產品質量,從而幫助企業(yè)快速確定符合預期質量產品的工藝參數(shù)。文獻[10]提出用動態(tài)神經網絡模型,從數(shù)據(jù)中提取發(fā)動機缸蓋機加工參數(shù)、模具狀態(tài)和成品缸蓋燃燒室容積間的關系,指導機加工參數(shù)的選取,以控制燃燒室容積的制造誤差。文獻[11]對批退火工序進行建模,用同一訓練數(shù)據(jù)對線性回歸、回歸分類樹、前饋反向傳播神經網絡三種模型分別進行訓練,驗證可知無需相關冶金和機械方面知識的前饋反向傳播神經網絡反而得出了最為精準的退火工序模型,該模型可根據(jù)當前數(shù)據(jù)預測退火工序的運行情況,專家也可針對該模型找到各參數(shù)的最優(yōu)值,進而改善退火工序。文獻[12]采用前饋人工神經網絡對樹脂中間體生產流程和印刷電路板制造流程中各因素間非線性的因果關系進行建模,模型使相關工作人員更好地認識了流程的運行情況,將明確的因果關系進行量化,進而可以運用這些關系優(yōu)化制造工藝,提升產品質量。
在能耗巨大的工業(yè),如冶金工業(yè)中,節(jié)能減耗可以在很大程度上提高企業(yè)的經濟效益,具有重大的現(xiàn)實意義。
文獻[13]利用關聯(lián)規(guī)則、K聚類和改進的門限法聚類等方法,從大量的煉鋼歷史能耗數(shù)據(jù)中獲取隱含的規(guī)則,指導企業(yè)改進生產參數(shù),降低生產能耗。文獻[14]提出了一種基于車間歷史數(shù)據(jù)的數(shù)控加工工藝參數(shù)自適應能效優(yōu)化方法,用多元統(tǒng)計技術和聚類分析方法對車間歷史數(shù)據(jù)進行分析,得到了工藝參數(shù)與能耗間的影響規(guī)律,再用模糊關聯(lián)規(guī)則算法得到高能效工藝參數(shù)優(yōu)化規(guī)則。
成本分析是設計階段的一項重要內容,在鋼鐵企業(yè)的成本分析中,對其工藝路線中各工序的成本消耗進行分析和控制是企業(yè)成本控制的首要任務。文獻[15]基于抽樣的C4.5決策樹算法從工藝路線中選出對制造成本影響最大的工序,通過對選出的工序進行控制和改進來優(yōu)化整個工藝路線的成本。
在工藝標準優(yōu)化方面,有文獻嘗試用數(shù)據(jù)挖掘的方法優(yōu)化服裝企業(yè)標準工時制定方案,以此提高企業(yè)成本核算和生產加工能力。文獻[16]對服裝企業(yè)標準工時系統(tǒng)的數(shù)據(jù)用決策樹方法進行分類,再用關聯(lián)規(guī)則對每一類數(shù)據(jù)進行分析,得到款式、材料、年齡對實際工時與標準工時差異的影響程度,并以此為依據(jù)對原有標準工時進行優(yōu)化。類似地,文獻[17]基于神經網絡模型預測生產工時,找出影響因素并排序,再用關聯(lián)規(guī)則模型評估導致標準工時不合理的影響因素并進行修正。此外,文獻[18]運用關聯(lián)規(guī)則中的Apriori算法對模具企業(yè)CAPP改模知識庫進行挖掘,較好的解決了模具企業(yè)改模工藝知識的獲取和積累問題。該方法進行工藝設計可提高CAPP智能化程度,提高改模工藝繼承性與重用性、促進改模工藝標準化。
在智能設計方面,文獻[19]用ART1神經網絡對摩托車總體設計方案實例庫進行聚類,再用BP神經網絡記憶聚類結果并根據(jù)設計要求檢索設計方案,提高了摩托車總體方案設計的效率。文獻[20]運用模糊物元的方法將客戶的多維度需求問題進行優(yōu)化,對基本粒子群算法稍作變化,提出了混合式算法,并將其運用在某型號轎車的整體外觀造型設計的客戶需求知識挖掘中。
隨著自動化生產線的廣泛應用,生產過程產生的數(shù)據(jù)都可以被采集和存儲。對這些數(shù)據(jù)進行分析,可以幫助人們對生產過程進行監(jiān)控,以優(yōu)化生產過程、檢測和診斷故障,達到提高效率和產率、降低成本和能耗的目的。
實際生產過程是一個動態(tài)過程,生產線上工藝、設備和環(huán)境都極其復雜,許多未知因素往往都會影響最終產品的質量。為了達到生產任務的要求,常常需要對產品質量進行快速檢測和提前預測,以便及時做出調整。然而,由于生產線的復雜性,檢測或預測產品質量并不容易。許多現(xiàn)有方法,或是準確率較低,或是成本高昂。而諸如回歸、分類、聚類、決策樹、粗糙集、神經網絡等數(shù)據(jù)挖掘和機器學習方法,由于能夠從大量數(shù)據(jù)中發(fā)現(xiàn)規(guī)則,因此能夠在一定程度上提高產品質量的檢測或預測準確率,且實施成本較低。
伸縮探針被用于檢測半導體產品的質量。但由于伸縮探針本身存在使用壽命,若探針老化,則會影響產品檢測結果,帶來經濟損失。文獻[21]基于線性回歸和分類模型對伸縮探針的狀態(tài)進行建模,從而掌握探針的老化程度,減少由于探針自身壽命問題帶來的產品質量檢測錯誤,提高準確率。
傳統(tǒng)的冷軋產品缺陷檢測方法,檢測標準不一,且存在大量漏洞和誤判。文獻[22]使用實際的生產數(shù)據(jù)訓練二分決策樹和多分決策樹,得到了找到產品缺陷的眾多規(guī)則,使企業(yè)可以根據(jù)所得規(guī)則快速準確的檢測生產出的冷軋產品的缺陷,提高了檢測的準確率。
文獻[23]針對印刷電路板中焊錫球缺陷這一質量問題,采用能夠識別個體區(qū)別的粗糙集對其進行數(shù)據(jù)挖掘并得到三個規(guī)則集,分別是存在焊錫球缺陷時的規(guī)則集、不存在焊錫球缺陷時的規(guī)則集和兩種情況皆可能的規(guī)則集,這三個規(guī)則集對不存在焊錫球缺陷的印刷電路板的預測正確率接近100%,對存在焊錫球缺陷的印刷電路板的預測正確率接近50%,整體預測正確率達到97.66%。根據(jù)這些規(guī)則,焊錫球工藝可得到相應的改進,其缺陷也可以及早發(fā)現(xiàn),極大地降低了電路板由于焊錫球缺陷而帶來的損失。
現(xiàn)有的釀酒工序中并沒有什么工具能夠提前檢測出預示著釀酒中存在瑕疵的早期征兆,因此也沒有辦法針對釀酒中出現(xiàn)的征兆進行改進。且釀酒工序環(huán)境復雜,相關數(shù)據(jù)繁多,如某關于釀酒的數(shù)據(jù)庫中即保存有29種數(shù)據(jù)記錄值,包括糖、醇類、有機酸、富氮化合物等。文獻[24]針對上述釀酒數(shù)據(jù)庫采用數(shù)據(jù)挖掘方法,分出訓練數(shù)據(jù)和測試數(shù)據(jù),先采用主成分分析法選出關鍵屬性對訓練數(shù)據(jù)進行降維,然后采用K-means聚類進行數(shù)據(jù)挖掘,獲取模式。利用聚類結果,研究人員得以在釀酒過程中就檢測出其產品質量是否合格,大大減少了由于釀酒出錯帶來的損失。
發(fā)酵是一種生物化學反應,在食品工業(yè)、生物和化學工業(yè)中均有廣泛應用。進行一次發(fā)酵通常需要不短的時間,傳統(tǒng)上發(fā)酵過程經常采用許多高科技手段諸如流動注射分析法、液相色譜法、紅外光譜法、氣相色譜法、質譜分析法等來實時監(jiān)測發(fā)酵過程的情況,以使其發(fā)酵過程始終處于正常范圍。但這些設備對于小型企業(yè)來說都比較昂貴。文獻[25]提出了另一種監(jiān)測發(fā)酵過程的方法,該方法只需用少許廉價的傳感器,獲得發(fā)酵過程中的各相關數(shù)據(jù)諸如PH值、溫度、溶解氧含量等,并對其進行數(shù)據(jù)挖掘,即可實現(xiàn)發(fā)酵過程的實時異常監(jiān)測。數(shù)據(jù)挖掘過程采用文獻[24]中提到的方法,得到具體發(fā)酵過程的模式,以此為依據(jù)實時監(jiān)測發(fā)酵過程的異常,并可根據(jù)特定的異常制定相應解決方案。
在實際生產線上,任何一個小的故障不及時解決,都可能會影響到整個生產系統(tǒng)的正常運行,帶來巨大的經濟損失。因此,快速、準確地進行故障檢測、診斷和預警,一直是制造業(yè)企業(yè)迫切需求。然而,如上所述,生產線是一個復雜的系統(tǒng),整個生產線有數(shù)十道甚至上百道工序,每個工序有多級操作,每步操作又對應不同的機器和設備。對于這樣的復雜系統(tǒng),用傳統(tǒng)方法去定量分析建模,找到異常狀況的影響因素是十分困難的。因此,即使經驗豐富的工程師,在面對一個原因未知的系統(tǒng)或工序故障時,也不能短時間低開銷解決問題。而基于大數(shù)據(jù)的方法,有助于從多種復雜因素中找到造成異常的因素以及相應的規(guī)則,因而對于故障檢測和診斷問題有很好的效果。
文獻[26]提出將聚類分析模型(自組織映射神經網絡和模糊C均值)應用到鋼鐵等冶金行業(yè),分析并找出生產數(shù)據(jù)中的異常點,為進一步發(fā)現(xiàn)生產過程的異常狀況或根據(jù)正確數(shù)據(jù)進行更深層次的分析奠定基礎。文獻[27]通過記錄6個屬性數(shù)據(jù)來描述電機設備的狀態(tài)信息,基于粗糙集思想提取其故障診斷規(guī)則,使得系統(tǒng)能夠通過設備的運行狀態(tài)來實時監(jiān)測其生產狀況,及時檢測出設備故障,保證生產系統(tǒng)的正常運行。文獻[28]就半導體制造業(yè)中的缺陷檢測提出了RMI(Root Cause Machine Identifier)綜合處理程序,其采用關聯(lián)規(guī)則得到預處理后數(shù)據(jù)庫的候選集。由于制造工序中許多間歇出現(xiàn)的問題都是多因素引起的,且因素間非線性的相互作用十分常見,因此RMI將計算出每個候選集的興趣度,并對其進行排序,根據(jù)興趣度高低找到問題根源。憑借RMI,制造過程中出現(xiàn)多種問題都將被立即識別并定位出根源,相關人員得以高效解決相關的機器缺陷,從而極大地提高了產品產量和高質量產品比例。文獻[29]提出了FDC(Fault Detection and Classification)方法,首先采用主成分分析法整理訓練數(shù)據(jù),建立模塊化的神經網絡以進行故障識別;D-S理論則是用于在存在不確定性的情況下(例如多故障產生或故障傳遞)進行故障分類。采用模塊化神經網絡和D-S理論的FDC方法具有在異常出現(xiàn)時快速識別異常,并定位該異常產生的根源部件的能力,使得相關人員能夠快速定位故障部件并采取相應措施解決。文獻[30]就土耳其一家毛毯制造公司的數(shù)據(jù),提出了基于C4.5決策樹算法的數(shù)據(jù)挖掘方案來快速識別定位毛毯制造流程中出現(xiàn)的故障原因,使得相關人員能夠快速精確解決故障,大大提高了毛毯的生產效率。其采用預處理技術提高所收集數(shù)據(jù)的質量,使用關聯(lián)分析找到關鍵屬性集以減少訓練數(shù)據(jù)的維度,最后采用C4.5決策樹算法,共得到101條規(guī)則,其識別故障原因的精準度達到72.811%。
提高生產效率在制造業(yè)生產過程中至關重要。在制造業(yè)中,生產調度是車間管理的核心,合理有效的車間調度是高效率生產的保障。文獻[31]研究了基于大數(shù)據(jù)分析的車間調度問題。對于離散工業(yè),針對靜態(tài)Job Shop調度問題,提出了用決策樹模型提取調度知識的方法,優(yōu)化了調度方案;針對動態(tài)Job Shop調度問題,提出采用遺傳算法獲取優(yōu)化調度方案,再用極限學習機從優(yōu)化調度數(shù)據(jù)中提取新的調度規(guī)則,指導車間調度。對于流程工業(yè)中的單階段多產品批處理調度問題,提出采用遺傳算法結合啟發(fā)式規(guī)則優(yōu)化加工設備分配方案,并用極限學習機預測訂單加工分配序列,實現(xiàn)訂單加工序列的快速確定。
在生產調度方面,決策樹模型受到了廣泛關注。文獻[32]將生產計劃中不同交工期的工單加工順序、不同類型工件分配在同一機器時的加工順序等記錄存儲起來,作為歷史數(shù)據(jù)訓練決策樹模型,模型可根據(jù)實時數(shù)據(jù)為工件安排合適的機器進行加工,使得車間能夠根據(jù)生產狀態(tài)進行實時優(yōu)化調度,充分利用加工資源,達到效率最大化。文獻[33]中也提到這一思想。文獻[34]用決策樹模型對紡紗廠數(shù)據(jù)進行分析,得到了機器細小位置移動次數(shù)和機器效率對停止次數(shù)的影響,以此為依據(jù)調整、檢測機器,提高車間生產效率、加強人員、機器的調配。文獻[35]對于典型機械制造企業(yè)業(yè)務流程中存在的問題,運用ID3決策樹算法,對企業(yè)質量管理信息進行挖掘,建立了處理部門歸屬決策模型,規(guī)范了管理流程,提高了管理效率。
除了保證產品質量、排除設備故障和提高生產效率,對生產過程中的能耗進行實時監(jiān)控,對于制造業(yè)企業(yè)來說也是不可或缺的。如今的企業(yè)能源管理模式較為傳統(tǒng),主要依靠人工管理,系統(tǒng)集成化程度不高,缺少決策支持,能源利用率低。文獻[36]針對煙草企業(yè),建立了企業(yè)能源管理系統(tǒng),集中監(jiān)控了企業(yè)生產中的供水系統(tǒng)、壓縮空氣系統(tǒng)、供配電系統(tǒng)和鍋爐系統(tǒng),并采用線性回歸、殘差灰色和附加動量的前饋神經網絡模型,對企業(yè)的能效進行了監(jiān)控和預測,保證了企業(yè)的用能安全和效率;文獻[37]針對造紙業(yè),將其制造過程中的電耗、氣耗分為四類能耗,對每類能耗先使用偏最小二乘法(PLS)從眾多能源影響因素中選出具有重要影響的因素,然后利用這些因素建立神經網絡模型,實現(xiàn)了對造紙過程各工序能耗的有效預測,為企業(yè)的能源管理控制提供了重要的決策依據(jù)。
采購階段主要涉及的問題是優(yōu)化庫存和節(jié)約成本。
庫存量適當是確保企業(yè)正常連續(xù)生產的必要條件,庫存量過多或多少都會造成不必要的經濟損失。為了減少貨物的積存,省去不必要的庫存開銷,制造業(yè)中產生了按訂單裝配的策略,該策略將產品的裝配操作推遲,直到客戶下了訂單。這樣一來,庫存中的都是產品的組件,可根據(jù)客戶要求進行裝配;而不是已裝配好了的成品,等有需求的客戶購買。該策略從根本上解決了貨物的積存情況,也省去了大量的庫存開銷。但由于按訂單裝配的策略,工廠在得到訂單后才開始進行產品的裝配,因此裝配的時間將直接影響到工廠交貨到客戶的時間。這意味著裝配過程中出現(xiàn)任何耽誤時間的情況(如返工等),都將影響交貨的時間。
文獻[38]針對某有色冶金企業(yè),采用改進的遺傳算法、神經網絡和模糊控制方式完善庫存優(yōu)化系統(tǒng)。文獻[39]采用進化規(guī)劃算法對庫存模型進行優(yōu)化,以提高企業(yè)的經濟效益。文獻[40]關注在后期裝配過程中,裝配順序對產品質量的影響,并采用關聯(lián)規(guī)則方法從歷史數(shù)據(jù)中抽取出11條規(guī)則,經專家整理分析,獲得更加清晰簡潔的規(guī)則和知識。根據(jù)這些規(guī)則,產品在組裝前即可對裝配序列進行優(yōu)化,其成品出現(xiàn)瑕疵品的幾率大大減少。文獻[41]用廣義回歸神經網絡(GRNN)模型對大型制造業(yè)企業(yè)庫存安全水平進行預測,用灰色聚類法對庫存中產品和原材料進行重要性劃分,以幫助企業(yè)控制和優(yōu)化庫存。
備件管理是制造業(yè)設備管理中的重要環(huán)節(jié)。如何運用最少的資金來保證最優(yōu)的備件供應與管理,并不斷提高設備的可靠性、維修性和經濟性是一個重要的課題。周期補充是目前很多企業(yè)普遍采用的備品備件管理模式,訂購量和訂購點是周期補充控制法的兩個基本控制參數(shù)。文獻[42]基于(,)的故障持續(xù)時間分布和生命周期分布模型,提出了一個基于效用的庫存管理模型(,),該模型考慮了技術折舊和資金擠壓所帶來的影響,也克服了供貨周期隨機性導致的缺貨損失、故障率過低導致的庫存冗余維護損失等問題。在機械制造業(yè)中,許多大數(shù)據(jù)分析挖掘模型都有很好的應用。文獻[43]提出了基于主成分分析和支持向量機的模型進行備件需求的預測,獲得了較好的預測精度,預測結果可以作為管理者的決策依據(jù)。文獻[44]用關聯(lián)規(guī)則分析機械制造企業(yè)外購件間的隱含關系,有助于企業(yè)合理制定采購計劃,有效控制采購資金。
成品的庫存量關聯(lián)著產品的生產、銷售等過程。文獻[45]針對服裝企業(yè)庫存管理,通過庫存周轉率、商品保本儲存期、動銷率、高中低檔商品消費能力等數(shù)據(jù),對BP神經網絡模型進行訓練,企業(yè)可以依據(jù)訓練完成的模型預測產品的庫存量,并依據(jù)預測結果安排生產,進而減輕了商品庫存堆積的情況,緩解企業(yè)訂貨瓶頸。
此外,庫存作為供應鏈的一個重要組成,其優(yōu)化過程常常與整個供應鏈密不可分。例如,生產、庫存與配送聯(lián)合優(yōu)化調度問題是供應鏈中的一個復合問題,該問題要涉及供應鏈中制造商以及零售商的生產、庫存、配送及缺貨成本等。文獻[46]提出可以基于大數(shù)據(jù)分析方法,綜合分析生產消耗、采購及銷售情況,找出保證企業(yè)正常生產的原材料合理庫存量,以優(yōu)化原材料庫存;根據(jù)設備使用、維修和保養(yǎng)原始記錄找出關鍵備件磨損規(guī)律,從而預測其壽命,為備件庫存控制提供依據(jù)。在具體的應用中,文獻[47]基于禁忌搜索算法、模擬退火算法優(yōu)化了生產、庫存與配送的聯(lián)合調度問題。文獻[48]提出建立制造業(yè)企業(yè)采購決策支持系統(tǒng),通過關聯(lián)規(guī)則分析產品價格、供應商評價、退貨原因等問題間的關聯(lián)關系,幫助企業(yè)進行采購方案的制定。文獻[49]以汽車產品一個季度的銷量作為數(shù)據(jù)挖掘對象,在建立采購業(yè)務數(shù)據(jù)集市的基礎上,運用ID3決策樹模型進行數(shù)據(jù)挖掘,為采購業(yè)務的管理者在制定采購計劃時提供重要的參考依據(jù)。
制造業(yè)中大量依賴原材料和生產設備,因此制造業(yè)中采購成本在企業(yè)總運行成本中占比很大。例如,煤礦企業(yè)在原煤開采過程中所消耗的材料種類繁多、數(shù)量巨大,材料成本占總成本的20%、直接成本的35%。同時,煤礦材料投入也是最具可控性的項目,通過準確預測材料成本,有效控制材料消耗,可以降低原煤生產成本、提高煤礦企業(yè)的競爭力。文獻[50]運用粒子群(PSO)優(yōu)化算法對支持向量機模型的參數(shù)進行優(yōu)化,構建基于粒子群優(yōu)化的支持向量回歸機(PSO-SVR)煤礦材料成本預測模型對相關煤礦材料的成本進行預測,進而從材料需求計劃和采購計劃的制定、材料成本控制、材料成本管理信息化等方面提出了煤礦材料成本管理的政策建議。文獻[51]提到運用BP神經網絡模型,通過學習制造業(yè)采購數(shù)據(jù)倉庫中的采購歷史數(shù)據(jù),對采購價格進行時間序列的預測,預測結果能夠滿足企業(yè)決策的需要。
降低采購成本、優(yōu)化采購方案的一項重要舉措是合理選擇供應商。文獻[52]提出用關聯(lián)規(guī)則(改進的Apriori算法)方法來解決離散制造企業(yè)零部件供應商選擇問題。文獻[53]建立基于關聯(lián)規(guī)則的裝備制造業(yè)供應商質量評價模型,指導企業(yè)采購時評價和選擇供應商。
在銷售階段,大數(shù)據(jù)分析的應用主要體現(xiàn)在預測產量、銷量、發(fā)現(xiàn)需求和優(yōu)化配送方案上。
制造業(yè)的銷售主體是其制造的產品,產品的產量和銷量影響著整個供應鏈。因此,銷售階段的重要任務之一就是準確、合理地預測產品的產量和銷量。
在產量預測方面,文獻[54]提出了一種基于動態(tài)改進多元線性回歸模型的次年產量預測方法,運用到某航空制造企業(yè)的次年產量預測中,證明了該模型的預測實用性;文獻[55]提出了基于有動量的自適應梯度下降法BP神經網絡模型,并用它對攀枝花市的鋼產量進行預測,實例表明該系統(tǒng)具有使用價值;文獻[56]基于Rough集理論實現(xiàn)了薄膜蒸發(fā)器的產量預測,研究結果找出了對產量影響較大的因素,對產量的預測基本符合實際。
在銷量預測方面,文獻[57]運用BP神經網絡模型,以月份因子(根據(jù)經驗對產品淡旺季的描述)和歷史月銷售量為輸入量對某電機企業(yè)五種產品進行銷量預測,得到了較好的預測結果。文獻[58]采用了滑動平均和指數(shù)平滑法對PVC主型材銷量進行預測,為生產計劃制定、作業(yè)控制、庫存控制等生產管理環(huán)節(jié)提供決策基礎。文獻[59]提出了改進遺傳算法結合Holt-winters的銷售預測模型,并對實際卷煙銷售量進行了預測,預測結果準確率90%以上。文獻[60]用時間序列分析預測流行飾品在不同區(qū)域的未來直銷趨勢,幫助管理人員制定銷售策略,并合理安排生產、采購計劃,提高利潤。
隨著市場經濟的逐漸完善,客戶需求知識的作用越來越大,其中隱藏著消費者對產品的個性化需求以及產品未來的發(fā)展趨勢等信息??蛻粜枨蟮娜諠u多樣化和個性化,要求企業(yè)能夠快速響應市場,在高質量低成本前提下以最短時間開發(fā)客戶需要的產品,制定符合客戶需求的銷售策略。基于大數(shù)據(jù)分析的方法,對海量銷售歷史數(shù)據(jù)進行建模,能夠準確地幫助企業(yè)發(fā)現(xiàn)需求。文獻[61]從卡車制造商的視角出發(fā),將大數(shù)據(jù)分析方法綜合應用到經銷商的客戶價值分析中:用聚類模型進行經銷商細分;用決策樹模型分析經銷商的重要程度;用關聯(lián)規(guī)則分析經銷商訂購車型間的關系以進行品牌推廣;用異常檢測方法分析經銷商流失;用神經網絡模型綜合分析經銷商價值。上述模型在相應場景中的也應用具有一定的通用性。文獻[62]將關聯(lián)規(guī)則算法運用到筆記本電腦BTO(Build to Order)生產計劃中,基于BTO制造的特點,采用了分類、多最小支持和增量挖掘的改進算法,挖掘PC用戶配置選擇的關聯(lián)關系,以此制定生產計劃。文獻[63]提出用關聯(lián)規(guī)則模型挖掘鐘表企業(yè)物料清單(BOM)中的歷史數(shù)據(jù),分析不同零部件組合的產品的客戶認可度和盈利能力,以此為基礎制定營銷策略。文獻[64]以機械制造企業(yè)為背景,運用決策樹技術中的CART算法對企業(yè)已有客戶群數(shù)據(jù)進行分析,得到了企業(yè)忠誠客戶預測模型。該模型可以幫助企業(yè)發(fā)現(xiàn)和培養(yǎng)忠誠客戶。文獻[65]對煙草企業(yè)客戶忠誠度指標構造分類決策樹模型,通過改進的K-means算法,按客戶的價值貢獻度對客戶進行聚類分析,以此劃分了客戶營銷等級。對不同等級客戶制定相應的營銷策略,實現(xiàn)精細化營銷。采用馬爾柯夫預測法實現(xiàn)客戶等級變化預測,并根據(jù)預測結果調整營銷策略。文獻[66]提出基于企業(yè)的客戶盈利能力數(shù)據(jù),用聚類方法預測企業(yè)未來的盈利能力,并將企業(yè)資源有效投入到能為公司帶來更大利潤的客戶上。文獻[67]使用市場值函數(shù)的方法,建立了紅塔集團促銷活動相應模型,預測客戶的市場值并以此為依據(jù)將客戶排序,從而幫助促銷活動策劃人員制定有針對性的促銷方案。
中國的制造業(yè)主要是以產業(yè)集群的形式存在,文獻[68]針對傳統(tǒng)制造業(yè)集群,引入行業(yè)作為控制變量對全部樣本進行回歸分析,發(fā)現(xiàn)集群企業(yè)規(guī)模和創(chuàng)新能力與服務需求之間的關系。
配送是銷售階段乃至整個供應鏈中至關重要的環(huán)節(jié),是企業(yè)競爭中不可或缺的一環(huán)。制造業(yè)的物流系統(tǒng)以射頻識別(ratio frequency identification,RFID)技術為核心。文獻[69]給出配送優(yōu)化的思路:通過路由算法,對一系列特定位置和需求量的客戶點,安排一定數(shù)量的運輸車輛,在特定約束條件下達到配送速度最快、配送成本最低。文獻[70]提出針對RFID產生的海量數(shù)據(jù),基于深度優(yōu)先搜索(DFS)挖掘頻繁路徑,并以此為基礎根據(jù)物品路徑歷史數(shù)據(jù)預測物品達到的下一位置及時間,以輔助企業(yè)進行物流配送管理和優(yōu)化。文獻[71]基于遺傳算法和免疫算法,分析了配送中心選址和配送路徑優(yōu)化的問題,設計了以最小化成本為目的的數(shù)學模型,并以某漁業(yè)企業(yè)的配送優(yōu)化問題證實了研究結果的可用性;文獻[72]針對物流配送優(yōu)化中聚類分析,旅行商問題和車輛路徑問題這三個最基本的子問題,在顧客需求存在性隨機和需求量隨機的背景下,給出各子問題的數(shù)學模型和相應算法,并通過仿真實驗驗證了算法的有效性;文獻[73]對供應鏈中分銷配送優(yōu)化模型及其求解算法展開研究,重點進行了供應鏈多級分銷系統(tǒng)優(yōu)化模型及其多目標混合遺傳算法和物流配送優(yōu)化模型及其多目標遺傳算法兩方面的研究。
售后階段主要為已售商品提供配套的服務,其內容有服務類型識別和產品運行狀態(tài)監(jiān)控等。
服務類型識別在以汽車行業(yè)為代表的消費型產品制造業(yè)中具有舉足輕重的地位。在汽車行業(yè)中,40%~60%的利潤在服務、維修等售后服務領域。傳統(tǒng)的售后服務模式是在客戶遇到問題時主動聯(lián)系企業(yè),企業(yè)被動提供服務,這種模式會使企業(yè)損失許多潛在客戶價值。隨著信息技術的發(fā)展,許多企業(yè)嘗試將信息技術運用到客戶服務中,由此出現(xiàn)了客戶關系管理(CRM)的概念。在CRM中引入大數(shù)據(jù)分析,能夠幫助企業(yè)進行客戶群分析,發(fā)掘潛在客戶,預測流失客戶,細分客戶群,使企業(yè)能夠主動地、有針對性的制定客戶服務策略。文獻[74]提出圍繞客戶細分、客戶支持、交叉營銷、客戶流失預警等方面,采用關聯(lián)規(guī)則、聚類、決策樹、神經網絡等模型,挖掘客戶潛在服務需求,主動為客戶提供相應服務,以創(chuàng)造更大的客戶價值。文獻[75]提出用序列模式挖掘的方法分析汽車用戶的使用、保養(yǎng)與維修情況,找到其中的特殊規(guī)律,實現(xiàn)為汽車用戶提供個性化的服務。文獻[76]提出在制造業(yè)售后服務中用ID3決策樹算法分析客戶評價信息,得到產品指標綜合滿意度結果,為企業(yè)質量功能展開(QFD)的實現(xiàn)奠定基礎。文獻[77]提出在CRM中應用關聯(lián)規(guī)則和序列分析等方法預測客戶行為,用分類和聚類方法進行客戶細分。文獻[78]提出用聚類分析對企業(yè)的客戶群進行細分,以針對不同客戶群制定相應的管理策略。文獻[79]提出在制造業(yè)客戶關系管理(CRM)中引入聚類分析和ID3決策樹算法,對客戶歷史數(shù)據(jù)進行分析,預測潛在流失客戶,以幫助企業(yè)提早采取措施挽留客戶。文獻[80]針對通信設備制造業(yè),用關聯(lián)規(guī)則(FP-growth)分析不同地區(qū)的銷售特征,以預測流失客戶;針對C4.5算法處理大量數(shù)據(jù)時耗時長的問題,提出自適應匹配和交叉驗證的改進方法,并用改進算法判斷會購買增值服務的客戶,以發(fā)掘潛在客戶。
隨著用戶生成內容的大量增長,在線評論成為挖掘客戶對產品和服務的意見的極有價值的來源。然而,大多數(shù)傳統(tǒng)的意見挖掘方法是粗粒度的,不能理解自然語言。文獻[81]提出一種無監(jiān)督的方法,從評論中提取評價表達模式(AEP),它代表了人們對產品或服務表達意見的方式,并且可以被視為方面和情感詞之間的句法關系的精簡表示。設計基于AEP的潛在狄利克雷分配模型(AEP-LDA),用于層面和情緒詞的識別。
如今與Web交互的主要方式是通過瀏覽器通過以人類可讀的方式呈現(xiàn)信息來操縱信息。然而,向Web上的許多進程的自動化的演進可能導致計算機到計算機的交互在當前的人到計算機交互中變得占優(yōu)勢。文獻[82]提出基于規(guī)劃的服務組合算法,其與潛在的大規(guī)模服務廣告目錄動態(tài)交互,以便用戶按需檢索匹配的服務廣告。
對產品的運行狀態(tài)進行監(jiān)控,可以幫助企業(yè)掌握產品的運行狀態(tài),及時發(fā)現(xiàn)問題,以便快速制定有針對性的服務策略。文獻[83]將聚類算法和關聯(lián)規(guī)則算法相結合,實現(xiàn)依據(jù)大量數(shù)據(jù)對挖掘機故障關聯(lián)關系的概率預測,從而進行有效地預防,并為生產商提供數(shù)據(jù)支持;文獻[84]采用基于邏輯數(shù)據(jù)倉庫的數(shù)據(jù)挖掘模式,運用BP神經網絡、K-means聚類分析算法和FP-Growth關聯(lián)規(guī)則算法對汽車售后的潛在故障進行分析;文獻[85]將維護工人在進行提升機各個系統(tǒng)維護行為之前的監(jiān)控數(shù)據(jù)進行刪減和去噪,用所得數(shù)據(jù)訓練C4.5決策樹模型,表征故障隱患;文獻[86]基于模糊神經網絡的智能診斷算法,根據(jù)實時獲取的工程起重車運行參數(shù),實現(xiàn)對起重車遠程實時故障診斷。
隨著設備故障復雜程度的不斷加深,具有隱蔽性、突發(fā)性、誘因多、復雜性和不確定性等特征的隱形故障成為復雜設備突發(fā)故障的主要誘因。文獻[87]采用增量更新算法使Ariori關聯(lián)規(guī)則算法能夠實時快速隨故障數(shù)據(jù)庫的更新而更新,以更好地對設備故障進行在線預警和診斷,然后引入BP神經網絡的方法解決隱形故障這類不確定性因素較多的非線性問題。
本文介紹了制造業(yè)大數(shù)據(jù)的概念,討論了制造業(yè)大數(shù)據(jù)的特點、制造業(yè)大數(shù)據(jù)分析的特點與挑戰(zhàn)。本文按制造業(yè)的通用流程將制造業(yè)劃分為設計、生產、采購、銷售和售后五個環(huán)節(jié),闡述了各個環(huán)節(jié)中主要業(yè)務場景的任務需求,并總結了大數(shù)據(jù)分析模型在這些場景中的應用的研究進展??梢钥吹?,在制造業(yè)的諸多業(yè)務場景中均面臨著復雜的預測、優(yōu)化問題,傳統(tǒng)的人工經驗和統(tǒng)計分析方法解決這些問題的效果有待提高。而大數(shù)據(jù)分析為這些問題的解決提供了新的思路,并取得了較為滿意的實驗結果。
然而,大數(shù)據(jù)技術在制造業(yè)中的應用,還面臨著諸多挑戰(zhàn)。在技術方面,文中涉及的研究成果多處于實驗階段,其實驗數(shù)據(jù)多為人工篩選和審查的高質量數(shù)據(jù),而實際生產環(huán)境中面臨著許多數(shù)據(jù)質量問題。此外,將上述模型和算法部署于實際場景,還需考慮諸多因素,如模型的通用性、靈活性和魯棒性,以及算法的實際性能等;在管理方面,研究者和企業(yè)管理人員還需考慮如何將大數(shù)據(jù)分析方案合理整合到企業(yè)的業(yè)務邏輯中,以使其真正發(fā)揮作用。
[1]Zheng L,Zeng C,Li L,et al. Applying data mining techniques to address critical process optimization needs in advanced manufacturing[C]. ACM SIGKDD International Conference on Knowledge Discovery and Data Mining,2014:1739-1748.
[2]GE Whitebook. The Case for an Industrial Big Data Platform: Laying the Groundwork for the New Industrial Age[EB/OL]. http://gesoftware.com/Industrial_Big_Data_Platform.pdf,2013.
[3]譚軍,余紹軍. 數(shù)據(jù)挖掘在制造業(yè)中的應用[C]. 全國電子信息技術與應用學術會議,2011.
[4]Harding J A,Shahbaz M,Srinivas,et al. Data Mining in Manufacturing: A Review[M]. VDM Verlag Dr. Müller,2006:969-976.
[5]Wang K,Tong S,Eynard B,et al. Review on Application of Data Mining in Product Design and Manufacturing[C]. International Conference on Fuzzy Systems and Knowledge Discovery,2007:613-618.
[6]孟小峰,慈祥. 大數(shù)據(jù)管理:概念、技術與挑戰(zhàn)[J]. 計算機研究與發(fā)展,2013,50(1):146-169.
[7]Cai-Yan L,You-Fa S. Application of Data Mining in Production Quality Management[J]. International Symposium on Intelligent Information Technology Application:2009:284-287.
[8]張玉東. PG煉鋼廠MES系統(tǒng)數(shù)據(jù)挖掘的設計與開發(fā)[D]. 成都:電子科技大學,2011.
[9]Li M,F(xiàn)eng S,Sethi I K,et al. Mining Production Data with Neural Network & CART[C]. IEEE International Conference on Data Mining,2003:731.
[10]駱自超. 基于數(shù)據(jù)挖掘的發(fā)動機缸蓋燃燒室容積制造誤差控制方法研究[D]. 上海:上海交通大學,2014.
[11]Moghimi M,Saraee M H,Bagheri A. Modeling of batch annealing process using data mining techniques for cold rolled steel sheets[C]. IEEE International Conference on Mechatronics,2011:18-22.
[12]Shi X,Schillings P,Boyd D. Applying artificial neural networks and virtual experimental design to quality improvement of two industrial processes[J]. International Journal of Production Research,2004,42(1):101-118.
[13]婁小芳. 基于模式識別和數(shù)據(jù)挖掘的鋁工業(yè)生產節(jié)能降耗研究[D]. 長沙:國防科學技術大學,2010.
[14]肖溱鴿. 基于數(shù)據(jù)分析的數(shù)控加工工藝參數(shù)能效優(yōu)化方法研究[D]. 重慶:重慶大學,2016.
[15]宋旭東,劉曉冰,程曉蘭,et al. 鋼鐵企業(yè)生產成本關鍵工序數(shù)據(jù)挖掘應用研究[J]. 計算機工程與應用,2008(28):184-186,195.
[16]張健. 服裝制造數(shù)據(jù)協(xié)同與輔助決策系統(tǒng)的研究與設計[D]. 蘇州:蘇州大學,2013.
[17]薛百里. 基于數(shù)據(jù)挖掘技術的服裝制造標準工時制定方法研究[D]. 蘇州:蘇州大學,2015.
[18]謝英星. Apriori算法在模具改模工藝信息處理中的應用[J]. 組合機床與自動化加工技術,2008(6):80-83.
[19]李霄林. 面向摩托車智能設計的數(shù)據(jù)挖掘系統(tǒng)研究與應用[D]. 重慶大學,2006.
[20]李冠卿. 基于模糊物元的客戶需求知識挖掘方法研究[D]. 合肥:合肥工業(yè)大學,2013.
[21]Aye T T,Yang F,Wang L,et al. Data driven framework for degraded pogo pin detection in semiconductor manufacturing[C]. Industrial Electronics and Applications,2015.
[22]郭龍波. 基于數(shù)據(jù)挖掘方法的冷軋表面質量缺陷分析[D]. 馬鞍山:安徽工業(yè)大學,2012.
[23]Kusiak A,Kurasek C. Data mining of printed-circuit board defects[J]. IEEE Transactions on Robotics & Automation,2001,17(2):191-196.
[24]Urtubia A,Pérez-Correa J R,Soto A,et al. Using data mining techniques to predict industrial wine problem fermentations[J]. Food Control,2007,18(12):1512-1517.
[25]Fakharudin A S,Embong A,Hamid R A,et al. Optimisation of fermentation process using data mining techniques for small-medium industry[C]. International Conference on Intelligent and Advanced Systems,2007:273-275.
[26]宋輝. 聚類分析系統(tǒng)的設計與實現(xiàn)及在工業(yè)中的應用[D]. 天津:天津科技大學,2004.
[27]辛旭明. 基于過程監(jiān)控的數(shù)據(jù)挖掘系統(tǒng)及其應用[D]. 上海:東華大學,2004.
[28]Chen W C,Tseng S S,Wang C Y. A Novel Manufacturing Defect Detection Method Using Data Mining Approach[C]. Innovations in Applied Artificial Intelligence, International Conference on Industrial and Engineering Applications of Artificial Intelligence and Expert Systems, Iea/aie 2004,Ottawa, Canada,May 17-20, 2004. Proceedings,2004:77-86.
[29]Hong S J,Lim W Y,Cheong T,et al. Fault Detection and Classification in Plasma Etch Equipment for Semiconductor Manufacturing $e$-Diagnostics[J]. IEEE Transactions on Semiconductor Manufacturing,2012,25(1):83-93.
[30]Iflikli C Kahya,Zyirmidokuz E. Implementing a data mining solution for enhancing carpet manufacturing productivity[M]. Elsevier Science Publishers B. V.,2010:783-788.
[31]王成龍. 基于數(shù)據(jù)挖掘技術的生產調度問題研究[D]. 杭州:浙江大學,2015.
[32]于藝浩. 基于數(shù)據(jù)的車間實時調度系統(tǒng)的研究與開發(fā)[D]. 沈陽:沈陽工業(yè)大學,2013.
[33]徐玉婷. MES車間生產調度系統(tǒng)及其數(shù)據(jù)挖掘方法的研究[D]. 南京:南京航空航天大學,2007.
[34]劉娜. 紡織領域中數(shù)據(jù)挖掘技術的應用研究[D]. 大連海事大學, 2004.
[35]魯釗,陳世平. 基于ID3算法的機械制造業(yè)決策應用[J]. 計算機應用,2011(11):3087-3090.
[36]劉立強. 企業(yè)能源管理系統(tǒng)的數(shù)據(jù)整合與處理[D]. 北京交通大學,2014.
[37]吳波. 造紙過程能源管理系統(tǒng)中數(shù)據(jù)挖掘與能耗預測方法的研究[D]. 華南理工大學,2012.
[38]桂衛(wèi)華,黃泰松,朱爽. 智能綜合原料庫存優(yōu)化系統(tǒng)及應用[J]. 中南工業(yè)大學學報(自然科學版),2001(5):536-540.
[39]陳青,吳敏,金可音,等. 一種改進的進化規(guī)劃算法在原料庫存優(yōu)化中的應用[J]. 株洲工學院學報,2005(1):74-76.
[40]Agard B. Data mining for improvement of product quality[J]. International Journal of Production Research,2006,44(18-19):4027-4041.
[41]孫宜然,趙嵩正,徐偉. 面向供應鏈的制造業(yè)庫存決策支持系統(tǒng)的分析與設計[J]. 工業(yè)工程,2006(3):75-79.
[42]張晉豫,楊維,張頂立. 基于效用的備品備件優(yōu)化庫存控制法[J]. 電子學報,2010(11):2708-2712,2714.
[43]姚菲. 制造業(yè)備件庫存管理優(yōu)化體系研究與應用[D]. 北京:北京郵電大學,2014.
[44]張亮. 數(shù)據(jù)挖掘在機械制造業(yè)外購件供應系統(tǒng)的應用[D]. 重慶:重慶大學,2004.
[45]陳承貴. 基于數(shù)據(jù)挖掘技術倉庫管理系統(tǒng)的應用與研究[D]. 成都:電子科技大學,2009.
[46]鐘金宏,黃玲,李興國,等. 鋼鐵制造業(yè)信息化集成方案與優(yōu)化技術研究[J]. 計算機應用研究,2008(8):2305-2308.
[47]周超. 生產庫存配送聯(lián)合優(yōu)化調度方法[D]. 合肥:合肥工業(yè)大學,2015.
[48]周明. 基于數(shù)據(jù)挖掘的制造業(yè)采購DSS理論及方法研究[D]. 天津:天津大學,2009.
[49]郭玲. 信息時代汽車制造業(yè)協(xié)同采購策略研究[D]. 長春:吉林大學,2006.
[50]郝立群. 基于數(shù)據(jù)挖掘的煤礦材料成本預測研究[D]. 徐州:中國礦業(yè)大學,2014.
[51]文小敏,袁清珂,羅小美. ERP決策支持系統(tǒng)中采購數(shù)據(jù)倉庫的構建與應用研究[J]. 現(xiàn)代機械,2005(2):27-29.
[52]王建良,杜元勝,徐建良. 面向離散制造業(yè)數(shù)據(jù)挖掘技術研究與應用[J]. 微計算機信息,2007(33):10-11,21.
[53]宋建聰. 數(shù)據(jù)挖掘在裝備制造業(yè)質量管理中的應用研究[D]. 廣州:廣東工業(yè)大學,2013.
[54]常建濤,仇原鷹,李申,等. 生產計劃與調度中的次年產量預測方法[J]. 計算機集成制造系統(tǒng),2013(7):1648-1654.
[55]周志剛. 灰色系統(tǒng)理論與人工神經網絡融合的時序數(shù)據(jù)挖掘預測技術及應用[D]. 成都:成都理工大學,2006.
[56]華潔,李慶生,尹俠,等. 基于Rough集理論的薄膜蒸發(fā)器產量預測[J]. 南京工業(yè)大學學報(自然科學版),2006(3):94-99.
[57]王鵬鵬,廖小平,鄧建新. ERP環(huán)境下銷售決策支持的研究與實現(xiàn)[J]. 機械設計與制造,2008(5):219-221.
[58]邢海霞. 基于時間序列分析的PVC型材銷售預測研究[D]. 大連交通大學,2010.
[59]劉勝. 基于數(shù)據(jù)挖掘的企業(yè)銷售決策支撐平臺設計[D]. 浙江理工大學,2015.
[60]江小輝,趙建民,朱信忠. 商業(yè)智能在流行飾品制造業(yè)中的應用研究[J]. 信息技術,2008(6):33-35.
[61]李燁. 數(shù)據(jù)挖掘技術在卡車制造商的客戶價值分析應用研究[D]. 柳州:廣西科技大學,2013.
[62]汪奇,黃洪,鄭曉群. 筆記本電腦BTO生產計劃中關聯(lián)規(guī)則挖掘的應用研究[J]. 商場現(xiàn)代化,2007(36):30-31.
[63]黃亦弢. 鐘表供應鏈管理中智能物料表研究[D]. 廣東工業(yè)大學,2006.
[64]劉菲. 基于決策樹技術的忠誠客戶挖掘研究[D]. 葫蘆島:遼寧工程技術大學,2009.
[65]陳力. 大數(shù)據(jù)環(huán)境下集團企業(yè)的精細化營銷體系設計方法與實現(xiàn)[D]. 杭州:浙江理工大學,2016.
[66]阮志林. 基于大批量定制模式的管理信息系統(tǒng)的研究及其應用[D]. 長沙:國防科學技術大學,2005.
[67]王海飛. 基于Hadoop云的數(shù)據(jù)庫營銷海量數(shù)據(jù)處理與挖掘的研究[D]. 杭州:浙江理工大學,2013.
[68]梁琦,陸劍寶. 傳統(tǒng)制造業(yè)集群的生產性服務需求——廣東、山西兩地4個制造業(yè)集群樣本的考察[J]. 管理評論,2014(11):169-181.
[69]任榮. 企業(yè)第三方物流信息系統(tǒng)關鍵技術及數(shù)據(jù)挖掘關鍵算法研究[J]. 電子商務,2012(11):52-53.
[70]趙利. 基于RFID中間件的海量數(shù)據(jù)集成技術及其在現(xiàn)代物流決策分析中應用研究[D]. 揚州:揚州大學,2012.
[71]劉淼. 供應鏈環(huán)境下配送優(yōu)化問題研究[D]. 大連:大連海事大學,2013.
[72]曾華. 隨機顧客和需求的配送優(yōu)化[D]. 濟南:山東大學,2012.
[73]李勇. 供應鏈中分銷配送優(yōu)化模型及算法研究[D]. 重慶:重慶大學,2005.
[74]石慧. 基于汽車服務業(yè)的服務挖掘[J]. 上海汽車,2007(7):28-30.
[75]蔣渝. 基于XML的汽車售后服務信息的數(shù)據(jù)挖掘模型[D]. 重慶:重慶大學,2003.
[76]沈小淦. 制造業(yè)售后服務系統(tǒng)的研究與開發(fā)[D]. 西安:西安電子科技大學,2012.
[77]賈玉鋒,胡迎新. 數(shù)據(jù)挖掘在客戶關系管理中的應用研究[J]. 石家莊鐵道學院學報(社會科學版),2009(2):31-34.
[78]郭鵬. 數(shù)據(jù)挖掘在市場營銷中的應用研究[D]. 武漢:武漢理工大學,2004.
[79]陳思行,陳保鋼. 基于制造業(yè)的CRM的客戶流失分析[J]. 建設機械技術與管理,2008(3):106-109.
[80]陳嵩. 通信設備制造業(yè)CRM中的數(shù)據(jù)挖掘研究[D]. 武漢:武漢理工大學,2008.
[81]Zheng X,Lin Z,Wang X,et al. Incorporating appraisal expression patterns into topic modeling for aspect and sentiment word identification[J]. Knowledge-Based Systems,2014,61(1):29-47.
[82]Constantinescu I,Binder W,F(xiàn)altings B. Service Composition with Directories[M]. Springer Berlin Heidelberg,2006:163-177.
[83]武霞. Hadoop平臺下基于聚類和關聯(lián)規(guī)則算法的工程車輛故障預測研究[D]. 太原:太原科技大學,2015.
[84]羅洪波. 汽車售后服務故障件管理及數(shù)據(jù)挖掘技術應用研究[D]. 成都:西南交通大學,2008.
[85]王詩. 基于數(shù)據(jù)挖掘技術的礦用提升機故障預警系統(tǒng)的研究[D]. 北京:北京郵電大學,2009.
[86]范卿. 工程機械遠程監(jiān)控系統(tǒng)研究[D]. 長沙:湖南大學,2011.
[87]于欣. 基于數(shù)據(jù)挖掘的物流設備隱性故障預警模型研究[D]. 秦皇島:燕山大學,2014.
A Review on the Application of Big Data Analysis in Manufacturing Industry
LIANG Zhiyu,WANG Hongzhi,LI Jianzhong,GAO Hong
( School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001, China )
The wide application of information technology has led to a rapid growth of data related to production, management and operation in manufacturing industry. Those data are valuable for manufacturing enterprises. The mine of information is conductive to optimizing the management workflow, improving production process, adjusting machining parameters and diagnosing equipment faults, which helps increasing efficiency, reducing costs, maximizing profit, and laying the foundation of intelligent manufacturing. However, there remains a contradiction between large quantity of data and low utilization of them. Consequently, more researchers nowadays focus on applying big data technology to manufacturing industry. The paper aims to review on those researches. Firstly, it explains the concept and characteristics of big data in manufacturing industry, and then discusses the features and challenges of big data analysis. Industrial process can be divided into five stages: design, production, purchase, sales and after-sales service. The researchers explain the typical work scenarios in different stages and summarize the recent researches on application of big data model in those scenarios. Finally, the paper analyzes and evaluates the current research results of industrial big data analysis and discuss the main limitations and deficiencies of those existing studies.
big data;manufacturing industry;data mining;industrial process;intelligent manufacturing
C37
A
10.3969/j.issn.1006-0316.2018.06.001
1006-0316 (2018) 06-0001-13
2018-04-17
國家自然科學基金重點項目(U1509216);國家重點研發(fā)計劃項目(2016YFB1000703);國家自然科學基金面上項目(61472099、61602129)
梁志宇(1994-),男,北京人,博士研究生,主要研究方向為工業(yè)大數(shù)據(jù);王宏志(1978-),男,遼寧丹東人,博士,教授、博士生導師,主要研究方向為大數(shù)據(jù)管理與分析;李建中(1950-),男,黑龍江哈爾濱人,教授、博士生導師,主要研究方向為大數(shù)據(jù)、物聯(lián)網;高宏(1966-),女,遼寧鐵嶺人,博士,教授、博士生導師,主要研究方向為大數(shù)據(jù)、物聯(lián)網。