摘 要:知識的發(fā)現(xiàn)是產(chǎn)品創(chuàng)新和企業(yè)取得成功的關(guān)鍵,數(shù)據(jù)信息在產(chǎn)品的創(chuàng)新設(shè)計與制造中發(fā)揮越來越重要的作用,充分利用數(shù)據(jù)挖掘技術(shù)從產(chǎn)品市場需求分析、概念設(shè)計、制造和服務(wù)中提取相應(yīng)的知識,從而控制和改善下一代產(chǎn)品的設(shè)計與制造。從數(shù)據(jù)挖掘技術(shù)出發(fā),分別論述了數(shù)據(jù)挖掘的關(guān)鍵技術(shù)以及在產(chǎn)品設(shè)計與制造中的應(yīng)用,綜述了數(shù)據(jù)挖掘在產(chǎn)品市場需求、概念設(shè)計、設(shè)計評價與優(yōu)化、制造過程質(zhì)量改善、產(chǎn)品裝配及服務(wù)等方面的應(yīng)用,并總結(jié)了數(shù)據(jù)挖掘技術(shù)在產(chǎn)品設(shè)計與制造中的應(yīng)用的未來發(fā)展方向。
關(guān)鍵詞:數(shù)據(jù)挖掘;產(chǎn)品設(shè)計;產(chǎn)品制造;制造信息化
DOI:10.16640/j.cnki.37-1222/t.2018.18.208
0 引言
當今的世界正是一個以信息化、自動化、人工智能等其他高新技術(shù)為核心的創(chuàng)新時代,我國制造企業(yè)受嚴峻考驗。目前,產(chǎn)品的研制周期長,市場反應(yīng)能力弱,創(chuàng)新度不夠等一系列因素控制了產(chǎn)品制造企業(yè)的生存和發(fā)展,據(jù)有關(guān)部門統(tǒng)計[1], “九五”期間開發(fā)出的新產(chǎn)品中,平均開發(fā)周期為 18 個月,產(chǎn)品的生命周期為 10.5 年,而美國 1990 年就已經(jīng)實現(xiàn)了“3個 3”。因此,如何在最短的時間內(nèi)開發(fā)出質(zhì)量高、價格能被用戶接受的新產(chǎn)品,已成為 21 世紀制造企業(yè)市場競爭的焦點,數(shù)據(jù)挖掘技術(shù)已經(jīng)成為分析和發(fā)現(xiàn)知識,提供決策十分有效的工具,必將有力地支持產(chǎn)品的創(chuàng)新設(shè)計和制造過程。
1 數(shù)據(jù)挖掘技術(shù)
1.1 數(shù)據(jù)挖掘的概念
數(shù)據(jù)挖掘[2](Data Mining,簡稱 DM)就是從大量的、不完全的、隨機的實際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。文獻[3]定義了數(shù)據(jù)挖掘的四種功能:分類,預(yù)測(回歸),聚類(分段),與描述。
1.2 數(shù)據(jù)挖掘相關(guān)技術(shù)
數(shù)據(jù)挖掘方法[4]是由人工智能、機器學(xué)習(xí)的方法發(fā)展而來,同時結(jié)合傳統(tǒng)的統(tǒng)計分析方法、模糊數(shù)學(xué)方法以及可視化技術(shù),以數(shù)據(jù)庫為研究對象的方法和技術(shù)。
1.3 數(shù)據(jù)挖掘相關(guān)算法
根據(jù)發(fā)現(xiàn)知識的不同,數(shù)據(jù)挖掘的任務(wù)主要分為以下6類:(1)關(guān)聯(lián)分析,揭示隱藏在數(shù)據(jù)之間相互關(guān)系的一項數(shù)據(jù)挖掘任務(wù)。(2)序列發(fā)現(xiàn),是指確定數(shù)據(jù)之間與時間相關(guān)的序列模式,利用該模式可對未來的相關(guān)行為進行預(yù)測。(3)聚類分析,是指依賴樣本間關(guān)聯(lián)的量度標準將其自動分成幾個群組,且使同一群組內(nèi)的樣本相似,而屬于不同群組的樣本相異的一組方法。(4)分類,是指找出一個類別的概念描述,它代表了這個類別數(shù)據(jù)的整體信息,一般用規(guī)則或決策樹模式表示。(5)偏差檢測,就是從數(shù)據(jù)分析中發(fā)現(xiàn)某些異常情況是否重要,從而獲得有用的知識。(6)預(yù)測,就是利用歷史數(shù)據(jù)找出變化規(guī)律,建立模型,并用此模型來預(yù)測未來數(shù)據(jù)的種類、特征等。
2 數(shù)據(jù)挖掘技術(shù)在產(chǎn)品設(shè)計與制造中的應(yīng)用
2.1 數(shù)據(jù)挖掘在產(chǎn)品設(shè)計與制造中的作用
在產(chǎn)品的設(shè)計與制造過程中,利用數(shù)據(jù)挖掘工具可以產(chǎn)品設(shè)計的創(chuàng)新,提高產(chǎn)品質(zhì)量,加速產(chǎn)品的制造過程,文獻[5]概述了數(shù)據(jù)挖掘在產(chǎn)品設(shè)計與制造系統(tǒng)中的主要作用及相關(guān)的應(yīng)用領(lǐng)域。
2.1.1 模式發(fā)現(xiàn)
在產(chǎn)品的設(shè)計和制造系統(tǒng)數(shù)據(jù)中隱含了重要的模式,比如購買次數(shù)較多的顧客特征,對促銷感興趣的顧客特征以及不購買顧客特征等分析,數(shù)據(jù)挖掘就是對隱含在數(shù)據(jù)中模式的深度分析。
2.1.2 趨勢預(yù)測
數(shù)據(jù)挖掘不僅能夠提取靜態(tài)的模式,也能預(yù)測動態(tài)的發(fā)展趨勢,目前時間序列挖掘是一個研究的熱點,動態(tài)的趨勢能夠反映顧客興趣的改變,從而使企業(yè)對發(fā)展趨勢做出相應(yīng)的市場決策。
2.1.3 數(shù)據(jù)的降維
數(shù)據(jù)的降維也叫做主成份分析,現(xiàn)代數(shù)據(jù)庫中包含了交易信息的特征,不相關(guān)的數(shù)據(jù)條目和特征可以從數(shù)據(jù)集中消除,數(shù)據(jù)降維的主要作用是選擇關(guān)鍵的數(shù)據(jù)進行分析。
2.1.4 分析數(shù)據(jù)的可視化
數(shù)據(jù)可視化主要旨在借助于圖表,圖,表格等形化手段,清晰有效地傳達與溝通信息。根據(jù)產(chǎn)品全生命周期考慮,產(chǎn)品設(shè)計與開發(fā)過程可劃分為:產(chǎn)品需求分析、概念設(shè)計、詳細設(shè)計、工藝設(shè)計、樣品試制、生產(chǎn)制造、銷售與售后服務(wù)等階段。每個階段和環(huán)節(jié)之間都存在著反饋和迭代過程,但其額度對不同設(shè)計類型有所不同,基于并行工程的產(chǎn)品設(shè)計與開發(fā)過程如圖1:
2.2 市場需求分析
企業(yè)開發(fā)出的產(chǎn)品首先是為了很好地滿足客戶的需要,進而贏得市場,增加企業(yè)的競爭力,因此,比如在市場分析中考慮客戶真正需要的產(chǎn)品特征、產(chǎn)品的那些特征最重要等,客戶需求知識最好能與設(shè)計規(guī)劃產(chǎn)品進行集成,另外,需求知識規(guī)則可以很好地幫助設(shè)計師采取適當?shù)漠a(chǎn)品開發(fā)策略。采取決策樹Apriori的數(shù)據(jù)挖掘算法,給出了研究的框架和分析程序,開發(fā)出滿足客戶需要的數(shù)碼相機產(chǎn)品??傊袌龅男枨笫菑?fù)雜和敏感的,產(chǎn)品企業(yè)要想在競爭中處于不敗之地,最重要的就是能夠很好的理解市場信息并能提供市場急需的、客戶滿意的產(chǎn)品。
2.3 產(chǎn)品設(shè)計
產(chǎn)品設(shè)計是在有限的時空范圍內(nèi),在特定的物質(zhì)條件下,人們?yōu)榱藵M足一定的需求而進行的一種創(chuàng)造性思維活動的實踐過程,設(shè)計具有創(chuàng)造性、復(fù)雜性和不確定性,其中包括分析、綜合和評價等過程,設(shè)計過程中的每一個行為都對應(yīng)于這三維空間中的一個點,如圖2所示。文獻[6]提出了一種基于數(shù)據(jù)挖掘的全息產(chǎn)品概念設(shè)計框架,主要考慮產(chǎn)品數(shù)據(jù)與環(huán)境數(shù)據(jù)之間的相互作用,發(fā)現(xiàn)其中隱含的知識,最后以機床產(chǎn)品為例,開發(fā)了基于數(shù)據(jù)挖掘的產(chǎn)品概念設(shè)計原型系統(tǒng)。文獻[7]建立了基于數(shù)據(jù)挖掘的動態(tài)全息概念設(shè)計模型,并給出了數(shù)學(xué)表達式,闡述了人、環(huán)境和產(chǎn)品數(shù)據(jù)的相互作用,最后以機床郵箱的設(shè)計為例,實現(xiàn)了機床概念設(shè)計中功構(gòu)映射及組合評價。文獻[8]進一步對產(chǎn)品全息概念設(shè)計進行研究,開發(fā)了數(shù)據(jù)挖掘工具和建立了相應(yīng)的數(shù)據(jù)倉庫,利用決策樹算法實現(xiàn)對產(chǎn)品功構(gòu)設(shè)計的映射。文獻[9]討論了遺傳算法、決策樹算法在新產(chǎn)品開發(fā)中的應(yīng)用。要在產(chǎn)品設(shè)計中進行創(chuàng)新,就要對過去的設(shè)計經(jīng)驗和數(shù)據(jù)信息進行總結(jié)、分解與組合,數(shù)據(jù)挖掘技術(shù)對設(shè)計知識的分析,有利于產(chǎn)品設(shè)計的創(chuàng)新,使之實現(xiàn)新的功用。
2.4 設(shè)計評價與優(yōu)化
數(shù)據(jù)挖掘技術(shù)不僅需要挖掘出信息,而且要對挖掘的結(jié)果做出評價,一般情況下,工程數(shù)據(jù)量大且復(fù)雜,就要對數(shù)據(jù)進行分類處理,為了解決數(shù)工程機械中數(shù)據(jù)量大的問題,通過對經(jīng)驗數(shù)據(jù)進行分析,然后用建立的決策樹算法來評價機械設(shè)計方案,以平地機設(shè)計中挑選發(fā)動機、傳動系統(tǒng)、橋荷分配為研究對象,最后驗證了該方法的可行性。
2.5 產(chǎn)品質(zhì)量檢驗
由于數(shù)據(jù)資料的數(shù)量龐大且維度較多,傳統(tǒng)的統(tǒng)計方法難以從中準確快速地提煉出具有指導(dǎo)意義的知識。 因此, 數(shù)據(jù)挖掘技術(shù)的應(yīng)用能夠在一定程度上解決這個矛盾。通過綜述數(shù)據(jù)挖掘技術(shù)在產(chǎn)品質(zhì)量檢驗方面的應(yīng)用,簡述了數(shù)據(jù)收集的特點,并給出了數(shù)據(jù)處理方法,并提出了數(shù)據(jù)挖掘技術(shù)在質(zhì)量檢測方面研究的發(fā)展方向。
2.6 產(chǎn)品裝配與服務(wù)
裝配知識大部分是非數(shù)值型知識,而且有很強的隨機性和不確定性,沒有統(tǒng)一的規(guī)則和模式,由于這種不確定性的存在使得裝配序列規(guī)劃專家系統(tǒng)顯得“裝配知識貧乏”,而數(shù)據(jù)挖掘技術(shù)能很好地滿足裝配序列規(guī)劃系統(tǒng)對裝配知識獲取的需要。
3 未來的研究方向(集成智能化)
隨著科學(xué)技術(shù)的進一步發(fā)展,利用計算機數(shù)據(jù)挖掘輔助工具,從產(chǎn)品設(shè)計過程中數(shù)據(jù)中抽取有用的信息,將數(shù)據(jù),設(shè)計,知識集成于一體指導(dǎo)產(chǎn)品設(shè)計過程。因此,產(chǎn)品的設(shè)計與制造系統(tǒng)最終朝著數(shù)字化,集成化、網(wǎng)絡(luò)化,智能化、人機一體化的方向發(fā)展,系統(tǒng)如何發(fā)現(xiàn)和獲取所需的知識仍是一個關(guān)鍵問題。還需要進一步研究和建立在 Web 環(huán)境下的數(shù)據(jù)挖掘工具,同時在知識獲取、知識表示、知識存貯等方面還需要投入更多的精力去研究。
4 結(jié)論
數(shù)據(jù)挖掘技術(shù)是產(chǎn)品設(shè)計創(chuàng)新的一個重要的手段,本文綜述了數(shù)據(jù)挖掘技術(shù)在產(chǎn)品設(shè)計與制造系統(tǒng)中的應(yīng)用技術(shù),其主要技術(shù)有模式發(fā)現(xiàn),趨勢預(yù)測,數(shù)據(jù)的降維,分析數(shù)據(jù)的可視化等技術(shù),分別論述了數(shù)據(jù)挖掘技術(shù)在市場需求、產(chǎn)品概念設(shè)計、設(shè)計評價與優(yōu)化、產(chǎn)品制造過程質(zhì)量改善已經(jīng)裝配過程的具體運用,并提出了數(shù)據(jù)挖掘技術(shù)在產(chǎn)品設(shè)計未來的研究方向。
參考文獻:
[1]胡斌梁,許功元.基于約束理論的產(chǎn)品造型概念設(shè)計研究[J].機械設(shè)計,2017(02):119-121.
[2]Anand,S.S.,& Buchner,A.G.(1998).Decision support using data mining.London:Financial Times Pitman.
[3]Adeniyi D A,Wei Z,Yongquan Y.Automated web usage data mining and recommendation system using K-Nearest Neighbor (KNN)classification method[J].Applied Computing & Informatics,2016,12(01):90-108.
[4]吳雪峰,馬路.數(shù)據(jù)挖掘技術(shù)及在制造業(yè)的應(yīng)用[J].計算機應(yīng)用與軟件,2017(10):71-77.
[5]Kusiak A,Smith M.Data mining in design of products and production systems[J].Annual Reviews in Control,2007,31(01):147-156.
[6]李鑫.基于中間模型的仿真數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究及應(yīng)用[D].浙江大學(xué),2016.
[7]沈曉.面向銀保知識資源庫的關(guān)鍵技術(shù)研究及系統(tǒng)構(gòu)建[D].復(fù)旦大學(xué),2011.
[8]丁衛(wèi),顧寄南,馬亮.數(shù)據(jù)挖掘與數(shù)據(jù)融合在產(chǎn)品優(yōu)化設(shè)計中的研究綜述[J].制造業(yè)自動化,2013,35(02):68-70.
[9]Agard B.Data mining for improvement of product quality[J].International Journal of Production Research,2006,44(18-19):4027-4041.
基金項目:貴州省科技支撐計劃項目(黔科合支撐[2017]2029);
貴州省科學(xué)技術(shù)基金計劃項目[黔科合基礎(chǔ)(2016)1037];
國家自然科學(xué)基金資助項目(51505094);
作者簡介:藍偉文(1973-),男,廣東興寧人,碩士,副教授,主要研究方向:智能制造。