林濤 葛玉敏 安玳寧
摘 要:提出一種基于RBF神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘方法,將RBF神經(jīng)網(wǎng)絡(luò)應(yīng)用于數(shù)據(jù)挖掘的分類和預(yù)測(cè)中,解決鋼構(gòu)件過(guò)程中的性能預(yù)測(cè)問(wèn)題。其中用黃金分割法確定基于RBF神經(jīng)網(wǎng)絡(luò)的隱層節(jié)點(diǎn)數(shù),減少該算法的計(jì)算復(fù)雜度,最終將其應(yīng)用于某鋼鐵企業(yè)質(zhì)量控制系統(tǒng)。構(gòu)建對(duì)鋼構(gòu)件質(zhì)量檢測(cè)的數(shù)據(jù)挖掘及質(zhì)量追溯平臺(tái),該平臺(tái)是基于RBF神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘技術(shù)的。實(shí)際應(yīng)用證明,產(chǎn)品的質(zhì)量合格率可達(dá)到96.27%,符合國(guó)家相關(guān)的標(biāo)準(zhǔn)和技術(shù)指標(biāo)。
關(guān)鍵詞:數(shù)據(jù)挖掘;徑向基函數(shù)神經(jīng)網(wǎng)絡(luò);黃金分割法; 質(zhì)量追溯
中圖分類號(hào):TP399 文獻(xiàn)標(biāo)識(shí)碼:A
Abstract:To solve the performance prediction problem in the steel production process, this paper presentsed an approach which is based on RBF neural network data mining method and uses RBF neural network in classification and prediction of data mining. The hidden layer nodes of the RBF neural network were determined by the golden section method to reduce the computational complexity of the algorithm, which were applied to a steel enterprise quality control system. Finally, a platform of data mining and quality retrospective, which is based on RBF neural network data mining technology,was constructed in product quality testing in steel companies. Practical application shows that the qualified rate of products can reach 96.27%, in line with national standards and technical specifications.
Key words:data mining; radial basis function neural network;golden section method; qualitytraceability
1 引 言
在國(guó)家“全面提高信息化水平,推進(jìn)信息化與工業(yè)化深度融合”的大環(huán)境下,有效的將信息技術(shù)、企業(yè)先進(jìn)制造技術(shù)與現(xiàn)代管理技術(shù)進(jìn)行結(jié)合,使得企業(yè)在生產(chǎn)經(jīng)營(yíng)過(guò)程中產(chǎn)生了海量數(shù)據(jù)。激增的數(shù)據(jù)背后隱藏著許多重要的信息,如何從大量的數(shù)據(jù)中提取并找到有用的信息以指導(dǎo)決策,是迫切需要解決的問(wèn)題[1,2]。
鋼構(gòu)件的生產(chǎn)、加工、成型及實(shí)際應(yīng)用的過(guò)程中涌現(xiàn)出企業(yè)決策的不確定性和不可預(yù)測(cè)性,大量結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),加劇了企業(yè)決策的風(fēng)險(xiǎn)。如何有效地收集數(shù)據(jù)、洞察數(shù)據(jù),如何將數(shù)據(jù)轉(zhuǎn)化為知識(shí)、將知識(shí)付諸于行動(dòng),已經(jīng)日益成為企業(yè)經(jīng)營(yíng)者難以把控的課題。
由于神經(jīng)網(wǎng)絡(luò)對(duì)噪聲數(shù)據(jù)的高承受能力和高容錯(cuò)能力使得神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)挖掘領(lǐng)域的應(yīng)用得到人們的重視,但是具有結(jié)構(gòu)復(fù)雜、可解釋性差、訓(xùn)練時(shí)間長(zhǎng)等缺點(diǎn)。針對(duì)這些問(wèn)題本文介紹了基于RBF神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘技術(shù)構(gòu)建的鋼構(gòu)件企業(yè)成品質(zhì)量檢測(cè)的數(shù)據(jù)挖掘及質(zhì)量追溯平臺(tái),并且應(yīng)用黃金分割法確定RBF神經(jīng)網(wǎng)絡(luò)的隱層節(jié)點(diǎn)數(shù),減少了該算法的計(jì)算復(fù)雜度,進(jìn)而簡(jiǎn)化RBF神經(jīng)網(wǎng)絡(luò)算法,使其更能滿足大型企業(yè)數(shù)據(jù)挖掘的需求,提高工作效率。
2 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘(DM: Data Mining.),也稱為數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)KDD(Knowledge Discovery in Database),是源于大型零售商在面對(duì)決策支撐問(wèn)題提出的,是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過(guò)程[3]。它匯聚了數(shù)據(jù)庫(kù)、人工智能、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)、可視化技術(shù)、并行計(jì)算機(jī)等不同學(xué)科和領(lǐng)域的知識(shí);借助了多年來(lái)數(shù)理統(tǒng)計(jì)技術(shù)及人工智能等領(lǐng)域研究成果構(gòu)建起自己的理論體系;利用了數(shù)據(jù)庫(kù)技術(shù)對(duì)數(shù)據(jù)進(jìn)行前端處理,應(yīng)用機(jī)器學(xué)習(xí)方法從處理后的數(shù)據(jù)中提取有用的知識(shí),并對(duì)數(shù)據(jù)背后隱藏的特征和趨勢(shì)進(jìn)行分析,最終給出關(guān)于數(shù)據(jù)的總體特征和發(fā)展趨勢(shì);運(yùn)用了可視化技術(shù)將人的觀察力和智能融入系統(tǒng),用直觀圖形將信息模式、數(shù)據(jù)的關(guān)聯(lián)或趨勢(shì)呈現(xiàn)給決策者,使用戶能交互式地分析數(shù)據(jù)。
數(shù)據(jù)挖掘大體分為三個(gè)步驟:目標(biāo)數(shù)據(jù)收集采樣、數(shù)據(jù)處理再加工和數(shù)據(jù)輸出與結(jié)果分析。數(shù)據(jù)挖掘就是尋找隱藏在數(shù)據(jù)中的如趨勢(shì)、模式及相關(guān)性的信息。數(shù)據(jù)挖掘?qū)儆跀?shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)(KDD)的一部分。它的本質(zhì)就是學(xué)習(xí)過(guò)去經(jīng)驗(yàn)的簡(jiǎn)單過(guò)程。圖1是知識(shí)發(fā)現(xiàn)過(guò)程的簡(jiǎn)單流程。
4 鋼構(gòu)件質(zhì)量檢測(cè)和追溯系統(tǒng)
現(xiàn)階段冶金行業(yè)的運(yùn)營(yíng)特點(diǎn)趨向于嚴(yán)格的冶金產(chǎn)品質(zhì)量規(guī)范,產(chǎn)品要進(jìn)行全過(guò)程的質(zhì)量跟蹤和嚴(yán)格的質(zhì)量檢測(cè),并為客戶開(kāi)具質(zhì)量保證書(shū)??梢?jiàn),質(zhì)量管理在鋼鐵冶金行業(yè)中占據(jù)著越來(lái)越重要的地位。質(zhì)量檢測(cè)是實(shí)現(xiàn)質(zhì)量管理的核心環(huán)節(jié),只有精確地檢測(cè)并分析出產(chǎn)品判廢原因并進(jìn)行質(zhì)量追溯,才能把成品質(zhì)量控制在最佳水平。為了更精確、更智能的進(jìn)行質(zhì)量檢測(cè)工作,本文將RBF神經(jīng)網(wǎng)絡(luò)應(yīng)用于數(shù)據(jù)挖掘的分類和預(yù)測(cè)中,把二者結(jié)合起來(lái)解決鋼構(gòu)件生產(chǎn)過(guò)程中的性能預(yù)測(cè)問(wèn)題,以此構(gòu)建了基于RBF神經(jīng)網(wǎng)絡(luò)的鋼構(gòu)件成品質(zhì)量檢測(cè)的數(shù)據(jù)挖掘及質(zhì)量追溯平臺(tái),該平臺(tái)將某鋼鐵企業(yè)中鋼構(gòu)件生產(chǎn)過(guò)程中的數(shù)據(jù)采集和質(zhì)量控制系統(tǒng)歷史數(shù)據(jù)庫(kù)的海量數(shù)據(jù)作為目標(biāo)信息源,進(jìn)行數(shù)據(jù)清洗和相關(guān)性分析,減少數(shù)據(jù)噪聲、刪除與任務(wù)無(wú)相關(guān)的數(shù)據(jù),建立挖掘數(shù)據(jù)庫(kù)。而數(shù)據(jù)挖掘自動(dòng)在數(shù)據(jù)庫(kù)中尋找預(yù)測(cè)性信息,迅速直接由數(shù)據(jù)本身得出結(jié)論。
目前的鋼構(gòu)件檢測(cè)技術(shù)基本上是將化學(xué)性能、物理性能、尺寸精度和表面質(zhì)量分開(kāi)檢測(cè),而化學(xué)性能和物理性能基本滿足單方向相關(guān)聯(lián)的關(guān)系,即產(chǎn)品的化學(xué)元素含量直接影響到產(chǎn)品的物理性能各項(xiàng)參數(shù)。因此,在對(duì)鋼構(gòu)件產(chǎn)品的物理性能檢測(cè)時(shí),可利用成品的化學(xué)物理性能相關(guān)性,通過(guò)RBF神經(jīng)網(wǎng)絡(luò)對(duì)化學(xué)參數(shù)的處理后,預(yù)測(cè)該產(chǎn)品的物理性能,從而簡(jiǎn)化了物理性能的檢測(cè)環(huán)節(jié),大量節(jié)省了人力物力并節(jié)約了檢測(cè)成本。然而,數(shù)據(jù)挖掘的結(jié)果是不確定的,要和專業(yè)知識(shí)相結(jié)合才能對(duì)其做出判斷,因此要結(jié)合質(zhì)量追溯對(duì)結(jié)果進(jìn)行深刻的分析,理解數(shù)據(jù),了解其過(guò)程,才能對(duì)數(shù)據(jù)挖掘的結(jié)果找出合理的解釋。因此對(duì)鋼構(gòu)件產(chǎn)品化學(xué)性能、物理性能、表面質(zhì)量、尺寸精度的數(shù)據(jù)挖掘可按照以下流程進(jìn)行:
依據(jù)上圖,僅以鋼構(gòu)件的化學(xué)成分為例進(jìn)行說(shuō)明。對(duì)構(gòu)件鋼的化學(xué)分析用試樣取樣法以及成品化學(xué)成分允許偏差檢測(cè)采用GB222—84標(biāo)準(zhǔn)。鋼種產(chǎn)品牌號(hào)為Q295,A級(jí)鋼,抽取了200組型鋼產(chǎn)品的樣本進(jìn)行該平臺(tái)的測(cè)試,首先從目標(biāo)信息源即數(shù)據(jù)采集和質(zhì)量控制系統(tǒng)歷史數(shù)據(jù)庫(kù)的海量數(shù)據(jù)中獲型鋼的化學(xué)成分?jǐn)?shù)據(jù),具體如下表1。
然后采用RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)挖掘,將數(shù)據(jù)集分為兩組,一組用來(lái)訓(xùn)練RBF神經(jīng)網(wǎng)絡(luò),一組用來(lái)測(cè)試RBF神經(jīng)網(wǎng)絡(luò)。為很好考察網(wǎng)絡(luò)的泛化能力,要保證測(cè)試數(shù)據(jù)和訓(xùn)練數(shù)據(jù)無(wú)交集。此外,為了防止所有數(shù)據(jù)的數(shù)據(jù)沖突問(wèn)題,將數(shù)據(jù)倉(cāng)庫(kù)與挖掘數(shù)據(jù)庫(kù)分開(kāi)設(shè)置。設(shè)置二級(jí)數(shù)據(jù)庫(kù)為數(shù)據(jù)倉(cāng)庫(kù),里面包含所有從生產(chǎn)線采集的數(shù)據(jù);數(shù)據(jù)挖掘庫(kù)為三級(jí)數(shù)據(jù)庫(kù),它是數(shù)據(jù)倉(cāng)庫(kù)邏輯上的一個(gè)子集,二級(jí)數(shù)據(jù)庫(kù)是三級(jí)數(shù)據(jù)庫(kù)的數(shù)據(jù)源,三級(jí)數(shù)據(jù)庫(kù)從二級(jí)數(shù)據(jù)庫(kù)挖掘篩選出需求數(shù)據(jù)。經(jīng)過(guò)RBF神經(jīng)網(wǎng)絡(luò)對(duì)38個(gè)化學(xué)參數(shù)的處理后,預(yù)測(cè)該產(chǎn)品的物理性能,最后對(duì)化學(xué)成分?jǐn)?shù)據(jù)、物理性能數(shù)據(jù)、尺寸精度數(shù)據(jù)和表面質(zhì)量參數(shù)進(jìn)行綜合判定后的判定結(jié)果進(jìn)行結(jié)果分析,判定結(jié)果以C#完成的界面人性化顯示如圖5.具體結(jié)果分析如表2。經(jīng)過(guò)此成品質(zhì)量檢測(cè)的數(shù)據(jù)挖掘及質(zhì)量追溯平臺(tái)來(lái)進(jìn)行產(chǎn)品質(zhì)量控制,鋼構(gòu)件產(chǎn)品的合格率可以達(dá)到96.27%。
5 結(jié) 論
本文將RBF神經(jīng)網(wǎng)絡(luò)應(yīng)用于數(shù)據(jù)挖掘的分類和預(yù)測(cè)中,把二者結(jié)合起來(lái)解決鋼構(gòu)件生產(chǎn)過(guò)程中的性能預(yù)測(cè)問(wèn)題,并結(jié)合質(zhì)量追溯對(duì)數(shù)據(jù)挖掘結(jié)果進(jìn)行詳細(xì)分析解釋。其中,在預(yù)測(cè)網(wǎng)絡(luò)的選擇上綜合考慮鋼構(gòu)件企業(yè)產(chǎn)品性能特點(diǎn),選用結(jié)構(gòu)相對(duì)簡(jiǎn)單的RBF前饋神經(jīng)網(wǎng)絡(luò),同時(shí)對(duì)鋼構(gòu)件產(chǎn)品進(jìn)行預(yù)測(cè)和檢測(cè)兩項(xiàng)工作,將數(shù)據(jù)挖掘技術(shù)深入到企業(yè)生產(chǎn)過(guò)程中,最終構(gòu)建了成品質(zhì)量檢測(cè)的數(shù)據(jù)挖掘及質(zhì)量追溯平臺(tái),經(jīng)過(guò)此對(duì)產(chǎn)品進(jìn)行質(zhì)量控制,使得鋼構(gòu)件產(chǎn)品的質(zhì)量符合國(guó)家相關(guān)的標(biāo)準(zhǔn)和技術(shù)指標(biāo)。
參考文獻(xiàn)
[1] Caiyan, Liu, and Sun Youfa. Application of data mining in production quality management[J].Proceedings of the 3rd international conference on Intelligent information technology application. IEEE Press, 2009.
[2] 儲(chǔ)兵, 吳陳, 楊習(xí)貝. 基于 RBF 神經(jīng)網(wǎng)絡(luò)與粗糙集的數(shù)據(jù)挖掘算法[J]. 計(jì)算機(jī)技術(shù)與發(fā)展, ISTIC, 2013. 23(7):50-58.
[3] 宮曉曼, 滕榮華.基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘在煤礦選煤中的應(yīng)用[J]. 煤炭技術(shù), 2013. 32(009):127-128.
[4] 趙婧宏,潘維民.人工神經(jīng)網(wǎng)絡(luò)算法在數(shù)據(jù)挖掘中的應(yīng)用[J].中國(guó)科技論文在線.
[5] 王行甫,覃啟賢,程用遠(yuǎn),等.一種改進(jìn)的徑向基神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)算法[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2012,(21)8:2-4.
[6] 李勁松.數(shù)據(jù)挖掘技術(shù)在鋼企質(zhì)量成本管理中應(yīng)用研究[J].科技導(dǎo)報(bào),2009.
[7] SPINOLA C., et al. "Image processing for surface quality control in stainless steel production lines." Imaging Systems and Techniques (IST)[J].2010 IEEE International Conference on. IEEE, 2010.
[8] 尉永青.數(shù)據(jù)挖掘技術(shù)在入侵檢測(cè)系統(tǒng)中的應(yīng)用研究[J].信息技術(shù)與信息化,2005:95-96.
[9] 林鋼.基于數(shù)據(jù)挖掘的前向型神經(jīng)網(wǎng)絡(luò)在交通流時(shí)序預(yù)測(cè)中的應(yīng)用[D].南京:東南大學(xué),2004.
[10]周濤,陸惠玲.數(shù)據(jù)挖掘中聚類算法研究進(jìn)展[J].計(jì)算機(jī)工程與應(yīng)用,2012,(48)12:40-46.
[11]Shen, Wei, et al.Forecasting stock indices using radial basis function neural networks optimized by artificial fish swarm algorithm[J].KnowledgeBased Systems 24.3 (2011): 378-385.
[12]Cios, Krzysztof J., Witold Pedrycz, and R. M. Swiniarsk.Data mining methods for knowledge discovery.Neural Networks[J].IEEE Transactions on 9.6 (1998): 1533-1534.
[13]Buchtala, Oliver, Manuel Klimek, and Bernhard Sick.Evolutionary optimization of radial basis function classifiers for data mining applications.Systems, Man, and Cybernetics, Part B: Cybernetics[J].IEEE Transactions on 35.5 (2005): 928-947.