徐紅霞
摘要:數(shù)據(jù)挖掘技術(shù)可以從海量收集來的數(shù)據(jù)中找到有用的數(shù)據(jù)并進行有效分析,對日益復(fù)雜的各種機械設(shè)備故障診斷提供了技術(shù)支持。該文就數(shù)據(jù)挖掘技術(shù)在機械設(shè)備故障診斷中的應(yīng)用進行詳細分析,給出了機械設(shè)備故障診斷的方法及實現(xiàn)過程,對提高經(jīng)濟效益具有十分重要的意義。
關(guān)鍵詞:數(shù)據(jù)挖掘;機械設(shè)備;故障診斷
中圖分類號:TP393 文獻標(biāo)識碼:A 文章編號:1009-3044(2018)30-0005-02
新時代經(jīng)濟發(fā)展需要社會工業(yè)生產(chǎn)必須向規(guī)模化、集群化、智能化方向發(fā)展和提升,在工業(yè)生產(chǎn)實踐中,普遍使用到的機械設(shè)備發(fā)生故障的原因更加復(fù)雜,提高機械設(shè)備的故障診斷技術(shù)成為保證工業(yè)發(fā)展的重要手段之一。故障診斷需要通過收集相關(guān)數(shù)據(jù)并進行分析才能夠得出精確的結(jié)果。信息技術(shù)高速發(fā)展的今天,數(shù)據(jù)挖掘技術(shù)應(yīng)運而生,它能夠幫助人們從海量的數(shù)據(jù)中找到一條正確的方案來實施。隨著電子計算機技術(shù)的飛速發(fā)展和提升,數(shù)據(jù)收集效率和質(zhì)量顯著提升,人工智能識別技術(shù)、模態(tài)識別技術(shù)、統(tǒng)計學(xué)基本理論、人工智能等相關(guān)領(lǐng)域及技術(shù)的發(fā)展實現(xiàn)了機械設(shè)備故障的快速、精準(zhǔn)識別及判定,且故障智能診斷技術(shù)已經(jīng)被廣泛使用在工業(yè)化生產(chǎn)領(lǐng)域及金融服務(wù)行業(yè)中。
1 數(shù)據(jù)挖掘技術(shù)概念
數(shù)據(jù)分析及采集技術(shù)就是從廣泛、海量的信息中獲取真實、有效、可用的數(shù)據(jù)信息,在數(shù)據(jù)收集實踐中,部分未降噪、模糊的數(shù)據(jù)類型隱含在海量數(shù)據(jù)中,為了實現(xiàn)數(shù)據(jù)的精準(zhǔn)提取和判定,必須將其從海量數(shù)據(jù)中剔除,以保證數(shù)據(jù)提取的高效性。
1.1 問題定義
海量的數(shù)據(jù)信息在總體較為細微的層面上出現(xiàn)極其微小的浮動和變化,數(shù)據(jù)信息專家在海量的數(shù)據(jù)信息中借助人工采集技術(shù)難以快速甄選鑒別,數(shù)據(jù)挖掘技術(shù)高效地解決了上述粗存在的問題,并提出了更加高效可用的數(shù)據(jù)挖掘技術(shù)。例如,設(shè)備操作人員及日常維修保養(yǎng)人樣對設(shè)備的性能及參數(shù)較為了解,但是,對系統(tǒng)中各個組件的性能及系統(tǒng)的集成問題的研究較為深入,可以敏銳、快速判定出不同零部件的變化及在具體運轉(zhuǎn)過程中出現(xiàn)的變動,但是上述問題難以被快速獲取,這同時表明實際理論經(jīng)驗同具體知識細則之間的變化情況。
1.2 數(shù)據(jù)準(zhǔn)備
檢測系統(tǒng)可以快速、高效地獲取數(shù)據(jù)信息,且采集到的信息類型具有顯著的復(fù)雜性、系統(tǒng)性、多樣性及集群性等特點,在具體的使用過程中控制難度較高。所以,為了徹底解決數(shù)據(jù)挖掘階段的挖掘目標(biāo)定位精度,實現(xiàn)數(shù)據(jù)挖掘目標(biāo)的快速定位,可以先對數(shù)據(jù)信息進行預(yù)處理和轉(zhuǎn)化分析。但是,數(shù)據(jù)信息挖掘的最終質(zhì)量直接影響到數(shù)據(jù)挖掘的整體結(jié)果,因此,提升數(shù)據(jù)挖掘的精度及質(zhì)量就顯得極其重要。
1.3 數(shù)據(jù)挖掘
可以使用規(guī)則學(xué)習(xí)或決策樹等多種方法來進行分析統(tǒng)計,不斷重復(fù),從而不斷發(fā)現(xiàn)一些潛藏的信息。
1.4 結(jié)果分析和評估
在滿足持續(xù)檢測的要求下,獲取的數(shù)據(jù)信息也出現(xiàn)不同程度的變化和發(fā)展,海量的數(shù)據(jù)信息分析必須借助數(shù)據(jù)建模技術(shù),只有通過反復(fù)建模論證,才可以保證新獲取的信息及設(shè)備在具體執(zhí)行階段的可靠性分,保證在較短時間內(nèi)可以獲取滿意的診斷結(jié)果。
2 數(shù)據(jù)挖掘的常用技術(shù)
選用的數(shù)據(jù)挖掘技術(shù)的質(zhì)量直接影響到挖掘的信息的總體質(zhì)量高低,當(dāng)前,在具體的技術(shù)研究領(lǐng)域,絕大多數(shù)的研究資源集中在算法研究方面,常用的算法技術(shù)主要基于以下幾個基本理論:
2.1 粗糙集理論
粗糙度集是典型的應(yīng)用在研究不確定性及模糊數(shù)學(xué)中的常用理論之一,是一款性價比較高的計算及分析工具。其中,粗糙度集的基本理論具有以下顯著優(yōu)勢:可以不提供大量的精準(zhǔn)信息,分析成本較低;分析流程及步驟得到顯著簡化;算法構(gòu)成簡單,便于操作。粗糙集基本理論的研究方式與二維關(guān)系下的信息表較為相似。但是,基于粗糙集的研究方式及理論難以體現(xiàn)數(shù)據(jù)及信息處理的聯(lián)系性,但是,在具體的信息表中羅列的屬性均是連續(xù)且客觀的。所以,具有離散屬性的粗糙度集基本理論的實用化是后續(xù)繼續(xù)深入研究的重點問題。
2.2 決策樹技術(shù)
決策樹法是一種常用的預(yù)測模型算法,其可以實現(xiàn)大量數(shù)據(jù)的實時、快速分類,并快速從海量的信息中獲取可用信息類型,提升了信息處理的效率。決策樹分析法的優(yōu)勢在于功能簡單、類型劃分速率快,滿足集群化數(shù)據(jù)處理的實際要求。
2.3 人工神經(jīng)元網(wǎng)絡(luò)技術(shù)
基于神經(jīng)網(wǎng)絡(luò)分析法是當(dāng)前數(shù)據(jù)分析及挖掘的關(guān)鍵技術(shù)之一,也是當(dāng)前使用最為廣泛的分析法之一,人工神經(jīng)網(wǎng)絡(luò)分析技術(shù)的原理借助仿生學(xué)基本原理,模仿人工神經(jīng)系統(tǒng)建立相應(yīng)的數(shù)據(jù)信息庫,實行對數(shù)據(jù)信息庫的數(shù)據(jù)實時采集和遴選。同上述分析方式存在差異的是,神經(jīng)網(wǎng)絡(luò)分析法在出現(xiàn)機械故障的情況下開可以實現(xiàn)精準(zhǔn)預(yù)判,所以,在處理某些連續(xù)故障及變量的問題上適用性較好,但是,對于維度較高的數(shù)據(jù)分析及處理不適用。根本原因是內(nèi)部結(jié)構(gòu)不透明問題,神經(jīng)網(wǎng)絡(luò)分析法比較適用于結(jié)構(gòu)形式相對復(fù)雜的數(shù)據(jù)結(jié)構(gòu)中,例如典型的聚類分析模式。圖1為常見的三層前端反饋神經(jīng)網(wǎng)絡(luò)分析模型。
2.4 遺傳算法
遺傳分析法和神經(jīng)網(wǎng)絡(luò)分析法存在某些相似性,遺傳分析法基于生物學(xué)基本理論,借鑒了自然選擇法則和遺傳學(xué)中的隨機搜尋基本理論。遺傳分析法具備顯著的隱藏性及并行特點,其分析模型可以較好地應(yīng)用在數(shù)據(jù)挖掘及分析實踐中。
3 數(shù)據(jù)挖掘技術(shù)在工業(yè)優(yōu)化中的應(yīng)用
量化分析及預(yù)測分析技術(shù)主要應(yīng)用在非線性分析實踐中,選用滿足數(shù)據(jù)要求的模式識別技術(shù)快速收集數(shù)據(jù)信息,建立相應(yīng)的數(shù)據(jù)分析信息,根據(jù)數(shù)據(jù)反映出的數(shù)據(jù)特點,建立相應(yīng)的數(shù)據(jù)結(jié)構(gòu)形式,建立滿足非線性特點的回歸方程,并最終進行非線性回歸分析,但是上述分析存在顯著的缺陷,就是在具體非線性回歸分析過程中回歸方程是主觀確定的。非線性分析法滿足繼續(xù)推廣的特點及要求,滿足多種分析法的聯(lián)合分析使用,建立滿足實際需要的數(shù)據(jù)搜尋及獲取方式。
4 數(shù)據(jù)挖掘技術(shù)在機械設(shè)備故障診斷中的實現(xiàn)步驟
4.1 基本原理
數(shù)據(jù)挖掘方式主要是借助數(shù)據(jù)記錄值實現(xiàn)對機械設(shè)備故障及類型的實時診斷,并獲取對應(yīng)的數(shù)據(jù)分析解決途徑,對于后期可能出現(xiàn)的多種故障及故障類型進行合理預(yù)判。機械設(shè)備故障類型的本質(zhì)特點就是模態(tài)識別,涉及的具體診斷方式就是內(nèi)部數(shù)據(jù)自我匹配的過程。
4.2 故障診斷的數(shù)據(jù)挖掘方法建模
涉及機械設(shè)備的故障及診斷分析,首先應(yīng)該重視的是數(shù)據(jù)的采集及收集,設(shè)備在具體使用過程中涉及大量的數(shù)據(jù)信息,上述數(shù)據(jù)類型中,既要涵蓋正常運轉(zhuǎn)的參數(shù)還應(yīng)該涵蓋故障數(shù)據(jù)值,保證設(shè)備在出現(xiàn)故障后可以通過采集到的數(shù)據(jù)信息實現(xiàn)準(zhǔn)確分析及定位。目前,已經(jīng)使用到的檢測系統(tǒng)及工具的精度較高,且可以實現(xiàn)對數(shù)據(jù)信息的實時定位和分析,提升數(shù)據(jù)采集及收集的便捷性和效率。
當(dāng)前,較為成熟的數(shù)據(jù)分析及識別技術(shù)中常用的基本理論和方法主要有關(guān)聯(lián)關(guān)系法則,上述數(shù)據(jù)關(guān)系主要依靠內(nèi)部數(shù)據(jù)的實時分類,實現(xiàn)數(shù)據(jù)快速采集及高效利用的目的,目前,數(shù)據(jù)相關(guān)關(guān)系中劃分出的主要類別可以實現(xiàn)數(shù)據(jù)及信息的重新定義及歸納,實現(xiàn)故障診斷的實時性,快速定位故障原因。數(shù)據(jù)挖掘體系及策略如圖2。
5 實現(xiàn)過程
機械設(shè)備故障診斷數(shù)據(jù)挖掘的開發(fā)平臺如下:
(1)數(shù)據(jù)庫技術(shù) 機械設(shè)備故障診斷的數(shù)據(jù)倉庫使用Microsoft SQL Server 2012 網(wǎng)絡(luò)數(shù)據(jù)庫進行組建;
(2)OLAP技術(shù)又稱為關(guān)聯(lián)分析技術(shù),主要針對特點問題實現(xiàn)關(guān)聯(lián)分析和即時數(shù)據(jù)訪問的一種技術(shù), 它可以根據(jù)要求進行快速、靈活的各種復(fù)雜查詢處理;
(3)使用 SQL Server 2012 Analysis Services 和SQL Server 2012 Integration Services 實現(xiàn)多維數(shù)據(jù)集和 ETL 過程;
(4)數(shù)據(jù)挖掘采用的相應(yīng)的挖掘工具進行數(shù)據(jù)采集,并從中獲取必要的知識體系及模型;
(5)前臺開發(fā)軟件 常用的前臺開發(fā)軟件主要有PHP、ASP.NET、JSP、C# 等,本平臺采用 C# 進行開發(fā)。
6 結(jié)束語
文章著重分析和介紹了機械設(shè)備故障類型的通用分析及診斷技術(shù)——數(shù)據(jù)挖掘法。將數(shù)據(jù)挖掘技術(shù)遷移到機械設(shè)備故障診斷中,能夠提前預(yù)測問題,采取有效措施對設(shè)備進行維修或更新從而確保機械設(shè)備的正常運行,降低了經(jīng)濟損失,提高了經(jīng)濟效益。
參考文獻:
[1]李洪燕,陳步英,趙美枝. 數(shù)據(jù)挖掘技術(shù)在煤礦機械故障診斷中的應(yīng)用[J]. 煤礦機械,2012.
[2]劉繼清,黃金花.基于改進決策樹算法的設(shè)備故障智能診斷模型[J]. 制造業(yè)自動化,2010,33(4):30-33.
[3]張?zhí)烊穑谔毂?,趙海峰,王宛山.數(shù)據(jù)挖掘技術(shù)在全斷面掘進機故障診斷中的應(yīng)用.東北大學(xué)學(xué)報,2015.
【通聯(lián)編輯:王力】