李養(yǎng)勝
(陜西工業(yè)職業(yè)技術學院 信息工程學院,陜西 咸陽 712000)
基于數(shù)據(jù)挖掘技術的煤礦電網(wǎng)綜合管理系統(tǒng)的設計與實現(xiàn)
李養(yǎng)勝
(陜西工業(yè)職業(yè)技術學院 信息工程學院,陜西 咸陽 712000)
摘要:在傳統(tǒng)的煤礦電網(wǎng)中,由于井下信息不能被及時獲取,也就無法對存在的隱患甚至是發(fā)生的故障立即發(fā)出預警。針對這一問題,基于數(shù)據(jù)挖掘技術,設計研究了一種綜合管理系統(tǒng),該系統(tǒng)綜合應用了嵌入式技術、實時數(shù)據(jù)庫技術以及工控組態(tài)軟件,能使煤礦電網(wǎng)高效運行。在對多方面的數(shù)據(jù)進行分析和建模時,結合了數(shù)據(jù)倉庫技術,采用多種挖掘模式,達到了預測報警的目的?;跀?shù)據(jù)挖掘技術的煤礦電網(wǎng)綜合管理系統(tǒng)不僅解決了供電監(jiān)控技術問題,還解除了煤礦安全運行中的重大隱患,使礦井的安全生產(chǎn)能力和抗災能力都得到有效增強。
關鍵詞:數(shù)據(jù)挖掘;煤礦電網(wǎng);故障預警;實時監(jiān)視
隨著經(jīng)濟社會的不斷發(fā)展,煤礦開采量也在不斷增加,但煤礦開采的安全形勢不容樂觀。導致事故發(fā)生的因素很多,其中最主要的原因來自于供電網(wǎng)絡監(jiān)測系統(tǒng),現(xiàn)有的系統(tǒng)在進行不間斷監(jiān)測井下情況時,信息孤島的存在導致電網(wǎng)的運行狀態(tài)不能被管理人員全面的掌握[1]。針對上述問題,本文基于數(shù)據(jù)挖掘技術,對煤礦電網(wǎng)的綜合管理系統(tǒng)進行設計研究,綜合了以太網(wǎng)、現(xiàn)場總線技術以及井下局域網(wǎng)等進行不同形式數(shù)據(jù)的大量積累[2],包括歷史數(shù)據(jù)、實時數(shù)據(jù)以及歷史故障記錄,進行綜合預測平臺的構造。應用綜合管理系統(tǒng)可以使煤礦電網(wǎng)的運行效率得到有效提高,危險系數(shù)得到降低,在預防隱患和事故發(fā)生的杜絕方面頗有成效,在煤礦安全生產(chǎn)方面具有現(xiàn)實意義。
在數(shù)據(jù)挖掘技術中,任務分為描述和預測2類,本文從這2類任務出發(fā)引入了挖掘算法,對煤礦電網(wǎng)綜合管理系統(tǒng)進行設計并完成了對模塊的實現(xiàn)。在系統(tǒng)的設計中,針對數(shù)據(jù)類型的不同,使用算法進行數(shù)據(jù)的轉換與集成,使用特定的挖掘模式,采用可視化技術對數(shù)據(jù)進行圖形展示,最終達到了預測與預防電網(wǎng)故障的目的[3-4]。
1數(shù)據(jù)挖掘
1.1研究背景和意義
隨著數(shù)據(jù)庫技術在許多領域的迅速發(fā)展,大型數(shù)據(jù)庫得到廣泛的建立。目前,對數(shù)據(jù)庫的使用還僅限于一些基本的操作,例如對數(shù)據(jù)進行查詢。在數(shù)據(jù)庫中,許多有價值的信息是隱藏起來的。對數(shù)據(jù)庫的使用不能僅限于粗加工數(shù)據(jù),應通過對數(shù)據(jù)的處理,把隱藏的那部分信息歸納出來,把這些知識進行有效地利用。在進一步加工數(shù)據(jù)和分析內(nèi)容的需求背景下,應運而生出了數(shù)據(jù)挖掘等技術。
數(shù)據(jù)挖掘比數(shù)據(jù)分析更深層次,從大量數(shù)據(jù)中進行數(shù)據(jù)挖掘可以發(fā)現(xiàn)數(shù)據(jù)的一定規(guī)律,更深層次的分析可以把信息資源的使用價值進一步提高,使信息資源得到充分利用,使使用效益得到有效提高。數(shù)據(jù)挖掘的使用給決策分析提供了一條新的途徑,使決策的準確性和可靠性都得到了有效提高,為科學決策提供了基礎[5]。
1.2數(shù)據(jù)挖掘的定義
數(shù)據(jù)挖掘又可以認為是從數(shù)據(jù)庫中發(fā)現(xiàn)知識,是一個對大量數(shù)據(jù)進行分析的復雜過程,通過這一過程可以把未知的、有價值的模式等知識抽取挖掘出來。數(shù)據(jù)挖掘設計的學科領域很多,是一個交叉學科領域,使用的方法也很多,包括數(shù)據(jù)庫技術、神經(jīng)網(wǎng)絡和可視化等。
數(shù)據(jù)挖掘演化過程示意圖如圖1所示。首先,把數(shù)據(jù)庫中的數(shù)據(jù)進行清洗,并集成進入到數(shù)據(jù)倉庫中,數(shù)據(jù)清洗不僅可以清除噪聲,還可以把與主題無關的數(shù)據(jù)都清除出去,數(shù)據(jù)的集成是把多數(shù)據(jù)源的相關數(shù)據(jù)組合到一起;其次,進入數(shù)據(jù)倉庫中的數(shù)據(jù)還要進行選擇和轉換進入到特定的數(shù)據(jù)集中,在這部分主要是轉換數(shù)據(jù)的存儲形式,以便于數(shù)據(jù)挖掘的進行;再次,應對特定數(shù)據(jù)集中的數(shù)據(jù)進行數(shù)據(jù)挖掘,這只是總的數(shù)據(jù)挖掘的一個步驟,主要是進行數(shù)據(jù)模式或規(guī)律的挖掘;最后,進行模式評估和知識表示,利用評估標準和可視化表達技術,篩選出有意義的知識模式并向用戶進行展示。
圖1 數(shù)據(jù)挖掘演化過程示意圖
2煤礦電網(wǎng)綜合管理系統(tǒng)的設計
2.1總體要求
煤礦電網(wǎng)綜合管理系統(tǒng)要使系統(tǒng)服務器與變電站重點計算機進行互聯(lián),使操作和信息網(wǎng)絡化,實現(xiàn)多種信息的共享和交互;遠程計算機的互聯(lián)通過建設專用通信網(wǎng)絡來實現(xiàn);變電站終端計算機要具備存儲管理各類信息,自動生成五防及操作票,以及顯示實時數(shù)據(jù)的功能;數(shù)據(jù)備份與更新功能要完善;要具備系統(tǒng)時間同步功能;系統(tǒng)要具備良好的擴展性;在權限的劃分方面要合理,并能實現(xiàn)數(shù)字化的筆跡簽名。
2.2設計原則
在煤礦電網(wǎng)綜合管理系統(tǒng)中,依據(jù)了計算機集成制造系統(tǒng)的相關思想,系統(tǒng)的設計遵循如下原則:系統(tǒng)采用的軟、硬件產(chǎn)品技術要成熟,以確保系統(tǒng)的可靠性;使用的技術產(chǎn)品應是專業(yè)廠家生產(chǎn)、有國際先進技術的產(chǎn)品,以確保技術的先進性;在設計中要確保系統(tǒng)的實用性;在模塊化結構的實現(xiàn)時要充分考慮可擴展性及開放性,以便于對模塊進行擴容與擴展。
2.3軟、硬件配置
利用調(diào)制解調(diào)器,借助PSTN通信網(wǎng)絡及終端服務器,可以實現(xiàn)各變電站和電務廠之間的聯(lián)系。系統(tǒng)硬件配置結構圖如圖2所示。軟、硬件主要包括數(shù)據(jù)庫、服務器、網(wǎng)關以及光纖收發(fā)器和數(shù)據(jù)采集等控制系統(tǒng)的硬件設施。
圖2 系統(tǒng)硬件配置結構圖
2.4結構設計
基于煤礦電網(wǎng)實際管理中的特點,運用數(shù)據(jù)倉庫技術,采用SQL Server 2000數(shù)據(jù)庫環(huán)境進行預警報警系統(tǒng)模塊的設計。系統(tǒng)結構示意圖如圖3所示,對數(shù)據(jù)倉庫的維護通過數(shù)據(jù)管理模塊來實現(xiàn);通過數(shù)據(jù)管理模塊進行數(shù)據(jù)庫和其他格式數(shù)據(jù)源的操作,進行數(shù)據(jù)倉庫的架構,對數(shù)據(jù)的描述和預測則通過數(shù)據(jù)挖掘模塊進行;報表管理模塊則主要實現(xiàn)定制與打印報表的功能。
圖3 系統(tǒng)結構示意圖
3模塊的實現(xiàn)
在系統(tǒng)模塊的實現(xiàn)中,數(shù)據(jù)挖掘主要由4部分組成。其中,數(shù)據(jù)的預處理是數(shù)據(jù)挖掘的前期操作;數(shù)據(jù)可視化可以形象地把相關數(shù)據(jù)進行圖表的展示,并對記錄抽樣和字段抽樣進行簡單地集成,只把用戶關心的數(shù)據(jù)顯示出來;挖掘引擎中,針對數(shù)據(jù)挖掘知識,用戶可以選擇特定的挖掘模式完成對規(guī)則知識的導出;回歸建模預測模塊主要是實現(xiàn)電網(wǎng)運行中的回歸建模與預測,并對模型庫進行維護[6]。
數(shù)據(jù)挖掘具有如下特點。
1)數(shù)據(jù)規(guī)范化。在模塊的實現(xiàn)中,一般都要對數(shù)據(jù)進行規(guī)范化處理,以適應挖掘算法。
2)數(shù)據(jù)離散化。在該模塊主要是對屬性進行概念分層,給定連續(xù)屬性值的個數(shù)要減少,盡量使用高層次的概念。在進行離散的數(shù)值屬性的選擇時,要根據(jù)實際情況劃分離散區(qū)間。
3)在數(shù)據(jù)缺損處理中,要填充字段,填充方式有平均值、最大值、最小值以及指定值填充。
4)分類方法是在數(shù)據(jù)挖掘中的數(shù)據(jù)歸納方法,用于預測離散無序類別值,在本文中,分類模式基于決策樹而實現(xiàn)。
目前,常用的決策樹算法為C4.5算法,其構建步驟如下:先給定1組訓練樣本,設S是樣本數(shù)據(jù)集,其具有m種不同的類標號屬性Ci;然后預處理數(shù)據(jù)源形成決策樹的訓練集;最后把樣本分類。其信息熵值可以用下式表式:
(1)
式中,pi是樣本屬于屬性類Ci的概率。對屬性A進行假設,假設其有很多個不同的值{a1,a2,…,an},樣本集就可以根據(jù)屬性劃分為不同的子集,其熵可以用下式表示:
(2)
式中,sj是屬性類Ci的樣本數(shù);s是S的樣本數(shù)。那么,就可以得出屬性A的信息熵E(A)、信息增益Gain(A)以及信息增益率Gain_Ratio(A),其表達式見式3。通過信息增益率的計算,就可以進行決策樹的構造。
(3)
決策樹構造完成后,用分類規(guī)則的形式對得到的分類模型進行描述輸出,然后利用模型進行位置數(shù)據(jù)實例歸屬類別的預測。估計模型分類準確率常用的方法是保持方法,樣本集根據(jù)訓練比例可分為訓練和測試樣本集,前者用于決策樹的建立,后者用于分類規(guī)則準確率的計算。
5)聚類是把1個數(shù)據(jù)集按照一定的規(guī)則劃分為若干類或若干組的過程,不同類或不同組的數(shù)據(jù)之間的相似度較低,在同一類或同一組內(nèi)數(shù)據(jù)之間的相似度通常較高。聚類分析與分類不同的是在對數(shù)據(jù)進行歸類時,數(shù)據(jù)是無類別歸屬的。
6)關聯(lián)規(guī)則挖掘實際上就是采用算法從給定的數(shù)據(jù)集中對數(shù)據(jù)項進行搜索,找出數(shù)據(jù)項之間有價值或隱藏的聯(lián)系。根據(jù)數(shù)據(jù)規(guī)則的特點,在進行規(guī)則挖掘時本文采用了Apriori算法,其使用的迭代方法是逐層搜索方法,該搜索方法利用了Apriori性質(zhì),即要求在頻繁項集中,其所有的非空子集都必須是頻繁項集。在獲取關聯(lián)規(guī)則時有2個階段,首先是Apriori算法的使用,通過該算法滿足最小支持度要求進行頻繁項集的產(chǎn)生;然后進入第2階段,滿足最小置信度的要求,即根據(jù)第1階段的頻繁項集進行強關聯(lián)規(guī)則的制定。實際上,第1階段結束之后,使用集合求冪方法可以獲取全部的關聯(lián)規(guī)則,本文只選取強關聯(lián)規(guī)則。在算法實現(xiàn)中,第1階段的最小支持度設置為5%,第2階段的最小置信度設置為60%。
7)回歸的建模與預測。這部分內(nèi)容的實現(xiàn)通常依靠利用統(tǒng)計回歸方法所建立的模型。在建模時所采用的回歸模型為基于最小二乘法的線性回歸方法,并進行相應變量和預測變量的選擇,進行回歸系數(shù)的計算,得到回歸模型之后還要進行檢驗和模型的保存,最終預測相應變量。
4系統(tǒng)功能
1)實時測量與監(jiān)視功能。系統(tǒng)提供了比較友好的界面,在界面上各個變電所中開關的情況可以同時得到實時顯示,而且顯示結果是按照順序進行排列的。實時顯示的數(shù)據(jù)主要為電壓、電流、電阻和功率等電量數(shù)據(jù);另外,還能對線路以及開關分合閘狀態(tài)、開關機構異常等情況進行監(jiān)視[7]。
2)預警報警功能。其中,預警主要指開關變位以及保護動作的預警;報警主要出現(xiàn)在電壓電流越限設置中,這樣一旦出現(xiàn)開關跳閘現(xiàn)象,就可以對故障所在范圍進行迅速的判斷,并實現(xiàn)了聲音、圖像以及文字窗口的提示,而且在提示故障的發(fā)生時,系統(tǒng)還能進行事故的回推畫面顯示。
3)一鍵復電功能以及無人值守功能。在停電時,能判斷出故障的性質(zhì)并使用技術人員設定好的一鍵復電功能。當無人值守時,用戶可以根據(jù)權限對保護設置實現(xiàn)遠程控制,實現(xiàn)變電所的無人值守功能。在局域網(wǎng)中的計算機,經(jīng)過管理員的授權都可實現(xiàn)對各類數(shù)據(jù)的web瀏覽功能,另外由于后臺數(shù)據(jù)庫采用的是實時讀取訪問技術,所以可以實現(xiàn)對數(shù)據(jù)以及數(shù)據(jù)庫的安全管理。
5結語
計算機及網(wǎng)絡技術的飛速發(fā)展使其在煤礦電網(wǎng)中的應用更為廣泛,使遠程監(jiān)控系統(tǒng)的開發(fā)變?yōu)榭赡?。在進行綜合管理系統(tǒng)開發(fā)之前,監(jiān)控數(shù)據(jù)只能在局、礦調(diào)度室顯示;在對煤礦電網(wǎng)進行綜合管理之后,監(jiān)控數(shù)據(jù)可以在本地服務器上進行保存,并能夠在本企業(yè)內(nèi)部信息網(wǎng)上進行數(shù)據(jù)的傳輸。數(shù)據(jù)挖掘技術的引入,使煤礦電網(wǎng)監(jiān)控運行數(shù)據(jù)分析的效率和深度都得到有效提高,不僅能解決井下監(jiān)控技術的難點問題,還可以解除煤礦安全運行中的重大隱患,在現(xiàn)實生產(chǎn)中有一定的應用推廣前景。
參考文獻
[1] 蔡林沁,謝閱,李鳳得,等.基于Web混合模式的煤礦安全管理信息系統(tǒng)[J].工業(yè)控制計算機, 2002,15(8):7-8.
[2] 夏巍,丁剛,嚴輝.基于CAN 總線的智能煤礦安全監(jiān)控系統(tǒng)的設計[J].工礦自動化, 2006(6): 37-38.
[3] 劉希軍,席波.煤礦井下電網(wǎng)綜合自動化監(jiān)測系統(tǒng)的應用[J].煤炭科學技術, 2008(5): 80-92.
[4] 陳躍,李德臣,袁小平,等.煤礦計算機監(jiān)視監(jiān)控系統(tǒng)中多媒體技術的應用[J].能源技術與管理, 2004(4):68-70.
[5] 張齊,周博慧.組態(tài)軟件實時數(shù)據(jù)庫的設計與實現(xiàn)[J].微計算機信息,2007(6): 161-163.
[6] 錢笑宇,張彥武.工業(yè)實時數(shù)據(jù)庫的研究和設計[J].計算機工程,2005,30(1): 98-99.
[7] 陳京民.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘技術[M ].北京:電子工業(yè)出版社, 2002.
責任編輯鄭練
Design and Implementation of Management System of Coal Mine Power Grid based on Data Mining
LI Yangsheng
(Shaanxi Polytechnic Institute Information Engineering Institute, Xianyang 712000, China)
Abstract:In the traditional coal mine power grid, due to the underground information can’t be timely got, so it is not able to immediately issue a warning for the existence of hidden failure. To solve this problem, based on the data mining technology, and put forward the design of a kind of comprehensive management system, it includes the application of embedded technology, real-time database technology and industrial control configuration software. They can make the efficient operation of the power grid of coal mine. With the data analysis and modeling combined with the data warehouse technology, use a variety of data mining model, and finally reach the purpose of predicting alarm. Based on data mining technology, the coal mine power network integrated management system not only solves the monitoring technology problem, but also may relieves the great hidden danger to the safe operation of coal mine. Mine safety production and resilience capacity can be effectively enhanced.
Key words:data mining, coal mine power network, coal mine power network, real-time monitoring
收稿日期:2015-01-21
作者簡介:李養(yǎng)勝(1974-),男,講師,碩士,主要從事計算機應用和圖像處理等方面的研究。
中圖分類號:TD 611
文獻標志碼:A