基于數(shù)據(jù)挖掘的電力設(shè)備狀態(tài)診斷系統(tǒng)建模

2016-01-20 04:42:03朱付保,霍曉齊,徐顯景

中原工學(xué)院學(xué)報(bào) 2015年3期

朱付保，霍曉齊，徐顯景

(鄭州輕工業(yè)學(xué)院計(jì)算機(jī)與通信工程學(xué)院，鄭州 450001)

摘要：以電力公司的業(yè)務(wù)需求為背景，為實(shí)現(xiàn)電力設(shè)備的狀態(tài)診斷，以數(shù)據(jù)挖掘技術(shù)中的粗糙集和決策樹算法為依據(jù)，采用粗糙集和決策樹相結(jié)合的數(shù)據(jù)處理模型對(duì)電力設(shè)備的各屬性數(shù)據(jù)進(jìn)行了分析處理。綜合運(yùn)用粗糙集和決策樹兩種數(shù)據(jù)挖掘算法，通過粗糙集技術(shù)進(jìn)行屬性約簡(jiǎn)，并運(yùn)用決策樹的ID3算法對(duì)約簡(jiǎn)后的數(shù)據(jù)進(jìn)行分枝、減枝得到規(guī)則集，實(shí)現(xiàn)對(duì)電力設(shè)備工作狀態(tài)的快速、高效診斷，并根據(jù)其工作狀態(tài)提供決策支持。

關(guān)鍵詞：粗糙集；ID3算法；知識(shí)庫；模型庫

中圖分類號(hào)：TP391

文獻(xiàn)標(biāo)志碼：A

DOI:10.3969/j.issn.1671-6906.2015.03.020

Abstract：The system uses the business needs of a power company as the background. For the realization of the state testing of electrical equipment, rough sets and decision tree algorithm belonging to data mining technology is used as the basis. The paper proposes a data processing model combining rough sets with decision tree to realize for power each attribute the data analysis and processing equipment for power each attribute of electrical equipment. Rough sets and decision tree are used in this paper synthetically. Through rough set technology attribute reduction can be realized in this paper. Data which has been reduced is branched and cut branches by the use of the ID3 decision tree algorithm, and then rules in order can be got. At last, the working status of electrical equipment can be diagnosed rapidly and efficiently and the decision support is provided according to their work status.

收稿日期：2014-06-11

基金項(xiàng)目：國家自然科學(xué)基金項(xiàng)目(41171341)

作者簡(jiǎn)介：何淵淘(1983-), 男，河南鄭州人，碩士。

文章編號(hào)：1671-6906(2015)03-0090-05

隨著社會(huì)進(jìn)步和經(jīng)濟(jì)的不斷發(fā)展，工業(yè)在人們的日常生活、生產(chǎn)中起到的作用越來越大。迫于各行業(yè)對(duì)電力能源的巨大需求，電力系統(tǒng)的規(guī)模越來越大，并且不斷朝著超高壓、跨地區(qū)的趨勢(shì)發(fā)展。與此同時(shí)，當(dāng)變壓器、斷路器等電力設(shè)備出現(xiàn)故障時(shí)，給人們的生活和工業(yè)生產(chǎn)帶來的影響也日益增大，這必然對(duì)電力設(shè)備安全、穩(wěn)定、可靠的運(yùn)行提出越來越高的要求。

然而，電力行業(yè)傳統(tǒng)的狀態(tài)檢測(cè)效率并不高。計(jì)劃檢修作為常規(guī)的檢測(cè)方法機(jī)械地按固定周期對(duì)所有電力設(shè)備進(jìn)行檢測(cè)診斷，工作十分繁瑣，且存在工作量大、維修滯后、檢修過剩等問題。引起這些問題的主要原因是沒有對(duì)電力設(shè)備狀態(tài)進(jìn)行充分的分析和評(píng)估，在不同的工作環(huán)境下通過已有的檢測(cè)診斷標(biāo)準(zhǔn)和檢修日志對(duì)設(shè)備進(jìn)行診斷并做出決策并不容易。怎樣根據(jù)以往的真實(shí)數(shù)據(jù)通過刪除不重要的屬性、得到判斷規(guī)則集、對(duì)數(shù)據(jù)進(jìn)行高效分析，從而實(shí)現(xiàn)對(duì)電力設(shè)備的狀態(tài)診斷、異常報(bào)警、決策分析，成為目前亟待解決的問題。

數(shù)據(jù)挖掘能夠?qū)崿F(xiàn)從海量的、無規(guī)則的、有干擾以及隨機(jī)的訓(xùn)練數(shù)據(jù)中提取出隱含的、人們?cè)炔⒉恢赖挠杏眯畔⒑鸵?guī)則[1]。當(dāng)前主要使用數(shù)據(jù)挖掘技術(shù)的屬性約簡(jiǎn)、分類和預(yù)測(cè)等功能。常用的數(shù)據(jù)挖掘方法有粗糙集、神經(jīng)網(wǎng)絡(luò)、決策樹和聚類分析等[2]。

本文利用數(shù)據(jù)挖掘中的粗糙集和決策樹建立數(shù)據(jù)處理模型，使用粗糙集算法對(duì)集合屬性進(jìn)行約簡(jiǎn)，并使用決策樹的ID3算法將簡(jiǎn)約后的結(jié)果進(jìn)行規(guī)則提取，實(shí)現(xiàn)對(duì)電力設(shè)備狀態(tài)的高效、快捷判斷。

1粗糙集算法

粗糙集理論是一種新的處理模糊和不確定知識(shí)的數(shù)學(xué)工具，最早起源于波蘭數(shù)學(xué)家Pawlak Z于1982年提出的數(shù)學(xué)分析理論[3]。粗糙集理論的主要任務(wù)是近似分類、知識(shí)約簡(jiǎn)、屬性相依性分析、根據(jù)決策表產(chǎn)生最優(yōu)或次優(yōu)決策控制算法等。粗糙集理論的主要思想是在保持分類能力不變的條件下，通過知識(shí)約簡(jiǎn)，導(dǎo)出問題的決策或分類規(guī)則。

1.1知識(shí)的含義

在粗糙集理論體系中，知識(shí)用來表示一種分類的能力。日常生活中，人們的各種行為其實(shí)就是辨別現(xiàn)實(shí)和抽象的對(duì)象的能力。假使起初已經(jīng)掌握了論域研究對(duì)象的必要的信息和知識(shí)，就可以通過這些已有的知識(shí)將其劃分到不同的類別當(dāng)中。假如兩個(gè)對(duì)象具有完全相同的信息，那么它們是不可區(qū)分的，也就是說當(dāng)前已有的信息并不能夠?qū)⑵浞珠_。

粗糙集的核心理論是等價(jià)關(guān)系，一般可以用等價(jià)關(guān)系來代替分類，根據(jù)已有的等價(jià)關(guān)系將樣本集合劃分為等價(jià)類。從知識(shí)庫的觀點(diǎn)來看，每一個(gè)等價(jià)類可以被稱為一個(gè)概念，也就是一條知識(shí)或規(guī)則。每個(gè)等價(jià)類可以唯一地用來表示一個(gè)概念，歸屬于同一個(gè)等價(jià)類的不同對(duì)象對(duì)于給定概念不能進(jìn)行區(qū)分。

1.2粗糙集的定義

定義1知識(shí)表達(dá)系統(tǒng)

一個(gè)知識(shí)表達(dá)系統(tǒng)A可以表示為有序四元組：A={U,R,V,f}，具體說明如表1。

表1　知識(shí)表達(dá)系統(tǒng)說明

定義2不可分辨關(guān)系

在粗糙集中，可以用多種信息來描述論域中的對(duì)象。如果兩個(gè)不同的對(duì)象是被完全相同的屬性所描述，則這兩個(gè)對(duì)象在信息系統(tǒng)中被歸為同一類，兩個(gè)對(duì)象之間的關(guān)系被稱為不可分辨關(guān)系。也就是對(duì)任意屬性子集B∈R，假若對(duì)象xi、xj∈U，?r∈B，只有當(dāng)f(xi，r)=f(xj，r)時(shí)，xi與xj為不可分辨對(duì)象，也簡(jiǎn)記作Ind(B)。不可分辨關(guān)系亦被稱作等價(jià)關(guān)系。

定義3上近似集和下近似集

上近似集：根據(jù)已有的知識(shí)R，判別論域U中一定屬于和可能屬于集合X的對(duì)象所組成的集合，公式表示如下：

R-(X)={x∈U，[x]R ∩X≠?}

(1)

式中，[x]R為等級(jí)關(guān)系R中的包含x元素的等價(jià)類。

下近似集：根據(jù)現(xiàn)存的知識(shí)R，判別論域U中全部一定屬于集合X的對(duì)象所組成的集合，公式表示如下：

R_(X)={x∈U，[x]R∈X}

(2)

式中，[x]R為等級(jí)關(guān)系R中的包含x元素的等價(jià)類。

通過上述上近似集和下近似集的定義可知，對(duì)于一個(gè)給定的知識(shí)表達(dá)系統(tǒng)S={U，R，V，f}，X∈U表示一個(gè)樣本子集，R表示等價(jià)關(guān)系，那么一切包含于X的基本集合的并集即為R_(X)，一切與X的交集不為空的基本集合的并集即為R-(X)。

定義4粗糙度

在論域U中，對(duì)于知識(shí)R，所選樣本子集X的不確定性可用粗糙度來度量，公式表示如下：

(3)

aR(X)通常也被稱為近似精確度，Card為集合的基數(shù)，即集合中元素的個(gè)數(shù)。易知，0≤aR(X)≤1，當(dāng)aR(X)取值為1時(shí)，則集合X對(duì)于R為確定的；假如aR(X)≤1，則集合X對(duì)于R是粗糙的。

定義5假設(shè)Q∈P，若Q為獨(dú)立,并且Ind(Q)=Ind(R)，那么稱Q為等價(jià)關(guān)系族P的一個(gè)約簡(jiǎn)，簡(jiǎn)記作Red(P)。在P中所有不可省略關(guān)系的集合稱為等價(jià)關(guān)系P的核，記作Core(P)。屬性約簡(jiǎn)和核之間的關(guān)系為：屬性約簡(jiǎn)集合Red(P)的交集就是P的核，即Core=∩Red(P)。核不僅是所有約簡(jiǎn)的計(jì)算基礎(chǔ)，是知識(shí)庫的最重要的組成部分，也是知識(shí)約簡(jiǎn)時(shí)不能刪掉的屬性[4]。

2決策樹

2.1分類的概念

分類是找出描述并區(qū)分?jǐn)?shù)據(jù)類或概念的模型(或函數(shù))，以便能夠使用模型來預(yù)測(cè)類標(biāo)記未知的對(duì)象類[5]。分類的目的是構(gòu)造一個(gè)分類函數(shù)或分類模型(也常常稱作分類器)，該模型能把數(shù)據(jù)庫中的數(shù)據(jù)項(xiàng)映射到給定類別中的某一個(gè)。

常用的分類方法有貝葉斯算法、粗糙集算法、神經(jīng)網(wǎng)絡(luò)算法、決策樹算法等?；跊Q策樹算法不需要繁瑣的先驗(yàn)知識(shí)，就能夠分析處理復(fù)雜的海量高維數(shù)據(jù)，獲得規(guī)則的方法簡(jiǎn)單快捷。因此，診斷模型選用決策樹作為分類方法。

2.2決策樹的介紹

決策樹是一種簡(jiǎn)單高效的分類算法，能夠從海量的隨機(jī)樣本中經(jīng)過分析推斷出可以用樹狀形式表示的規(guī)則集。與流程圖中樹的結(jié)構(gòu)特別相像，決策樹的最高層為根節(jié)點(diǎn)；最底層的節(jié)點(diǎn)為葉子節(jié)點(diǎn)，代表一種分類；根節(jié)點(diǎn)與葉子節(jié)點(diǎn)之間為內(nèi)部節(jié)點(diǎn)，在內(nèi)部節(jié)點(diǎn)上進(jìn)行特定屬性的訓(xùn)練檢測(cè)，特定屬性通過ID3算法中的信息增益標(biāo)準(zhǔn)來確定，各個(gè)分支表示檢測(cè)輸出。其中，通過構(gòu)建的決策樹來檢測(cè)隨機(jī)樣本的各個(gè)屬性值，檢測(cè)路徑由根節(jié)點(diǎn)到葉子節(jié)點(diǎn)，得到分類結(jié)果進(jìn)而形成分類模型。分類模型形成后，通過測(cè)試數(shù)據(jù)集對(duì)模型的準(zhǔn)確率進(jìn)行估量，經(jīng)測(cè)試完全符合標(biāo)準(zhǔn)的模型才能夠用來進(jìn)行樣本分類預(yù)測(cè)，其原理如圖1所示。

圖1　決策樹工作原理

2.3ID3算法

定義6信息熵

已知隨機(jī)樣本集合T中樣本個(gè)數(shù)為a，類別屬性有n個(gè)互不相同的值，可以得出n個(gè)類別Mi(i=1,2,…,n)。假設(shè)類別值為Mi的樣本個(gè)數(shù)為ai,則對(duì)某一樣本進(jìn)行分類需要的期望信息[6]如式(4)所示：

(4)

式中，pi為樣本集合中Mi的概率值，可以用ai/a進(jìn)行計(jì)算。由于信息需用二進(jìn)制進(jìn)行編碼，上述公式中的對(duì)數(shù)底數(shù)值取2。

定義7信息增益

假定{b1,b2,…,be}是屬性B的e個(gè)不相同的值，按照屬性B可以將T劃分成e個(gè)子集合{a1,a2,…,ae}；aj表示樣本T中在屬性B上取值為bj的子集,假若選屬性B作為決策樹的測(cè)試屬性，則以上的子集即與由節(jié)點(diǎn)生成的分枝相對(duì)應(yīng)，并且由屬性B對(duì)集合進(jìn)行劃分的期望信息可以由式(5)求出：

(5)

Gain(B)=L(a1,a2,…,an)-E(B)

(6)

在構(gòu)造決策樹的過程中，通過比較各個(gè)屬性的信息增益的大小，選擇信息增益值最大的屬性作為隨機(jī)樣本的測(cè)試屬性。

ID3算法就是通過各個(gè)屬性的信息增益來選擇測(cè)試屬性構(gòu)造決策樹的，其構(gòu)造過程如圖2所示。

圖2　ID3算法構(gòu)造決策樹的流程圖

在決策樹的構(gòu)建過程中，通過信息增益值來選擇內(nèi)部節(jié)點(diǎn)的測(cè)試屬性。將信息增益值最大的屬性選作特定節(jié)點(diǎn)的測(cè)試屬性[7]，確保選中的測(cè)試屬性在對(duì)隨機(jī)樣本數(shù)據(jù)進(jìn)行分類時(shí)所需要的信息量最小，且反映出劃分的最小隨機(jī)性。使用ID3算法可以保證對(duì)樣本對(duì)象進(jìn)行分類時(shí)期望檢測(cè)次數(shù)達(dá)到最少，而且方便計(jì)算出一棵簡(jiǎn)單的決策樹。

3粗糙集和決策樹相結(jié)合的算法模型

粗糙集方法和其他一些不確定方法一樣，都能夠處理含糊的和不確定的數(shù)學(xué)問題，然而粗糙集理論自身并沒有處理不確定和不準(zhǔn)確數(shù)據(jù)的機(jī)制。決策樹技術(shù)雖然也有很多優(yōu)點(diǎn)，卻不能刪除不相關(guān)和有干擾性的屬性。此外，當(dāng)前在構(gòu)造決策樹的過程中，通常選擇單個(gè)屬性作為測(cè)試屬性。

根據(jù)粗糙集和決策樹各自的優(yōu)缺點(diǎn)，本文將二者結(jié)合起來，取長(zhǎng)補(bǔ)短，建立粗糙集-決策樹數(shù)據(jù)處理模型，如圖3所示。

圖3　粗糙集-決策樹數(shù)據(jù)處理模型

在數(shù)據(jù)處理模型中用到的數(shù)據(jù)主要有兩類，一類用作訓(xùn)練測(cè)試，一類用作對(duì)訓(xùn)練結(jié)果進(jìn)行驗(yàn)證。根據(jù)屬性判斷指標(biāo)對(duì)訓(xùn)練數(shù)據(jù)集進(jìn)行離散化處理[8]，將處理過的數(shù)據(jù)中重復(fù)的數(shù)據(jù)予以刪除，從而實(shí)現(xiàn)對(duì)訓(xùn)練數(shù)據(jù)集的清洗；根據(jù)已經(jīng)預(yù)處理過的樣本對(duì)象建立決策表，決策表中的數(shù)據(jù)是建立數(shù)據(jù)處理模型的數(shù)據(jù)分析來源。根據(jù)決策表生成分辨矩陣，由分辨函數(shù)得出樣本數(shù)據(jù)集的核，進(jìn)而根據(jù)核值計(jì)算出約簡(jiǎn)集，得出約簡(jiǎn)后的決策表，利用ID3算法生成簡(jiǎn)單的決策樹。

通常情況下，由簡(jiǎn)單的決策樹得到的規(guī)則集形式并不是最簡(jiǎn)的，需采用后剪枝算法對(duì)生成的決策樹進(jìn)行剪枝，通過刪除內(nèi)部節(jié)點(diǎn)的分枝，剪掉樹節(jié)點(diǎn)。對(duì)于樹中每一個(gè)非樹葉節(jié)點(diǎn)，計(jì)算該節(jié)點(diǎn)上的子樹被剪枝可能出現(xiàn)的期望錯(cuò)誤率。然后，使用每個(gè)分枝的錯(cuò)誤率，結(jié)合沿每個(gè)分枝觀察的權(quán)重評(píng)估，計(jì)算出對(duì)該節(jié)點(diǎn)剪枝后的期望錯(cuò)誤率。如果剪去該節(jié)點(diǎn)導(dǎo)致較高的期望錯(cuò)誤率，則保留該子樹；否則，剪去該子樹。產(chǎn)生一組逐漸被剪枝的樹之后，使用一個(gè)獨(dú)立的測(cè)試集評(píng)估每棵樹的準(zhǔn)確率，得到具有最小期望錯(cuò)誤率的決策樹，根據(jù)剪枝后的決策樹生成相應(yīng)規(guī)則。運(yùn)用驗(yàn)證數(shù)據(jù)集對(duì)生成的規(guī)則進(jìn)行驗(yàn)證，若生成規(guī)則不符合，或未達(dá)到預(yù)期標(biāo)準(zhǔn)，則重新進(jìn)行計(jì)算，直至生成規(guī)則符合要求。

4系統(tǒng)實(shí)現(xiàn)

4.1邏輯結(jié)構(gòu)

根據(jù)電力設(shè)備狀態(tài)診斷系統(tǒng)的需求，電力設(shè)備狀態(tài)檢測(cè)系統(tǒng)的邏輯體系結(jié)構(gòu)設(shè)計(jì)如圖4所示。

圖4　系統(tǒng)邏輯結(jié)構(gòu)圖

Web終端是客戶端部分，用戶可以通過終端對(duì)系統(tǒng)進(jìn)行操作，并將請(qǐng)求向服務(wù)器提交。Web服務(wù)器將用戶請(qǐng)求傳遞給診斷系統(tǒng)的控制模塊部分，最終將處理結(jié)果以圖、樹等多種形式返回給客戶端。根據(jù)服務(wù)器返回的數(shù)據(jù)形式，Web服務(wù)器負(fù)責(zé)生成相應(yīng)的圖表，終端部分將最終的結(jié)果予以呈現(xiàn)。

設(shè)備狀態(tài)檢修專業(yè)知識(shí)庫中存放著大量的業(yè)務(wù)經(jīng)驗(yàn)數(shù)據(jù)。通過數(shù)據(jù)挖掘模塊得到的結(jié)果可以通過知識(shí)庫中存放的數(shù)據(jù)進(jìn)行修正。部分經(jīng)過數(shù)據(jù)挖掘得到的規(guī)則[9]和信息也會(huì)被存放到知識(shí)庫當(dāng)中，為下次同樣分析做參考使用。

告警庫是狀態(tài)診斷系統(tǒng)中的另一個(gè)獨(dú)立的數(shù)據(jù)庫系統(tǒng)，電力設(shè)備的告警信息就存放在其中。通過對(duì)告警信息進(jìn)行處理，可以更加準(zhǔn)確地對(duì)數(shù)據(jù)進(jìn)行分析處理[10]。

數(shù)據(jù)庫是關(guān)系到數(shù)據(jù)診斷系統(tǒng)正常工作的最基本的組成部分，是整個(gè)系統(tǒng)的基本數(shù)據(jù)來源，其主要組成部分包括整個(gè)電力公司的設(shè)備運(yùn)行時(shí)的真實(shí)數(shù)據(jù)和部分歷史數(shù)據(jù)。數(shù)據(jù)挖掘模塊中用到的數(shù)據(jù)都來源于數(shù)據(jù)庫。從其他庫中抽取的經(jīng)過處理的數(shù)據(jù)也存放在該數(shù)據(jù)庫中。系統(tǒng)對(duì)數(shù)據(jù)庫最多的操作是數(shù)據(jù)提取、變換、集成等。

模型庫中存儲(chǔ)著系統(tǒng)的業(yè)務(wù)處理方法和接口，數(shù)據(jù)處理方法、挖掘方法等的實(shí)現(xiàn)程序都存放在模型庫中。通過在方法管理模塊進(jìn)行注冊(cè)，能夠?qū)ν馓峁┙y(tǒng)一的接口，在方法庫中所有遵循模型庫接口規(guī)范的方法都可以被使用。各個(gè)模型自身并不存在業(yè)務(wù)背景，每個(gè)模型關(guān)心的只是數(shù)據(jù)輸入的個(gè)數(shù)以及類型，各個(gè)模型都嚴(yán)格執(zhí)行相應(yīng)的數(shù)據(jù)處理，而與數(shù)據(jù)涉及的業(yè)務(wù)邏輯無關(guān)。只需在方法庫中設(shè)置一個(gè)包裝程序，并將標(biāo)準(zhǔn)形式的參數(shù)進(jìn)行輸入，就能夠得到用戶需要的結(jié)果。

4.2系統(tǒng)架構(gòu)

系統(tǒng)使用了JavaEE中的Struts2、Spring、AJAX等技術(shù)，使用Struts2實(shí)現(xiàn)MVC開發(fā)模式的設(shè)計(jì)，運(yùn)用Spring的分層架構(gòu)靈活選擇所需組件，利用AJAX技術(shù)高效實(shí)現(xiàn)用戶與前臺(tái)頁面的動(dòng)態(tài)交互。通過這些開發(fā)技術(shù)，有效實(shí)現(xiàn)了功能模塊和系統(tǒng)代碼間的松耦合，并且使系統(tǒng)的工作效率得到極大提高。

開發(fā)平臺(tái)選用Myeclipse，采用Java作為編碼語言?？蛻舳送ㄟ^采用JSP+CSS+JavaScript技術(shù)，高效實(shí)現(xiàn)頁面的交互性。通過點(diǎn)擊界面左側(cè)的級(jí)聯(lián)菜單，可以方便地選擇需要查看的電力設(shè)備。導(dǎo)入設(shè)備的數(shù)據(jù)報(bào)表，通過后臺(tái)的算法處理，即可便捷地查看設(shè)備的工作狀態(tài)。

5結(jié)語

系統(tǒng)運(yùn)用數(shù)據(jù)挖掘中粗糙集和決策樹相結(jié)合的數(shù)據(jù)分析模型對(duì)變壓器等電力設(shè)備的屬性數(shù)據(jù)進(jìn)行分析和處理，根據(jù)最后生成的規(guī)則集構(gòu)建知識(shí)庫，為電力設(shè)備工作狀態(tài)的診斷提供了依據(jù)。通過采用Web開發(fā)中的Struts2、Spring、 AJAX等技術(shù)，降低了代碼之間的耦合性，不僅提高了工作效率，也便于系統(tǒng)的擴(kuò)展開發(fā)。

通過構(gòu)造粗糙集和決策樹的數(shù)據(jù)挖掘模型，將變壓器等電力設(shè)備的狀態(tài)診斷技術(shù)與數(shù)據(jù)挖掘技術(shù)相結(jié)合，提高了對(duì)系統(tǒng)數(shù)據(jù)庫中用到的海量數(shù)據(jù)的處理能力。通過對(duì)生成的規(guī)則集和狀態(tài)指標(biāo)進(jìn)行分析，實(shí)現(xiàn)了電力設(shè)備工作狀態(tài)的預(yù)測(cè)、評(píng)估、檢修等功能，為電力設(shè)備正常、穩(wěn)定地運(yùn)行提供了可靠的保障。

參考文獻(xiàn):

[1]徐曉，翟敬梅，劉海濤，等.制造決策的知識(shí)融合粗糙集模型[J].華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,39(8):36-40.

[2]胡燕，王慧琴，秦薇薇. 基于粗糙集的火災(zāi)圖像特征選擇與識(shí)別[J].計(jì)算機(jī)應(yīng)用,2013,33(3):704-707.

[3]劉興文，王典洪，陳分雄. 一種基于變精度粗糙集的C4.5決策樹改進(jìn)算法[J].計(jì)算機(jī)應(yīng)用研究,2011,28(10):3649-3651.

[4]費(fèi)洪曉，胡琳. 一種粗糙集-決策樹結(jié)合的入侵檢測(cè)方法[J]. 計(jì)算機(jī)工程與應(yīng)用,2012,48(22):124-128.

[5]張軍，李鵬. 動(dòng)態(tài)粗集理論在決策樹算法中的應(yīng)用研究[J].計(jì)算機(jī)應(yīng)用與軟件,2013,30(8):99-101.

[6]張明，唐振民，楊習(xí)貝.基于粗糙集的拒絕決策規(guī)則獲取和約簡(jiǎn)[J].計(jì)算機(jī)工程,2011,37(3):22-24.

[7]王飛，王卓，曾姚.基于變精度粗糙集的決策樹構(gòu)造改進(jìn)算法[J].計(jì)算機(jī)與數(shù)字工程,2013(3):337-339.

[8]翟俊海,翟夢(mèng)堯,李勝杰.基于相容粗糙集技術(shù)的連續(xù)值屬性決策樹歸納[J].計(jì)算機(jī)科學(xué),2012,39(11):183-186.

[9]王永梅，胡學(xué)鋼. 決策樹中ID3算法的研究[J]. 安徽大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,35(3):71-75.

[10]盧錚松.研究生獎(jiǎng)學(xué)金的決策樹分類數(shù)據(jù)挖掘研究[J].計(jì)算機(jī)工程與應(yīng)用，2012,48(26):139-144.

(責(zé)任編輯：席艷君)

The Modeling of the Power Equipment Condition Diagnostic

System Based on Data Mining

ZHU Fu-bao， HUO Xiao-qi， XU Xian-jing

(Zhengzhou University of Light Industry, Zhengzhou 450002, China)

Key words：rough sets; ID3 algorithm; knowledge base; model library