黃勇+胡連城+劉增良
摘 要: 針對(duì)工業(yè)光纖網(wǎng)絡(luò)通信故障檢測(cè)過程繁瑣、效率低的問題,設(shè)計(jì)了一種基于優(yōu)化的決策樹數(shù)據(jù)挖掘算法的光纖網(wǎng)絡(luò)通信故障檢測(cè)系統(tǒng)。系統(tǒng)以減少檢測(cè)器重復(fù)工作和準(zhǔn)確定位為目標(biāo),引入以決策樹為核心的故障數(shù)據(jù)挖掘模塊,降低了對(duì)非己空間的故障挖掘時(shí)間。將第一階光纖網(wǎng)絡(luò)故障分類時(shí)僅以IP地址作為參量變成第二階分類時(shí)使用指定的網(wǎng)絡(luò)指標(biāo)為基礎(chǔ)構(gòu)建決策樹,進(jìn)一步提高故障檢測(cè)精度。對(duì)某車輛制造企業(yè)現(xiàn)有的光纖網(wǎng)絡(luò)應(yīng)用結(jié)果表明,與標(biāo)準(zhǔn)決策樹方法相比,該算法將精度從69.0%提升到99.9%,將誤報(bào)率從3.14%降低到0.48%,優(yōu)化效果明顯。
關(guān)鍵詞: 光纖網(wǎng)絡(luò); 通信故障檢測(cè); 故障診斷; 數(shù)據(jù)挖掘; 決策樹
中圖分類號(hào): TN711?34; TP23 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2014)20?0134?03
Industrial fiber network communication fault detection system based on decision tree algorithm
HUANG Yong1, 2, HU Lian?cheng2, LIU Zeng?liang3
(1. School of Automation, University of Science and Technology Beijing, Beijing 100083, China;
2. Communication Network Technology Management Center of Beijing Military District, Beijing 100041, China;
3. National Defense University of PLA China, Beijing 100091, China)
Abstract: For tedious fault detection process and low detection efficiency of industrial optical network communication, an optical fiber network communication fault detection system based on optimized decision tree data mining algorithm was designed. In order to reduce the repeated rework of detector and realize accurate positioning, the fault data mining module taking the decision tree as the core was introduced into the system to reduce the time of fault mining in not its own space. Only taking the IP address as a parameter in the first?order fiber?optic network fault classification is changed into the construction of decision tree based on the specified network index in the second?order classification, which further improves the accuracy of fault detection. The application results of optical network existing in a vehicle manufacturing enterprise show that, compared with the standard method of decision tree, this algorithm has increased accuracy from 69.0% to 99.9%, and reduced the false report rate from 3.14% to 0.48%. The optimization effect is obvious.
Keywords: fiber network; communication fault detection; fault diagnosis; data mining; decision tree
0 引 言
光纖網(wǎng)絡(luò)支持光纖應(yīng)用系統(tǒng)和工業(yè)生產(chǎn)過程之間的通信,目前主要的控制網(wǎng)絡(luò)有樓宇自動(dòng)化、工廠自動(dòng)化和過程自動(dòng)化[1]??刂凭W(wǎng)絡(luò)有許多不同的作用和應(yīng)用環(huán)境,通常部署在支持安全可靠通信的緊要使命操作環(huán)節(jié),這樣可確保光纖網(wǎng)絡(luò)通信會(huì)話的服務(wù)質(zhì)量,并使通信延遲最小。許多傳統(tǒng)的光纖網(wǎng)絡(luò)如基金會(huì)現(xiàn)場(chǎng)總線、數(shù)字化現(xiàn)場(chǎng)總線、ModBus現(xiàn)場(chǎng)總線等主要依靠專有協(xié)議,這些控制網(wǎng)絡(luò)技術(shù)獨(dú)立于如今蓬勃發(fā)展的以太網(wǎng)和基于網(wǎng)際協(xié)議(IP)的網(wǎng)絡(luò)技術(shù)。但是由于以太網(wǎng)和IP技術(shù)的成本低廉、可擴(kuò)展性強(qiáng)、易于維護(hù)等優(yōu)勢(shì),這些網(wǎng)絡(luò)近來也逐漸引入工業(yè)以太網(wǎng)和IP技術(shù)[2]。但是,當(dāng)采用基于IP的控制網(wǎng)絡(luò)技術(shù)后,將不得不面臨IP網(wǎng)絡(luò)中常見的網(wǎng)絡(luò)問題。網(wǎng)絡(luò)級(jí)錯(cuò)誤和光纖網(wǎng)絡(luò)中的錯(cuò)誤大相迥異。網(wǎng)絡(luò)級(jí)錯(cuò)誤例如包重傳和校驗(yàn)錯(cuò)誤等是光纖網(wǎng)絡(luò)錯(cuò)誤的癥狀之一,明確的控制網(wǎng)絡(luò)錯(cuò)誤和網(wǎng)絡(luò)級(jí)錯(cuò)誤常并發(fā)于網(wǎng)絡(luò)條件差的IP網(wǎng)絡(luò)中[3]。因而光纖網(wǎng)絡(luò)故障檢測(cè)系統(tǒng)的主要需求就是能夠理解網(wǎng)絡(luò)級(jí)癥狀和實(shí)際錯(cuò)誤間的關(guān)聯(lián),在此基礎(chǔ)上設(shè)計(jì)了一套基于決策樹的光纖網(wǎng)絡(luò)通信故障檢測(cè)系統(tǒng),用于車輛制造企業(yè)的光纖網(wǎng)絡(luò)。
1 光纖網(wǎng)絡(luò)結(jié)構(gòu)分析
常見的光纖網(wǎng)絡(luò)結(jié)構(gòu)是金字塔式的[4],如圖 1所示。頂層的控制器驅(qū)動(dòng)下層被控設(shè)備執(zhí)行既定操作,最頂層的是光纖控制器(PC),一般使用人機(jī)界面,是可編程邏輯控制器(PLC)開發(fā)商提供的軟硬件包,是在電腦上運(yùn)行的光纖應(yīng)用軟件,可快捷方便地訪問下層的PLC,通過開發(fā)商提供的服務(wù)器應(yīng)用軟件進(jìn)行通信,其圖形用戶界面提供實(shí)時(shí)監(jiān)控結(jié)果,之間的連接使用有連接的TCP協(xié)議。中層的PLC是連接光纖網(wǎng)絡(luò)的光纖單片機(jī),一系列復(fù)雜的控制裝置或工廠流水線上的低端控制設(shè)備通過PLC上運(yùn)行的定制軟件程序處理運(yùn)行。下層的被控設(shè)備種類繁雜,涉及傳感器、制動(dòng)器、電動(dòng)機(jī)等設(shè)備,通過嵌入式接口接收上層PLC的命令信息。其中頂層PC和中層PLC通過以太網(wǎng)連接,PLC和底層的被控設(shè)備通過專有協(xié)議連接。
圖1 光纖網(wǎng)絡(luò)結(jié)構(gòu)
光纖網(wǎng)絡(luò)中的設(shè)備必須同步或順序運(yùn)行,一個(gè)微小的網(wǎng)絡(luò)錯(cuò)誤可能就是致命的,換言之,控制設(shè)備的一個(gè)錯(cuò)誤可能會(huì)迫使整個(gè)生產(chǎn)過程耽擱甚至停滯,帶來巨大的經(jīng)濟(jì)損失。因此,光纖網(wǎng)絡(luò)中快速準(zhǔn)確的故障檢測(cè)舉足輕重。
2 光纖網(wǎng)絡(luò)故障檢測(cè)和故障診斷
2.1 故障類型分析極其弊端
通過分析光纖網(wǎng)絡(luò)錯(cuò)誤的實(shí)際案例,可知其故障主要分為四類:IP連接故障、網(wǎng)絡(luò)配置錯(cuò)誤、物理故障、軟件故障[5],其主要的故障現(xiàn)象如表 1所示。
目前已有的IP網(wǎng)絡(luò)故障診斷工具如嗅探器等不具備分析光纖網(wǎng)絡(luò)故障的能力,不能提供故障成因,而且控制網(wǎng)絡(luò)故障的早期癥狀常夾雜著網(wǎng)絡(luò)級(jí)錯(cuò)誤。常見的IP網(wǎng)絡(luò)指標(biāo)有幀沖突、巨型幀、超短幀、循環(huán)冗余碼錯(cuò)誤幀、TCP校驗(yàn)錯(cuò)誤、分片報(bào)文、重傳報(bào)文、分組到達(dá)間隔時(shí)間、吞吐率、包突發(fā),通過分析可知網(wǎng)絡(luò)故障的報(bào)警條件,這些指標(biāo)本身并不獨(dú)特,但并不在大多數(shù)的商業(yè)IP網(wǎng)絡(luò)診斷工具的分析對(duì)象之列。由于常用工具不能完全檢測(cè)出控制網(wǎng)絡(luò)故障僅能生成故障網(wǎng)絡(luò)警報(bào),因此需要設(shè)置新的監(jiān)控分類和條件,可使用被動(dòng)網(wǎng)絡(luò)監(jiān)控技術(shù),不會(huì)影響網(wǎng)絡(luò)運(yùn)行。本文設(shè)計(jì)的檢測(cè)結(jié)構(gòu)的部分監(jiān)測(cè)指標(biāo)及報(bào)警條件如表 2所示。
表1 常見的光纖網(wǎng)絡(luò)錯(cuò)誤
表2 監(jiān)測(cè)指標(biāo)及報(bào)警條件
在每個(gè)涉及共享地址和端口的雙向數(shù)據(jù)包傳輸?shù)牧髁啃畔⒅卸急O(jiān)測(cè)這類指標(biāo),只要出現(xiàn)異常就發(fā)布警報(bào),因?yàn)檫@類指標(biāo)異常只要出現(xiàn)就意味著發(fā)生通信故障的可能,即這類指標(biāo)的突變意味著光纖網(wǎng)絡(luò)的運(yùn)行異常。網(wǎng)絡(luò)管理員識(shí)別出早期的控制網(wǎng)絡(luò)通信故障是非常關(guān)鍵的,操作者必須調(diào)查大量數(shù)據(jù)尋出網(wǎng)絡(luò)連接異常序列,由于不同設(shè)備的控制網(wǎng)絡(luò)有不同的通信量特性和故障案例,因此需要一個(gè)能夠自動(dòng)地從歷史故障數(shù)據(jù)中提取故障檢測(cè)規(guī)則的系統(tǒng),決策樹是一種非常合適的選擇,可自動(dòng)生成反映操作控制網(wǎng)絡(luò)通信異常的規(guī)則用于故障檢測(cè)。
2.2 決策樹的引入光纖網(wǎng)絡(luò)通信挖掘優(yōu)化
傳統(tǒng)的故障挖掘算法面臨2個(gè)難題:檢測(cè)時(shí)間過長(zhǎng),由于需要在大量網(wǎng)絡(luò)數(shù)據(jù)中進(jìn)行響應(yīng)的操作,因此搜索過程極其耗時(shí);由于冗余信息的干擾,降低了系統(tǒng)檢測(cè)的精度。
光纖網(wǎng)絡(luò)通信數(shù)據(jù)挖掘充當(dāng)控制網(wǎng)絡(luò)故障檢測(cè)的推理機(jī),根據(jù)檢修案例、用戶經(jīng)驗(yàn)和網(wǎng)絡(luò)測(cè)量指標(biāo),推測(cè)出故障與網(wǎng)絡(luò)指標(biāo)間的關(guān)聯(lián),這種關(guān)聯(lián)被轉(zhuǎn)化為故障檢測(cè)規(guī)則應(yīng)用于故障檢測(cè)系統(tǒng)。決策樹可以很好地解決這兩個(gè)問題。
決策樹用于歸類有共同屬性的數(shù)據(jù)[6],每一個(gè)決策樹代表了一種用于區(qū)分屬性的規(guī)則,主要包含內(nèi)部節(jié)點(diǎn)、葉節(jié)點(diǎn)和邊界。內(nèi)部節(jié)點(diǎn)指明區(qū)分?jǐn)?shù)據(jù)的屬性,邊界根據(jù)母節(jié)點(diǎn)的屬性條件予以標(biāo)記,葉節(jié)點(diǎn)根據(jù)數(shù)據(jù)劃分的決策值標(biāo)記,決策樹已證明在網(wǎng)絡(luò)故障檢測(cè)效果較好。在控制網(wǎng)絡(luò)中,IP地址和商品號(hào)標(biāo)記結(jié)點(diǎn),故障或正常標(biāo)記葉名,而標(biāo)注箭頭定為邊界。決策樹根據(jù)訓(xùn)練數(shù)據(jù)使用信息獲取函數(shù)構(gòu)建,通過修剪決策樹獲得學(xué)習(xí)信息,這個(gè)過程會(huì)犧牲分類的精確性,如果沒有網(wǎng)絡(luò)故障則所有結(jié)點(diǎn)都標(biāo)記為正常。修剪前后的故障決策樹如圖2所示。
圖2 修剪前后的故障決策樹
3 實(shí)用效果分析
使用國(guó)內(nèi)某汽車生產(chǎn)公司的生產(chǎn)光纖網(wǎng)絡(luò)完全的數(shù)據(jù)包跟蹤,其周期為4天,光纖網(wǎng)絡(luò)通信總數(shù)據(jù)流量是62 GB。這些流量數(shù)據(jù)被合成有共同網(wǎng)絡(luò)特征的數(shù)據(jù)流,然后進(jìn)行特征提取,相關(guān)的特征是前文提及的網(wǎng)絡(luò)指標(biāo)。分析并標(biāo)記數(shù)據(jù)集中的數(shù)據(jù)流,為了便于訓(xùn)練和檢驗(yàn),每個(gè)數(shù)據(jù)流排成一行,并標(biāo)記正?;蛘吖收?。表3所示為用于訓(xùn)練和檢驗(yàn)步驟的示例數(shù)據(jù),包含58 123行正常數(shù)據(jù)和3 317行故障數(shù)據(jù)。
表3 實(shí)驗(yàn)示例數(shù)據(jù)
為了測(cè)量決策樹對(duì)于光纖網(wǎng)絡(luò)通信網(wǎng)絡(luò)故障識(shí)別結(jié)果的精確度,引入數(shù)據(jù)決策技術(shù)中常用來評(píng)估精確度的三個(gè)參量:精度(PV)、檢索率(RP),可由精度(TP)、假陽(yáng)性(FP)和假陰性(FN)計(jì)算得出,正確分選的對(duì)象數(shù)目占數(shù)目的比例為測(cè)量精度,反之為漏報(bào)率,正確對(duì)象被錯(cuò)誤分選為其他類型則為假陰性,檢索率反映被錯(cuò)誤歸類的對(duì)象比例,計(jì)算如式(1),式(2)所示。
[PV=TP(TP+FP)] (1)
[RP=TP(TP+FN)] (2)
在故障檢測(cè)中,降低漏報(bào)率值是非常關(guān)鍵的,因?yàn)檎`判故障數(shù)據(jù)為正常數(shù)據(jù)將會(huì)導(dǎo)致發(fā)生故障造成經(jīng)濟(jì)損失,必須予以糾正,這也是檢驗(yàn)故障檢測(cè)技術(shù)的重要參考值。在實(shí)驗(yàn)1中,首先用上文提到的光纖網(wǎng)絡(luò)通信網(wǎng)絡(luò)指標(biāo)建立決策樹,并對(duì)決策樹進(jìn)行剪枝。實(shí)驗(yàn)2以IP連接的源地址和目的地址對(duì)作為特征值,對(duì)決策樹進(jìn)行剪枝,檢驗(yàn)假陰性指標(biāo)。實(shí)驗(yàn)3原理同實(shí)驗(yàn)2一樣,只是不對(duì)決策樹進(jìn)行剪枝。實(shí)驗(yàn)4用二階決策樹分類方法,即在第一階分類時(shí)僅以IP地址作為參量,第二階分類時(shí)使用上文提及的網(wǎng)絡(luò)指標(biāo)為基礎(chǔ)構(gòu)建決策樹。實(shí)驗(yàn)結(jié)果如表4所示。
表4 實(shí)驗(yàn)結(jié)果
由表4可知,實(shí)驗(yàn)1即標(biāo)準(zhǔn)的光纖網(wǎng)絡(luò)通信決策樹方法都可以保證較高的精度和檢索率,這是由于控制網(wǎng)絡(luò)的復(fù)雜度遠(yuǎn)低于正常網(wǎng)絡(luò),但是仍有104個(gè)漏報(bào),比例為3.14%,這種結(jié)果是無法接受的??紤]到標(biāo)準(zhǔn)決策樹算法中沒有將IP地址作為決策樹建立的輸入?yún)⒘浚侨我庖粋€(gè)光纖網(wǎng)絡(luò)通信網(wǎng)絡(luò)連接都包含著兩個(gè)網(wǎng)絡(luò)設(shè)備以及源地址和目的地址,因此需要在此進(jìn)行修改,即如實(shí)驗(yàn)2中所用的方法,將光纖網(wǎng)絡(luò)通信源地址和目的地址引入決策樹構(gòu)建過程,因而成功地將假陰性樹降到53個(gè),比例為1.60%。
實(shí)驗(yàn)3的原理同實(shí)驗(yàn)2一樣,只是不進(jìn)行決策樹剪枝,雖然增加了數(shù)據(jù)量,但是將光纖網(wǎng)絡(luò)通信漏報(bào)數(shù)降低到45個(gè),比例為1.355%。實(shí)驗(yàn)4的二階決策樹方法,雖然增加了系統(tǒng)復(fù)雜度,但是進(jìn)一步地將漏報(bào)數(shù)目降低到16個(gè),比例為0.48%。這個(gè)數(shù)值雖然很低,但仍然存在漏判故障,對(duì)這16個(gè)假陰性誤判進(jìn)行檢驗(yàn),發(fā)現(xiàn)原因是故障案例非常稀少,在整個(gè)數(shù)據(jù)集中最多出現(xiàn)2次,大多數(shù)僅出現(xiàn)1次,即使使用交叉驗(yàn)證也難以保證足夠的訓(xùn)練。為了檢查出16種故障,需要引入16個(gè)決策樹獨(dú)立規(guī)則,這雖然會(huì)增加系統(tǒng)復(fù)雜度和硬件消耗,但考慮到控制網(wǎng)絡(luò)周期性地產(chǎn)生網(wǎng)絡(luò)流量,故障誘因相對(duì)較少,因而只要訓(xùn)練數(shù)據(jù)足夠多,訓(xùn)練較好,可以保證每一個(gè)故障都可以檢測(cè)認(rèn)定。
4 結(jié) 論
本文結(jié)合IP網(wǎng)絡(luò)特點(diǎn)和光纖網(wǎng)絡(luò)的特點(diǎn),設(shè)計(jì)了一套基于二階決策樹數(shù)據(jù)挖掘的光纖優(yōu)化故障檢測(cè)系統(tǒng),經(jīng)過國(guó)內(nèi)某車輛生產(chǎn)企業(yè)現(xiàn)用的光纖網(wǎng)絡(luò)實(shí)用結(jié)果表明,該系統(tǒng)性能優(yōu)越,光纖網(wǎng)絡(luò)通信故障檢測(cè)率可達(dá)到99.9%。在一定數(shù)據(jù)量的基礎(chǔ)上,該方案可以將漏報(bào)率降低到0.48%,優(yōu)化效果較為明顯,取得了較好的檢測(cè)效果,目前正逐步推廣。
參考文獻(xiàn)
[1] WON Y J, CHOI Mi?Jung, HONG J W. Fault detection and diagnosis in IP?based mission critical industrial process control networks [J]. IEEE Communications Magazine, 2008, 46(5): 172?180.
[2] AMOOEE Gloriz, MINAEI?BIDGOLI Behrouz, BAGHERI?DEHNAVI Malihe. A comparison between data mining prediction algorithms for fault detection [J]. IJCSI International Journal of Computer Science Issues, 2011, 8(3): 425?431.
[3] ALZGHOU A, LOFSTRAND M. Increasing availability of industrial systems through data stream mining [J]. Computers & Industrial Engineering, 2010, 10(31): 743?748.
[4] CHEN Kai?ying, CHEN Long?sheng, CHEN Mu?chen, et al. Using SVM based method for equipment fault detection in a thermal power plant [J]. Computers in Industry, 2011, 2(62): 42?50.
[5] 錢宇,徐敏,郭東,等.基于預(yù)警專家系統(tǒng)的航天器規(guī)避研究[J].計(jì)算機(jī)仿真,2011,28(5):93?96.
[6] 陳春燕.小波神經(jīng)網(wǎng)絡(luò)改進(jìn)算法在故障診斷中的應(yīng)用[J].科技通報(bào),2012,28(10):31?33.
表4 實(shí)驗(yàn)結(jié)果
由表4可知,實(shí)驗(yàn)1即標(biāo)準(zhǔn)的光纖網(wǎng)絡(luò)通信決策樹方法都可以保證較高的精度和檢索率,這是由于控制網(wǎng)絡(luò)的復(fù)雜度遠(yuǎn)低于正常網(wǎng)絡(luò),但是仍有104個(gè)漏報(bào),比例為3.14%,這種結(jié)果是無法接受的??紤]到標(biāo)準(zhǔn)決策樹算法中沒有將IP地址作為決策樹建立的輸入?yún)⒘浚侨我庖粋€(gè)光纖網(wǎng)絡(luò)通信網(wǎng)絡(luò)連接都包含著兩個(gè)網(wǎng)絡(luò)設(shè)備以及源地址和目的地址,因此需要在此進(jìn)行修改,即如實(shí)驗(yàn)2中所用的方法,將光纖網(wǎng)絡(luò)通信源地址和目的地址引入決策樹構(gòu)建過程,因而成功地將假陰性樹降到53個(gè),比例為1.60%。
實(shí)驗(yàn)3的原理同實(shí)驗(yàn)2一樣,只是不進(jìn)行決策樹剪枝,雖然增加了數(shù)據(jù)量,但是將光纖網(wǎng)絡(luò)通信漏報(bào)數(shù)降低到45個(gè),比例為1.355%。實(shí)驗(yàn)4的二階決策樹方法,雖然增加了系統(tǒng)復(fù)雜度,但是進(jìn)一步地將漏報(bào)數(shù)目降低到16個(gè),比例為0.48%。這個(gè)數(shù)值雖然很低,但仍然存在漏判故障,對(duì)這16個(gè)假陰性誤判進(jìn)行檢驗(yàn),發(fā)現(xiàn)原因是故障案例非常稀少,在整個(gè)數(shù)據(jù)集中最多出現(xiàn)2次,大多數(shù)僅出現(xiàn)1次,即使使用交叉驗(yàn)證也難以保證足夠的訓(xùn)練。為了檢查出16種故障,需要引入16個(gè)決策樹獨(dú)立規(guī)則,這雖然會(huì)增加系統(tǒng)復(fù)雜度和硬件消耗,但考慮到控制網(wǎng)絡(luò)周期性地產(chǎn)生網(wǎng)絡(luò)流量,故障誘因相對(duì)較少,因而只要訓(xùn)練數(shù)據(jù)足夠多,訓(xùn)練較好,可以保證每一個(gè)故障都可以檢測(cè)認(rèn)定。
4 結(jié) 論
本文結(jié)合IP網(wǎng)絡(luò)特點(diǎn)和光纖網(wǎng)絡(luò)的特點(diǎn),設(shè)計(jì)了一套基于二階決策樹數(shù)據(jù)挖掘的光纖優(yōu)化故障檢測(cè)系統(tǒng),經(jīng)過國(guó)內(nèi)某車輛生產(chǎn)企業(yè)現(xiàn)用的光纖網(wǎng)絡(luò)實(shí)用結(jié)果表明,該系統(tǒng)性能優(yōu)越,光纖網(wǎng)絡(luò)通信故障檢測(cè)率可達(dá)到99.9%。在一定數(shù)據(jù)量的基礎(chǔ)上,該方案可以將漏報(bào)率降低到0.48%,優(yōu)化效果較為明顯,取得了較好的檢測(cè)效果,目前正逐步推廣。
參考文獻(xiàn)
[1] WON Y J, CHOI Mi?Jung, HONG J W. Fault detection and diagnosis in IP?based mission critical industrial process control networks [J]. IEEE Communications Magazine, 2008, 46(5): 172?180.
[2] AMOOEE Gloriz, MINAEI?BIDGOLI Behrouz, BAGHERI?DEHNAVI Malihe. A comparison between data mining prediction algorithms for fault detection [J]. IJCSI International Journal of Computer Science Issues, 2011, 8(3): 425?431.
[3] ALZGHOU A, LOFSTRAND M. Increasing availability of industrial systems through data stream mining [J]. Computers & Industrial Engineering, 2010, 10(31): 743?748.
[4] CHEN Kai?ying, CHEN Long?sheng, CHEN Mu?chen, et al. Using SVM based method for equipment fault detection in a thermal power plant [J]. Computers in Industry, 2011, 2(62): 42?50.
[5] 錢宇,徐敏,郭東,等.基于預(yù)警專家系統(tǒng)的航天器規(guī)避研究[J].計(jì)算機(jī)仿真,2011,28(5):93?96.
[6] 陳春燕.小波神經(jīng)網(wǎng)絡(luò)改進(jìn)算法在故障診斷中的應(yīng)用[J].科技通報(bào),2012,28(10):31?33.
表4 實(shí)驗(yàn)結(jié)果
由表4可知,實(shí)驗(yàn)1即標(biāo)準(zhǔn)的光纖網(wǎng)絡(luò)通信決策樹方法都可以保證較高的精度和檢索率,這是由于控制網(wǎng)絡(luò)的復(fù)雜度遠(yuǎn)低于正常網(wǎng)絡(luò),但是仍有104個(gè)漏報(bào),比例為3.14%,這種結(jié)果是無法接受的。考慮到標(biāo)準(zhǔn)決策樹算法中沒有將IP地址作為決策樹建立的輸入?yún)⒘?,但是任意一個(gè)光纖網(wǎng)絡(luò)通信網(wǎng)絡(luò)連接都包含著兩個(gè)網(wǎng)絡(luò)設(shè)備以及源地址和目的地址,因此需要在此進(jìn)行修改,即如實(shí)驗(yàn)2中所用的方法,將光纖網(wǎng)絡(luò)通信源地址和目的地址引入決策樹構(gòu)建過程,因而成功地將假陰性樹降到53個(gè),比例為1.60%。
實(shí)驗(yàn)3的原理同實(shí)驗(yàn)2一樣,只是不進(jìn)行決策樹剪枝,雖然增加了數(shù)據(jù)量,但是將光纖網(wǎng)絡(luò)通信漏報(bào)數(shù)降低到45個(gè),比例為1.355%。實(shí)驗(yàn)4的二階決策樹方法,雖然增加了系統(tǒng)復(fù)雜度,但是進(jìn)一步地將漏報(bào)數(shù)目降低到16個(gè),比例為0.48%。這個(gè)數(shù)值雖然很低,但仍然存在漏判故障,對(duì)這16個(gè)假陰性誤判進(jìn)行檢驗(yàn),發(fā)現(xiàn)原因是故障案例非常稀少,在整個(gè)數(shù)據(jù)集中最多出現(xiàn)2次,大多數(shù)僅出現(xiàn)1次,即使使用交叉驗(yàn)證也難以保證足夠的訓(xùn)練。為了檢查出16種故障,需要引入16個(gè)決策樹獨(dú)立規(guī)則,這雖然會(huì)增加系統(tǒng)復(fù)雜度和硬件消耗,但考慮到控制網(wǎng)絡(luò)周期性地產(chǎn)生網(wǎng)絡(luò)流量,故障誘因相對(duì)較少,因而只要訓(xùn)練數(shù)據(jù)足夠多,訓(xùn)練較好,可以保證每一個(gè)故障都可以檢測(cè)認(rèn)定。
4 結(jié) 論
本文結(jié)合IP網(wǎng)絡(luò)特點(diǎn)和光纖網(wǎng)絡(luò)的特點(diǎn),設(shè)計(jì)了一套基于二階決策樹數(shù)據(jù)挖掘的光纖優(yōu)化故障檢測(cè)系統(tǒng),經(jīng)過國(guó)內(nèi)某車輛生產(chǎn)企業(yè)現(xiàn)用的光纖網(wǎng)絡(luò)實(shí)用結(jié)果表明,該系統(tǒng)性能優(yōu)越,光纖網(wǎng)絡(luò)通信故障檢測(cè)率可達(dá)到99.9%。在一定數(shù)據(jù)量的基礎(chǔ)上,該方案可以將漏報(bào)率降低到0.48%,優(yōu)化效果較為明顯,取得了較好的檢測(cè)效果,目前正逐步推廣。
參考文獻(xiàn)
[1] WON Y J, CHOI Mi?Jung, HONG J W. Fault detection and diagnosis in IP?based mission critical industrial process control networks [J]. IEEE Communications Magazine, 2008, 46(5): 172?180.
[2] AMOOEE Gloriz, MINAEI?BIDGOLI Behrouz, BAGHERI?DEHNAVI Malihe. A comparison between data mining prediction algorithms for fault detection [J]. IJCSI International Journal of Computer Science Issues, 2011, 8(3): 425?431.
[3] ALZGHOU A, LOFSTRAND M. Increasing availability of industrial systems through data stream mining [J]. Computers & Industrial Engineering, 2010, 10(31): 743?748.
[4] CHEN Kai?ying, CHEN Long?sheng, CHEN Mu?chen, et al. Using SVM based method for equipment fault detection in a thermal power plant [J]. Computers in Industry, 2011, 2(62): 42?50.
[5] 錢宇,徐敏,郭東,等.基于預(yù)警專家系統(tǒng)的航天器規(guī)避研究[J].計(jì)算機(jī)仿真,2011,28(5):93?96.
[6] 陳春燕.小波神經(jīng)網(wǎng)絡(luò)改進(jìn)算法在故障診斷中的應(yīng)用[J].科技通報(bào),2012,28(10):31?33.