趙丹妮
(西北空管局,西安 710000)
空管設(shè)備為空管業(yè)務(wù)提供了技術(shù)保障,由很多不同時(shí)期建立的子系統(tǒng)組成,這些子系統(tǒng)作用各異,且由不同部門分別維護(hù)。尤其傳輸線路由專門的部門維護(hù),一條鏈路上設(shè)備眾多。當(dāng)不正常事件發(fā)生后,各部門分頭排查自己的設(shè)備,缺乏配合,效率低,易留下安全隱患。為了盡快排除故障,各部門對(duì)故障必須協(xié)同診斷。本文初步探討了診斷體系的基本框架。
協(xié)同診斷體系分為兩個(gè)層次,第一層是總體拓?fù)鋱D,回答了作為一個(gè)整體的空管設(shè)備由哪些子系統(tǒng)組成,以及各子系統(tǒng)之間的關(guān)系;第二層描述了各子系統(tǒng)故障間的因果關(guān)系。下面敘述這兩層的構(gòu)建。
圖1的節(jié)點(diǎn)是各個(gè)子系統(tǒng)。鑒于協(xié)同診斷的目標(biāo)是建立各維護(hù)部門在面對(duì)設(shè)備故障時(shí)的協(xié)作關(guān)系,所以節(jié)點(diǎn)按系統(tǒng)組成和維護(hù)部門劃分,一個(gè)節(jié)點(diǎn)有惟一確定的一個(gè)維護(hù)部門,節(jié)點(diǎn)之間有簡(jiǎn)單清晰的關(guān)系,至于節(jié)點(diǎn)本身的簡(jiǎn)單或復(fù)雜則無關(guān)緊要。
一個(gè)設(shè)備,即便非常復(fù)雜,但如果由一個(gè)部門維護(hù),應(yīng)作為一個(gè)節(jié)點(diǎn)。如果一個(gè)部門維護(hù)的設(shè)備中夾雜了其他部門維護(hù)的設(shè)備,則應(yīng)劃分成多個(gè)節(jié)點(diǎn)。為了突出連接關(guān)系,兩個(gè)維護(hù)單位在某個(gè)設(shè)備上的接口在需要時(shí)可以分別設(shè)計(jì)為兩個(gè)節(jié)點(diǎn)??傊?jié)點(diǎn)劃分基于子系統(tǒng)的劃分,但與子系統(tǒng)的劃分又有很大不同,其目的是便于故障協(xié)同診斷。
表達(dá)各個(gè)節(jié)點(diǎn)的連接關(guān)系。連接線路類型、速率、名稱等參數(shù)在節(jié)點(diǎn)中表達(dá),不在連接關(guān)系中表達(dá)。
總體拓?fù)鋱D表達(dá)了空管設(shè)備的全貌和各維護(hù)單位之間的接口,是故障協(xié)同診斷的基礎(chǔ)。
故障關(guān)系圖:
空管設(shè)備整體用拓?fù)鋱D表示,即表示為節(jié)點(diǎn)及節(jié)點(diǎn)間的連接關(guān)系,其中連接關(guān)系是固定的,要么有,要么沒有,與設(shè)備的正常與否無關(guān)。連接線路的實(shí)際運(yùn)行狀況則在節(jié)點(diǎn)中表示。這樣,設(shè)備(包括連接線路)的某個(gè)故障一定可以歸結(jié)為節(jié)點(diǎn)的故障。
節(jié)點(diǎn)的故障分為兩種情況,一種是節(jié)點(diǎn)自身故障,另一種則由其他節(jié)點(diǎn)的故障引起。這樣,一個(gè)節(jié)點(diǎn)的某個(gè)故障可以成為其他節(jié)點(diǎn)故障的原因,稱為原因故障。
我們根據(jù)設(shè)備情況和維護(hù)經(jīng)驗(yàn)找出各個(gè)節(jié)點(diǎn)的所有故障,其中節(jié)點(diǎn)內(nèi)部的故障簡(jiǎn)單列舉即可,重點(diǎn)考慮有因果關(guān)系的各個(gè)故障,將這些因果關(guān)系畫成圖,就是故障關(guān)系圖,其中原因故障按出現(xiàn)可能性從大到小的順序排列。
故障關(guān)系圖用于快速診斷故障。發(fā)現(xiàn)故障時(shí),從故障關(guān)系圖迅速找到引起這個(gè)故障的所有原因并逐一排查,可以根據(jù)情況同時(shí)排查,也可以按順序排查,也可以優(yōu)先排查本維護(hù)單位負(fù)責(zé)的故障,為此需要制定故障排查預(yù)案。
現(xiàn)在我們以一個(gè)實(shí)例說明并驗(yàn)證上述的基本架構(gòu)。該實(shí)例假定有這樣一個(gè)系統(tǒng),該系統(tǒng)用采集子系統(tǒng)采集數(shù)據(jù),通過傳輸線路發(fā)送給處理子系統(tǒng)處理,處理所得的數(shù)據(jù)在顯示器上顯示,顯示器通過KVM 與處理系統(tǒng)連接。采集子系統(tǒng)由采集子系統(tǒng)維護(hù)部門維護(hù),處理子系統(tǒng)由處理子系統(tǒng)維護(hù)部門維護(hù),KVM、傳輸線路由傳輸維護(hù)部門維護(hù)??傮w拓?fù)鋱D和故障關(guān)系圖如下,圖1、圖2。
圖1 總體拓?fù)鋱D
圖2 故障關(guān)系圖
節(jié)點(diǎn)基本上對(duì)應(yīng)子系統(tǒng),但非一一對(duì)應(yīng),將子系統(tǒng)轉(zhuǎn)換為節(jié)點(diǎn)是該框架的難點(diǎn)。要解決好這個(gè)問題,須緊緊把握節(jié)點(diǎn)的本質(zhì),在遇到問題時(shí),用下面幾個(gè)標(biāo)準(zhǔn)反復(fù)衡量。
(1)節(jié)點(diǎn)的基本作用是承載故障,實(shí)際出現(xiàn)的故障要?dú)w結(jié)到節(jié)點(diǎn)。
(2)節(jié)點(diǎn)表示了維護(hù)部門的分工。
(3)總體拓?fù)鋱D表示了空管設(shè)備的總體結(jié)構(gòu)。
(4)節(jié)點(diǎn)劃分表示了對(duì)系統(tǒng)現(xiàn)狀的認(rèn)識(shí)?,F(xiàn)狀改變、認(rèn)識(shí)深化后是可以修改的,不是一成不變的。
(5)重視節(jié)點(diǎn)的命名,命名不要重復(fù),而且要和實(shí)際功能一致。
對(duì)熟悉系統(tǒng)的專業(yè)人員來說,列舉出大部分故障并非難事。但列舉出所有故障,找出因果關(guān)系,并指引故障排查則很困難。需要反復(fù)思考,集思廣益,并經(jīng)歷多輪修改。把握如下原則有助于故障的列舉。
(1)征求盡量多的實(shí)際維護(hù)人員的意見。在征求意見時(shí),不用著急整理和歸納,應(yīng)著重于收集所有可能的線索。
(2)將所有故障歸類,歸類的層次盡量多一點(diǎn),每類包含的故障不要多,最好是三四個(gè)。提取每類共同的特征,從共同的特征找出未發(fā)現(xiàn)的故障。等這項(xiàng)工作做完后,再減少歸類的層次,使表述更簡(jiǎn)潔、更實(shí)用。
(3)列舉故障的目的是找出故障間的因果關(guān)系,對(duì)于和其他故障沒有因果關(guān)系的故障,可以不細(xì)分。
(4)故障列舉務(wù)求涵蓋所有故障。如無把握全部列舉,可歸為“其他故障”,以便出現(xiàn)未想到的故障時(shí),也有基本的應(yīng)對(duì)措施。
(5)重視故障命名。
(6)為隨時(shí)擴(kuò)展創(chuàng)造條件。
故障協(xié)同診斷是加快設(shè)備應(yīng)急、故障排查的有效方法。本文作者參與了西北空管局協(xié)同診斷手冊(cè)的編寫工作,本文提出的方法用于設(shè)備和故障梳理,取得了較好的效果。后續(xù)可在此基礎(chǔ)上可以設(shè)計(jì)一個(gè)協(xié)同診斷軟件系統(tǒng)。另外,該方法亦可用于子系統(tǒng)內(nèi)部的結(jié)構(gòu)分析和故障梳理。