王華偉,史天運(yùn)*,閆永利
(1.中國鐵道科學(xué)研究院電子計(jì)算技術(shù)研究所,北京100083;2.中國鐵路總公司工電部,北京100844)
鐵路運(yùn)輸設(shè)備是鐵路運(yùn)輸生產(chǎn)的基礎(chǔ),是鐵路運(yùn)輸安全有序的可靠保證,鐵路機(jī)務(wù)、車輛、供電、工務(wù)、電務(wù)各專業(yè)分別建設(shè)了設(shè)備管理相關(guān)系統(tǒng),已部分實(shí)現(xiàn)運(yùn)輸設(shè)備的專業(yè)化管理.然而對于運(yùn)輸設(shè)備的統(tǒng)一管理和綜合評價(jià)還存在很大困難.管理單元是鐵路運(yùn)輸設(shè)備監(jiān)控、維修、管理及分析決策的基礎(chǔ)對象和基本單位,因此運(yùn)輸設(shè)備單元?jiǎng)澐趾侠砼c否,不僅會(huì)影響設(shè)備管理及決策分析的準(zhǔn)確性,而且會(huì)影響設(shè)備的檢修和維護(hù)工作效率.
因此,需要結(jié)合運(yùn)輸設(shè)備特點(diǎn)和管理需要,將鐵路運(yùn)輸設(shè)備分成顆粒適度、便于管理、易于數(shù)據(jù)化的設(shè)備單元,從而實(shí)現(xiàn)運(yùn)輸設(shè)備的統(tǒng)一化、標(biāo)準(zhǔn)化管理,為設(shè)備管理及狀態(tài)綜合評價(jià)提供支撐.
單元化管理思想是來源于精益化管理,是成組技術(shù)理論的一個(gè)成功應(yīng)用.王祖錦等[1]把單元化管理思想運(yùn)用到物流管理行業(yè),為精益物流管理提供了堅(jiān)實(shí)的管理基礎(chǔ);邵敏華等[2]開展了公路管理單元?jiǎng)討B(tài)劃分技術(shù)研究;何洋等[3]開展鐵路工務(wù)維修管理單元?jiǎng)澐址椒ㄑ芯?,為鐵路運(yùn)輸設(shè)備單元化管理提供了成功的借鑒.然而,目前對于鐵路運(yùn)輸設(shè)備統(tǒng)一的單元?jiǎng)澐址椒ㄉ袩o相關(guān)研究,因此開展鐵路運(yùn)輸設(shè)備單元?jiǎng)澐址椒ㄑ芯?,對于運(yùn)輸設(shè)備綜合管理具有一定的創(chuàng)新性,具有非常重要的意義.
本文在分析鐵路運(yùn)輸設(shè)備構(gòu)成的基礎(chǔ)上,總結(jié)提出鐵路運(yùn)輸設(shè)備單元?jiǎng)澐衷瓌t,基于K-means聚類算法開展鐵路運(yùn)輸設(shè)備單元?jiǎng)澐址椒ㄑ芯浚⒔?jīng)過實(shí)踐驗(yàn)證方法的科學(xué)性和合理行.
鐵路運(yùn)輸設(shè)備構(gòu)成按其應(yīng)用特點(diǎn)可分為固定設(shè)備設(shè)施、移動(dòng)設(shè)備、安全監(jiān)測設(shè)備等幾大類[4].具體分類如表1所示.
表1 鐵路運(yùn)輸設(shè)備構(gòu)成Table 1 Railway transportation equipment constituent
充分考慮鐵路各專業(yè)運(yùn)輸設(shè)備管理需求,鐵路運(yùn)輸設(shè)備單元?jiǎng)澐忠裱韵?個(gè)原則.
(1)單元?jiǎng)澐值奈ㄒ恍院酮?dú)立性.
每個(gè)單元的劃分明確區(qū)別于其他單元.保證運(yùn)輸設(shè)備單元?jiǎng)澐值奈ㄒ恍允枪芾韱卧幕A(chǔ)工作,每個(gè)獨(dú)立的單元標(biāo)識將是管理單元的“身份證”,直接影響到后續(xù)管理單元的管理及技術(shù)狀態(tài)數(shù)據(jù)的標(biāo)準(zhǔn)化.應(yīng)同時(shí)符合兩方面的要求:一方面,應(yīng)在運(yùn)輸設(shè)備綜合管理系統(tǒng)中能準(zhǔn)確、迅速地確定其單元身份;另一方面,符合用戶管理習(xí)慣,并能在現(xiàn)場應(yīng)用中準(zhǔn)確定位.
(2)單元?jiǎng)澐值耐暾院秃喕?
按照運(yùn)輸設(shè)備技術(shù)狀態(tài)管理全壽命周期綜合管理及狀態(tài)評價(jià)的需要,各相關(guān)專業(yè)運(yùn)輸設(shè)備及組件都要包含在單元?jiǎng)澐址秶鷥?nèi),避免漏項(xiàng),力求所有單元?jiǎng)澐值耐暾?同時(shí),通過評價(jià)單元的劃分,能夠使運(yùn)輸設(shè)備管理及評價(jià)工作簡化便捷,方便運(yùn)用管理.
(3)生產(chǎn)組織及后期維護(hù)的便捷性.
鐵路運(yùn)輸設(shè)備技術(shù)狀態(tài)管理是一個(gè)復(fù)雜的系統(tǒng)化工程,涉及到設(shè)備從投產(chǎn)應(yīng)用到報(bào)廢全壽命周期的監(jiān)測、檢修、維護(hù)等諸多環(huán)節(jié),設(shè)備管理單元的劃分必須能夠有效定位到相關(guān)設(shè)備,反映出問題所在,并能夠把設(shè)備單元存在的問題與后期的維修養(yǎng)護(hù)進(jìn)行管理.所以說,設(shè)備單元的劃分不僅僅要考慮提高管理和分析的效率,而且要考慮到后期生產(chǎn)組織及后期維護(hù)的便捷性.
(4)技術(shù)狀態(tài)數(shù)據(jù)采集單元與理論分析模型的統(tǒng)一性.
運(yùn)輸設(shè)備技術(shù)狀態(tài)管理實(shí)質(zhì)上就是采集運(yùn)輸設(shè)備單元全壽命周期內(nèi)的履歷數(shù)據(jù)、檢測監(jiān)控?cái)?shù)據(jù)、檢修維護(hù)數(shù)據(jù)等動(dòng)靜態(tài)單元數(shù)據(jù),構(gòu)建設(shè)備狀態(tài)分析評價(jià)模型,對設(shè)備性能、健康狀態(tài)等進(jìn)行分析評價(jià).因此,為保證理論分析的連貫性、科學(xué)性與一致性,對于設(shè)備技術(shù)狀態(tài)的管理單元的劃分,要與理論分析模型保持一致,保證技術(shù)狀態(tài)數(shù)據(jù)采集單元與理論分析模型的統(tǒng)一性.
(5)單元?jiǎng)澐至6鹊倪m應(yīng)性.
指運(yùn)輸設(shè)備單元?jiǎng)澐至6纫m應(yīng)各專業(yè)不同的運(yùn)輸設(shè)備管理需要及分析需求,分析哪些技術(shù)狀態(tài)屬性成為單元?jiǎng)澐值囊罁?jù),應(yīng)視系統(tǒng)目標(biāo)的側(cè)重點(diǎn)找出影響系統(tǒng)決策分析的主要屬性,對于不同性質(zhì)的單元,提供靈活的、適宜的、粒度不同的單元?jiǎng)澐謽?biāo)準(zhǔn).
(6)與生產(chǎn)布局和管理決策的一致性.
管理單元的劃分要考慮數(shù)據(jù)分析后的利用價(jià)值,將為運(yùn)輸設(shè)備施工維修作業(yè)提供合理的方法和建議,優(yōu)化檢修作業(yè)流程,提高檢修作業(yè)效率.因此,運(yùn)輸設(shè)備管理單元的劃分要充分考慮生產(chǎn)布局及管理決策的需要,保持與生產(chǎn)力布局和管理決策的統(tǒng)一性,全面提升運(yùn)輸設(shè)備的管理及智能維修水平.
K-means算法是經(jīng)典的劃分聚類方法之一,算法效率較高,在大規(guī)格數(shù)據(jù)聚類時(shí)得到較為廣泛的應(yīng)用.K-means算法的基本原理是:首先設(shè)定k為參數(shù),確定需要將含有n個(gè)對象的數(shù)據(jù)集劃分成k個(gè)類,隨機(jī)地選取k個(gè)對象作為初始聚類中心;然后,對于剩余的每個(gè)對象,根據(jù)距離公式計(jì)算該對象到每一個(gè)初始聚類中心的距離,將計(jì)算好的數(shù)據(jù)對象劃分到最近的類中;最后重新計(jì)算每個(gè)類中心,不斷重復(fù)這個(gè)過程,直到準(zhǔn)則函數(shù)收斂[5-6].K-means通常采用平方誤差準(zhǔn)則函數(shù)進(jìn)行收斂,其定義為
式中:E是數(shù)據(jù)集中所有對象的平方誤差的總和;p是數(shù)據(jù)集中的點(diǎn);mi是類Ci的平均值.
K-means聚類算法流程如圖1所示.
圖1 聚類分析算法流程圖Fig.1 Flow chart of cluster analysis algorithm
鐵路運(yùn)輸設(shè)備單元?jiǎng)澐值哪康木褪菍⒏黝愡\(yùn)輸設(shè)備設(shè)施分成便于監(jiān)控管理、易于維護(hù)和量化分析的設(shè)備設(shè)施單元,滿足設(shè)備監(jiān)測、檢修、維護(hù)、管理分析的需要.因而對于運(yùn)輸設(shè)備單元的劃分要綜合考慮設(shè)備日常監(jiān)測、檢修維護(hù)和管理分析過程中的重點(diǎn)因素,選擇構(gòu)建完整、科學(xué)、客觀的設(shè)備單元?jiǎng)澐种笜?biāo),本文選擇的鐵路運(yùn)輸設(shè)備單元?jiǎng)澐种笜?biāo)如表2所示.
表2 鐵路運(yùn)輸設(shè)備單元?jiǎng)澐种笜?biāo)Table 2 Railway transportation equipment unit division index
基于K-means聚類算法的運(yùn)輸設(shè)備單元?jiǎng)澐帜P途唧w實(shí)現(xiàn)如圖2所示.
圖2 基于K-means聚類算法的運(yùn)輸設(shè)備單元?jiǎng)澐帜P虵ig.2 Unit division model of railway transportation equipment based on K-means clustering algorithm
按照運(yùn)輸設(shè)備單元?jiǎng)澐衷瓌t,結(jié)合設(shè)備技術(shù)狀態(tài)屬性信息,現(xiàn)以電務(wù)通信設(shè)備為例對設(shè)備單元?jiǎng)澐炙惴ㄔ砑皩?shí)現(xiàn)流程進(jìn)行說明[7-8],基于K-means的通信專業(yè)運(yùn)輸設(shè)備單元?jiǎng)澐植襟E如下.
Step 1設(shè)所有要納入大數(shù)據(jù)平臺(tái)管理的通信設(shè)備設(shè)施及相關(guān)設(shè)備組件類別集合為S,S1,S2,…,Sn表示每類通信設(shè)備及組件,比如通信機(jī)房、通信鐵塔、通信光纜、通信電纜、分插復(fù)用設(shè)備、交流配電設(shè)備等,則有
Step 2準(zhǔn)備樣本數(shù)據(jù).
①選取通信設(shè)備或組件的m個(gè)特征指標(biāo),若用P1,P2,P3,…,Pm表示,則
②根據(jù)管理需求及專家經(jīng)驗(yàn),按照表2選取特征指標(biāo),P1,P2,P3,…,P8,分別代表日常監(jiān)測信息來源、日常檢查周期、中修周期、大修周期、報(bào)廢周期、設(shè)備所屬類別、安裝位置、設(shè)備基礎(chǔ)信息來源等,從不同通信設(shè)備類別中按該類別設(shè)備所占總設(shè)備數(shù)量的比重選取48類通信設(shè)備單元?jiǎng)澐謽颖窘⒕仃嘢,如表3所示.
表3 鐵路通信設(shè)備單元?jiǎng)澐謽颖綯able 3 Railway communication equipment unit division sample
③由于通信設(shè)備單元?jiǎng)澐謱傩詤?shù)中既有定性指標(biāo),又有定量指標(biāo),且各指標(biāo)數(shù)值的量綱不一致,因此特將樣本矩陣數(shù)據(jù)做統(tǒng)一的歸一化處理[9],如表4所示.
表4 鐵路通信設(shè)備單元?jiǎng)澐謿w一化樣本Table 4 Railway communication equipment unit division sample normalization
Step 3根據(jù)聚類需要,初始化聚類中相關(guān)參數(shù),所選參數(shù)在計(jì)算迭代過程中可以調(diào)整優(yōu)化.
①確定數(shù)據(jù)集S需要?jiǎng)澐值木垲悅€(gè)數(shù)k;
②設(shè)定迭代次數(shù)為X,令X=1;
③在數(shù)據(jù)集S中,隨機(jī)選取k個(gè)數(shù)據(jù)對象,將這k個(gè)數(shù)據(jù)對象設(shè)定為初始聚類中心,即有C1(X),C2(X),C3(X),…,Ck(X)等k個(gè)初始聚類中心點(diǎn);
④設(shè)定與聚類中心的距離參數(shù)ξ;
⑤選定數(shù)據(jù)樣本點(diǎn)與聚類中心的距離計(jì)算公式,利用歐幾里得距離公式式(4)進(jìn)行計(jì)算.
式中:i=1,2,…,n;j=1,2,…,k.
Step 4利用式(4)分別計(jì)算樣本點(diǎn)與聚類中心的距離,確定樣本數(shù)據(jù)點(diǎn)歸屬的類.如果滿足,那么
式中:C(z)表示以Cz(X)為中心點(diǎn)的聚類,即數(shù)據(jù)點(diǎn)Si歸屬于C(z)類.
Step 5若計(jì)算完成后,某分類C(z)中的樣本數(shù)為零,則k=k-1,去掉該分類.
Step 6令X=X+1,計(jì)算新的k個(gè)聚類中心點(diǎn).
式中:Nj為C(j)類中的樣本個(gè)數(shù).
Step 7計(jì)算平方誤差準(zhǔn)則函數(shù)E的值為
Step 8判斷是否滿足條件|E(I)-E(I-1) |<ξ,若滿足,則算法結(jié)束;否則,返回Step4,繼續(xù)執(zhí)行迭代,直至結(jié)束.
利用Matlab的聚類函數(shù)按上述步驟對通信設(shè)備樣本進(jìn)行聚類劃分,設(shè)D為各類數(shù)據(jù)點(diǎn)到其對應(yīng)的聚類中心的距離平方和,利用D值作為聚類親和程度的衡量指標(biāo).隨著聚類數(shù)量k的變化,對應(yīng)的D值變化結(jié)果如圖3所示.結(jié)果表明,當(dāng)參數(shù)k=4時(shí),D的變化趨于緩和,不再出現(xiàn)大幅的波動(dòng),因此最終聚類合適的分類個(gè)數(shù)為4,如果數(shù)量過少,劃分各類中單元關(guān)系不緊密,如果數(shù)量過多,資源分類過細(xì),造成管理的繁瑣與不便.因此我們將最終的單元?jiǎng)澐謹(jǐn)?shù)目k值設(shè)定為4.當(dāng)k=4時(shí),通信設(shè)備單元?jiǎng)澐纸Y(jié)果如表5所示.
圖3 D-k關(guān)系對應(yīng)曲線Fig.3 D-krelation curve
表5 鐵路通信設(shè)備單元一級聚類結(jié)果Table 5 Railway communication equipment unit first level clustering result
由表5實(shí)驗(yàn)結(jié)果可以看出,基于K-means聚類的運(yùn)輸設(shè)備單元?jiǎng)澐峙c傳統(tǒng)的按設(shè)備類別分類方式存在不同程度的差異:比如通信機(jī)房,按照傳統(tǒng)的設(shè)備分類方式,應(yīng)與通信接入點(diǎn)、通信鐵塔、通信桿柱等歸為一類,同屬于通信基礎(chǔ)設(shè)施;而利用本文提出的單元?jiǎng)澐址椒ǎㄐ艡C(jī)房則與電源等動(dòng)力設(shè)備等歸為一類,原因是電源設(shè)備幾乎都安裝在通信機(jī)房內(nèi),且通信機(jī)房與電源等技術(shù)狀態(tài)參數(shù)都由動(dòng)環(huán)監(jiān)測系統(tǒng)進(jìn)行動(dòng)態(tài)監(jiān)測,技術(shù)狀態(tài)分析和管理有著密切的關(guān)聯(lián)關(guān)系,相比之下,通信機(jī)房與其他基礎(chǔ)設(shè)施在狀態(tài)監(jiān)測與分析評價(jià)方面基本沒有太多關(guān)聯(lián)關(guān)系.再如電源設(shè)備,在傳統(tǒng)的設(shè)備分類中,其與其他通信設(shè)備屬于同一類,而本文提出的方法則將電源設(shè)備與其他通信設(shè)備分開,原因是電源設(shè)備無論從狀態(tài)監(jiān)測、檢修維護(hù)還是管理分析,本質(zhì)上跟其他普通通信設(shè)備存在差異.
由此可見,本文提出的基于K-means聚類的運(yùn)輸設(shè)備單元?jiǎng)澐直葌鹘y(tǒng)的按設(shè)備類別分類,更符合設(shè)備技術(shù)狀態(tài)管理和分析的需求,其與傳統(tǒng)方式設(shè)備分類方式的具體對比如表6所示.
表6 本方法與傳統(tǒng)的人工設(shè)備劃分方法對比Table 6 The comparison between the proposed method and the traditional manual division method
總之,本文提出的基于K-means聚類的運(yùn)輸設(shè)備單元?jiǎng)澐纸Y(jié)合了設(shè)備日常監(jiān)測、檢修維護(hù)和管理分析等各類因素,與傳統(tǒng)的單純根據(jù)設(shè)備類別進(jìn)行的設(shè)備分類方式相比較有明顯的優(yōu)勢,具有很好的實(shí)用價(jià)值,更適合于運(yùn)輸設(shè)備生產(chǎn)組織、設(shè)備維護(hù)技術(shù)及狀態(tài)分析和管理.
本文對鐵路運(yùn)輸設(shè)備構(gòu)成進(jìn)行了分析,明確了運(yùn)輸設(shè)備管理及單元?jiǎng)澐值姆秶?,總結(jié)分析了運(yùn)輸設(shè)備單元?jiǎng)澐衷瓌t,研究提出基于K-means聚類的鐵路運(yùn)輸設(shè)備單元?jiǎng)澐址椒?,并選取電務(wù)通信專業(yè)運(yùn)輸設(shè)備的樣本數(shù)據(jù)進(jìn)行了方法驗(yàn)證,實(shí)驗(yàn)效果良好.今后,要考慮到專業(yè)管理的差異性,利用該方法更好地實(shí)現(xiàn)對其他專業(yè)設(shè)備管理單元的劃分.
[1]王祖錦.物流單元化管理及專業(yè)單元化器具系列連載之一物流單元化管理的基本思想[J].物流技術(shù)與應(yīng)用,2006,11(4):96-98.[WANG Z J.Logistics management on unit load system(Ⅰ)the basic concept of logistics management on unit load system[J].Logistics&Material Handling,2006,11(4):96-98.]
[2]邵敏華,孫立軍.公路管理單元?jiǎng)討B(tài)劃分技術(shù)與數(shù)據(jù)模型研究[J].同濟(jì)大學(xué)學(xué)報(bào)(自然科學(xué)版),2004,32(3):343-347.[SHAO M H,SUN L J.Research on segmentation technique and data modeling in highway management system[J].Journal of Tongji University,2004,32(3):343-347.]
[3]何洋,劉明亮,陳容淮,等.鐵路工務(wù)維修管理單元?jiǎng)澐址椒ㄑ芯縖J].鐵道標(biāo)準(zhǔn)設(shè)計(jì),2016,60(11):14-18.[HE Y,LIU M L,CHEN R H,et al.Research on railway maintenance managementunitdivision method[J].Railway Standard Design,2016,60(11):14-18.]
[4]吳芳.鐵路運(yùn)輸設(shè)備[M].北京:中國鐵道出版社,2007.[WU F.Railway transportation equipment[M].Beijing:China Railway Press,2007.]
[5]楊陽.數(shù)據(jù)挖掘K-means聚類算法的研究[D].長沙:湖南師范大學(xué),2015.[YANG Y.Research on K-means clustering algorithm in data mining[D].Changsha:Hunan Normal University,2015.]
[6]HONG Y,KWONG S.Learning assignment order of instancesforthe constrained K-meansclustering algorithm[J].IEEE Transactions on Systems Man&Cybernetics Part B Cybernetics A Publication of the IEEE Systems Man&Cybernetics Society,2009,39(2):568-574.
[7]關(guān)云鴻.改進(jìn)K-均值聚類算法在電信客戶分類中的應(yīng)用[J].計(jì)算機(jī)仿真,2011,28(8):138-140.[GUAN Y H.Application of improved K-means algorithm in telecom customer segmentation[J]. Computer Simulation,2011,28(8):138-140.]
[8]趙莉,候興哲,胡君,等.基于改進(jìn)K-means算法的海量智能用電數(shù)據(jù)分析[J].電網(wǎng)技術(shù),2014,38(10):2715-2720.[ZHAO L,HOU X Z,HU J,et al.Improved K-means algorithm based analysis on massive data of intelligent power utilization[J]. Power System Technology,2014,38(10):2715-2720.]
[9]趙興浩,鄧兵,陶然.分?jǐn)?shù)階傅里葉變換數(shù)值計(jì)算中的量綱歸一化[J].北京理工大學(xué)學(xué)報(bào),2005,25(4):360-364.[ZHAO X H,DENG B,TAO R.Dimensional normalization in the digital computation of the fractional fourier transform[J].Transactions of Beijing Institute of Technology,2005,25(4):360-364.]