習(xí)佳星 沈 鋼 許承焯
(同濟(jì)大學(xué)鐵道與城市軌道交通研究院,201804,上?!蔚谝蛔髡?,碩士研究生)
輪緣是影響列車(chē)輪對(duì)導(dǎo)向和防止脫軌的關(guān)鍵部位。輪緣是否存在異常磨耗對(duì)線路運(yùn)營(yíng)安全至關(guān)重要。當(dāng)前對(duì)輪緣異常磨耗的研究較少:文獻(xiàn)[1]對(duì)深圳軌道交通9號(hào)線輪緣嚴(yán)重磨耗問(wèn)題進(jìn)行研究,通過(guò)比較左右側(cè)車(chē)輪輪緣磨耗量,發(fā)現(xiàn)輪對(duì)明顯磨耗不均勻;文獻(xiàn)[2]對(duì)上海軌道交通4號(hào)線列車(chē)運(yùn)營(yíng)期內(nèi)的輪緣萬(wàn)km磨耗量進(jìn)行計(jì)算,發(fā)現(xiàn)其顯著高于與其部分共線的3號(hào)線列車(chē)車(chē)輪輪緣磨耗量;文獻(xiàn)[3]對(duì)廣州軌道交通3號(hào)線頻繁鏇輪的現(xiàn)象進(jìn)行分析,發(fā)現(xiàn)一段范圍內(nèi)輪緣厚度磨耗速率遠(yuǎn)超出正常值。而輪緣異常磨耗研究尚缺少對(duì)輪緣磨耗監(jiān)控?cái)?shù)據(jù)挖掘分析的有效方法。
輪緣磨耗異常值檢測(cè)常采用統(tǒng)計(jì)學(xué)方法、基于距離的方法和基于樹(shù)的方法等。箱線圖法是一種統(tǒng)計(jì)學(xué)方法,對(duì)數(shù)據(jù)分布類(lèi)型沒(méi)有限制,抗干擾性好,其計(jì)算結(jié)果相對(duì)客觀[4]。孤立森林法是一種基于樹(shù)的方法,沒(méi)有利用距離或密度測(cè)量,具有簡(jiǎn)單、高效的優(yōu)點(diǎn)[5]。本文基于某地鐵自動(dòng)化采集設(shè)備采集的整列列車(chē)48個(gè)車(chē)輪的實(shí)測(cè)廓形數(shù)據(jù),分別采用箱線圖算法和孤立森林算法進(jìn)行輪緣磨耗異常檢測(cè)。
基于某地鐵列車(chē)的實(shí)測(cè)廓形數(shù)據(jù),對(duì)輪緣厚度Sw按左右、軸位及動(dòng)拖車(chē)分別進(jìn)行計(jì)算分析,得到鏇修后列車(chē)運(yùn)行里程L為1.2萬(wàn)km至14.5萬(wàn)km時(shí),Sw在各維度下的磨耗情況,如圖1—圖3所示。
由圖1—圖3可知,該列車(chē)輪緣存在偏磨,但不同軸位、不同車(chē)輛的磨耗差異不明顯??梢?jiàn),僅依靠輪緣厚度難以判斷輪緣是否存在異常磨耗。
圖1 左、右側(cè)的車(chē)輪Sw平均值變化
圖2 不同軸位的車(chē)輪Sw平均值變化
圖3 動(dòng)車(chē)及拖車(chē)的車(chē)輪Sw平均值變化
輪緣根部是輪對(duì)自導(dǎo)向能力的關(guān)鍵部位,其磨損是導(dǎo)致輪緣磨耗的起因。如果輪緣根部發(fā)生磨耗,其輪徑差減小會(huì)導(dǎo)致輪對(duì)自導(dǎo)向能力減弱,當(dāng)車(chē)輛通過(guò)曲線時(shí)為防止脫軌,輪緣會(huì)與鋼軌內(nèi)軌面接觸并產(chǎn)生輪緣側(cè)磨。由此,本研究基于輪緣根部和側(cè)面磨耗規(guī)律選擇指標(biāo)。
輪緣根部發(fā)生磨耗后,在相同的橫移量下輪對(duì)所能產(chǎn)生的輪徑差減小,自導(dǎo)向能力減弱,車(chē)輪輪緣區(qū)段會(huì)與鋼軌產(chǎn)生磨耗。因此,本文擬定以輪緣根部的輪徑差變動(dòng)量來(lái)衡量輪緣根部的磨耗。
現(xiàn)階段,相關(guān)單位將Sw作為輪緣側(cè)磨衡量指標(biāo)。Sw測(cè)量以名義滾動(dòng)圓接觸點(diǎn)作為基準(zhǔn)。當(dāng)踏面名義滾動(dòng)圓處存在磨耗時(shí),可能出現(xiàn)圖4所示情況,即磨耗廓形Sw2與新廓形Sw1相等。此外,當(dāng)名義滾動(dòng)圓處磨耗速率大于輪緣側(cè)磨速率時(shí),可能表現(xiàn)出輪緣“假增厚”。因此,本文選用磨耗面積Aw來(lái)衡量輪緣側(cè)磨(圖4陰影)。將磨耗廓形與參考廓形作對(duì)比,Aw能直接表示輪緣的側(cè)磨量。
注:Sh1表示新廓形的輪緣高度,Sh2表示磨耗廓形的輪緣高度。
由上述輪緣磨耗規(guī)律,本研究以輪緣根部輪徑差之半(橫移量為12 mm)變化速率Rf和輪緣磨耗面積(法向磨耗面積,且距輪背橫向距離為20~30 mm區(qū)段)變化速率Ra為指標(biāo),對(duì)輪緣磨耗進(jìn)行檢測(cè)辨識(shí)。
文獻(xiàn)[6]于1977年提出經(jīng)典的箱線圖理論。箱線圖主要由最小值、下四分位數(shù)Q1、中位數(shù)Q2、上四分位數(shù)Q3和最大值5個(gè)數(shù)值點(diǎn)組成,Q1與Q3的差值為四分位距IQR。本研究將樣本數(shù)據(jù)中大于Q3+1.5IQR或小于Q1-1.5IQR的值定義為異常值。
針對(duì)本研究中的監(jiān)控?cái)?shù)據(jù)分別計(jì)算在連續(xù)里程區(qū)段內(nèi)各車(chē)輪輪緣磨耗速率的變化情況,識(shí)別出存在異常磨耗的車(chē)輪及其里程區(qū)段。以Ra為例,假設(shè)整列車(chē)各車(chē)輪輪緣側(cè)磨面積為Aw1,Aw2,Aw3,…,Awn,n為列車(chē)車(chē)輪樣本總數(shù)。用Awi,1,Awi,2,Awi,3,…,Awi,t,表示第i個(gè)車(chē)輪輪緣磨耗面積Awi下的t個(gè)有序趨勢(shì)值,設(shè)l為時(shí)間序列觀察窗口長(zhǎng)度(l 1)計(jì)算得到各車(chē)輪在觀察窗口長(zhǎng)度l內(nèi)的輪緣磨耗面積變化值ΔAwi,t和t時(shí)刻磨耗速率RAwi,t: ΔAwi,t=Awi,t-Awi,t-1,i=1,2,3,…,n (1) RAwi,t=ΔAwi,t/ΔL,i=1,2,3,…,n (2) 2)計(jì)算得到t時(shí)刻樣本數(shù)據(jù)內(nèi)各分位數(shù)所處位置Lp,t及數(shù)值Qp,t: 3)計(jì)算得到t時(shí)刻樣本數(shù)據(jù)內(nèi)的Ra最大值Qu,t: 4)判斷Awi,t≤Qu,t是否成立,若不成立則標(biāo)記為異常值。 5)更改時(shí)刻值t=t+l,并重復(fù)1)—4),完成對(duì)各個(gè)時(shí)刻測(cè)量值的異常狀態(tài)辨識(shí)。 圖5為箱線圖檢測(cè)識(shí)別算法的流程圖。 圖5 箱線圖檢測(cè)識(shí)別算法 根據(jù)箱線圖算法,將Ra換成Rf,同樣可以計(jì)算并觀察連續(xù)里程區(qū)段內(nèi)Rf的波動(dòng)大小及異常狀況。 本文分別計(jì)算L為0~10.7萬(wàn)km的車(chē)輪Ra和Rf的監(jiān)控?cái)?shù)據(jù)分析結(jié)果。 選取典型的存在異常磨耗和正常磨耗車(chē)輪的監(jiān)控結(jié)果,如圖6及圖7所示。從圖6 a)中可知,當(dāng)L為1.7萬(wàn)~5.7萬(wàn)km及6.2萬(wàn)~8.2萬(wàn)km時(shí),該車(chē)輪Ra超出最大值,識(shí)別出該車(chē)輪存在異常磨耗。同理,由圖7 a)可識(shí)別,當(dāng)L為8.7萬(wàn)~10.2萬(wàn)km時(shí),該車(chē)輪存在異常磨耗。對(duì)比圖6 b)及圖7 b)中的正常磨耗車(chē)輪可見(jiàn),各車(chē)輪輪緣磨耗速率基本在其磨耗速率均值曲線附近小幅度波動(dòng)。 a)1軸左輪 由圖6及圖7可知,基于箱線圖的輪緣磨耗檢測(cè)識(shí)別方法能辨識(shí)出車(chē)輪存在異常磨耗的狀況,客觀地得到了各指標(biāo)的檢測(cè)識(shí)別結(jié)果。 a)23軸左輪 L為1.7萬(wàn)~10.7萬(wàn)km時(shí),箱線圖算法有效辨識(shí)出的輪緣異常磨耗情況統(tǒng)計(jì)結(jié)果見(jiàn)表1。 L=10.5萬(wàn)km時(shí),整列車(chē)的輪緣法向磨耗面積均值、輪緣根部的輪徑差之半均值分別為8.18 mm2、0.95 mm;表1中1號(hào)、2號(hào)、28號(hào)、34號(hào)、41號(hào)、42號(hào)、46號(hào)和47號(hào)車(chē)輪的輪緣法向磨耗面積分別為19.71 mm2、14.43 mm2、8.94 mm2、13.77 mm2、9.57 mm2、9.58 mm2、8.64 mm2和8.30 mm2,3號(hào)、23號(hào)、34號(hào)、38號(hào)、41號(hào)、42號(hào)、43號(hào)、47號(hào)和48號(hào)車(chē)輪的輪緣根部輪徑差之半值分別為2.41 mm、2.64 mm、2.58 mm、1.72 mm、2.46 mm、1.34 mm、1.68 mm、1.37 mm和1.31 mm,都明顯高于平均水平,表現(xiàn)出磨耗異常。這與實(shí)際磨耗情況基本一致。 表1 箱線圖算法的磨耗異常檢測(cè)計(jì)算結(jié)果 周志華教授等于2008年在第八屆IEEE數(shù)據(jù)挖掘國(guó)際會(huì)議上提出孤立森林理論[7],提出異常數(shù)據(jù)可基于路徑長(zhǎng)度被檢測(cè)出來(lái)。二叉搜索樹(shù)的平均路徑長(zhǎng)度c(n)為: c(n)=2h(n-1)-2(n-1)/n (3) 其中n為樣本個(gè)數(shù);h(i)為調(diào)和數(shù),該值可被估計(jì)為h(i)=ln(i)+0.577 215 664 9(Euler常數(shù))。c(n)用來(lái)標(biāo)準(zhǔn)化樣本x的路徑長(zhǎng)度h(x)。 異常分值s(x,n)用來(lái)判斷數(shù)據(jù)異常的程度,定義如下: s(x,n)=2-E(h(x))/c(n) (4) 其中E(h(x))為樣本x在一群孤立樹(shù)中的路徑長(zhǎng)度的期望。 孤立森林算法在構(gòu)建孤立樹(shù)的過(guò)程中,存在分割數(shù)據(jù)隨機(jī)性較強(qiáng)的問(wèn)題。對(duì)此,本文改進(jìn)了孤立森林算法:先分析采樣數(shù)據(jù),判斷此樣本集是否適合構(gòu)造孤立樹(shù),以避免隨機(jī)選擇的根節(jié)點(diǎn)中包含較多沒(méi)有離群點(diǎn)的樣本集;隨后,在構(gòu)造孤立樹(shù)時(shí),用特定的切割點(diǎn)將孤立樹(shù)分成左右子樹(shù)。 對(duì)于數(shù)據(jù)集m,隨機(jī)選擇j個(gè)樣本點(diǎn)作為孤立樹(shù)根節(jié)點(diǎn)樣本,再隨機(jī)選擇其中一維作為切割屬性。由數(shù)據(jù)的分布特性可知,樣本點(diǎn)中超過(guò)上界值的概率很低。因此,若有數(shù)據(jù)點(diǎn)落在此區(qū)域外,則所選根節(jié)點(diǎn)樣本中包含異常點(diǎn)的可能性很大。如果樣本集中的最大值max(j)大于這個(gè)上界值,則將j樣本放入樹(shù)的根節(jié)點(diǎn),否則構(gòu)建為1棵空樹(shù)。 在第一次選擇切割點(diǎn)時(shí),取根節(jié)點(diǎn)樣本數(shù)據(jù)中相應(yīng)切割屬性下的上界值作為切割點(diǎn)。在下一個(gè)子空間選擇切割點(diǎn)時(shí),則以該子樣本數(shù)據(jù)最大值z(mì)max與最小值z(mì)min之間的黃金分割點(diǎn)作為切割點(diǎn)。遞歸上述過(guò)程直到當(dāng)前子樹(shù)只包含1個(gè)數(shù)據(jù)點(diǎn)或達(dá)到最大限制的樹(shù)高。此樹(shù)定義為孤立樹(shù)。 孤立森林算法的改進(jìn)去除了可能含有干擾屬性的孤立樹(shù),加快了迭代,提高了運(yùn)行效率及穩(wěn)定性。 結(jié)合Ra和Rf綜合計(jì)算各車(chē)輪輪緣磨耗速率的異常得分s(j,m)。具體流程如下: 步驟1:初始化孤立森林。設(shè)置孤立樹(shù)分叉的最大限制高度。 步驟2:初始化生成孤立樹(shù)算法參數(shù)。輸入數(shù)據(jù)集m,該數(shù)據(jù)集存入的是鏇修后10.7萬(wàn)km里程范圍內(nèi)48個(gè)車(chē)輪的輪緣磨耗速率值,具有Ra和Rf2個(gè)指標(biāo)維度。生成孤立樹(shù)的總數(shù)即是數(shù)據(jù)集的采樣次數(shù)為T(mén),采樣大小為j。樣本中的2個(gè)指標(biāo)維度即代表孤立樹(shù)分叉過(guò)程中的2種切割屬性。 步驟3:判斷當(dāng)前磨耗速率樣本數(shù)據(jù)中的最大值max(j)>上界值(由樣本數(shù)據(jù)的分布特性確定)是否成立。若不成立,則舍棄該樣本集,重新選取1個(gè)樣本集。 步驟4:隨機(jī)選擇1個(gè)指標(biāo)維度作為切割屬性,選擇相應(yīng)上界值作為初次切割點(diǎn)p,在選取的指標(biāo)維度下對(duì)磨耗速率樣本集中的數(shù)據(jù)進(jìn)行比較,磨耗速率≥p的放在右子樹(shù),磨耗速率 步驟5:判斷樣本集的分割是否達(dá)到最大限制高度或者當(dāng)前子樣本中是否只有1個(gè)磨耗速率數(shù)據(jù)點(diǎn)。若是,則完成對(duì)樣本集的1次計(jì)算,并且開(kāi)始構(gòu)建下一個(gè)樣本集。 步驟6:遞歸構(gòu)造孤立子樹(shù),即不斷分叉。左子樹(shù)(即磨耗速率數(shù)據(jù)的子樣本集)選擇數(shù)據(jù)最大值與最小值之間的0.618比例處(即zmin+0.618×(zmax-zmin))為切割點(diǎn);右子樹(shù)相應(yīng)選擇0.382比例處(zmin+0.382×(zmax-zmin))作為切割點(diǎn)。選擇黃金分割點(diǎn)可減小切割隨機(jī)性,能讓孤立樹(shù)在生成子空間時(shí)每次都切割為與樣本父節(jié)點(diǎn)均等比例大小的左右子樹(shù)[5];并且2個(gè)分割點(diǎn)比例之和為1,可使得構(gòu)造子樹(shù)時(shí)迭代速度加快,且具有一定穩(wěn)定性[7]。 步驟7:重復(fù)步驟6,完成每棵孤立樹(shù)的構(gòu)建。 步驟8:重復(fù)步驟3—步驟7,遍歷所有孤立樹(shù)。設(shè)定檢測(cè)閾值Sm,計(jì)算得到s(j,m),將磨耗速率得分超過(guò)閾值的數(shù)據(jù)點(diǎn)確定為異常點(diǎn)。 圖8為改進(jìn)后的孤立森林算法流程圖。采用改進(jìn)后的孤立森林算法對(duì)L<10.7萬(wàn)km的列車(chē)車(chē)輪輪緣磨耗情況進(jìn)行計(jì)算。 圖8 改進(jìn)后的孤立森林檢測(cè)識(shí)別算法 表2為L(zhǎng)<10.7萬(wàn)km,選用不同Sm時(shí),改進(jìn)后的孤立森林算法對(duì)存在異常磨耗的車(chē)輪及其里程區(qū)段的辨識(shí)結(jié)果。和表1對(duì)照的誤報(bào)情況見(jiàn)表3。其中誤報(bào)車(chē)輪數(shù)是將正常磨耗車(chē)輪監(jiān)測(cè)為異常磨耗車(chē)輪的個(gè)數(shù),總誤報(bào)次數(shù)為誤報(bào)車(chē)輪數(shù)與非連續(xù)區(qū)段對(duì)應(yīng)誤報(bào)次數(shù)乘積的總和。 由表3可知,改進(jìn)后的孤立森林算法所得異常檢測(cè)結(jié)論與箱線圖算法所得結(jié)論較一致,兩種算法檢測(cè)出來(lái)的存在異常磨耗的車(chē)輪及其里程區(qū)段結(jié)果基本一致,驗(yàn)證了兩種算法應(yīng)用于地鐵車(chē)輪輪緣磨耗異常檢測(cè)的可行性。 由表2及表3還可看出:當(dāng)Sm為0.820~0.831時(shí),能辨識(shí)出存在異常磨耗的車(chē)輪及其里程區(qū)段,存在1~3個(gè)車(chē)輪誤報(bào)的情況;當(dāng)Sm減小至0.800時(shí),總誤報(bào)次數(shù)相對(duì)增加;當(dāng)Sm為0.832~0.930時(shí),出現(xiàn)不能辨識(shí)出車(chē)輪存在異常磨耗的狀況。可見(jiàn),過(guò)高的閾值降低了算法辨識(shí)的準(zhǔn)確性。 表2 不同Sm下的異常辨識(shí)結(jié)果 表3 不同Sm下的異常辨識(shí)誤報(bào)情況統(tǒng)計(jì)結(jié)果 當(dāng)Sm=0.831時(shí),L分別為1.97萬(wàn)km、4.01萬(wàn)km和9.35萬(wàn)km時(shí)的輪緣磨耗檢測(cè)識(shí)別結(jié)果如圖9所示。由圖9 a)可知,Sm=0.831,L=1.97萬(wàn)km時(shí),1號(hào)、42號(hào)輪被辨識(shí)為異常點(diǎn),且明顯與同列車(chē)其余位置的車(chē)輪區(qū)分開(kāi)來(lái);圖9 b)中的孤立分?jǐn)?shù)結(jié)果顯示,1號(hào)、42號(hào)輪的s(j,m)值高于Sm。分析圖9 c)—圖9 f),同樣可得類(lèi)似結(jié)論。這說(shuō)明改進(jìn)后的孤立森林算法能夠較好地辨識(shí)出存在異常磨耗的車(chē)輪及其里程區(qū)段,得到相應(yīng)的綜合檢測(cè)識(shí)別結(jié)果。 a)磨耗速率異常辨識(shí)(L=1.97萬(wàn)km) 本文基于某地鐵列車(chē)48個(gè)車(chē)輪的實(shí)測(cè)廓形數(shù)據(jù),結(jié)合輪緣磨耗面積變化速率和輪緣根部輪徑差變化速率,對(duì)大量實(shí)測(cè)數(shù)據(jù)進(jìn)行了有效分析和處理,提出了兩種能檢測(cè)和辨識(shí)出存在異常磨耗的車(chē)輪及對(duì)應(yīng)里程區(qū)段的數(shù)據(jù)挖掘的方法。 箱線圖法具有好的抗干擾能力,對(duì)數(shù)據(jù)類(lèi)型沒(méi)有限制。本文通過(guò)箱線圖算法完成了對(duì)指標(biāo)的單獨(dú)檢測(cè),得到客觀的統(tǒng)計(jì)結(jié)果,能很好地辨識(shí)出異常磨耗的車(chē)輪及其對(duì)應(yīng)里程。 本文對(duì)孤立森林算法中生成孤立樹(shù)及分割成左右子樹(shù)的過(guò)程進(jìn)行了優(yōu)化改進(jìn),提高了計(jì)算效率。通過(guò)改進(jìn)后的孤立森林算法完成了對(duì)指標(biāo)的綜合檢測(cè)。經(jīng)比較,改進(jìn)后的孤立森林算法與箱線圖法可以得到較一致的磨耗異常檢測(cè)結(jié)論,驗(yàn)證了兩種方法的可行性。此外,在改進(jìn)后的孤立森林算法中,閾值設(shè)為0.820~0.831時(shí)的檢測(cè)可靠性最好。3 基于孤立森林算法的磨耗檢測(cè)
3.1 孤立森林相關(guān)概念
3.2 孤立森林算法的改進(jìn)
3.3 改進(jìn)算法流程及結(jié)果分析
4 結(jié)語(yǔ)