• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      支持向量機(jī)和決策樹算法在滾動軸承故障診斷中的應(yīng)用

      2023-02-15 14:02:34孔祥媖
      技術(shù)與市場 2023年2期
      關(guān)鍵詞:基尼決策樹分類器

      孔祥媖

      (重慶交通大學(xué)機(jī)電與車輛工程學(xué)院,重慶 400074)

      0 引言

      滾動軸承是風(fēng)力發(fā)電機(jī)等大型機(jī)械設(shè)備的重要零部件,其性能狀態(tài)直接影響機(jī)械設(shè)備的安全穩(wěn)定運(yùn)行。及時(shí)、準(zhǔn)確的故障診斷對制定針對性維護(hù)計(jì)劃,延長使用壽命,提高機(jī)械系統(tǒng)可靠性有重要意義。因此,滾動軸承故障診斷的研究具有重要意義[1]。

      在滾動軸承故障診斷領(lǐng)域,信號采集技術(shù)、計(jì)算能力,特別是人工智能和機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步,使診斷更加自動化?;跈C(jī)器學(xué)習(xí)的故障診斷范式可分為3個(gè)階段:數(shù)據(jù)采集、特征提取和模式識別。

      第1階段,從安裝在設(shè)備中的傳感器收集信號,以獲得有關(guān)其狀態(tài)的定量信息。其中,振動信號最常用于軸承故障診斷[2]。

      第2階段,在時(shí)域、頻域或時(shí)頻域[3]中處理收集的信號,以提取可能代表軸承狀態(tài)的屬性(或特征)。例如,屬性是統(tǒng)計(jì)指標(biāo)、自回歸模型系數(shù)、分解為奇異值[4]等。這些屬性被收集到一個(gè)低維向量中(遠(yuǎn)小于所收集信號的樣本數(shù)),作為下一步分類的輸入。

      第3階段,使用專門用于模式分類的算法讀取屬性并進(jìn)行診斷,這通常在訓(xùn)練步驟后完成。在訓(xùn)練步驟中,調(diào)整算法以從機(jī)器操作歷史中識別不同的操作模式。在滾動軸承故障診斷的背景下,已經(jīng)使用了一些算法來實(shí)現(xiàn),例如決策樹[5]、k近鄰(k-NN)[6]、樸素貝葉斯分類器和支持向量機(jī)(SVM)[7]等算法。

      SVM技術(shù)具有良好的泛化性,并且有著堅(jiān)實(shí)的理論基礎(chǔ),已成功應(yīng)用于各種分類問題,如字符和對象識別。SVM分類器通常針對二進(jìn)制問題進(jìn)行訓(xùn)練,其中只需要區(qū)分兩類(“缺陷”和“非缺陷”),但也可以針對多類問題進(jìn)行調(diào)整(使用“全反一”策略)。

      決策樹算法則是一種基于樹的知識方法,用于表示分類規(guī)則。用C4.5算法生成的標(biāo)準(zhǔn)樹由多個(gè)分支、1個(gè)根、多個(gè)節(jié)點(diǎn)和多個(gè)葉子組成。1個(gè)分支是從根到葉的節(jié)點(diǎn)鏈;每個(gè)節(jié)點(diǎn)涉及1個(gè)屬性。樹中屬性的出現(xiàn)提供了有關(guān)相關(guān)屬性重要性的信息。

      本文利用SVM算法和決策樹算法,使用DC競賽軸承故障檢測數(shù)據(jù)集對其在滾動軸承故障診斷中的使用效果進(jìn)行對比分析,通過觀察4個(gè)評價(jià)指標(biāo)對2個(gè)模型進(jìn)行綜合評估,結(jié)果表明,SVM能更為準(zhǔn)確地對滾動軸承進(jìn)行故障診斷。

      1 支持向量機(jī)算法

      SVM分類器條目是要分類的對象的屬性向量。該算法的輸出是一個(gè)分?jǐn)?shù),其信號(正或負(fù))描述測試向量是否屬于每個(gè)感興趣的類別,該分?jǐn)?shù)直接作為檢測類別的標(biāo)簽呈現(xiàn)給用戶。

      SVM是一種二元識別模型。它的目的是找到一個(gè)最優(yōu)超平面段樣品,以便最大化之間的距離最近的點(diǎn)的空間和本身,算法如下。

      給定1個(gè)訓(xùn)練集:

      D={(x1,y1),(x2,y2),(x3,y3),…,(xi,yi)},yi∈{-1,1}

      (1)

      超平面可以用函數(shù)表示:

      f(x)=wTx+b

      (2)

      如果f(x)為0,樣本點(diǎn)落在超平面。當(dāng)f(x)超過0時(shí),y的值為1。如果f(x)的值小于0,則y的值為-1。其中y只是一個(gè)標(biāo)簽,為了便于描述,y的范圍是{-1,1}。

      (3)

      當(dāng)wTx+t的值大于1或小于-1時(shí),更支持??臻g中任意采樣點(diǎn)X到超平面的距離用r表示:

      (4)

      也就是說,SVM的最終目標(biāo)是使分類區(qū)間最大化。集成學(xué)習(xí)是將多個(gè)弱分類器結(jié)合一定的策略來生成一個(gè)強(qiáng)分類器。Bagging算法是一種基于均勻概率分布對數(shù)據(jù)集進(jìn)行重復(fù)采樣(帶放回)的方法。每個(gè)新數(shù)據(jù)集都具有與初始數(shù)據(jù)集相同的維度。

      2 決策樹算法

      決策樹用于衡量特征貢獻(xiàn)程度的算法有3種,分別為信息增益(ID3)、信息增益率(C4.5)和基尼指數(shù)(Gini index)。CART采用的是基尼指數(shù)最小化準(zhǔn)則,即用基尼指數(shù)選擇最優(yōu)特征,同時(shí)決定該特征的最優(yōu)二值切分點(diǎn)?;嶂笖?shù)表示在樣本集合中1個(gè)隨機(jī)選中的樣本被分錯(cuò)的概率,指數(shù)越小表示集合中選中樣本被分錯(cuò)的概率越小,集合的純度越高,反之集合越不純。在分類問題中,假設(shè)一共有M個(gè)類別,樣本點(diǎn)屬于第m類的概率為pm,則該概率分布的基尼指數(shù)為:

      (5)

      式(5)表示概率的不確定性。對于二分類問題,若樣本屬于其中某一類的概率是p,則:

      Gini(p)=2p(1-p)

      (6)

      在遍歷特征集合尋找各個(gè)特征的切分點(diǎn)時(shí),假設(shè)數(shù)據(jù)集被屬性劃分成了D1和D22個(gè)子集,則在屬性的條件下數(shù)據(jù)集的基尼指數(shù)計(jì)算如下:

      (7)

      3 基于機(jī)器學(xué)習(xí)的故障診斷

      3.1 數(shù)據(jù)介紹

      本文的研究數(shù)據(jù)來自DC競賽軸承故障檢測數(shù)據(jù)集,由id(樣本編號)、6 000個(gè)軸承震動信號以及l(fā)abel組成。其中,label指該樣本軸承是否出現(xiàn)故障,label為0時(shí)為正常,label為1時(shí)為故障。整個(gè)數(shù)據(jù)集有792個(gè)樣本,其中正常軸承有177個(gè)樣本,故障軸承有615個(gè)樣本,label分布如圖1所示。

      圖1 label分布

      3.2 數(shù)據(jù)處理

      按照8:2的比例劃分訓(xùn)練集與測試集,通過觀察label分布,可以發(fā)現(xiàn)數(shù)據(jù)存在不平衡的現(xiàn)象,采用SMOTE過采樣方法對訓(xùn)練集進(jìn)行處理,從而解決類樣本不平衡問題,處理完畢后label為0和1的樣本均為492個(gè)。

      3.3 基于SVM的軸承故障診斷

      將訓(xùn)練集輸入SVM模型進(jìn)行訓(xùn)練,模型選擇SVM.SVC,參數(shù)均為默認(rèn),模型訓(xùn)練完畢后用測試集進(jìn)行預(yù)測,預(yù)測情況如混淆矩陣所示(見圖2)。

      圖2 SVM混淆矩陣

      通過觀察混淆矩陣可以發(fā)現(xiàn),label為0的樣本全部判斷正確,label為1的樣本有15個(gè)誤判,剩下的108個(gè)樣本判斷正確。

      圖3為ROC曲線,ROC曲線圖是反映敏感性與特異性之間關(guān)系的曲線。橫坐標(biāo)x軸為1-特異性,也稱為假陽性率(誤報(bào)率),x軸越接近零準(zhǔn)確率越高;縱坐標(biāo)y軸稱為敏感度,也稱為真陽性率(敏感度),y軸越大代表準(zhǔn)確率越好。總的來說,AUC的值越接近1效果越好。通過ROC曲線圖可以發(fā)現(xiàn)AUC的值為0.939,效果較好。

      圖3 ROC曲線

      3.4 基于決策樹的軸承故障診斷

      將訓(xùn)練集輸入決策樹模型進(jìn)行訓(xùn)練,參數(shù)均為默認(rèn),模型訓(xùn)練完畢后用測試集進(jìn)行預(yù)測,預(yù)測情況如混淆矩陣所示(見圖4)。

      圖4 決策樹混淆矩陣

      通過觀察決策樹混淆矩陣可以發(fā)現(xiàn),label為0的樣本中有10個(gè)誤判為1,剩下的10個(gè)樣本預(yù)測正確,label為1的樣本有12個(gè)誤判,剩下的111個(gè)樣本判斷正確。通過觀察ROC曲線,AUC的值為0.812,如圖5所示。

      圖5 決策樹ROC曲線

      3.5 模型評估

      為了進(jìn)一步評價(jià)SVM和決策樹模型的性能,采用如下指標(biāo)對測試集進(jìn)行評價(jià),包括精確率(PRE)、召回率(Recall)和準(zhǔn)確率(ACC)。指標(biāo)的定義如下:

      (8)

      (9)

      (10)

      式中:TP表示正確識別的陽性樣本數(shù)量;TN表示正確識別的陰性樣本數(shù)量;FN表示錯(cuò)誤識別的陽性樣本數(shù)量;FP表示識別錯(cuò)誤的陰性樣本數(shù)量。

      SVM模型的測試結(jié)果如表1所示,從以上4個(gè)評價(jià)指標(biāo)來看,SVM能起到很好的預(yù)測效果。

      表1 SVM和決策樹模型評估

      4 結(jié)語

      本文利用軸承振動信號數(shù)值特征來進(jìn)行建模,以實(shí)現(xiàn)軸承故障診斷。在建模過程中用SMOTE過采樣方法來解決訓(xùn)練集不平衡的現(xiàn)象,通過觀察4個(gè)指標(biāo),可以發(fā)現(xiàn)SVM有較好的預(yù)測效果,準(zhǔn)確率達(dá)到了91%,能夠?qū)S承的故障診斷提供有效的參考。

      猜你喜歡
      基尼決策樹分類器
      Wimbledon Tennis
      一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
      決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      BP-GA光照分類器在車道線識別中的應(yīng)用
      電子測試(2018年1期)2018-04-18 11:52:35
      卷入選戰(zhàn)的布基尼
      加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
      結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
      強(qiáng)制“脫衫”
      基于決策樹的出租車乘客出行目的識別
      基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
      台北县| 紫金县| 盐源县| 北安市| 格尔木市| 瑞金市| 获嘉县| 林芝县| 东乌珠穆沁旗| 溧水县| 龙陵县| 普陀区| 孟州市| 万源市| 沙河市| 北流市| 沈丘县| 龙泉市| 大竹县| 体育| 中山市| 错那县| 绥芬河市| 金川县| 彭阳县| 阜新市| 武鸣县| 杭锦后旗| 九龙城区| 漯河市| 曲阳县| 许昌县| 青浦区| 正安县| 灯塔市| 天门市| 华池县| 喜德县| 黄平县| 翁源县| 睢宁县|