改進卷積膠囊網(wǎng)絡(luò)的滾動軸承故障診斷方法

2024-06-15 17:42:14趙小強柴靖軒

振動工程學報 2024年5期

趙小強柴靖軒

摘要：目前許多基于卷積網(wǎng)絡(luò)的滾動軸承故障診斷方法受噪聲信號以及負荷變化的影響，存在診斷效果不佳、泛化能力差的問題。針對此問題提出一種改進卷積膠囊網(wǎng)絡(luò)的滾動軸承變工況故障診斷方法。該方法設(shè)計了多尺度非對稱卷積模塊，其中采用不同尺度的非對稱卷積層對輸入數(shù)據(jù)進行特征提取，在實現(xiàn)最大化提取數(shù)據(jù)中的特征信息的同時，還能夠有效減少參數(shù)量；在該模塊中引入通道注意力機制，能更好地提取有用的通道特征，提高該方法特征提取的能力；通過將網(wǎng)絡(luò)中的全連接層改進為膠囊全連接層，使得膠囊在輸出向量特征信息時，避免了特征信息在空間中的丟失。使用凱斯西儲大學軸承數(shù)據(jù)集和東南大學變速箱數(shù)據(jù)集來驗證所提方法的診斷性能，并與其他深度學習方法進行了比較。實驗結(jié)果表明，與其他深度學習方法相比，具有較好的泛化性，效果更佳。

關(guān)鍵詞：故障診斷；滾動軸承；膠囊網(wǎng)絡(luò)；非對稱卷積；特征提取

中圖分類號： TH165+.3； TH133.33+1??? 文獻標志碼： A??? 文章編號： 1004-4523（2024）05-0885-11

DOI：10.16385/j.cnki.issn.1004-4523.2024.05.017

引言

旋轉(zhuǎn)機械中的滾動軸承是關(guān)鍵部件，其運行狀態(tài)直接影響到整個旋轉(zhuǎn)機械的工作過程［1］，發(fā)生故障可能會損壞整個設(shè)備，造成重大損失。因此，對滾動軸承進行更準確、更智能的故障診斷是減少經(jīng)濟損失的重要保障［2］。

故障診斷技術(shù)向智能化階段發(fā)展，其中人工智能的算法對各種故障類型的識別和分類尤為重要［3?4］。作為人工智能的主要方法，機器學習可以有效地學習數(shù)據(jù)信息，模擬并實現(xiàn)人類學習行為，不斷改進和提高自身的性能，取得更好的學習效果。貝葉斯分類器［5］、支持向量機［6］和神經(jīng)網(wǎng)絡(luò)［7］等機器學習方法雖然能夠提取、識別與分類所需的故障特征，但是在提取軸承的故障信號特征時，往往使用復雜的數(shù)學工具，針對不同類型的故障所采用的特征提取方法也不同。傳統(tǒng)的故障特征提取方法過于依賴信號處理的相關(guān)知識以及故障診斷專家的經(jīng)驗［8?9］，這對故障檢測的效率和成本都是很大的考驗。

與傳統(tǒng)的人工智能故障診斷方法相比，深度學習技術(shù)不僅直接處理工業(yè)生產(chǎn)系統(tǒng)的檢測信號，而且不過多依賴信號處理和專家經(jīng)驗。近年來，深度學習技術(shù)在軸承故障診斷領(lǐng)域取得了快速發(fā)展［10?11］，例如卷積神經(jīng)網(wǎng)絡(luò)［12］、深度置信網(wǎng)絡(luò)［13］、稀疏自編碼器［14］和卷積自編碼網(wǎng)絡(luò)［15］等方法通過多層非線性特征提取結(jié)構(gòu)，將振動信號進行多層非線性變換，可以比較充分地提取故障特征，診斷生產(chǎn)過程中的設(shè)備故障類別。然而在實際的工業(yè)應用中，傳感器采集到的振動信號會無法避免地被現(xiàn)場各種噪聲所污染［16?17］。此外，軸承的轉(zhuǎn)速會因負荷的變化而變化。鑒于各種復雜的系統(tǒng)組件及其內(nèi)部工作原理，通常存在錯綜復雜且強相關(guān)的耦合關(guān)系。因此，傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)在診斷受噪聲干擾和負荷變化影響的軸承故障時，會存在診斷準確率低、泛化能力差的問題。

膠囊網(wǎng)絡(luò)由Sabour等［18］提出。與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)不同，膠囊網(wǎng)絡(luò)中的每個神經(jīng)元都不是由傳統(tǒng)的標量組成，而是由向量組成。因此，膠囊網(wǎng)絡(luò)可以從輸入數(shù)據(jù)中提取并存儲更詳細的特征，同時有效地減少特征信息的損失。初始膠囊網(wǎng)絡(luò)提取特征時僅使用了單卷積；楊平等［19］提出雙卷積層膠囊網(wǎng)絡(luò)的診斷方法，但雙卷積層膠囊網(wǎng)絡(luò)只增加了一個卷積層和池化層［18］，使得原始圖像數(shù)據(jù)特征未被進一步提取，導致細節(jié)特征提取不夠完整，其特征提取能力還有待改善。

針對上述膠囊網(wǎng)絡(luò)存在的問題，本文提出一種基于卷積膠囊網(wǎng)絡(luò)的故障診斷方法。首先使用不同尺度非對稱卷積層和注意力機制構(gòu)建多尺度非對稱卷積結(jié)構(gòu)，然后使用膠囊全連接層改進了膠囊網(wǎng)絡(luò)，最后結(jié)合多尺度非對稱卷積和改進的膠囊網(wǎng)絡(luò)進行特征分類，可以在強噪聲影響或變負荷的情況下診斷軸承的故障，提高故障診斷的準確率。

1 基礎(chǔ)理論

1.1 Inception卷積結(jié)構(gòu)

在深度學習中，卷積神經(jīng)網(wǎng)絡(luò)（CNN）［20］是一種前饋神經(jīng)網(wǎng)絡(luò)，具有自動提取特征的能力，它通過多個卷積核逐層提取輸入數(shù)據(jù)中的深層特征，卷積核的每個元素都包含一個權(quán)重系數(shù)和偏差，并對輸入圖像或數(shù)據(jù)執(zhí)行局部卷積運算。

Inception結(jié)構(gòu)使用不同大小的卷積核，通過堆疊來增加網(wǎng)絡(luò)寬度，從而可以提取豐富的特征信息，同時利用1×1尺度的卷積核對輸入的特征圖進行降維，減少參數(shù)，加快網(wǎng)絡(luò)計算及訓練速度。由于激活函數(shù)的增加，多層卷積核的非線性表達能力得到提升；卷積層的深度增加，避免了一定的梯度彌散。目前，Inception模塊已經(jīng)更新到Inception v4和Inception?ResNet模塊［21］。

1.2 通道注意力機制

注意力機制模仿人觀察事物、關(guān)注重點部位的特點，在自然語言處理、統(tǒng)計學習及語音識別等領(lǐng)域中［22］被廣泛應用。通道注意力機制能更好地提取有用的通道特征，增強模型特征提取的能力。通道注意力模塊由三部分組成：壓縮模塊、激勵模塊和注意力模塊［23］。壓縮模塊由池化層將各通道內(nèi)的全局空間特征信息進行求和壓縮，形成各自的通道特征，該特征能反映全局的通道特征信息，等同擴大了網(wǎng)絡(luò)的感受野；激勵模塊在增強模塊遷移能力的同時降低模塊的參數(shù)數(shù)量；注意力模塊在每個通道域上將原卷積相應的通道特征值與得到的特征權(quán)重進行加權(quán)相加，使卷積通道特征表現(xiàn)不同的權(quán)重，提取出表征目標中的關(guān)鍵信息。

1.3 膠囊網(wǎng)絡(luò)

膠囊網(wǎng)絡(luò)使用卷積層來對二維輸入信息的各個區(qū)域進行卷積計算，并將計算結(jié)果堆疊，形成卷積層的輸出。傳統(tǒng)深度學習方法通常使用最大池化層來實現(xiàn)靜態(tài)不變性，由于最大池化層持續(xù)搜尋二維矩陣的區(qū)域并選取區(qū)域內(nèi)最大的計算結(jié)果，因此有價值的信息容易損失，并且對編碼特征間的相對空間關(guān)系缺乏考慮，本文方法使用動態(tài)路由算法替代最大池化層，膠囊層提取的重要特征信息以向量形式被膠囊封裝，普通標量神經(jīng)元與膠囊向量神經(jīng)元如圖1所示。

在圖2膠囊網(wǎng)絡(luò)結(jié)構(gòu)中，設(shè)定上層膠囊為父膠囊，下層膠囊為子膠囊。除第一層膠囊外，其余下層膠囊的總輸入是來自子膠囊的所有“預測向量”的加權(quán)和，記父膠囊層第個神經(jīng)元為，為與神經(jīng)元相乘的權(quán)重矩陣。用非線性Squash函數(shù)替代傳統(tǒng)激活函數(shù)，將總輸入傳遞到膠囊網(wǎng)絡(luò)中，得到最終的輸出向量，其表達式為：

式中是由迭代動態(tài)路由過程確定的耦合系數(shù)，其目的是使輸入的神經(jīng)元能夠自主選擇最好的路徑傳輸?shù)较乱粚由窠?jīng)元。膠囊與上一層，膠囊i-1層中所有膠囊之間的耦合系數(shù)之和為1，由“路由Softmax”確定，其初始Logits函數(shù)為膠囊連接到膠囊的對數(shù)先驗概率，其表達式為：

在每一次動態(tài)路由的前向傳播中，都先將初始化為0，使用式（5）來更新的值，從而更新的值，通過前向傳播進一步修正的值，改變輸出向量的值，通過動態(tài)路由迭代循環(huán)，最終得到一組最佳的耦合系數(shù)。

2 改進卷積膠囊網(wǎng)絡(luò)的滾動軸承故障診斷方法

滾動軸承的工作環(huán)境通常伴隨強噪聲、變負荷等情況，導致實際軸承檢測的振動信號容易受到外界因素干擾。為了充分利用膠囊網(wǎng)絡(luò)的特征提取能力，同時改進神經(jīng)網(wǎng)絡(luò)需要處理大量的數(shù)據(jù)和時間來提高學習能力的缺點，并預防梯度損失的問題，本文提出了改進卷積膠囊的滾動軸承變工況故障診斷方法，設(shè)計了改進的多尺度非對稱卷積模塊和改進全連接膠囊層并引入通道注意力機制，實現(xiàn)對強噪聲和變工況下故障的診斷。

2.1 多尺度非對稱卷積結(jié)構(gòu)

為使膠囊網(wǎng)絡(luò)從原始振動信號中獲取更多的有用信息，并提升膠囊網(wǎng)絡(luò)提取特征的速度，本文提出了一種改進的多尺度非對稱卷積模塊。該模塊基于Inception結(jié)構(gòu)，相比于普通的對稱k×k卷積核的卷積，非對稱卷積是將一個k×k的卷積拆解成一個k×1的卷積再串聯(lián)一個1×k的卷積，兩者的感受野是相同的，但非對稱卷積能有效地減少參數(shù)量和運算量［24］，因為多個大小兼容的二維核使用相同的步長對同一輸入進行操作，這些卷積核會產(chǎn)生具有相同分辨率的輸出。在求和非對稱卷積的輸出后，相應位置的卷積核會相互疊加，從而形成一個等效的卷積核，其輸出與原始輸出相同［25?26］，其結(jié)構(gòu)如圖3所示：在第一層中，使用1×1結(jié)構(gòu)，3×1與1×3的串聯(lián)，以及5×1與1×5的串聯(lián)結(jié)構(gòu)。且并行的卷積層對輸入故障數(shù)據(jù)進行不同尺度的特征提取，通道數(shù)設(shè)置為16，8，8；第二層將5×5，3×3的卷積分別等效拆解成5×1與1×5，3×1與1×3的非對稱卷積，并與第一層串聯(lián)，通道數(shù)都為16；第三層使用兩個1×1且通道數(shù)都為32的卷積層。為了增加模型的非線性表達能力，在每個卷積層之后使用批量標準化和ReLU激活函數(shù)，然后通過Concat層對不同分支的特征維度進行堆疊拼接，并使用通道注意力機制獲得不同特征信息的重要程度，依據(jù)重要程度增強有用特征，抑制干擾。

2.2 膠囊全連接層

全連接層（Fully Connected Layers）在整個神經(jīng)網(wǎng)絡(luò)中起到將學習到的“分布式特征表示”映射到樣本標記空間的作用［27］。因為全連接層的特性參數(shù)在網(wǎng)絡(luò)中也是最多的，所以全連接層在綜合前邊提取的特征時，參數(shù)相對冗余，在模型進行最后故障分類時，存在特征信息丟失的問題。為使模型達到更好的故障診斷效果，本文改進了一種膠囊全連接層［28］來替代傳統(tǒng)全連接層。膠囊全連接層是由子膠囊構(gòu)成，子膠囊保留上層父膠囊提取的特征信息，如圖4所示。當模型在最后壓縮輸出時，下層的膠囊被展平成膠囊列表，送入膠囊全連接層，膠囊層中每個子膠囊乘以轉(zhuǎn)換矩陣，通過協(xié)議路由，以產(chǎn)生適用于每個類別的最終膠囊及其概率。因為協(xié)議路由內(nèi)部會使用Softmax函數(shù)產(chǎn)生膠囊間的對數(shù)先驗概率，所以本文使用ReLU激活函數(shù)在全連接層內(nèi)部進行一次再壓縮，針對每個最終膠囊進行解碼。改進因膠囊全連接層內(nèi)部的Softmax函數(shù)被過多使用，導致數(shù)值溢出的問題；所以在其內(nèi)部使用ReLU函數(shù)進行單側(cè)抑制，增強運算效率的同時，并沒有像傳統(tǒng)前連接層一樣丟失過多的特征信息。因為各個膠囊盡可能地保留了特征向量，所以在將各個數(shù)字膠囊層提取的特征信息相連時，依舊保持較高的信息量，在最后使用ReLU函數(shù)來抑制過擬合，可以提高模型的分類準確度。

2.3 網(wǎng)絡(luò)結(jié)構(gòu)

為提高卷積膠囊網(wǎng)絡(luò)的特征提取效率，利用改進的多尺度特征提取模塊進行前端特征提取，該模塊采用多通道不同尺度的非對稱卷積核，有效地減少特征提取時的參數(shù)量。采用通道注意力機制獲得更多更有效的故障數(shù)據(jù)信息，并減少特征提取時的模型計算量，與主膠囊層相結(jié)合，將前端提取的標量特征信息轉(zhuǎn)換為向量特征信息，在空間上存儲了更多的有效特征信息。以動態(tài)路由算法替代了傳統(tǒng)最大池化實現(xiàn)特征傳遞，并在后端數(shù)字膠囊層與輸出層之間使用全連接膠囊層進行下一步的特征信息全連接和特征分類的輸出傳遞，保證特征信息盡可能地存儲在膠囊中，經(jīng)過交叉熵損失函數(shù)輸出故障診斷結(jié)果，其結(jié)構(gòu)如圖5所示。

3 實驗驗證及結(jié)果分析

為了評估本文提出方法對故障診斷的有效性和準確性，實驗在Windows 10系統(tǒng)下進行，處理器為i9?9900K，GPU為RTX 2070 SUPER，利用Pycharm平臺，編程語言為Python，深度學習框架為Tensorflow［29］。本文實驗以滾動軸承為對象，采用來自美國凱斯西儲大學（CWRU）的軸承數(shù)據(jù)［30］和東南大學變速箱數(shù)據(jù)集中的軸承數(shù)據(jù)［31］進行實驗驗證與分析。

3.1 CWRU軸承故障數(shù)據(jù)集

3.1.1 數(shù)據(jù)集介紹

本文選取了凱斯西儲大學（CWRU）滾動軸承數(shù)據(jù)中心的公開數(shù)據(jù)集驗證本文方法的可行性，CWRU實驗臺由電機、扭矩傳感器和測功器組成。測試的故障軸承是型號為SKF 6205的電機驅(qū)動端軸承，采用電火花方法在內(nèi)圈、滾動體和外圈的表面上加工出損傷直徑為0.1778，0.3556，0.5334和0.7112 mm的單點凹槽，以模擬滾動軸承在實際運行中的磨損情況。本實驗采樣頻率為12 kHz，分別采集轉(zhuǎn)速為1797，1772，1750和1730 r/min時，對應負載為0，1，2和3 hp（約為0，0.75，1.49和2.24 kW）狀態(tài)下的加速度數(shù)據(jù)集，并將其標記為數(shù)據(jù)集A、數(shù)據(jù)集B、數(shù)據(jù)集C和數(shù)據(jù)集D。將采集到的數(shù)據(jù)按照不同位置和不同損傷度劃分為16種狀態(tài)標簽，且每種狀態(tài)標簽中的樣本數(shù)量大致相同。在每個數(shù)據(jù)集中單次選取8000個樣本，按照3∶1的比例劃分訓練樣本和測試樣本，每段的采樣點數(shù)設(shè)置為784個，每一訓練批次大小為100。訓練集和測試集如表1所示。

3.1.2 數(shù)據(jù)集處理

實驗臺采集的軸承數(shù)據(jù)為一維時間序列，為了適應改進卷積膠囊網(wǎng)絡(luò)模型輸入數(shù)據(jù)格式，有效地進行卷積和下采樣操作，根據(jù)如圖6所示的重構(gòu)方式，本文對長度為784的一維數(shù)據(jù)進行提取。首先，將時間序列樣本等分為28段，每段包含28個數(shù)據(jù)點；然后，將這28段數(shù)據(jù)堆疊在一起，獲得一個（28，28）的二維特征灰度圖。

為了加快網(wǎng)絡(luò)模型訓練速度，讓數(shù)據(jù)便于計算、獲得更加泛化的結(jié)果，對輸入數(shù)據(jù)做標準化處理，有效消除變量量綱和變異范圍的影響，其表達式為：

式中為輸入數(shù)據(jù)，為數(shù)據(jù)中的最小值，為數(shù)據(jù)中的最大值。

3.2 網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)

網(wǎng)絡(luò)結(jié)構(gòu)越深，特征提取能力就越強，但是網(wǎng)絡(luò)層數(shù)越多，越容易產(chǎn)生梯度爆炸等問題。滾動軸承的故障數(shù)據(jù)為一維時間序列，在轉(zhuǎn)化成二維特征圖像輸入時，有效特征不是足夠多，所以提出方法時要考慮提升網(wǎng)絡(luò)的計算效率。在使用多尺度特征提取時，用非對稱卷積核替代傳統(tǒng)對稱卷積核，這樣可以在同樣的感受野下，減少模型計算的參數(shù)量，加快模型的計算效率。在通道注意力機制后，需要構(gòu)建膠囊單元，表2中膠囊單元的輸出尺寸表示為6×（8），即特征層的寬度為6且每一個向量的維度為8。在膠囊層中通過動態(tài)路由將之前卷積輸出的特征標量變?yōu)樘卣魇噶?，在膠囊層之間進行運算。同理，16×（10）表示16個維度為10的向量，10×（8）表示10個維度為8的向量。

因為膠囊網(wǎng)絡(luò)的擬合能力較強，所以訓練時在膠囊層使用Dropout操作，即對神經(jīng)元在每次迭代時隨機失活，并且失活神經(jīng)元的權(quán)值不再更新，從而降低網(wǎng)絡(luò)復雜度，防止網(wǎng)絡(luò)過擬合。本文方法參數(shù)設(shè)計如表2所示。

3.3 對比方法

為了驗證本文方法在變噪聲、變負荷和變工況實驗中，是否能夠獲得較高的故障診斷準確率和較好的泛化能力，將本文方法和常見的深度學習方法（CNN，IRB，CapsNet和FD?CCN）進行對比。對比模型的網(wǎng)絡(luò)參數(shù)如表3所示，表3中的參數(shù)盡量使用與原文獻中相同的網(wǎng)絡(luò)參數(shù)。

CNN（Convolutional Neural Network）使用傳統(tǒng)的全連接層，為適應時頻變換后的數(shù)據(jù)結(jié)構(gòu)，通過卷積和池化的方式，逐層提取和壓縮特征。卷積層的參數(shù)構(gòu)建是為了更好地對比IRB［30］網(wǎng)絡(luò)，因為IRB網(wǎng)絡(luò)同樣使用卷積層，有著不錯的診斷效果。

IRB（Inception+Residual Block）全局殘差網(wǎng)絡(luò)［32］在殘差網(wǎng)絡(luò)中添加了注意力機制，并使用了五個殘差塊來提取特征信息，兩個全連接層來逐層進行特征壓縮。網(wǎng)絡(luò)內(nèi)部參數(shù)參照原文獻來復現(xiàn)網(wǎng)絡(luò)，同時使用Inception模塊。

FD?CCN（Fault Diagnosis?Convolution Capsule Network）卷積膠囊網(wǎng)絡(luò)［19］用傳統(tǒng)卷積層和池化層組合先進行特征提取，并二次使用卷積與池化，再與膠囊層相組合，結(jié)合了卷積網(wǎng)絡(luò)和膠囊網(wǎng)絡(luò)的各自特點，采用ReLU激活函數(shù)，以傳統(tǒng)的全連接層來進行特征壓縮，也采用原文獻中的網(wǎng)絡(luò)參數(shù)，驗證本文方法對改進膠囊網(wǎng)絡(luò)具有明顯的提升和優(yōu)勢。

CapsNet（Capsules Network）膠囊網(wǎng)絡(luò)［18］先通過一個二維卷積層進行特征提取并作為膠囊層的輸入，在初級膠囊層與數(shù)字膠囊層之間通過動態(tài)路由算法進行特征向量的矢量轉(zhuǎn)化。膠囊網(wǎng)絡(luò)使用文獻［18］中的網(wǎng)絡(luò)參數(shù)，驗證了本文方法對原有膠囊網(wǎng)絡(luò)的改進具有顯著效果。

分別使用構(gòu)建好的數(shù)據(jù)集B進行實驗，樣本按3∶1的比例隨機劃分訓練集和測試集。4種方法均采用Adam優(yōu)化方法，學習率為0.001，衰減率為0.9，訓練時單次讀入數(shù)據(jù)量批次大小為100，全部樣本迭代批次數(shù)設(shè)置為50，運行3次取平均結(jié)果。表4為在數(shù)據(jù)集B上的不同方法診斷結(jié)果對比。

由表4可以看到，改進卷積膠囊網(wǎng)絡(luò)對訓練集的診斷精度有一定提升。這說明改進的卷積膠囊網(wǎng)絡(luò)相比于其他深度學習方法在數(shù)據(jù)量更大時，不僅診斷精度優(yōu)于其他方法，而且在減少特征損失方面也有著不錯的表現(xiàn)。

3.4 變工況條件下的故障診斷結(jié)果與分析

3.4.1 變負荷故障診斷

由于在實際中，滾動軸承經(jīng)常工作在變負荷狀態(tài)下，所以要求故障診斷方法具有良好的泛化能力。為了驗證本文方法在變負荷情況下的診斷性能，網(wǎng)絡(luò)訓練與測試用的數(shù)據(jù)均為不同負荷下的數(shù)據(jù)集。以數(shù)據(jù)集A、數(shù)據(jù)集B、數(shù)據(jù)集C和數(shù)據(jù)集D中的一種依次作為訓練樣本，另外三種負荷數(shù)據(jù)集作為測試樣本，實驗結(jié)果如圖7所示。

由圖7可以看到，本文提出的方法在變負荷實驗中的診斷準確率均高于其他三種方法，其中以數(shù)據(jù)集C作為訓練樣本，數(shù)據(jù)集A、數(shù)據(jù)集B和數(shù)據(jù)集D作為測試樣本時，IRB雖然改進了數(shù)據(jù)池化層、增強了網(wǎng)絡(luò)特征學習能力，但是診斷準確率不如FD?CCN和本文方法，這是由于膠囊網(wǎng)絡(luò)能保留卷積丟失的特征信息；CapsNet相較于卷積方法的性能有提升，但是因為其單一的卷積層，沒有充分提取故障特征信息，提升優(yōu)勢并不是很明顯；FD?CCN雖然已經(jīng)有了較明顯的提取特征能力的提升，但是在前端卷積層輸出特征信息到膠囊層的過程中過度使用池化層，在特征提取過程中過濾了不活躍的特征信息，影響了故障診斷準確率提升。以數(shù)據(jù)集C為訓練集，本文方法對測試集為數(shù)據(jù)集A、數(shù)據(jù)集B、數(shù)據(jù)集D時的故障診斷準確率分別為97.52%，96.41%和98.56%，平均診斷準確率達到97.49%，而FD?CCN方法的診斷準確率平均值為92.38%，本文方法相比于FD?CCN準確率提升5%左右。

3.4.2 變噪聲故障診斷

在實際應用中，檢測的信號受到強噪聲的干擾，為了驗證本文方法在故障診斷時的抗強噪聲性能，將不同信噪比（SNR）的高斯白噪聲添加在測試數(shù)據(jù)集中。信噪比是評價信號中所含噪聲的重要指標，其表達式為：

式中為信號有效功率；為噪聲功率。

本文方法以滾動軸承數(shù)據(jù)集C作為訓練樣本，并且在數(shù)據(jù)集C的測試樣本中加入信噪比分別為 -3，3，6和9 dB的高斯白噪聲。給原始信號加入噪聲以后，原始信號的特征就被強噪聲所淹沒，如圖8所示。人眼已無法清晰地區(qū)分強噪聲信號故障是否與原始信號故障屬于相同故障。將最終得到的實驗結(jié)果與CNN，IRB，CapsNet和FD?CCN方法的診斷結(jié)果進行對比分析，實驗結(jié)果如表5所示。

由表5的數(shù)據(jù)對比可知，在不同信噪比的實驗結(jié)果中，F(xiàn)D?CCN和CapsNet相比CNN和IRB有著明顯的診斷優(yōu)勢，在信噪比為-3 dB的噪聲下達到95%左右的診斷準確率，相比于IRB和CNN提升了5%以上；在信噪比為-3 dB時，本文方法比CapsNet的故障診斷準確率提升了2.98%，相比FD?CCN的診斷準確率提升了1.27%。本文方法在數(shù)據(jù)池化層采用多尺度非對稱卷積，最大限度地提取了故障數(shù)據(jù)中的信息，在6 dB以上的噪聲下故障診斷準確率達99%以上，相比于其他4種方法其抗噪性能更好。

圖9是本文方法在不同信噪比下的故障診斷結(jié)果，可以直觀得到，在-3 dB的強噪聲環(huán)境下，測試集的診斷準確率達到95%以上。

3.4.3 變工況故障診斷

在實際工程應用中，由于軸承的工作環(huán)境復雜，振動信號可能同時受到強噪聲和負荷變化的影響。在變噪聲和變負荷的單工況故障診斷實驗中，本文提出的方法均取得了良好的診斷效果，為了驗證本文方法在噪聲環(huán)境下，且負荷在變化時的診斷性能，以數(shù)據(jù)集A作為訓練樣本，數(shù)據(jù)集B、數(shù)據(jù)集C和數(shù)據(jù)集D作為測試樣本并且向測試樣本中分別添加-3，3，6和9 dB的高斯白噪聲，與CNN，IRB，CapsNet和FD?CCN模型的診斷結(jié)果進行對比分析，結(jié)果如表6所示。

從表6可知，本文方法在不同信噪比和變負荷的環(huán)境下，其故障識別準確率都優(yōu)于IRB，CapsNet和FD?CCN。以數(shù)據(jù)集B為測試樣本時，隨著信噪比的減小，F(xiàn)D?CCN的診斷準確率從97.41%降到了85.96%，而本文方法從99.11%降到了90.37%，診斷準確率仍在90%以上，說明本文方法擁有更好的泛化能力。

3.5 變速箱的滾動軸承實驗分析

3.5.1 變速箱數(shù)據(jù)集介紹與處理

為了驗證本文所提方法在其他類型軸承應用的可行性，采用來自東南大學變速箱數(shù)據(jù)集中的軸承數(shù)據(jù)進行實驗驗證［31］，該數(shù)據(jù)從傳動系統(tǒng)動力學模擬器（DDS）上獲取，DDS由電機、行星齒輪箱、并聯(lián)齒輪箱和制動器構(gòu)成。在實驗中，分別在兩種運行條件下（20 Hz，0 V和30 Hz，2 V）對齒輪和軸承的故障進行診斷實驗，其中軸承狀態(tài)包括正常、外圈裂縫故障、內(nèi)圈裂縫故障、滾動體裂縫故障和內(nèi)外圈裂縫聯(lián)合故障。DDS實驗臺表面采用7個608A11振動傳感器，其頻率范圍為0.5～10 Hz，測量范圍為±50g，測量精度為100 mV/g。測量了齒輪箱x，y，z三個方向的振動信號，并采用緊湊型光譜板數(shù)據(jù)采集儀（最多20個通道）進行數(shù)據(jù)采集，采樣頻率為1024 Hz，采樣窗口為512 s［33］。本文在每種故障中隨機選取800個樣本，按照3∶1的比例劃分訓練集和測試集，如表7所示。

3.5.2 故障診斷結(jié)果與分析

（1）變負荷故障診斷

該實驗轉(zhuǎn)速?負載分別設(shè)置為20 Hz?0 V和30 Hz?2 V，以軸承5種故障類型為基礎(chǔ)，構(gòu)建10個實驗數(shù)據(jù)集。讀入數(shù)據(jù)共計批次大小為100，設(shè)置迭代批次為50，將全部樣本運行3次并取平均結(jié)果。將實驗結(jié)果與CNN，IRB，CapsNet和FD?CCN方法作比較，結(jié)果如表8所示。

由表8可知，在變負荷環(huán)境下，本文所提方法的故障診斷準確率相比其他4種方法有顯著提升。這是由于本文方法設(shè)計了改進后的多尺度非對稱卷積模塊進行特征提取，能夠充分提取故障數(shù)據(jù)中的信息，提取的特征進入膠囊網(wǎng)絡(luò)，膠囊網(wǎng)絡(luò)可以更充分地提取并保存數(shù)據(jù)中的特征信息，從而使故障診斷準確率得到顯著的提升。

為進一步觀察本文所提方法對故障誤判的情況，對測試結(jié)果做了混淆矩陣實驗，結(jié)果如圖10所示，圖中橫坐標為預測標簽的診斷狀態(tài)，縱坐標為真實標簽的實際狀態(tài)。

從圖10（a）可看出，F(xiàn)D?CCN方法對于軸承滾動體故障的診斷準確率僅為98.29%，因為FD?CCN使用了兩次池化操作，在特征提取過程中損失了一些細節(jié)特征。這導致兩種故障的診斷準確率分別為0.96與0.97，對整個故障診斷造成了影響。而從圖10（b）可看出，本文方法對各個故障狀態(tài)均有較高的診斷準確率，其整體診斷準確率達99.81%，這說明本文方法相比于FD?CCN擁有更佳的診斷性能，能夠更充分地提取故障特征信息。也驗證了本文所提出的故障診斷方法應用在其他種類軸承數(shù)據(jù)集的可行性和泛化能力。

（2）變噪聲故障診斷

在變速箱數(shù)據(jù)集上依舊采用和CWRU軸承數(shù)據(jù)集一樣的處理方式，分別加入信噪比為-3，3，6和9 dB的高斯白噪聲，具體結(jié)果如表9所示。

由表9可知，在-3 dB的強噪聲環(huán)境下，本文方法相比傳統(tǒng)的CapsNet故障診斷準確率提升了2.42%，相比FD?CCN提升了0.65%。這說明本文方法依舊保持著良好的特征提取性能，且本文方法在軸承故障診斷的抗噪方面有著不錯的表現(xiàn)。

3.6 模型參數(shù)量

計算成本是評價深度學習方法性能的重要指標。本文方法和各對比方法的參數(shù)量如表10所示。傳統(tǒng)CNN和IRB方法的參數(shù)量雖然明顯小于膠囊相關(guān)方法，但是它們的故障診斷準確率也是最低的。本文方法相比傳統(tǒng)CapsNet的參數(shù)量顯著減少，盡管比FD?CCN的參數(shù)量要多，但是本文方法在變速箱數(shù)據(jù)集變負荷實驗中每批次平均耗時最短，診斷結(jié)果更優(yōu)。這是因為參數(shù)量相同時，非對稱卷積比對稱卷積計算效率更高。同時由于本文方法在膠囊網(wǎng)絡(luò)前未使用池化操作過濾部分特征信息，能夠充分提取故障特征信息，所以具有良好的魯棒性。

4 結(jié) 論

本文提出了一種改進卷積膠囊網(wǎng)絡(luò)的滾動軸承變工況故障診斷方法。該方法將一維時域信號轉(zhuǎn)為二維圖像數(shù)據(jù)作為網(wǎng)絡(luò)輸入，通過大量的數(shù)據(jù)學習，能夠自適應地提取軸承故障特征，而無需對原始數(shù)據(jù)進行過多的人工預處理，通過將多尺度非對稱卷積與通道注意力模塊結(jié)合，并且改進膠囊網(wǎng)絡(luò)中的膠囊全連接層，起到抗噪和改善特征提取能力的作用，使得本文方法的穩(wěn)定性和泛化能力更好。實驗結(jié)果表明，相比于傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)、全局殘差網(wǎng)絡(luò)和雙卷積膠囊神經(jīng)網(wǎng)絡(luò)，本文方法可以實現(xiàn)更高的診斷準確率和更好的泛化能力。未來在強噪聲環(huán)境影響下，需要對本文方法進一步優(yōu)化，改善網(wǎng)絡(luò)參數(shù)選擇的穩(wěn)定性和通用性。

參考文獻：

［1］張妮，車立志，吳小進. 基于數(shù)據(jù)驅(qū)動的故障診斷技術(shù)研究現(xiàn)狀及展望［J］. 計算機科學， 2017， 44（6A）： 47-52.

Zhang N， Che L Z， Wu X J. Present situation and prospects of data-driven based fault diagnosis technique［J］. Computer Science， 2017， 44（6A）： 47-52.

［2］Lu C， Wang Z Y， Qin W L， et al. Fault diagnosis of rotary machinery components using a stacked denoising autoencoder-based health state identification［J］. Signal Processing， 2017， 130： 377-388.

［3］劉強，柴天佑，趙立杰. 基于數(shù)據(jù)和知識的工業(yè)過程監(jiān)視及故障診斷綜述［J］. 控制與決策， 2010， 25（6）： 801-807.

Liu Q， Chai T Y， Zhao L J. Progress of data-driven and knowledge-driven process monitoring and fault diagnosis for industry process［J］. Control and Decision， 2010， 25（6）： 801-807.

［4］盧文濤. 基于膠囊網(wǎng)絡(luò)模型過程故障識別的應用與研究［D］. 南昌：華東交通大學， 2020.

Lu Wentao. Application and research of process fault identification based on CapsNet Model［D］. Nanchang： East China Jiaotong University， 2020.

［5］Muralidharan V， Sugumaran V. A comparative study of Na?ve Bayes classifier and Bayes net classifier for fault diagnosis of monoblock centrifugal pump using wavelet analysis［J］. Applied Soft Computing， 2012， 12（8）： 2023-2029．

［6］Yang Y， Yu D， Cheng J. A fault diagnosis approach for roller bearing based on IMF envelope spectrum and SVM［J］. Measurement， 2007， 40（9-10）： 943-950．

［7］賀巖松，黃毅，徐中明，等. 基于小波奇異熵與SOFM神經(jīng)網(wǎng)絡(luò)的電機軸承故障識別［J］. 振動與沖擊， 2017， 36（10）： 217-223．

He Y S， Huang Y， Xu Z M， et al. Motor bearing fault identification based on wavelet singular entropy and SOFM neural network［J］. Journal of Vibration and Shock， 2017， 36（10）： 217-223.

［8］Verstraete D， Ferrada A， Drognett E L， et al. Deep learning enabled fault diagnosis using time-frequency image analysis of rolling element bearings［J］. Shock ＆ Vibration， 2017， 2017： 1-17．

［9］He Z， Shao H， Ding Z， et al. Modified deep autoencoder driven by multisource parameters for fault transfer prognosis of aeroengine［J］. IEEE Transactions on Industrial Electronics， 2021， 69（1）： 845-855.

［10］胡越，羅東陽，花奎，等. 關(guān)于深度學習的綜述與討論［J］. 智能系統(tǒng)學報， 2019， 14（1）： 1-19.

Hu Y， Luo D Y， Hua K， et al. Overview on deep learning［J］. Journal of Intelligent Systems， 2019， 14（1）： 1-19.

［11］邵海東，張笑陽，程軍圣，等. 基于提升深度遷移自動編碼器的軸承智能故障診斷［J］. 機械工程學報， 2020， 56（9）： 84-90.

Shao H D， Zhang X Y， Cheng J S， et al. Intelligent fault diagnosis of bearings using enhanced deep transfer auto-encoder［J］. Journal of Mechanical Engineering， 2020， 56（9）： 84-90.

［12］曲建嶺，余路，袁濤，等. 基于一維卷積神經(jīng)網(wǎng)絡(luò)的滾動軸承自適應故障診斷算法［J］. 儀器儀表學報， 2018， 39（7）： 134-143．

Qu J L， Yu L， Yuan T， et al. Adaptive fault diagnosis algorithm for rolling bearings based on one-dimensional convolutional neural network［J］. Chinese Journal of Scientific Instrument， 2018， 39（7）： 134-143.

［13］Gan M， Wang C， Zhu C. Construction of hierarchical diagnosis network based on deep learning and its application in the fault pattern recognition of rolling element bearings［J］. Mechanical Systems & Signal Processing， 2016， 72-73： 92-104.

［14］Sun W， Shao S， Zhao R， et al. A sparse auto-encoder-based deep neural network approach for induction motor faults classification［J］. Measurement， 2016， 89： 171-178.

［15］張西寧，向宙，唐春華. 一種深度卷積自編碼網(wǎng)絡(luò)及其在滾動軸承故障診斷中的應用［J］. 西安交通大學學報， 2018， 52（7）： 1-8．

Zhang X N， Xiang Z， Tang C H. A deep convolutional auto-encoding neural network and its application in bearing fault diagnosis［J］. Journal of Xi'an Jiaotong University， 2018， 52（7）： 1-8.

［16］Laha S K. Enhancement of fault diagnosis of rolling element bearing using maximum kurtosis fast nonlocal means denoising［J］. Measurement， 2017， 100： 157-163．

［17］Shao H， Li W， Xia M， et al. Fault diagnosis of a rotor-bearing system under variable rotating speeds using two-stage parameter transfer and infrared thermal images［J］. IEEE Transactions on Instrumentation and Measurement， 2021， 70： 3524711.

［18］Sabour S， Frosst N， Hinton G E. Dynamic routing between capsules［C］//Proceedings of the 31st International Conference on Neural Information Processing Systems. Long Beach， CA， USA， 2017： 3859-3869.

［19］楊平，蘇燕辰，張振. 基于卷積膠囊網(wǎng)絡(luò)的滾動軸承故障診斷研究［J］. 振動與沖擊， 2020， 39（4）： 55-62.

Yang P， Su Y C， Zhang Z. A study on rolling bearing fault diagnosis based on convolutional capsule network［J］. Journal of Vibration and Shock， 2020， 39（4）： 55-62.

［20］Chen Y. Convolutional neural network for sentence classification［D］. Waterloo： University of Waterloo， 2015.

［21］Szegedy C， Ioffe S， Vanhoucke V， et al. Inception-v4， inception-ResNet and the impact of residual connections on learning［C］//Proceedings of the 31st AAAI Conference on Artificial Intelligence. Palo Alto， CA， USA， 2017： 4278-4284.

［22］Bahdanau D， Cho K H， Bengio Y. Neural machine translation by jointly learning to align and translate［C］//3rd International Conference on Learning Representations. San Diego， United States ， 2015： 1-15.

［23］Hu J， Shen L， Sun G， et al. Squeeze-and-excitation networks［J］. IEEE Transactions on Pattern Analysis and Machine Intelligence， 2020， 42（8）： 2011-2023.

［24］Szegedy C， Vanhoucke V， Ioffe S， et al. Rethinking the Inception architecture for computer vision［C］//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas， NV， USA， 2016： 2818-2826.

［25］王賀兵，張春梅. 基于非對稱卷積-壓縮激發(fā)-次代殘差網(wǎng)絡(luò)的人臉關(guān)鍵點檢測［J］. 計算機應用， 2021， 41（9）： 2741-2747.

Wang H B， Zhang C M. Facial detection based on ResNet with asymmetric convolution and squeeze excitation［J］. Journal of Computer Applications， 2021， 41（9）： 2741-2747.

［26］楊宏業(yè). 卷積神經(jīng)網(wǎng)絡(luò)的多光譜遙感圖像超分辨率重建［D］. 徐州：中國礦業(yè)大學， 2020.

Yang Hongye. Multispectral remote sensing images super-resolution based on convolutional neural network［D］. Xuzhou： China University of Mining and Technology， 2020.

［27］王婷.基于LSTM深度網(wǎng)絡(luò)的電力負荷預測［D］. 太原：山西大學， 2020.

Wang Ting. Power load forecasting based on LSTM deep network［D］. Taiyuan： Shanxi University， 2020.

［28］Zhao W， Ye J， Yang M， et al. Investigating capsule networks with dynamic routing for text classification［C］//2018 Conference on Empirical Methods in Natural Language Processing. Brussels， Belgium， 2018： 3110-3119.

［29］Abadi M， Agarwal A， Barham P，et al. Tensorflow： large-scale machine learning on heterogeneous distributed systems［J］. arXiv：1603.04467， 2016.

［30］袁壯，董瑞，張來斌，等. 深度領(lǐng)域自適應及其在跨工況故障診斷中的應用［J］. 振動與沖擊， 2020， 39（12）： 281-288.

Yuan Z， Dong R， Zhang L B， et al. Deep domain adaptation and its application in fault diagnosis across working conditions［J］. Journal of Vibration and Shock， 2020， 39（12）： 281-288.

［31］Shao S， McAleer S， Yan R， et al. Highly accurate machine fault diagnosis using deep transfer learning［J］. IEEE Transactions on Industrial Informatics， 2019， 15（4）： 2446-2455.

［32］趙小強，梁浩鵬. 使用改進殘差神經(jīng)網(wǎng)絡(luò)的滾動軸承變工況故障診斷方法［J］. 西安交通大學學報， 2020， 54（9）： 23-31.

Zhao X Q， Liang H P. Fault diagnosis method of rolling bearing under variable condition using improved residual neural network［J］. Journal of Xi'an Jiaotong University， 2020， 54（9）： 23-31.

［33］Zhao R， Wang D， Yan R， et al. Machine health monitoring using local feature-based gated recurrent unit networks［J］. IEEE Transactions on Industrial Electronics， 2018， 65（2）： 1539-1548.

Improved convolutional capsule network method for rolling bearing fault diagnosis

Abstract： At present， many rolling bearing fault diagnosis methods based on convolutional networks have the disadvantages of poor diagnosis effect and poor generalization ability under the influence of noise signals and load variations. Aiming at these problems， an improved convolutional capsule network fault diagnosis method of rolling bearing under variable operating conditions is proposed. This method designs a multi-scale asymmetric convolution module， in which asymmetric convolution layers of different scales to extract features from the input data to maximize the extraction of feature information in the data and reduce the number of parameters effectively. In this module， the channel attention mechanism is introduced to better extract useful channel features and improve the feature extraction ability of the method in this paper. By improving the fully connected layer in the network to the fully connected layer of the capsule， the capsule can avoid the loss of characteristic information in the space in the process of outputting vector feature information. Case Western Reserve University bearing dataset and Southeast University gearbox dataset are used to verify the diagnostic performance of the proposed method and compare with other deep learning methods. The experimental results show that the proposed method has a better generalization and performance.

Key words： fault diagnosis；rolling bearing；capsule network；asymmetric convolution；feature extraction

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

改進卷積膠囊網(wǎng)絡(luò)的滾動軸承故障診斷方法