張江泉 ,高宏力 ,向守兵 ,郭 亮 ,2,譚詠文
(1.西南交通大學機械工程學院,四川 成都 610031;2.國防科技大學裝備綜合保障技術重點實驗室,湖南 長沙410073)
滾珠絲杠副是數(shù)控機床等高端制造裝備的核心部件之一,主要負責將電機旋轉運動轉變?yōu)槠脚_上的線性運動,或是將線性運動轉化為旋轉運動,具有低摩擦損失和高傳動效率等特點.在滾珠絲杠副服役過程中,由于其長期工作于高頻率、高負荷的復雜工況之下,滾珠和滾道表面受到持續(xù)的沖擊,絲杠無可避免地發(fā)生性能退化直到失效[1-3].由于滾珠絲杠副的定位精度對數(shù)控機床等制造裝備的加工精度有著直接影響,對滾珠絲杠副進行退化狀態(tài)評估和監(jiān)測,對于提升數(shù)控機床等高端制造裝備運行可靠性、降低設備運維成本具有重要意義.
現(xiàn)有滾珠絲杠副退化狀態(tài)評估方法主要包括機器學習算法和深度學習算法[4]:1) 機器學習算法是一類比較傳統(tǒng)的智能化狀態(tài)識別方法,經典方法包括貝葉斯算法[5]、支持向量機[6]、K近鄰法等[7].該類方法不需要對設備的物理實體和動力學特性進行建模(建立傳感器信號和特征之間的隱射關系).但機器學習算法較為依賴信號處理和特征提取水平,自適應化和智能化水平較低,難以應對復雜情況下的狀態(tài)評估問題[8].2) 隨著信息化技術的發(fā)展,深度學習算法克服了傳統(tǒng)機器學習算法的不足,通過構造更復雜的網絡結構,增強網絡的特征學習和表征能力[9-10].現(xiàn)有深度學習算法主要包括深度置信網絡[11]、循環(huán)神經網絡[12]、堆棧自編碼網絡[13]、卷積神經網絡[14]等經典網絡結構,能夠有效地從大量數(shù)據(jù)中挖掘關鍵信息,在智能化狀態(tài)評估領域取得了廣泛的應用.
上述方法通常根據(jù)已有的充足且?guī)撕灥臄?shù)據(jù)集,利用智能化狀態(tài)評估技術和模型建立傳感器信號和滾珠絲杠副狀態(tài)之間的函數(shù)隱射關系.但在實際工程應用中,受制于故障所引發(fā)的嚴重后果、獲取標簽的成本過高、復雜多變的運行工況環(huán)境等實際因素,通常難以在特定工況下獲得大量帶標簽數(shù)據(jù)集,制約了現(xiàn)有智能化狀態(tài)評估方法在滾珠絲杠副中的應用.針對以上問題,學者們開展了一系列研究,取得了較為成功的應用成果:Li等[15]考慮復雜工況下采集的機械故障監(jiān)測數(shù)據(jù)特征具有不匹配性,提出了一種集成學習和多重深度遷移學習的故障診斷方法,提升模型對跨域不變特征的學習能力;Azamfar等[16]利用特征分布自適應模塊對復雜工況下的差異性特征進行適配,可有效地應對復雜工況下的滾珠絲杠副狀態(tài)評估任務;Zhu等[17]提出結合特征間的余弦相似性和Wasserstein距離,在滾珠絲杠副故障診斷中達到了較高的識別準確率,進一步推動了智能化狀態(tài)評估研究的發(fā)展.
深度域對抗學習(DAT)是一種是近年出現(xiàn)的深度遷移學習方法[18],通過利用帶標簽源域實現(xiàn)對無標簽條件下的目標域數(shù)據(jù)的特征學習和提取,完成域不變特征的知識遷移[19].在訓練過程中,DAT以動態(tài)對抗的方式減小域判別器所學到的源域和目標域之間的特征分布差異,使得判別器無法識別特征來源于源域還是目標域,確保模型將特征隱射到跨域共享特征子空間[20].基于DAT的智能化圖像識別和故障診斷方法近年來被廣泛應用,但滾珠絲杠副退化狀態(tài)評估智能化狀態(tài)評估方法相關的研究較少,亟須進一步探索.
本文針對滾珠絲杠副狀態(tài)評估應用中的復雜工況和標簽缺失等應用難點,通過分析滾珠絲杠副振動信號的特點,在現(xiàn)有智能化狀態(tài)評估方法進行研究和改進,提出一種基于多尺度域對抗學習的智能化狀態(tài)評估方法.該方法采用多尺度深度卷積神經網絡作為自適應特征提取器,進而對多尺度特征進行融合學習,最終利用域對抗學習模塊減少訓練數(shù)據(jù)和測試數(shù)據(jù)之間的特征分布差異.所提方法在復雜工況下的滾珠絲杠副退化狀態(tài)識別任務中取得了較好的識別效果,同時放寬了模型對標簽的要求.本文分別從深度域對抗學習原理、所提方法框架和試驗結果3個方面進行介紹.
深度域對抗學習[21]受啟發(fā)于生成對抗網絡(GAN)[22],將源域和目標域分別看作輸入的真實樣本和生成器生成的虛假樣本,從而進行對抗訓練學習.DAT通過域分類器預測樣本的域標簽,同時計算預測標簽和真實域標簽之間的二元分類損失.深度域對抗學習的流程如圖1所示.圖中:MACNN 1~5為多尺度注意力卷積神經網絡模塊;GAP為全局平均層;FO為特征輸出層.當訓練完成時,模型難以分辨特征是來自于訓練集還是測試集,此時可認為模型已經學習到了跨域不變的關鍵特征.
圖1 深度域對抗模型流程Fig.1 Flowchart of deep adversarial training model
DAT及其相關算法在圖像識別、人臉識別和故障診斷等領域取得了廣泛的應用[15].在實際應用中,DAT通常以深度模型作為特征提取器,從而自適應地提取關鍵特征.使用過程中存在的問題主要包括:DAT中深度學習模型著重于提取某一尺度的特征,缺乏刻畫多尺度下的目標特征的能力; DAT通常將源域和目標域中學習到的特征進行對抗訓練,當特征量較大時,模型缺乏對關鍵特征的關注,導致模型泛化能力降低.
針對以上問題,本文提出了基于多尺度域對抗學習框架,以具有多尺度特征學習能力的深度卷積神經網絡為基礎,結合跨域混合訓練方法增強模型在復雜工況下的特征學習能力和跨域泛化能力.
本文所提的多尺度域對抗學習框架主要包括多尺度注意力卷積神經網絡模塊(MACNN)和域對抗模塊.其中,MACNN借鑒多尺度學習[23]的思想,利用不同尺度的卷積核對輸入特征進行學習,提升網絡的自適應能力.應對多卷積帶來的參數(shù)數(shù)量增長和特征冗余問題,MACNN引入神經網絡注意力機制,對特征重要性進行建模和加權,提升模型在多尺度條件下特征提取的有效性.為了進一步提升網絡對復雜工況下的故障識別能力,所提多尺度域對抗學習框架采用域對抗模塊,通過對所學的多尺度特征進行對抗訓練,動態(tài)地減少源域和目標域數(shù)據(jù)之間的分布差異,從而提高模型的泛化能力,提升模型對滾珠絲杠副退化狀態(tài)的識別準確率.
MACNN模塊的核心思想是利用多個不同尺度的卷積核去學習原始信號中的短期和長期特征,從而提升模型對復雜多尺度特征的刻畫能力.MACNN采用多組并行的卷積神經網絡分支,通過調整不同分支所用的卷積核大小,利用多個卷積層學習不同時間尺度的特征,并將多組特征拼接起來作為最終的特征輸出.滾珠絲杠副振動信號具有變化快和周期性強等特點(包括沖擊峰值等短時沖擊特征以及振蕩周期等長時周期特征),利用多尺度特征提取網絡能夠有效增強網絡對不同尺度下的特征建模能力.
圖2展示了單個MACNN模塊的基本結構.圖中:SECNN為帶有網絡注意力機制的卷積神經網絡模塊.由圖可知,輸入特征x被送往多組并行卷積網絡之中進行特征提取,每個網絡分支分別包含不同大小的卷積核、歸一化層(BN層)、激活層(ReLU)以及防止過擬合的Dropout層.考慮到多組網絡參數(shù)帶來的參數(shù)增長,模型更容易出現(xiàn)特征冗余,從而降低了特征學習的有效性.因此,在對多組特征進行拼接之后,在網絡中引入注意力機制,對多尺度特征進行顯式評分和重構,抑制無關特征帶來的干擾信息.
圖2 MACNN模塊示意Fig.2 Structure of the MACNN module
在神經網絡中引入注意力能夠對網絡學習特征的重要性進行評估,并以此度量模型所學特征的重要性.以卷積神經網絡為例,每一層神經網絡的卷積核只能學習到局部感受野上的信息,而所有卷積核局部特征的疊加構成了數(shù)據(jù)信號的全局描述.對于不同的卷積核通道,其關注的區(qū)域也不相同,因此特征的重要性也不盡相同.帶注意力機制卷積神經網絡的實現(xiàn)流程如圖3所示.圖中:H、W和C分別為特征的高度、寬度和通道維數(shù).
圖3 帶注意力機制的CNN網絡Fig.3 CNN networks with attention mechanisms
Hu等[24]提出了一種基于壓縮和重構卷積核通道間重要性的深度學習注意力模塊(SENet),通過顯式地計算特征通道之間的關系,提升對當前任務有效特征并抑制無效特征.SENet主要包括特征壓縮模塊和特征重構模塊.SENet可采用全局均值化層(GAP)來實現(xiàn)特征壓縮過程,從而將特征圖中的關鍵信息以低維方式儲存.隨后,可利用疊加的全連接層學習不同特征之間的非線性關系,為重要的特征賦予更高的權重.SENet的具體流程如圖4所示.
圖4 SENet的具體實現(xiàn)流程Fig.4 Implementation details of the SENet network
尺度為H×L×C的特征圖譜,其特征壓縮過程的數(shù)學描述為
式中:uc為輸入特征U在第c個通道的特征分量;Zc為壓縮完成后的特征.
SENet的特征重構過程可通過多個全連接層進行實現(xiàn),其數(shù)學表達式為
式 中 : δReLU和 σSigmoid分 別 為 所 選 用 的 ReLU和Sigmoid函數(shù);W1和W2分別為兩個全連接層;s為輸出特征.
選定中間過程的特征降維率為r,W1接受的特征輸入尺寸可寫作 ( 1×1×C) ,其輸出特征尺寸為而W2的輸入和輸出尺寸和W1相反,分別為
基于2.1節(jié)中所提的MACNN模塊,本節(jié)提出一種基于多尺度域對抗學習的深度學習框架,如圖5所示.
圖5 多尺度域對抗學習框架Fig.5 Structure of multi-scale adversarial domain adversarial learning
在所提多尺度域對抗框架中,MACNN模塊卷積神經網絡模塊的具體參數(shù)設置如表1所示.其中,每個卷積網絡模塊包括3個不同大小的卷積核,對特征進行分別卷積運算并最終將所學的多尺度特征進行拼接,作為下一個卷積網絡模塊的輸入.在經過多層MACNN層運算之后,輸出特征被送入GAP層進行特征降維,以減少模型所需的參數(shù)量.最終,特征通過全連接層(FC)將特征輸出為所需維度,并用于預測數(shù)據(jù)標簽以及計算模型的損失函數(shù).
表1 MACNN模塊基礎參數(shù)Tab.1 Basic parameters of the MACNN modules
所提多尺度域對抗學習網絡模型需要首先實現(xiàn)對源域數(shù)據(jù)的精準識別,其次需能夠高效地減少源域數(shù)據(jù)和目標域數(shù)據(jù)之間的特征分布差異.因此,所提模型的損失函數(shù)主要包含模型在源域中的標簽預測損失以及源域和目標域之間的域分類損失.源域中的標簽預測損失可寫作交叉熵形式,如式(3).
式中:xi和xk為 計算交叉熵損失所用的特征;yi為 特征xi所對用的樣本標簽;I為0-1變量,yi=c取 1,yi≠c取 0.
此外,網絡還需通過域對抗模塊實現(xiàn)數(shù)據(jù)之間的特征差異最小化,從而保證在源域學到的知識能有效地應用于目標域的任務.域對抗模塊的優(yōu)化損失為
式中:Gd為 域判別器,負責對網絡學習到的特征歸屬進行判斷,其參數(shù)為 θd;Xi為模型最終輸出特征;Ds和Dt分別為帶標簽源域和無標簽目標域;yc為標簽為c的樣本.
綜合式(3)和式(4),最終的模型損失函數(shù)為
式中: λ 為權衡各部分損失函數(shù)的超參數(shù),隨著網絡更新而逐漸降低, λ =0.6/(1.0+0.15i)0.5; θf為特征提取模型的參數(shù)空間;Cy為 模型的真實標簽集.
網絡更新學習率l=0.01/(1.0+0.15i)0.5.基于式(5),應用反向傳播算法和Adam算法來更新整個網絡的梯度和權重.
利用滾珠絲杠副加速退化試驗臺開展?jié)L珠絲杠副加速性能退化試驗.試驗臺機械部分如圖6所示,主要由伺服電機、滾珠絲杠副、支撐軸承、工作平臺、磁粉制動裝置和傳動裝置等部分組成.試驗臺工作時:電機負責為系統(tǒng)提供驅動力,從而帶動滾珠絲杠副進行旋轉運動;絲杠螺母帶動與其連接的工作平臺做直線往復運動.
圖6 滾珠絲杠副加速退化試驗臺Fig.6 Accelerated degradation test bench for ball screw
在運行過程中,可通過電機和磁粉制動裝置調節(jié)系統(tǒng)轉速和輸出扭矩,從而開展多工況條件下的滾珠絲杠副性能退化試驗.試驗選用的滾珠絲杠副型號為FFZD4010-3,其安裝方式為固定-支撐式.所用滾珠絲杠副的具體參數(shù)如表2.
表2 所選FFZD4010-3型滾珠絲杠副基礎參數(shù)Tab.2 Basic parameters of selected FFZD4010-3 ball screw
考慮到滾珠絲杠副的性能退化主要受到軸向載荷和轉速等運行工況的影響,因此,設計多工況下的滾珠絲杠副性能退化試驗獲取滾珠絲杠副全壽命性能退化數(shù)據(jù).具體工況設置如表3所示.試驗選擇間隔采樣的數(shù)據(jù)采集方式,每隔40 min進行一次數(shù)據(jù)采樣,對滾軸絲杠副運行的往返行程進行采樣,每次采樣時長為60 s,試驗所用采樣頻率為5 kHz.
表3 試驗工況詳細參數(shù)Tab.3 Detailed parameters of test working conditions
滾珠絲杠副的性能退化過程通常包括磨合期、穩(wěn)定器、快速退化期和退化失效期.基于此性能退化過程,通過對絲杠表面形貌變化以及振動信號進行分析,可將滾珠絲杠副的運行狀態(tài)大致分化為啟動階段、平穩(wěn)階段、退化階段和快速退化階段.在以上階段中,滾珠絲杠副失效的概率逐漸增加,直至出現(xiàn)嚴重故障.圖7為滾珠絲杠副快速退化階段的振動信號圖.該信號采集于安裝在螺母座上的加速度傳感器,并分別包括3個方向上的信號源.
圖7 滾珠絲杠副運行末期信號Fig.7 Signals at the end of the ball screw operation
根據(jù)對滾珠絲杠副退化過程數(shù)據(jù)的分析,將滾珠絲杠副退化數(shù)據(jù)分為4組:前42組數(shù)據(jù)作為啟動階段;43~120組數(shù)據(jù)作為平穩(wěn)階段;121~183組數(shù)據(jù)作為退化階段;184組之后的數(shù)據(jù)作為快速退化階段.以上4組數(shù)據(jù)的標簽分別為0、1、2、3.將振動傳感器所采集3個方向的振動信號進行整合,構建試驗原始數(shù)據(jù)集,并將其分割為長度為1 200的一維信號,用于模型的訓練與測試.
根據(jù)帶標簽工況數(shù)據(jù)和無標簽工況數(shù)據(jù)的不同,共構建6組遷移狀態(tài)識別任務,訓練任務的詳細設置參考表4.試驗任務考慮多種工況情況,以任務A為例:工況1代表帶標簽源域,工況2代表無標簽數(shù)據(jù)集.對于狀態(tài)識別任務,所有源域數(shù)據(jù)和70%目標域數(shù)據(jù)用于模型的訓練,剩余目標域數(shù)據(jù)用于測試模型的識別性能.在所有測試任務中,超參數(shù)的取值策略都與所提方法相同.
表4 滾珠絲杠副退化狀態(tài)識別試驗Tab.4 Ball screw degradation state identification test
為了減少隨機因素對模型識別結果的影響,將各組狀態(tài)評估子任務重復進行10次,其最終的平均識別結果如表5.所有任務的超參數(shù)、學習率、網絡結構等都保持一致,網絡初始參數(shù)通過隨機初始化得到.從表中可知,所提方法在所有任務中都取得了較好的識別準確度.圖8進一步詳細展示了所提方法在不同任務重復實驗中所取得的識別準確率以及其對應的方差,可知所提方法在所有子任務多次重復試驗中的方差較小,具有較穩(wěn)定的識別效果.綜合以上結果可知:所提方法能夠充分應對復雜工況下的滾珠絲杠副退化狀態(tài)識別問題,具有較好的應用效果和實際應用前景.
表5 退化狀態(tài)識別試驗結果Tab.5 Results of degradation state identification tests %
圖8 滾珠絲杠副退化狀態(tài)識別子任務結果Fig.8 Results of ball screw degradation state recognition tasks
為了探究所提方法對輸入樣本數(shù)量的敏感程度,選擇任務C作為研究對象,對比和分析所提方法在不同樣本數(shù)量下的退化狀態(tài)識別能力.在任務C的基礎之上,構建包含不同數(shù)量帶標簽工況樣本的訓練樣本數(shù)據(jù)集,分別包含 100、200、500、1 000、2 000個和3 000個訓練數(shù)據(jù).
圖9匯總了所構建任務的退化狀態(tài)識別結果.由圖9可知:對500個樣本及以上的退化識別任務能夠取得高于90%的平均退化識別準確率;對于少于500個訓練樣本的退化識別任務,也能夠取得接近85%的平均識別率.因此,所提方法的性能在樣本量較少的情況下也能取得較好的識別效果,并且識別效果隨著樣本數(shù)量的增多而增強.
圖9 不同樣本數(shù)量下的退化狀態(tài)識別結果Fig.9 Results of ball screw degradation state recognition tasks with various samples quantities
為了驗證所提方法的優(yōu)勢,將本文所提方法與現(xiàn)有先進算法進行對比與分析.先進算法包括以卷積神經網絡為代表的深度模型方法(CNN)、聯(lián)合概率分布自適應方法(JDAN)[25]和與深度域對抗方法(DANN).將對比方法和本文所提方法應用于滾珠絲杠副退化評估試驗任務E,其識別結果如表6所示.由實驗結果可知:本文所提方法取得了最優(yōu)的識別精度,達到了91.84%;CNN方法的識別精度最低,僅為73.57%.在復雜工況條件下,傳統(tǒng)深度學習模型無法有效地提取關鍵特征,從而導致識別性能下降,而本文所提方法結合多尺度特征提取和深度學習注意力機制,進一步提升了模型對于復雜工況下的特征的泛化能力,能夠取得更加理想的退化狀態(tài)識別效果.
表6 所提方法與對比方法的結果比較Tab.6 Comparison between the proposed method and the state-of-the-art methods
為了進一步展示所提方法的有效性,采用t-分布隨機鄰域(t-SNE)對傳統(tǒng)CNN方法和所提方法進行可視化分析.t-SNE技術可將高維特征映射到低維空間,并以散點圖的形式直觀地展示特征的聚類分布特性.選用最后一層全連接層的輸出特征作為可視化對象,其結果如圖10.在圖10中:S0和T0分別代表源域和目標域數(shù)據(jù)集中標簽為0的高維特征,以此類推.由可視化結果可知:CNN方法所學不同工況特征的聚合效果較差,網絡未能在復雜工況條件下有效地提取關鍵特征;所提方法學習到的特征被清楚地分為4組,且同一退化狀態(tài)的特征之間的匹配程度較高,不同退化狀態(tài)的特征則相互分離,此時模型能夠識別出不同類特征之間的差異性,從而實現(xiàn)高準確率的退化狀態(tài)評估.
圖10 t-SNE特征可視化結果Fig.10 Feature visualization results via t-SNE
1) 提出了基于多尺度注意力卷積神經網絡模塊,利用不同尺度的卷積核對輸入特征進行學習,同時引入神經網絡注意力機制,對特征重要性進行建模和加權,應對多卷積帶來的參數(shù)量增長和特征冗余問題,提升模型在多尺度條件下的特征提取的有效性.
2) 提出了多尺度域對抗學習框架,并將其應用于其應用在復雜工況下的滾珠絲杠副退化狀態(tài)識別任務之中.利用域對抗模塊對跨域特征之間的差異性進行建模,確保模型能夠有效地學習具有相似特征分布的子空間,從而應對滾珠絲杠副狀態(tài)評估應用中的復雜工況和標簽缺失的應用難點.
3) 本文方法可以針對不同工況下的滾珠絲杠副退化信號進行高效的特征提取和狀態(tài)識別,并且對訓練樣本數(shù)量不敏感,能夠在較少樣本條件下自