李天梅 司小勝 劉 翔 裴 洪
高速列車、航空航天裝備、導(dǎo)彈武器、風(fēng)電裝備、工業(yè)機(jī)器人、石化裝備等現(xiàn)代裝備在功能不斷提升的同時,正逐漸趨于大型化、多元化和集成化,這類裝備多是由機(jī)械傳動系統(tǒng)、電磁驅(qū)動系統(tǒng)、運(yùn)動控制系統(tǒng)、信息傳感系統(tǒng)等耦合組成的復(fù)雜系統(tǒng),其服役過程受變環(huán)境、變載荷、變工況、大擾動和強(qiáng)沖擊等因素影響,整體及關(guān)鍵部件性能將發(fā)生不可避免的退化,一旦因設(shè)備性能退化造成最終失效,將會造成巨大的人員傷亡和財產(chǎn)損失.例如,2014 年8 月2 日發(fā)生在我國江蘇省昆山市的重大鋁粉塵爆炸事故,共造成97 人死亡、163 人受傷,直接經(jīng)濟(jì)損失達(dá)到3.51 億元,事后調(diào)查表明: 除塵器維護(hù)不足而造成集塵桶銹蝕退化破損是主要技術(shù)原因.2017 年7 月發(fā)生在美國密西西比州的美國海軍陸戰(zhàn)隊KC-130 運(yùn)輸機(jī)墜毀事件,造成機(jī)上16 名軍人全部遇難,該事故的調(diào)查結(jié)果表明發(fā)動機(jī)螺旋槳性能退化是造成飛機(jī)墜毀的主要原因.因此,若能在設(shè)備性能退化初期,尤其在尚未造成重大危害時,根據(jù)狀態(tài)監(jiān)測信息,及時發(fā)現(xiàn)異?;蚨吭u價設(shè)備健康狀態(tài)并預(yù)測其剩余壽命(Remaining useful life,RUL),據(jù)此對設(shè)備實施健康管理,對于切實保障復(fù)雜設(shè)備的運(yùn)行安全性、可靠性與經(jīng)濟(jì)性具有重要意義.其中,剩余壽命預(yù)測是連接系統(tǒng)運(yùn)行狀態(tài)信息感知與基于運(yùn)行狀態(tài)實現(xiàn)個性化精準(zhǔn)健康管理的紐帶和關(guān)鍵,在過去十余年得到了長足的發(fā)展,主要技術(shù)方法包括失效機(jī)理分析方法、數(shù)據(jù)驅(qū)動的方法、機(jī)理模型和數(shù)據(jù)混合驅(qū)動方法[1-8],如圖1 所示.基于失效機(jī)理分析的方法主要通過構(gòu)建描述設(shè)備失效機(jī)理的數(shù)學(xué)模型,結(jié)合特定設(shè)備的經(jīng)驗知識和缺陷增長方程實現(xiàn)設(shè)備的剩余壽命預(yù)測.由于實際工程設(shè)備本身的復(fù)雜性、任務(wù)與運(yùn)行環(huán)境的多樣性,其健康狀態(tài)演化規(guī)律通常難以物理機(jī)理建?;蛘攉@得失效機(jī)理模型的代價過高,導(dǎo)致失效機(jī)理方法及機(jī)理模型和數(shù)據(jù)混合驅(qū)動方法存在推廣應(yīng)用難的問題.因此,數(shù)據(jù)驅(qū)動的剩余壽命預(yù)測技術(shù)已成為國際上可靠性工程和自動化技術(shù)領(lǐng)域的研究前沿,過去十余年中得到了長足發(fā)展,在航空航天、軍事、工業(yè)制造等領(lǐng)域具有極其重要的應(yīng)用.
圖1 剩余壽命預(yù)測方法體系Fig.1 The methodology of remaining useful life prediction
伴隨著先進(jìn)傳感技術(shù)的快速發(fā)展,工程設(shè)備健康狀態(tài)感知手段日益豐富,為設(shè)備運(yùn)行監(jiān)測大數(shù)據(jù)的獲取提供了更多的可能.因此,數(shù)據(jù)驅(qū)動的剩余壽命預(yù)測技術(shù)發(fā)展迎來了新的契機(jī),針對大數(shù)據(jù)處理的隨機(jī)退化設(shè)備剩余壽命預(yù)測問題得到了大量學(xué)者的關(guān)注,相關(guān)技術(shù)蓬勃發(fā)展.在此背景下,本文的主要目的在于面向大數(shù)據(jù)背景下隨機(jī)退化設(shè)備剩余壽命預(yù)測的現(xiàn)實需求,通過分析當(dāng)前剩余壽命預(yù)測技術(shù)的發(fā)展動態(tài),旨在探究該領(lǐng)域亟待解決的關(guān)鍵問題和新的發(fā)展方向.為此,第1 節(jié)首先結(jié)合數(shù)據(jù)特點對大數(shù)據(jù)下剩余壽命預(yù)測的研究背景、主要方法及思路、核心問題等進(jìn)行了概述.第2~ 5 節(jié)分別分析了機(jī)理模型與數(shù)據(jù)混合驅(qū)動的剩余壽命預(yù)測技術(shù)、基于機(jī)器學(xué)習(xí)的剩余壽命預(yù)測技術(shù)、統(tǒng)計數(shù)據(jù)驅(qū)動的剩余壽命預(yù)測技術(shù)以及機(jī)器學(xué)習(xí)和統(tǒng)計數(shù)據(jù)驅(qū)動相結(jié)合的剩余壽命預(yù)測技術(shù)的基本研究思想和發(fā)展動態(tài),同時結(jié)合隨機(jī)退化設(shè)備監(jiān)測大數(shù)據(jù)特點以及剩余壽命預(yù)測不確定性量化這一核心問題,深入剖析了當(dāng)前研究存在的局限性和共性難題.第6節(jié)針對當(dāng)前研究存在的局限性,提出了一種多源傳感監(jiān)測大數(shù)據(jù)下數(shù)模聯(lián)動的隨機(jī)退化設(shè)備剩余壽命預(yù)測問題解決思路(簡稱為數(shù)模聯(lián)動,這里需要說明的是,“數(shù)”是指數(shù)據(jù)退化特征提取,“模”是指所提取退化特征時變演化過程隨機(jī)建模),通過構(gòu)建優(yōu)化目標(biāo)函數(shù)實現(xiàn)數(shù)據(jù)特征提取與所提取特征時變演化過程隨機(jī)建模的 “聯(lián)動”,并通過航空發(fā)動機(jī)多源監(jiān)測數(shù)據(jù)初步驗證了該思路的可行性和有效性.第7 節(jié)借鑒數(shù)模聯(lián)動思路,圍繞大數(shù)據(jù)背景下隨機(jī)退化設(shè)備剩余壽命預(yù)測不確定性量化這一核心問題,探討并提出了大數(shù)據(jù)背景下深度學(xué)習(xí)與隨機(jī)退化建模交互聯(lián)動、監(jiān)測大數(shù)據(jù)與剩余壽命及其預(yù)測不確定性映射機(jī)制、非理想大數(shù)據(jù)下的剩余壽命預(yù)測等亟待解決的關(guān)鍵科學(xué)問題.第8 節(jié)總結(jié)全文.
近年來,隨著無線傳感、物聯(lián)網(wǎng)等技術(shù)快速興起與普及,各式傳感器猶如一張龐大的神經(jīng)網(wǎng)絡(luò)密布在裝備內(nèi)部,實時感知裝備的一舉一動,推動剩余壽命預(yù)測進(jìn)入 “大數(shù)據(jù)” 時代.例如,軍事裝備在國家戰(zhàn)略安全中具有不可替代的特殊地位,其各子系統(tǒng)的安全可靠運(yùn)行舉足輕重,必須依靠狀態(tài)監(jiān)測、剩余壽命預(yù)測以及預(yù)測維護(hù)等理論與方法保駕護(hù)航.由于需要監(jiān)測的軍事裝備群規(guī)模大、每個裝備需監(jiān)測參量多、數(shù)據(jù)采樣頻率高、服役時間長,所以獲取了海量監(jiān)測數(shù)據(jù): 一個現(xiàn)代航空發(fā)動機(jī),每10毫秒就能生成幾百個傳感器信息,每次飛行能產(chǎn)生TB 級的運(yùn)行監(jiān)測數(shù)據(jù);現(xiàn)代化工業(yè)制造生產(chǎn)線安裝有數(shù)以萬計的各型傳感器來監(jiān)測工業(yè)裝備的運(yùn)行過程信息及產(chǎn)品質(zhì)量信息,比如大型工業(yè)機(jī)器人制造商利用云平臺監(jiān)控著百萬臺工業(yè)機(jī)器人,實時獲取機(jī)器人每個運(yùn)動關(guān)節(jié)的轉(zhuǎn)速、角度、位置、溫度、振動等信號,每天需要對TB 級以上的數(shù)據(jù)進(jìn)行處理.然而,這些監(jiān)測大數(shù)據(jù)在為設(shè)備健康狀態(tài)感知及剩余壽命預(yù)測提供豐富信息的同時,由于設(shè)備工況多變、多源信號差異大、采樣策略形式多、信息之間相互耦合、數(shù)據(jù)價值密度低,導(dǎo)致數(shù)據(jù)質(zhì)量參差不齊,狀態(tài)監(jiān)測大數(shù)據(jù)呈現(xiàn)不同的統(tǒng)計特性.根據(jù)監(jiān)測數(shù)據(jù)呈現(xiàn)的特點,圖2 給出了完整監(jiān)測大數(shù)據(jù)和非完整監(jiān)測大數(shù)據(jù)(具有碎片化、分段的、稀疏性等特征)的示例.
圖2 完整的、碎片化的、稀疏的監(jiān)測大數(shù)據(jù)示例Fig.2 Examples of complete,fragment and sparse big data
這里完整監(jiān)測大數(shù)據(jù)主要針對運(yùn)行模式比較固定的隨機(jī)退化設(shè)備(如軸承、齒輪等),能夠?qū)崿F(xiàn)不間斷連續(xù)監(jiān)測,監(jiān)測大數(shù)據(jù)涵蓋了設(shè)備從開始運(yùn)行到失效比較完整的狀態(tài)數(shù)據(jù),而非完整監(jiān)測大數(shù)據(jù)主要針對受經(jīng)濟(jì)條件及現(xiàn)實監(jiān)測條件限制的隨機(jī)退化設(shè)備(如航空發(fā)動機(jī)、渦輪泵、配電電池等),對這類設(shè)備進(jìn)行連續(xù)監(jiān)測采樣是不現(xiàn)實的,只能間歇性地對其監(jiān)測,得到的狀態(tài)監(jiān)測大數(shù)據(jù)表現(xiàn)出一定的“碎片化、分段、稀疏”等特點.因此,當(dāng)剩余壽命預(yù)測進(jìn)入大數(shù)據(jù)時代,如何根據(jù)監(jiān)測大數(shù)據(jù)呈現(xiàn)出的不同特點,充分分析利用豐富的監(jiān)測大數(shù)據(jù)資源,從浩如煙海的數(shù)據(jù)中進(jìn)行 “沙里淘金”,深度挖掘出反映設(shè)備健康狀態(tài)的信息并據(jù)此進(jìn)行剩余壽命預(yù)測,是隨機(jī)退化設(shè)備剩余壽命預(yù)測領(lǐng)域亟需解決的關(guān)鍵問題.
數(shù)據(jù)驅(qū)動的剩余壽命預(yù)測方法基于設(shè)備運(yùn)行監(jiān)測數(shù)據(jù),通過擬合設(shè)備性能變量演化規(guī)律并外推到失效閾值,或建立監(jiān)測數(shù)據(jù)與失效時間的映射關(guān)系,以實現(xiàn)剩余壽命預(yù)測,為大數(shù)據(jù)背景下隨機(jī)退化設(shè)備剩余壽命預(yù)測提供了可行的技術(shù)思路.然而,剩余壽命指當(dāng)前時刻到系統(tǒng)失效時刻的有效時間間隔,因此剩余壽命預(yù)測實際上是根據(jù)當(dāng)前得到的監(jiān)測信息,對系統(tǒng)將來失效事件的預(yù)測,其預(yù)測結(jié)果不可避免的具有不確定性.van Asselt 等[9]從哲學(xué)和認(rèn)識論的角度討論了預(yù)測的不確定性處理問題,指出預(yù)測結(jié)果具有不確定性是學(xué)術(shù)界的共識,也是當(dāng)今時代的特征.聯(lián)合攻擊機(jī)F-35 項目組研究人員Hess 等[10]和Smith 等11]、壽命預(yù)測領(lǐng)域代表性學(xué)者馬里蘭大學(xué)先進(jìn)生命周期工程中心Pecht 教授等[1,12]、可靠性領(lǐng)域知名期刊Quality and Reliability Engineering International主編Brombacher 教授[13]通過各種事例強(qiáng)調(diào)了預(yù)測不確定性的量化是剩余壽命預(yù)測從理論到應(yīng)用轉(zhuǎn)化的核心.美國國家航空航天局(National Aeronautics and Space Administration,NASA)預(yù)測與健康管理中心研究規(guī)劃中也將剩余壽命預(yù)測不確定性的管理列為了中心發(fā)展路線圖的重要研究內(nèi)容(https://ti.arc.nasa.gov/tech/dash/groupspcoe/roadmap).由此可見,預(yù)測不確定性的量化是數(shù)據(jù)驅(qū)動隨機(jī)退化設(shè)備剩余壽命預(yù)測領(lǐng)域的一個核心問題,也是解決 “敢用、能用” 剩余壽命預(yù)測理論技術(shù)實現(xiàn)實際工程設(shè)備個性化精準(zhǔn)健康管理、保障設(shè)備長周期安全可靠運(yùn)行的關(guān)鍵所在.
隨著信息技術(shù)和傳感器技術(shù)的迅猛發(fā)展,數(shù)據(jù)驅(qū)動的剩余壽命預(yù)測技術(shù)由于適用范圍廣、容易實現(xiàn)、無需深入專業(yè)機(jī)理知識等優(yōu)點,作為其中典型代表的機(jī)器學(xué)習(xí)方法和統(tǒng)計數(shù)據(jù)驅(qū)動方法已獲得了大量研究和蓬勃發(fā)展,得到了學(xué)術(shù)界和工業(yè)界的廣泛關(guān)注,相關(guān)技術(shù)已經(jīng)在導(dǎo)彈武器、航空航天、風(fēng)力發(fā)電、工業(yè)制造等領(lǐng)域產(chǎn)生了重要應(yīng)用[14-16].盡管以機(jī)器學(xué)習(xí)方法和統(tǒng)計數(shù)據(jù)驅(qū)動方法為典型代表的數(shù)據(jù)驅(qū)動隨機(jī)退化設(shè)備剩余壽命預(yù)測已獲得了大量研究和蓬勃發(fā)展,但已有理論與方法在大數(shù)據(jù)背景下隨機(jī)退化設(shè)備剩余壽命預(yù)測及其預(yù)測不確定性量化這一核心問題上,仍然沒有系統(tǒng)有效的解決方法,主要體現(xiàn)在統(tǒng)計數(shù)據(jù)驅(qū)動方法處理大數(shù)據(jù)能力不足,而機(jī)器學(xué)習(xí)方法量化預(yù)測不確定性能力不足.因此,通過對大數(shù)據(jù)背景下剩余壽命預(yù)測研究發(fā)展脈絡(luò)的探究,深入剖析當(dāng)前研究存在的瓶頸問題,對于促進(jìn)隨機(jī)退化設(shè)備剩余壽命預(yù)測技術(shù)的發(fā)展具有重要意義.在第2~ 5 節(jié),將針對當(dāng)前大數(shù)據(jù)背景下剩余壽命預(yù)測典型解決思路的研究動態(tài)和存在的問題進(jìn)行具體的分析.
基于機(jī)理模型的方法主要是依據(jù)失效機(jī)理構(gòu)建描述設(shè)備退化過程的參數(shù)化數(shù)學(xué)模型,結(jié)合設(shè)備的設(shè)計試驗數(shù)據(jù)或經(jīng)驗知識辨識數(shù)學(xué)模型參數(shù),進(jìn)而基于狀態(tài)監(jiān)測數(shù)據(jù)更新機(jī)理模型參數(shù)實現(xiàn)設(shè)備的剩余壽命預(yù)測.典型的參數(shù)識別與更新方法包括: 卡爾曼濾波[17-19]、粒子濾波[20-21]和貝葉斯方法[22-23]等.常見的用于剩余壽命預(yù)測的機(jī)理模型包括: Paris模型、Forman 模型以及在其基礎(chǔ)上的各種改進(jìn)和擴(kuò)展模型,主要用以描述裂紋擴(kuò)展和層裂增長[24-25].例如,Li 等[26-27]基于Paris 模型,建立了缺陷增長率與缺陷面積及材料常數(shù)的映射關(guān)系,以預(yù)測滾動軸承的剩余壽命;Li 等[28]提出了Paris 裂紋擴(kuò)展模型,根據(jù)裂紋尺寸和動態(tài)載荷預(yù)測齒輪的剩余使用壽命;Liang 等[29]研究了基于Paris 模型的滾珠軸承剩余使用壽命自適應(yīng)預(yù)測方法,即使在缺乏先驗信息且缺陷增長為時變的情況下,也能獲得可靠的預(yù)測結(jié)果.Oppenheimer 等[30]利用線彈性斷裂力學(xué),對轉(zhuǎn)軸建立了基于Forman 裂紋擴(kuò)展的壽命模型;針對層裂增長故障,Marble 等[31]開發(fā)了一種渦輪發(fā)動機(jī)軸承的層裂增長預(yù)測模型,能夠根據(jù)工況估計層裂增長軌跡和故障時間,并利用診斷反饋進(jìn)行自調(diào)整,降低了預(yù)測不確定性;Choi 等[32]考慮了由于裂紋形成和磨粒磨損引起的層裂增長現(xiàn)象,提出了滾動接觸的層裂增長壽命模型.在充分理解失效機(jī)理并得到準(zhǔn)確的模型估計參數(shù)后,基于機(jī)理模型的方法能夠?qū)崿F(xiàn)對剩余使用壽命的精確預(yù)測.然而,以上現(xiàn)有基于機(jī)理模型的剩余壽命預(yù)測方法未能結(jié)合實際運(yùn)行設(shè)備的實時監(jiān)測數(shù)據(jù),難以準(zhǔn)確反映設(shè)備當(dāng)前運(yùn)行的實際狀態(tài),特別是在設(shè)備運(yùn)行環(huán)境、運(yùn)行工況發(fā)生變化時,若不能利用實時監(jiān)測數(shù)據(jù)對模型進(jìn)行更新,將產(chǎn)生較大的預(yù)測偏差.
為了使得機(jī)理模型能夠更好地建模實際服役個體設(shè)備的性能演變過程,將設(shè)備實時運(yùn)行監(jiān)測數(shù)據(jù)與機(jī)理模型進(jìn)行混合,將有助于實現(xiàn)剩余壽命預(yù)測準(zhǔn)確性的提升.因此,機(jī)理模型與數(shù)據(jù)混合驅(qū)動的剩余壽命預(yù)測方法也得到了較多的關(guān)注和發(fā)展[4].最近該方面的研究包括Liao 等[33]、Wang 等[34]的論文,這些研究分別針對鋰電池系統(tǒng)和旋轉(zhuǎn)機(jī)械設(shè)備,提出了機(jī)理模型與數(shù)據(jù)混合驅(qū)動的剩余壽命預(yù)測方法.根據(jù)機(jī)理模型與數(shù)據(jù)混合驅(qū)動實現(xiàn)方式不同,可將這類混合驅(qū)動的剩余壽命預(yù)測方法分為兩大類: 1)基于監(jiān)測數(shù)據(jù)構(gòu)建機(jī)理模型所刻畫退化狀態(tài)的測量模型,運(yùn)用卡爾曼濾波、粒子濾波等方法估計退化狀態(tài)和機(jī)理模型參數(shù),然后通過機(jī)理模型預(yù)測設(shè)備的剩余壽命[12,35];2)首先分別基于數(shù)據(jù)和機(jī)理模型進(jìn)行設(shè)備的剩余壽命預(yù)測,然后利用決策層融合方法實現(xiàn)集成基于數(shù)據(jù)和基于機(jī)理模型的剩余壽命預(yù)測[36-37].以上兩類機(jī)理模型與數(shù)據(jù)混合驅(qū)動實現(xiàn)剩余壽命預(yù)測的方式各具優(yōu)勢: 第1 種方式能夠充分考慮退化狀態(tài)難以直接測量的實際,在考慮監(jiān)測數(shù)據(jù)中測量噪聲的情況下,可實現(xiàn)隱含退化狀態(tài)的估計和機(jī)理模型參數(shù)的更新,使得最終的預(yù)測結(jié)果能夠更準(zhǔn)確地反映設(shè)備當(dāng)前的實際狀態(tài);第2種方式實現(xiàn)過程相對簡單獨立,決策層融合的形式較為多樣,如平均法、權(quán)重平均、核回歸、證據(jù)組合等,能夠集成多種方法的優(yōu)勢,有助于提升預(yù)測結(jié)果的魯棒性.
雖然基于機(jī)理模型的方法和機(jī)理模型與數(shù)據(jù)混合驅(qū)動方法得到了一定的發(fā)展,但其成功應(yīng)用的基礎(chǔ)是可獲取精確可靠的機(jī)理模型.隨著當(dāng)代設(shè)備逐步呈現(xiàn)復(fù)雜化、非線性化以及高維化等特征,其健康狀態(tài)演化規(guī)律通常難以精確機(jī)理建?;蛘攉@得失效機(jī)理模型的成本過高.現(xiàn)有研究中通過物理機(jī)理分析、理化分析、實驗分析等手段獲取的機(jī)理模型主要針對特定材料或?qū)ο?這一點也可以通過當(dāng)前機(jī)理模型的種類相當(dāng)匱乏反映出,由此在一定程度上限制了這類方法的廣泛應(yīng)用.因此,在大數(shù)據(jù)背景下,通過挖掘數(shù)據(jù)中隱含的設(shè)備健康狀態(tài)信息,發(fā)展數(shù)據(jù)驅(qū)動的剩余壽命預(yù)測方法成為當(dāng)前的主流和研究的焦點.
基于機(jī)器學(xué)習(xí)的設(shè)備剩余壽命預(yù)測主要思路是通過機(jī)器學(xué)習(xí)擬合性能變量演化規(guī)律并通過滾動外推到失效閾值以預(yù)測失效時間,或直接建立監(jiān)測數(shù)據(jù)與失效時間的映射關(guān)系實現(xiàn)端到端的預(yù)測,基于此通過預(yù)測的失效時間減去當(dāng)前運(yùn)行時間得到剩余壽命的預(yù)測值.裴洪等[38]和Khan 等[39]分別綜述了機(jī)器學(xué)習(xí)方法和深度學(xué)習(xí)方法在剩余壽命預(yù)測與健康管理領(lǐng)域的研究應(yīng)用現(xiàn)狀.為區(qū)別于以上綜述中介紹的工作,本文重點結(jié)合最新的研究進(jìn)展和大數(shù)據(jù)下剩余壽命預(yù)測的現(xiàn)實需求,對基于機(jī)器學(xué)習(xí)的剩余壽命預(yù)測技術(shù)發(fā)展動態(tài)和存在的問題進(jìn)行分析.根據(jù)機(jī)器學(xué)習(xí)網(wǎng)絡(luò)模型結(jié)構(gòu)特點,這類方法主要分為基于淺層機(jī)器學(xué)習(xí)的方法和基于深度學(xué)習(xí)的方法.
基于淺層機(jī)器學(xué)習(xí)的剩余壽命預(yù)測方法中的典型代表為神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等,具體發(fā)展動態(tài)分述如下.
1) 神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是一種模擬人類中樞神經(jīng)系統(tǒng)組織結(jié)構(gòu)與信息處理機(jī)制的學(xué)習(xí)網(wǎng)絡(luò),主要由輸入層、隱層和輸出層組成[40].神經(jīng)網(wǎng)絡(luò)具有自學(xué)習(xí)、自組織、自適應(yīng)以及強(qiáng)非線性映射擬合能力等優(yōu)點[41-42],因而在設(shè)備剩余壽命預(yù)測領(lǐng)域受到了學(xué)者們的廣泛關(guān)注[43-45].早在2004 年,Gebraeel 等[46]就將單隱層前饋神經(jīng)網(wǎng)絡(luò)用于機(jī)械設(shè)備振動信號建模,通過外推至失效閾值實現(xiàn)剩余壽命預(yù)測.Mahamad 等[47]通過改進(jìn)前饋神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法,將改進(jìn)后的網(wǎng)絡(luò)用于旋轉(zhuǎn)機(jī)械的壽命預(yù)測.Lim 等[48]采用特征時序直方圖法從多源監(jiān)測數(shù)據(jù)中提取了具有局部趨勢性的退化指標(biāo),然后將這些退化指標(biāo)輸入到多層感知機(jī)中去預(yù)測航空發(fā)動機(jī)的剩余壽命.Drouillet 等[49]將單隱層前饋神經(jīng)網(wǎng)絡(luò)用于高速銑刀剩余壽命預(yù)測.Ahmadzadeh[50]等使用多層感知機(jī)去預(yù)測研磨機(jī)剩余壽命.Zhang 等[51]基于小波包分解、快速傅里葉變換和反向傳播神經(jīng)網(wǎng)絡(luò)構(gòu)建了鼓風(fēng)機(jī)剩余壽命預(yù)測模型.徐東輝[52]提出了多類神經(jīng)網(wǎng)絡(luò)組合預(yù)測的方法,利用改進(jìn)的Elman 神經(jīng)網(wǎng)絡(luò)和非線性自回歸神經(jīng)網(wǎng)絡(luò)兩個單項預(yù)測模型進(jìn)行預(yù)測,并且借助于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)對兩個單項模型的預(yù)測值進(jìn)行非線性組合,實現(xiàn)了剩余壽命預(yù)測.楊洋[53]研究了一種基于自回歸移動平均和后向傳播神經(jīng)網(wǎng)絡(luò)組合模型的鋰電池壽命預(yù)測方法,有效結(jié)合了兩者在短期預(yù)測方面與非線性擬合方面的優(yōu)勢.在最新的研究中,Bektas 等[54]通過引入傳感器選擇、數(shù)據(jù)歸一化、特征提取等數(shù)據(jù)預(yù)處理技術(shù),將預(yù)處理后的數(shù)據(jù)用于訓(xùn)練神經(jīng)網(wǎng)絡(luò),提出了一種基于神經(jīng)網(wǎng)絡(luò)和相似性的剩余壽命預(yù)測方法.Li 等[55]利用監(jiān)測數(shù)據(jù)訓(xùn)練了多個神經(jīng)網(wǎng)絡(luò),基于加權(quán)平均思想提出了一種基于集成網(wǎng)絡(luò)的剩余壽命預(yù)測方法.
2)支持向量機(jī)
支持向量機(jī)是由Cortes[56]和Vapnik[57]于1995 年首次提出的,在小樣本和高維數(shù)據(jù)機(jī)器學(xué)習(xí)領(lǐng)域受到廣泛關(guān)注,主要原理是首先通過非線性變換將多維輸入向量映射到高維特征空間,然后在高維特征空間中構(gòu)造最優(yōu)超平面來實現(xiàn)樣本分類或回歸.由于支持向量機(jī)能夠有效避免 “維數(shù)災(zāi)難”問題,且具有較好的泛化能力,因而廣泛應(yīng)用于設(shè)備的剩余壽命預(yù)測中[58-61].例如,Soualhi 等[62]利用Hilbert-Huang 變換構(gòu)建了滾動軸承的敏感退化指標(biāo),然后將這些退化指標(biāo)輸入到支持向量機(jī)中實現(xiàn)了旋轉(zhuǎn)軸承的剩余壽命預(yù)測;Sun 等[63]構(gòu)建了貝葉斯最小二乘法支持向量機(jī)預(yù)測模型,并將其用于微波器件的剩余壽命預(yù)測;Nieto 等[64]將支持向量機(jī)應(yīng)用到了航空發(fā)動機(jī)的剩余壽命預(yù)測中;Khelif 等[65]研究提出了一種不需要建立健康指標(biāo)、故障狀態(tài)等直接基于支持向量回歸模型建立監(jiān)測數(shù)據(jù)與設(shè)備壽命的擬合關(guān)系,進(jìn)而實現(xiàn)了剩余壽命預(yù)測.Huang等[66]對基于支持向量機(jī)的剩余壽命預(yù)測方法研究現(xiàn)狀、應(yīng)用領(lǐng)域及發(fā)展趨勢進(jìn)行了系統(tǒng)地梳理和分析.
3)其他淺層模型
除了以上幾種常用的淺層模型外,一些其他機(jī)器學(xué)習(xí)模型也被應(yīng)用到裝備的剩余壽命預(yù)測中,如極限學(xué)習(xí)機(jī)[67]、貝葉斯網(wǎng)絡(luò)[68]、隨機(jī)森林[69]、梯度提升決策樹[70]、基于案例的學(xué)習(xí)方法[71]、基于案例的推理方法[72]等.文獻(xiàn)[38]對基于淺層機(jī)器學(xué)習(xí)的剩余壽命預(yù)測方法進(jìn)行了詳細(xì)綜述,本文不再贅述.
通過文獻(xiàn)總結(jié)分析可以發(fā)現(xiàn),雖然淺層神經(jīng)網(wǎng)絡(luò)訓(xùn)練相對比較容易,基于淺層機(jī)器學(xué)習(xí)方法實現(xiàn)設(shè)備剩余壽命預(yù)測的研究具有較長的歷史,但這類方法中采用的網(wǎng)絡(luò)結(jié)構(gòu)簡單、預(yù)測性能較多地依賴于專家先驗知識與信號處理技術(shù),且難于量化剩余壽命預(yù)測結(jié)果的不確定性.此外,這類研究中較多的方法需借助人工經(jīng)驗與知識預(yù)先提取監(jiān)測數(shù)據(jù)中的關(guān)鍵信息并構(gòu)建退化指標(biāo),因此退化指標(biāo)的好壞將很大程度上決定淺層神經(jīng)網(wǎng)絡(luò)的預(yù)測性能.在大數(shù)據(jù)時代,設(shè)備退化特征愈發(fā)表現(xiàn)出耦合性、不確定性、非完整性等特點,淺層機(jī)器學(xué)習(xí)算法自學(xué)習(xí)能力較弱,難以自動處理和分析海量監(jiān)測數(shù)據(jù).因此,大數(shù)據(jù)下剩余壽命預(yù)測的智能學(xué)習(xí)模型由 “淺”入 “深”、勢在必行.
深度學(xué)習(xí)作為一種大數(shù)據(jù)處理工具,旨在模擬大腦學(xué)習(xí)過程,構(gòu)建深度模型,通過海量數(shù)據(jù)學(xué)習(xí)特征,刻畫數(shù)據(jù)豐富的內(nèi)在信息,最終提升建模精度.深度學(xué)習(xí)自從2006 年在Science上首次提出便掀起了學(xué)術(shù)界和工業(yè)界的研究浪潮,如雨后春筍,以其強(qiáng)大的海量數(shù)據(jù)處理能力在諸多領(lǐng)域的大數(shù)據(jù)分析中方興未艾.經(jīng)過了十余年的探索,深度學(xué)習(xí)當(dāng)前已成功應(yīng)用于許多工程領(lǐng)域,如圖像識別[73]、自然語言處理[74]、語音識別[75]、故障診斷[76]等,同時在剩余壽命預(yù)測領(lǐng)域也嶄露頭角.如圖1 所示,根據(jù)網(wǎng)絡(luò)結(jié)構(gòu)的不同,這類方法主要包括: 基于深度自編碼器的方法、基于深度置信網(wǎng)絡(luò)的方法、基于卷積神經(jīng)網(wǎng)絡(luò)的方法、基于循環(huán)神經(jīng)網(wǎng)絡(luò)的方法以及多種網(wǎng)絡(luò)組合而成的混合網(wǎng)絡(luò)方法.無論基于哪種深度網(wǎng)絡(luò)結(jié)構(gòu)形式,其基本思想都是采用現(xiàn)有深度學(xué)習(xí)模型建立性能測試數(shù)據(jù)與剩余壽命標(biāo)簽或退化標(biāo)簽之間的潛在關(guān)系.下面針對幾種典型的深度學(xué)習(xí)網(wǎng)絡(luò),介紹其應(yīng)用于剩余壽命預(yù)測時的研究動態(tài)并分析當(dāng)前研究存在的問題.
1)深度自編碼網(wǎng)絡(luò)
深度自編碼網(wǎng)絡(luò)是由多個自編碼器或降噪自編碼器堆疊組成的深度神經(jīng)網(wǎng)絡(luò).基于深度自編碼網(wǎng)絡(luò)的剩余壽命預(yù)測通過提取出原始數(shù)據(jù)的深層次特征,然后通過邏輯回歸層或全連接層實現(xiàn)機(jī)械裝備的剩余壽命預(yù)測[77-80].由于自編碼器是以重構(gòu)原始輸入為學(xué)習(xí)目標(biāo),因而其學(xué)習(xí)到的特征對數(shù)據(jù)有更本質(zhì)的刻畫,有利于提高預(yù)測精度,且深度自編碼網(wǎng)絡(luò)能夠以無監(jiān)督學(xué)習(xí)方式逐層對網(wǎng)絡(luò)參數(shù)進(jìn)行預(yù)訓(xùn)練,將訓(xùn)練結(jié)果作為反向微調(diào)的初始值,確保了網(wǎng)絡(luò)參數(shù)的在線更新,在剩余壽命預(yù)測領(lǐng)域得到了廣泛的應(yīng)用[81-85].例如,Xia 等[79]提出了一種基于深度自編碼網(wǎng)絡(luò)的兩階段剩余壽命預(yù)測方法,首先運(yùn)用深度降噪自編碼器網(wǎng)絡(luò)對監(jiān)測大數(shù)據(jù)進(jìn)行階段劃分,然后訓(xùn)練深度自編碼網(wǎng)絡(luò)得到每個階段的退化特征,最后通過回歸方法分析各階段特征實現(xiàn)剩余壽命預(yù)測.然而,深度自編碼網(wǎng)絡(luò)在處理力信號、振動信號、聲發(fā)射信號、光信號等高維原始監(jiān)測數(shù)據(jù)時,其仍需要借助各類信號處理技術(shù)來提取設(shè)備的退化指標(biāo).
2)深度置信網(wǎng)絡(luò)
深度置信網(wǎng)絡(luò)主要是由多個受限波爾茲曼機(jī)堆疊與一個分類層或回歸層組合形成的深度網(wǎng)絡(luò),通過逐層預(yù)訓(xùn)練和反向精調(diào)策略解決深度模型普遍存在的訓(xùn)練困難問題,不僅能實現(xiàn)數(shù)據(jù)從淺層到深層的特征表示與提取,而且能發(fā)現(xiàn)輸入數(shù)據(jù)的分布式特征,在深層特征提取方面獲得了廣泛的應(yīng)用.例如,Jiao 等[86]提出了一種基于深度置信網(wǎng)絡(luò)的健康指標(biāo)構(gòu)建方法用于裝備的剩余壽命預(yù)測,該方法采用無監(jiān)督學(xué)習(xí)的策略融合多個傳感器監(jiān)測數(shù)據(jù)對裝備健康狀態(tài)進(jìn)行評估,得到描述其退化程度的健康指標(biāo)用于剩余壽命預(yù)測.需要注意的是,深度置信網(wǎng)絡(luò)在實際中的應(yīng)用主要集中在深層次特征提取方面,單純利用深度置信網(wǎng)絡(luò)實現(xiàn)剩余壽命預(yù)測的研究還相當(dāng)有限,需要與其他網(wǎng)絡(luò)混合進(jìn)行才能進(jìn)行剩余壽命預(yù)測.
3)卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)作為一類經(jīng)典的前饋神經(jīng)網(wǎng)絡(luò),是由LeCun 等[87]首次提出并用于解決圖像處理問題的,主要由若干卷積層和池化層組成,既能輸入序列數(shù)據(jù),也能處理網(wǎng)格化數(shù)據(jù),在計算機(jī)視覺、語音識別等領(lǐng)域應(yīng)用十分廣泛.針對設(shè)備性能監(jiān)測大數(shù)據(jù)的特點,先后發(fā)展出了多種用于剩余壽命預(yù)測的卷積神經(jīng)網(wǎng)絡(luò),主要包括深度卷積神經(jīng)網(wǎng)絡(luò)[88]、多層可分離卷積神經(jīng)網(wǎng)絡(luò)[89]、多尺度卷積神經(jīng)網(wǎng)絡(luò)[90]、聯(lián)合損失卷積神經(jīng)網(wǎng)絡(luò)[91]等.Babu 等[92]首次將深度卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于剩余壽命預(yù)測領(lǐng)域,采用兩個卷積層和兩個池化層提取原始信號特征,同時結(jié)合多層感知器實現(xiàn)剩余壽命的預(yù)測.最近,Yang 等[93]提出了一種基于兩個卷積神經(jīng)網(wǎng)絡(luò)的剩余壽命預(yù)測方法,其中一個是分類網(wǎng)絡(luò)用于監(jiān)測性能退化的初始時刻,另一個是回歸網(wǎng)絡(luò)用于預(yù)測剩余壽命.相比于其他深度學(xué)習(xí)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)能夠更有效地處理力信號、振動信號、聲發(fā)射信號、光信號等高維原始數(shù)據(jù),可實現(xiàn)從監(jiān)測數(shù)據(jù)中自動提取退化特征信息,適合處理監(jiān)測大數(shù)據(jù)且具有降噪的功能,同時其網(wǎng)絡(luò)參數(shù)量相對較少,訓(xùn)練更加方便高效,因此易于構(gòu)建更深的網(wǎng)絡(luò)結(jié)構(gòu).然而,隨機(jī)退化設(shè)備的監(jiān)測數(shù)據(jù)蘊(yùn)含的健康特征往往是時序相關(guān)的,而卷積神經(jīng)網(wǎng)絡(luò)在應(yīng)對大數(shù)據(jù)下時序特征提取能力不足,容易造成重要時序特征的丟失,這對于剩余壽命預(yù)測是不利的,因此卷積神經(jīng)網(wǎng)絡(luò)在應(yīng)用于剩余壽命預(yù)測時經(jīng)常與其他深度網(wǎng)絡(luò)組合使用.
4)循環(huán)神經(jīng)網(wǎng)絡(luò)
循環(huán)神經(jīng)網(wǎng)絡(luò)作為一類包含前饋連接與內(nèi)部反饋連接的前饋神經(jīng)網(wǎng)絡(luò),主要用于處理具有相互依賴特性的監(jiān)測向量序列,由于其特殊的網(wǎng)絡(luò)結(jié)構(gòu),能夠保留隱含層上一時刻的狀態(tài)信息,目前已經(jīng)在剩余壽命預(yù)測領(lǐng)域得到廣泛的關(guān)注,被應(yīng)用于鋰電池系統(tǒng)[94]、風(fēng)力發(fā)電設(shè)備[95]、航空發(fā)動機(jī)[96]等.為解決循環(huán)神經(jīng)網(wǎng)絡(luò)通常存在 “記憶衰退”進(jìn)而導(dǎo)致預(yù)測偏差較大這一問題,學(xué)者們對循環(huán)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行了改進(jìn),提出了一種長短期記憶(Long short term memory,LSTM)模型,門結(jié)構(gòu)作為LSTM 的獨特結(jié)構(gòu),能夠在最優(yōu)條件下確定出所通過信息特征,在剩余壽命預(yù)測領(lǐng)域獲得了廣泛的應(yīng)用[97-98].例如: 為解決運(yùn)行和環(huán)境擾動引起的不確定性問題,Elsheikh 等[99]對LSTM 的結(jié)構(gòu)分別進(jìn)行了改進(jìn),提出了基于雙向LSTM 的剩余壽命預(yù)測方法.雖然循環(huán)神經(jīng)網(wǎng)絡(luò)在隨機(jī)退化設(shè)備退化過程建模方面具有先天優(yōu)勢,但當(dāng)處理長期依賴型退化數(shù)據(jù)時,循環(huán)神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中也經(jīng)常面臨梯度消失或爆炸問題.同時,以上基于循環(huán)神經(jīng)網(wǎng)絡(luò)的剩余壽命預(yù)測研究中都未考慮預(yù)測結(jié)果不確定性的量化問題,只能輸出一個剩余壽命的點估計,難以評估預(yù)測結(jié)果的置信度.
最近,針對剩余壽命預(yù)測不確定性量化問題,Zhang 等[100]在假定退化數(shù)據(jù)服從正態(tài)分布的前提下利用Monte Carlo 方法從退化數(shù)據(jù)中隨機(jī)采樣,通過改變LSTM 網(wǎng)絡(luò)輸入,在不同網(wǎng)絡(luò)輸入下得到不同的剩余壽命預(yù)測值,由此構(gòu)造剩余壽命的數(shù)值分布,試圖量化預(yù)測不確定性.Huang 等[101]利用雙向LSTM 網(wǎng)絡(luò)預(yù)測剩余壽命輸出的均方根誤差構(gòu)建剩余壽命預(yù)測的誤差帶,以區(qū)間的形式表示預(yù)測不確定性.Yu 等[102]對退化監(jiān)測數(shù)據(jù)進(jìn)行劃分、以退化量為標(biāo)簽,建立了多個基于LSTM 網(wǎng)絡(luò)的退化量預(yù)測模型,然后通過滾動預(yù)測的思想將預(yù)測值作為模型輸入迭代預(yù)測至退化量超過失效預(yù)測的時刻,由此確定設(shè)備的剩余壽命預(yù)測值.進(jìn)一步,為綜合多個LSTM 網(wǎng)絡(luò)預(yù)測值,引入Bayesian 模型平均方法,估計各個模型的后驗概率,由此可以確定最終的剩余壽命預(yù)測值和預(yù)測置信區(qū)間,有效提高了剩余壽命預(yù)測精度的同時以置信區(qū)間的形式表示了預(yù)測不確定性.以上思路在基于機(jī)器學(xué)習(xí)方法的剩余壽命預(yù)測不確定性量化方面做出了有益的嘗試,然而無論是改變輸入條件構(gòu)建數(shù)值分布、基于均方根誤差構(gòu)建誤差帶,還是構(gòu)建多個預(yù)測模型通過Bayesian 模型平均構(gòu)建置信區(qū)間,都更多地反映了網(wǎng)絡(luò)訓(xùn)練的效果而不能全面反映設(shè)備性能退化固有的時變隨機(jī)性和動態(tài)特性.
5)混合深度網(wǎng)絡(luò)
基于混合深度網(wǎng)絡(luò)的方法可看作多個深度學(xué)習(xí)網(wǎng)絡(luò)以一定方式組合連接(如串聯(lián)、并聯(lián)等)用于彌補(bǔ)現(xiàn)有單一深度學(xué)習(xí)網(wǎng)絡(luò)的不足,目前主要的混合形式包括深度置信網(wǎng)絡(luò)+前饋神經(jīng)網(wǎng)絡(luò)[103]、受限玻爾茲曼機(jī)+LSTM 網(wǎng)絡(luò)[104]、LSTM 網(wǎng)絡(luò)+卷積神經(jīng)網(wǎng)絡(luò)[105]、LSTM 網(wǎng)絡(luò)+編碼-解碼模型[106]、循環(huán)神經(jīng)網(wǎng)絡(luò)+自編碼器[107]、多損失編碼器+兩階段卷積神經(jīng)網(wǎng)絡(luò)[108]等.這類方法主要通過繼承不同深度學(xué)習(xí)模型的優(yōu)勢,進(jìn)而期望實現(xiàn)取長補(bǔ)短、改善剩余壽命預(yù)測的效果.例如: Ren 等[109]提出了一種堆棧自編碼器與前饋神經(jīng)網(wǎng)絡(luò)組合的軸承剩壽命預(yù)測方法,該方法能夠有效利用堆棧自編碼器在特征表示方面的優(yōu)勢,同時將其引入至前饋神經(jīng)網(wǎng)絡(luò)可有效避免訓(xùn)練過程中的局部最優(yōu)問題;Deutsch等[104]提出了一種融合深度置信網(wǎng)絡(luò)與前饋神經(jīng)網(wǎng)絡(luò)的旋轉(zhuǎn)設(shè)備剩余壽命預(yù)測方法,這是基于深度置信網(wǎng)絡(luò)方法的改進(jìn)和拓展,能夠有效結(jié)合深度置信網(wǎng)絡(luò)特征提取能力與前饋神經(jīng)網(wǎng)絡(luò)的預(yù)測性能.雖然通過混合深度網(wǎng)絡(luò)進(jìn)行剩余壽命預(yù)測有助于產(chǎn)生互補(bǔ)效應(yīng),但混合多種深度網(wǎng)絡(luò)將不可避免地導(dǎo)致剩余壽命預(yù)測模型的訓(xùn)練復(fù)雜化,而且混合方式的選擇基本上是啟發(fā)式的,缺乏公認(rèn)統(tǒng)一的形式.因此,發(fā)展剩余壽命預(yù)測相關(guān)性能要求牽引下的混合深度網(wǎng)絡(luò)構(gòu)建方式以提高混合方式的可解釋性仍有待深入研究.
需要說明的是,基于深度學(xué)習(xí)的剩余壽命預(yù)測研究正在蓬勃發(fā)展,以上介紹到的文獻(xiàn)僅是冰山一角.通過對當(dāng)前相關(guān)研究發(fā)展動態(tài)的分析不難發(fā)現(xiàn),無論是傳統(tǒng)的基于淺層機(jī)器學(xué)習(xí)還是正在蓬勃發(fā)展的基于深度學(xué)習(xí)的剩余壽命預(yù)測研究,基本上都可以歸結(jié)到兩種思路,即基于退化量滾動預(yù)測和基于學(xué)習(xí)網(wǎng)絡(luò)建立監(jiān)測數(shù)據(jù)與失效時間端到端的映射.雖然在以上兩種思路下的剩余壽命預(yù)測方法研究快速發(fā)展,且都屬于數(shù)據(jù)驅(qū)動的方法,但當(dāng)前研究面對剩余壽命預(yù)測現(xiàn)實需求時主要存在以下有待解決的問題:
1)目前這些基于機(jī)器學(xué)習(xí)的剩余壽命預(yù)測研究,基本上都是將其他領(lǐng)域應(yīng)用需求驅(qū)動下提出并發(fā)展起來的各種深度網(wǎng)絡(luò)直接應(yīng)用,其網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)均是確定性的,一般只能得到確定性的剩余壽命預(yù)測值,很難得到能夠量化剩余壽命預(yù)測不確定性的概率分布.正如第1 節(jié)所討論的,剩余壽命預(yù)測針對的是設(shè)備將來的失效事件,而設(shè)備性能退化在預(yù)測區(qū)間內(nèi)受到環(huán)境、負(fù)載等多重隨機(jī)因素影響,導(dǎo)致剩余壽命預(yù)測結(jié)果不可避免地具有不確定性,因此剩余壽命預(yù)測不確定性的量化表征是該領(lǐng)域的一個核心問題.然而,目前基于機(jī)器學(xué)習(xí)的方法對這方面重視不夠,在預(yù)測不確定性量化能力上存在不足.無法量化預(yù)測不確定性也意味著無法量化預(yù)測結(jié)果帶來的風(fēng)險,由此導(dǎo)致難以滿足以最小化運(yùn)行風(fēng)險或最小化費用為目標(biāo)的健康管理相關(guān)決策(如維護(hù)決策、備件訂購等)對運(yùn)行風(fēng)險定量評估的應(yīng)用需求[39].造成以上問題的根本原因在于所采用的學(xué)習(xí)網(wǎng)絡(luò)并不是針對剩余壽命預(yù)測的核心需求設(shè)計的,更多的是直接采用或借鑒其他任務(wù)需求下發(fā)展起來的學(xué)習(xí)網(wǎng)絡(luò).因此,如何設(shè)計并發(fā)展面向剩余壽命預(yù)測及其不確定性量化需求的專用學(xué)習(xí)網(wǎng)絡(luò),使得其能夠從監(jiān)測數(shù)據(jù)中學(xué)習(xí)到反映預(yù)測不確定性的剩余壽命概率分布相關(guān)的信息,是克服現(xiàn)有研究發(fā)展瓶頸的根本途徑和有重要價值的研究方向.
2)現(xiàn)有研究中通過學(xué)習(xí)網(wǎng)絡(luò)建立監(jiān)測數(shù)據(jù)與失效時間端到端映射以預(yù)測剩余壽命的思路,其成功實現(xiàn)的前提是能夠獲取充分的同類設(shè)備失效時間數(shù)據(jù)以制作訓(xùn)練標(biāo)簽.然而,在工程實際中,由于受到安全性與經(jīng)濟(jì)性等因素的限制,設(shè)備運(yùn)行至失效狀態(tài)是極其危險的,一般在失效前對設(shè)備進(jìn)行替換.在該情況下,所能獲取的更多的是設(shè)備在服役過程中積累的大量狀態(tài)監(jiān)測數(shù)據(jù),關(guān)于設(shè)備失效時間的數(shù)據(jù)幾乎沒有,因而這類狀態(tài)監(jiān)測大數(shù)據(jù)大多屬于非全壽命周期類型.盡管大數(shù)據(jù)背景下非全壽命周期數(shù)據(jù)包含了豐富的設(shè)備退化機(jī)制與壽命信息,但由于失效數(shù)據(jù)匱乏將導(dǎo)致現(xiàn)有基于機(jī)器學(xué)習(xí)的剩余壽命預(yù)測方法中所需的壽命標(biāo)簽難以制作(即零壽命標(biāo)簽問題),由此為構(gòu)建監(jiān)測數(shù)據(jù)與剩余壽命之間端到端的映射關(guān)系帶來了極大的挑戰(zhàn).與此同時,基于退化量滾動預(yù)測的思路以退化量為標(biāo)簽構(gòu)建預(yù)測模型,能夠減少對壽命標(biāo)簽數(shù)據(jù)的依賴,但在實現(xiàn)過程中將本身存在誤差的退化量預(yù)測值作為預(yù)測模型輸入進(jìn)行滾動預(yù)測,容易造成預(yù)測誤差的累積,進(jìn)而影響剩余壽命預(yù)測的準(zhǔn)確性.此外,目前基于以上思路的剩余壽命預(yù)測研究主要針對完整監(jiān)測數(shù)據(jù),而對于圖2 所示的 “碎片化、分段的、稀疏的”非完整監(jiān)測大數(shù)據(jù)與剩余壽命之間的映射關(guān)系鮮有研究.因此,零壽命標(biāo)簽情形下如何通過非完整監(jiān)測大數(shù)據(jù)構(gòu)建隨機(jī)退化設(shè)備剩余壽命預(yù)測模型,發(fā)展剩余壽命預(yù)測研究的新范式仍有待解決.
3)如前所述,剩余壽命預(yù)測是銜接設(shè)備健康狀態(tài)感知與基于狀態(tài)感知信息實現(xiàn)設(shè)備的個性化精準(zhǔn)健康管理的橋梁,因此剩余壽命預(yù)測方法的可解釋性對于將預(yù)測結(jié)果用于設(shè)備的健康管理(如預(yù)測維護(hù)、備件訂購等)至關(guān)重要.然而,現(xiàn)有基于機(jī)器學(xué)習(xí)的剩余壽命預(yù)測方法通過學(xué)習(xí)網(wǎng)絡(luò)建立監(jiān)測數(shù)據(jù)與剩余壽命之間的映射關(guān)系,監(jiān)測數(shù)據(jù)與剩余壽命之間的關(guān)系難以顯式表示,呈現(xiàn) “黑箱” 特點,難以解釋設(shè)備退化失效機(jī)理.此外,當(dāng)前的研究較多地關(guān)注了剩余壽命預(yù)測的準(zhǔn)確性,但機(jī)器學(xué)習(xí)模型中超參數(shù)的選擇對預(yù)測結(jié)果的準(zhǔn)確性和魯棒性具有重要影響,預(yù)測的效果對調(diào)參技巧和經(jīng)驗有較大的依賴,而如何合理有效地選擇機(jī)器學(xué)習(xí)模型的超參數(shù)在機(jī)器學(xué)習(xí)領(lǐng)域本身就是一個極具挑戰(zhàn)性的問題.綜合以上兩個方面可見,發(fā)展具有可解釋性的基于機(jī)器學(xué)習(xí)的剩余壽命預(yù)測方法,將有助于打通當(dāng)前這類方法從理論研究到推廣應(yīng)用于設(shè)備健康管理的最后一公里.提高基于機(jī)器學(xué)習(xí)的剩余壽命預(yù)測方法的可解釋性的研究方向包括在學(xué)習(xí)網(wǎng)絡(luò)設(shè)計中考慮設(shè)備退化失效的機(jī)理知識、基于學(xué)習(xí)網(wǎng)絡(luò)從監(jiān)測數(shù)據(jù)中提取退化特征時將特征的趨勢性或單調(diào)性作為約束條件考慮、將超參數(shù)的選擇問題轉(zhuǎn)化為提升預(yù)測效果的優(yōu)化問題納入模型訓(xùn)練過程等.
傳統(tǒng)統(tǒng)計數(shù)據(jù)驅(qū)動的剩余壽命預(yù)測方法通過對設(shè)備失效時間數(shù)據(jù)統(tǒng)計分析,構(gòu)造壽命T的分布函數(shù),由此設(shè)備在t時刻的剩余壽命即為T -t|T >t,z,其中z代表該類設(shè)備的事件數(shù)據(jù)集(主要指失效時間數(shù)據(jù)),然后通過分布擬合得到壽命T的概率分布,再通過上述條件隨機(jī)變量的關(guān)系實現(xiàn)剩余壽命預(yù)測[110].然而,隨著生產(chǎn)制造水平的不斷提升,設(shè)備的可靠性逐步提高,很難在短期內(nèi)(即使是加速條件下)獲得足夠多的失效數(shù)據(jù)或?qū)τ诎嘿F的設(shè)備獲取成本過高,而且這類方法沒有用到設(shè)備運(yùn)行過程中的監(jiān)測數(shù)據(jù),預(yù)測結(jié)果難以反映當(dāng)前運(yùn)行實際情況,由此導(dǎo)致難以實現(xiàn)個體服役設(shè)備的精準(zhǔn)健康管理.
相比之下,隨著信息技術(shù)和傳感器技術(shù)的迅猛發(fā)展,通過設(shè)備性能退化變量的監(jiān)測數(shù)據(jù),建立描述設(shè)備性能演化過程的隨機(jī)模型,便可預(yù)測設(shè)備剩余壽命[111].這類方法以概率統(tǒng)計理論為基礎(chǔ),在隨機(jī)模型框架下建模性能退化變量演變規(guī)律,以概率分布的形式給出剩余壽命分布的表達(dá)式,不僅能得到剩余壽命的點估計,而且能描述預(yù)測的不確定性(方差、置信區(qū)間等各種不確定性量化指標(biāo)),這對維修、替換、后勤保障等的科學(xué)決策極為重要,因而已成為國內(nèi)外研究的熱點.
基于隨機(jī)模型建模性能退化變量監(jiān)測數(shù)據(jù)的關(guān)鍵是選擇合適的隨機(jī)模型,常用的隨機(jī)模型主要指各種隨機(jī)過程模型,包括Wiener 過程、Gamma過程、Markov 鏈、隱Markov 過程和逆高斯過程等[112-115].這類方法采用隨機(jī)過程描述性能退化變量的演變過程,通過監(jiān)測數(shù)據(jù)實現(xiàn)模型參數(shù)的估計,基于此通過求解所建立的隨機(jī)退化過程首達(dá)失效閾值時間的概率分布實現(xiàn)剩余壽命預(yù)測,在剩余壽命預(yù)測不確定性量化方面具有天然優(yōu)勢.從物理機(jī)制看,設(shè)備退化是其內(nèi)部應(yīng)力和外部環(huán)境綜合作用而引起的設(shè)備老化和性能衰變,與采樣時間和采樣頻率無關(guān),亦即設(shè)備的退化過程應(yīng)該滿足無限可分性.迄今,從數(shù)學(xué)上已證明滿足無限可分性的隨機(jī)過程模型只有Gamma 過程、逆高斯過程和Wiener 過程[116-117].因此,利用這三類隨機(jī)過程建立設(shè)備退化模型,在數(shù)學(xué)上和物理上均具有較強(qiáng)的可解釋性,受到了國內(nèi)外研究者的廣泛關(guān)注[118-119].然而,前兩種隨機(jī)過程都是單調(diào)隨機(jī)過程,只能描述單調(diào)退化,例如磨損、疲勞裂紋增長等.在實際中,由于設(shè)備內(nèi)部應(yīng)力的吸收與釋放、使用強(qiáng)度、使用頻率、載荷大小、外界環(huán)境等的動態(tài)變化,性能退化變量的監(jiān)測信號往往呈現(xiàn)非單調(diào)波動的特點,而Wiener 過程是由Brownian 運(yùn)動驅(qū)動的一類擴(kuò)散過程,其增量獨立且為高斯分布,適合刻畫非單調(diào)退化過程,在退化測量信號的建模上更具靈活性,因此廣泛應(yīng)用于滾動軸承、液晶顯示器、激光器、慣性器件等的退化建模及剩余壽命預(yù)測.2018 年,Zhang 等[120]系統(tǒng)全面地總結(jié)了基于Wiener 過程的各種退化建模及剩余壽命預(yù)測方法最新研究進(jìn)展情況.
目前,這類基于隨機(jī)過程的方法主要針對圖2所示的完整監(jiān)測數(shù)據(jù),且需要能夠從監(jiān)測數(shù)據(jù)中提取具有一定趨勢特征的性能退化變量,以確定所采用隨機(jī)過程的參數(shù)化形式并基于監(jiān)測數(shù)據(jù)實現(xiàn)隨機(jī)過程模型參數(shù)辨識,最終通過求解隨機(jī)過程首達(dá)失效閾值時間的概率分布達(dá)到預(yù)測剩余壽命的目的.根據(jù)建模過程中涉及的性能退化變量數(shù)目,主要分為單變量模型和多變量模型兩種情況.
單變量下隨機(jī)退化設(shè)備剩余壽命預(yù)測研究得到了廣泛關(guān)注和深入研究.Gebraeel 等[121]以軸承振動數(shù)據(jù)為背景,將設(shè)備退化數(shù)據(jù)演化過程描述為線性Wiener 過程,最早將Bayesian 更新策略用于剩余壽命分布的在線遞歸預(yù)測.Huang 等[122]通過采用時間尺度變換線性化技術(shù)研究了一類基于一般Wiener 隨機(jī)退化過程的剩余壽命預(yù)測問題,提出了漂移系數(shù)自適應(yīng)更新方法;為處理本質(zhì)非線性退化數(shù)據(jù),Si 等[123]提出了一類一般非線性擴(kuò)散過程模型描述退化數(shù)據(jù),通過時間-空間變換,得到了剩余壽命分布的解析形式,并將所得結(jié)果應(yīng)用于慣性平臺的漂移退化和2017-T4 鋁合金的疲勞裂紋增長.在文獻(xiàn)[123]基礎(chǔ)之上,出現(xiàn)了諸多的理論擴(kuò)展及應(yīng)用研究[124-125].最新出版的學(xué)術(shù)專著 [126] 對基于Wiener過程及其變形開展的單變量下隨機(jī)退化設(shè)備剩余壽命預(yù)測基礎(chǔ)理論和方法,從線性到非線性、從固定模式到切換模式進(jìn)行了詳細(xì)的論述.
在工程實際中,設(shè)備存在運(yùn)行工況、運(yùn)行環(huán)境、運(yùn)行負(fù)載多變等復(fù)雜運(yùn)行模式,反映設(shè)備性能退化的變量往往不止一個且相互關(guān)聯(lián),呈現(xiàn)多性能退化變量的特點,表征設(shè)備健康狀態(tài)的性能退化指標(biāo)往往并不唯一.文獻(xiàn)[127]在Bayesian 框架下研究了多變量動態(tài)系統(tǒng)的可靠性估計問題,但將各個變量單獨建模,未考慮多退化變量之間相互耦合的實際.當(dāng)前,對多變量耦合的情況主要有兩種思路.第1種是基于Copula 函數(shù)的方法.其中,Copula 函數(shù)是一種連接多維聯(lián)合分布與一維邊緣分布的特殊函數(shù),基于此函數(shù),多個相關(guān)退化量的聯(lián)合分布可以通過每個退化量的邊緣分布和Copula 函數(shù)融合為一個整體分布[128].Pan 等[129]、Peng等[130]、劉勝南等[131]、張建勛等[132]采用不同的隨機(jī)過程模型和Copula 函數(shù)研究了多元退化變量的建模問題,并用于剩余壽命預(yù)測.然而,基于Copula 函數(shù)的方法成功應(yīng)用的關(guān)鍵在于Copula 函數(shù)的選擇,不同的退化數(shù)據(jù)常常適用于不同的Copula 函數(shù),而且可供選擇的Copula 函數(shù)形式是非常有限的,選擇的過程有一定的主觀性,選擇結(jié)果也不唯一,因此這類方法難以對多個性能退化變量之間的相互作用關(guān)系進(jìn)行合理的定量描述.第2 種是基于信息融合的方法.這種方法的主要思路是在進(jìn)行退化建模之前,首先根據(jù)多維數(shù)據(jù)之間的關(guān)系,通過優(yōu)化、加權(quán)、融合濾波等方式,將多維數(shù)據(jù)投影變換到一維數(shù)據(jù)上來,提取一個單變量復(fù)合性能指標(biāo),再應(yīng)用已有針對單變量的方法對此一維數(shù)據(jù)進(jìn)行建模和預(yù)測.例如,Liu 等先后提出了基于退化信號加權(quán)組合[133-134]、基于信號質(zhì)量優(yōu)化[135]、基于多源信息融合[136-137]的復(fù)合性能指標(biāo)獲取方法,據(jù)此采用單變量退化建模方法實現(xiàn)剩余壽命預(yù)測.此類方法的優(yōu)點在于融合后的性能指標(biāo)可以采用傳統(tǒng)針對單變量的退化建模和剩余壽命預(yù)測方法.然而,在多維數(shù)據(jù)融合時其相互之間的關(guān)系一般難以界定,使得融合后的指標(biāo)難以全面反映整個設(shè)備的退化,而且融合后的指標(biāo)物理意義不明確,導(dǎo)致退化失效閾值的確定成為一個新的難題.
通過以上文獻(xiàn)分析可以看出,統(tǒng)計數(shù)據(jù)驅(qū)動方法以概率統(tǒng)計理論為基礎(chǔ),利用隨機(jī)模型對監(jiān)測數(shù)據(jù)進(jìn)行建模,進(jìn)而對剩余壽命進(jìn)行推斷,可以得到剩余壽命的概率分布,在量化剩余壽命預(yù)測不確定性上具有天然優(yōu)勢,且隨機(jī)模型參數(shù)與設(shè)備退化失效過程緊密相關(guān)使得模型可解釋性較強(qiáng)(如反映退化快慢的退化率參數(shù)、反映退化過程時變不確定性的擴(kuò)散系數(shù)等),因此得到了可靠性領(lǐng)域?qū)W者的大力推崇,發(fā)展迅速.但需要注意到的是,無論是單變量下還是多變量下,這類方法主要針對圖2 所示的完整監(jiān)測數(shù)據(jù)且需要能夠從監(jiān)測數(shù)據(jù)中提取具有一定統(tǒng)計特征的退化趨勢數(shù)據(jù)以實現(xiàn)參數(shù)化的演變軌跡建模.然而,在大數(shù)據(jù)時代,通常采用傳感器網(wǎng)絡(luò)收集多物理源信號以全面反映設(shè)備狀態(tài),由于多源信號差異大、采樣策略形式多,數(shù)據(jù)價值密度低,導(dǎo)致數(shù)據(jù)質(zhì)量參差不齊,現(xiàn)有統(tǒng)計數(shù)據(jù)驅(qū)動的方法從大數(shù)據(jù)中提取退化特征信息如同大海撈針,處理如圖2 所示的 “碎片化、分段的、稀疏的”監(jiān)測大數(shù)據(jù)更是難上加難,沒有良好統(tǒng)計特征的退化數(shù)據(jù)做輸入,這類方法必將迷失于浩瀚的數(shù)據(jù)海洋.此外,單變量下隨機(jī)退化設(shè)備剩余壽命預(yù)測研究試圖提取單一特征表征設(shè)備健康狀態(tài)全貌的思路,已與復(fù)雜運(yùn)行條件下設(shè)備健康狀態(tài)需從多維度表征的需求不相適應(yīng),而現(xiàn)有多變量下隨機(jī)退化設(shè)備剩余壽命預(yù)測問題的研究基本都是試圖通過轉(zhuǎn)換為單變量情況再來處理,未充分考慮多性能退化變量相互耦合、相互影響的機(jī)制,多變量耦合導(dǎo)致的剩余壽命分布求解難題仍未能得到有效解決.因此,針對大數(shù)據(jù)環(huán)境下隨機(jī)退化設(shè)備的剩余壽命預(yù)測問題,發(fā)展新的理論和方法勢在必行.
通過第3 節(jié)和第4 節(jié)的文獻(xiàn)分析可以看出,以深度學(xué)習(xí)為代表的機(jī)器學(xué)習(xí)方法在監(jiān)測大數(shù)據(jù)深層次特征自動提取、復(fù)雜結(jié)構(gòu)數(shù)據(jù)擬合、非線性映射等方面具有強(qiáng)大的處理能力,但很難得到體現(xiàn)剩余壽命預(yù)測不確定性的概率分布,這與其強(qiáng)大的數(shù)據(jù)處理能力和學(xué)習(xí)能力還不相匹配.統(tǒng)計數(shù)據(jù)驅(qū)動的方法雖能得到剩余壽命的概率分布、在量化剩余壽命預(yù)測不確定性上具有天然優(yōu)勢,但對具有多源信號差異大、采樣策略形式多、數(shù)據(jù)價值密度低、數(shù)據(jù)質(zhì)量參差不齊等特點的監(jiān)測大數(shù)據(jù)處理能力非常有限.因此,若能將機(jī)器學(xué)習(xí)方法與統(tǒng)計數(shù)據(jù)驅(qū)動方法相結(jié)合,有望綜合兩者的優(yōu)勢、彌補(bǔ)各自局限性.最近,一些學(xué)者也開始了這方面的探索性研究.Deutsch 等[138]將深度置信網(wǎng)絡(luò)用于提取退化特征,然后用隨機(jī)退化模型表示特征的演變趨勢,利用粒子濾波算法實現(xiàn)模型更新,并得到了剩余壽命概率分布的數(shù)值形式.彭開香等[139]研究提出了一種基于深度置信網(wǎng)絡(luò)的無監(jiān)督健康指標(biāo)構(gòu)建方法,并結(jié)合隱馬爾可夫模型對特征進(jìn)行建模用于剩余壽命預(yù)測.進(jìn)一步,該方法被改進(jìn)為深度置信網(wǎng)絡(luò)與粒子濾波相結(jié)合的形式[140],可以實現(xiàn)剩余壽命概率分布的數(shù)值計算.最近,Hu 等[141]利用深度置信網(wǎng)絡(luò)的無監(jiān)督學(xué)習(xí)特性構(gòu)建性能退化指標(biāo),然后采用非線性擴(kuò)散過程建模性能退化指標(biāo)演變趨勢,從而得到了剩余壽命的概率分布.
這些研究在做出了有益嘗試的同時,還存在不容忽視的局限性: 1)以上方法中深度網(wǎng)絡(luò)用于特征提取而隨機(jī)模型用于建模特征實現(xiàn)剩余壽命的概率分布輸出,但在實現(xiàn)過程中特征提取和模型建立是孤立進(jìn)行的,由此導(dǎo)致機(jī)器學(xué)習(xí)方法和統(tǒng)計數(shù)據(jù)驅(qū)動方法實際是簡單的組合關(guān)系,提取的深度退化特征能否適應(yīng)并匹配所采用的隨機(jī)模型仍是問題,因為在特征提取過程中并沒有考慮提取后采用何種形式的模型對其建模表征;2)深度網(wǎng)絡(luò)通常可以從監(jiān)測大數(shù)據(jù)中提取深層次、多維度的退化特征,但以上方法通過指標(biāo)篩選技術(shù)從多維度特征中選擇單個特征用于隨機(jī)退化建模,由此這類方法還存在第4節(jié)討論的所選單一特征難以表征設(shè)備健康狀態(tài)全貌、未考慮多變量耦合下剩余壽命分布求解等問題;3)通過深度網(wǎng)絡(luò)從大數(shù)據(jù)中提取的退化特征實際上是虛擬退化指標(biāo),物理意義不明確,由此導(dǎo)致這些退化指標(biāo)所對應(yīng)的失效閾值確定成為一個新的難題.
通過上述分析可見,若能綜合統(tǒng)計數(shù)據(jù)驅(qū)動方法在預(yù)測不確定性量化能力上的優(yōu)勢與機(jī)器學(xué)習(xí)方法在大數(shù)據(jù)處理能力上的優(yōu)勢,實現(xiàn)交互聯(lián)動、交叉融合、強(qiáng)強(qiáng)聯(lián)合,發(fā)展大數(shù)據(jù)環(huán)境下隨機(jī)退化設(shè)備剩余壽命預(yù)測新理論與新方法,有望為大數(shù)據(jù)時代設(shè)備剩余壽命預(yù)測與健康管理打造一把利器.然而,現(xiàn)有為數(shù)不多的綜合機(jī)器學(xué)習(xí)方法和統(tǒng)計數(shù)據(jù)驅(qū)動方法的剩余壽命預(yù)測研究中,基于監(jiān)測數(shù)據(jù)的退化特征提取過程與所提取特征的隨機(jī)過程建模是孤立進(jìn)行的,由此導(dǎo)致機(jī)器學(xué)習(xí)方法和統(tǒng)計數(shù)據(jù)驅(qū)動方法實際上是簡單的組合關(guān)系.此外,這些研究中提取退化特征的過程中主要關(guān)注了特征本身的特性(如單調(diào)性、趨勢性等),但如此提取的特征能否適應(yīng)并匹配所采用的隨機(jī)過程模型并不能保證.因此,發(fā)展大數(shù)據(jù)下退化特征提取與隨機(jī)退化建模交互聯(lián)動的剩余壽命預(yù)測方法,將有助于形成大數(shù)據(jù)下剩余壽命預(yù)測研究的新模式.
根據(jù)第1 節(jié)大數(shù)據(jù)下剩余壽命預(yù)測問題面向的數(shù)據(jù)特點,可知如何有效融合隨機(jī)退化設(shè)備的多源傳感監(jiān)測數(shù)據(jù)是實現(xiàn)這類設(shè)備剩余壽命精準(zhǔn)預(yù)測的關(guān)鍵.針對多源傳感監(jiān)測大數(shù)據(jù)融合下的剩余壽命預(yù)測問題,通過第4 節(jié)和第5 節(jié)的文獻(xiàn)介紹,可以發(fā)現(xiàn)Liu 等[133-137]在設(shè)備退化特征應(yīng)當(dāng)具有的單調(diào)性、趨勢性、失效時刻復(fù)合健康指標(biāo)值方差最小等期望特性的要求下,通過構(gòu)建適當(dāng)?shù)膬?yōu)化目標(biāo)函數(shù),提出了多傳感信號加權(quán)融合構(gòu)建復(fù)合健康指標(biāo)的方法,在此基礎(chǔ)上采用隨機(jī)系數(shù)回歸模型建模復(fù)合健康指標(biāo)的演化軌跡以實現(xiàn)剩余壽命預(yù)測;彭開香等[139]將深度置信網(wǎng)絡(luò)應(yīng)用于多源傳感監(jiān)測數(shù)據(jù)融合構(gòu)建退化特征,提取復(fù)合健康指標(biāo),然后通過隨機(jī)模型建模其演變過程實現(xiàn)剩余壽命預(yù)測.然而,以上研究均存在第5 節(jié)分析的將本身緊密相連的退化特征提取與隨機(jī)退化建模過程孤立進(jìn)行而導(dǎo)致構(gòu)建的退化特征和所采用的模型難以匹配的問題.因此,第5 節(jié)提出發(fā)展大數(shù)據(jù)下退化特征提取與隨機(jī)退化建模交互聯(lián)動的剩余壽命預(yù)測方法具有重要研究價值.
為了解決以上問題并佐證前面提出的通過交互聯(lián)動思想實現(xiàn)大數(shù)據(jù)下剩余壽命預(yù)測的可行性,本文以融合多源傳感監(jiān)測數(shù)據(jù)的剩余壽命預(yù)測問題為例,提出一種針對完整監(jiān)測大數(shù)據(jù)的隨機(jī)退化設(shè)備剩余壽命預(yù)測的新型解決思路,其基本思想是: 根據(jù)設(shè)備多源傳感監(jiān)測數(shù)據(jù),在數(shù)據(jù)層進(jìn)行多源傳感器加權(quán)融合構(gòu)建復(fù)合健康指標(biāo)用于表征設(shè)備退化特征,然后采用隨機(jī)過程模型建模該復(fù)合健康指標(biāo)時變演化趨勢,通過求解復(fù)合健康指標(biāo)首達(dá)失效閾值的時間實現(xiàn)壽命預(yù)測,基于壽命預(yù)測值與設(shè)備實際壽命的偏差構(gòu)建表征預(yù)測效果的優(yōu)化目標(biāo)函數(shù),對多源傳感器融合系數(shù)和隨機(jī)退化建模中的參數(shù)進(jìn)行反向優(yōu)化調(diào)整,形成復(fù)合健康指標(biāo)提取與隨機(jī)退化建模的反饋閉環(huán),實現(xiàn)復(fù)合健康指標(biāo)提取與隨機(jī)退化建模的交互聯(lián)動、交叉融合,達(dá)到復(fù)合健康指標(biāo)與隨機(jī)模型自動匹配的目的,同時克服復(fù)合健康指標(biāo)物理意義不明確進(jìn)而導(dǎo)致其對應(yīng)的失效閾值難以確定的問題.以上提出的新思路,簡稱為數(shù)模聯(lián)動,是指數(shù)據(jù)退化特征提取與所提取特征時變演化過程隨機(jī)建模的交互聯(lián)動、交叉融合,力求思路導(dǎo)向結(jié)果.主要實現(xiàn)方案及流程如圖3 所示.
通過圖3 可以看出,本文提出的數(shù)模聯(lián)動思路,通過形成復(fù)合健康指標(biāo)提取過程與隨機(jī)退化建模過程的反饋閉環(huán),使得復(fù)合健康指標(biāo)提取與隨機(jī)退化建模交互聯(lián)動,這一思路與文獻(xiàn)[138-141]中退化特征提取與隨機(jī)退化建模過程孤立進(jìn)行的思路顯著不同.此外,需要說明的是,圖3 所示的數(shù)模聯(lián)動方案與第2 節(jié)討論的機(jī)理模型與數(shù)據(jù)混合驅(qū)動的方案最大的不同在于其中的退化模型的來源.機(jī)理模型與數(shù)據(jù)混合驅(qū)動方案中的模型為設(shè)備退化失效的機(jī)理模型,但如前所述這類模型的獲取往往是困難的,而且機(jī)理模型的種類相當(dāng)有限.相比之下,數(shù)模聯(lián)動方案中的模型指的是用于描述退化特征時變演化趨勢的隨機(jī)過程模型,在模型構(gòu)建及選擇時可以融入退化失效的機(jī)理知識但又不完全受機(jī)理知識匱乏的束縛,而且根據(jù)第4 節(jié)的介紹可以看出剩余壽命預(yù)測領(lǐng)域?qū)τ陔S機(jī)過程模型的研究高度重視,仍處于蓬勃發(fā)展階段,針對退化建模的各類隨機(jī)過程模型層出不窮,因此數(shù)模聯(lián)動方案應(yīng)用于剩余壽命預(yù)測時更具靈活性,有助推廣應(yīng)用于各類退化設(shè)備.
圖3 多源傳感器剩余壽命預(yù)測數(shù)模聯(lián)動解決方案與流程圖Fig.3 Idea and flowchart of data-model interactive remaining useful life prediction with multi-source sensors
下面針對多源傳感器監(jiān)測下隨機(jī)退化設(shè)備剩余壽命預(yù)測問題,根據(jù)上述數(shù)模聯(lián)動原理,給出具體實現(xiàn)過程的一個示例,以說明其可行性和有效性.
令xi,j(t) 為第i(1≤i ≤N)個隨機(jī)退化設(shè)備第j(1≤j ≤S) 個傳感器在t(t ≥0)時刻采集到的性能退化監(jiān)測數(shù)據(jù),N為需要監(jiān)測的隨機(jī)退化設(shè)備個數(shù),假設(shè)對于同一個隨機(jī)退化設(shè)備共安裝有S個傳感器.根據(jù)多源傳感器數(shù)據(jù),運(yùn)用加權(quán)方法,融合多傳感器監(jiān)測數(shù)據(jù)后的復(fù)合健康指標(biāo)表示為
其中,wj表示第j個傳感器的融合系數(shù),衡量了該傳感器在數(shù)據(jù)融合過程中所占比重.
假設(shè)第i(1≤i ≤N)個隨機(jī)退化設(shè)備對應(yīng)監(jiān)測時刻為ti={ti,0,ti,1,ti,2,···,ti,Ki},則復(fù)合健康指標(biāo)對應(yīng)的觀測數(shù)據(jù)為zi={zi,0,zi,1,zi,2,···,zi,Ki},其中,zi,k=Zi(ti,k),k=0,1,2,···,Ki,Ki為第i個隨機(jī)退化設(shè)備的監(jiān)測數(shù)據(jù)個數(shù).不失一般性,本文僅考慮隨機(jī)退化設(shè)備監(jiān)測時間間隔為等間隔的情況,即 Δt=ti,k-ti,k-1.
為說明數(shù)模聯(lián)動的思路,這里以具有增長趨勢的退化特征為例,考慮線性Wiener 過程建模復(fù)合健康指標(biāo)隨時間的演變過程,模型描述為
其中,zi,0為第i個設(shè)備在t0=0時刻的初始退化量,λi為漂移系數(shù),反映了第i個設(shè)備的退化率,σi為第i個設(shè)備的擴(kuò)散系數(shù),刻畫退化過程的隨機(jī)不確定性,B(t)為反映退化過程時變隨機(jī)性的標(biāo)準(zhǔn)Brownian 運(yùn)動.
基于以上建立的退化過程,通過首達(dá)時間的概念,設(shè)備的壽命可定義為
其中,v是融合多源傳感器的復(fù)合健康指標(biāo)對應(yīng)的失效閾值.
對于隨機(jī)退化過程(2)和首達(dá)時間壽命的定義(3),根據(jù)文獻(xiàn)[125]可知,壽命Yi服從逆高斯分布,其概率密度函數(shù)、數(shù)學(xué)期望和方差分別為
其中,
根據(jù)以上參數(shù)估計結(jié)果,第i(1≤i ≤N)個隨機(jī)退化設(shè)備壽命的預(yù)測值(點估計)可以表示為
其中,失效閾值v和融合系數(shù)wj仍然為待確定量,將由下述的數(shù)模聯(lián)動過程優(yōu)化得到.
多源傳感器數(shù)據(jù)融合后構(gòu)建的復(fù)合健康指標(biāo)不具備實際的物理意義,且其構(gòu)建過程和隨機(jī)過程建模及失效閾值的確定是孤立進(jìn)行的,相互之間未形成聯(lián)動、融合機(jī)制,這是目前基于多源傳感器數(shù)據(jù)剩余壽命預(yù)測需重點解決的關(guān)鍵問題.為解決這一難題,本文基于前面圖3 所示的數(shù)模聯(lián)動思路,構(gòu)建以最小化預(yù)測均方誤差為核心的優(yōu)化目標(biāo)函數(shù),對多源數(shù)據(jù)融合系數(shù)和隨機(jī)退化建模中的失效閾值進(jìn)行反向優(yōu)化調(diào)整,形成融合多源數(shù)據(jù)復(fù)合健康指標(biāo)構(gòu)建與隨機(jī)退化建模的反饋閉環(huán),達(dá)到復(fù)合健康指標(biāo)構(gòu)建與隨機(jī)退化過程模型自動匹配的目的.
對于式(11)的優(yōu)化求解問題,對應(yīng)地由式(10)給出的目標(biāo)函數(shù),現(xiàn)有較為成熟的各類優(yōu)化方法均可應(yīng)用.本文在案例驗證中將采用應(yīng)用較為廣泛、具有較強(qiáng)靈活性的擬牛頓法進(jìn)行多維搜索求解,具體通過MATLAB 中的 “fminunc”函數(shù)實現(xiàn).通過上述優(yōu)化求解過程,對多源數(shù)據(jù)融合系數(shù)和隨機(jī)退化建模中失效閾值進(jìn)行迭代優(yōu)化調(diào)整,實現(xiàn)退化特征提取與隨機(jī)退化建模的交互聯(lián)動、交叉融合,達(dá)到復(fù)合健康指標(biāo)構(gòu)建與隨機(jī)退化建模自動匹配的目的.基于以上數(shù)模聯(lián)動過程確定的復(fù)合健康指標(biāo)融合系數(shù)和失效閾值,可以根據(jù)實際服役設(shè)備多源傳感器監(jiān)測數(shù)據(jù),構(gòu)建其復(fù)合健康指標(biāo),然后采用隨機(jī)模型建模其演變過程,進(jìn)而實現(xiàn)服役設(shè)備的剩余壽命預(yù)測.
為驗證上述數(shù)模聯(lián)動融合多源傳感器數(shù)據(jù)進(jìn)行剩余壽命預(yù)測的思路,本文基于文獻(xiàn)[142]和文獻(xiàn)[143]提供的C-MAPSS 渦扇發(fā)動機(jī)退化數(shù)據(jù)集中的訓(xùn)練數(shù)據(jù)集train_FD001 通過數(shù)模聯(lián)動過程確定復(fù)合健康指標(biāo)融合系數(shù)和失效閾值,基于測試數(shù)據(jù)集test_FD001 驗證應(yīng)用于個體服役設(shè)備剩余壽命預(yù)測時的效果,其中訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集分別包括了100 個發(fā)動機(jī)的21 個傳感器監(jiān)測數(shù)據(jù),即N=100.
針對渦扇發(fā)動機(jī)退化數(shù)據(jù)集,可以發(fā)現(xiàn)部分傳感器的數(shù)據(jù)基本沒有變化,不具有時變的趨勢性特征,從數(shù)據(jù)趨勢建模的角度看這些傳感器數(shù)據(jù)的質(zhì)量難以滿足可預(yù)測性要求.因此,在進(jìn)行多源數(shù)據(jù)融合前一般先進(jìn)行傳感器的選擇.為此,本文選取衡量退化數(shù)據(jù)趨勢性的皮爾遜相關(guān)系數(shù)作為表征數(shù)據(jù)質(zhì)量的一個評價指標(biāo)進(jìn)行傳感器的篩選.具體地,令第i(1≤i ≤N) 個發(fā)動機(jī)對應(yīng)監(jiān)測時刻為ti={ti,0,ti,1,ti,2,···,ti,Ki},xi,j(t) 為第i(1≤i ≤N)個發(fā)動機(jī)的第j(1≤j ≤S) 個傳感器在t(t ≥0)時刻采集到的性能退化監(jiān)測數(shù)據(jù),Ki+1 為第i個發(fā)動機(jī)的監(jiān)測數(shù)據(jù)個數(shù),則第i個發(fā)動機(jī)的第j(1≤j ≤S)個傳感器監(jiān)測數(shù)據(jù)對應(yīng)的皮爾遜相關(guān)系數(shù)ri,j為
根據(jù)式(12),對train_FD001 數(shù)據(jù)集中每個發(fā)動機(jī)的各個傳感器數(shù)據(jù)對應(yīng)的皮爾遜相關(guān)系數(shù)ri,j進(jìn)行計算,然后取各個傳感器相關(guān)系數(shù)的平均值作為傳感器選擇的依據(jù).本文根據(jù)計算的皮爾遜相關(guān)系數(shù)ri,j,選擇一致性較好且平均值較大的 2,3,4,7,11,12,15,17,20,21號傳感器數(shù)據(jù),用于數(shù)模聯(lián)動的多源傳感數(shù)據(jù)融合復(fù)合健康指標(biāo)構(gòu)建,此時S=10.在此基礎(chǔ)上,本文對該訓(xùn)練集中100 臺發(fā)動機(jī)的以上10 個傳感器監(jiān)測數(shù)據(jù)做最大-最小歸一化處理和平滑去噪處理[144],然后應(yīng)用本文提出的數(shù)模聯(lián)動方法,通過MATLAB 中的 “fminunc” 函數(shù)求解式(11),可以得到融合系數(shù)為{W*}={-0.0204,0.3 0 3 6 4,0.4451,-0.2238,0.0910,-0.1339,0.1283,0.1126,-0.0201,-0.1522},失效閾值為v*=0.7648.根據(jù)以上融合系數(shù),可以利用train_FD001 數(shù)據(jù)集,融合該數(shù)據(jù)集中100 個發(fā)動機(jī)考慮 2,3,4,7,11,12,15,17,20,21 號傳感器數(shù)據(jù)的復(fù)合健康指標(biāo).然后,基于構(gòu)建的復(fù)合健康指標(biāo)和確定的失效閾值,利用如式(2)所示的線性Wiener 過程分別對測試數(shù)據(jù)集中100 個發(fā)動機(jī)的復(fù)合健康指標(biāo)建模并預(yù)測剩余壽命,由此實現(xiàn)數(shù)模聯(lián)動的融合多源傳感器剩余壽命預(yù)測.
為了說明本文提出的數(shù)模聯(lián)動方案實現(xiàn)復(fù)合健康指標(biāo)提取與隨機(jī)退化建模交互聯(lián)動后對于數(shù)據(jù)質(zhì)量的改善情況及應(yīng)用于剩余壽命預(yù)測時的效果,下面分兩個方面進(jìn)行性能的對比.
1)數(shù)模聯(lián)動后數(shù)據(jù)質(zhì)量改善效果
首先,基于皮爾遜相關(guān)系數(shù)對數(shù)模聯(lián)動優(yōu)化后構(gòu)建的復(fù)合健康指標(biāo)與單一傳感器指標(biāo)數(shù)據(jù)在趨勢性方面的效果進(jìn)行對比.表1 給出了train_FD001數(shù)據(jù)集中100 個發(fā)動機(jī)的 2,3,4,7,11,12,15,17,20,21 號傳感器數(shù)據(jù)的平均皮爾遜相關(guān)系數(shù)值和數(shù)模聯(lián)動構(gòu)建的復(fù)合健康指標(biāo)的平均皮爾遜相關(guān)系數(shù)值.
由表1 中結(jié)果可以看出,數(shù)模聯(lián)動融合多源傳感監(jiān)測得到的復(fù)合健康指標(biāo)的皮爾遜相關(guān)系數(shù)平均值超過0.9,明顯高于單一傳感器對應(yīng)的值,表明數(shù)模聯(lián)動構(gòu)建的復(fù)合健康指標(biāo)的時變趨勢性更好,在改善用于退化建模的復(fù)合健康指標(biāo)數(shù)據(jù)的質(zhì)量方面效果明顯.
表1 皮爾遜相關(guān)系數(shù)對比結(jié)果Table 1 Comparative results of Pearson correlation coefficients
進(jìn)一步,考慮到數(shù)據(jù)集中的發(fā)動機(jī)具有相同的型號且都是設(shè)定在相同的工作條件下,因此用于退化建模的健康指標(biāo)值在發(fā)動機(jī)失效時刻的分散程度應(yīng)當(dāng)盡可能小,以體現(xiàn)同類發(fā)動機(jī)在相同條件下質(zhì)量的一致性.例如,文獻(xiàn)[133,137]中通過使復(fù)合健康指標(biāo)在失效時刻取值的方差最小化來構(gòu)建復(fù)合健康指標(biāo).鑒于此,本文將通過數(shù)模聯(lián)動構(gòu)建的復(fù)合健康指標(biāo)在發(fā)動機(jī)失效時刻取值的方差與以上研究中的結(jié)果和單一傳感器對應(yīng)的結(jié)果進(jìn)行對比,具體結(jié)果如表2 所示.
表2 失效時刻健康指標(biāo)值的方差比較Table 2 Variance of health indices at failure time
根據(jù)表2 中的結(jié)果可知,本文數(shù)模聯(lián)動下構(gòu)建的復(fù)合健康指標(biāo)值在失效時刻對應(yīng)的方差值遠(yuǎn)小于單一傳感器和文獻(xiàn)[133,137]中構(gòu)建的復(fù)合健康指標(biāo)對應(yīng)的方差值.值得一提的是,本文的數(shù)模聯(lián)動方法是以壽命預(yù)測的均方誤差最小為目標(biāo)構(gòu)建復(fù)合健康指標(biāo)的,不同于已有文獻(xiàn)[133,137]中以復(fù)合健康指標(biāo)在失效時刻取值方差最小化的出發(fā)點,但通過表2 的結(jié)果表明本文方法在改善失效時刻發(fā)動機(jī)復(fù)合健康指標(biāo)數(shù)值的一致性方面也有較好的效果,這將為本文方法提升剩余壽命預(yù)測效果奠定基礎(chǔ).
2)數(shù)模聯(lián)動剩余壽命預(yù)測效果對比
本節(jié)將數(shù)模聯(lián)動方法在剩余壽命預(yù)測的效果與基于單一傳感器數(shù)據(jù)的方法及前面文獻(xiàn)綜述中涉及的方法進(jìn)行對比,以佐證基于多源監(jiān)測大數(shù)據(jù)進(jìn)行數(shù)模聯(lián)動剩余壽命預(yù)測的必要性和性能提升潛力.為此,本文采用針對該數(shù)據(jù)集的3 種剩余壽命預(yù)測領(lǐng)域常用的性能對比指標(biāo): 預(yù)測得分、準(zhǔn)確性及均方誤差,其定義分別如下:
a) 預(yù)測得分(Score)
該指標(biāo)值反映了剩余壽命預(yù)測誤差落在區(qū)間內(nèi)的百分比,反映了預(yù)測的準(zhǔn)確性,其值越大越好.
對于以上兩種評價指標(biāo),這里需要說明的是:在剩余壽命預(yù)測領(lǐng)域,C-MAPSS 航空發(fā)動機(jī)退化數(shù)據(jù)集已成為驗證剩余壽命預(yù)測方法的基準(zhǔn)數(shù)據(jù)集,而該數(shù)據(jù)集最早用于IEEE PHM 2008 挑戰(zhàn)賽,挑戰(zhàn)賽主辦方為了評價各類預(yù)測方法在該數(shù)據(jù)集上的表現(xiàn),給出了預(yù)測得分(13) 以及準(zhǔn)確性指標(biāo)(14)和(15).通過式(13)可以看出預(yù)測得分是非對稱的評價指標(biāo),且該指標(biāo)值越小越好.采用非對稱指標(biāo)的主要出發(fā)點在于: 考慮到提前預(yù)測(errori ≥0)產(chǎn)生的后果要小于滯后預(yù)測(errori <0)產(chǎn)生的后果,對于提前預(yù)測給予較小的懲罰而對于滯后預(yù)測給予更大的懲罰這是由于滯后的剩余壽命預(yù)測將使得設(shè)備運(yùn)行失效而未能提前維護(hù)的風(fēng)險更大,因此給予更大的指標(biāo)值以示懲罰.在該指標(biāo)中,-10 和13 這兩個數(shù)值就是用于反映這種非對稱性的,也是由IEEE PHM 2008 挑戰(zhàn)賽主辦方給出的.因此,預(yù)測誤差若能夠落在區(qū)間,則在一定程度上就能夠反映剩余壽命預(yù)測方法的準(zhǔn)確性,這也就是準(zhǔn)確性指標(biāo)是統(tǒng)計預(yù)測誤差落在區(qū)間內(nèi)的百分比的原因所在.在IEEE PHM 2008 挑戰(zhàn)賽后,預(yù)測得分和準(zhǔn)確性指標(biāo)被一直沿用于評價各種剩余壽命預(yù)測方法在C-MAPSS航空發(fā)動機(jī)退化數(shù)據(jù)集上的預(yù)測效果,-10 和13 這兩個數(shù)值也被領(lǐng)域內(nèi)廣泛采納.因此,本文為了和現(xiàn)有的各類方法進(jìn)行對比,也使用了這兩個指標(biāo).
c) 均方誤差(Mean squared error,MSE)
該指標(biāo)值反映了預(yù)測誤差平方的平均值,其值越小越好.
基于以上預(yù)測性能指標(biāo),本文將提出的數(shù)模聯(lián)動剩余壽命預(yù)測方法與基于單一傳感器數(shù)據(jù)的方法及前面文獻(xiàn)綜述中涉及的一些典型的基于機(jī)器學(xué)習(xí)的方法和混合方法進(jìn)行對比.具體地,用于對比的方法包括: 支持向量回歸方法[65]、基于案例的學(xué)習(xí)方法[71]、基于案例的推理方法[72]、多目標(biāo)深度置信網(wǎng)絡(luò)集成方法[86]、卷積神經(jīng)網(wǎng)絡(luò)[92]、循環(huán)神經(jīng)網(wǎng)絡(luò)[96]、限玻爾茲曼機(jī)+LSTM 網(wǎng)絡(luò)[104]、基于長短時網(wǎng)絡(luò)的編碼-解碼器[106]、循環(huán)神經(jīng)網(wǎng)絡(luò)+自編碼器[107]、基于多損失編碼器與卷積復(fù)合特征的兩階段深度學(xué)習(xí)方法[108]、深度置信網(wǎng)絡(luò)+后向傳播神經(jīng)網(wǎng)絡(luò)+改進(jìn)粒子濾波算法[140]、深度置信網(wǎng)絡(luò)+改進(jìn)粒子濾波算法[140]以及基于線性Wiener 過程隨機(jī)建模單一傳感器監(jiān)測數(shù)據(jù)的剩余壽命預(yù)測方法.表3 給出了各類方法在預(yù)測得分、準(zhǔn)確性、均方誤差等性能指標(biāo)上的對比結(jié)果.這里需要說明的是,為了更客觀地反映對比效果,表3 中采用了對比文獻(xiàn)中各類方法得到的預(yù)測得分、準(zhǔn)確性及均方誤差的最好效果(眾所周知,機(jī)器學(xué)習(xí)類方法的預(yù)測結(jié)果對模型參數(shù)的設(shè)置具有較大依賴),其中 “—”表示對比文獻(xiàn)中沒有計算并給出這一指標(biāo)值.
通過表3 中的結(jié)果可以發(fā)現(xiàn),相比各類基于機(jī)器學(xué)習(xí)的剩余壽命預(yù)測方法、機(jī)器學(xué)習(xí)與統(tǒng)計數(shù)據(jù)驅(qū)動相結(jié)合的剩余壽命預(yù)測方法、基于線性Wiener 過程隨機(jī)建模單一傳感器監(jiān)測數(shù)據(jù)的剩余壽命預(yù)測方法在該發(fā)動機(jī)數(shù)據(jù)集上的表現(xiàn),本文提出的數(shù)模聯(lián)動多源傳感監(jiān)測數(shù)據(jù)融合剩余壽命預(yù)測方法在預(yù)測得分、準(zhǔn)確性、均方誤差等性能指標(biāo)上均保持明顯的優(yōu)勢.以上驗證結(jié)果表明,構(gòu)建以最小化預(yù)測均方誤差為核心的優(yōu)化目標(biāo)函數(shù),對多源數(shù)據(jù)融合系數(shù)和隨機(jī)退化建模中的失效閾值進(jìn)行反向優(yōu)化調(diào)整,形成多源傳感數(shù)據(jù)復(fù)合健康指標(biāo)構(gòu)建與隨機(jī)退化建模的反饋閉環(huán),將很大程度上實現(xiàn)復(fù)合健康指標(biāo)構(gòu)建與隨機(jī)退化過程模型自動匹配的目標(biāo),進(jìn)而提升剩余壽命預(yù)測性能,有助于思路導(dǎo)向結(jié)果.此外,表3 的對比結(jié)果反映出通過數(shù)模聯(lián)動實現(xiàn)退化特征提取與隨機(jī)退化建模交互聯(lián)動的思路在應(yīng)用于剩余壽命預(yù)測時,預(yù)測性能好于典型的基于機(jī)器學(xué)習(xí)的方法,甚至也好于一些最新提出的基于深度學(xué)習(xí)的方法,進(jìn)而顯示出數(shù)模聯(lián)動思路在大數(shù)據(jù)背景下剩余壽命預(yù)測中具有很好的應(yīng)用潛力.這里需要說明的是,以上案例中所采用的隨機(jī)過程模型僅僅是最基本的線性Wiener 過程模型,從式(8)可以看出,由于該過程的獨立增量特性和馬氏性,漂移系數(shù)估計結(jié)果中僅僅利用了初始時刻和最后監(jiān)測時刻的數(shù)據(jù),忽視了中間演變過程的數(shù)據(jù),勢必會影響建模及預(yù)測性能.因此,采用更為先進(jìn)的模型參數(shù)估計方法(如Bayesian 方法、自適應(yīng)濾波方法等)將有望進(jìn)一步優(yōu)化數(shù)模聯(lián)動下剩余壽命預(yù)測的效果.此外,實現(xiàn)數(shù)模聯(lián)動的關(guān)鍵在于構(gòu)建反映預(yù)測性能的目標(biāo)函數(shù)J(W,v),然而以上案例中J(W,v)僅僅考慮了剩余壽命預(yù)測的點估計,未考慮反映預(yù)測不確定性的剩余壽命預(yù)測的方差,因此通過預(yù)測誤差和表征預(yù)測不確定性的量構(gòu)建以預(yù)測不確定性為核心的優(yōu)化目標(biāo)函數(shù)將是值得深入研究的問題.以上兩種思路將使得目標(biāo)函數(shù)J(W,v)的復(fù)雜性顯著增加,因此進(jìn)一步研究相應(yīng)的優(yōu)化求解技術(shù)也很有必要.
表3 剩余壽命預(yù)測性能比較Table 3 Comparative results in the performance of the remaining useful life prediction
綜上,數(shù)模聯(lián)動融合多源傳感器監(jiān)測數(shù)據(jù)的發(fā)動機(jī)剩余壽命預(yù)測應(yīng)用案例結(jié)果雖然初步驗證了本文提出的數(shù)模聯(lián)動思路的可行性和有效性,但發(fā)展先進(jìn)實用的數(shù)模聯(lián)動剩余壽命預(yù)測技術(shù),特別是如何將數(shù)模聯(lián)動的思路推廣用于解決大數(shù)據(jù)背景下隨機(jī)退化設(shè)備的剩余壽命預(yù)測問題,任重道遠(yuǎn).
大數(shù)據(jù)環(huán)境下隨機(jī)退化設(shè)備的剩余壽命智能預(yù)測是工程需求驅(qū)動的前沿研究方向,然而通過前面的文獻(xiàn)分析可以發(fā)現(xiàn)已有理論與方法在解決大數(shù)據(jù)下剩余壽命預(yù)測問題時捉襟見肘,主要表現(xiàn)為: 1)基于機(jī)器學(xué)習(xí)的剩余壽命預(yù)測在大數(shù)據(jù)深層次特征自動提取、復(fù)雜結(jié)構(gòu)數(shù)據(jù)擬合、非線性映射等方面具有強(qiáng)大處理能力,但用于剩余壽命預(yù)測時難以得到其概率分布并量化預(yù)測不確定性;2)統(tǒng)計數(shù)據(jù)驅(qū)動方法以概率統(tǒng)計理論為基礎(chǔ),在量化剩余壽命預(yù)測不確定性上具有天然的優(yōu)勢,但更多處理的是完整監(jiān)測數(shù)據(jù)且需要一定趨勢性的退化特征以實現(xiàn)參數(shù)化建模,在應(yīng)對多源信號差異大、采樣策略形式多、數(shù)據(jù)價值密度低、數(shù)據(jù)質(zhì)量參差不齊等特點的監(jiān)測大數(shù)據(jù),特別是 “碎片化、分段的、稀疏的”監(jiān)測大數(shù)據(jù)時明顯力不從心;3)機(jī)器學(xué)習(xí)方法與統(tǒng)計數(shù)據(jù)驅(qū)動方法相結(jié)合的剩余壽命預(yù)測研究既能處理大數(shù)據(jù)又能得到剩余壽命的概率分布,但兩者未能實現(xiàn)交互聯(lián)動、交叉融合、自動匹配,存在特征提取與隨機(jī)建模孤立進(jìn)行、退化特征失效閾值難確定、多維化深度特征下剩余壽命分布難求解等問題,與大數(shù)據(jù)下剩余壽命預(yù)測的需求還不相適應(yīng).
針對以上研究挑戰(zhàn),第6 節(jié)以多源傳感監(jiān)測大數(shù)據(jù)下剩余壽命預(yù)測問題為例,提出了一種數(shù)模聯(lián)動的完整監(jiān)測數(shù)據(jù)下隨機(jī)退化設(shè)備剩余壽命預(yù)測問題解決思路,并通過航空發(fā)動機(jī)多源監(jiān)測數(shù)據(jù)初步驗證了該思路的可行性和有效性.借鑒所提出的數(shù)模聯(lián)動思路,綜合考慮機(jī)器學(xué)習(xí)方法和統(tǒng)計數(shù)據(jù)驅(qū)動方法的優(yōu)勢,緊緊扭住剩余壽命預(yù)測不確定性量化問題,大數(shù)據(jù)背景下隨機(jī)退化設(shè)備的剩余壽命預(yù)測主要存在以下亟待解決的關(guān)鍵科學(xué)問題.
針對以深度學(xué)習(xí)為代表的機(jī)器學(xué)習(xí)方法在監(jiān)測大數(shù)據(jù)深層次特征自動提取、復(fù)雜結(jié)構(gòu)數(shù)據(jù)擬合、非線性映射等方面具有強(qiáng)大的處理能力但很難得到體現(xiàn)剩余壽命預(yù)測不確定性的概率分布,而統(tǒng)計數(shù)據(jù)驅(qū)動的方法針對完整監(jiān)測數(shù)據(jù)雖能得到剩余壽命的概率分布但對大數(shù)據(jù)處理能力非常有限的問題,可以借鑒第6 節(jié)針對多源傳感監(jiān)測數(shù)據(jù)提出的數(shù)模聯(lián)動思路,發(fā)展深度學(xué)習(xí)與隨機(jī)退化過程建模交互聯(lián)動的剩余壽命預(yù)測技術(shù),通過深度學(xué)習(xí)網(wǎng)絡(luò)提取大數(shù)據(jù)下設(shè)備退化特征,運(yùn)用隨機(jī)過程模型對其表征并預(yù)測壽命,構(gòu)建以最小化預(yù)測不確定性為核心的優(yōu)化目標(biāo)函數(shù),實現(xiàn)深度網(wǎng)絡(luò)特征提取與隨機(jī)退化建模的交互聯(lián)動、交叉融合,達(dá)到深度特征提取與隨機(jī)退化模型自動匹配、失效閾值優(yōu)化確定的目的.通過這一思路,使得深度退化特征的提取直接服務(wù)于隨機(jī)退化建模和剩余壽命預(yù)測,有助于保證思路導(dǎo)向最終的結(jié)果——提升剩余壽命預(yù)測性能.在此過程中,如何通過深度學(xué)習(xí)網(wǎng)絡(luò)從大數(shù)據(jù)中提取反映設(shè)備退化的復(fù)合特征指標(biāo)、如何構(gòu)建面向預(yù)測不確定性最小化的優(yōu)化目標(biāo)函數(shù)、如何利用目標(biāo)函數(shù)反向優(yōu)化調(diào)整網(wǎng)絡(luò)參數(shù)和模型參數(shù)形成復(fù)合特征指標(biāo)提取與隨機(jī)退化建模的反饋閉環(huán)等都是需要解決的關(guān)鍵問題.
在工程實際中,設(shè)備受運(yùn)行工況、環(huán)境、負(fù)載等復(fù)雜因素相互影響,表征設(shè)備健康狀態(tài)的性能退化特征往往并不唯一且相互關(guān)聯(lián).現(xiàn)有多變量下隨機(jī)退化設(shè)備剩余壽命預(yù)測問題的研究基本都是試圖通過轉(zhuǎn)換為單變量情況再來處理,未充分考慮多性能退化變量相互耦合、相互影響的問題.因此,在深度學(xué)習(xí)與隨機(jī)退化建模交互聯(lián)動思路啟發(fā)下,通過深度學(xué)習(xí)網(wǎng)絡(luò)提取大數(shù)據(jù)中多維度深層次退化特征,構(gòu)建多變量下的設(shè)備性能退化過程模型,研究多變量耦合下隨機(jī)模型參數(shù)估計及壽命分布求解問題,實現(xiàn)深度網(wǎng)絡(luò)特征提取與隨機(jī)退化建模的交互聯(lián)動,達(dá)到多維深度特征與隨機(jī)退化模型的自動匹配、失效閾值的優(yōu)化確定,對于大數(shù)據(jù)下復(fù)雜退化設(shè)備的剩余壽命預(yù)測具有重要意義.在此過程中,如何通過深度學(xué)習(xí)網(wǎng)絡(luò)從大數(shù)據(jù)中提取反映設(shè)備退化的多維度深層次退化特征、如何考慮多維特征耦合關(guān)系的前提下建模其演變趨勢、如何求解多變量耦合下設(shè)備的剩余壽命分布等問題極具挑戰(zhàn)性,有待深入系統(tǒng)的研究.
數(shù)據(jù)是開展數(shù)據(jù)驅(qū)動剩余壽命預(yù)測研究的基礎(chǔ),數(shù)據(jù)質(zhì)量很大程度決定了剩余壽命預(yù)測的準(zhǔn)確性和魯棒性.然而,隨機(jī)退化設(shè)備的監(jiān)測大數(shù)據(jù)往往呈現(xiàn)非理想的狀態(tài),具體表現(xiàn)為大而非平衡、局部缺失、不完備等特點,如圖2 所示的 “碎片化、分段的、稀疏的”非完整監(jiān)測大數(shù)據(jù).據(jù)統(tǒng)計公開發(fā)表的NASA 數(shù)據(jù)集中,正常工況的數(shù)據(jù)達(dá)95%,而異常極端環(huán)境數(shù)據(jù)只有5%[145],美國馬里蘭大學(xué)先進(jìn)壽命周期中心(Center for advanced life cycle engineering,CALCE)公布的數(shù)據(jù)集中的情況與此類似[146].可見,實際設(shè)備的非理想監(jiān)測大數(shù)據(jù)在工程中客觀存在,數(shù)據(jù)的非理想將導(dǎo)致基于這些數(shù)據(jù)建立的剩余壽命預(yù)測模型泛化能力不足,局限于某一特定條件.
針對非理想數(shù)據(jù)中的非平衡、局部缺失等數(shù)據(jù),如果能利用先進(jìn)的數(shù)據(jù)增強(qiáng)技術(shù)或能夠?qū)⑵渌r、環(huán)境下的數(shù)據(jù)遷移到待研究的問題中,將有望改善數(shù)據(jù)質(zhì)量從而提升剩余壽命預(yù)測的效果.例如,針對數(shù)據(jù)缺失問題,可以通過生成對抗網(wǎng)絡(luò)利用有限的數(shù)據(jù)訓(xùn)練生成網(wǎng)絡(luò)和判別網(wǎng)絡(luò)以增強(qiáng)與擴(kuò)充數(shù)據(jù).當(dāng)前生成對抗網(wǎng)絡(luò)在處理缺失數(shù)據(jù)的問題中應(yīng)用較多,但這些研究更多地追求生成的數(shù)據(jù)與真實數(shù)據(jù)之間的接近程度,如果能夠應(yīng)用前面提出的數(shù)模聯(lián)動的思想,在構(gòu)建生成對抗網(wǎng)絡(luò)目標(biāo)函數(shù)時考慮生成數(shù)據(jù)改善剩余壽命預(yù)測性能方面的效果,將數(shù)據(jù)擴(kuò)充后剩余壽命預(yù)測效果改善情況用于指導(dǎo)數(shù)據(jù)生成,有望為缺失數(shù)據(jù)下剩余壽命預(yù)測問題的研究打開新的思路;針對不同工況下非平衡數(shù)據(jù)的問題,遷移學(xué)習(xí)技術(shù)將是有效的解決途徑,通過挖掘源域和目標(biāo)域的數(shù)據(jù)共性,將不同工況下的數(shù)據(jù)可以轉(zhuǎn)換到特定工況下,以實現(xiàn)不同工況下非平衡數(shù)據(jù)的增強(qiáng)與擴(kuò)充.類似地,如果在數(shù)據(jù)遷移實現(xiàn)數(shù)據(jù)擴(kuò)充時能關(guān)注擴(kuò)充后的數(shù)據(jù)在剩余壽命預(yù)測應(yīng)用時的效果,將能夠更好地實現(xiàn)數(shù)據(jù)的擴(kuò)充直接服務(wù)于最終剩余壽命預(yù)測應(yīng)用的目標(biāo),避免兩者脫節(jié)導(dǎo)致數(shù)據(jù)與最終效果不匹配的問題.
此外,針對圖2 所示的具有數(shù)據(jù)價值密度低、數(shù)據(jù)質(zhì)量參差不齊等特點的 “碎片化、分段的、稀疏的” 非完備監(jiān)測大數(shù)據(jù),以深度學(xué)習(xí)為代表的新一代機(jī)器學(xué)習(xí)方法,在大數(shù)據(jù)深層次特征提取、復(fù)雜結(jié)構(gòu)數(shù)據(jù)擬合、非線性映射等方面具有強(qiáng)大的處理能力,為建立 “碎片化、分段的、稀疏的” 監(jiān)測大數(shù)據(jù)與剩余壽命之間的映射關(guān)系提供了新的可能,但在建立映射關(guān)系的同時如何量化預(yù)測不確定性仍是當(dāng)前面臨的主要挑戰(zhàn).為此,針對非完整監(jiān)測大數(shù)據(jù),可考慮直接通過深度學(xué)習(xí)網(wǎng)絡(luò)建立 “碎片化、分段的、稀疏的” 非完整監(jiān)測大數(shù)據(jù)與包含壽命信息的標(biāo)簽信息及其預(yù)測不確定性的映射機(jī)制,在網(wǎng)絡(luò)構(gòu)建過程中將網(wǎng)絡(luò)參數(shù)隨機(jī)化,表示為隨機(jī)變量,由此構(gòu)建概率深度網(wǎng)絡(luò),網(wǎng)路結(jié)構(gòu)形式可以是卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)、LSTM 等,然后運(yùn)用Bayesian 方法估計網(wǎng)絡(luò)參數(shù)的后驗分布,使得網(wǎng)絡(luò)輸出具有隨機(jī)性以達(dá)到獲取概率分布的目標(biāo).最近,一些學(xué)者開始了這方面的有益嘗試[147-148],但這些僅有的研究中需要充分的壽命數(shù)據(jù)作為標(biāo)簽數(shù)據(jù),在實際工程中當(dāng)面對截尾數(shù)據(jù)時,由于缺乏壽命信息,這類方法的適用性受到一定限制.因此,如何在壽命標(biāo)簽信息匱乏條件下,通過概率深度網(wǎng)絡(luò)擬合監(jiān)測數(shù)據(jù)趨勢并滾動預(yù)測,由此發(fā)展面向非完整監(jiān)測大數(shù)據(jù)的剩余壽命預(yù)測方法仍有待突破.此外,在概率深度網(wǎng)絡(luò)中,由于參數(shù)的隨機(jī)變量化處理,導(dǎo)致網(wǎng)絡(luò)參數(shù)的Bayesian 估計涉及高維積分的求解問題,直接求解難度很大.因此,發(fā)展面向概率深度網(wǎng)絡(luò)參數(shù)Bayesian 估計的高效近似求解技術(shù),對于攻克非完整監(jiān)測大數(shù)據(jù)下剩余壽命預(yù)測難題具有重要意義,值得深入研究.
綜上,非理想數(shù)據(jù)的問題在大數(shù)據(jù)下隨機(jī)退化設(shè)備剩余壽命預(yù)測研究中普遍存在,本文針對幾類典型的非理想數(shù)據(jù),探討了可能的研究思路,但需要說明的是,剩余壽命預(yù)測領(lǐng)域?qū)@一問題的關(guān)注程度還不夠,目前針對性的處理方法還比較有限.可以預(yù)見的是,隨著大數(shù)據(jù)下隨機(jī)退化設(shè)備剩余壽命預(yù)測迫切需求的驅(qū)動和相關(guān)研究的深入,非理想大數(shù)據(jù)下的剩余壽命預(yù)測問題將逐漸成為新的研究熱點.
本文面向大數(shù)據(jù)背景下隨機(jī)退化設(shè)備剩余壽命預(yù)測的現(xiàn)實需求,深入分析了機(jī)理模型與數(shù)據(jù)混合驅(qū)動的剩余壽命預(yù)測技術(shù)、基于機(jī)器學(xué)習(xí)的剩余壽命預(yù)測技術(shù)、統(tǒng)計數(shù)據(jù)驅(qū)動的剩余壽命預(yù)測技術(shù)以及機(jī)器學(xué)習(xí)和統(tǒng)計數(shù)據(jù)驅(qū)動相結(jié)合的剩余壽命預(yù)測技術(shù)的基本研究思想和發(fā)展動態(tài).在此基礎(chǔ)上,結(jié)合隨機(jī)退化設(shè)備監(jiān)測大數(shù)據(jù)的特點以及剩余壽命預(yù)測不確定性量化問題,全面剖析了當(dāng)前研究存在的局限性和共性難題.針對這些問題,本文以多源傳感監(jiān)測大數(shù)據(jù)下剩余壽命預(yù)測問題為例,提出了一種大數(shù)據(jù)下數(shù)模聯(lián)動的隨機(jī)退化設(shè)備剩余壽命預(yù)測問題解決思路,通過構(gòu)建以最小化壽命預(yù)測均方誤差為核心的優(yōu)化目標(biāo)函數(shù),對多源數(shù)據(jù)融合系數(shù)和隨機(jī)退化建模中的失效閾值進(jìn)行反向優(yōu)化調(diào)整,達(dá)到復(fù)合健康指標(biāo)構(gòu)建與隨機(jī)退化過程模型自動匹配的目的,并通過航空發(fā)動機(jī)多源監(jiān)測數(shù)據(jù)初步驗證了該思路的可行性和有效性.最后,借鑒數(shù)模聯(lián)動思路,本文提出了大數(shù)據(jù)背景下深度學(xué)習(xí)與隨機(jī)退化建模交互聯(lián)動、監(jiān)測大數(shù)據(jù)與剩余壽命及其預(yù)測不確定性映射機(jī)制、非理想大數(shù)據(jù)下的剩余壽命預(yù)測等亟待解決的關(guān)鍵科學(xué)問題,并探討了解決思路.