張明宇, 王琦,2, 于洋
(1.沈陽工業(yè)大學(xué) 信息科學(xué)與工程學(xué)院,遼寧 沈陽 110870; 2.遼寧工業(yè)大學(xué),遼寧 錦州 121001)
電子器件在貯存、運(yùn)輸和使用過程中會(huì)受到熱應(yīng)力、電應(yīng)力、環(huán)境輻射、機(jī)械振動(dòng)等各種環(huán)境應(yīng)力的影響,當(dāng)這些應(yīng)力條件超過最大額定值時(shí),將對(duì)其造成損傷。電子器件由應(yīng)力積累損傷所造成的永久性故障在形式上多表現(xiàn)為突發(fā)性、隨機(jī)性,發(fā)生前無明顯的外在征兆,給電子器件的狀態(tài)預(yù)測(cè)與性能評(píng)估帶來困難。近年來,通過深入機(jī)理分析與大量試驗(yàn)研究,學(xué)術(shù)界對(duì)電子器件耗損規(guī)律有了初步認(rèn)識(shí):雖然電子器件故障的產(chǎn)生具有突發(fā)性,但超過負(fù)載的環(huán)境應(yīng)力會(huì)造成器件參數(shù)超過正常容差范圍,導(dǎo)致產(chǎn)品狀態(tài)退化,退化程度和退化速度與器件暴露在環(huán)境應(yīng)力中的面積、持續(xù)時(shí)間有關(guān)[1],從而為電子器件故障預(yù)測(cè)和健康管理(PHM)提供了理論依據(jù)。
PHM是一種預(yù)測(cè)性維修策略,是視情維修的支撐技術(shù)。目前,PHM技術(shù)在機(jī)械領(lǐng)域已得到廣泛應(yīng)用,電子設(shè)備的PHM技術(shù)仍集中在總體架構(gòu)方面,維修決策管理的研究比較少,未能取得應(yīng)用于工程實(shí)際的實(shí)質(zhì)性突破。美國(guó)、英國(guó)相關(guān)研究起步較早、基礎(chǔ)較好,已形成比較成熟的體系架構(gòu)。我國(guó)電子設(shè)備PHM技術(shù)還處于原理概念的方法論階段,以跟蹤國(guó)外研究、借鑒機(jī)械類研究為主。
PHM技術(shù)的基礎(chǔ)和關(guān)鍵是故障預(yù)測(cè),但由于電子器件易受多種環(huán)境應(yīng)力影響,器件結(jié)構(gòu)復(fù)雜,構(gòu)建一個(gè)確定的故障物理模型較難,目前PHM技術(shù)中常用的故障預(yù)測(cè)方法為數(shù)據(jù)驅(qū)動(dòng)法,即通過大量歷史數(shù)據(jù)挖掘電子器件狀態(tài)與環(huán)境應(yīng)力間的潛在聯(lián)系。數(shù)據(jù)驅(qū)動(dòng)法又可分為機(jī)器學(xué)習(xí)法和統(tǒng)計(jì)數(shù)據(jù)法?;跈C(jī)器學(xué)習(xí)的數(shù)據(jù)驅(qū)動(dòng)法包括最近鄰算法、神經(jīng)網(wǎng)絡(luò)法、支持向量機(jī)方法等?;诮y(tǒng)計(jì)數(shù)據(jù)的數(shù)據(jù)驅(qū)動(dòng)法包括回歸模型法、馬爾可夫法、主成分分析方法等。美國(guó)馬里蘭大學(xué)Dorj等[2]采用隱式馬爾可夫模型研究絕緣柵雙極型晶體管(IGBT)的故障預(yù)測(cè)與健康管理。Kunche等[3]采用濾波算法,以常見濾波器電路作為研究對(duì)象,監(jiān)測(cè)電路中元器件如電阻、電容取值的變化,研究電路級(jí)的故障預(yù)測(cè)與健康管理。美國(guó)宇航局(NASA)的Saha等[4]通過采用粒子濾波器算法處理實(shí)驗(yàn)數(shù)據(jù),研究單個(gè)IGBT的故障預(yù)測(cè)與健康管理。我國(guó)電子領(lǐng)域的PHM技術(shù)研究主體以高校和科研院所為主,研究方法也以數(shù)據(jù)驅(qū)動(dòng)法居多。北京航空航天大學(xué)于格等[5]、查國(guó)清等[6-7]、蔣旭等[8]提出基于故障行為模型的電子產(chǎn)品壽命分析方法,通過加速試驗(yàn)獲取電子產(chǎn)品失效機(jī)理,完成電子產(chǎn)品健康狀態(tài)評(píng)估。電子科技大學(xué)龍兵等提出了最小二乘支持向量機(jī)模型[9]、加權(quán)隱馬爾可夫的自回歸狀態(tài)預(yù)測(cè)模型[10]、貝葉斯網(wǎng)絡(luò)的故障預(yù)測(cè)模型[11]以及最小二乘支持向量機(jī)-隱馬爾可夫模型[12],用于研究電路的故障預(yù)測(cè)與健康管理、模擬電路的剩余壽命[13]。國(guó)防科學(xué)技術(shù)大學(xué)呂克洪等[14-17]對(duì)電子器件故障預(yù)測(cè)和健康管理技術(shù)發(fā)展動(dòng)態(tài)進(jìn)行闡述,分析損傷與時(shí)間應(yīng)力的關(guān)系,提出了基于優(yōu)化自回歸模型的電子器件壽命預(yù)測(cè)方法。此外,席霄鵬等[18]基于維納過程建立系統(tǒng)性能狀態(tài)空間模型,描述了測(cè)量信息與真實(shí)退化之間的關(guān)系。張朝龍等[19]應(yīng)用加權(quán)貝葉斯模型對(duì)電力變壓器進(jìn)行了故障診斷。樊浩等[20]將主成分分析法與支持向量機(jī)法相結(jié)合,研究了斷路器的故障診斷。
現(xiàn)有研究建立數(shù)據(jù)驅(qū)動(dòng)模型時(shí),大多只考慮應(yīng)力等級(jí)對(duì)研究對(duì)象的影響,忽略了應(yīng)力累計(jì)時(shí)間對(duì)研究對(duì)象的作用。本文以電子器件中的半導(dǎo)體器件為研究對(duì)象,綜合考慮應(yīng)力等級(jí)和應(yīng)力累計(jì)作用時(shí)間對(duì)研究對(duì)象造成的積累損傷,基于長(zhǎng)短時(shí)記憶(LSTM)算法,充分挖掘研究對(duì)象在不同應(yīng)力等級(jí)和應(yīng)力時(shí)長(zhǎng)作用下數(shù)據(jù)特征與影響因素的潛在關(guān)系,研究半導(dǎo)體器件狀態(tài)隨熱應(yīng)力和應(yīng)力累計(jì)時(shí)長(zhǎng)的變化趨勢(shì),預(yù)測(cè)故障時(shí)間,以避免對(duì)失效機(jī)理的過度依賴。
隨著現(xiàn)代半導(dǎo)體設(shè)計(jì)、制造工藝和控制過程技術(shù)的發(fā)展,半導(dǎo)體器件因工藝造成的早期失效率和偶然失效率已接近于0.時(shí)間和環(huán)境應(yīng)力成為引起半導(dǎo)體器件故障的主要外因。
熱應(yīng)力是半導(dǎo)體器件使用過程中常見的環(huán)境應(yīng)力。熱應(yīng)力引起半導(dǎo)體器件故障的失效機(jī)理,常見的有熱載流子注入效應(yīng)、電遷移效應(yīng)、時(shí)間相關(guān)的電介質(zhì)擊穿效應(yīng)和因熱膨脹系數(shù)不匹配引起的器件結(jié)構(gòu)變化。下面簡(jiǎn)要介紹熱應(yīng)力下半導(dǎo)體器件的失效機(jī)理:
1)熱載流子注入效應(yīng)由熱載流子(電子和空穴)注入柵氧化層引起。熱載流子比熱平衡狀態(tài)下的載流子具有更高的動(dòng)能,由于載流子具有很高的能量,可在硅-二氧化硅界面處和柵氧化層中產(chǎn)生大量缺陷,從而導(dǎo)致器件退化乃至失效。
2)電遷移效應(yīng)是在高電流密度作用下,由金屬中的原子遷移所致。電遷移會(huì)引起金屬互連線短路或開路失效,進(jìn)而影響半導(dǎo)體器件的壽命。
3)時(shí)間相關(guān)的電介質(zhì)擊穿效應(yīng)也受熱應(yīng)力的影響。溫度的升高會(huì)導(dǎo)致柵氧化層薄膜中的共價(jià)鍵更易斷裂,電子破壞作用更明顯,擊穿所需時(shí)間縮短,所需擊穿電量減少。
4)半導(dǎo)體器件管芯、基板、管殼等部位的材料熱膨脹系數(shù)不同,當(dāng)溫度快速變化時(shí)材料將產(chǎn)生熱膨脹和收縮,不同材質(zhì)交界面處將產(chǎn)生機(jī)械應(yīng)力,最終形成空洞、裂紋,進(jìn)而影響器件的性能。熱膨脹系數(shù)的不同,還會(huì)使芯片和基板之間的粘接層產(chǎn)生疲勞失效,造成電子器件熱性能變差、內(nèi)部粘接不牢、芯片翹起、熱阻增大和功率循環(huán)性能變差。
上述失效機(jī)理在初始狀態(tài)下并不會(huì)影響半導(dǎo)體器件的正常工作,但隨著使用時(shí)間和使用頻率的增加,器件暴露在熱應(yīng)力中的時(shí)間越來越長(zhǎng),器件性能會(huì)逐漸退化。熱應(yīng)力對(duì)半導(dǎo)體器件性能的影響主要體現(xiàn)在閾值電壓、遷移率、漏極電流、延時(shí)時(shí)間、跨導(dǎo)、漏-源導(dǎo)通電阻RDS(on)和邏輯電平等參數(shù)上[21]。
由于半導(dǎo)體器件在正常應(yīng)力水平下壽命可達(dá)幾十萬甚至上百萬小時(shí),在預(yù)測(cè)半導(dǎo)體器件故障及可靠性問題時(shí)常采用加速老化實(shí)驗(yàn)。此次樣本數(shù)據(jù)采自美國(guó)宇航局艾姆斯研究中心提供的金屬-氧化物半導(dǎo)體場(chǎng)效應(yīng)晶體管熱過應(yīng)力老化數(shù)據(jù)集。在加速老化實(shí)驗(yàn)中,溫度由常溫逐漸上升到預(yù)設(shè)溫度,實(shí)驗(yàn)為不同老化溫度和實(shí)驗(yàn)時(shí)長(zhǎng)的組合,加速老化實(shí)驗(yàn)預(yù)設(shè)溫度及預(yù)設(shè)溫度下的實(shí)驗(yàn)時(shí)長(zhǎng)如表1所示。實(shí)驗(yàn)所用半導(dǎo)體器件為IRF520NPbF,數(shù)據(jù)集中包括柵-源電壓、漏-源電壓、漏電流和殼溫等參數(shù)的監(jiān)測(cè)數(shù)據(jù)。
表1 加速老化實(shí)驗(yàn)條件
以數(shù)據(jù)集中12號(hào)器件為例,通過(1)式計(jì)算RDS(on),分析熱應(yīng)力和應(yīng)力累計(jì)時(shí)長(zhǎng)對(duì)半導(dǎo)體器件狀態(tài)的影響。
(1)
式中:VDS為漏-源電壓;ID為漏極電流。RDS(on)隨熱應(yīng)力等級(jí)和熱應(yīng)力作用時(shí)間的變化趨勢(shì)如圖1、圖2所示。從圖1中可以看出,前4次實(shí)驗(yàn)中,相同的老化時(shí)長(zhǎng)內(nèi),RDS(on)參數(shù)主要受溫度變化的影響,隨溫度的下降而降低。圖2顯示,第5次實(shí)驗(yàn)中,在殼溫低于第4次實(shí)驗(yàn)的情況下,器件RDS(on)參數(shù)值反而要遠(yuǎn)大于第4次實(shí)驗(yàn)值,此時(shí)應(yīng)力累計(jì)時(shí)長(zhǎng)為影響RDS(on)參數(shù)的主要因素。由上述分析可知,RDS(on)參數(shù)的變化不僅與熱應(yīng)力等級(jí)有關(guān),還受實(shí)驗(yàn)累計(jì)時(shí)長(zhǎng)的影響。
圖1 前4次實(shí)驗(yàn)RDS(on)變化趨勢(shì)圖
圖2 第4次實(shí)驗(yàn)與第5次實(shí)驗(yàn)RDS(on)變化趨勢(shì)圖
綜合上述分析可知,研究半導(dǎo)體器件性能的變化,僅考慮熱應(yīng)力等級(jí)的影響是不充分的,還應(yīng)考慮熱應(yīng)力累計(jì)時(shí)間。本文考慮的半導(dǎo)體失效因素如圖3所示:RDS(on)在熱應(yīng)力等級(jí)和熱應(yīng)力累計(jì)時(shí)間的共同作用下發(fā)生變化,進(jìn)而引發(fā)產(chǎn)品失效。
圖3 熱應(yīng)力下半導(dǎo)體器件失效原理圖
傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)通過隱狀態(tài)存儲(chǔ)歷史信息,但隱狀態(tài)每個(gè)時(shí)刻都會(huì)被重寫,因此是一種短期記憶。當(dāng)輸入序列很長(zhǎng)時(shí),RNN還會(huì)出現(xiàn)梯度爆炸和梯度消失問題。
LSTM是應(yīng)用在深度學(xué)習(xí)領(lǐng)域的特殊循環(huán)神經(jīng)網(wǎng)絡(luò),是對(duì)RNN模型的改良,能夠建立較長(zhǎng)距離的時(shí)序依賴關(guān)系并有效解決RNN梯度爆炸和梯度消失問題,由Hochreiter與Schmidhuber于1997年提出[22]。
圖4 LSTM循環(huán)結(jié)構(gòu)單元
設(shè)Wxf、Wxi、Wxo、Wxc分別表示xt與遺忘門、輸入門、輸出門、記憶單元間的權(quán)值,Whf、Whi、Who、Whc分別表示隱藏層與遺忘門、輸入門、輸出門、記憶單元間的權(quán)值,bf、bi、bo表示偏置,⊙表示向量元素乘積。LSTM循環(huán)結(jié)構(gòu)單元通過控制遺忘門、輸入門和輸出門的開關(guān)程度,控制信息的流動(dòng),具體過程如步驟1~步驟6所示。
步驟1遺忘門ft以當(dāng)前層的輸入xt、上一時(shí)刻隱藏層的輸出ht-1作為輸入,遺忘門的輸出結(jié)果與ct-1相乘,控制上一個(gè)時(shí)刻的內(nèi)部狀態(tài)ct-1需要遺忘多少信息,其表達(dá)式見(2)式:
ft=σ(Wxfxt+Whfht-1+bf).
(2)
步驟2輸入門選擇性地保留當(dāng)前輸入信息,輸出結(jié)果it作為將要更新的信息,表達(dá)式如(3)式:
it=σ(Wxixt+Whiht-1+bi).
(3)
步驟3輸出門ot控制當(dāng)前時(shí)刻的內(nèi)部狀態(tài)ct有多少信息需要輸出給外部狀態(tài)ht,表達(dá)式見(4)式:
ot=σ(Wxoxt+Whoht-1+bo).
(4)
步驟4輸出門ot與經(jīng)過tanh層處理后的記憶單元狀態(tài)相乘,得到隱藏層的輸出ht,見(5)式:
ht=ottanh ⊙(ct).
(5)
步驟5記憶單元ct記錄了到當(dāng)前時(shí)刻為止的歷史信息,可由(6)式計(jì)算得出:
(6)
(7)
輸出樣本R可表示為
考慮到實(shí)際采集環(huán)境中存在的干擾因素會(huì)影響數(shù)據(jù)的真實(shí)性,采用加權(quán)滑動(dòng)平均濾波法濾除樣本中的高低頻噪音。其基本思想是根據(jù)窗口內(nèi)各項(xiàng)數(shù)據(jù)的重要性,對(duì)近期數(shù)據(jù)賦予較大的權(quán)重[24],如(8)式所示:
(8)
wd=N+1-d.
(9)
實(shí)驗(yàn)中的控制信號(hào)頻率為1 kHz,占空比為40%,5次實(shí)驗(yàn)采集的數(shù)據(jù)量巨大。作為深度學(xué)習(xí)網(wǎng)絡(luò),雖然LSTM算法支持面向底層原始數(shù)據(jù)直接訓(xùn)練,但此舉會(huì)造成不必要的重復(fù)訓(xùn)練,引發(fā)模型收斂困難、預(yù)測(cè)時(shí)間過長(zhǎng)等問題。結(jié)合實(shí)際情況,經(jīng)綜合考慮,選用1階預(yù)測(cè)器數(shù)據(jù)壓縮算法剔除重復(fù)、冗余數(shù)據(jù)。具體操作如(10)式~(12)式所示:
Δx(t2)=x(t2)-x(t1),
(10)
式中:t1、t2表示相鄰時(shí)刻;x(t1)、x(t2)為t1、t2時(shí)刻對(duì)應(yīng)的兩個(gè)數(shù)據(jù)點(diǎn)。利用x(t1)和x(t2)定義1條直線,如(11)式和(12)式所示:
(t3)=x(t2)+Δx(t2),
(11)
(12)
設(shè)置一個(gè)可變閾值,如果t3時(shí)刻采樣點(diǎn)在閾值范圍內(nèi)則去除,反之留用。圖5、圖6分別為原始數(shù)據(jù)和壓縮處理后的數(shù)據(jù)。對(duì)比圖5和圖6可以看出,壓縮后的數(shù)據(jù)在數(shù)據(jù)量減少的同時(shí),較好地保留了原始數(shù)據(jù)的變化趨勢(shì)。
圖5 原始數(shù)據(jù)
圖6 壓縮后的數(shù)據(jù)
由于作為樣本的多源數(shù)據(jù)量綱不同,為避免量綱對(duì)模型訓(xùn)練結(jié)果的干擾并加快模型收斂,對(duì)樣本進(jìn)行歸一化處理后再進(jìn)行模型訓(xùn)練。歸一化公式如(13)式所示:
=(x-xmin)/(xmax-xmin),
(13)
模型初始參數(shù)在均值為0、方差為2/(a+b)的均勻分布中抽取,其中a為模型輸入數(shù)量,b為模型輸出數(shù)量。模型訓(xùn)練時(shí),采用Adam算法[25]優(yōu)化LSTM模型權(quán)重參數(shù),具體步驟如下:
步驟1劃分訓(xùn)練樣本集與測(cè)試樣本集。
步驟2設(shè)置LSTM模型初始化參數(shù)、學(xué)習(xí)率。
步驟3沒有達(dá)到停止準(zhǔn)則前循環(huán)執(zhí)行第1步~第6步:
1)m個(gè)樣本批量輸入LSTM模型中,y為樣本對(duì)應(yīng)的目標(biāo)輸出,進(jìn)行前向傳播計(jì)算;
2)進(jìn)行反向傳播計(jì)算,計(jì)算梯度:
3)t←t+1;
4)計(jì)算有偏1階矩估計(jì):
s←ρ1s+(1-ρ1)g;
計(jì)算有偏2階矩估計(jì):
r=ρ2r+(1-ρ2)g⊙g;
5)計(jì)算1階矩的偏差:
計(jì)算2階矩的偏差:
6)進(jìn)行權(quán)重參數(shù)更新:
如果達(dá)到停止準(zhǔn)則,則停止執(zhí)行,否則返回第1步。
步驟3中:g為梯度;L(·)為損失函數(shù);θ為初始參數(shù);x(i)為數(shù)據(jù)集的第i個(gè)樣本輸入,y(i)為對(duì)應(yīng)目標(biāo);ρ1、ρ2為矩估計(jì)的指數(shù)衰減率;s為1階矩變量;r為2階矩變量;ε為步長(zhǎng);δ為分母偏移量。
為了檢驗(yàn)本文所提基于LSTM算法的熱應(yīng)力下半導(dǎo)體器件故障預(yù)測(cè)模型,用金屬-氧化物半導(dǎo)體場(chǎng)效應(yīng)晶體管熱過應(yīng)力老化數(shù)據(jù)集的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行驗(yàn)證。選取8號(hào)、9號(hào)、11號(hào)和14號(hào)IRF520NPbF的實(shí)驗(yàn)數(shù)據(jù)作為訓(xùn)練集進(jìn)行訓(xùn)練,12號(hào)IRF520NPbF的實(shí)驗(yàn)數(shù)據(jù)作為測(cè)試集進(jìn)行預(yù)測(cè)驗(yàn)證,訓(xùn)練集和測(cè)試集的劃分如表2所示。
監(jiān)測(cè)的原始序列數(shù)據(jù)包含噪音,首先用加權(quán)滑動(dòng)平均濾波法進(jìn)行平滑處理。由于實(shí)驗(yàn)是對(duì)器件的全壽命周期進(jìn)行不間斷監(jiān)測(cè),數(shù)據(jù)量巨大,為了在海量時(shí)域監(jiān)測(cè)信號(hào)中提取狀態(tài)變化趨勢(shì),也為了加快模型收斂速度,對(duì)濾波后序列數(shù)據(jù)進(jìn)行壓縮處理以剔除冗余數(shù)據(jù),壓縮后的數(shù)據(jù)量如表2所示。為消除因多源數(shù)據(jù)量綱不統(tǒng)一對(duì)模型預(yù)測(cè)結(jié)果造成的影響,進(jìn)行壓縮后的數(shù)據(jù)歸一化處理,將數(shù)據(jù)大小限定在[0,1]范圍內(nèi)。
訓(xùn)練集和測(cè)試集經(jīng)預(yù)處理后,結(jié)合1.2節(jié)的實(shí)驗(yàn)條件訓(xùn)練故障預(yù)測(cè)模型,以探究熱應(yīng)力等級(jí)和應(yīng)力累計(jì)時(shí)長(zhǎng)對(duì)半導(dǎo)體器件的影響情況。在此階段,將訓(xùn)練集中的殼溫及應(yīng)力累計(jì)時(shí)長(zhǎng)輸入LSTM網(wǎng)絡(luò)模型中,以真實(shí)RDS(on)值作為模型輸出,訓(xùn)練熱應(yīng)力下半導(dǎo)體器件LSTM故障預(yù)測(cè)模型。從表2中可觀察到,壓縮后的全壽命序列數(shù)據(jù)量依然很大,而LSTM獨(dú)特的門控機(jī)制與引入的記憶單元,使之處理這類較長(zhǎng)的輸入序列時(shí),也可以學(xué)習(xí)當(dāng)前時(shí)刻為止的所有歷史信息,建模這種長(zhǎng)距離的依賴關(guān)系。模型采用堆疊結(jié)構(gòu),初始學(xué)習(xí)率設(shè)為0.01,選用Adam方法優(yōu)化權(quán)重參數(shù)。經(jīng)實(shí)驗(yàn),迭代次數(shù)設(shè)為1 500,dropout值設(shè)置為0.5.模型使用半均方誤差作為損失函數(shù),其表達(dá)式如(14)式所示:
表2 實(shí)驗(yàn)數(shù)據(jù)
(14)
式中:S為樣本個(gè)數(shù);Q為樣本中真實(shí)值的數(shù)量;Tij為模型預(yù)測(cè)值;Yij為樣本真實(shí)值,即模型目標(biāo)值;5次實(shí)驗(yàn)的損失函數(shù)曲線如圖7所示。為更明顯地顯示損失函數(shù)曲線的變化趨勢(shì)、清晰地反映曲線細(xì)節(jié),圖7中的損失函數(shù)值為對(duì)數(shù)值。從圖7中可以看出:5次實(shí)驗(yàn)的模型損失函數(shù)經(jīng)1 500次迭代后,均已收斂;收斂后損失函數(shù)的對(duì)數(shù)值集中在[-2.9,-2.7]范圍內(nèi),對(duì)應(yīng)著損失函數(shù)值范圍為[0.001,0.002]。
圖7 LSTM模型損失函數(shù)曲線圖
圖8~圖12分別為表1中5次實(shí)驗(yàn)的模型輸出結(jié)果。從5次實(shí)驗(yàn)的加速老化時(shí)長(zhǎng),可推算出5次實(shí)驗(yàn)的加速老化累計(jì)時(shí)間為35 min、70 min、105 min、140 min和320 min.從圖8~圖12中可以看出,模型預(yù)測(cè)值曲線和目標(biāo)值曲線具有很好的吻合度。
圖8 第1次加速老化實(shí)驗(yàn)預(yù)測(cè)結(jié)果(預(yù)設(shè)溫度250 ℃,老化時(shí)長(zhǎng)35 min)
圖9 第2次加速老化實(shí)驗(yàn)預(yù)測(cè)結(jié)果(預(yù)設(shè)溫度240 ℃,老化時(shí)長(zhǎng)35 min)
圖10 第3次加速老化實(shí)驗(yàn)預(yù)測(cè)結(jié)果(預(yù)設(shè)溫度230 ℃,老化時(shí)長(zhǎng)35 min)
圖11 第4次加速老化實(shí)驗(yàn)預(yù)測(cè)結(jié)果(預(yù)設(shè)溫度220 ℃,老化時(shí)長(zhǎng)35 min)
圖12 第5次加速老化實(shí)驗(yàn)預(yù)測(cè)結(jié)果(預(yù)設(shè)溫度210 ℃,老化時(shí)長(zhǎng)180 min)
對(duì)比觀察圖8~圖12的模型輸出曲線可以發(fā)現(xiàn),相對(duì)于前4次實(shí)驗(yàn)RDS(on)的緩慢增長(zhǎng),第5次實(shí)驗(yàn)RDS(on)的增長(zhǎng)開始加快,在210 min左右RDS(on)開始激增,而模型輸出曲線也很好地反映了這一變化趨勢(shì)。在殼溫穩(wěn)定在實(shí)驗(yàn)預(yù)設(shè)溫度后,選取RDS(on)參數(shù)20%的漂移作為器件故障閾值[26]。仍以12號(hào)器件為例,用模型預(yù)測(cè)值計(jì)算RDS(on)參數(shù)的漂移情況,具體數(shù)值如表3所示。
從表3中可以看出,前4次實(shí)驗(yàn)RDS(on)參數(shù)的漂移低于故障閾值,可判斷器件并沒有發(fā)生故障,這也與真實(shí)實(shí)驗(yàn)結(jié)果相符。RDS(on)參數(shù)在第5次實(shí)驗(yàn)中漂移超過故障閾值,計(jì)算故障時(shí)間如表4所示。
表3 RDS(on)參數(shù)漂移百分比
表4 預(yù)測(cè)故障時(shí)間與實(shí)際故障時(shí)間
從表4中可以看到,12號(hào)器件在實(shí)驗(yàn)累計(jì)進(jìn)行265 min時(shí)發(fā)生故障,模型預(yù)測(cè)故障在227 min時(shí)發(fā)生,模型能夠提早預(yù)測(cè)故障的發(fā)生,具有合理性。
為了更直觀地反映基于LSTM法建立的多源數(shù)據(jù)模型對(duì)半導(dǎo)體器件狀態(tài)預(yù)測(cè)的優(yōu)勢(shì)和建立的故障預(yù)測(cè)模型的可信度,使用均方根誤差作為模型評(píng)價(jià)標(biāo)準(zhǔn),均方根誤差越小,表示模型回歸預(yù)測(cè)效果越好。
將多源數(shù)據(jù)LSTM模型的均方根誤差分別與單以殼溫為輸入的LSTM模型、多源數(shù)據(jù)反向傳播(BP)神經(jīng)網(wǎng)絡(luò)模型均方根誤差對(duì)比,如表5所示。從表5中可以看出,本文建立的基于LSTM算法的多源數(shù)據(jù)模型均方根誤差最小,曲線擬合度最好。
表5 模型的均方根誤差
用更直觀的點(diǎn)線圖表示各模型均方根誤差,如圖13所示。從圖13中可以看出:5次實(shí)驗(yàn)中,單以殼溫為樣本輸入的LSTM模型均方根誤差大于本文建立的多源數(shù)據(jù)LSTM模型,表明同等條件下將應(yīng)力等級(jí)和應(yīng)力累計(jì)時(shí)長(zhǎng)同時(shí)作為樣本輸入,可提高模型的準(zhǔn)確率,驗(yàn)證了本文方法的有效性;第5次實(shí)驗(yàn)時(shí),殼溫LSTM模型的均方根誤差尤其大,這一現(xiàn)象也印證了前文的分析,即第5次實(shí)驗(yàn)中應(yīng)力累計(jì)時(shí)長(zhǎng)是影響器件性能的主要因素,而殼溫LSTM模型在建模時(shí)只考慮了熱應(yīng)力的等級(jí),忽略了應(yīng)力累計(jì)時(shí)長(zhǎng)對(duì)器件的影響,因此此次預(yù)測(cè)準(zhǔn)確率降低,驗(yàn)證了建模時(shí)同時(shí)考慮應(yīng)力等級(jí)和應(yīng)力累計(jì)時(shí)長(zhǎng)的合理性及多源數(shù)據(jù)LSTM模型的優(yōu)越性。
圖13 各模型均方根誤差對(duì)比
雖然BP神經(jīng)網(wǎng)絡(luò)法也支持建立多源數(shù)據(jù)模型,但從圖13中可見,BP神經(jīng)網(wǎng)絡(luò)法構(gòu)建的5次實(shí)驗(yàn)?zāi)P途礁`差均大于LSTM法構(gòu)建的模型,且BP神經(jīng)網(wǎng)絡(luò)法的均方根誤差隨著實(shí)驗(yàn)累計(jì)時(shí)長(zhǎng)的增加而增長(zhǎng)。由此可見,LSTM算法具備長(zhǎng)期記憶的特征,使之處理半導(dǎo)體器件這類現(xiàn)狀態(tài)與之前時(shí)刻狀態(tài)有關(guān)的長(zhǎng)序列問題時(shí)更具優(yōu)勢(shì),此方法5次實(shí)驗(yàn)的模型輸出曲線與目標(biāo)值曲線幾乎重合,走勢(shì)一致,輸出結(jié)果和目標(biāo)值吻合度較高,可以較好地?cái)M合熱應(yīng)力作用下樣本參數(shù)的變化趨勢(shì),模型的計(jì)算結(jié)果作為預(yù)測(cè)值可信度高。
本文以LSTM法為基礎(chǔ),利用LSTM長(zhǎng)期記憶的能力有效地建立了熱應(yīng)力、應(yīng)力累計(jì)時(shí)長(zhǎng)與半導(dǎo)體器件狀態(tài)間的邏輯關(guān)系。得到主要結(jié)論如下:
1)本文所提方法與多源數(shù)據(jù)BP神經(jīng)網(wǎng)絡(luò)法、單以殼溫為輸入的LSTM法進(jìn)行對(duì)比,通過表5的數(shù)據(jù)可以看出,本文所提方法預(yù)測(cè)誤差最小,表明本文所建立的模型輸出結(jié)果與目標(biāo)值吻合度最高,能夠良好地預(yù)測(cè)研究對(duì)象的狀態(tài)發(fā)展趨勢(shì)。
2)根據(jù)模型輸出值與閾值的關(guān)系,預(yù)估研究對(duì)象故障時(shí)間。通過表4可以看出,模型能夠提早預(yù)測(cè)故障的發(fā)生,驗(yàn)證了該方法的有效性和合理性,表明此方法是可以工程推廣的。