胡時(shí)光,尤文斌,丁永紅,路萬(wàn)里,王海霞
(中北大學(xué) 電子測(cè)試技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,山西 太原 030051)
隨著導(dǎo)彈技術(shù)的發(fā)展,固態(tài)存儲(chǔ)器在其研發(fā)過(guò)程中的地位愈發(fā)重要,其可靠性直接決定了所測(cè)的飛控?cái)?shù)據(jù)是否準(zhǔn)確有效,關(guān)系著導(dǎo)彈的后期設(shè)計(jì)改進(jìn)研發(fā)。因其具有發(fā)射回收負(fù)載高、一次使用及長(zhǎng)期貯存的特點(diǎn)[1],使得在可靠性方面存在諸多問(wèn)題,可能會(huì)導(dǎo)致數(shù)據(jù)存儲(chǔ)失敗,如何可靠地獲取數(shù)據(jù)一直是固態(tài)存儲(chǔ)器的研究重點(diǎn)[2]。通常研制部門(mén)基于經(jīng)驗(yàn)預(yù)估判斷固態(tài)存儲(chǔ)器可靠性,缺乏定性定量分析描述系統(tǒng)的失效機(jī)理和失效模式,在系統(tǒng)故障時(shí)難以及時(shí)找出故障位置,未能形成有效的可靠性研究。
針對(duì)以上問(wèn)題,筆者提出了基于故障樹(shù)分析的固態(tài)存儲(chǔ)器可靠性研究。通過(guò)研究固態(tài)存儲(chǔ)器的組成和測(cè)試原理,建立固態(tài)存儲(chǔ)器的故障樹(shù)模型,定性定量分析研究固態(tài)存儲(chǔ)器的可靠性,闡明系統(tǒng)的邏輯關(guān)系,對(duì)各底事件進(jìn)行重要度排序,有助于研發(fā)人員及時(shí)定位故障位置,為今后的固態(tài)存儲(chǔ)器研發(fā)改進(jìn)提供參考。
在測(cè)試過(guò)程中,固態(tài)存儲(chǔ)器位于彈體內(nèi)部,需進(jìn)行回收,要經(jīng)過(guò)發(fā)射、飛行以及跌落3個(gè)過(guò)程,發(fā)射與跌落過(guò)程屬于瞬態(tài)高沖擊、強(qiáng)振動(dòng)過(guò)程。在此過(guò)程中,固態(tài)存儲(chǔ)器會(huì)受到極大的加速度沖擊,在此惡劣工作環(huán)境下經(jīng)常會(huì)導(dǎo)致固態(tài)存儲(chǔ)器的關(guān)鍵部件失效,這將會(huì)對(duì)新型武器的研制改進(jìn)造成難以估量的損失。
固態(tài)存儲(chǔ)器主要組成有機(jī)械殼體和存儲(chǔ)記錄電路,在高過(guò)載條件下常見(jiàn)失效形式主要分兩類(lèi):一是機(jī)械殼體變形;二是存儲(chǔ)記錄電路失效。在跌落回收過(guò)程中固態(tài)存儲(chǔ)器受高g值沖擊載荷[3],可能導(dǎo)致機(jī)械殼體變形壓縮內(nèi)部空間致使內(nèi)部電路失效;或直接導(dǎo)致內(nèi)部電路構(gòu)件松動(dòng)、斷裂等情況失效。因此固態(tài)存儲(chǔ)器可靠性研究重點(diǎn)在于存儲(chǔ)記錄電路。
以某型號(hào)彈載固態(tài)存儲(chǔ)器為例進(jìn)行分析,其內(nèi)部存儲(chǔ)記錄電路實(shí)物圖如圖1所示。主要由模擬采編模塊1、模擬采編模塊2、數(shù)字采編模塊、電源調(diào)節(jié)模塊以及存儲(chǔ)控制模塊5個(gè)部分組成。
存儲(chǔ)記錄電路主要完成多路模擬信號(hào)的采集調(diào)理、編碼及存儲(chǔ);完成PCM數(shù)字量的采集、串并轉(zhuǎn)換及存儲(chǔ);完成外部輸入電源的隔離轉(zhuǎn)換;完成記錄數(shù)據(jù)的發(fā)送和接收單元測(cè)試臺(tái)的控制命令。 從底層元器件出發(fā)對(duì)存儲(chǔ)記錄電路進(jìn)行剖析,電路各模塊是由電阻與電容、連接導(dǎo)線、集成電路、接插件、印制板與焊點(diǎn)、半導(dǎo)體分立器件等組成。集成電路又包括模擬電路、模擬開(kāi)關(guān)、A/D變換器、數(shù)字電路、Flash存儲(chǔ)。半導(dǎo)體分立器件又包括二極管和光耦。存儲(chǔ)記錄電路框圖如圖2所示。
鑒于模塊分析的冗余性和復(fù)雜性,以及保證測(cè)試數(shù)據(jù)的完整性,根據(jù)固態(tài)存儲(chǔ)器電路系統(tǒng)組成和測(cè)試原理,按照部件種類(lèi)劃分可靠性預(yù)計(jì)單元,把不同模塊間的相同器件進(jìn)行歸類(lèi)合并,分析研究其各類(lèi)元器件的主要失效模式和失效機(jī)理,依據(jù)單元在電路系統(tǒng)上的功能,采用元器件應(yīng)力分析法,建立形成典型失效案例[4]??煽啃钥驁D如圖3所示。
系統(tǒng)的可靠性是衡量產(chǎn)品質(zhì)量的一項(xiàng)重要依據(jù),按照國(guó)家標(biāo)準(zhǔn),可靠性定義為產(chǎn)品在規(guī)定條件下和規(guī)定時(shí)間內(nèi)完成規(guī)定功能的能力[5],如圖4所示。經(jīng)常作為可靠性衡量的特征量有兩類(lèi):一是以概率指標(biāo)表示,如可靠度、失效率及失效概率等;二是以壽命指標(biāo)表示,如平均壽命和可靠壽命等。
根據(jù)固態(tài)存儲(chǔ)器電路的可靠性框圖,擬選用GJB/Z 299C—2006《電子設(shè)備可靠性預(yù)計(jì)手冊(cè)》中所給出的21類(lèi)元器件概率指標(biāo)作為衡量指標(biāo),采用元器件應(yīng)力分析方法對(duì)固態(tài)存儲(chǔ)器的可靠性進(jìn)行預(yù)計(jì)分析[6]。除微電路外,大多數(shù)元器件工作失效率λp預(yù)計(jì)模型均為基本失效率λb與πE、πQ等一系列π系數(shù)相連乘的形式[7]。
對(duì)于電阻電容、接插件以及分立器件等常規(guī)電子元件,其典型失效率模型為
λPi=λbπEπQπX,
(1)
式中:λb為基本失效率;πE為環(huán)境系數(shù);πQ為質(zhì)量系數(shù);πX為類(lèi)別系數(shù)。
對(duì)于模擬電路及Flash存儲(chǔ)等半導(dǎo)體單片集成部件典型失效率模型為
λPj=πQ[C1πTπV+(C2+C3)πE]πL,
(2)
式中:πT為溫度系數(shù);πV為電壓應(yīng)力系數(shù);πL為成熟系數(shù);C1、C2為復(fù)雜度失效率;C3為封裝復(fù)雜度失效率。
因絕大多數(shù)電子產(chǎn)品和機(jī)電產(chǎn)品服從指數(shù)分布,則可靠度為
R(i)=e-λit,
(3)
式中:λi為元器件失效率;t為工作時(shí)間。
頂事件失效概率為
(4)
式中:Xi為最小割集;N為最小割集個(gè)數(shù)。
在許多實(shí)際工程問(wèn)題中,多數(shù)零件可靠度較高,也就是底事件失效概率很小。因此在實(shí)際計(jì)算中,常取首項(xiàng)來(lái)近似:
(5)
故障樹(shù)分析(FTA)[8]是在系統(tǒng)設(shè)計(jì)過(guò)程中對(duì)可能造成系統(tǒng)故障的各種因素進(jìn)行分析,選取系統(tǒng)失效故障為頂事件,以運(yùn)行狀況和實(shí)踐經(jīng)驗(yàn)逐層搜索引起故障發(fā)生的中間事件和底事件[9],通過(guò)邏輯關(guān)系圖演繹,從而確定系統(tǒng)故障原因的各種可能組合方式或其發(fā)生概率,以計(jì)算系統(tǒng)故障概率。該方法通過(guò)定性分析和定量計(jì)算[10],可以很好地分析出各底事件對(duì)頂事件的影響,具有準(zhǔn)確、高效、形象等特點(diǎn),在故障分析中得到了廣泛應(yīng)用[11-12]。
故障樹(shù)分析的步驟如圖5所示,其重難點(diǎn)是故障樹(shù)建立以及定性定量分析。
2.2.1 定性分析
定性分析的目的是尋找導(dǎo)致頂事件發(fā)生的故障模式,明確導(dǎo)致系統(tǒng)頂事件發(fā)生的全部最小割集。每一個(gè)最小割集代表了系統(tǒng)的一種故障模式,只要在設(shè)計(jì)過(guò)程中能夠保證每個(gè)最小割集中至少有一個(gè)底事件能夠不發(fā)生,那么頂事件就一定不會(huì)發(fā)生。
2.2.2 定量分析
定量計(jì)算的目的是計(jì)算頂事件發(fā)生的概率,以及通過(guò)對(duì)底事件的重要度進(jìn)行計(jì)算,分析底事件發(fā)生故障對(duì)頂事件發(fā)生的影響大小。
重要度分析[13]是故障樹(shù)分析中的重要組成部分,不同的底事件在系統(tǒng)中呈現(xiàn)非均等的重要性。為了從不同角度評(píng)估各底事件對(duì)系統(tǒng)失效的貢獻(xiàn),有必要分析并計(jì)算底事件的重要度。重要度又分為結(jié)構(gòu)重要度、概率重要度和關(guān)鍵重要度。
1)結(jié)構(gòu)重要度反映單元在故障樹(shù)結(jié)構(gòu)中所處位置的重要程度,與該單元發(fā)生概率無(wú)關(guān)。其計(jì)算公式為
(6)
式中:Ist(i)為底事件關(guān)鍵重要度;ni為因第i個(gè)單元從正常變?yōu)楣收隙瓜到y(tǒng)由正常變?yōu)楣收系拇螖?shù)。
2)概率重要度反映單元概率的變化對(duì)系統(tǒng)概率變化的影響程度。即各底事件對(duì)頂事件失效概率計(jì)算公式求一次偏導(dǎo)。其計(jì)算公式為
(7)
式中:Ipr(i)為底事件概率重要度;Pi代表底事件的失效概率;PT代表系統(tǒng)的失效概率。
3)關(guān)鍵重要度反映單元故障概率改進(jìn)的難易程度。其計(jì)算公式為
(8)
式中:Icr(i)為底事件關(guān)鍵重要度;Ipr(i)為底事件概率重要度;Pi代表底事件的失效概率;PT代表系統(tǒng)的失效概率。
根據(jù)固態(tài)存儲(chǔ)器的組成和測(cè)試原理,其可靠性模型應(yīng)為串聯(lián)模型,固態(tài)存儲(chǔ)器隨彈體飛行時(shí)間設(shè)計(jì)為1 000 s.
根據(jù)對(duì)存儲(chǔ)記錄電路的分析,建立該系統(tǒng)的故障樹(shù)模型如圖6所示,事件說(shuō)明如表1所示。
表1 事件說(shuō)明表
定性分析的方法有上行法和下行法兩種[14],所謂下行法,就是由頂事件開(kāi)始,由上而下逐級(jí)尋找事件集合,最終獲得故障樹(shù)的最小割集;所謂上行法,就是從底事件開(kāi)始,由下而上逐級(jí)尋找事件集合,最終獲得故障樹(shù)的最小割集。筆者應(yīng)用下行法對(duì)故障樹(shù)進(jìn)行定性分析?;舅枷胧牵篛R門(mén)使割集數(shù)目增加,AND門(mén)使割集容量增加。經(jīng)分析,系統(tǒng)最小割集為{X1},{X2},{X3},{X4},{X5},{X6},{X7},{X8},{X9},{X10},{X11},{X12},{X13}.
定量分析主要有兩方面內(nèi)容:一是通過(guò)底事件的概率來(lái)計(jì)算系統(tǒng)的概率;二是計(jì)算系統(tǒng)各底事件的重要度。定量分析涉及到眾多參數(shù)的選取和繁雜的計(jì)算過(guò)程,其中質(zhì)量等級(jí)劃分為A、B、C三等,細(xì)分又可分A1~A6、B1~B2及C,筆者主要選取B等級(jí)進(jìn)行計(jì)算。其他參數(shù)選取如表2所示。
表2 定量分析各事件參數(shù)選擇
3.3.1 底事件概率計(jì)算
根據(jù)式(1)~(2),將表2所列各參數(shù)帶入對(duì)應(yīng)的公式中,即可求各底事件失效率數(shù)值,如表3所示。
表3 基本事件及失效率
將固態(tài)存儲(chǔ)器隨彈體飛行時(shí)間和表3中計(jì)算出的底事件失效率代入式(3),可知各底事件的可靠度R(i).查閱可知失效概率(即不可靠度)計(jì)算公式為
P(i)=1-R(i),
(9)
則可知各底事件失效概率結(jié)果如表4所示。
表4 基本事件失效概率表
3.3.2 重要度計(jì)算
根據(jù)式(5)和(7)對(duì)各底事件的概率重要度進(jìn)行計(jì)算得知,系統(tǒng)各底事件的概率重要度相等,且計(jì)算得出其值為Ipr(Xi)=1.
根據(jù)式(5)、(7)、(8)進(jìn)行聯(lián)合計(jì)算,將計(jì)算結(jié)果按照比例劃分,系統(tǒng)各底事件的關(guān)鍵重要度結(jié)果及所占比例如圖7所示。
通過(guò)定性分析,發(fā)現(xiàn)在失效故障中,13個(gè)底事件都可能導(dǎo)致頂事件的發(fā)生。因此,在研發(fā)過(guò)程中需加強(qiáng)對(duì)底事件的重視。同時(shí),在進(jìn)行定量分析及重要度排序過(guò)程中,由于各底事件結(jié)構(gòu)重要度和概率重要度計(jì)算結(jié)果相等,因此著重參考關(guān)鍵重要度。通過(guò)對(duì)關(guān)鍵重要度進(jìn)行百分比排序得知模擬電路(X5)、AD轉(zhuǎn)換(X7)以及Flash存儲(chǔ)(X9)在存儲(chǔ)電路系統(tǒng)中占有較大比重。因此在存儲(chǔ)電路設(shè)計(jì)中重點(diǎn)關(guān)注此三類(lèi)元器件,盡可能選用更可靠穩(wěn)定的廠商器件,同時(shí)加強(qiáng)篩選實(shí)驗(yàn)以避免偶然失效事件的發(fā)生。
在某次實(shí)驗(yàn)測(cè)試中,測(cè)試過(guò)程如圖8所示,模擬采編模塊1通道10出現(xiàn)數(shù)據(jù)峰值過(guò)低問(wèn)題,波形圖如圖9所示。
通過(guò)故障樹(shù)定性分析找出底事件,參考前文定量分析中重要度比例大小進(jìn)行排序檢查,X9>X5>X7>X3>X6>X4>X8>X13>X10>X12>X11>X2>X1,在檢查到第4步電阻部分時(shí),發(fā)現(xiàn)此通道調(diào)理電路部分分壓電阻有問(wèn)題,在更換電阻后再進(jìn)行數(shù)據(jù)的測(cè)試讀取,讀取結(jié)果如圖10所示,結(jié)果顯示正常。此次實(shí)驗(yàn)說(shuō)明故障樹(shù)分析可以很好地應(yīng)用在固態(tài)存儲(chǔ)器的故障定位上,方便人員快速進(jìn)行故障定位。
針對(duì)固態(tài)存儲(chǔ)器缺乏定性定量分析和故障難以定位的問(wèn)題,提出了基于故障樹(shù)分析的固態(tài)存儲(chǔ)器可靠性研究。采用基于故障樹(shù)的分析方法,研究固態(tài)存儲(chǔ)器的系統(tǒng)組成和工作原理,按照元器件種類(lèi)劃分可靠性單元,建立故障樹(shù)模型;對(duì)故障樹(shù)進(jìn)行定性分析找出底事件,確定引起系統(tǒng)失效的最小割集;進(jìn)行定量分析計(jì)算各底事件失效概率及3種重要度,并對(duì)重要度進(jìn)行排序,確定各底事件對(duì)系統(tǒng)的影響程度;最后以實(shí)驗(yàn)驗(yàn)證了故障樹(shù)分析在固態(tài)存儲(chǔ)器可靠性方面的可行性。
通過(guò)故障樹(shù)方法中的分析計(jì)算,分析闡明系統(tǒng)的邏輯關(guān)系,從而對(duì)各部件的重要程度進(jìn)行合理準(zhǔn)確的判斷,有助于人員快速定位故障位置,對(duì)合理高效地解決突發(fā)故障提供理論參考依據(jù)。通過(guò)這次分析發(fā)現(xiàn),故障樹(shù)分析可以很好地應(yīng)用在固態(tài)存儲(chǔ)器設(shè)計(jì)中,為提高固態(tài)存儲(chǔ)器的可靠性提供科學(xué)指導(dǎo)。