王韶軒,郭丁情,李學禮,林志賢,戈道川,汪建業(yè)
(1.中國科學院合肥物質科學研究院,中子輸運理論與輻射安全重點實驗室,合肥 230031;2.中國科學技術大學,合肥 230026;3.上海交通大學,核科學與工程學院,上海 200240;4.中廣核工程設計有限公司,廣東深圳 518000)
動態(tài)故障樹(DFT)概念最早由弗吉尼亞大學Dugan教授于1992年提出[1],其誕生背景是計算機容錯系統(tǒng)因采用冗余設計、動態(tài)冗余管理以及復雜故障恢復技術而導致的系統(tǒng)時序失效行為。Dugan教授為描述系統(tǒng)這一時序失效行為,并對其可靠性進行精準的建模和分析,發(fā)展了6種動態(tài)邏輯門,因此DFT被定義為至少包含一種動態(tài)邏輯門的故障樹。由于集成了動態(tài)邏輯門,DFT具備比靜態(tài)故障樹更強大的系統(tǒng)失效建模能力,一經(jīng)提出,便引起了可靠性領域專家的注意并在實踐中獲得大量應用。目前,DFT的三大主要分析方法為:Monte Carlo數(shù)值仿真、馬爾科夫鏈模型以及被統(tǒng)稱為“組合法”的容斥原理法和不交化積之和模型法。隨著快速定量分析技術的提升以及系統(tǒng)可靠性學科的發(fā)展,DFT也開始在其他安全重要領域得到應用,例如核能系統(tǒng)、化工過程系統(tǒng)和航空航天系統(tǒng)等。
尤其是核能系統(tǒng),安全一直是其可持續(xù)健康發(fā)展的生命線[2]。為了保障安全,核電廠大量采用冗余管理和設計理念,比如縱深防御和單一故障準則[3]。由于大量冗余系統(tǒng)/設備的存在,使得核電廠系統(tǒng)廣泛存在復雜時序失效行為,例如大亞灣核電站給水泵系統(tǒng)采用2×65%汽動泵+1×65%電動泵配置方式。正常運行時,2臺汽動泵工作,另一電動泵作為冷備用。在一臺汽動泵跳閘的情況下,電動泵在極短時間內啟動并替換跳閘的汽動泵。給水泵系統(tǒng)功能失效的DFT模型如下圖1所示。顯然,給水泵系統(tǒng)存在四種時序失效模式:A→S,A→B,B→S,B→A[4]。這種時序失效行為給利用傳統(tǒng)故障樹對系統(tǒng)進行可靠性建模和分析的方式提出了挑戰(zhàn)。核電廠時序失效行為不僅影響系統(tǒng)失效概率也會影響事故后果。在對失效概率的影響方面,有研究結果表明[5]:對于兩輸入優(yōu)先與門和靜態(tài)與門,當設備的失效率λ和修復率μ滿足一定關系時(λA>>λB,μA>>μB或λA<<λB,μA<<μB),DFT與靜態(tài)故障樹的計算結果存在量級的差別。即便不考慮設備的維修性,DFT與靜態(tài)故障樹的計算結果往往也存在倍數(shù)的差別,而差別大小是由系統(tǒng)時序失效特性以及設備失效可靠性參數(shù)共同決定。本文中時序失效特性主要是指系統(tǒng)時序失效行為的類型、時序失效行為之間的耦合度,以及系統(tǒng)的結構和規(guī)模等。對事故后果的影響方面,有研究結果表明[6]:事故后安全系統(tǒng)發(fā)生失效的前后順序不同,則導致事故后果嚴重程度不一。因此,應用DFT對核能系統(tǒng)的時序失效行為進行建模分析,有助于識別核電廠危險的事故場景、釋放保守的事故風險,對提升核電廠的經(jīng)濟性和安全性具有重要的現(xiàn)實意義。
圖1 大亞灣核電廠給水泵系統(tǒng)功能失效DFT模型Fig.1 DFT model of failure of feedwater pump system in Daya Bay nuclear power plant
當前,DFT已經(jīng)在核能系統(tǒng)可靠性評價中得到了初步應用,但也僅限于時間相關的失效系統(tǒng)或部件。核能系統(tǒng)中的共因失效、設備啟動失敗、稀有始發(fā)事件發(fā)生(如LLOCA)概率/頻率等并沒有顯著的時間分布特性,常表現(xiàn)為一個獨立于時間維度的概率值或頻率值,這給DFT傳統(tǒng)定量求解算法提出了挑戰(zhàn),目前很少有文獻對此開展研究。本文對近30年DFT分析方法進行綜述,介紹國內外DFT理論、方法和核安全領域的研究現(xiàn)狀和未來趨勢,并分析不同分析方法的特點與適用場合,最后結合核能系統(tǒng)的時序失效行為特性,給出核電領域DFT未來的發(fā)展方向及待解決的問題,為DFT方法在我國核能系統(tǒng)可靠性和概率安全分析中的進一步應用與研究提供有益的幫助。
DFT具備對復雜系統(tǒng)的時序失效行為進行系統(tǒng)可靠性建模的能力,其是在靜態(tài)故障樹的基礎上集成了6種動態(tài)邏輯門,分別為優(yōu)先與門(PAND)、功能相關門(FDEP)、順序強制門(SEQ)、冷備門(CSP)、溫備門(WSP)和熱備門(HSP),如圖2所示[1]。國內外眾多研究機構和學者均開展了DFT建模理論及分析方法研究,早期主要側重單個動態(tài)邏輯門的失效語義表述、時序失效邏輯表達、時序失效邏輯運算以及時序失效概率計算,分析對象的規(guī)模相對較小、系統(tǒng)時序失效邏輯相對簡單[7,8]。近年來,得益于系統(tǒng)可靠性理論的進步以及快速評價方法的發(fā)展,DFT建模能力和求解效率得到了很大提升。其中,動態(tài)邏輯門失效語義的明確和統(tǒng)一[9,10],加深了人們對系統(tǒng)時序失效行為的理解,進一步明晰了動態(tài)邏輯門與系統(tǒng)時序失效行為之間的映射關系,為建立更大規(guī)模的時序失效系統(tǒng)的DFT模型提供了理論依據(jù)。此外,基于DFT不交化積之和模型[11,12],有學者發(fā)展了系列DFT快速計算方法,為分析更大規(guī)模系統(tǒng)DFT提供了技術支持,但是這種快速計算方法也存在一定的局限性,如分析對象必須是不可修系統(tǒng)、系統(tǒng)部件失效時間必須服從指數(shù)分布,這也在一定程度上限制了這些方法在核能系統(tǒng)中的實際應用。當前,學者正圍繞DFT的兩個方面開展深入研究,一是研究更加快速的計算方法,使之能夠同時適用于分析可修和不可修系統(tǒng);另一個是開展廣泛的工程應用研究,優(yōu)化系統(tǒng)設計以提高系統(tǒng)運行安全和經(jīng)濟性。尤其對安全和經(jīng)濟性極為重視的核能系統(tǒng),開展相適應的DFT快速計算方法以及工程應用研究更具有現(xiàn)實意義。
圖2 6種動態(tài)邏輯門Fig.2 6 kindsof dynamic logic gates
經(jīng)過近20年的發(fā)展,目前DFT分析方法主要分為以下幾類(如圖3所示):狀態(tài)空間法、組合法、隨機法以及其他方法(貝葉斯網(wǎng)絡法和Petri Net法)。其中馬爾科夫鏈模型法、組合法以及其他方法屬于解析法,隨機法則屬于近似法。
圖3 DFT分析方法分類Fig.3 Classification of DFT analysismethods
1.2.1 狀態(tài)空間法
狀態(tài)空間法,即Markov鏈模型法,其主要研究系統(tǒng)“狀態(tài)”與“狀態(tài)”之間的概率轉移特性,在DFT的定量計算中的到了廣泛的應用。1992年,Dugan JB首次利用基于系統(tǒng)狀態(tài)空間的馬爾科夫鏈模型實現(xiàn)了對DFT的定量分析[1],但也明確指出馬爾科夫鏈狀態(tài)空間會隨著系統(tǒng)部件的增加呈指數(shù)級增長,對規(guī)模較大的系統(tǒng)而言,計算成本較高。對于一個含有n個部件的二元狀態(tài)系統(tǒng),其馬爾科夫鏈模型計算復雜度為o(m3),其中m為馬爾科夫鏈中的狀態(tài)個數(shù),大小為o(2n)[13]。隨后,為提高計算效率,大量學者開展縮減馬爾科夫鏈狀態(tài)空間的技術研究[14,15]。而實際上,工業(yè)系統(tǒng)DFT的規(guī)模往往較大,即使馬爾科夫鏈模型能縮減規(guī)模,但仍面臨“狀態(tài)空間爆炸”難題。其次,馬爾科夫鏈模型要求設備失效時間和修復時間均服從指數(shù)分布以滿足時間無記憶性,即無法對非指數(shù)失效時間分布的設備系統(tǒng)進行分析。
1.2.2 組合法
組合法基本克服了Markov狀態(tài)空間爆炸的問題和強制要求設備服從指數(shù)失效時間分布的約束,具有較好的求解效率和適用性。因該方法的實施基于DFT結構函數(shù),所以也被稱之為結構函數(shù)法。研究人員就如何獲取DFT的結構函數(shù),已經(jīng)開展大量研究并取得了系列成果[16-18]。關于組合法的研究現(xiàn)主要集中在兩個方面:一個是容斥原理(Inclusive-Exclusive Principle,IEP)法;另一個是不交化積之和(Sumof disjointproducts,SDP)法。
IEP是分析DFT的常用方法,該方法首先對DFT的結構函數(shù)按照容斥原理進行展開,通過求解每個容斥項的發(fā)生概率最終得到整個DFT的發(fā)生概率[8]。需要注意的是,對一個結構函數(shù)含有m個邏輯項的DFT,IEP法展開后將產(chǎn)生2m-1個容斥項。因此,這種方法在處理大型DFT時也較容易產(chǎn)生因組合爆炸而導致無法求解的問題。
SDP法是目前求解不可修DFT的最高效算法之一,該方法將DFT的割序集轉化為“不交化積之和”形式,從而將求解過程簡化為對各不交化割序的概率進行直接求和。近年來,多名學者針對SDP法的理論與應用進行了深入研究,逐步解決了使用SDP法求解DFT的技術障礙,并且發(fā)現(xiàn)SDP法計算復雜度與不交化路徑的個數(shù)成線性關系,通過大量的案例分析表明,SDP法比馬爾科夫鏈模型法以及容斥原理法計算效率都要高[18-20]。
1.2.3 隨機法
DFT的隨機量化方法主要有兩種:一種是基于蒙特卡洛的隨機抽樣方法[22],另一種是基于非伯努利隨機序列的試驗方法[23-25]。蒙特卡洛方法又稱為隨機模擬法、隨機抽樣法、統(tǒng)計實驗法等,該方法以概率論和數(shù)理統(tǒng)計為基礎,利用重復抽樣、計算機生成的隨機數(shù)、統(tǒng)計實驗來求解一些可以用隨機過程來描述的問題,并且隨著計算機的快速發(fā)展,蒙特卡洛法得到了越來越廣泛的應用。該方法的優(yōu)點在于收斂速度與問題維度無關、計算誤差可以度量、解決問題時受限小、適應性廣。但其復雜度與結果要求的精度有關,對于小概率事件,該方法的計算成本較大且只能提供一個在統(tǒng)計學意義下的近似解,且與其他方法相比該方法在處理低維數(shù)的實際情況時效果可能不是很好,在保持置信水平不變抽樣數(shù)為N時,收斂速度較慢為o(1/N)[26]。
基于非伯努利隨機序列的試驗方法,其利用0,1隨機排列組成的非伯努利序列作為基本事件的概率來分析DFT,與傳統(tǒng)的伯努利序列在隨機計算中的使用相反,該方法將非伯努利序列(作為固定數(shù)目的1和0的隨機排列)用于初始輸入與門故障概率。相關學者通過對兩輸入和三輸入不可修復優(yōu)先與門的計算,發(fā)現(xiàn)相比于蒙特卡洛抽樣法,該方法有更高的計算精度和更快的收斂速度[24]。但是目前僅適用于不可修DFT,計算效率依賴于隨機伯努利序列長度。
1.2.4 其他方法
其他方法主要是指貝葉斯網(wǎng)絡分析法和Petri Net法。貝葉斯網(wǎng)絡分析法將DFT轉化為貝葉斯網(wǎng)絡再進行相應的求解[27,28]。貝葉斯網(wǎng)絡(Bayesian Networks,BN)又稱信任網(wǎng)絡(Belief Networks),是近10年來受到廣泛關注的可靠性模型,其結合了概率論和圖論,是一個賦值的因果關系圖,本質上是一種基于概率推理的數(shù)學模型,具有堅實的概率論基礎。這種方法的計算復雜度類似容斥原理法,避免了全局狀態(tài)空間爆炸的問題,但其也存在條件概率表的參數(shù)組合爆炸和備件節(jié)點失效時間僅能是指數(shù)分布的不足。
Codetta-Reiteri提出一種廣義Petri Net來分析DFT[29]。Petri網(wǎng)(Petri Net,PN)是一種用來描述離散系統(tǒng)的數(shù)學建模工具,提出后被廣泛用于各種實際系統(tǒng)的建模和分析。關于這種方法的研究目前還比較少,其在DFT領域的應用仍處于探索階段,對于大型復雜系統(tǒng),因為PN模型的可達圖難以獲取,故而很難進行定性和定量分析。此外,PN可靠性指標求解是基于馬爾可夫或半-馬爾可夫理論,也面臨著適用范圍較窄和指數(shù)爆炸的問題。目前,這兩種方法僅限于不可修DFT。
以上DFT分析方法的優(yōu)缺點對比如表1所示。這些分析方法除了Markov鏈模型法都是建立在基本事件不具有維修性這一假設的基礎上,但是在現(xiàn)實中系統(tǒng)部件普遍具有可修復性。因此,發(fā)展可修DFT的快速計算方法具有重要的現(xiàn)實意義。
表1 DFT分析方法優(yōu)缺點對比Table 1 Comparison of advantagesand disadvantagesof DFT analysismethods
縱深防御理念和單一故障準則是保障核安全的基本思想和重要途徑。采用大量冗余設計是核電廠安全設計的一個重要方面,這也決定了核能系統(tǒng)廣泛存在時序失效行為。通過對核能系統(tǒng)進行設計和運行分析,核能系統(tǒng)的時序失效行為主要存在于如圖4所示的幾種情況:
圖4 時序失效行為的存在場景Fig.4 Scenarioswith temporal failurebehaviors
(1)數(shù)字化儀控系統(tǒng)(Digital I&C System)。數(shù)字化儀控系統(tǒng)通過計算機硬件和控制系統(tǒng)軟件平臺執(zhí)行各種復雜的核電廠控制功能,與純硬件系統(tǒng)相比,計算機軟件系統(tǒng)具有顯著的冗余設計特性,廣泛存在時序失效行為。例如反應堆功率數(shù)字化冗余控制系統(tǒng)(簡稱RRS)采用熱冗余雙處理器配置,分別為系統(tǒng)A和系統(tǒng)B,每一個系統(tǒng)又都含有雙冗余微處理器,時序失效行為顯著。
(2)安全系統(tǒng)內部。核能安全系統(tǒng)需要在事故工況下執(zhí)行規(guī)定的安全功能,需要較高的運行可靠性,因此,關鍵安全系統(tǒng)內部一般采用多樣化冗余設計,比如壓水堆,其高壓安注系統(tǒng)中泵往往采用三組備用列配置。此外,給水泵系統(tǒng)也采用主給水泵和備用給水泵的冗余配置結構。
(3)安全系統(tǒng)之間。核能系統(tǒng)發(fā)生始發(fā)事件后,會觸發(fā)安全系統(tǒng)系列響應,這些安全系統(tǒng)會以一定的響應規(guī)程依次投入運行,同時安全系統(tǒng)的響應依賴于某些監(jiān)測設備的觸發(fā)信號,一旦這些監(jiān)測設備提前失效,安全系統(tǒng)就無法正常啟動。因此,始發(fā)事件發(fā)生后,安全系統(tǒng)之間會呈現(xiàn)時序失效行為。
(4)能動系統(tǒng)與動力源。核能系統(tǒng)采用大量的能動系統(tǒng),如泵系統(tǒng)、閥系統(tǒng)、控制棒系統(tǒng),儀表系統(tǒng)等,這些能動設備的功能依賴廠內或場外的動力源支持(如電、壓縮空氣等),一旦喪失動力源,所有相關系統(tǒng)就會失效,而相關系統(tǒng)失效對動力源不產(chǎn)生影響,其屬于功能相關失效(時序失效的一種)。因此,能動系統(tǒng)與動力源之間往往出現(xiàn)功能相關時序失效行為。
(5)操作員的干預行為。按照操作規(guī)程,核電廠發(fā)生事故后,在某些設備(如能動閥門、自動開關等)無法正常開啟時需要操作員手動干預。在某些事故場景下,操作員會隨著事故演進進行不同的干預,由于受到各種主觀和客觀因素的影響,操作員可能會干預失敗。因此,在核能系統(tǒng)事故進程中,操作員的干預行為可能會出現(xiàn)時序失效行為。
為確保反應堆的安全,核能安全系統(tǒng)往往需要發(fā)揮三大安全功能:反應性控制、余熱排除、放射性物質包容。這些安全功能的實現(xiàn)往往需要投入大量的安全系統(tǒng)、操作人員、儀表儀控以及其他輔助設施協(xié)同執(zhí)行。由于人機交互、軟硬件交互、嚴格的操作規(guī)程以及安全系統(tǒng)遵循縱深防御理念依次投入,相對于其他工業(yè)系統(tǒng),核能系統(tǒng)的時序失效特性更為復雜,主要表現(xiàn)為復雜耦合的時序失效行為以及系統(tǒng)規(guī)模較大。其中,復雜耦合的時序失效行為體現(xiàn)在系統(tǒng)和設備兩個層級,在系統(tǒng)層面,由于多個系統(tǒng)因共享設備的耦合,可能出現(xiàn)多種時序失效行為在時間和空間上的深度耦合;在設備層面,設備的失效概率可能在特定的任務時間上出現(xiàn)頻率型、概率型以及時間分布型的疊加效應。
核能系統(tǒng)由于冗余設計而廣泛存在時序失效行為,傳統(tǒng)靜態(tài)故障樹無法對此進行建模分析。近年來,基于DFT的系統(tǒng)可靠性評估方法在核能領域有了初步的應用,2008年,Dehlinger J對核電廠數(shù)字化給水控制系統(tǒng)可靠性進行了DFT建模和分析,并就DFT如何在核電廠PSA應用給出了建議[30]。2009年,K.Durga Rao使用DFT對核電廠電力供應系統(tǒng)和功率控制系統(tǒng)進行建模并使用蒙特卡羅模擬的方法進行求解,論證了DFT方法應用于解決大規(guī)模問題的可行性[31]。2015年,戈道川通過DFT建模和數(shù)值仿真,對含有多失效行為的核電廠供電系統(tǒng)進行了可靠性分析,結果顯示相比于以往方法DFT方法更具優(yōu)勢[32]。2018年,吳鏘針對AP1000安全級儀控系統(tǒng)的PMS系統(tǒng)進行了DFT建模,最終得到了安全技術儀控系統(tǒng)的失效模式和對系統(tǒng)失效影響較大的部件[33]。2019年,錢虹針對核反應堆穩(wěn)壓器數(shù)字壓力控制裝置開展了基于DFT的可靠性分析,給出了可靠性優(yōu)化程度相對較高的控制邏輯模塊[34]。2020年,戈道川對聚變裝置一體化除氚系統(tǒng)可靠性進行了DFT建模分析,得到關鍵部件的重要度排序,并就系統(tǒng)可靠性優(yōu)化給出了見解[5]。總體而言,DFT在核能系統(tǒng)中應用范圍和深度較為有限,主要限于關鍵安全系統(tǒng)以及儀表儀控系統(tǒng)的可靠性評估。
DFT在核能系統(tǒng)可靠性評估中所具有的優(yōu)勢是無法被忽視的,DFT集成動態(tài)邏輯門可以對核能系統(tǒng)的時序失效行為進行精確建模,分析的結果更加貼近實際。大量研究結果表明,DFT可以識別潛在的事故場景以及釋放核能系統(tǒng)被保守評估的風險,有助于提高核能系統(tǒng)的安全性和經(jīng)濟性。未來可利用DFT建模和分析技術對核能系統(tǒng)進行可靠性分析,識別潛在隱含的設計薄弱環(huán)節(jié),進行有針對性的優(yōu)化設計,進而提高核能系統(tǒng)整體安全性;此外,利用DFT還可以對核能系統(tǒng)的維修大綱進行優(yōu)化,減緩由于保守風險導致過高的維修強度(減少維修頻次和持續(xù)時間等),提高經(jīng)濟性。目前核電廠概率安全研究趨勢正朝著對真實系統(tǒng)的失效行為進行精確建模分析(即最佳估算)的方向發(fā)展,雖然現(xiàn)在DFT在核能系統(tǒng)中的應用并不充分,但其特性決定了其在核能系統(tǒng)可靠性精確評估與概率安全分析有著廣闊的應用前景和較大的研究價值。受限于建模方法和分析技術,DFT的分析對象相對簡單,規(guī)模較小(限于系統(tǒng)級),未能針對核能系統(tǒng)的時序失效特點進行深度DFT建模和分析,未能研究時序失效對整個核能系統(tǒng)事故風險的影響。當前設備失效類型也僅限于時間相關失效,未能分析設備頻率型和概率型失效的疊加影響。此外,鑒于核能系統(tǒng)可靠性和風險模型規(guī)模較大,需要高效的求解算法,這些都為未來發(fā)展先進核電廠DFT評價方法和技術提出了新的要求。
綜上所述,由于核能系統(tǒng)規(guī)模較大、設備部件失效類型復雜,加之當前DFT的建模方法和分析技術有所不足,導致了DFT在復雜核能系統(tǒng)可靠性評價應用范圍較小的現(xiàn)狀。為了進一步提升和拓展DFT計算效率和建模能力,同時結合當前DFT在核能系統(tǒng)實際應用中存在的主要問題,本文提出了5個未來發(fā)展方向(如圖5所示):
圖5 未來DFT在核能系統(tǒng)中的發(fā)展方向Fig.5 The future development direction of DFT in nuclear energy systems
(1)高效分析方法:為了保障運行安全,核能系統(tǒng)需要對高風險的配置進行快速評估和響應,而核能系統(tǒng)結構復雜且規(guī)模較大,這為大型DFT的求解效率提出了更高的要求。尤其是含有維修事件的DFT,目前分析方法主要依賴于馬爾科夫鏈模型法,對大系統(tǒng)的求解效率低;
(2)精確建模技術:核能系統(tǒng)普遍存在典型的共因失效,共因失效分析是傳統(tǒng)PSA分析的重要內容,這些共因失效可能與系統(tǒng)時序失效耦合在一起,形成更為復雜的失效行為,如何在DFT中體現(xiàn)對共因失效的建模能力,尚需要發(fā)展更為精確的建模技術;
(3)綜合概率求解模型:當前DFT概率求解模型的建立依賴于設備或部件的失效時間,核能系統(tǒng)廣泛存在頻率型和概率型的設備失效事件,其發(fā)生概率在時間尺度上是一個獨立的常量,如何對含有頻率型和概率型的時序失效事件(割序)進行概率建模和求解,仍然是一個技術挑戰(zhàn);
(4)安全系統(tǒng)成功準則修訂:傳統(tǒng)核能系統(tǒng)PSA模型的建立,需要借助確定論分析技術給定安全系統(tǒng)的成功準則,而在動態(tài)事件樹和故障樹的核能系統(tǒng)風險模型中,時序失效行為必將影響安全系統(tǒng)的成功準則,未來利用DFT分析核能系統(tǒng)的事故風險時,必然要對安全系統(tǒng)成功準則進行修訂,以便建立的風險模型與客觀實際一致;
(5)統(tǒng)一建模準則或約定:為了減少人為建模的不確定性,需要更全面地梳理和分析核能系統(tǒng)的時序失效特性,建立時序失效場景與動態(tài)邏輯門之間的映射關系,制定統(tǒng)一的核能系統(tǒng)DFT建模準則或約定,盡量在統(tǒng)一的建模準則或約定下,建立的DFT模型相差不多,以更好地推動DFT在核能系統(tǒng)可靠性和PSA中的應用。
截至目前,DFT在核能系統(tǒng)可靠性評估中的應用范圍和水平都較低,本文期望可以為動態(tài)故障樹方法在核能系統(tǒng)可靠性和概率風險分析中的深入應用提供理論依據(jù)和實踐指導,并為進一步提升核能系統(tǒng)的安全性和經(jīng)濟性提供有益的參考和建議。