靳春玲 王運鑫 貢力
摘要:突發(fā)水污染事故誘因眾多且不確定,為預測此類不確定性因素進而進行防控,提前做好風險預防具有較大的經濟意義。通過研究突發(fā)水污染事故風險因素、馬爾科夫鏈和貝葉斯網絡方法,根據現場調研獲取的指標因素,提出馬爾科夫鏈和貝葉斯網絡相結合的突發(fā)水污染風險預測新方法,從縱、橫兩方面預測突發(fā)水污染事故發(fā)生的概率,彌補僅用馬爾科夫鏈不能預測上層指標的不足,并為突發(fā)水污染事故的預防提供參考依據。實例分析結果表明:人為因素、機械設備因素和環(huán)境因素誘發(fā)黃河流域突發(fā)水污染事故的概率分別為52%、29%、12%,人為、機械設備和環(huán)境三方面應重點關注的風險因素分別是違規(guī)操作、管道破裂和自然災害。
關鍵詞:突發(fā)水污染;風險預測;馬爾科夫鏈;貝葉斯網絡;黃河流域
中圖分類號:X522:TV882.1
文獻標志碼:A
doi: 10.3969/j.issn.1000-1379.2018.04.015
突發(fā)水污染事故具有發(fā)生突然、誘因眾多、危害嚴重、處置困難、影響長期等特點,通過統(tǒng)計歷史事故,分析水污染事故特征、規(guī)律及關鍵因素,可有針對性地采取措施,降低事故發(fā)生率或預防事故發(fā)生。近年來,環(huán)境和水利工程領域的許多專家分別利用水質模型、多指標綜合評價法、AHP(層次分析法)一模糊綜合評價法、改進的相對風險模型等方法研究突發(fā)水污染風險問題,在風險預測方面集中于對水體中污染物遷移、擴散情況及應急響應時間、水質狀況的預測研究,如孟憲林等、蔣新新等采用不同的模型對污染物的動態(tài)變化進行預測模擬,陶亞等對事故發(fā)生后水廠取水口應急響應時間進行預測,魏智寬等采用灰色模型對突發(fā)事故后水質變化進行預測,而對事故風險因素后驗概率的預測研究幾乎是空白。
研究引發(fā)水污染事故的風險因素、分析底層因素導致風險發(fā)生的概率及各因素間關系,并預測各上層指標的概率分布,是突發(fā)水污染風險預測研究的主要內容。馬爾科夫鏈是一種研究隨機問題的預測方法,具有較高的預測精度:貝葉斯網絡是概率論與圖形理論結合起來表達和推理計算不確定概率性事物的網絡結構,廣泛用于人工智能、診斷分析、數據挖掘等領域。本研究對馬爾科夫鏈和貝葉斯網絡方法進行融合,摒棄馬爾科夫鏈不能分析風險原因和貝葉斯網絡預測能力差的不足,充分利用二者的優(yōu)勢,提出了從縱、橫兩方面進行突發(fā)水污染風險預測的新方法,并進行了案例驗證和推理。
1 研究方法
1.1 馬爾科夫鏈預測
一般情況下,在當前狀態(tài)(in)已知的條件下,將來的狀態(tài)(in+1)可能與過去的狀態(tài)i0,i1,…,in-1)有關,也可能無關。對隨機過程{Xn|n∈T;i0,i1,…,in∈I},若條件概率滿足關系式P{Xn+1=in+1|X0=i0,X1=i1,…,Xn=in}=P{Xn+1=in+1|Xn=in},即與過去狀態(tài)無關,則稱隨機過程{Xn|n∈T}為馬爾科夫鏈,并將上述特性稱為馬氏性或無后效性。在馬爾科夫鏈預測模型中,轉移概率決定著馬氏鏈的統(tǒng)計規(guī)律,對任意的n∈T和狀態(tài)i∈I、j∈I,稱Pij(n)=P(Xn+1=j|xn=i)為馬爾科夫鏈的轉移概率。
應用馬爾科夫鏈預測模型的前提條件是隨機過程具有馬氏性,通常用統(tǒng)計量X2來檢驗隨機序列是否具有馬氏性X2的計算公式為式中:fij為狀態(tài)i轉移到狀態(tài)j的次數;Pj為(fij)n×n的第J列之和同各行各列總和的比值,即PJ=pij為狀態(tài)i轉移到狀態(tài)j的概率,即
選擇置信度χ,查X2分布概率表得X2χ[(n-1)2]。若X2>X2[(n-1)2],則隨機過程{Xn|n∈T}具有馬氏性。
采用馬爾科夫鏈預測的步驟:①劃分狀態(tài):②計算每個指標的狀態(tài)轉移概率矩陣:③檢驗初始數據序列是否具有馬氏性,若有則繼續(xù)下一步,若無則去除該指標因素;④選取初始狀態(tài)進行預測;⑤結果分析。
1.2 貝葉斯網絡
貝葉斯網絡(Bayesian Networks,BN)又稱信度網絡或因果網絡,是為解決概率論中聯(lián)合概率計算問題而產生的,是描述數據變量之間依賴關系的一種圖形模型,也是一種用來進行推理的模型。采用框架結構來表示因果關系,邏輯清晰,便于人們理解變量間的復雜關系,常用于不確定環(huán)境建模和推理。
貝葉斯網絡就是一個有向無環(huán)圖和模型參數的集合,信息表達由兩部分組成:一是網絡結構(有向無環(huán)圖)。網絡中的每個節(jié)點代表一個變量,節(jié)點間的有向弧表示二者因果關系,由起因節(jié)點指向結果節(jié)點,體現了領域知識的定性特征:二是網絡參數(條件概率分布表),體現領域知識的定量特征。在概率推理中,用隨機變量代表事件或事物,通過將隨機變量轉化成各種實例,就可以將一系列事件或事物的現有狀態(tài)模型化。
貝葉斯網絡預測的步驟:①確定網絡節(jié)點及值域:②建立網絡結構:③設置預測條件概率:④貝葉斯網絡推理預測。
1.3 馬爾科夫鏈和貝葉斯網絡的融合
馬爾科夫鏈是一種依據已知數據樣本來探索變量未來狀態(tài)的縱向預測方法,貝葉斯網絡則是一種依據時間序列信息來展示指標因子間相互影響關系的橫向預測方法。融合這兩種方法,可以預測指標體系中各節(jié)點事件的后驗概率,以實現對事物風險的宏觀、全面和定量預測,為風險決策者提供有效的決策依據。二者的融合,不僅突出動態(tài)層次結構,還能夠更有效地利用動態(tài)時序信息。
馬爾科夫鏈和貝葉斯網絡融合的預測步驟:①建立貝葉斯網絡模型:②分析指標因素并獲取數據,檢驗數據序列是否具有馬氏性,若有則繼續(xù)下一步,若無則篩除該指標因素:③利用馬爾科夫鏈對底層指標進行預測:④將馬爾科夫鏈預測結果作為證據輸入貝葉斯網絡模型;⑤用貝葉斯網絡推理對上層指標進行預測。
2 突發(fā)水污染事故風險預測實例
2.1 建立貝葉斯網絡結構
2.1.1 確定網絡節(jié)點
從人為因素、機械設備因素和環(huán)境因素三方面分析導致突發(fā)水污染事故的原因,經過多次篩選,最終確定14個網絡節(jié)點,見表1。
2.1.2 建立網絡結構
通過分析每一起突發(fā)水污染事故發(fā)生的因果,綜合所有事故樣本的因果鏈,建立圖1所示的流域突發(fā)水污染事故貝葉斯網絡結構。
2.2 數據來源
突發(fā)水污染事故一旦發(fā)生就會造成巨大損失,但通常不易發(fā)生,因此將其視為布爾變量,即變量取值為0和10表示不發(fā)生或沒發(fā)生,1表示發(fā)生。本研究主要依托“流域突發(fā)水污染風險分區(qū)分級方法研究”課題,對《黃河突發(fā)水污染事件調查研究報告》中的84起黃河突發(fā)水污染事故(見表2)進行分析。
2.3 馬爾科夫鏈預測
2.3.1 馬氏性檢驗
依據表2,構造各指標的概率轉移矩陣:式中:Pij=fij/fi,fi為狀態(tài)i出現的總次數,fij為狀態(tài)i轉移到狀態(tài)j的次數。
采用式(1)計算可得:X2(Hl)=6.904,X2(H2)=0.240,X2(H3)=12.224,X2(H4)=2.980,X2(Ml)=4.316,X2(M2)=14.268,X2(M3)=2.840,X2(M4)=2.840,X2(El)=4.364,X2(E2)=3.036。
取顯著性水平χ=0.1,則x20.1[(2—1)2]=X20.1(1)=2.710。除指標“信息上報不及時H2”外,所有指標的X2值都大于2.710,即除H2外其余指標都具有馬氏性,可進行馬爾科夫鏈預測。
2.3.2 馬爾科夫鏈預測
所有具有馬氏性的變量的狀態(tài)可用矩陣形式表示,即發(fā)生=[10]、不發(fā)生=[01]。據相關研究20,三步預測結果精度高、誤差小,所以采用三步預測。記初始狀態(tài)矩陣為N,轉移矩陣為P,則三步預測公式為
M預測=N初始P3
(2)
選取2012年的狀態(tài)作為初始狀態(tài),預測2015年突發(fā)水污染事故發(fā)生概率,結果見表3。由表3可知,馬爾科夫鏈預測結果與實際情況吻合程度較高,故其可作為初始證據用于貝葉斯網絡推理。
2.4 貝葉斯網絡預測
貝葉斯網絡具有概率的傳播性,若初始條件概率已知,則可得到各個節(jié)點的概率。本文采用genie軟件將表3中馬爾科夫鏈預測的2015年的根節(jié)點狀態(tài)概率作為證據輸入到已設置參數的貝葉斯網絡模型,得到2015年的各上層指標的風險概率(即各節(jié)點的后驗概率)條形圖,見圖2。由圖2可知,黃河流域突發(fā)水污染事故發(fā)生概率為68%,人為因素造成突發(fā)水污染事故的概率為52%,機械設備因素造成突發(fā)水污染事故的概率為29%,環(huán)境因素導致突發(fā)水污染事故的概率為12%。
2.5 結果分析
根據圖2,逆向推理便可得出貝葉斯網絡結構中人為、機械設備和環(huán)境這三方面因素各自的薄弱環(huán)節(jié),對薄弱環(huán)節(jié)應重點控制?!叭藶橐蛩豀”節(jié)點有違規(guī)操作H、管理力度欠缺H3和防范不足H4三個父節(jié)點,后驗概率依次為42%、12%和11%,控制措施先后次序為Hl、H3、H4?!皺C械設備因素M”節(jié)點有管道破裂Ml、設備裝置故障M2、運輸T具故障M3和儲罐或油爐爆炸M4四個父節(jié)點,后驗概率依次為17%、13%、3%和3%,控制措施先后次序為Ml、M2、M3和M4?!碍h(huán)境因素E”節(jié)點有極端天氣El、自然災害E2兩個父節(jié)點,后驗概率依次為2%、11%,控制措施先后次序為E2、El。
3 結論
將馬爾科夫鏈和貝葉斯網絡預測方法融合并應用于突發(fā)水污染事故風險因子概率預測,得出如下結論。
(1)二者融合的預測新方法充分體現了馬爾科夫鏈縱向預測底層指標狀態(tài)的準確性和貝葉斯網絡橫向預測上層指標后驗概率的優(yōu)點,克服了突發(fā)水污染事故指標體系中因上層指標數據缺乏而不能預測的問題。
(2)人為因素是導致黃河流域突發(fā)水污染事故發(fā)生的最主要因素,誘發(fā)概率為52%;機械設備因素是次要因素,誘發(fā)概率為29%:環(huán)境因素誘發(fā)概率為12%。確定的各類底層指標因素預控措施的優(yōu)先次序,可作為突發(fā)水污染事故防制和控制的參考依據。
(3)在大樣本數據下,馬爾科夫一貝葉斯網絡模型能充分挖掘數據信息并準確分析事由。本研究樣本欠缺,致使某些指標不具備馬氏性及事故風險因素概率分布的準確度可能不高,但為突發(fā)水污染事故的風險分析提供了新方法。未來研究中,應增加樣本數,以提高風險預測的準確性。