王敬,王全鳳
(1.中冶建筑研究總院有限公司,北京 100088;2.華僑大學土木工程學院,福建 泉州 362021)
復雜系統(tǒng)風險分析的模擬方法
王敬1,王全鳳2
(1.中冶建筑研究總院有限公司,北京 100088;2.華僑大學土木工程學院,福建 泉州 362021)
采用粗糙集理論進行知識約簡并選擇主要風險因素,應用神經(jīng)網(wǎng)絡理論方法尋找主要風險因素與總體風險之間的模糊關系模型.最后,采用蒙特卡羅方法模擬系統(tǒng)總體風險的概率分布,形成復雜系統(tǒng)風險分析的集成模擬方法.通過水利生態(tài)系統(tǒng)實例驗證,證明該方法是合理且可行的.
知識約簡;粗糙集;風險分析;神經(jīng)網(wǎng)絡;蒙特卡羅仿真
對復雜系統(tǒng)的風險分析,主要是解決以下3個方面的問題:(1)風險因素的辨識及主要風險因素的確定;(2)如何根據(jù)主要風險因素的水平來表達系統(tǒng)整體風險的水平,即整體風險的評估;(3)如何尋找系統(tǒng)風險的概率分布,對風險的重要性作出判斷.近年來,我國已經(jīng)實施或者正在規(guī)劃一系列流域生態(tài)環(huán)境恢復水資源保障計劃.對水利生態(tài)系統(tǒng)分析的目標,就是尋求系統(tǒng)的最優(yōu)發(fā)展路徑.這個目標具有一定的模糊性和不確定性,無法用簡單的函數(shù)表達.水利生態(tài)系統(tǒng)初始狀態(tài)向目標狀態(tài)轉移的路徑集合中,各條路徑成為最優(yōu)路徑概率不同,因此需要將不同路徑的風險水平引入系統(tǒng)可持續(xù)發(fā)展測度的計算中.即將研究目標轉化為評估系統(tǒng)不同發(fā)展路徑的風險水平,并以此進行水利生態(tài)系統(tǒng)的可持續(xù)狀態(tài)分析.本文通過近代數(shù)學方法,對水利生態(tài)復雜多樣的系統(tǒng)進行風險分析.
粗糙集是一種處理不精確、不確定與不完全數(shù)據(jù)的新的數(shù)學理論[1-5].知識約簡是粗糙集理論的核心內(nèi)容之一.通過知識簡約可以在復雜、繁多、變化的知識庫中進行知識挖掘,尋找并確定解決問題所需的充分必要的條件(因素),為解決問題提供基礎依據(jù).文中所研究的問題為完備信息系統(tǒng),因此,只討論完備信息系統(tǒng)的知識約簡問題.
1.1 完備信息系統(tǒng)的知識約簡[2]
定義1 設S=(U,A,F(xiàn))是一個信息系統(tǒng),其中U為對象集,A為屬性集,A={a1,a2,…,am},F(xiàn)為U與A之間的關系集,即F={fl∶U→Vl},其中Vl為al(l≤m)的值域.
定義2 設S=(U,A,F(xiàn)),至少存在一個α∈A T,使得Vl含有空值,則稱知識表達系統(tǒng)S為不完備信息系統(tǒng);否則,稱S為完備信息系統(tǒng).
對于完備信息系統(tǒng),通過建立區(qū)分矩陣來計算區(qū)分函數(shù),由區(qū)分函數(shù)的值確定信息系統(tǒng)的約簡與核,從而實現(xiàn)信息系統(tǒng)的知識約簡.
(1)區(qū)分矩陣與區(qū)分函數(shù).
定義3 設S=(U,A,F(xiàn)),則區(qū)分矩陣是一個n×n的對稱矩陣,矩陣中的任意元素為
定義4對每一個屬性a指定一個布爾變量α,若α(x,y)={α1,α2,…,αk}≠Φ,則令α(x,y)=1.區(qū)分函數(shù)可定義為
(2)約簡與核.區(qū)分函數(shù)Δ的極小析取范式中,所有合取式是屬性集A的所有約簡.核是區(qū)分矩陣中所有單個元素組成的集合,即
定理1 定義red(A)為A的所有約簡,由此可得核與約簡的關系為
core(A)=∩red(A).
1.2 知識約簡步驟
在整個模型的運行過程中,存在著以下不同環(huán)節(jié)的風險.這些環(huán)節(jié)包括[6]:(1)制度設計與執(zhí)行環(huán)節(jié);(2)水利-生態(tài)系統(tǒng)供需水量優(yōu)化配置環(huán)節(jié);(3)社會-生態(tài)-經(jīng)濟績效及發(fā)展狀態(tài)分析環(huán)節(jié).
這些環(huán)節(jié)涉及自然、社會、經(jīng)濟、工程、管理等多種因素,匯集所有的風險因素,就構成了水利生態(tài)系統(tǒng)的風險因素集.這些因素主要包括以下16項:(1)可調(diào)用水量,包括來水的不確定性因素;(2)水利生態(tài)工程對徑流的控制能力;(3)水庫對生態(tài)供水的調(diào)控能力;(4)水土流失風險;(5)法律、法規(guī)風險因素;(6)生態(tài)系統(tǒng)需水量;(7)水利生態(tài)績效分析方法的科學性;(8)生態(tài)用水價格變化;(9)各相關部門的協(xié)調(diào)管理風險因素;(10)水利生態(tài)系統(tǒng)運行所需資金的籌措和使用風險;(11)社會道德風險.(12)人口總量及增幅對生態(tài)系統(tǒng)的消耗;(13)牲畜總量及增幅對生態(tài)系統(tǒng)的消耗;(14)生態(tài)水權的定位和執(zhí)行風險;(15)生態(tài)系統(tǒng)服務功能價值計算體系的完善程度;(16)跨流域調(diào)水量,即對于使用跨流域調(diào)水量需要考慮跨流域調(diào)入水量存在的風險.
對于不同的水利生態(tài)系統(tǒng),以上風險因素根據(jù)具體情況有所不同,應該按照實際情況考慮.文中的案例沒有跨流域調(diào)水量,因此,去掉需要考慮跨流域調(diào)入水量存在的風險,則確定該水利生態(tài)系統(tǒng)的風險由其余的15個評價指標構成.即A={a1,a2,…,a15}.按照風險因素對系統(tǒng)目標的影響程度,取風險評語集為V={很大,大,中,?。?,并按照上述理論進行知識約簡.
按照該水利生態(tài)系統(tǒng)的具體情況,根據(jù)不同的來水頻率(η)、調(diào)水方案(A:水源獨立供水;B:水源獨立供水;A+B:水源聯(lián)合調(diào)度)、生態(tài)補水路線(3條)、生態(tài)水權狀態(tài)、生態(tài)需水量(V)大小等,可形成多種運行方案.選取其中9個方案進行分析,U={x1,x2,…,x9},如表1所示.
表1 方案簡表Tab.1 Projects
通過專家調(diào)查、打分,獲得各個方案風險因素的評語集,如表2所示.為說明問題及節(jié)省篇幅,以下取x1,x2,x3方案進行詳細分析.
表2 方案與風險因素關系表Tab.2 Relationship between project and risk factor
(1)依據(jù)給定的關系表,計算區(qū)分矩陣中各元素的值,列出區(qū)分矩陣為
由區(qū)分矩陣,計算區(qū)分函數(shù),有
(2)根據(jù)區(qū)分函數(shù)的值,找出信息系統(tǒng)的所有約簡為{a1},{a6},{a9},{a10},{a11},{a14},{a15}.
(3)從信息系統(tǒng)所有約簡中,按照找出信息系統(tǒng)的核.由于從所有信息系統(tǒng)的約簡中找不出核,所以約簡后信息系統(tǒng)的屬性取為a1,a6,a9,a10,a11,a14,a15.
(4)根據(jù)定義,按照核或約簡中包含的元素,列出約簡后的關系表(限于篇幅,略去).
通過9個方案約簡后,最終屬性集合變?yōu)锳={a1,a6,a9,a10,a11,a14},即該屬性集合中的元素是主要風險因素.
主要風險因素確定后,即可建立其與整體風險水平的關系.采用風險效用來表示系統(tǒng)的整體風險[7].風險效用是指對主要風險因素所導致系統(tǒng)可能偏離目標程度的判斷.如果用U表示風險效用,用Z=(z1,z2,…,zn)表示主要風險因素,則兩者之間的關系為
一般情況下,由于項目的復雜性,以及各種因素的相互作用等影響,主要風險因素與項目總體風險之間并不能直接用數(shù)學表達式(函數(shù)式)表達,即f一般無法得到具體的關系.為了形成一種具有普遍意義的方法,采用神經(jīng)網(wǎng)絡方法建立主要風險因素與風險效用之間的關系.
2.1 主要風險因素標準化與概率分析
2.1.1 主要風險因素量化 因素屬性分為效益型、成本型等多種類型.類型不同,對屬性值的要求也不相同.為了更好地進行神經(jīng)網(wǎng)絡訓練與模擬,對涉及的兩種主要風險因素進行標準化分析.
(1)效益型.其量化值計算方法為
(2)成本型.其量化值計算方法為
上兩式中:Zj,aj分別為風險因素的第j個量化標準值和評估值,n為方案數(shù)量;bj=max(aj)或bj=,而為因素的理想點.
2.1.2 主要風險因素的概率分析 確定風險事件的概率分布通常有3種方法[6],即根據(jù)歷史資料確定風險事件的概率分布、利用理論概率分布和主觀概率法.對于具有長系列資料的因素,通過分析,可直接選用概率統(tǒng)計中的概率分布進行風險估計.當沒有足夠的資料來確定風險事件概率分布時,可利用理論概率分布或主觀估計的方法對其進行估計.
水資源風險估計中常用的概率分布有正態(tài)分布、對數(shù)分布、皮爾遜Ⅲ型分布等.在獲得的信息不夠充分的條件下,需要根據(jù)主觀判斷和近似的方法來確定概率分布.由于水利生態(tài)實踐的時間較短,對風險因素概率的分布研究缺乏足夠的統(tǒng)計資料和數(shù)據(jù)分析成果,因此可以采用推斷、主觀判斷和理論概率分布等方法表達各因素的概率分布.文中風險因素的概率分布主要采用[0,1]均勻分布,如z1,z2,z3,z4,z5,以及[0,1]區(qū)間內(nèi)分段取定值分布,如z6.
2.2 效用-風險因素關系神經(jīng)網(wǎng)絡模擬模型
2.2.1 風險模擬的神經(jīng)網(wǎng)絡結構[8]選擇基本的BP網(wǎng)絡作為解決實際問題的工具,通過對訓練樣本的學習、誤差反饋、逐漸逼近并形成模型,其結構關系是通過組織輸入層與隱含層、隱含層與輸出層間的連接關系來實現(xiàn)的.輸入層中,神經(jīng)元個數(shù)與主要風險因素個數(shù)n相同;輸出層中,風險效用U即輸出層的神經(jīng)元個數(shù)為1;隱含層神經(jīng)元的個數(shù)尚無統(tǒng)一的確定方法,視具體情況由訓練過程確定.
2.2.2 網(wǎng)絡學習樣本的確定及網(wǎng)絡訓練
(1)學習樣本的輸入.經(jīng)過知識約簡后,取可調(diào)用水量,生態(tài)系統(tǒng)需水量、各相關部門的協(xié)調(diào)能力、水利生態(tài)建設、運行所需資金的籌措和使用風險、社會道德風險生態(tài)水權等6個為主要風險因素.將其作為輸入向量,經(jīng)過排序、量化、歸一化后,結果如表3所示.
表3 風險因素相對數(shù)值Tab.3 Relative values of risk factor
(2)學習樣本的輸出.根據(jù)上述9個方案的主要風險因素的取值,采用專家調(diào)查方法,可分別獲得9個方案x1~x9的風險效用U:0.305 3,0.523 5,0.911 2,0.813 4,0.751 1,0.755 6,0.278 9,0.356 7,0.400 1.
(3)神經(jīng)網(wǎng)絡收斂結果.以表3及風險效用值為樣本,采用Matlab程序庫中函數(shù)訓練的BP網(wǎng)絡模型,建立輸入層為6個單元,隱含層為2個單元,輸出層為1個單元的BP神經(jīng)網(wǎng)絡模型.神經(jīng)網(wǎng)絡訓練收斂過程,如圖1所示.圖1中:T為精度值;n為循環(huán)次數(shù).
圖1 神經(jīng)網(wǎng)絡訓練收斂過程Fig.1 Convergence process of training of neural network
2.3 基于蒙特卡羅模型的風險概率模擬
水利生態(tài)可持續(xù)發(fā)展方案風險分析是多因素多目標風險問題,直接由各主要風險因素的概率分布組合求出風險目標的理論概率分布很困難.這是因為確定各主要風險因素的理論概率分布存在困難;而且對于多因素的聯(lián)合概率分布的確定就更困難.鑒于此,采用蒙特卡羅模擬技術[9]進行風險目標的概率分布分析.
設效用與主要風險因素之間函數(shù)關系如式(4),按照主要風險因素的概率分布,抽取一組隨機變量(z1,z2,…,zn)的值,按照訓練完成的神經(jīng)網(wǎng)絡模型確定U的值.反復獨立抽樣(模擬)多次,便可得到函數(shù)的一批抽樣數(shù)據(jù).當模擬次數(shù)滿足預定的精度要求時,便可給出與實際情況相近的函數(shù)U的概率分布及其數(shù)字特征,即完成了系統(tǒng)的風險估計.模擬得到的水利生態(tài)系統(tǒng)的風險概率分布圖,如圖2所示.
2.4 系統(tǒng)風險評價
在風險估計的基礎上,通過系統(tǒng)風險效用值及系統(tǒng)風險的概率分布對系統(tǒng)的風險狀態(tài)進行綜合分析,可以得到不同方案水利生態(tài)系統(tǒng)的風險水平.風險水平可定義為
對于給定的方案i,其風險效用值為Ui(由神經(jīng)網(wǎng)絡模型得到),頻率為Pi(由圖2給出),則該方案的風險水平為Vi.Vi反映了風險的相對嚴重性.Vi越小說明系統(tǒng)的風險水平越低,系統(tǒng)越可靠;反之亦然.有時風險的效用值Ui很大,但由于出現(xiàn)的概率較低,風險水平并不高;而有時效用值Ui并不大,但由于出現(xiàn)的概率較高,風險水平并不低,系統(tǒng)的可靠性不高.
對于上述案例,通過模擬可得到不同方案風險的相對排序為
V2>V9>V8>V1>V6>V5>V7>V4>V3.
說明,方案3的風險水平最低,而方案2的風險水平最高.
圖2 水利生態(tài)系統(tǒng)的風險概率分布圖Fig.2 Distribution of risk probability for water conservancy ecosystem
復雜系統(tǒng)一般都具有多屬性、空間尺度和時間延伸性共同作用,以及在系統(tǒng)運行過程中多環(huán)節(jié)、多主體的特點,導致對這種系統(tǒng)的風險評價十分復雜.文中以水利生態(tài)系統(tǒng)風險分析為例,通過粗糙集理論、神經(jīng)網(wǎng)絡和蒙特卡羅等方法的集成,形成一種基于知識簡約、神經(jīng)網(wǎng)絡模型和蒙特卡羅模擬的復雜系統(tǒng)的風險分析方法.水利生態(tài)系統(tǒng)風險分析的驗證結果表明,通過不同方案風險水平的計算,可直觀地比較不同方案的風險影響程度,為復雜系統(tǒng)的風險分析提供一種新方法.
[1]MI Ju-sheng,WU Wei-zhi,ZHANG Wen-xiu.Approaches to knowledge reduction based on variable precision rough set model[J].Information Sciences,2004,159(3/4):255-272
[2]張文修,仇國芳.基于粗糙集的不確定決策[M].北京:清華大學出版社,2005.
[3]YAHIA M E,MAHMOD R,SULAIMAN N.Rough neural expert systems[J].Expert Systems with Applications,2000,18(2):87-99.
[4]張文修,吳偉志,梁吉業(yè),等.粗糙集理論與方法北京[M].北京:科學出版社,2001.
[5]方千山.粗糙集理論在模糊隸屬函數(shù)辨識中的應用[J].華僑大學學報:自然科學版,2003,24(1):33-38.
[6]王敬.水利生態(tài)系統(tǒng)可持續(xù)發(fā)展研究[D].北京:華北電力大學,2007.
[7]沈建明.項目風險管理[M].北京:機械工業(yè)出版社,2003.
[8]樓順天,施陽.基于MATLAB的系統(tǒng)分析與設計:神經(jīng)網(wǎng)絡[M].西安:西安電子科技大學出版社,1999.
[9]LIU J S.科學計算中的蒙特卡羅策略(英文影印版)[M].北京:世界圖書出版社,2005.
Simulation Method for Risk Analysis in Complex System
WANG Jing1,WANG Quan-feng2
(1.Central Research Institute of Building and Construction CO.L TD.MCC Group,Beijing 100088,China;2.College of Civil Engineering,Huaqiao University,Quanzhou 362021,China)
The rough set theory(RST)is used as knowledge reduction and the selection of main risk factors.The fuzzy relationship model between main risk factors and overall risk is established by artificial neural network(ANN).The probability distribution of overall system risk is simulated by Monte Carlo method,an integrated simulation method is proposed for complex system risk analysis.The method is reasonable and feasible by verification of water conservancy ecosystem.
knowledge reduction;rough set;risk analysis;artificial neural network;Monte Carlo simulation
TV 213.4;TP 18
A
1000-5013(2010)03-0337-05
(責任編輯:黃仲一 英文審校:方德平)
2009-05-05
王全鳳(1945-),男,教授,主要從事土木工程的研究.E-mail:qfwang@hqu.edu.cn.
水利部水利生態(tài)績效審計評價基金資助項目(040310)