韓正強 鄧景毅
當一個國家的人均GDP進入3000美元區(qū)域時,各種突發(fā)事件會集中爆發(fā),我國每年由此造成的經(jīng)濟損失達到GDP總量的5%,加強對突發(fā)事件的應(yīng)急管理已經(jīng)成為我國各級政府的重要工作內(nèi)容和目標。針對各類突發(fā)事件進行科學的風險分析,有利于提高應(yīng)急決策水平,優(yōu)化應(yīng)急資源配置,進而降低災害損失,實現(xiàn)組織的應(yīng)急管理目標。
在災害的演化研究中,人們往往更多地關(guān)注事件的異常性,如病毒基因的變異,兩架飛機同時改變著陸機場而導致的空難。但是,隨著研究的逐步深入,人們越來越認識到:災害的損失與其產(chǎn)生的原因不存在比例關(guān)系,一些大的災難往往是由于微小的干擾引起的,如導致美國航天飛機失事的O型圈事件;幾乎導致美蘇核戰(zhàn)爭的熊事件。對于該類事件,Perrow(1981)稱之為正常事件(Normal Accident)。因此,在突發(fā)事件的研究中,我們可以界定這樣一類系統(tǒng),在這類系統(tǒng)中,存在大量的干擾,其發(fā)生的數(shù)量是隨機的,這些干擾如果得不到及時處理,會對系統(tǒng)的生存造成重要影響,當這些干擾不斷集聚,達到一定閾值時(本文的第三部分應(yīng)用系統(tǒng)動力學仿真方法驗證了閾值的存在性),將導致突發(fā)性的災害事件,我們稱之為干擾聚集系統(tǒng)。
本文以干擾聚集系統(tǒng)為研究對象,首先闡述了干擾聚集系統(tǒng)的基本概念,然后應(yīng)用系統(tǒng)動力學仿真模型驗證了干擾聚集系統(tǒng)中閾值的存在性;進而應(yīng)用極值理論對干擾聚集系統(tǒng)突發(fā)事件的發(fā)生概率進行定量分析;最后對全文進行了總結(jié),并展望了未來的研究方向。
陳長坤等(2009)對危機事件的演化進行了分類;羅成琳等(2009)認為突發(fā)事件演化存在生命周期;孫康等(2006)利用一般模仿者動態(tài)模型和博弈論分析了群體性突發(fā)事件的演化過程;Rudolph等(2002)進行了災害動力學的研究。從目前的研究來看,對于復雜系統(tǒng)(特別是包含人類行為的復雜系統(tǒng))的演化研究,主要以定性分析居多,定量分析較少。
突發(fā)事件風險分析大部分針對某一專門領(lǐng)域,而且自然領(lǐng)域居多,社會領(lǐng)域較少。其中,季學偉等(2009)應(yīng)用概率函數(shù)、層次分析等方法確定了火災、地震等原生災害引起的次生事件的發(fā)生概率;Sun等(2009)應(yīng)用復雜神經(jīng)網(wǎng)絡(luò)對巖層突裂進行了預測;GuiKema(2009)利用統(tǒng)計學習理論對自然災害導致的關(guān)鍵基礎(chǔ)設(shè)施失效進行了風險分析;Iman和Eyke(2007)則采用基于模糊概率的方法對自然災害進行風險評估;Jiang等(2009)對馬來西亞的洪災地區(qū)進行了實證分析,證實了模糊數(shù)學理論在洪災風險評估中的有效性。關(guān)于社會系統(tǒng)的突發(fā)事件風險定量分析未見相關(guān)文獻。
干擾聚集系統(tǒng)首先是一個社會系統(tǒng),控制人員在系統(tǒng)中負責處理各種干擾,但是單位時間內(nèi)人的處理能力是有限的,當人的處理能力達到極限而干擾仍然在不斷增加時,系統(tǒng)將發(fā)生災難崩潰;其次,干擾聚集系統(tǒng)中的要素眾多,各種要素都存在失效的可能性,一旦失效或者未按照人們的預期工作,將產(chǎn)生各種干擾,等待系統(tǒng)控制人員進行處理以恢復正常;最后,系統(tǒng)產(chǎn)生的干擾,人們在理性的條件下能夠?qū)ζ溥M行處理,但是,尋找干擾產(chǎn)生的根源以及處理這些干擾需要時間和其他資源(包括物質(zhì)和信息),在時間壓力和資源有限的情況下,會導致處理失誤。航天飛機、核電站、大型計算機網(wǎng)絡(luò)均可以看作這類系統(tǒng)。
干擾的聚集導致系統(tǒng)的突發(fā)災害事件。耶魯大學社會學家Perrow(1999)指出,這些干擾是不可避免的,而且連續(xù)不斷地以一種常態(tài)的形式發(fā)生。Rudolph(2002)則強調(diào)干擾的數(shù)量是導致突發(fā)災害的重要因素。當系統(tǒng)中的干擾不斷發(fā)生時,系統(tǒng)控制人員分析和解決這些問題,使系統(tǒng)穩(wěn)定在某一平衡態(tài),遠離臨界點??刂迫藛T的問題解決能力(行為)與自身的能力有關(guān),也與其所處的外部環(huán)境壓力有關(guān),行為與外部環(huán)境壓力之間的關(guān)系可以用Yerkes-Dodson曲線描述。由于干擾聚集系統(tǒng)中干擾在某一時刻的發(fā)生數(shù)量是隨機的,而控制人員的行為也難以使用數(shù)學函數(shù)進行精確定義和描述,因此通過精確的確定性數(shù)學模型求解干擾聚集系統(tǒng)閾值顯得非常困難,而建立基于系統(tǒng)動力學的仿真模型是可供選擇的方法。依據(jù)Forrest(1961)和Sterman(2000)提供的系統(tǒng)動力學方法,在Rudolph(2002)的基礎(chǔ)上,本文針對干擾聚集系統(tǒng)完成了系統(tǒng)動力學仿真建模和分析。
(一)模型的假設(shè)
干擾聚集系統(tǒng)是復雜大系統(tǒng),考慮所有與突發(fā)事件相關(guān)的因素是不現(xiàn)實的。為使模型便于系統(tǒng)仿真,并且盡可能與實際相吻合,本文作如下假設(shè):
1)模型主要考察干擾數(shù)量導致的突發(fā)事件,而由于干擾相互作用引起的異常事件(NovelEvent),模型不予考察。主要原因在于:首先模型的目的是驗證和確定干擾導致突發(fā)災害在數(shù)量上的閾值;其次干擾相互作用導致異常事件的機理目前尚不能確定,更無法進行定量分析;最后控制人員能否處理異常事件以及所占用的資源難以確定,這將導致后續(xù)模擬仿真無法進行。因此,盡管某些突發(fā)事件的主要因素是異常事件,但本模型不進行分析。
2)壓力是單位時間內(nèi)發(fā)生的干擾總和與控制人員的處理能力的比值。一旦單位時間內(nèi)干擾的發(fā)生頻率大于控制人員的處理能力,就會對控制人員造成壓力??刂迫藛T承受的壓力與處理能力的關(guān)系遵循Yerkes-Dodson法則。
3)控制人員在處理干擾時會發(fā)生錯誤,錯誤以一定的概率發(fā)生。錯誤發(fā)生后需要重新再處理,處理的時長不發(fā)生變化。不考慮處理錯誤帶來的后續(xù)關(guān)聯(lián)影響。
(二)系統(tǒng)動力學流圖
系統(tǒng)動力學流圖的相關(guān)變量如下:
Interruption Arrival Rate:干擾到達率(流);
Interruption Resolution Rate:干擾處理率(流);
Interruption Pending:未處理的干擾(水準);
Error:由于不正確處理產(chǎn)生的錯誤(流);
Error FeedBack:錯誤反饋(輔助變量);
Desired Resolution Time:系統(tǒng)期望處理時間(常量);
Desired Resolution Rate:系統(tǒng)期望處理率(輔助變量);
Normal Rate:控制人員的正常處理率(常量);
Stress:壓力(輔助變量)。
其中,壓力和干擾的處理率之間的關(guān)系見下圖。鑒于篇幅,相關(guān)的系統(tǒng)動力學方程和初始設(shè)置略。
圖1 擾聚集系統(tǒng)系統(tǒng)動力學流圖
(三)系統(tǒng)仿真結(jié)果與分析
基于以上系統(tǒng)動力學方程和系統(tǒng)動力學流圖,使用STELLA 9.0軟件進行系統(tǒng)動力學仿真(STELLA 9.0是iSee Systems公司的系統(tǒng)分析軟件之一,是目前商業(yè)領(lǐng)域應(yīng)用最為廣泛的系統(tǒng)動力學軟件之一)。在仿真過程中,脈沖分析是常見的系統(tǒng)輸入分析方法。我們對干擾到達率設(shè)置了脈沖,第一次設(shè)置的脈沖值為正常值的200%,第二次設(shè)置的脈沖為正常值的300%,脈沖持續(xù)時間均為1單位。仿真結(jié)果見圖2(為便于兩次仿真的比較,本文采用數(shù)據(jù)表方式進行仿真輸出后,應(yīng)用EXCEL2003繪制仿真結(jié)果圖)。
圖2 兩次不同脈沖輸入的系統(tǒng)仿真結(jié)果
基于以上系統(tǒng)仿真結(jié)果,我們可以得到以下結(jié)論:
1)當脈沖值比較小時,系統(tǒng)具有自我調(diào)節(jié)功能,經(jīng)過一段時間后由于脈沖導致的對系統(tǒng)的影響將逐漸減小直至消失。
2)當脈沖值比較大時,系統(tǒng)將喪失自我恢復功能,系統(tǒng)中的干擾將不斷積聚,直至最后系統(tǒng)崩潰。顯然,在此二值之間存在一個閾值θ(例中,脈沖的閾值為5.4左右),當脈沖越過θ時,系統(tǒng)無法自我恢復。
3)從干擾曲線來看,其曲率的極性并非一直保持不變。存在臨界時刻,在此時刻之前(大致對應(yīng)圖中第7單位時間),系統(tǒng)均有可能恢復至穩(wěn)定態(tài)。因此,在處理突發(fā)事件時,可以依據(jù)此時刻作為參考來判斷是應(yīng)該放棄系統(tǒng)以保存力量還是全力以赴使系統(tǒng)恢復正常。
4)在高壓力下,控制人員干擾處理率的急劇下降是導致曲線尾部上翹的重要原因。通過各種訓練,提高控制人員在高壓力下的處理能力可以改善閾值。
依據(jù)具體環(huán)境,應(yīng)用各種隨機數(shù)發(fā)生器產(chǎn)生符合某種分布(如泊松分布)的隨機數(shù)進行仿真,其結(jié)果將更加貼合實際。鑒于本部分的目的在于——證明干擾聚集系統(tǒng)中干擾閾值θ的存在性以及應(yīng)用系統(tǒng)仿真確定閾值θ的可行性,本文對此不作深入探討。
通過系統(tǒng)動力學仿真確定的干擾聚集系統(tǒng)的閾值,為分析干擾聚集系統(tǒng)突發(fā)事件的發(fā)生概率及其風險分析提供了基礎(chǔ)。正常情況下,在某一時間段內(nèi),超過某一閾值θ的概率應(yīng)該非常低(否則這一系統(tǒng)會不斷的發(fā)生崩潰),我們可以將其認為是極端事件。極值理論是針對這些極端異常事件進行統(tǒng)計分析的較為有效的工具。
(一)模型的假設(shè)
為計算和求解干擾聚集系統(tǒng)突發(fā)事件的發(fā)生概率和進行風險分析,在第三部分假設(shè)的基礎(chǔ)上,增加如下假設(shè):
1)完成干擾的處理后,將形成新的干擾聚集系統(tǒng)。新系統(tǒng)的任意時刻干擾發(fā)生的數(shù)量與原系統(tǒng)具有相同的分布,即底分布保持不變。
2)單位時間段內(nèi),觀測到的干擾發(fā)生數(shù)量的極值是獨立的。
上述假設(shè)使系統(tǒng)滿足極值理論的應(yīng)用條件。
(二)基于閾值μ的極值分布
經(jīng)典的極值模型所使用的數(shù)據(jù)是某一組或者一個區(qū)段的若干數(shù)據(jù)中的最大值或者最小值,這將導致這些數(shù)據(jù)中包含的信息不能被充分利用。因此,一般考慮超過某一閾值μ的觀測值,這些觀測值的極限服從Pareto分布。由于此處的閾值與導致干擾聚集系統(tǒng)突發(fā)事件的閾值是不同的概念,因此分別使用μ和θ表示。Pareto分布定義如下:
假設(shè)xt(t=1,2,…n)為隨機變量X在時刻t的觀測值,將各觀測值按降序排序得xi(i=1,2,…n),其中x1≥x2…≥xn,則有:
其中,μ∈R為位置參數(shù),σ>0為尺度參數(shù),ξ∈R為形狀參數(shù)。
通過變換可以得到,干擾聚集系統(tǒng)突發(fā)事件的概率為:
若需要控制p,以使突發(fā)事件的概率控制在一定的范圍內(nèi),則其對應(yīng)的分位數(shù)為:
當廣義Pareto分布可以作為超過閾值μ超過量的有效近似時,那么對于一個更高的閾值θ的超過量也服從廣義Pareto分布。兩者的形狀參數(shù)ξ相同,尺度參數(shù)存在以下關(guān)系:
由此可知,平均超出量函數(shù)為:
以上各式中,(2)式用于確定系統(tǒng)突發(fā)事件的發(fā)生概率;(3)和(5)用于確定系統(tǒng)風險和對系統(tǒng)干擾處理率的改進。
(三)閾值μ的選擇
閾值μ的選擇對于整個模型的建立至關(guān)重要。取值太大,會導致超過量太少,使得參數(shù)估計量的方差變大;取值太小,則容易產(chǎn)生有偏的參數(shù)估計?,F(xiàn)有的μ值確定方法有:Hill法;平均剩余壽命圖法;二次子樣試算法等。
(四)參數(shù)的估計
閾值模型的常用參數(shù)估計方法包括:極大似然估計和回歸方法。其中,極大似然估計具有良好的性質(zhì),被廣泛使用。依據(jù)廣義Pareto分布的定義,容易得到其對數(shù)似然函數(shù)為:
通過數(shù)值方法可以求解極大似然估計σ,ξ。
(五)數(shù)據(jù)分析
1.數(shù)據(jù)說明
本文選取來自某集團公司的資訊管理部門1998-2000年的數(shù)據(jù)作為原始數(shù)據(jù)(該時間段內(nèi),資訊管理部門的設(shè)備數(shù)量基本維持穩(wěn)定)。部門負責整個公司信息設(shè)備的維修和維護工作,員工21人,其所負責維修和維護的信息設(shè)備共計3771臺(件),包括各種型號的計算機、軟件系統(tǒng)(ERP系統(tǒng)、電子郵件系統(tǒng)、考勤系統(tǒng)等)、網(wǎng)絡(luò)設(shè)備、服務(wù)器、通訊設(shè)備等。將每天發(fā)生的設(shè)備故障視為各種干擾,這些干擾由資訊管理部門負責處理和解決,干擾得不到及時處理將導致公司的各級管理部門和生產(chǎn)部門的工作延誤和決策失誤,給公司造成巨大損失。計算機病毒在局域網(wǎng)范圍內(nèi)的大量傳播以及網(wǎng)絡(luò)擁塞造成的電子郵件系統(tǒng)故障、ERP系統(tǒng)故障均可以認為是突發(fā)事件。我們假定每一員工的工作能力和技術(shù)水平是同質(zhì)的,這樣每一次維修或維護的時長便可作為基本單位進行累加計算。另外,在數(shù)據(jù)的選取時,我們只確定有效維修或維護時間,依據(jù)這一原則對其中的一些數(shù)據(jù)作了相關(guān)的技術(shù)處理(如由于缺少相關(guān)硬件,需要等待采購,導致名義維修時間大于有效維修時間)。
2.計算結(jié)果與分析
圖3是針對所有數(shù)據(jù)作的散點圖,統(tǒng)計數(shù)據(jù)見表1。
!!!"#$%&’
圖3 有效時間散點圖
依據(jù)式(5)可知,如果對于某個閾值μ,超出量分布近似服從廣義Pareto分布,則平均超出量函數(shù)應(yīng)該在一條直線附近波動。從圖中可以看出,μ應(yīng)該取在149附近,超出該值的數(shù)據(jù)有128個。圖5和圖6的形狀參數(shù)估計和位置參數(shù)估計圖進一步驗證了該值
圖4 平均超出量分布圖
圖5 位置參數(shù)圖
圖6 形狀參數(shù)圖
由圖5和圖6以及計算機分析結(jié)果可知:
%D ow nLo dddd dddd dddd e ! " #ad Cod e dddd ! " #
圖7 概率圖
圖8 分位數(shù)圖
圖9 重現(xiàn)期水平圖
圖10 密度圖
由此可知,干擾聚集系統(tǒng)突發(fā)事件的概率為:
從圖7和圖8可以看出,樣本點均分布在直線附近,因此通過PP圖和QQ圖均不能否定所擬合的模型;由于ξ<0,因此相應(yīng)分布的支撐存在有限上界,重現(xiàn)水平圖與這一結(jié)論吻合。密度曲線的估計也與直方圖吻合較好。因此,四個診斷圖均支持擬合的Pareto型超閾值分布。
基于以上分析可知,當給定相應(yīng)的干擾閾值θ,代入(7)式,即可計算出相應(yīng)的突發(fā)事件發(fā)生概率,以上例計,若θ取180小時,則突發(fā)事件的概率大約為萬分之四,重現(xiàn)期為196年左右;若要求該類事件的發(fā)生概率小于萬分之一,則相應(yīng)的閾值應(yīng)該取182.5左右,此時,閾值的增加將導致突發(fā)事件的發(fā)生概率成倍減少,因此,增加培訓,提高干擾處理水平對于降低系統(tǒng)風險效果非常明顯。
復雜系統(tǒng)演化的深入分析對于突發(fā)事件應(yīng)急管理具有重要意義。微小擾動因素的不斷集聚最終導致突發(fā)事件的產(chǎn)生。分析表明,通過系統(tǒng)動力學仿真確定干擾聚集系統(tǒng)的閾值,然后依據(jù)閾值確定突發(fā)事件的發(fā)生概率并且進行相應(yīng)的風險分析是可行的。結(jié)論也表明控制人員在壓力條件下處理能力的提升將能夠成倍地降低系統(tǒng)風險,這與實際相吻合。但是,在干擾聚集系統(tǒng)模型中,各種干擾的相互影響被忽略,而這一因素在某些系統(tǒng)中是至關(guān)重要的,如何確定各種干擾的相互影響并建立相應(yīng)的分析模型是下一步的研究方向。