李拴虎 高立新 丁風(fēng)和 陳立峰 楊紅櫻
(中國呼和浩特010010內(nèi)蒙古自治區(qū)地震局)
?
用于地震參數(shù)估算的兩種貝葉斯概率算法分析*
李拴虎*高立新 丁風(fēng)和 陳立峰 楊紅櫻
(中國呼和浩特010010內(nèi)蒙古自治區(qū)地震局)
概率估算 貝葉斯概率 先驗(yàn)概率 似然概率
貝葉斯概率算法(Beyesian probability algorithm)是一種通用的框架, 整合了先驗(yàn)概率和似然概率各自的優(yōu)點(diǎn), 并能根據(jù)數(shù)據(jù)的具體情況作出相應(yīng)調(diào)整, 確保計算結(jié)果的合理性. 該算法除了用于河流溶解氧含量的估算(Patil, Deng, 2011)、 樁基礎(chǔ)的可靠性評估(Zhangetal, 2006)、 合成孔徑雷達(dá)圖像的重建(Vuetal, 2013)和海上鉆井風(fēng)險性的量化評價(Khakzadetal, 2013)以外, 也被應(yīng)用于諸如地震邊坡失穩(wěn)的評估(Songetal, 2012)、 地震對結(jié)構(gòu)脆弱性的影響分析(Koutsourelakis, 2010)以及活斷層的參數(shù)估算(Amighpeyetal, 2014)等方面的地震研究.
相對于貝葉斯概率算法, 先驗(yàn)概率和似然概率方法具有一定的局限性. 基于“理論”的先驗(yàn)概率(prior probability)是在缺乏統(tǒng)計數(shù)據(jù)的情況下描述一個事件, 具有較強(qiáng)的假設(shè)性. 先驗(yàn)概率可以分為兩類: 利用歷史資料計算得到的先驗(yàn)概率, 稱為客觀先驗(yàn)概率; 當(dāng)歷史資料無從獲取或資料不完全時, 僅憑主觀經(jīng)驗(yàn)判斷而得到的先驗(yàn)概率, 稱為主觀先驗(yàn)概率. 基于“真實(shí)”數(shù)據(jù)的似然概率(likelihood probability)是對事件的真實(shí)統(tǒng)計, 要求大量的實(shí)測數(shù)據(jù)支撐. 貝葉斯概率算法是一種簡單有效的算法, 通常被用來描述一個隨機(jī)變量, 特別是在樣本有限的情況下. 不同于僅取決于樣本數(shù)量的經(jīng)典統(tǒng)計方法, 貝葉斯概率算法是結(jié)合先驗(yàn)信息(經(jīng)驗(yàn), 判斷等)和樣品數(shù)量得到估算結(jié)果, 其評價結(jié)果值同樣也不是一個事件“真實(shí)”的計算結(jié)果, 而是一個概率值. 本文重點(diǎn)研究用于地震參數(shù)估算的兩種貝葉斯概率算法, 即震源到站點(diǎn)的距離概率和區(qū)域發(fā)震概率, 并通過兩個實(shí)例驗(yàn)證其合理性.
在概率地震危險性分析(probabilistic seismic hazard analysis, 簡寫為PSHA)中用到的震源到站點(diǎn)的距離函數(shù), 通常使用假定地震在研究區(qū)域內(nèi)“均勻分布”的模式(Kramer, 1996), 在目前的震源距離函數(shù)計算中廣為使用(Chengetal, 2007; Wangetal, 2013). 雖然“非均勻分布”模式如平滑算法, 也經(jīng)常被推薦使用(Frankel, 1995), 但同質(zhì)化假設(shè)仍然是震源模型的現(xiàn)行標(biāo)準(zhǔn)之一, 而且并不是每個模型的開發(fā)均能滿足平滑算法的要求. 一般情況下, 地震并不會均勻地分布在研究區(qū)域, 均勻假設(shè)顯然不符合實(shí)際情況. 圖1a為內(nèi)蒙古河套斷陷帶區(qū)域的震源和地震臺站的分布示意圖, 圖1b為該研究區(qū)的“理論”震源分布, 可以看出其具有離散性和網(wǎng)格化的特征.
圖1 研究區(qū)的實(shí)際震源(a)與理論震源(b)的分布特征
“均勻分布”的理論算法和“非均勻分布”的平滑算法在實(shí)際應(yīng)用中均有涉及, 其優(yōu)缺點(diǎn)均比較明顯, 理論距離算法的均勻分布假設(shè)并未得到有效的驗(yàn)證, 平滑距離算法的缺點(diǎn)是沒有足夠的實(shí)際觀測數(shù)據(jù)支撐. 在這種情況下, 引入貝葉斯概率算法, 不僅能表示震源到站點(diǎn)的距離, 也能表示各種源到點(diǎn)的距離, 最常用于破裂距離等參數(shù)的計算(Chengetal, 2007; Kaklamanosetal, 2011). 參考Ang和Tang(2007)提出的理論公式, 根據(jù)P(A|B)·P(B)=P(B|A)P(A)建立在條件假設(shè)概率基礎(chǔ)上的基本準(zhǔn)則, 推導(dǎo)出貝葉斯概率f(Di|O)為
(1)
式中,f(Di)為理論距離概率函數(shù)的先驗(yàn)信息,f(O|Di)為基于實(shí)際觀測值O和距離Di基礎(chǔ)上的似然概率,f(Di|O)為后驗(yàn)概率. 已知f(O)=∑f(O|Di)f(Di)(Ang, Tang, 2007), 式(1)可以改寫為
(2)
圖2 先驗(yàn)概率、 似然概率和貝葉斯概率的計算值比較Fig.2 Comparison of the calculated values of the prior probability (squares), likelihood probability (circles) and Beyesian probability (triangles)
圖2給出了內(nèi)蒙古河套斷陷帶區(qū)域地震數(shù)據(jù)的先驗(yàn)概率、 似然概率和貝葉斯后驗(yàn)距離概率的計算值. 由于同質(zhì)假設(shè)或理論分布并不能真實(shí)地反映實(shí)際情況, 因此使用似然概率和先驗(yàn)概率兩種方法得到的計算結(jié)果具有不同程度的差異. 需要注意的是, 貝葉斯后驗(yàn)概率值不一定處于先驗(yàn)概率值與似然概率值之間; 在40 km和180 km處, 利用貝葉斯概率算法得到的概率值更大, 但其總體趨勢與似然概率接近, 可靠性優(yōu)于先驗(yàn)概率的計算結(jié)果.
ML≥6.0大地震的發(fā)生概率是評價區(qū)域地震危險性的重要參數(shù), 而該參數(shù)的計算需要具有百年時間尺度的數(shù)據(jù), 但是在當(dāng)前條件下, 儀器記錄的可靠地震數(shù)據(jù)只有幾十年, 這使得沒有足夠的數(shù)據(jù)來計算大地震發(fā)生的真實(shí)概率. 例如, 在常規(guī)統(tǒng)計和有限數(shù)量觀測值的情況下, 假設(shè)過去50年內(nèi)沒有記錄到大地震的相關(guān)數(shù)據(jù), 則發(fā)震概率估算值為0, 這顯然會直接導(dǎo)致計算結(jié)果產(chǎn)生較大誤差, 甚至出現(xiàn)錯誤的結(jié)果. 因此, 在觀測數(shù)據(jù)有限的條件下引入計算地震發(fā)生概率的貝葉斯算法, 可以減小由于時間尺度過短和數(shù)據(jù)量不足等方面帶來的誤差. 這是一個計算區(qū)域地震發(fā)生概率平滑函數(shù)的方法, 其關(guān)鍵是利用鄰區(qū)的地震信息作為先驗(yàn)信息, 重新分配目標(biāo)區(qū)域的觀測數(shù)據(jù). 圖3a給出了內(nèi)蒙古—寧夏—甘肅交界帶地震數(shù)據(jù)的分區(qū)統(tǒng)計, 9個區(qū)塊分別表示1900年以來各區(qū)塊內(nèi)所發(fā)生的ML≥6.0地震事件個數(shù), 其中5個區(qū)塊(E2,E3,E4,E6,E8)的數(shù)值為0, 表示研究時段內(nèi)該區(qū)塊未記錄到地震事件; 但是, 地震發(fā)生概率計算應(yīng)當(dāng)是一個長周期的統(tǒng)計結(jié)果, 顯然0事件的記錄不符合實(shí)際情況.
圖3 各區(qū)塊內(nèi)ML≥6.0地震事件的分布(a)和貝葉斯算法平滑之后得到的發(fā)震概率(b)
針對似然概率和先驗(yàn)概率的不足, 貝葉斯概率算法可以解決該問題. 對于不連續(xù)及非規(guī)律性事件, 貝葉斯概率算法的公式為
(3)
式中:A為概率質(zhì)量函數(shù)的計算參數(shù),A=0或A=1;n為A的數(shù)量, 本例中n=2;B為觀測值, 本例中B=0或B=1;P′(Ai)和P″(Ai)分別為先驗(yàn)和后驗(yàn)概率(平滑率). 若不把周圍區(qū)塊的事件作為先驗(yàn)信息, 單獨(dú)考慮E3一個區(qū)塊, 則基于E3和相鄰3個區(qū)塊(E2,E5和E6)的信息, 當(dāng)A=1時,E3內(nèi)的發(fā)震概率只有0.25, 因?yàn)镋3及相鄰3個區(qū)塊中僅在E2一個區(qū)塊內(nèi)記錄到1900年以來的一次地震; 當(dāng)A=0時,E3塊體內(nèi)的發(fā)震概率為0.75, 因?yàn)樵贓3周邊有兩個區(qū)塊未記錄到地震. 假設(shè)地震的復(fù)發(fā)性符合泊松分布, 則E3區(qū)塊內(nèi)的似然概率計算如下:
(4)
(5)
式(4)和(5)是泊松概率計算, 其概率質(zhì)量模型可表示為
(6)
式中,y為泊松隨機(jī)變量X的平均值. 將似然概率和先驗(yàn)概率代入式(3)計算后驗(yàn)概率, 當(dāng)A=1時, 根據(jù)
(7)
即可計算出E3區(qū)塊的發(fā)震概率為0.11, 相比簡單的似然概率計算值0.37, 該值相對符合實(shí)際情況.
發(fā)震概率計算中的貝葉斯方法是一種典型的后驗(yàn)算法, 由似然概率衍生而來, 通過對每個區(qū)塊的類似計算即可得到如圖3b所示的平滑結(jié)果. 由此可見, 這種貝葉斯算法提供了一個區(qū)塊發(fā)震概率的平滑計算方法, 在數(shù)據(jù)有限的情況下, 可以得到更加有意義的估算值, 而不是簡單的0或1概率事件.
綜上所述, 在數(shù)據(jù)量嚴(yán)重不足的情況下, 根據(jù)實(shí)測數(shù)據(jù)計算的似然概率方法是最不準(zhǔn)確的, 而先驗(yàn)概率方法更具有適用性; 但是偏“理論”性的先驗(yàn)算法也不具有普遍適用性, 該算法基于各種穩(wěn)態(tài)分布的概率模型, 在非規(guī)律性(連續(xù)性)事件概率計算中有時與實(shí)際情況偏離較大. 而貝葉斯概率算法作為一種估算概率, 并非事件的“真實(shí)”計算結(jié)果, 其實(shí)質(zhì)是組合了先驗(yàn)信息與似然概率各自的優(yōu)點(diǎn), 在實(shí)測數(shù)據(jù)量不足和事件離散性較大的情況下, 具有更好的適用性.
Amighpey M, Voosoghi B, Motagh M. 2014. Deformation and fault parameters of the 2005 Qeshe earthquake in Iran revisited: A Bayesian simulated annealing approach applied to the inversion of space geodetic data[J].IntJApplEarthObservGeoinf, 26(1): 184--192.
Ang A H S, Tang W H. 2007.ProbabilityConceptsinEngineering:EmphasisonApplicationstoCivilandEnvironmentalEngineering[M]. New York: John Wiley & Sons: 1--420.
Cheng C T, Chiou S J, Lee C T, Tsai Y B. 2007. Study on probabilistic seismic hazard maps of Taiwan after Chi-Chi earthquake[J].JGeoEng, 2(1): 19--28.
Frankel A. 1995. Mapping seismic hazard in the central and eastern United States[J].SeismolResLett, 66(4): 8--21.
Kaklamanos J, Baise L G, Boore D M. 2011. Estimating unknown input parameters when implementing the NGA ground-motion prediction equations in engineering practice[J].EarthqSpectra, 27(4): 1219--1235.
Khakzad N, Khan F, Amyotte P. 2013. Quantitative risk analysis of offshore drilling operations: A Bayesian approach[J].SafetySci, 57: 108--117.
Koutsourelakis P S. 2010. Assessing structural vulnerability against earthquakes using multidimensional fragility surfaces: A Bayesian framework[J].ProbEngMech, 25(1): 49--60.
Kramer S L. 1996.GeotechnicalEarthquakeEngineering[M].Upper Saddle River, NJ: Prentice Hall: 1--653.
Patil A, Deng Z Q. 2011. Bayesian approach to estimating margin of safety for total maximum daily load development[J].JEnvironManage, 92(3): 910--918.
Song Y Q, Gong J H, Gao S, Wang D C, Cui T J, Li Y, Wei B Q. 2012. Susceptibility assessment of earthquake-induced landslides using Bayesian network: A case study in Beichuan, China[J].CompGeosci, 42(5): 189--199.
Vu D, Xue M, Tan X, Li J. 2013. A Bayesian approach to SAR imaging[J].DigSignalProc, 23(3): 852--858.
Wang J P, Huang D, Cheng C T, Shao K S, Wu Y C, Chang C W. 2013. Seismic hazard analysis for Taipei City including deaggregation, design spectra, and time history with Excel applications[J].CompGeosci, 52(1): 146--154.
Zhang L M, Li D Q, Tang W H. 2006. Impact of routine quality assurance on reliability of bored piles[J].JGeotechnGeoenvironEng, 132(5): 622--630.
Application of two Bayesian probability algorithms to the estimation of earthquake parameters
Li Shuanhu*Gao Lixin Ding Fenghe Chen Lifeng Yang Hongying
(EarthquakeAdministrationofInnerMongoliaAutonomousRegion,Hohhot010010,China)
probability estimation; Bayesian probability; priori probability; likelihood probability
研究簡報
內(nèi)蒙古自治區(qū)地震局局長基金課題(2016YC01)資助.
2016-03-22收到初稿, 2016-06-13決定采用修改稿.
10.11939/jass.2016.06.015
P315.08
A
李拴虎, 高立新, 丁風(fēng)和, 陳立峰, 楊紅櫻. 2016. 用于地震參數(shù)估算的兩種貝葉斯概率算法分析. 地震學(xué)報, 38(6): 952--955. doi:10.11939/jass.2016.06.015.
Li S H, Gao L X, Ding F H, Chen L F, Yang H Y. 2016. Application of two Bayesian probability algorithms to the estimation of earthquake parameters.ActaSeismologicaSinica, 38(6): 952--955. doi:10.11939/jass.2016.06.015.
*通訊作者 e-mail: lizhengke06@126.com