李蒙,丁凌靈,林從謀
(華僑大學(xué) 土木工程學(xué)院,福建 廈門(mén)361021)
近年來(lái),人員疏散問(wèn)題一直面臨著嚴(yán)峻的挑戰(zhàn).尤其是當(dāng)?shù)刭|(zhì)災(zāi)害發(fā)生時(shí),一些場(chǎng)所由于人口稠密等原因?qū)е率枭⑹謸頂D,一旦人群中發(fā)生擁擠踐踏事件,后果十分嚴(yán)重.地質(zhì)災(zāi)害的發(fā)生常常具有突發(fā)性,提前作出預(yù)測(cè)并及時(shí)采取有效、合理的人員疏散方案有其必要性.目前,針對(duì)人員疏散的研究可大體分為兩類:一類是關(guān)于數(shù)學(xué)理論在人員疏散中的應(yīng)用;另一類是利用元胞自動(dòng)機(jī)(CA)來(lái)模擬人員疏散的過(guò)程.彭華等[1]利用平面解析幾何知識(shí)為解決緊急疏散情況下的路徑規(guī)劃問(wèn)題,提出一種新的算法;李?。?]則介紹了國(guó)內(nèi)外常用的疏散模型算法,并比較分析出最優(yōu)的算法,利用仿真軟件具體標(biāo)定了算法中的參數(shù),為建模及計(jì)算提供了參考;周金旺等[3]應(yīng)用元胞自動(dòng)機(jī)模擬了行人疏散的過(guò)程;宋偉等[4]用元胞自動(dòng)機(jī)建立了人員的疏散模型;任書(shū)君等[5]則將元胞自動(dòng)機(jī)與Agent技術(shù)相結(jié)合來(lái)研究人員的疏散過(guò)程;何大治等[6]從子空間網(wǎng)絡(luò)方面建立了人員的疏散模型.以上方法雖對(duì)人員疏散過(guò)程進(jìn)行了較好地描述或模擬,但都沒(méi)有將人的行為因素考慮在疏散過(guò)程中,模擬結(jié)果可能存在較大的偏差.本文認(rèn)為地質(zhì)災(zāi)害中人員疏散也可看作一個(gè)演化博弈過(guò)程[7-8].因此,提出一種基于演化博弈的地質(zhì)災(zāi)害人員疏散仿真,結(jié)合演化博弈將人的行為因素補(bǔ)充到人員疏散的過(guò)程中.
假定在一個(gè)時(shí)間步長(zhǎng)內(nèi),每個(gè)個(gè)體隨機(jī)選擇另一個(gè)個(gè)體,并觀察其行為模式.當(dāng)個(gè)體之間的行為模式相差不超過(guò)其觀測(cè)距離時(shí),個(gè)體之間的行為模式會(huì)發(fā)生變化.假設(shè)每個(gè)個(gè)體為一個(gè)智能體Agent,那么Agent之間的行為模式會(huì)按照一定的比例更接近對(duì)方,也有可能完全趨同.假設(shè)每個(gè)Agent在逃生的過(guò)程中,都會(huì)對(duì)逃生方向及方法持有自己的行為模式,令行為模式為I,I∈(0,1).
若從人員中任意選擇某兩個(gè)個(gè)體Agent,他們各自的行為模式用Xi和Xj表示,其行為模式的觀測(cè)距離為d,則當(dāng)d>|Xi-Xj|時(shí),這兩個(gè)個(gè)體才能夠進(jìn)行行為模式的交互.再假設(shè)行為模式之間的交互比例為p,兩者進(jìn)行交互后,各自的行為模式為
改變p值可以獲得不同性質(zhì)的群體.極端情況下,當(dāng)p=0時(shí),參與交互的雙方不發(fā)生行為模式的改變;當(dāng)p=1時(shí),一方完全轉(zhuǎn)變?yōu)榱硪环降男袨槟J?一般情況下,當(dāng)p=1/2時(shí),是指交互雙方均將發(fā)生一定的行為模式的改變,而改變值為其行為模式距離的算術(shù)平均值.
地質(zhì)災(zāi)害有多種,以山體滑坡為例,假設(shè)山體上已經(jīng)出現(xiàn)滑坡趨勢(shì)時(shí),人群中會(huì)出現(xiàn)兩類個(gè)體:A類和B類.每個(gè)個(gè)體都會(huì)對(duì)自己的行為模式(假定為是否逃生及逃生的路線和方法)持有自己的觀點(diǎn),A類個(gè)體I,I∈(0.5,1),B類個(gè)體I,I∈(0,1).如果兩類個(gè)體隨機(jī)地一一配對(duì),則可以構(gòu)成了無(wú)數(shù)同質(zhì)且獨(dú)立的博弈單元.
若A類個(gè)體對(duì)于信息具有一定的優(yōu)勢(shì),如年齡較大的個(gè)體有過(guò)躲避山體滑坡的經(jīng)驗(yàn),或受過(guò)一定的逃生培訓(xùn),具有一定的逃生知識(shí),或掌握正確及時(shí)資訊的個(gè)體,而B(niǎo)類個(gè)體則不具備此優(yōu)勢(shì).當(dāng)山體滑坡發(fā)生時(shí),A類個(gè)體與A類個(gè)體進(jìn)行配對(duì),假定不會(huì)發(fā)生行為模式的交互,此時(shí)p=0;而當(dāng)A類個(gè)體與B類個(gè)體配對(duì)時(shí),A類個(gè)體選擇說(shuō)服B類個(gè)體的概率為q,選擇不說(shuō)服的概率為1-q.B類個(gè)體也會(huì)采取相應(yīng)的策略,那么B類個(gè)體選擇相信的概率為i,選擇不相信的概率為1-i.由于天氣對(duì)災(zāi)害的發(fā)生會(huì)造成影響,天氣良好,山體滑坡不發(fā)生的概率為j,山體滑坡如預(yù)期發(fā)生的概率為1-j.
當(dāng)與選擇說(shuō)服策略的A類個(gè)體配對(duì)的B類個(gè)體,選擇相信A類個(gè)體.若因天氣良好,山體滑坡不發(fā)生,那么對(duì)于A類個(gè)體,除了得到固有收益之外,還可能會(huì)得到額外收益S(S=1/d),同時(shí)A類個(gè)體也要付出說(shuō)服成本C,則A類個(gè)體的總收益為R+S-C,而B(niǎo)類個(gè)體可能獲得收益r,也可能因疏散造成家中無(wú)人而財(cái)物意外損失u,B類個(gè)體的總收益為r-u;若山體滑坡如預(yù)期發(fā)生,則B類個(gè)體有損失v(如房屋受損,但人身安全得到保障).如果B類個(gè)體對(duì)A類個(gè)體的選擇策略是不相信,對(duì)于A類個(gè)體,除了得到固有收益R之外,同樣付出了說(shuō)服成本C,則其收益是R-C;若因天氣良好,山體滑坡不發(fā)生,則B類個(gè)體可能獲得收益r,B類個(gè)體的總收益為r;若山體滑坡如預(yù)期發(fā)生,則B類個(gè)體有損失V.
當(dāng)A類個(gè)體選擇不說(shuō)服的策略時(shí),A類個(gè)體的收益仍然為R,如果B類個(gè)體選擇盲目相信的策略,此時(shí)若跟著A類個(gè)體的疏散行為模式,若因天氣良好,山體滑坡不發(fā)生,B類個(gè)體可能獲得收益r[8],也可能因疏散造成家中無(wú)人而財(cái)物意外損失u,B類個(gè)體的總收益為r-u;若山體滑坡如預(yù)期發(fā)生,則B類個(gè)體有損失V.但若是跟錯(cuò)了個(gè)體,跟著自己同類的個(gè)體則可能有被誤導(dǎo)的可能性,從而造成一定的損失d,其中,d為兩個(gè)隨機(jī)選出個(gè)體之間的行為模式距離的絕對(duì)值.假設(shè)A類個(gè)體在疏散群體中所占的比例為k∈(0,1),而群體總數(shù)為n,則此時(shí)B類個(gè)體的收益期望值為r(k/n)-d(1-k)/n;如果B類個(gè)體選擇不相信的策略,則A類個(gè)體的收益仍然為R,若因天氣良好,山體滑坡不發(fā)生,則B類個(gè)體可能獲得收益r,B類個(gè)體的總收益為r;若山體滑坡如預(yù)期發(fā)生,則B類個(gè)體有損失V.假設(shè)A類個(gè)體的可能獲得收益與其付出成本成比例C=x/d.
在上述假定的情況下,每個(gè)個(gè)體的收益不僅與自己的選擇有關(guān),也與和自己博弈的對(duì)方的選擇有關(guān),還與天氣狀況有關(guān).分別計(jì)算每類個(gè)體的期望收益和平均收益.
A類個(gè)體的收益為
當(dāng)UA(說(shuō)服)不等于UA(不說(shuō)服)時(shí),得益較差的一方早晚會(huì)發(fā)現(xiàn)得益的差異,從而在再次面對(duì)災(zāi)害時(shí),改變自己的策略,模仿得益較好的另一類型.因此,說(shuō)服與不說(shuō)服兩種類型的個(gè)體的比例是隨時(shí)間變化的函數(shù),分別為q(t)和1-q(t),則說(shuō)服博弈方的動(dòng)態(tài)變化速度可用復(fù)制動(dòng)態(tài)方程表示為[9]
根據(jù)動(dòng)態(tài)方程,如果x=i,則dq/dt始終為0,所有q都是穩(wěn)定狀態(tài),意味著只有比例為q的A類個(gè)體選擇說(shuō)服策略,其余個(gè)體均選擇不說(shuō)服策略.如果x>i,Q(x)<0,則q=0,q=1是q的兩個(gè)穩(wěn)定狀態(tài),其中q=0是演化穩(wěn)定狀態(tài),所有A類個(gè)體均選擇不說(shuō)服策略.若x<i,Q(x)>0,則q=0,q=1是q的兩個(gè)穩(wěn)定狀態(tài),其中q=1是演化穩(wěn)定狀態(tài),所有A類個(gè)體均選擇說(shuō)服策略[10].
同理可得,B類個(gè)體的收益為
根據(jù)動(dòng)態(tài)方程,如果x=j(luò),則dq/dt始終為0,所有i都是穩(wěn)定狀態(tài),意味著只有比例為i的B類個(gè)體選擇相信策略,其余個(gè)體均選擇不相信策略.如果x>j,I(x)<0,則i=0,i=1是i的兩個(gè)穩(wěn)定狀態(tài),其中i=0是演化穩(wěn)定狀態(tài),所有B類個(gè)體均選擇不相信策略.若x<j,I(x)>0,則i=0,i=1是i的兩個(gè)穩(wěn)定狀態(tài),其中i=I是演化穩(wěn)定狀態(tài),所有B類個(gè)體均選擇相信策略.當(dāng)博弈達(dá)到均衡時(shí),也即A類和B類個(gè)體之間的觀點(diǎn)趨向一致.
采用連續(xù)的疏散模型,利用Repast仿真工具進(jìn)行仿真.A類個(gè)體的疏散觀點(diǎn)定義在(0.5,1)區(qū)間內(nèi);B類個(gè)體的疏散觀點(diǎn)定義在(0,1)區(qū)間內(nèi);個(gè)體個(gè)數(shù)為N.其中,A類個(gè)體占個(gè)體總數(shù)比例為y,B類個(gè)體占1-y,每個(gè)個(gè)體在初始狀態(tài)隨機(jī)的選擇觀點(diǎn)值,每次博弈時(shí),在A類和B類的個(gè)體中隨機(jī)選擇,每個(gè)個(gè)體選擇自己的觀點(diǎn),并進(jìn)行疏散觀點(diǎn)的交互,將相應(yīng)改變自己的觀點(diǎn)值.假設(shè)每個(gè)個(gè)體在博弈過(guò)程中所選擇的觀點(diǎn)與他們以前和其他個(gè)體交互所采取的觀點(diǎn)所獲得的收益有關(guān).
取N=100,y=0.5,R=1,r=0.5,V=0.5,u=0.21作為初始情況,疏散模型演化圖如圖1所示.由圖1可知:隨著交互次數(shù)的增加,每個(gè)個(gè)體的疏散觀點(diǎn)會(huì)逐漸演化,收斂形成幾個(gè)觀點(diǎn)群體,經(jīng)過(guò)一段時(shí)間后,最終達(dá)成觀點(diǎn)統(tǒng)一,形成一個(gè)觀點(diǎn)群體.
圖1 初始情況疏散模型演化圖Fig.1 Initial evolution chart of evacuation model
由圖1中觀點(diǎn)演化的情況表明:在剛開(kāi)始的時(shí)候,由于B類個(gè)體選擇相信策略的收益并不高,而A類個(gè)體為了減少不必要的損失而選擇不說(shuō)服策略,B類個(gè)體由于信息方面不具有優(yōu)勢(shì),隨機(jī)選擇觀點(diǎn),但隨著時(shí)間的推移,A類個(gè)體發(fā)現(xiàn)選擇說(shuō)服策略可以獲得更大的利益,B類個(gè)體則發(fā)現(xiàn)選擇相信策略比不相信策略的收益大,因而疏散觀點(diǎn)逐漸演化合并,最終形成一個(gè)統(tǒng)一的觀點(diǎn).
當(dāng)增加B類個(gè)體選擇相信策略的收益r,會(huì)發(fā)現(xiàn)收斂時(shí)間得以提前,可以更快捷有效地疏散人群.例如,取N=100,y=0.5,R=1,r=0.7,V=0.5,u=0.2,仿真圖如圖2所示.
圖2 增加B類個(gè)體仿真圖Fig.2 Simulation of increasing agent B
由圖2可知:由于B類個(gè)體選擇相信策略的收益提高,所以B類個(gè)體會(huì)更多地選擇相信策略,相應(yīng)的,A類個(gè)體為了獲得最大的收益,在一開(kāi)始便大量使用說(shuō)服策略,從而疏散觀點(diǎn)的交互過(guò)程較為簡(jiǎn)單,疏散觀點(diǎn)可以很快達(dá)到一致,交互時(shí)間得到大量減少.
當(dāng)減少A類個(gè)體選擇說(shuō)服策略的收益R,發(fā)現(xiàn)導(dǎo)致疏散觀點(diǎn)一片混亂,最終沒(méi)有達(dá)成一致.例如,取N=100,y=0.5,R=0.5,r=0.5,V=0.5,u=0.2,仿真圖如圖3所示.
圖3 減少A類個(gè)體仿真圖Fig.3 Simualtion of decreasing agent A
由圖3可知:由于A類個(gè)體選擇說(shuō)服策略的收益降低,所以A類個(gè)體出于獲得最大的收益的考慮,選擇說(shuō)服策略的機(jī)率也大幅降低,將有大量A類個(gè)體選擇不說(shuō)服策略,也會(huì)有大量B類個(gè)體選擇不相信策略,從而會(huì)出現(xiàn)多個(gè)疏散觀點(diǎn)群體.
疏散策略收斂的時(shí)間與A,B兩類個(gè)體的比例有直接的關(guān)系,例如,當(dāng)分別取y=0.3,y=0.5,y=0.7,而其他參數(shù)不變,即N=100,R=1,r=0.5,V=0.5,u=0.2,仿真圖如圖4所示.圖4中:n為仿真次數(shù);t為收斂時(shí)間.
圖4 y對(duì)收斂時(shí)間的影響Fig.4 Influence of yon convergence time
由圖4可知:隨著A類個(gè)體占總體比例的減少,即對(duì)信息擁有優(yōu)勢(shì)的個(gè)體在人群中的比例的減少,遇到的選擇相信策略的B類個(gè)體的概率也降低,從而造成疏散觀點(diǎn)收斂時(shí)間變長(zhǎng),疏散時(shí)間也相應(yīng)變長(zhǎng),反之則變短.
將個(gè)體異質(zhì)性引入個(gè)體的行為中,提出演化博弈收益函數(shù),模擬仿真博弈模型,得到以下4點(diǎn)結(jié)論.
1)由于受教育程度和社會(huì)關(guān)系等因素的不同,受災(zāi)人員中必然會(huì)有一些人具有信息優(yōu)勢(shì),當(dāng)其中一部分人發(fā)現(xiàn)適當(dāng)透露自己已知的信息去說(shuō)服別人可能獲得超額利益,他們可能會(huì)繼續(xù)采取說(shuō)服策略.
2)信息劣勢(shì)者發(fā)現(xiàn)選擇相信后能夠提高收益,減少損失,會(huì)繼續(xù)相信并吸引更多人追隨前者,反過(guò)來(lái)也激勵(lì)更多信息優(yōu)勢(shì)者選擇說(shuō)服策略,從而實(shí)現(xiàn)博弈均衡.
3)提出一個(gè)基于演化博弈論的災(zāi)害人員疏散仿真模型,與其他的人員疏散仿真模型不同的是,考慮了個(gè)體的消息不對(duì)稱問(wèn)題,通過(guò)個(gè)體的不同選擇,使得模型可以更好地研究個(gè)體行為對(duì)逃生結(jié)果的影響,從而制定出更加有效的疏散方案.
4)不同策略的收益、具有信息優(yōu)勢(shì)者的比例等因素均對(duì)災(zāi)害人員的疏散過(guò)程有著顯著的影響.
[1] 彭華,許斌,羅燦華,等.一種基于幾何方法的人員疏散多威脅規(guī)劃算法[J].建筑科學(xué),2010(3):84-86.
[2] 李俊.體育場(chǎng)館人員疏散時(shí)間數(shù)學(xué)模型研究[J].哈爾濱商業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2011,27(2):13-20.
[3] 周金旺,陳秀麗,孔令江,等.基于元胞自動(dòng)機(jī)的行人流疏散模擬研究[J].廣西師范大學(xué)學(xué)報(bào):自然科學(xué)版,2008,26(4):14-17.
[4] 宋偉,李美彥,胡曉琴.基于元胞自動(dòng)機(jī)的人員疏散微觀仿真[J].交通科技與經(jīng)濟(jì),2011,65(3):85-88.
[5] 任書(shū)君,汪波,歐陽(yáng)朝輝,等.基于Agent和元胞自動(dòng)機(jī)的人員疏散過(guò)程建模與仿真[J].福建電腦,2011,27(3):99-101.
[6] 何大治,謝步瀛.基于子空間網(wǎng)絡(luò)的人員疏散模型[J].工程圖學(xué)學(xué)報(bào),2009,12(2):24-26.
[7] 韓少春,劉云,張彥超,等.基于動(dòng)態(tài)演化博弈論的輿論傳播羊群效應(yīng)[J].系統(tǒng)工程學(xué)報(bào),2011,26(2):275-281.
[8] 夏茂森,朱憲辰,江波,等.農(nóng)產(chǎn)品交易行為的動(dòng)態(tài)演化博弈分析[J].技術(shù)經(jīng)濟(jì),2009,28(8):123-127.
[9] BRAUER F,DRIESSCHE P.Models for transmission of disease with immigration of infectives[J].Mathematical Biosciences,2001,171(2):143-154.
[10] 朱孔金,楊立中.房間出口位置及內(nèi)部布局對(duì)疏散效率的影響研究[J].物理學(xué)報(bào),2010,59(11):7701-7707.