段 琦, 史英杰
(天津大學 管理與經(jīng)濟學部, 天津 300072)
?
尋路行為策略的進化博弈分析
段 琦, 史英杰
(天津大學 管理與經(jīng)濟學部, 天津 300072)
針對我國交通樞紐站中乘客的尋路行為,建立了初訪者群體之間以及初訪者與熟悉者群體間的博弈模型及其復制動力學方程,并對復制動態(tài)做了分析和討論,得出模型中博弈雙方的進化穩(wěn)定策略。研究結(jié)果表明樞紐站內(nèi)初訪者、初訪者與熟悉者在有限理性基礎上得到的進化穩(wěn)定策略與標識布設的合理性有關(guān),提出了改進標識布設以推進積極尋路行為發(fā)生的合理對策和建議。
進化博弈論;進化穩(wěn)定策略;復制動力學方程;尋路行為;樞紐站
我國城市軌道交通建設已隨著城市的發(fā)展而步入快速發(fā)展階段。處于多種軌道交通交叉點的樞紐站是城市軌道交通建設的重要組成部分,是實現(xiàn)客流有效組織的重要載體。但是,由于樞紐站自身建筑空間大且復雜的特點,導致了樞紐站中行人自我定位以及高效地找到目的地等行為的困難。而樞紐站客運組織功能的復雜性、多家建設單位參與建設的現(xiàn)狀,更導致了樞紐站中導向標識布設的復雜性以及傳遞信息的不統(tǒng)一性。在樞紐中進行尋路所依賴的信息,主要來源于兩個方面:導向標識傳遞的信息和其他乘客的行為信息。由此導致了初次進入樞紐的乘客會有兩種尋路行為:模仿尋路以及標識尋路。基于當前我國樞紐站建設中標識布設的不良現(xiàn)狀,上述兩種尋路策略帶有不對等的收益色彩。按照導向標識以及模仿他人作為人類在新環(huán)境中進行尋路的兩種行為策略,都可以被看做是在任何人進行決策行為的過程中不斷進行學習進化的結(jié)果。按照導向標識進行尋路與模仿尋路可以說是博弈雙方的兩種基本策略,最佳尋路的策略就是在模仿他人最有利的策略之后,再通過一個長期模仿和對標識自我理解的過程后,使得博弈雙方趨于一個進化穩(wěn)定策略(ESS)。本文運用進化博弈的復制動態(tài)法對樞紐站中的乘客在尋路過程中的尋路策略進行了研究,指出影響不同策略采用的因素以及合理的標識布設應該成為尋路行為的一種積極誘導。
Fewings[1]依據(jù)尋路者到達目的地的原因而將尋路行為劃分為娛樂性尋路、果斷性尋路以及緊急性尋路。娛樂性尋路者,其目的在于自身的娛樂,例如在公園中散步、在商場中購物;果斷性尋路是以盡可能高效地找到目的地為目標,例如外出就餐或者乘車去上學、工作等;緊急性尋路是盡最大努力快速到達特定目的地,可指火災逃生、逃避恐怖襲擊等。交通樞紐一般集交通、辦公、商業(yè)、休閑、娛樂等服務于一體,其中行人的尋路行為在常態(tài)下一般涉及到Fewings分類中的娛樂性和果斷性尋路,在危急情況下涉及到緊急性尋路。而現(xiàn)實中,由于注重娛樂的娛樂性尋路者放松、休閑的心態(tài),果斷性尋路者所面臨的時間緊迫以及緊急性尋路者面對生命威脅等特點,導致了樞紐中乘客尋路行為是有限理性的。此外,由于人類尋路行為是一種復雜的系統(tǒng)決策過程,因此尋路現(xiàn)實中決策者行為的完全理性是很難滿足的高要求。從而,有限理性的情況是普遍發(fā)生的。
一般來說,導向標識是用來抵消建筑物空間結(jié)構(gòu)復雜性的一種手段[2]。標識是一種景觀,是人與環(huán)境交流的一種媒介[3,4]。導向標識布設與交通樞紐站的建設并非同步開展,標識布設一般位于樞紐站功能分區(qū)確定之后。因此,人為安裝在樞紐站的標識,由于畢竟不是隨其所處環(huán)境一起產(chǎn)生的,容易產(chǎn)生標識信息不準確、不必要的現(xiàn)象。該現(xiàn)象在我國交通樞紐站中極為常見。這也在一定程度上解釋了乘客在新步入某一樞紐站后不根據(jù)標識尋找目的地,而是通過問詢他人或者直接模仿、尾隨他人而到達目的地的行為,這種尋路行為是有限理性的行為。標識布設不合理而導致乘客無法獲取自己下一步?jīng)Q策所需的信息、標識布設過于復雜而導致乘客無法在有限時間內(nèi)獲取所需信息等,都能成為解釋模仿、尾隨他人的尋路行為普遍存在的原因。
進化博弈理論最早可追溯至Fisher、Hamilyon和Trivers等發(fā)現(xiàn)使用博弈論的方法可以在多數(shù)情況下且不依賴任何理性假設的前提下對動植物進化結(jié)果進行解釋[5]。1973年,Maynard Smith和Price提出進化穩(wěn)定策略(Evolutionarily Stable Strategy, ESS),被學術(shù)界普遍認為是進化博弈理論誕生的標志。ESS作為進化博弈中最為基礎的均衡概念,其核心思想為,若一個現(xiàn)存策略是進化穩(wěn)定均衡策略,那么必須存在一個正的入侵障礙,使得在變異策略的頻率低于該障礙時,現(xiàn)存的策略能夠比變異策略獲得更高的收益。
任何策略x作為ESS具有以下兩個性質(zhì)(y為任何變異策略)[6,7]:
u(x,y)≤u(x,x) ?y
(y,x)=u(x,x)?u(y,y)
近年來,由于進化博弈理論能夠反映出博弈方的學習和策略調(diào)整過程、行為和策略的動態(tài)穩(wěn)定性以及分析和預測出有限理性個體組成的群體間的博弈,并已被廣泛應用于經(jīng)濟制度及行為進化[9~11]以及社會行為進化等研究領(lǐng)域之中。其中,對社會行為進化的相關(guān)研究中,Nowak和Sigmund對人類的間接互惠行為進行了分析,從進化博弈的角度來理解人類社會合作[12];余孝軍運用進化博弈理論研究了駕駛員群體與交管部門之間就超速與反超速的行為策略選擇,得出了各博弈方的進化穩(wěn)定策略[13];陶鋒和邢會歌采用進化博弈的復制動態(tài)方法,分析了技術(shù)和制度創(chuàng)新中決策者的模仿及創(chuàng)新行為,提出構(gòu)建誘導創(chuàng)新的社會氛圍等建議措施[14]。上述將進化博弈理論應用于社會行為進化中的研究證實,進化博弈理論適合于研究人類在遇到復雜選擇問題時由直覺引導或?qū)Τ晒φ哌M行模仿的非理性行為方式。因此,采用進化博弈理論對交通樞紐站中人類的尋路策略選擇進行分析和研究也是具有可行性的。
2.1 初訪者群體間博弈
2.1.1 模型
初訪者是指首次到達該交通樞紐站,或是曾在該樞紐中使用過其他非當前欲使用的功能的乘客。為了表示方便,將初訪者群體抽象為兩個個體,它們都是有限理性的博弈局中人。假設s表示初訪者模仿他人尋路時的超額收益,即模仿比自己通過閱讀、理解標識后尋路所節(jié)省的時間;w表示由于初訪者與他人不同路時發(fā)生模仿錯誤而浪費的時間以及因此而導致的誤車、誤工等損失;x表示初訪者模仿發(fā)生錯誤的概率(0 表1 初訪者博弈的收益矩陣 其中s、w、x均為正數(shù),該博弈的均衡取決于s、w以及xw的數(shù)值大小以及它們彼此間的相對大小。 2.1.2 復制動力學方程和ESS 由上述收益矩陣,構(gòu)建復制動力學方程,以研究初訪者群體間的進化動態(tài)規(guī)律。在構(gòu)建復制動力學方程之前,還需要假設初訪者中愿意采取模仿行為的乘客比例為y,則采取閱讀標識行為的乘客比例為1-y。在此基礎上,采取兩種策略行為的博弈方的期望收益和群體平均期望收益為: u模=y(s-w)+(1-y)(s-xw) u標=y×0+(1-y)×0=0 根據(jù)以上所示收益得到初訪者在采取模仿策略情形下的復制動力學方程為: 由Weibull[8]對ESS的定義可知,非內(nèi)部最優(yōu)的策略是不能成為ESS的。也就是說,作為進化穩(wěn)定策略的點y*,必然是對采取策略的某博弈方來說是最優(yōu)的,即若該博弈方由于一些偶然的錯誤導致其策略偏離了y*而采取了策略y,經(jīng)過復制動態(tài)一定會使y回復到y(tǒng)*,可以說y*在進化壓力下是穩(wěn)健的。 2.1.3 討論 對于上述三個平衡點,需要根據(jù)s、w、x的大小來具體進行分析: 按照常理來說,博弈雙方都采取標識尋路策略時,其Pareto優(yōu)于雙方都采取模仿尋路策略,即s-w<0,所以y*=1這一平衡點被排除。 當s-w<0且s-xw>0時,即模仿錯誤時初訪者的收益小于看標識時所得收益,同時也說明模仿的收益大于模仿發(fā)生錯誤后所受到的損失,此時y*=(s-xw)/(w-xw)是ESS,即由于建筑物自身通達性好、各功能區(qū)區(qū)分性強等結(jié)構(gòu)特點或?qū)驑俗R系統(tǒng)由于布設位置或內(nèi)容不合理而導致初訪者無法在不駐足的情況下得以理解利用時,初訪者進行模仿的尋路行為是以上述y*=(s-xw)/(w-xw)的概率而發(fā)生的。而s-w<0且s-xw<0時,同樣若模仿發(fā)生錯誤時初訪者的收益小于看標識時所得收益,同時模仿所得收益小于模仿錯誤后所受到的損失,此時y*=0是ESS;由于樞紐站建筑結(jié)構(gòu)復雜、目的地為不同方向的人流眾多、標識設計符合人因需求等,這導致初訪者閱讀理解標識后根據(jù)標識的導向內(nèi)容而作出尋路行為為最佳策略。 2.2 初訪者群體與熟悉者群體之間的博弈 2.2.1 模型 在一個正常運營的交通樞紐中,除了初訪者之外,還有經(jīng)常使用該樞紐的乘客,將此類乘客稱作熟悉者。除了前面討論的初訪者博弈行為之外,還需要考慮在尋路過程中,熟悉者與初訪者之間的博弈行為。在前述的博弈模型中,可知初訪者因選擇策略的不同而收益有差,但是,熟悉者的行為也是初訪者是否采取模仿或是標識策略的重要因素。此外,初訪者策略選擇也會對熟悉者產(chǎn)生一定的影響。除了繼承上一模型中初訪者的兩種尋路策略之外,由于初訪者猶豫、駐足閱讀標識導致人流行進速度減緩等原因,導致熟悉者因初訪者行為策略的不同而有同路或繞路兩種策略供其選擇。 假設熟悉者在行走路線通暢的情形下收益為s,可將該收益理解為節(jié)省的時間、趕上最近一班車等;熟悉者采取繞路行為時,會造成a的損失;由于初訪者駐足閱讀標識導致人流變緩時,尋路者的損失為b;初訪者由于模仿發(fā)生錯誤的損失為w;模仿錯誤的概率為x。表2是該博弈中初訪者和熟悉者的收益矩陣。 表2 初訪者和熟悉者博弈的收益矩陣 其中s、w、x、a均為正數(shù),b為非負數(shù)。 2.2.2 復制動力學方程和ESS 假設有比例為y的初訪者選擇模仿策略,則選擇標識策略的初訪者比例為1-y;選擇同路策略的熟悉者比例為z,1-z比例的熟悉者選擇繞路策略。 熟悉者采用同路和繞路策略的收益分別為: u同=y(s-xw)+(1-y)(s-b),u繞=y(s-a-xw)+(1-y)(s-b) 該群體平均期望收益為: =z[y(s-xw)+(1-y)(s-b)]+(1-z)[y(s-a-xw)+(1-y)(s-b)] 根據(jù)以上所示收益得到熟悉者在采取同路策略情形下的復制者動力學方程為: 初訪者采用模仿或標識策略的收益如下: u模=zs+(1-z)(s-a),u標=z(s-b)+(1-z)(s-a) 群體平均期望收益為: =y[zs+(1-z)(s-a)]+(1-y)[z(s-b)+(1-z)(s-a)] 由以上各收益得到初訪者在采取模仿策略情形下的復制動力學方程為: 2.2.3 討論 3.1 結(jié)論 初訪者群體間博弈中,由于現(xiàn)實以及人類的行為特點,初訪者全都不按照導向標識而模仿其他初訪者進行尋路的情況是不可能發(fā)生的。由對兩種條件下不同的ESS的討論,可得如下結(jié)論: (1)初訪者選擇模仿的人數(shù)比例與模仿發(fā)生錯誤所受到的損失是負相關(guān)的,即模仿發(fā)生錯誤的概率越大,初訪者選擇模仿行為的概率就越小,當這種錯誤概率達到一定程度時,初訪者模仿行為的現(xiàn)象就會消失。(2)當模仿的收益小于看標識所得收益時,說明標識布設得較為合理,能夠滿足乘客在尋路過程中保持正常行進速度下理解標識、并按照標識指向而找到自己的道路。 由初訪者與熟悉者間群體博弈討論,可得如下結(jié)論: (1)若存在一定比例的初訪者不采用按照標識指示的尋路策略,即采用模仿策略的初訪者在整體初訪者中所占比例不為零時,熟悉者群體會逐漸傾向于選擇同路策略。究其原因,在于選擇繞路策略時會產(chǎn)生一定程度的損失。(2)當標識布設得足夠合理,使初訪者免于駐足而能夠在正常行進中獲取尋路所需要的信息時,任何比例的混合策略都是穩(wěn)定的。這時初訪者的行為策略完全由個人行為偏好所決定。(3)當標識布設不能滿足在正常行進中被初訪者所捕獲,即初訪者必須駐足以獲取自身尋路所需的信息,由此導致的人流變緩給所有尋路者帶來一定的損失。此時,若熟悉者群體中采取同路策略的比例不為零時,初訪者群體逐漸傾向于采取模仿策略。 4.2 建議 (1)改善標識布設位置的合理性,在尋路過程中的關(guān)鍵決策點設置導向標識。在距離較長的通道或走廊內(nèi),為保證尋路者心理連續(xù)性而布設適當數(shù)量的標識。 (2)提高單個標識布設的合理性,從尋路者的需求角度出發(fā),設計出內(nèi)容滿足尋路者行為決策時所需要信息的標識,保證標識信息布設的結(jié)構(gòu)符合人因特點,滿足高工效的要求。 (3)保證標識的簡潔性和易讀性,使標識布設在不因人流阻擋而破壞視野的范圍之內(nèi),盡量滿足標識內(nèi)容無須駐足而在正常行走速度下可被理解的要求。 [1] Fewings R. Wayfinding and airport terminal design[J]. Journal of Navigation, 2001, 54(2): 177-184. [2] O’Neill M J. Effect of signage and floor plan configuration on wayfinding accurancy[J]. Evironment and Behavior, 1991, 23(5): 553-574. [3] Fuller G. The arrow-directional semictics: wayfinding in transit[J]. Social Semiotics, 2002, 12(3); 231-244. [4] Raubal M, Winter S. Enriching wayfinding instruction with local landmarks[J]. Lecture Notes in Computer Science, 2002, 2478: 243-259. [5] 洪開榮,孫倩.經(jīng)濟博弈論前沿專題[M].北京:經(jīng)濟科學出版社,2012.127. [6] Smith J M, Price G R. The logic of animal conflict[J]. Nature, 1973, 246: 15-18. [7] Smith J M. The theory of games and the evolution of animal conflicts[J]. Journal of Theoretical Biology, 1974, 47: 209-221. [8] Weibull J W. Evolutionary game theory[M]. Cambridge: MIT Press, 1995. 9-11. [9] Homburg C, Fuerst A, Ehrmann T. Incumbents’ defense strategies: a comparison of deterrence and shakeout strategy based on evolutionary game theory[J]. Journal of The Academy of Marketing Science, 2013, 41(2); 185-205. [10] Ito J. Collective action for local management in rural Runnan, China: empirical evidence and hypotheses using evolutionary game theory[J]. Land Econimics, 2012, 88(1): 181-200. [11] Cai G S, Kock N. An evolutionary game theoretic perspective on e-collaboration: the collaboration effort and media relativeness[J]. European Journal of Operational Research, 2009, 194(3): 821- 833. [12] Nowak M A, Sigmund K. Evolution of indirect reciprocity[J]. Nature, 2005, 437(27): 1291-1297. [13] 余孝軍.超速駕駛行為的進化博弈分析[J].數(shù)學的實踐與認識,2009,39(11):14-18. [14] 陶鋒,邢會歌.創(chuàng)新與模仿行為的進化博弈分析[J].科技進步與對策,2008,25(11):35-37. Evolutionary Game Analysis of Wayfinding Behavior DUAN Qi, SHI Ying-jie (SchoolofManagementandEconomy,TianjinUniversity,Tianjin300072,China) For the wayfinding behavior of passengers in transit hubs, and a game model among unfamiliar passengers, a game model between familiar and unfamiliar passengers are presented. The duplicative dynamic equations of these models are formulated and analyzed to obtain evolutionary stable strategies. It is showed that the evolutionary stable strategies of unfamiliar passengers and familiar passengers based on bounded rationality depend on the rationality of singage layout. Finally, some reasonable advices about how to optimize singage layout to improve positive wayfinding behaviors are proposed. evolutionary game theory; evolutionary stable strategy; duplicative dynamic equation; wayfinding; transit hubs; 2013- 07- 03 國家自然科學基金青年基金資助項目(71201114) 段琦(1986-),女,北京延慶人,博士研究生,從事人因工程、標識布設及尋路行為研究;史英杰(1977-),女,管理學博士,講師,從事消費者行為、博弈論應用研究。 F224.3;U291 A 1007-3221(2015)02- 0087- 053 結(jié)論