湯天培,王 華,陳 豐,曹 陽
(1.南通大學(xué)交通與土木工程學(xué)院,江蘇 南通 226019;2.新加坡國立大學(xué)工程學(xué)院,新加坡 117576;3.同濟(jì)大學(xué)交通運(yùn)輸工程學(xué)院,上海 200092)
電動(dòng)自行車已經(jīng)成為我國居民日常出行的主要交通方式之一,但由電動(dòng)自行車騎行人引發(fā)的交通事故在不斷增加。相關(guān)研究表明[1-4],電動(dòng)自行車騎行人的交通違法行為(包括闖紅燈、超速騎行、占用機(jī)動(dòng)車道騎行、逆向騎行等)是導(dǎo)致電動(dòng)自行車相關(guān)交通事故的主要原因之一?,F(xiàn)有研究主要從個(gè)體特征(性別、年齡等)[5,6]、認(rèn)知心理(態(tài)度、主觀規(guī)范、知覺行為控制、道德規(guī)范、從眾傾向等)[6]、交通運(yùn)行條件(機(jī)動(dòng)車交通量、違法騎行人數(shù)量)[5]、交通設(shè)施條件(交叉口類型、交叉口大小、遮雨棚等)[7,8]等方面研究其對(duì)騎行人交通違法行為的影響,而忽略了交通執(zhí)法者執(zhí)法策略對(duì)交通違法行為的影響。目前僅有交通執(zhí)法策略對(duì)機(jī)動(dòng)車駕駛?cè)私煌ㄟ`法行為影響的相關(guān)研究。比如,劉翰寧等[9]建立了階位罰款額度優(yōu)化模型,提出了遞增式階梯罰款機(jī)制。Wong等[10]基于多項(xiàng)Logit模型,采用震懾效果指標(biāo)量化處罰水平產(chǎn)生的影響,研究發(fā)現(xiàn)提高處罰額度和違法扣分能有效降低駕駛?cè)诉`法行為。Sze等[11]評(píng)估了處罰和違法監(jiān)控綜合策略的效果,研究表明該綜合策略能有效降低駕駛?cè)说倪`法比例。由此可見,鮮有文獻(xiàn)深入探究交通執(zhí)法策略對(duì)電動(dòng)自行車騎行人交通違法行為的影響機(jī)理。
對(duì)電動(dòng)自行車騎行人而言,會(huì)根據(jù)感知收益差、處罰額度、社會(huì)負(fù)面影響,以及自身對(duì)于交通執(zhí)法者以往的執(zhí)法概率的認(rèn)知,進(jìn)行交通違法行為的決策。對(duì)交通執(zhí)法者而言,受限于警力限制,警力無法覆蓋區(qū)域內(nèi)每個(gè)路段,交通執(zhí)法者會(huì)根據(jù)處罰額度、執(zhí)法成本、社會(huì)負(fù)面影響,以及騎行人群體以往的違法概率,綜合決策在區(qū)域路網(wǎng)內(nèi)警力或交通監(jiān)控?cái)z像頭對(duì)路段和交叉口的覆蓋密度,即執(zhí)法概率。因此,兩者之間存在博弈關(guān)系,即騎行人“違法”或“不違法”的策略選擇與交通執(zhí)法者“執(zhí)法”或“不執(zhí)法”的策略選擇是一個(gè)互動(dòng)的動(dòng)態(tài)演化過程。而演化博弈論就是將博弈分析與動(dòng)態(tài)演化相結(jié)合的分析方法[12-14],可應(yīng)用于探究電動(dòng)自行車騎行人與交通執(zhí)法者策略選擇的演化博弈過程與規(guī)律,并通過仿真分析處罰額度、感知收益差、執(zhí)法成本和社會(huì)負(fù)面影響,對(duì)博弈雙方策略選擇概率的影響,揭示不同交通執(zhí)法策略對(duì)電動(dòng)自行車騎行人交通違法行為的影響機(jī)理。
基于對(duì)電動(dòng)自行車騎行人與交通執(zhí)法者策略選擇的合理考慮,提出以下假設(shè)。
假設(shè)1:騎行人的策略集為{違法、不違法},交通執(zhí)法者的策略集為{執(zhí)法、不執(zhí)法}。其中,“不執(zhí)法”是指在區(qū)域路網(wǎng)內(nèi)沒有警力巡邏或交通監(jiān)控?cái)z像頭。
假設(shè)2:騎行人和交通執(zhí)法者都是在不確定情況下選擇策略,博弈雙方均為有限理性的,無法通過一次博弈而獲取自身的最大收益策略,必須通過不斷的重復(fù)博弈才能獲取最大收益策略。
假設(shè)3:研究主要考慮騎行人群體違法行為決策,不考慮騎行人個(gè)體特征的差異影響,仿真參數(shù)采用群體平均值,因此對(duì)群體的行為決策而言,分析結(jié)果仍然是合理的。
假設(shè)4:騎行人在選擇違法策略時(shí),認(rèn)為違法后發(fā)生交通事故的概率為零,即在決策是否違法時(shí)未考慮可能發(fā)生交通事故后的成本。相關(guān)研究表明,雖然大部分的駕駛?cè)四芤庾R(shí)到交通違法行為會(huì)產(chǎn)生事故風(fēng)險(xiǎn),但是他們?nèi)匀粯酚^的相信這些交通事故不會(huì)發(fā)生[15]。
當(dāng)騎行人選擇“違法”,交通執(zhí)法者選擇“執(zhí)法”,即“違法-執(zhí)法”策略時(shí),騎行人的收益為V1-Cp,其中V1為騎行人認(rèn)為單次違法行為后產(chǎn)生的平均感知收益(單位:元),Cp為交通執(zhí)法者對(duì)單次違法行為的平均處罰額度(單位:元);交通執(zhí)法者的收益為Cp-Ce,其中Ce為交通執(zhí)法者單次執(zhí)法的平均執(zhí)法成本(單位:元)。當(dāng)騎行人選擇“違法”,交通執(zhí)法者選擇“不執(zhí)法”,即“違法-不執(zhí)法”策略時(shí),騎行人的收益為V1,交通執(zhí)法者的收益為-I,其中I為單次違法行為未被處罰產(chǎn)生的平均社會(huì)負(fù)面影響,用經(jīng)濟(jì)成本反應(yīng)該影響(單位:元)。騎行人選擇“不違法”,交通執(zhí)法者選擇“執(zhí)法”,即“不違法-執(zhí)法”策略時(shí),騎行人的收益為V2,交通執(zhí)法者的收益為-Ce,其中V2為騎行人認(rèn)為單次不違法產(chǎn)生的平均感知收益(單位:元)。騎行人選擇“不違法”,交通執(zhí)法者選擇“不執(zhí)法”,即“不違法-不執(zhí)法”策略時(shí),騎行人的收益為V2,交通執(zhí)法者的收益為0。由此可得,電動(dòng)自行車騎行人與交通執(zhí)法者的博弈矩陣,見表1。
表1 博弈矩陣
假設(shè)電動(dòng)自行車騎行人選擇“違法”策略的概率為p,則選擇“不違法”策略的概率為1-p;假設(shè)交通執(zhí)法者選擇“執(zhí)法”策略的概率為q,則選擇“不執(zhí)法”策略的概率為1-q。其中,交通執(zhí)法者選擇“執(zhí)法”策略的概率q,即為在某區(qū)域路網(wǎng)內(nèi)警力或交通監(jiān)控?cái)z像頭對(duì)路段和交叉口的覆蓋密度。騎行人與交通執(zhí)法者可根據(jù)歷史信息判斷對(duì)方的策略選擇行為,表現(xiàn)為策略選擇概率p和q的動(dòng)態(tài)變化與調(diào)整,即博弈雙方的策略選擇概率在動(dòng)態(tài)復(fù)制中演化。由此,基于演化博弈理論中的復(fù)制動(dòng)態(tài)分析法[16],進(jìn)行演化博弈模型的構(gòu)建。
(1)
(2)
(3)
(4)
(5)
(6)
將電動(dòng)自行車騎行人策略選擇概率的復(fù)制動(dòng)態(tài)方程記為dp/dt,交通執(zhí)法者策略選擇概率的復(fù)制動(dòng)態(tài)方程記為dq/dt,計(jì)算表達(dá)式如下
(7)
(8)
采用Jacobian矩陣的局部穩(wěn)定分析法進(jìn)行檢驗(yàn)[16],即根據(jù)Jacobian矩陣對(duì)應(yīng)行列式及跡滿足的條件“Det(J)>0且Tr(J)<0”篩選出演化穩(wěn)定策略(ESS)。根據(jù)式(7)和(8)可得Jacobian矩陣(9),以及該矩陣的Det(J)和Tr(J),分別為式(10)和(11)
(9)
Det(J)=(1-2p)(V1-V2-qCp)(1-2q)
(pCp+pI-Ce)-(q-q2)(Cp+I)(p2-p)Cp
(10)
Tr(J)=(1-2p)(V1-V2-qCp)+(1-2q)
(pCp+pI-Ce)
(11)
由式(10)和(11)可知,騎行人對(duì)交通違法與不違法的感知收益差是研究的重點(diǎn),因此令V1-V2=ΔV,ΔV即為感知收益差。根據(jù)演化穩(wěn)定策略的條件,分別對(duì)演化博弈系統(tǒng)的穩(wěn)定性進(jìn)行分析①條件一:當(dāng)ΔV>Cp,且Cp+I>Ce時(shí),E4=(1,1)為均衡點(diǎn);②條件二:當(dāng)ΔV>0,且Cp+I 靜態(tài)處罰策略模型的穩(wěn)定性條件三中,即當(dāng)0<ΔV (12) (13) (14) 根據(jù)式(13)和(14)可得Jacobian矩陣(15),以及該矩陣的Det(J)和Tr(J),分別為式(16)和(17) (15) Det(J)=(qCp(3p2-1)+(V1-V2)(1-2p))(1-2q)(p2Cp+p(Cp+I)-Ce)-(2pqCp(1-q) -(q2-q)(Cp+I))(p3-p)Cp (16) Tr(J)=qCp(3p2-1)+(V1-V2)(1-2p)+(1-2q)(p2Cp+p(Cp+I)-Ce) (17) 根據(jù)演化穩(wěn)定策略的條件,分別對(duì)演化博弈系統(tǒng)的穩(wěn)定性進(jìn)行分析:①條件一:當(dāng)ΔV>2Cp,且2Cp+I>Ce時(shí),E4=(1,1)為均衡點(diǎn);②條件二:當(dāng)ΔV>0,且2Cp+I 采用MATLAB進(jìn)行仿真分析,通過輸入?yún)?shù)的調(diào)整,觀察靜態(tài)處罰策略模型和動(dòng)態(tài)處罰策略模型演化博弈規(guī)律的變化。探究處罰額度、感知收益差、執(zhí)法成本和社會(huì)負(fù)面影響,對(duì)電動(dòng)自行車騎行人和對(duì)交通執(zhí)法者策略選擇演化規(guī)律的影響。由于博弈雙方的策略選擇初始概率對(duì)均衡解沒有影響,本次仿真設(shè)定概率初始值為(p0,q0)=(0.5,0.5)。 在純策略條件下,即條件一和條件二情況下,仿真結(jié)果如圖1至圖4。在靜態(tài)或動(dòng)態(tài)策略模型中,博弈雙方的策略選擇概率均收斂于均衡解(1,1)或(1,0)。隨著處罰額度的增加/感知收益差的減小/執(zhí)法成本的減小/社會(huì)負(fù)面影響的增加,電動(dòng)自行車騎行人選擇違法的概率收斂于1的速度會(huì)變慢;隨著處罰額度的增加/感知收益差的增加/執(zhí)法成本的減小/社會(huì)負(fù)面影響的增加,交通執(zhí)法者選擇執(zhí)法的概率收斂于1的速度會(huì)變快(條件一),收斂于0的速度會(huì)變慢(條件二)。由此可見,當(dāng)最大處罰額度小于感知收益差,且執(zhí)法成本較小(小于最大處罰額度和社會(huì)負(fù)面影響成本之和)時(shí),電動(dòng)自行車騎行人傾向于選擇違法行為,交通執(zhí)法者傾向于選擇執(zhí)法。當(dāng)執(zhí)法成本較高(大于最大處罰額度和社會(huì)負(fù)面影響成本之和)時(shí),電動(dòng)自行車騎行人始終傾向于選擇違法行為,而交通執(zhí)法者傾向于選擇不執(zhí)法。因此,在上述情況下無論如何調(diào)整處罰額度、感知收益差、執(zhí)法成本和社會(huì)負(fù)面影響,均無法有效減少電動(dòng)自行車騎行人的交通違法行為。 圖1 處罰額度對(duì)博弈雙方策略選擇概率的影響(條件一、二) 圖2 感知收益差對(duì)博弈雙方策略選擇概率的影響(條件一、二) 圖3 執(zhí)法成本對(duì)博弈雙方策略選擇概率的影響(條件一、二) 圖4 社會(huì)負(fù)面影響對(duì)博弈雙方策略選擇概率的影響(條件一、二) 在混合策略條件下,即條件三情況下,仿真結(jié)果如圖5至圖8,采用動(dòng)態(tài)處罰策略可有效抑制博弈雙方的策略選擇波動(dòng),并達(dá)到均衡解。 4.2.1 處罰額度影響 如圖5,靜態(tài)策略模型中,博弈雙方的策略選擇概率圍繞(0.38,0.83)、(0.30,0.63)、(0.25,0.50)進(jìn)行周期性波動(dòng),即隨著處罰額度的增加,騎行人與交通執(zhí)法者策略選擇的波動(dòng)中心點(diǎn)逐漸下降,但無法達(dá)到均衡解。動(dòng)態(tài)策略模型中,博弈雙方的策略選擇概率經(jīng)過多次博弈波動(dòng)后收斂于均衡解(0.67,1)、(0.40,0.90)、(0.34,0.74),即隨著處罰額度的增加,騎行人選擇違法的概率顯著降低,交通執(zhí)法者選擇執(zhí)法的概率也顯著降低。 圖5 處罰額度對(duì)博弈雙方策略選擇概率的影響(條件三) 由此,建議交通執(zhí)法者通過調(diào)研,充分了解騎行人對(duì)違法和不違法的感知收益,基于感知收益差合理制定處罰額度。采用動(dòng)態(tài)處罰策略,制定的最大處罰額度大于感知收益差,在此基礎(chǔ)上提高處罰額度,可保證交通執(zhí)法者采取較低的執(zhí)法概率,也能有效約束騎行人的交通違法行為。 4.2.2 感知收益差影響 如圖6,靜態(tài)策略模型中,博弈雙方的策略選擇概率圍繞(0.43,0.20)、(0.43,0.40)、(0.43,0.60)進(jìn)行周期性波動(dòng),即隨著感知收益差的減小,騎行人選擇違法的概率波動(dòng)中心點(diǎn)保持不變,交通執(zhí)法者選擇執(zhí)法的概率波動(dòng)中心點(diǎn)顯著降低,但均無法達(dá)到均衡解。動(dòng)態(tài)策略模型中,博弈雙方的策略選擇概率經(jīng)過多次博弈波動(dòng)后收斂于均衡解(0.52,0.27)、(0.52,0.53)、(0.52,0.79),即隨著感知收益差的減小,騎行人選擇違法的概率保持不變,交通執(zhí)法者選擇執(zhí)法的概率顯著減小。 圖6 感知收益差對(duì)博弈雙方策略選擇概率的影響(條件三) 由此,建議交通執(zhí)法者采用動(dòng)態(tài)處罰策略,通過交通安全基礎(chǔ)教育、宣傳與培訓(xùn)等,將感知收益差控制為小于最大處罰額度。在此基礎(chǔ)上減少感知收益差,以較低的警力或交通監(jiān)控?cái)z像頭覆蓋密度,也能將騎行人交通違法概率控制在同一水平。 由此,建議交通執(zhí)法者采用動(dòng)態(tài)處罰策略,通過交通安全基礎(chǔ)教育、宣傳與培訓(xùn)等,將感知收益差控制為小于最大處罰額度。在此基礎(chǔ)上減少感知收益差,以較低的警力或交通監(jiān)控?cái)z像頭覆蓋密度,也能將騎行人交通違法概率控制在同一水平。 4.2.3 執(zhí)法成本影響 如圖7,靜態(tài)策略模型中,博弈雙方的策略選擇概率圍繞(0.43,0.60)、(0.71,0.60)、(0.86,0.60)進(jìn)行周期性波動(dòng),即隨著執(zhí)法成本的減小,騎行人選擇違法的概率波動(dòng)中心點(diǎn)顯著降低,交通執(zhí)法者選擇執(zhí)法的概率波動(dòng)中心點(diǎn)保持不變。動(dòng)態(tài)策略模型中,博弈雙方的策略選擇概率經(jīng)過多次博弈波動(dòng)后收斂于均衡解(0.52,0.79)、(0.78,0.67)、(0.89,0.62),即隨著執(zhí)法成本的減小,騎行人選擇違法的概率會(huì)顯著降低,交通執(zhí)法者選擇執(zhí)法的概率會(huì)逐漸提高。 圖7 執(zhí)法成本對(duì)博弈雙方策略選擇概率的影響(條件三) 由此,建議采取動(dòng)態(tài)處罰策略,隨著執(zhí)法成本的減小,交通執(zhí)法者適當(dāng)提高執(zhí)法概率,可將騎行人違法概率控制在更低的水平。比如,采用基于RFID技術(shù)的闖紅燈自動(dòng)識(shí)別系統(tǒng),對(duì)電動(dòng)自行車騎行人闖紅燈行為進(jìn)行自動(dòng)抓拍。雖然前期硬件投入會(huì)導(dǎo)致執(zhí)法成本的增加,但是硬件成本會(huì)隨著技術(shù)發(fā)展而降低,同時(shí)也能減少人力成本,從而有效控制電動(dòng)自行車騎行人的交通違法行為。 4.2.4 社會(huì)負(fù)面影響 如圖8,靜態(tài)策略模型中,博弈雙方的策略選擇概率圍繞(0.43,0.60)、(0.38,0.60)、(0.30,0.60)進(jìn)行周期性波動(dòng),即隨著社會(huì)負(fù)面影響的增加,騎行人選擇違法的概率波動(dòng)中心點(diǎn)逐漸降低,交通執(zhí)法者選擇執(zhí)法的概率波動(dòng)中心點(diǎn)保持不變,但均無法達(dá)到均衡解。動(dòng)態(tài)策略模型中,博弈雙方的策略選擇概率經(jīng)過多次博弈波動(dòng)后收斂于均衡解(0.52,0.79)、(0.45,0.83)、(0.36,0.88),即隨著社會(huì)負(fù)面影響的增加,騎行人選擇違法的概率會(huì)逐漸降低,交通執(zhí)法者選擇執(zhí)法的概率會(huì)逐漸增加。 圖8 社會(huì)負(fù)面影響對(duì)對(duì)博弈雙方策略選擇概率的影響(條件三) 由此,建議采用動(dòng)態(tài)處罰策略,當(dāng)社會(huì)負(fù)面影響成本不斷提高時(shí),將促使交通執(zhí)法者維持在較高的執(zhí)法概率,從而有效降低電動(dòng)自行車騎行人的違法概率。具體而言,可通過社會(huì)輿論手段提高交通違法行為的社會(huì)負(fù)面影響,有助于顯著降低騎行人的交通違法行為。 1)基于演化博弈論,構(gòu)建了電動(dòng)自行車騎行人與交通執(zhí)法者策略選擇的演化博弈模型,分析了交通執(zhí)法策略對(duì)騎行人交通違法行為的影響,提出了交通執(zhí)法策略建議,可有效減少電動(dòng)自行車騎行人的交通違法行為。 2)當(dāng)交通執(zhí)法者制定的最大處罰額度小于感知收益差時(shí),采用靜態(tài)處罰策略或動(dòng)態(tài)處罰策略,均無法有效減少電動(dòng)自行車騎行人的交通違法行為。 3)當(dāng)交通執(zhí)法者制定的最大處罰額度大于感知收益差,執(zhí)法成本較小(小于最大處罰額度和社會(huì)負(fù)面影響成本之和)時(shí),采用靜態(tài)處罰策略,騎行人與交通執(zhí)法者策略選擇的博弈過程沒有均衡解,這個(gè)不利于雙方的策略選擇。采用動(dòng)態(tài)處罰策略,可有效抑制博弈雙方的策略選擇波動(dòng),達(dá)到均衡解?,F(xiàn)階段,全國各地都存在交通警力不足的情況,可通過合理制定或優(yōu)化處罰額度、感知收益差、執(zhí)法成本、社會(huì)負(fù)面影響等因素,以較低的區(qū)域路網(wǎng)警力覆蓋密度,也能有效降低電動(dòng)自行車騎行人的交通違法行為。 4)本次構(gòu)建的演化博弈模型中仍存在一些不足。比如,未考慮騎行人可能發(fā)生交通事故而產(chǎn)生的成本,以及未考慮交通執(zhí)法者的執(zhí)法有效性等。以上不足將是后續(xù)研究工作的重點(diǎn)3 電動(dòng)自行車騎行人與交通執(zhí)法者的動(dòng)態(tài)處罰演化博弈模型分析
3.1 動(dòng)態(tài)處罰演化博弈模型構(gòu)建
3.2 動(dòng)態(tài)處罰策略模型的求解及穩(wěn)定性分析
4 演化博弈仿真分析
4.1 純策略條件
4.2 混合策略條件
5 結(jié)論