劉禹彤 趙毅
一、圣彼得堡悖論
圣彼得堡悖論來自于一個擲幣游戲關(guān)于概率期望值的悖論。擲幣游戲規(guī)則:設(shè)定擲出正面為成功,游戲者如果第一次投擲成功,得獎金2元,游戲結(jié)束;否則,繼續(xù)投擲,第二次成功得獎金4元,游戲結(jié)束;以此類推,如果第n次投擲成功,得獎2n金元,游戲結(jié)束。
按照概率期望值的計算方法:將每一個可能結(jié)果的獎金乘以該結(jié)果發(fā)生的概率,即可得到該結(jié)果的獎金期望值,游戲的期望值即為所有可能結(jié)果的獎金期望值之和。隨著實驗次數(shù)n的增加,雖然發(fā)生概率小,但獎金越來越多,且每一個結(jié)果的獎金期望值均為1,則游戲的期望值將為“無窮大”。而且按照概率的理論,多次實驗的結(jié)果將會接近于數(shù)學(xué)期望。
但是,以往經(jīng)驗表明“沒有人愿意花25元去參加一次這樣的游戲。”這就出現(xiàn)了計算的期望值與實際情況的“矛盾”。我們可以使用MATLAB軟件模擬實驗過程來解釋這一問題。
二、圣彼得堡實驗的MATLAB模擬分析
由于投擲硬幣得到正面和反面的概率相同(等概率事件),即P(正面)=P(反面)=0.5。
1.單輪圣彼得堡游戲的MATLAB模擬
當(dāng)游戲參與者投擲硬幣出現(xiàn)正面時游戲結(jié)束,我們可以將每次投擲的隨機值由函數(shù)rand產(chǎn)生。如果該次rand函數(shù)運算結(jié)果小于等于0.5,定義為投擲出反面,游戲繼續(xù);反之,則定義為投擲出正面,游戲終止。
由于圣彼得堡游戲的不確定性,為了獲得可信度較高的均值數(shù)據(jù),需要進行多次模擬。下面討論中,對一次性連續(xù)多次的游戲模擬統(tǒng)稱為一輪游戲模擬。一輪圣彼得堡游戲由多個單次圣彼得堡游戲組成。截取每次運行的投擲次數(shù)和獎金數(shù)額這兩個結(jié)果,得到單輪多次圣彼得堡游戲的MATLAB模型(設(shè)本輪投擲運行為100次)。從結(jié)果可以看出,在本輪模擬實驗中單次游戲最高獎金達到32元,但是平均獎金只有10.62元,遠小于32元。同時單次游戲最大投擲次數(shù)為5,但平均投擲次數(shù)只有1.98。
為了增加實驗的可靠性,減少不確定性,增加單輪游戲的次數(shù),以此觀察實驗結(jié)果與單輪100次模擬實驗的結(jié)果的異同,以此找出規(guī)律(程序運行5000次)。
結(jié)果表明:單次游戲的最高獎金雖然達到了2048元,但平均獎金只有13.4972元,遠小于2048元。同時,單次最大投擲次數(shù)增加為11,但平均投擲次數(shù)只有2.004。也就是說,對單次游戲來講,平均每次游戲能夠得到6.7351元。之所以可以達到13.4972元這樣的平均獎金,是由于游戲的不確定性,產(chǎn)生了11次的最大單次投擲次數(shù),使該游戲的獎金額大幅增加。
2.多輪圣彼得堡游戲的MATLAB模擬
在上圖中發(fā)現(xiàn)最大投擲次數(shù)隨著輪數(shù)的增加而增加,但是,增加速度并不明顯。其中,最大的投擲次數(shù)為16次,此時,這一事件的概率為,約為1.5259×10-5。
在此基礎(chǔ)上驗證了當(dāng)輪數(shù)為100000時的隨機模擬實驗,隨著輪數(shù)的劇增,但是,單輪最大投擲次數(shù)僅為18,最大獎金額為 262144元。
說明當(dāng)輪數(shù)趨向于無窮大時,最大投擲次雖然數(shù)也會增加,但是增加速率極慢。
在上圖100個樣本值中,數(shù)據(jù)分布如下:
54個數(shù)據(jù)分布在0~10元,均值為9.4720元,34個數(shù)據(jù)分布在10~20元,均值為17.1560元,8個數(shù)據(jù)分布在20~30元,均值為24.8400元,只有4個數(shù)據(jù)在30元以上。
綜上分析,圣彼得堡游戲的定價可以按照其從小到大排序的88個數(shù)據(jù)的平均值為參照標(biāo)準(zhǔn),定價為12元左右。
3.單輪游戲的平均投擲次數(shù)
從下圖可以發(fā)現(xiàn)無論單輪的游戲次數(shù)是多少,其單輪的平均投擲次數(shù)的平均值為1.9911,最大值為2.1071,最小值為1.82,在直線y=2上下波動震蕩(見下圖)。
三、結(jié)論
從以上的模擬實驗的結(jié)果數(shù)據(jù)分析得出以下結(jié)論:
1.圣彼得堡游戲的平均單次投擲次數(shù)趨近于2
2.單輪圣彼得堡游戲的最高投擲次數(shù)增長速度隨著次數(shù)的增加而變緩,趨近于0
3.單輪圣彼得堡游戲的平均獎金的增長速度隨著次數(shù)的增加而變緩,趨近于0
4.由于實驗的不確定性,單次游戲可以有較高的獎金,但是其概率極小,不會對其他參與者產(chǎn)生吸引力
由上述模擬結(jié)果分析得出:可以將游戲定價為12元時,此時需要投擲硬幣4次才可以贏取獎金4元,此時的概率為0.0625,這已經(jīng)是一個小概率事件了,而且可以保證游戲參與者中既有失敗者,又有成功者,而且游戲組織者的損失和收益也大致相當(dāng)。
參考文獻:
朱琳,葉向.圣彼得堡悖論的計算機模擬分析[J]計算機系統(tǒng)應(yīng)用,2009(11).
(作者單位 劉禹彤:北京林業(yè)大學(xué)理學(xué)院 趙毅: 浙江財經(jīng)大學(xué))