鄧世容 石躍勇
摘 要 本文以概率論與數(shù)理統(tǒng)計(jì)課程中的兩個(gè)典型問題(復(fù)雜難求概率的估計(jì)、非正態(tài) 總體的假設(shè)檢驗(yàn))為例,給出了基于蒙特卡洛方法的解答過程。并用統(tǒng)計(jì)模擬驗(yàn)證了提出的方法的可行性及有效性。
關(guān)鍵詞 蒙特卡洛方法 概率 統(tǒng)計(jì)
中圖分類號(hào):G424 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.16400/j.cnki.kjdks.2018.01.050
Applications of Monte Carlo Method in Teaching of
Probability and Mathematical Statistics
DENG Shirong[1], SHI Yueyong[2]
([1] School of Mathematics and Statistics, Wuhan University, Wuhan, Hubei 430072;
[2]School of Economics and Management, China University of Geosciences, Wuhan, Hubei 430074)
Abstract In this paper, the Monte Carlo Method for the two classical problems (probability estimation and hypothesis testing for non-normal population) in Probability and Mathematical Statistics is described. Simulations are developed to verify the feasibility and effectiveness of the proposed method.
Keywords Monte Carlo Method; probability; statistics
概率論與數(shù)理統(tǒng)計(jì)是一門主要研究隨機(jī)現(xiàn)象的統(tǒng)計(jì)規(guī)律性的學(xué)科,廣泛應(yīng)用于社會(huì)生活的各個(gè)學(xué)科中。[1]在其教學(xué)過程中,理論知識(shí)的講述是根本,同時(shí)也應(yīng)該引導(dǎo)學(xué)生學(xué)習(xí)運(yùn)用理論知識(shí)分析實(shí)際應(yīng)用問題。在實(shí)際問題分析的過程中,利用統(tǒng)計(jì)軟件得到的數(shù)據(jù)、圖表的等可以幫助學(xué)生對(duì)問題有更全面直觀的理解,同時(shí)也可以培養(yǎng)學(xué)生的學(xué)習(xí)興趣與實(shí)踐經(jīng)驗(yàn)。因此,在課程引入統(tǒng)計(jì)軟件的簡(jiǎn)單運(yùn)用是必要的,并且會(huì)是對(duì)概率論與數(shù)理統(tǒng)計(jì)教學(xué)的一大改進(jìn)。
R軟件是一種完全免費(fèi)共享的統(tǒng)計(jì)軟件(http://www.r-project.org),它提供了豐富的統(tǒng)計(jì)軟件包,可以非常方便靈活地分析數(shù)據(jù),深受統(tǒng)計(jì)學(xué)家們的喜愛。 [2]R在Windows、Mac、Linux系統(tǒng)下都可以安裝使用,并且掌握起來很容易,學(xué)生在概率統(tǒng)計(jì)課程中學(xué)習(xí)使用R軟件,有助于更好地理解理論問題,提高學(xué)習(xí)興趣。
蒙特卡洛方法,也稱為統(tǒng)計(jì)模擬方法,是二十世紀(jì)四十年代中期由于電子計(jì)算機(jī)的發(fā)明及科學(xué)技術(shù)的發(fā)展,而被提出的一種以概率統(tǒng)計(jì)理論為指導(dǎo)非常重要的數(shù)值計(jì)算方法。蒙特卡洛方法通過構(gòu)造符合一定規(guī)則的隨機(jī)數(shù)來解決數(shù)學(xué)上的各種問題。當(dāng)所求解問題是某種隨機(jī)事件出現(xiàn)的概率或者是某個(gè)隨機(jī)變量的期望值時(shí),蒙特卡洛方法通過隨機(jī)模擬的方法用這個(gè)事件出現(xiàn)的頻率估計(jì)這一隨機(jī)事件的概率,或者得到這個(gè)隨機(jī)變量的某些數(shù)字特征,并將其作為問題的解。
在概率論與數(shù)理統(tǒng)計(jì)的傳統(tǒng)教學(xué)中,一般并未討論下面的兩類問題。一類是要計(jì)算的概率涉及到不能用初等函數(shù)表示出來的積分時(shí),所求概率最終是求不出來的;另一類是非正態(tài)總體的假設(shè)檢驗(yàn)問題,難點(diǎn)在于在非正態(tài)總體下檢驗(yàn)統(tǒng)計(jì)量的分布不好確定。針對(duì)這兩類實(shí)際應(yīng)用中會(huì)存在的這兩類問題,我們提出了用蒙特卡洛方法來解答,并通過模擬驗(yàn)證了我們提出方法的可行性及合理性。為這兩類問題給出了簡(jiǎn)單直觀的解答方式,為概率論與數(shù)理統(tǒng)計(jì)的教學(xué)提供了更為豐富的資料。
1 概率的估計(jì)
例1 考慮(0,1)區(qū)間上均勻分布且獨(dú)立的隨機(jī)變量和,求概率。
解:本題的求解的常規(guī)方法就是求二重積分,但是無法用初等函數(shù)表示出來,[3] 因此寫不出具體的結(jié)果。下面我們給出蒙特卡洛方法的具體過程:
1)隨機(jī)生成個(gè)隨機(jī)點(diǎn),即和是(0,1)上均勻分布的隨機(jī)數(shù);
2)計(jì)算個(gè)點(diǎn)中滿足條件的點(diǎn)的個(gè)數(shù),記為;
3)當(dāng),所求概率近似等于頻率。
將上述步驟編寫成R模擬程序(程序名:Calpro.R)如下:
Calpro<-function(n){
k<-0;x<-runif(n);y<-runif(n)
for(i in 1:n){
if (y[i]<=exp(-x[i]^2))
k<-k+1
}
k/n
}
調(diào)用Calpro.R函數(shù),取不同的,重復(fù)運(yùn)行1000次,取平均值()作為最終結(jié)果,并且得到這1000次估計(jì)的樣本標(biāo)準(zhǔn)差(),結(jié)果見表1:
由表1可知,當(dāng)不斷增大并且趨于無窮時(shí),所求概率逐漸穩(wěn)定在常數(shù)0.7468附近,且估計(jì)的標(biāo)準(zhǔn)差也越來越小,說明我們所要求的概率=0.7468。
2 非正態(tài)總體的假設(shè)檢驗(yàn)
例2 假設(shè)樣本獨(dú)立同分布于非正態(tài)總體,其期望為 ,方差為 2。在實(shí)際應(yīng)用中,有時(shí)需檢驗(yàn)如下的假設(shè):
。
解: 想要對(duì)上述假設(shè)做檢驗(yàn),首先要找到一個(gè)合適的統(tǒng)計(jì)量,對(duì)于非正態(tài)總體, 通常的分布形式很難寫出,因此無法得到基于這個(gè)統(tǒng)計(jì)量的檢驗(yàn)拒絕域。
下面我們利用蒙特卡洛方法給出基于這個(gè)統(tǒng)計(jì)量的檢驗(yàn)方法:
1)生成個(gè)服從的隨機(jī)數(shù),計(jì)算統(tǒng)計(jì)量的值,記為;
2)將步驟1)重復(fù)次,得到;
3)將從小到大順序排列,得到;
4)對(duì)于給定的顯著性水平 ,定義的上 分布點(diǎn)為,其中表示不超過的最大整數(shù);[4]
5)對(duì)于假設(shè)構(gòu)造拒絕域,再根據(jù)樣本觀測(cè)值判定檢驗(yàn)結(jié)果。
我們以為例[5],取,用上述方法得到了其上 分位點(diǎn)。由中心極限定理知,依分布收斂于,則的近似上 分位點(diǎn),其中為標(biāo)準(zhǔn)正態(tài)分布的上 分位點(diǎn)。按照上述過程編寫程序,并運(yùn)行1000次,得到的平均值及樣本標(biāo)準(zhǔn)差(), 另外還得到了的平均值。表2中給出了 =0.025和0.05的模擬結(jié)果,其他值的結(jié)果也可得到(由于篇幅限制,這里并未給出)。
從表2可知,上述蒙特卡洛方法得到的統(tǒng)計(jì)量的上 分位點(diǎn)與由中心極限定理得到的上 分位點(diǎn)是可比的,并且當(dāng)樣本量增加,蒙特卡洛方法重復(fù)的次數(shù)增加時(shí),這兩個(gè)分位點(diǎn)的差距變小,且標(biāo)準(zhǔn)差也變小,說明結(jié)果更穩(wěn)定。充分說明提出的蒙特卡洛方法可以得到合理的分位點(diǎn),進(jìn)而得到準(zhǔn)確的假設(shè)檢驗(yàn)的結(jié)論。
本文以概率論與數(shù)理統(tǒng)計(jì)中常規(guī)方法求解不出來的概率的估計(jì)以及非正態(tài)總體的假設(shè)檢驗(yàn)問題,提出利用蒙特卡洛方法來求解,用R軟件編程模擬驗(yàn)證所述方法是可行的。這些例子可作為教學(xué)示例演示給學(xué)生,會(huì)使得課程內(nèi)容更加豐富;同時(shí)也可以激發(fā)學(xué)生的學(xué)習(xí)熱情,自主學(xué)習(xí)用統(tǒng)計(jì)軟件分析理論知識(shí),真正做到理論與實(shí)踐的完美結(jié)合。
*通訊作者:鄧世容
基金項(xiàng)目: 武漢大學(xué)教學(xué)改革研究項(xiàng)目(QYW201409);中央高校教改基金項(xiàng)目(G1320311745)
參考文獻(xiàn)
[1] 劉祿勤,王文祥,龔曉慶.概率論與數(shù)理統(tǒng)計(jì)(第二版).北京:高等教育出版社,2011.
[2] 薛毅,陳立萍.統(tǒng)計(jì)建模與R軟件.北京:清華大學(xué)出版社,2007.
[3] 華東師范大學(xué)數(shù)學(xué)系.數(shù)學(xué)分析(上冊(cè)),北京:高等教育出版社,2000.
[4] 楊自強(qiáng).你也需要蒙特卡羅方法——一個(gè)得心應(yīng)手的工具[J].數(shù)理統(tǒng)計(jì)與管理,2007.26(1):178-188.
[5] 張幗奮,丁寧.一種非對(duì)稱拉普拉斯分布[J].浙江大學(xué)學(xué)報(bào)(理學(xué)版),2014.41(6):650-653.