張志成,張 艷
(1.河南工學(xué)院,河南 新鄉(xiāng) 453003;2.河南師范大學(xué) 計算機與信息工程學(xué)院,河南 新鄉(xiāng) 453007)
中心極限定理是概率論中重要的基本理論,在概率論及數(shù)理統(tǒng)計的理論研究和實際應(yīng)用中都有著舉足輕重的地位。關(guān)于相互獨立的隨機變量之和的極限分布的一系列定理統(tǒng)稱為中心極限定理。只要n充分大,我們就可以用中心極限定理作近似計算。它為解決實際應(yīng)用問題提供了理論基礎(chǔ)。
國內(nèi)外不少專家、學(xué)者廣泛研究了中心極限定理在實際中的應(yīng)用。2005 年唐莉等人以彩票業(yè)和保險業(yè)為實例討論了大數(shù)定律和中心極限定理的實際應(yīng)用[1]。同年,王東紅研究了大數(shù)定律與中心極限定理在保險中的重要應(yīng)用[2]。2011 年,王丙參等人討論了中心極限定理在制定保費及自留額、擬定保險單位數(shù)及減少保險個人平均危險值等方面的應(yīng)用[3]。2018 拉窮等探討和分析了中心極限定理在保險經(jīng)營中的應(yīng)用[4]。本文從概率預(yù)測和樣本容量推斷兩個方面來探討中心極限定理在實際生活中的應(yīng)用。
棣莫佛-拉普拉斯中心極限定理[5]:
中心極限定理表明,如果某一個量的變化受到許多隨機因素的影響,且這些因素中每一個所起的作用都很小,那么這個量就服從或近似服從正態(tài)分布。而在經(jīng)濟問題中這些量是很常見的。這就是為什么我們對經(jīng)濟問題進行定量分析時,往往假定在主要因素的影響之外其他各種因素的影響可以用一個服從正態(tài)分布的隨機變量來描述的原因。
在解決實際問題時,很多總體的分布往往是未知的,或僅知道其分布概型但里面含有未知的參數(shù)。這時,我們要了解總體的分布,需要根據(jù)以往的統(tǒng)計數(shù)據(jù)或經(jīng)驗數(shù)據(jù)來估計未知的參數(shù)。因此我們可以采用抽樣的方法,利用已知的統(tǒng)計數(shù)據(jù)或經(jīng)驗數(shù)據(jù)估計出總體的概率,并將其作為條件,對某事件發(fā)生的情況作出預(yù)測。
例如:假設(shè)人在新冠肺炎傳染性疾病流行時的感染率為0.5%,為滿足防疫的需要,在某社區(qū)隨機抽取500 人進行檢疫,結(jié)果發(fā)現(xiàn)感染人數(shù)不超過1 人,問該傳染病是否已經(jīng)在該社區(qū)流行?
我們不難發(fā)現(xiàn),這類問題經(jīng)常將樣本值與期望值進行比較或?qū)⒖傮w的概率與抽樣的頻率進行比較,這時將很難得到合理的結(jié)論,往往需要用概率去預(yù)測。
假設(shè)該傳染病已經(jīng)在本地區(qū)流行,感染率p為0.005,任取500 人進行檢疫,則有X人感染的頻率為X/500,且X~N(500,0.005)。
由式(1),可得
還有一些問題,我們只知道它可以用二項分布來描述,而總體的概率未知或無法估計,這時根據(jù)大數(shù)定律,我們可以用抽樣的頻率來估計總體的概率,但是如何在一定的可信度下,使估計值滿足精度的要求?樣本容量取多少合適?根據(jù)棣莫佛-拉普拉斯中心極限定理,可以給出一種簡單的推斷方法[6]。
例如:某農(nóng)場欲購買一大批種子,為了了解某品牌種子的真實發(fā)芽率,事先購買了一部分樣本進行發(fā)芽實驗。那么應(yīng)該先購買多少粒種子,才能使得實驗的發(fā)芽率與真實發(fā)芽率的絕對誤差不超過假設(shè)推斷的可信度
顯然總體X(該批種子發(fā)芽的數(shù)量)服從二項分布,而總體概率p(該批種子發(fā)芽的概率)未知,假設(shè)先購買了n粒種子X1,X2,…,Xn進行發(fā)芽實驗,則X1,X2,…,Xn是來自總體X的一個簡單隨機樣本,fn為購買的n粒種子發(fā)芽的數(shù)量。那么在可信度n應(yīng)取多少才能使
即滿足式(3)的n的值即為所求
可得,對于任意的p,有n2401。
故應(yīng)先購買2401 粒種子,才能有95%的把握使實驗發(fā)芽率與真實發(fā)芽率的絕對誤差不超過0.05。
假如該農(nóng)場經(jīng)推斷后購買了3000 粒種子做發(fā)芽實驗,結(jié)果有2700 粒種子發(fā)芽,此時推斷出該批種子的真實發(fā)芽率的置信區(qū)間(置信水平為95%)是
則該農(nóng)場可根據(jù)該置信區(qū)間決定是否大批量購買該品牌的種子。
中心極限定理在實際生活中的應(yīng)用非常廣泛。本文以中心極限定理為理論依據(jù),針對生活中的一些實際問題,討論了其在概率預(yù)測、樣本容量推斷等方面的應(yīng)用,為教學(xué)和科研提供一定的參考。