丁 健,李紅菊
(安徽新華學(xué)院公共課教學(xué)部,安徽合肥230088)
在經(jīng)濟(jì)數(shù)學(xué)的實(shí)際問題中,隨機(jī)變量到處可見,許多隨機(jī)變量服從正態(tài)分布,即使有些隨機(jī)變量不服從正態(tài)分布,但它們的和也近似服從正態(tài)分布,這是由中心極限定理決定的.在概率論中凡是在一定條件下判定隨機(jī)變量之和的分布是正態(tài)分布的定理統(tǒng)稱為中心極限定理.中心極限定理解釋了正態(tài)分布廣泛存在的原因,并為解決實(shí)際問題時(shí)利用正態(tài)分布提出了理論依據(jù).目前教科書上僅對中心極限定理做了理論上的闡述,對它的實(shí)用價(jià)值涉及較少,本文通過統(tǒng)計(jì)推斷中的實(shí)際問題來說明中心極限定理的廣泛應(yīng)用.通過對實(shí)際問題的探討和學(xué)習(xí),學(xué)生能夠較深刻地理解和掌握中心極限定理,這對教學(xué)有實(shí)際意義.
獨(dú)立同分布的中心極限定理和棣莫弗-拉普拉斯中心極限定理是我們所熟悉的兩大類中心極限定理,具體內(nèi)容如下:
獨(dú)立同分布的中心極限定理[1]設(shè)隨機(jī)變量 X1,X2,…,Xn相互獨(dú)立,且服從同一分布,E(Xi)=u,D(Xi)= σ2,i=1,2,…,n,則當(dāng) n 很大時(shí),隨機(jī)變量,即
棣莫弗 -拉普拉斯中心極限定理[1]在n重伯努力試驗(yàn)中,事件A在每次試驗(yàn)中發(fā)生的概率為p,ηn為事件A發(fā)生的次數(shù),則當(dāng)n充分大時(shí),有或
數(shù)理統(tǒng)計(jì)一般研究正態(tài)總體均值和方差的統(tǒng)計(jì)估計(jì),而由簡單隨機(jī)抽樣得到的隨機(jī)變量是相互獨(dú)立且服從同一分布的,所以在實(shí)際問題中,不論總體服從什么樣的分布,只要樣本的容量充分大,我們就可以根據(jù)中心極限定理把隨機(jī)變量的和近似看成服從正態(tài)分布,直接利用中心極限定理進(jìn)行統(tǒng)計(jì)推斷,對總體中未知參數(shù)進(jìn)行區(qū)間估計(jì).
不論總體服從什么分布,只要選擇的樣本容量足夠大,根據(jù)中心極限定理,樣本均值為選取樞軸量關(guān)于總體均值的置信水平為1-α的置信區(qū)間為在許多實(shí)際問題中,我們還經(jīng)常碰到總體分布和總體方差均未知的情況,此時(shí)可以用樣本方差s2作為總體方差D(X)的無偏估計(jì)量,用s2代替D(X),根據(jù)中心極限定理,仍可以求出μ的置信水平為1-α的置信區(qū)間
例1 以X表示某一工廠生產(chǎn)的某種器材的壽命(以小時(shí)計(jì)),經(jīng)驗(yàn)表明D(X)=1156,現(xiàn)從總體中取得一容量為49的樣本,得到各個觀察值,并計(jì)算出樣本均值珋x=1589,樣本方差s2=1122.25.求總體均值μ在置信水平為0.95時(shí)的置信區(qū)間.
解 由題意可知,從總體中抽取了一個大樣本(n=49),不論總體服從什么樣的分布,根據(jù)中心極限定理,樣本均值
1-α=0.95,總體均值μ的置信水平為0.95的置信區(qū)間為查正態(tài)分布表得.代入觀察值得到這家工廠制造的器件平均壽命的置信水平為0.95的置信區(qū)間為(1579.48,1598.52),這說明這家工廠制造的器件平均壽命在(1579.48,1598.52)的概率不小于0.95.
注 如果在例1中不知總體的方差,仍可以計(jì)算出總體均值μ的置信水平為0.95的置信區(qū)間
如果試驗(yàn)是伯努力試驗(yàn),隨機(jī)事件A發(fā)生的概率p未知,可以從總體中抽取一個容量(n)很大的樣本,fn表示事件A發(fā)生的次數(shù)。當(dāng)樣本容量很大時(shí),二項(xiàng)式分布近似于正態(tài)分布,即),對 p進(jìn)行統(tǒng)計(jì)估計(jì),則關(guān)于p的置信水平為1-α的置信區(qū)間為
例2 糧站有一大批糧種,欲了解糧種的發(fā)芽率p,在其中任選了6400粒進(jìn)行試驗(yàn),試驗(yàn)結(jié)果5000粒發(fā)芽,求糧種發(fā)芽率p的置信水平為0.99的置信區(qū)間.
1-α=0.99,得到發(fā)芽率p在置信水平為0.99時(shí)的置信區(qū)間為
假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的另一個重要內(nèi)容.對總體分布函數(shù)的形式或關(guān)于總體參數(shù)值的陳述叫做統(tǒng)計(jì)假設(shè)[1].總體的分布或參數(shù)未知的情況下,通過一些預(yù)知的知識對總體提出兩個假設(shè)H0和H1,然后根據(jù)樣本去判斷是接受H0還是拒絕H0的過程是假設(shè)檢驗(yàn)[1].
在許多實(shí)際經(jīng)濟(jì)問題中,研究的幾乎都是大樣本.根據(jù)中心極限定理,當(dāng)樣本容量很大時(shí),對總體的均值進(jìn)行假設(shè)檢驗(yàn),提出原假設(shè) H0:E(X)=μ0,可以選取檢驗(yàn)統(tǒng)計(jì)量或,當(dāng)原假設(shè)H0成立時(shí),檢驗(yàn)統(tǒng)計(jì)量Z近~似N(0,1),選擇顯著性水平為α,此時(shí)H0的拒絕域?yàn)?/p>
例3 某農(nóng)業(yè)大學(xué)研究在改善栽培條件下黃豆的重量是否有明顯改變,已知改善條件前黃豆的平均重量μ0=350(單位:mg),σ未知,現(xiàn)隨機(jī)地抽取100粒,測得這100粒黃豆的平均重量x珋=352.5mg,s2=25,問在顯著性水平α=0.05條件下改善栽培條件后黃豆的重量是否較之前重量有明顯差異?
解 由題意H0:E(X)= μ0;H1:E(X)≠μ0,其中μ0=350.
在顯著性水平 α=0.05的條件下,H0的拒絕域?yàn)閨Z|≤zα=Z0.025.
查正態(tài)分布表z0.025=1.96,故|Z|=,所以接受原假設(shè),即認(rèn)為在顯著性水平α=0.05的條件下改善栽培條件后黃豆的重量較之前重量有明顯差異.
由于實(shí)際的經(jīng)濟(jì)問題均通過大樣本來估計(jì)總體,總體的分布已知不是必要的解題條件,只要當(dāng)樣本容量很大,隨機(jī)變量的和總是近似服從正態(tài)分布,正是這個結(jié)論使得中心極限定理可以解決很多實(shí)際問題.本文僅探討了中心極限定理在統(tǒng)計(jì)推斷中關(guān)于總體未知參數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn)的一些實(shí)際應(yīng)用,其實(shí)在商業(yè)管理決策、函數(shù)極限求法、保險(xiǎn)業(yè)、抽樣推斷中的概率預(yù)測和樣本容量的確定等實(shí)際問題中都會用到中心極限定理,所以對于中心極限定理的研究具有一定的理論意義和實(shí)際價(jià)值.
[1]盛驟,謝式千.概率論與數(shù)理統(tǒng)計(jì)及其應(yīng)用[M].北京:高等教育出版社,2010.
[2]劉家琨.應(yīng)用概率統(tǒng)計(jì)[M].北京:科學(xué)出版社,2004.