熊梅 張大林
摘 要 中心極限定理在概率論與數(shù)理統(tǒng)計(jì)中具有首席定理之稱,是概率論與數(shù)理統(tǒng)計(jì)教學(xué)過程中的一個(gè)重難點(diǎn)。本文將實(shí)驗(yàn)項(xiàng)目融入中心極限定理的教學(xué)過程之中,設(shè)計(jì)了數(shù)值模擬和圖形模擬兩個(gè)實(shí)驗(yàn)項(xiàng)目,并利用MATLAB軟件實(shí)現(xiàn)。對(duì)于數(shù)值模擬項(xiàng)目,將實(shí)驗(yàn)數(shù)值與理論數(shù)值進(jìn)行比較,得到中心極限定理直觀的近似結(jié)果。對(duì)圖形模擬項(xiàng)目,展示了中心極限定理蘊(yùn)含的極限變化過程,使得抽象的教學(xué)內(nèi)容具體化、直觀化和形象化,加深了學(xué)生對(duì)中心極限定理的理解,提高了課堂教學(xué)效果。
關(guān)鍵詞 中心極限定理;實(shí)驗(yàn)項(xiàng)目;MATLAB;教學(xué)設(shè)計(jì)
中圖分類號(hào):G424? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A? DOI:10.16400/j.cnki.kjdk.2021.33.032
Teaching Design of Central Limit Theorem Based on Experimental Project
XIONG Mei, ZHANG Dalin
(School of Mathematics and Statistics, Qiannan Normal University for Nationalities, Duyun, Guizhou 558000)
Abstract The central limit theorem is called the chief theorem in probability theory and mathematical statistics. It is significant and difficult in the teaching process of probability theory and mathematical statistics. In this paper, the experimental projects are integrated into the teaching process of the central limit theorem, and two experimental projects, numerical simulation and graphic simulation, are designed and realized by using MATLAB software. For the numerical simulation project, comparing with the theoretical value the intuitive results approximated of the central limit theorem is obtained. The graphic simulation project shows the limit changing process contained in the central limit theorem, which makes the abstract teaching content concretized, intuitional and visualized, deepens students' understanding of the central limit theorem and improves the classroom teaching effect.
Keywords central limit theorem; experimental project; MATLAB; teaching design
在自然界中,一些現(xiàn)象受到許多相互獨(dú)立的隨機(jī)因素的影響,如果每個(gè)因素所產(chǎn)生的影響都很微小時(shí),總的影響可以看作是服從正態(tài)分布的。中心極限定理就是從數(shù)學(xué)上證明了這一現(xiàn)象。中心極限定理是概率論的重要內(nèi)容,也是數(shù)理統(tǒng)計(jì)學(xué)的基石之一,是概率論與數(shù)理統(tǒng)計(jì)課程教學(xué)中的一個(gè)重難點(diǎn)。在實(shí)際教學(xué)過程中,由于中心極限定理本身的抽象性和結(jié)果的多樣性使得學(xué)生容易產(chǎn)生畏難情緒,導(dǎo)致學(xué)生很難準(zhǔn)確深入理解中心極限定理的實(shí)質(zhì)。
1 中心極限定理的表述
中心極限定理的第一版是被法國數(shù)學(xué)家棣莫弗發(fā)現(xiàn)的,他在1733年發(fā)表的卓越論文中使用正態(tài)分布去估計(jì)大量拋擲硬幣出現(xiàn)正面次數(shù)的分布。 這個(gè)超越時(shí)代的成果險(xiǎn)些被歷史遺忘,所幸著名法國數(shù)學(xué)家拉普拉斯在1812年發(fā)表的巨著《概率分析理論》中拯救了這個(gè)默默無名的理論。 拉普拉斯擴(kuò)展了棣莫弗的理論,指出二項(xiàng)分布可用正態(tài)分布逼近。1901年,俄國數(shù)學(xué)家里雅普諾夫用更普通的隨機(jī)變量定義中心極限定理,并在數(shù)學(xué)上進(jìn)行了精確的證明。如今,中心極限定理被認(rèn)為是(非正式地)概率論中的首席定理。主要表述為: Lindeberg-Levy中心極限定理(獨(dú)立同分布中心極限定理)、De Moivre-Laplace中心極限定理(二項(xiàng)分布的正態(tài)近似)和Lyapunov中心極限定理(獨(dú)立但不同分布中心極限定理)。[1]其中De Moivre-Laplace中心極限定理是獨(dú)立同分布中心極限定理的特殊情況,而Lyapunov中心極限定理則比獨(dú)立同分布中心極限定理更具有一般性。
1.1 De Moivre-Laplace中心極限定理
設(shè)隨機(jī)變量服從參數(shù)為的二項(xiàng)分布,即則對(duì)于任何實(shí)數(shù)有下式成立:
1.2 Lindeberg- Levy中心極限定理
設(shè)隨機(jī)變量相互獨(dú)立且服從同一分布,數(shù)學(xué)期望和方差都存在且方差不為0,即,,,則對(duì)于任何實(shí)數(shù)有下式成立:
1.3 Lyapunov中心極限定理
設(shè)隨機(jī)變量相互獨(dú)立,且數(shù)學(xué)期望,方差,記。 若滿足如下Lindeberg條件:存在,使得時(shí),有
則
這個(gè)定理證明了由大量微小的而且獨(dú)立的隨機(jī)因素引起并累積而成的變量,必將是一個(gè)正態(tài)隨機(jī)變量。
2 中心極限定理的實(shí)驗(yàn)項(xiàng)目設(shè)計(jì)
中心極限定理究竟說明的是一個(gè)什么樣的現(xiàn)象,它反映了怎樣的統(tǒng)計(jì)規(guī)律和分布特征呢?除了數(shù)學(xué)理論上的證明外,我們還可以通過實(shí)驗(yàn)的形式,來直觀的理解和掌握中心極限定理的本質(zhì)特征。下面兩個(gè)實(shí)驗(yàn)項(xiàng)目的實(shí)現(xiàn)可以發(fā)現(xiàn),當(dāng)獨(dú)立隨機(jī)變量的個(gè)數(shù)不斷變大時(shí),隨機(jī)變量之和的分布會(huì)趨向于正態(tài)分布。這一現(xiàn)象指出了正態(tài)分布使用范圍之廣的原因,也間接證明了正態(tài)分布在實(shí)際案例中起到了關(guān)鍵作用。[4]
2.1 數(shù)值近似實(shí)驗(yàn)項(xiàng)目
設(shè)隨機(jī)變量服從參數(shù)為0.5的泊松分布,即~(0.5),其30次重復(fù)觀測(cè)結(jié)果為,記
用計(jì)算機(jī)模擬的重復(fù)觀測(cè)結(jié)果1000次,將的經(jīng)驗(yàn)分布函數(shù)()與在點(diǎn)
,
的值相比較,并解釋比較結(jié)果。[2]
解:在Matlab命令窗口中輸入代碼:
>>y=poissrnd(0.5,1000,30);得到一個(gè)1000?0階的矩陣該矩陣的每一行可以看作的一次30次重復(fù)觀測(cè)的模擬結(jié)果。
執(zhí)行代碼:>>xm= (mean (y,2)-0.5)*sqrt(60);
得到1000維的列向量,它是每個(gè)分量都是的一次重復(fù)觀測(cè)的模擬結(jié)果。
運(yùn)行代碼:>>sum([xm<-3,xm<-2.5,xm<-2,xm<-1.5,xm<-1,xm<-0.5])/1000
得到的經(jīng)驗(yàn)分布函數(shù)在-3,-2.5,-2,-1.5,-1,-0.5處的值:
ans= ?0.0000 ? 0.0000 ? 0.0220 ? 0.0790 ? 0.1900 ? 0.3670
>>sum([xm<0,xm<0.5,xm<1,xm<1.5,xm<2,xm<2.5,xm<3])/1000
得到的經(jīng)驗(yàn)分布函數(shù)在0,0.5,1,1.5,2,2.5,3處的值:
ans= ?0.4740 ? 0.6640 ? 0.8110 ? 0.9220 ? 0.9680 ? 0.9860 ? 0.9960
>>normcdf(-3:0.5:3,0,1)
得到分布函數(shù)在點(diǎn)的值,0≤k≤12。
ans= ?Columns 1 ?through 7
0.0013 ? ?0.0062 ? ?0.0228 ? ?0.0668 ? ?0.1587
0.3085 ? 0.5000
Columns 8 ?through 13
0.6915 ? ?0.8413 ? ?0.9332 ? ?0.9772 ? ?0.9938
0.9987
將所得的經(jīng)驗(yàn)分布函數(shù)和正態(tài)分布函數(shù)的值列入表1。比較兩個(gè)分布函數(shù)在相同點(diǎn)的值,發(fā)現(xiàn)它們的最大誤差不超過0.06,說明用標(biāo)準(zhǔn)正態(tài)分布函數(shù)來近似的經(jīng)驗(yàn)分布函數(shù)的效果還是比較好的(表1)。
2.2 圖形模擬實(shí)驗(yàn)項(xiàng)目
由獨(dú)立同分布中心極限定理可知,當(dāng)充分大時(shí),獨(dú)立同分布的隨機(jī)變量序列的平均值近似服從正態(tài)分布。現(xiàn)以指數(shù)分布為例,在樣本容量較大時(shí),模擬服從指數(shù)分布的相互獨(dú)立的隨機(jī)變量序列的平均值的分布。設(shè)指數(shù)分布的概率密度函數(shù)為,其分布函數(shù)為
不妨以為例,編寫Matlab程序如下:[3]
clc, clear, N=10^5;theta=3;n=5;
x=exprnd(theta,[1,N]);
hist(x,10)
for i=1:floor(N/n)
mu(i)=mean(x((i-1)*n+1:i*n));
end
figure(2),hist(mu,10)
運(yùn)行后得到服從指數(shù)分布的隨機(jī)變量序列的平均值的模擬柱狀圖如圖1、圖2、圖3、圖4。
由圖1到圖4可以看出,當(dāng)n=1,隨機(jī)變量序列的平均值的分布就是指數(shù)分布,當(dāng)n=10時(shí)只有偏正態(tài)分布的雛形,n=40時(shí),開始呈現(xiàn)正態(tài)分布的特征,到n=80時(shí),分布特征越來越接近于標(biāo)準(zhǔn)的正態(tài)分布。從而直觀的模擬了獨(dú)立同分布的隨機(jī)變量序列的均值隨著n的增大越來越趨向于(此例中)正態(tài)分布。同時(shí)方差越來越小。即時(shí),。
3 結(jié)束語
在本教學(xué)設(shè)計(jì)中,通過實(shí)驗(yàn)項(xiàng)目的加入,以數(shù)值比較和圖形模擬直觀展示了中心極限定理的深刻內(nèi)涵,加深學(xué)生對(duì)概念本質(zhì)的理解。 實(shí)施實(shí)驗(yàn)教學(xué),既可以提高學(xué)生的學(xué)習(xí)興趣和編程能力,還可以培養(yǎng)學(xué)生數(shù)學(xué)直覺性和創(chuàng)造力,是一個(gè)不錯(cuò)的教學(xué)設(shè)計(jì)項(xiàng)目和實(shí)施方案。
基金項(xiàng)目:2020年黔南州科技計(jì)劃項(xiàng)目“黔南民族師范學(xué)院一流學(xué)科專項(xiàng)(數(shù)學(xué))”(2020XK03ST)
參考文獻(xiàn)
[1] 茆詩松.概率論與數(shù)理統(tǒng)計(jì)教程[M].2版.北京:高等教育出版社,2010.
[2] 張德豐等.MATLAB概率與數(shù)理統(tǒng)計(jì)分析[M].北京:機(jī)械工業(yè)出版社,2010.
[3] 馬翠玲等.融入數(shù)學(xué)史,借助MATLAB實(shí)現(xiàn)中心極限定理形象化教學(xué)[J].大學(xué)數(shù)學(xué),2014.12.30(1):115-118.
[4] 李生彪.中心極限定理在實(shí)際中的應(yīng)用[J].甘肅科技,2008,24(18):72-73.