曹廣福,羅荔齡
?
中學(xué)數(shù)學(xué)部分概率內(nèi)容的教學(xué)策略
曹廣福,羅荔齡
(廣州大學(xué) 數(shù)學(xué)與信息科學(xué)學(xué)院,廣東 廣州 510006)
針對超幾何分布、條件概率、離散型隨機(jī)變量與分布列、相互獨(dú)立的隨機(jī)事件與二項(xiàng)分布、數(shù)學(xué)期望與方差以及正態(tài)分布等中學(xué)數(shù)學(xué)概率中幾個(gè)重要概念,創(chuàng)設(shè)了真實(shí)的問題情境引導(dǎo)課堂教學(xué),為教師的實(shí)際教學(xué)提供了具有可操作性的教學(xué)方案.特別對于正態(tài)分布密度函數(shù)的處理既不同于大學(xué)教材中的公式化定義,也不同于中學(xué)教材中頻率直方圖的極限定義.公式化的定義對于中學(xué)生顯得有些抽象,但利用頻率直方圖的極限定義,正態(tài)密度函數(shù)超出了中學(xué)生的知識點(diǎn)和認(rèn)知能力,實(shí)際教學(xué)的可操作性不大.首先,從函數(shù)模擬現(xiàn)實(shí)圖象出發(fā),通過現(xiàn)實(shí)的圖形與頻率直方圖的相似性找出模擬這類圖形的函數(shù);其次,討論這類函數(shù)中的參數(shù)與圖象之間的關(guān)系;最后,再回到概率,討論參數(shù)與數(shù)學(xué)期望與方差的關(guān)系,既很好地解釋了正態(tài)分布密度函數(shù)的幾何意義與參數(shù)的概率意義,也適應(yīng)中學(xué)生的認(rèn)知能力.
超幾何分布;條件概率;離散型隨機(jī)變量;分布列;數(shù)學(xué)期望;方差;正態(tài)分布
相比于大學(xué)的概率論,中學(xué)數(shù)學(xué)概率部分涵蓋的內(nèi)容雖然比較淺顯,但涉及的概念并不少,除了古典概型、幾何概型,還包括隨機(jī)變量、超幾何分布、離散型隨機(jī)變量及其分布列、二項(xiàng)分布、數(shù)學(xué)期望與方差、標(biāo)準(zhǔn)差以及正態(tài)分布,其中正態(tài)分布是中學(xué)概率教學(xué)中的一大難點(diǎn),根據(jù)研究者對不同地區(qū)一線教師的了解,學(xué)生普遍對這部分內(nèi)容的理解有困難,尤其是教材的處理方法似乎超越了學(xué)生的認(rèn)知范圍.例如,通過頻率直方圖的極限定義正態(tài)密度曲線存在幾個(gè)方面的認(rèn)知困難:(1)中學(xué)階段并不專門介紹極限概念,而且頻率直方圖的極限與微積分里的函數(shù)極限還有所不同,它是指圖形的極限;(2)隨著樣本量的增加(頻率直方圖的加細(xì)),對應(yīng)的是不同的隨機(jī)變量,換句話說,正態(tài)密度函數(shù)實(shí)際是頻率直方圖對應(yīng)的隨機(jī)變量分布列的極限,學(xué)生對通常函數(shù)序列的極限尚且不知,如何保證對隨機(jī)變量分布列的極限能真正理解?(3)正態(tài)密度函數(shù)是連續(xù)型隨機(jī)變量的密度函數(shù),但教材并不介紹連續(xù)型隨機(jī)變量的分布函數(shù),忽然冒出一個(gè)正態(tài)密度函數(shù)顯得有些突兀.這里擬針對這些問題重組課堂教學(xué),使之適應(yīng)學(xué)生的認(rèn)知能力.
即使一個(gè)隨機(jī)試驗(yàn)的樣本空間是有限的,也并不意味著這是個(gè)古典概型,因?yàn)槌霈F(xiàn)每一個(gè)結(jié)果的可能性未必相等.這就引出了概率分布列的概念.當(dāng)然,理論上講,概率分布列也可以是無限的,但既然教材限于有限情形,不必節(jié)外生枝.不過教材中總是以拋硬幣和抽球問題作為例子顯得單調(diào)了一點(diǎn),這里完全可以通過商品抽檢出現(xiàn)不合格品的概率為例說明概率分布列.例如可以通過下面的問題引導(dǎo)學(xué)生分析.
問題1:在件被抽檢的商品中,有(<)件不合格,從這些商品中隨機(jī)抽取一件,請用合適的隨機(jī)變量表示這個(gè)抽檢過程并寫出該隨機(jī)變量的分布列.
如果希望稍微復(fù)雜一點(diǎn),不妨以優(yōu)、良、中、合格、不合格等若干等級設(shè)計(jì)一個(gè)問題,就可以得到一般的概率分布列了.
教材中超幾何分布的正文雖然僅有兩頁紙,但依然有些啰嗦.如果僅僅是介紹超幾何分布的概率,寥寥數(shù)語就可以說清楚,但超幾何分布涉及組合問題,其中會(huì)出現(xiàn)一些比較復(fù)雜的問題,尤其是如果出現(xiàn)重復(fù)試驗(yàn)的過程,問題則更復(fù)雜,也就是緊接著超幾何分布之后的條件概率.但教材中“2.3獨(dú)立性”不如換成“2.3條件概率”更合適,因?yàn)闂l件概率本身不僅重要,而且還是全概率公式、貝葉斯公式中必不可少的概念,事件的獨(dú)立性也是通過條件概率來描述的.
教材中這部分內(nèi)容的編寫模式也值得斟酌.有些傳統(tǒng)還是值得肯定的,例如傳統(tǒng)教材中一個(gè)概念的出現(xiàn)一定會(huì)以“定義”的方式呈現(xiàn),一個(gè)定理的出現(xiàn)也一定會(huì)以“定理”的字樣出現(xiàn),這樣既突出了概念與定理,以便引起讀者的注意,也可以讓邏輯層次更清晰.以超幾何分布為例,雖然一般概率論教材并不單獨(dú)定義超幾何分布,但既然定義了這個(gè)概念,還是嚴(yán)格化一點(diǎn)比較好.可以由一個(gè)具體的例子切入,引入超幾何分布的定義.
定義1:假設(shè)集合含個(gè)元素,其中個(gè)元素具有性質(zhì),-個(gè)元素具有性質(zhì),從中任意抽取個(gè)元素,0≤≤,其中個(gè)元素具有性質(zhì),=0, 1, 2,…,,=min(,),則稱該隨機(jī)事件的概率分布為超幾何分布.
在此基礎(chǔ)上引導(dǎo)學(xué)生回答這樣幾個(gè)問題:在這個(gè)隨機(jī)試驗(yàn)中,樣本空間是什么?含多少樣本點(diǎn)?如何設(shè)置隨機(jī)變量?如何用隨機(jī)變量表示概率分布?
條件概率有兩種類型,一種是隨機(jī)試驗(yàn)可能是重復(fù)進(jìn)行的,也就是先有事件A,再有事件B,然后問在事件A發(fā)生的情況下,事件B發(fā)生的概率是多少?最典型的例子就是產(chǎn)品的抽檢,假設(shè)件產(chǎn)品中有件不合格(事件A),從這批產(chǎn)品中任意選取一件,發(fā)現(xiàn)是一件不合格產(chǎn)品,然后再抽取一件,第二次抽取的產(chǎn)品不合格(事件B)的概率是多少?這就是一個(gè)條件概率問題,也就是事件A發(fā)生的條件下事件B發(fā)生的概率.教材以兩次擲骰子為例顯得更簡單,更容易理解.還有一種條件概率問題與重復(fù)試驗(yàn)無關(guān),但與隨機(jī)事件的性質(zhì)有關(guān),例如隨機(jī)擲一枚骰子,出現(xiàn)的是奇數(shù)(事件A),計(jì)算出現(xiàn)的奇數(shù)大于1(事件B)的概率,這也是條件概率.在通過一些具體的例子給出條件概率的直觀描述后,應(yīng)該給條件概率一個(gè)嚴(yán)格的數(shù)學(xué)定義.
定義2:設(shè)A、B是隨機(jī)試驗(yàn)的兩個(gè)事件,且(B)>0,則稱(A|B)=(AB)/(B)為事件B已經(jīng)發(fā)生的條件下,事件A發(fā)生的條件概率.
在此基礎(chǔ)上可以再通過一些例子強(qiáng)化.
問題2:很多隨機(jī)試驗(yàn)相互之間可能是有關(guān)系的,而且隨機(jī)事件的發(fā)生有先后之分,能否舉例說明這種現(xiàn)象?
這個(gè)問題與抓鬮問題很容易混淆,學(xué)生比較容易犯迷糊,兩者之間的本質(zhì)是不同的.第一個(gè)抓鬮的人是不能看結(jié)果的,只有大家都抓到之后才能看,所以無論先抓還是后抓,抓到某個(gè)鬮的可能性都是一樣的.但如果先抓的人知道了結(jié)果,情況就不一樣了.如果學(xué)生能找到合適的例子,可以針對學(xué)生的例子進(jìn)行分析,如果學(xué)生找不到,可以參考下面的問題.
問題3:假設(shè)箱子里有10個(gè)白球,20個(gè)黑球,這些球除了顏色不同,質(zhì)地、大小、形狀完全一樣.兩個(gè)人分別從箱子里各摸一個(gè)球,但第一個(gè)人摸出來后不再放回,第一個(gè)人摸球的結(jié)果對第二個(gè)人有沒有影響?如何計(jì)算第二個(gè)人摸到白球的概率?
當(dāng)然對學(xué)生說清楚AB不能寫成A與B的交就可以了,除非樣本空間是清楚的,A與B也明確表示成了樣本空間的子集.
當(dāng)(A)>0時(shí),將條件概率的定義變換一下形式便得到
稱該式為概率的乘法公式.
問題4:(B|A)是否具有與概率類似的性質(zhì)?即非負(fù)性、規(guī)范性、可加性.
離散型隨機(jī)變量是針對隨機(jī)變量的取值來定義的,與樣本空間的大小無關(guān),例如假設(shè)樣本空間是單位圓,設(shè)Ω是半徑為(<1)的圓,記
()顯然是一個(gè)隨機(jī)變量,而且僅取兩個(gè)值,所以它是一個(gè)離散型隨機(jī)變量.
定義3:如果隨機(jī)變量的取值是一個(gè)數(shù)列,則稱該隨機(jī)變量為離散型隨機(jī)變量(discrete random variable).
問題5:100件產(chǎn)品中有10件次品,任意抽取4件,其中可能含多少件次品?如何用隨機(jī)變量表示這個(gè)隨機(jī)
試驗(yàn)?
隨機(jī)變量的重要意義是可以利用它表示隨機(jī)事件.
問題6:假設(shè)是問題5中的隨機(jī)變量,{<3}表示什么事件?如何用表示“抽出3件以上次品”這一隨機(jī)
事件?
有這樣一個(gè)問題:“燈泡的壽命是不是隨機(jī)變量?”的取值固然是清楚的,它是燈泡壞了的時(shí)間點(diǎn),那么基本事件是什么?學(xué)生或許會(huì)理解成:任取一個(gè)燈泡,該燈泡的壽命是多少?這個(gè)隨機(jī)試驗(yàn)的樣本空間實(shí)際是時(shí)間,也就是任取一個(gè)時(shí)刻,燈泡可能壞了也可能沒壞,所以燈泡的壽命理論上可以是任意的時(shí)間長度.
如果隨機(jī)試驗(yàn)是任取一個(gè)燈泡,檢驗(yàn)其壽命,樣本空間是什么?隨機(jī)變量是不是離散的?
由于燈泡的壽命不可能是無限的,每個(gè)燈泡有其特定的壽命,所以如果隨機(jī)試驗(yàn)是隨機(jī)取一個(gè)燈泡,檢驗(yàn)其壽命,按照隨機(jī)變量的定義,有限樣本空間上的隨機(jī)變量只能取有限個(gè)值,它當(dāng)然是離散的隨機(jī)變量.
根據(jù)以上分析,教師如果以燈泡壽命作為隨機(jī)變量的例子,最好解釋清楚樣本空間是什么.
一般情況下,廠家或管理部門判斷一個(gè)燈泡是否合格,往往是規(guī)定其使用壽命不能低于多少小時(shí),所以也可以根據(jù)使用時(shí)間是否達(dá)到要求定義隨機(jī)變量.例如,假若規(guī)定燈泡的使用壽命超過2?000小時(shí)為合格,低于2?000小時(shí)為不合格,則可以定義隨機(jī)變量如下:設(shè)樣本空間Ω為一批燈泡,燈泡對應(yīng)的值()為
這里僅取0和1兩個(gè)值,顯然是一個(gè)離散隨機(jī)變量.
連續(xù)型隨機(jī)變量在中學(xué)階段的確不適合深究,因?yàn)槠浣Y(jié)構(gòu)非常復(fù)雜,不妨稍微直觀一點(diǎn).如果課堂上介紹分布函數(shù)概念,則可以簡單地把連續(xù)型隨機(jī)變量定義為分布函數(shù)連續(xù)的隨機(jī)變量.如果課堂上不介紹分布函數(shù),則可以采用如下定義.
定義4:如果隨機(jī)變量的取值范圍是某一個(gè)區(qū)間,這樣的隨機(jī)變量稱為連續(xù)型隨機(jī)變量.
但要注意的是,這個(gè)定義與分布函數(shù)連續(xù)的隨機(jī)變量并不等價(jià).
既可以找到符合定義4,但分布函數(shù)間斷的隨機(jī)變量,也可以找到具有連續(xù)分布函數(shù)的隨機(jī)變量,其取值范圍并不充滿任何區(qū)間.
通過下面一系列問題可以逐步引導(dǎo)學(xué)生認(rèn)識離散型隨機(jī)變量的基本特征與性質(zhì).
問題7:回憶一下隨機(jī)變量的定義,能否用圖表表示離散隨機(jī)變量的概率分布?如何表示?
通過這兩個(gè)問題引導(dǎo)學(xué)生搞清楚兩個(gè)問題:(1)離散型隨機(jī)變量可以用圖表來表示其概率分布,從而可以一目了然地看出概率的變化規(guī)律;(2)隨機(jī)變量的函數(shù)不會(huì)改變其屬性,即離散型隨機(jī)變量的函數(shù)仍是離散的,連續(xù)型隨機(jī)變量的函數(shù)仍是連續(xù)的.
1,2,…,3,…,
ξx1x2…xi… Pp1p2…pi…
問題10:回憶任何隨機(jī)事件發(fā)生的概率都滿足:0≤(A)≤1,并且不可能事件的概率為0,必然事件的概率為1.請據(jù)此總結(jié)分布列具有什么性質(zhì).
(1)p≥0,=1, 2, …;
(2)1+2+…=1.
問題11:假設(shè)離散變量的分布列為
ξx1x2…xi… Pp1p2…pi…
學(xué)生對隨機(jī)事件的獨(dú)立性不會(huì)有太多理解上的困難,可以讓學(xué)生自己尋找一些例子,從而更好地辨別相互獨(dú)立的隨機(jī)事件,下列問題可以作為參考.
問題12:箱子里有3個(gè)白球,2個(gè)黑球,某人從箱子里隨機(jī)摸一個(gè)球后發(fā)現(xiàn)是白球,于是又放回去,然后再次從箱子里摸一個(gè)球,希望能摸出一個(gè)黑球來,他第二次摸到黑球的概率會(huì)不會(huì)受到第一次摸球的影響?
由于是有放回地抽樣,后一次抽樣的樣本空間與前一次的樣本空間是一樣的,所以前一次抽樣不會(huì)對后一次抽樣產(chǎn)生影響.
問題13:請舉出幾個(gè)相互對結(jié)果不會(huì)產(chǎn)生影響的隨機(jī)事件.
定義5:設(shè)A、B為兩個(gè)事件,如果(AB)=(A)(B),則稱事件A與事件B相互獨(dú)立(mutually independent).
事件A(或B)是否發(fā)生對事件B(或A)發(fā)生的概率沒有影響,這樣的兩個(gè)事件叫做相互獨(dú)立事件.
問題14:記Ac與Bc分別是A與B的對立事件,如果A與B是相互獨(dú)立事件,則A與Bc,Ac與B,Ac與Bc是否相互獨(dú)立?
問題15:如果事件A1,A2,…,A相互獨(dú)立,如何計(jì)算這個(gè)事件同時(shí)發(fā)生的概率?
問題16:如果反復(fù)拋擲一枚質(zhì)地均勻的硬幣10次,出現(xiàn)4次正面的概率是多少?出現(xiàn)5次正面的概率是多少?出現(xiàn)幾次正面的可能性最大?
這個(gè)問題是獨(dú)立重復(fù)試驗(yàn)的簡單模型,有了前面的獨(dú)立事件概念做基礎(chǔ),在教師引導(dǎo)下,學(xué)生應(yīng)該不難回答這個(gè)問題,它可以幫助學(xué)生復(fù)習(xí)組合數(shù)的性質(zhì).
定義6:一個(gè)隨機(jī)試驗(yàn)如果在同等條件下重復(fù)進(jìn)行次,則稱這個(gè)實(shí)驗(yàn)為次獨(dú)立重復(fù)試驗(yàn),也稱為貝努利試驗(yàn).
貝努利試驗(yàn)是概率論中非常重要的試驗(yàn),也有著十分重要的現(xiàn)實(shí)意義,但有了組合的基礎(chǔ)與獨(dú)立事件的概念,學(xué)生在理解上應(yīng)該沒有本質(zhì)的困難.課堂可以直接從組合的角度進(jìn)行分析,也就是按照教材的第二種分析法講授,遠(yuǎn)比第一種分析法簡單明了.
問題17:如果在一次隨機(jī)試驗(yàn)中某事件發(fā)生的概率為,那么在同等條件下進(jìn)行次重復(fù)試驗(yàn),這個(gè)事件恰好發(fā)生(≤)次的概率是多少?
這個(gè)問題與問題16的唯一差別在于,問題16中拋擲硬幣出現(xiàn)正反面的概率都是1/2,但一般的隨機(jī)試驗(yàn)出現(xiàn)某個(gè)結(jié)果和不出現(xiàn)某個(gè)結(jié)果的概率可能是不同的,然而處理這類問題的方法與問題16并無本質(zhì)區(qū)別,所以教師可以由學(xué)生歸納總結(jié)出一般規(guī)律.
于是得到隨機(jī)變量的概率分布如下.
ξ01…k…n P……
數(shù)學(xué)期望類似加權(quán)平均,學(xué)生對算術(shù)平均耳熟能詳,但對加權(quán)平均了解不多,現(xiàn)實(shí)中加權(quán)平均的例子并不鮮見.方差則是學(xué)生比較陌生的概念,可以從生活中常見的問題入手引導(dǎo)學(xué)生進(jìn)行思考.
問題18:當(dāng)我們考完試之后,教師通常需要進(jìn)行考試情況分析,幫老師想想看,需要做哪些分析?
最高分、最低分以及平均分是學(xué)生最容易想到的,但方差就不是學(xué)生能獨(dú)立思考出來的了,教師可能需要圍繞著問題18作進(jìn)一步提示,如何分析考試成績的分布狀況?通常最集中的分?jǐn)?shù)段是什么?這可以讓學(xué)生對后面要學(xué)習(xí)的正態(tài)分布有一個(gè)直觀體驗(yàn).
問題19:高考中,語文、數(shù)學(xué)、英語滿分各150分,物理滿分110分,化學(xué)滿分100分,生物滿分90分,總分750分.但150分的題量顯得有些大,因此決定將各門課程都統(tǒng)一成滿分100分,但仍然要體現(xiàn)各門課程所占比重的差別,如果總分仍然為750分,你能否為此設(shè)計(jì)一個(gè)方案?
通過這個(gè)問題可以讓學(xué)生對加權(quán)概念有初步了解.類似這樣加權(quán)計(jì)分的情況生活中很常見,例如在很多評價(jià)指標(biāo)中,各項(xiàng)指標(biāo)的分值是有差別的,這就反映了不同指標(biāo)的權(quán)重是不同的.
這個(gè)問題與問題19有相似之處,不同點(diǎn)是,問題19是一個(gè)確定性問題,問題20則是隨機(jī)性問題.有問題19做鋪墊,學(xué)生應(yīng)該可以想到該如何定義離散型隨機(jī)變量的“均值”.不過正式的定義最好不要稱之為均值,使用通用的術(shù)語“數(shù)學(xué)期望”更合適一點(diǎn).
…………
故次射擊的總環(huán)數(shù)大約為
因此,次射擊的“平均”環(huán)數(shù)約為
這個(gè)“平均數(shù)”與問題19中的加權(quán)平均很相似,通常稱之為數(shù)學(xué)期望.
定義7:若離散型隨機(jī)變量的概率分布為
ξx1x2…xn… Pp1p2…pn…
數(shù)學(xué)期望是隨機(jī)變量的一個(gè)重要特征數(shù),它反映了隨機(jī)變量取值的平均水平.如果的概率分布滿足
這是通常的算術(shù)平均,也是把的數(shù)學(xué)期望稱為平均數(shù)或均值的原因.對于連續(xù)型隨機(jī)變量則需要利用積分計(jì)算其數(shù)學(xué)期望.
問題21:甲乙兩家企業(yè)員工規(guī)模差不多,兩家員工(包括總經(jīng)理、中層管理人員及普通員工)年平均收入也差不多,但乙單位的普通員工總是埋怨收入不高,甲單位的員工則心態(tài)比較平和,沒人抱怨,你能分析一下兩家員工的心態(tài)為什么有差別嗎?
問題18雖然不屬于隨機(jī)問題,但與隨機(jī)現(xiàn)象有相似之處,乙單位員工之所以心態(tài)不平衡,是因?yàn)槭杖氲膬蓸O分化現(xiàn)象比較嚴(yán)重,極少數(shù)人的高收入把平均收入拉高了,普通員工的實(shí)際收入遠(yuǎn)低于平均水平,甲單位相對均衡一些,大多數(shù)人的收入集中在平均水平.如何建立數(shù)學(xué)模型反映兩個(gè)企業(yè)員工的收入差別?
經(jīng)過對這個(gè)問題的分析,后面引入方差概念就不難理解了.在問題21中,如果簡單地用每個(gè)員工的收入減去平均收入然后求和,未必能反映出兩個(gè)企業(yè)員工的真實(shí)差別來,因?yàn)閮蓚€(gè)企業(yè)員工的構(gòu)成可能有所差別.例如假設(shè)甲乙兩個(gè)企業(yè)各有員工人,平均收入均為,其中甲企業(yè)低收入員工有1人,收入為1,中等收入員工有2人,收入為2,高收入員工有3人,收入為3,1+2+3=.乙企業(yè)低收入員工有1人,收入為1,中等收入員工有2人,收入為2,高收入員工有3人,收入為3,1+2+3=.比較兩個(gè)企業(yè)員工收入差別的合理指標(biāo)應(yīng)該是:
問題22:如果離散隨機(jī)變量的分布列為
ξx1x2…xn… Pp1p2…pn…
離散隨機(jī)變量的分布列為
ηy1y2…yn… Pq1q2…qn…
如何分析這兩個(gè)隨機(jī)變量之間的差別?
有問題21作基礎(chǔ),學(xué)生應(yīng)該不難理解,僅僅比較兩個(gè)隨機(jī)變量的數(shù)學(xué)期望是不夠的,還需要比較這兩個(gè)隨機(jī)變量的取值偏離數(shù)學(xué)期望的程度.
定義8:假設(shè)隨機(jī)變量的分布列為
ξx1x2…xn… Pp1p2…pn…
問題23:隨機(jī)變量的方差與標(biāo)準(zhǔn)差反映了隨機(jī)變量的何種特征?
問題24:既然有了方差,為什么又定義標(biāo)準(zhǔn)差?
標(biāo)準(zhǔn)差與隨機(jī)變量本身有著相同的量綱,在描述隨機(jī)變量偏離數(shù)學(xué)期望的范圍時(shí)標(biāo)準(zhǔn)差比方差更方便.例如,甲企業(yè)的平均年收入是200?000,標(biāo)準(zhǔn)差是20?000,那么方差就是20?0002.可以進(jìn)行的比較簡便的描述是該企業(yè)員工收入分布是200?000±20?000,使用方差就無法做到了.
應(yīng)該注意的是,數(shù)學(xué)期望未必對任何概率分布都存在,無論是無窮的分布列還是連續(xù)型分布,數(shù)學(xué)期望都可能不存在.例如,可以取分段函數(shù)如下:
這說明該概率分布的數(shù)學(xué)期望是無窮大.
離散隨機(jī)變量的分布列也可能沒有數(shù)學(xué)期望,例如,令x=2,p=1/2,=1, 2, 3,…,,…,則如下的分布列
Xx1x2x3…xn… Pp1p2p3…pn…
沒有數(shù)學(xué)期望,或者說數(shù)學(xué)期望為∞.
大學(xué)教材通常是采用公式化的方法定義正態(tài)分布密度函數(shù),然后反推以這個(gè)函數(shù)為分布密度的隨機(jī)變量,其數(shù)學(xué)期望與方差剛好是該函數(shù)中的兩個(gè)參數(shù),接著通過參數(shù)的變化解釋其數(shù)學(xué)期望及方差與圖形的形狀之間的關(guān)系,這個(gè)方法對于中學(xué)生顯然有些困難(參見文[1]和文[2]).但中學(xué)通過頻率直方圖不斷加細(xì)(數(shù)據(jù)量越來越大)來說明正態(tài)密度函數(shù)需要經(jīng)過3個(gè)質(zhì)的飛躍:從直方圖經(jīng)過極限過程得到概率密度曲線,再從概率密度曲線過渡到具有兩個(gè)參數(shù)的正態(tài)分布密度函數(shù),最后根據(jù)正態(tài)分布密度函數(shù)指出數(shù)學(xué)期望和方差恰好是函數(shù)的兩個(gè)參數(shù).很難想象,初學(xué)微積分的中學(xué)生如何在短短一節(jié)課的時(shí)間內(nèi)完成這3個(gè)飛躍.因?yàn)榇饲皩W(xué)生對連續(xù)型分布一無所知,什么叫概率密度曲線?它跟概率是什么關(guān)系?是哪個(gè)隨機(jī)變量的概率密度?數(shù)據(jù)越來越多,意味著樣本空間在發(fā)生變化,換言之,隨機(jī)變量在發(fā)生變化,那么經(jīng)歷了極限過程后,這些隨機(jī)變量變成了什么?恐怕沒有哪個(gè)教師能回答這些問題.
教材的確針對不同的參數(shù)分析了正態(tài)密度曲線將呈現(xiàn)何種變化,問題是,其中的參數(shù)是什么?哪里來的?教材并未作出解釋,教師在課堂上能作出解釋嗎?
這里做一個(gè)大膽嘗試,結(jié)合現(xiàn)實(shí)中常見的問題以及教材中的例子,從圖象的特征出發(fā)尋找可以模擬這類圖象的函數(shù).以函數(shù)模擬曲線作為出發(fā)點(diǎn)給予闡述是學(xué)生容易接受的一種方式,進(jìn)一步通過函數(shù)的參數(shù)與函數(shù)圖象形狀的關(guān)系解釋清楚隨機(jī)變量的數(shù)學(xué)期望及方差與正態(tài)分布密度函數(shù)中參數(shù)的關(guān)系.
無論是連續(xù)型正態(tài)分布還是離散型頻率直方圖,教學(xué)的重點(diǎn)在于讓學(xué)生理解這兩類圖形的高低、寬窄及位置的變化與數(shù)學(xué)期望、方差之間的關(guān)系.是連續(xù)曲線還是分塊矩形本身并不重要,它們不過是外表,關(guān)鍵是要搞清楚內(nèi)在的本質(zhì)關(guān)系.
問題25:觀察下面的圖片,它們有什么共同點(diǎn)?有什么不同點(diǎn)?
問題26:上述兩幅圖的剖面圖是什么形狀?
可以通過板書或PPT形式畫出大概的剖面圖,此處不必急于講正態(tài)分布概念,不妨對這類圖形用數(shù)學(xué)方法進(jìn)行模擬,得到一般圖象的數(shù)學(xué)表達(dá),再過渡到正態(tài)分布概念.
在研究了上述問題之后,有條件的話不妨介紹高爾頓實(shí)驗(yàn)板,還可通過Matlab等數(shù)學(xué)軟件進(jìn)行演示,效果可能會(huì)好得多.
問題27:如果用頻率直方圖將班級某門課程的考試成績表示出來,這個(gè)直方圖大概是什么形狀?
不妨以幾次真實(shí)的班級考試成績作為例子畫出直方圖,正常情況下,成績的分布是呈正態(tài)分布的,教師可以事先拿幾份統(tǒng)計(jì)數(shù)據(jù)試做一下.
某版教材通過一組身高數(shù)據(jù)得到一個(gè)直方圖也是可以的,教師課堂上直接使用這個(gè)例子也未嘗不可,不管這個(gè)例子是不是杜撰的,無傷大雅,至少還是有一定現(xiàn)實(shí)意義的.
從某中學(xué)的男生中隨機(jī)地選出84名,測量其身高,數(shù)據(jù)(單位:cm)如下:
上述數(shù)據(jù)的分布有怎樣的特點(diǎn)?
為了研究身高的分布,可以先根據(jù)這些數(shù)據(jù)作出頻率分布直方圖.
第一步 對數(shù)據(jù)分組(取組距=4);
第二步 列出頻數(shù)(或頻率)分布表,如圖所示;
第三步 作出頻率分布直方圖,如圖所示.
然而,中學(xué)講授微積分并不介紹極限概念,在沒有正式講授微積分之前,從頻率直方圖過渡到連續(xù)的分布密度曲線,對學(xué)生而言有本質(zhì)的困難.事實(shí)上,無論你的樣本空間有多大,統(tǒng)計(jì)出來的總是一個(gè)頻率直方圖,所謂數(shù)據(jù)無限增多只能憑想象,在建立極限概念之前,學(xué)生是無法真正理解這個(gè)過程的.而且,某版教材簡單一句話便從頻率直方圖過渡到概率密度曲線,緊接著便寫出了正態(tài)密度曲線的函數(shù)表達(dá)式,并針對密度函數(shù)的兩個(gè)參數(shù)對函數(shù)性質(zhì)進(jìn)行了大量分析.最后指出,兩個(gè)參數(shù)分別是隨機(jī)變量的數(shù)學(xué)期望與均方差.恐怕再高明的教師也沒有能力在課堂上給學(xué)生來一個(gè)三級跳:從頻率直方圖跳到概率密度曲線,從概率密度曲線跳到正態(tài)分布密度函數(shù),再從正態(tài)分布密度函數(shù)跳到參數(shù)的內(nèi)涵描述.
中學(xué)階段的正態(tài)分布教學(xué)應(yīng)適可而止,或者只介紹頻率直方圖,最多做一番直觀解釋.當(dāng)數(shù)據(jù)越來越大時(shí),頻率直方圖中每一個(gè)小矩形條會(huì)越來越窄,其形狀很像一個(gè)倒掛的金鐘.待到大學(xué)階段,系統(tǒng)學(xué)習(xí)了微積分之后再來學(xué)習(xí)連續(xù)型的正態(tài)分布為時(shí)不晚.或者引入問題1,從純函數(shù)的角度模擬這個(gè)形狀,得到正態(tài)分布密度曲線.
問題28:比較問題26與問題27所得到的兩個(gè)圖,雖然兩者細(xì)節(jié)上的差別很大,但形狀有什么特點(diǎn)?能不能用數(shù)學(xué)模型把問題26中的圖形模擬出來?
可以引導(dǎo)學(xué)生進(jìn)行分析,曾經(jīng)學(xué)過的哪些函數(shù)其形狀與這個(gè)圖形有相似之處?如何對熟悉的函數(shù)做適當(dāng)改進(jìn)使其圖象與這個(gè)圖形接近?下圖中的指數(shù)為什么是2而不是?
()
通過對問題26與問題27的比較,引導(dǎo)學(xué)生分析兩者之間的共同特點(diǎn),雖然前者是曲面的剖面,它是連續(xù)的曲線,后者是一些矩形圖構(gòu)成的,但其形狀頗為相似,當(dāng)數(shù)據(jù)非常龐大時(shí),矩形的寬會(huì)變得很窄,通過下面兩幅圖片可以說明這個(gè)過程.
問題29:問題28圖()與圖()及圖()的形狀雖然相似,但由于坐標(biāo)系的建立有所不同,其函數(shù)的形式也有所不同.能不能通過對圖()中的函數(shù)做適當(dāng)修改得到類似圖()或圖()的函數(shù)關(guān)系?
(1)那個(gè)函數(shù)指數(shù)前面的系數(shù)是怎么回事?
(2)圖象的形狀也許相似,但寬窄很可能有差別,這種差別如何通過函數(shù)反映出來?
系數(shù)不是關(guān)鍵,因?yàn)檫@里的()表示的并非概率分布,而是概率的密度,類似離散情況下的分布列中隨機(jī)變量取某個(gè)值時(shí)的概率.所以這個(gè)系數(shù)是根據(jù)對概率的計(jì)算得到的,假定學(xué)生已經(jīng)學(xué)過微積分,那么密度函數(shù)滿足
問題并沒有完全得到解決,因?yàn)槭窃诩俣〝?shù)學(xué)期望與方差已知的情況下得到的分布密度函數(shù),如果問題反過來呢?
問題30:如果隨機(jī)變量的分布密度為
問題31:如果已知隨機(jī)變量的密度函數(shù),如何求其概率分布函數(shù)?
只要是了解一點(diǎn)積分理論的學(xué)生不難回答這個(gè)問題,但有些學(xué)校也許在微積分之前講授概率論.如何解決這個(gè)矛盾?可以利用直方圖來解釋這個(gè)問題,頻率直方圖中每個(gè)小的矩形代表離散型隨機(jī)變量取某個(gè)值的概率,如何求隨機(jī)變量小于某個(gè)值的概率?顯然
換言之,將所有取值小于的概率相加就得到(<)了.離散型隨機(jī)變量的分布列相當(dāng)于連續(xù)型隨機(jī)變量的密度函數(shù),對于連續(xù)型隨機(jī)變量來說,其分布函數(shù)為
如果時(shí)間允許,在上述分析的基礎(chǔ)上,不妨針對不同的參數(shù)繪制幾個(gè)正態(tài)密度函數(shù)的圖象.
[1] 蘇淳.概率論[M].北京:科學(xué)出版社,2010:43-106.
[2] 盛驟,謝式千.概率論與數(shù)理統(tǒng)計(jì)及其應(yīng)用[M].北京:高等教育出版社,2004:25-68.
Teaching Strategy of Part Probability Content in Middle School Mathematics
CAO Guang-fu, LUO Li-ling
(Faculty of Mathematics and Information Science, Guangzhou University, Guangdong Guangzhou 510006, China)
In this paper, several important concepts in probability, such as hypergeometric distribution, conditional probability, discrete random variables and distribution column, independent random events and binomial distribution, mathematical expectation and variance, and normal distribution, were created to guide classroom teaching in real problem situations, which provided practical teaching scheme for teachers. In particular, the normal distribution density function was not the same as the formulaic definition in college textbooks and the limit definition of frequency histogram in middle school textbooks. According to the authors, the definition of formulaic was abstract for middle school students, but using the limit of frequency histogram to define normal density function was beyond the knowledge point and cognitive ability of middle school students, and the practical teaching was not operable. This paper starts from the function simulation of the real image, through the similarity between the real graph and the frequency histogram to find out the function to simulate such graph. Then discuss the relation between the parameters and the image, finally, return to the probability, discuss the relation between the parameters and the mathematical expectation and the variance.
hypergeometric distribution; conditional probability; discrete random variable; distribution column; mathematical expectation; variance; normal distribution
2018–06–20
國家“萬人計(jì)劃”領(lǐng)軍人才、廣東省“特支計(jì)劃”、廣州市教育名家工作室聯(lián)合資助
曹廣福(1960—),男,江蘇海安人,教授,博士生導(dǎo)師,首屆國家高等學(xué)校教學(xué)名師獎(jiǎng)獲得者,入選國家“萬人計(jì)劃”領(lǐng)軍人才,主要從事數(shù)學(xué)研究與數(shù)學(xué)教育研究.
G420
A
1004–9894(2018)05–0017–08
曹廣福,羅荔齡.中學(xué)數(shù)學(xué)部分概率內(nèi)容的教學(xué)策略[J].?dāng)?shù)學(xué)教育學(xué)報(bào),2018,27(5):17-24.
[責(zé)任編校:周學(xué)智、陳漢君]
數(shù)學(xué)教育學(xué)報(bào)2018年5期