何建營 周瑞芳
摘要:概率論與數(shù)理統(tǒng)計(jì)是理工科類專業(yè)必修科目之一。概率的定義是系統(tǒng)化知識(shí)體系——概率統(tǒng)計(jì)的基石,學(xué)習(xí)者對(duì)此概念的理解程度,決定了他以后在應(yīng)用時(shí)的高度。同時(shí),也會(huì)對(duì)數(shù)學(xué)其他概念理解和深入學(xué)習(xí)產(chǎn)生促進(jìn)作用。本篇主要討論概率論中關(guān)于“概率”概念統(tǒng)計(jì)定義的教學(xué)。通過實(shí)例與數(shù)學(xué)軟件模擬結(jié)合,畫圖對(duì)比演示概率的統(tǒng)計(jì)學(xué)概念的本質(zhì)含義,深入淺出地剖析概念中的問題、難點(diǎn)及解決辦法。
關(guān)鍵詞:概率論,統(tǒng)計(jì)學(xué)定義,極限,依概率收斂
引言
《概率論與數(shù)理統(tǒng)計(jì)》是大學(xué)理工類專業(yè)必修基礎(chǔ)課之一,在后期的專業(yè)學(xué)習(xí)、研究生課程學(xué)習(xí)及專業(yè)領(lǐng)域等研究中,有著廣泛的應(yīng)用,它的理論與方法在諸如物理、化學(xué)、工程、生物、管理等眾多傳統(tǒng)學(xué)科中發(fā)揮著重要作用,同時(shí)又在一些新興學(xué)科有著重要作用,如信息論、控制論、可靠性理論、人工智能、大數(shù)據(jù)、物聯(lián)網(wǎng)等。概率論與數(shù)理統(tǒng)計(jì)是目前最為活躍的數(shù)學(xué)學(xué)科之一,在理論與實(shí)踐教學(xué)中,也有著更豐富的素材和背景,是學(xué)生們較為感興趣的一門數(shù)學(xué)課程。
現(xiàn)狀:
概率論與數(shù)理統(tǒng)計(jì)畢竟是一門嚴(yán)謹(jǐn)?shù)膶W(xué)科,有著數(shù)學(xué)學(xué)科的抽象性與嚴(yán)謹(jǐn)性,但同時(shí),也有著自身的特點(diǎn)。概率論最大的特點(diǎn)就是研究對(duì)象的不確定性,是對(duì)事件發(fā)生的可能性的討論,從某種意義上說,是一對(duì)多的關(guān)系的研究,這一點(diǎn)上,與高中學(xué)習(xí)的函數(shù)這一概念有所區(qū)別,是數(shù)學(xué)中與映射關(guān)系對(duì)應(yīng)的另一種數(shù)學(xué)關(guān)系。雖然高中學(xué)生們已經(jīng)接觸過概率統(tǒng)計(jì)相關(guān)知識(shí),鑒于高等數(shù)學(xué)的研究手段,大學(xué)階段,需要同學(xué)們先行修讀高等數(shù)學(xué)或數(shù)學(xué)分析的相關(guān)基礎(chǔ)課程,滿足學(xué)習(xí)的必備知識(shí)。
不過在學(xué)習(xí)了高等數(shù)學(xué)課程以后,同學(xué)們?cè)谶M(jìn)行概率課學(xué)習(xí)的過程中,對(duì)有些概念的理解容易混淆,或者是理解的似是而非。在概率統(tǒng)計(jì)這門課中,包含了很多同時(shí)也很抽象的知識(shí)點(diǎn)和定理。例如概率的公理化定義,依概率收斂,測度,中心極限定理,假設(shè)檢驗(yàn)等等,這些概念以及定理在概率論學(xué)習(xí)中不容易理解,更加不容易理解精確和深刻。有些定義如隨機(jī)變量,多維隨機(jī)變量,隨機(jī)變量的分布和條件分布,數(shù)字特征,中心矩,原點(diǎn)矩等等,學(xué)生雖然能夠記住,但是掌握得并不好,在后期的應(yīng)用上更加滿足不了所需所學(xué)。以至于在有些研究的后期階段用到概率有關(guān)知識(shí)時(shí),經(jīng)常鬧出笑話或者犯嚴(yán)重的概念錯(cuò)誤。
大學(xué)數(shù)學(xué)課程培養(yǎng)學(xué)生的目標(biāo)就有培養(yǎng)學(xué)生抽象思維能力,能夠舉一反三,真正學(xué)以致用。高等數(shù)學(xué)培養(yǎng)了學(xué)生從有些到無限的思維模式,培養(yǎng)了劃分、近似替代、求和、無限逼近極限的思維;那么概率論與數(shù)理統(tǒng)計(jì)培養(yǎng)的就是學(xué)生從確定性到隨機(jī)性不確定性轉(zhuǎn)變的思想。但是這種思維轉(zhuǎn)變需要由形象具體到抽象有一個(gè)過程轉(zhuǎn)變,需要對(duì)學(xué)生加以引導(dǎo)。
下面就概率統(tǒng)計(jì)教學(xué)中的案例給出探討,從而達(dá)到學(xué)生學(xué)習(xí)該定義理解的深入:
修讀或者講授過高等數(shù)學(xué)的人都十分清楚極限的定義,一種是對(duì)極限的描述性定義,
從上圖中,容易發(fā)現(xiàn),在從某有限項(xiàng)開始以后,數(shù)列的值開始趨于穩(wěn)定,也就是說,擺動(dòng)地或者超出某個(gè)范圍的可能為零,換句話說,都落在了某個(gè)穩(wěn)定值的附近。
對(duì)于概率的統(tǒng)計(jì)定義,很多同學(xué)就會(huì)想當(dāng)然認(rèn)為,概率不就是頻率的極限嗎?當(dāng),認(rèn)為頻率。我們細(xì)想,真的是這樣的嗎?這其中是有著本質(zhì)區(qū)別的。區(qū)別就是,頻率并非收嚴(yán)格收斂與,而是依概率收斂與。這里邊其實(shí)是有著區(qū)別的,但是在介紹依概率收斂的定義之前,同學(xué)們首先學(xué)習(xí)的是概率的統(tǒng)計(jì)定義,接著是公理化定義。于是乎,就想當(dāng)然地認(rèn)為,頻率的極限就是概率了。誠然,大數(shù)定律告訴我們這樣一個(gè)事實(shí):隨著實(shí)驗(yàn)次數(shù)的增加,頻率會(huì)越來越穩(wěn)定接近于某個(gè)常數(shù)。這一陳述沒有問題,問題出在了“越來越”三個(gè)字上,這一模糊的描述其實(shí)就蘊(yùn)含了依概率收斂的意思,我們一拋硬幣實(shí)驗(yàn)為例:顯然這是一個(gè)n重貝努力實(shí)驗(yàn)類型,服從二項(xiàng)分布,隨著實(shí)驗(yàn)次數(shù)的增加,最終我們發(fā)現(xiàn),出現(xiàn)正面向上的頻率多數(shù)是接近1/2的,但我們就能說極限是1/2嗎?錯(cuò)!顯然,我們實(shí)驗(yàn)的次數(shù)對(duì)于極限無窮來說,還差很遠(yuǎn),事實(shí)上,完全有這種可能,實(shí)驗(yàn)了很多次,恰好都是出現(xiàn)反面向上,或者只僅僅出現(xiàn)了1次,2次…這種可能雖然很低,但我們不能就此說沒有可能,只能說可能性幾乎為0,(彩票特等獎(jiǎng)中獎(jiǎng)率不就如此嗎)所以說,這里得從統(tǒng)計(jì)學(xué)出發(fā)的概率定義,并沒有用極限,實(shí)際上,是一種依概率收斂的定義。我們通過計(jì)算機(jī)多次模擬作圖證明,概率的定義與極限定義的不同之處:
從中可以發(fā)現(xiàn),概率的收斂是有別于數(shù)列收斂的。所有說,概率并不能簡單的以頻率極限來定義。
當(dāng)然,我們也能從中找到解釋這一現(xiàn)象的原因:理論上講,對(duì)應(yīng)拋硬幣實(shí)驗(yàn),隨著實(shí)驗(yàn)次數(shù)的增多,應(yīng)該說出現(xiàn)正面向上的次數(shù)與總的次數(shù)之比,即頻率,應(yīng)該接近0.5,關(guān)于這一點(diǎn),大數(shù)定律可以保證。但是這是接近,只是說在多次重復(fù)過程中的統(tǒng)計(jì)結(jié)果的平均值,而不是多有的值。我們?cè)囅胍幌?,完全存在不管做了多少次重?fù)實(shí)驗(yàn),一直都是“正面”超上的結(jié)果,雖然說這種可能微乎其微,但不能據(jù)此否定這種可能性,或者出現(xiàn)1次,2次,3次……總之比較少的有限次數(shù),只要不是接近一半的次數(shù),這些都是有可能的,這跟買彩票中一等獎(jiǎng)的情況很相似,可能性都很小,幾乎為零,但卻是存在的。以生活中的問題為例,例如小明同學(xué)想購買一種彩票,假如說中“頭獎(jiǎng)”的可能性為10-10,雖然很低,幾乎可以認(rèn)為是零。但是,我們不能就此說他一定不會(huì)中“頭獎(jiǎng)”。因?yàn)橛锌赡茉谒I第一次時(shí),就可能中獎(jiǎng)。這種可能性的度量方式,其實(shí)就是基于概率的統(tǒng)計(jì)學(xué)定義給出的。
那么問題出來了,既然概率不是頻率的極限,該如何定義概率呢?很多教材這樣給出了概率的文字描述定義,說隨著實(shí)驗(yàn)次數(shù)的增加,頻率會(huì)越來越穩(wěn)定與某一穩(wěn)定的數(shù),這一數(shù)值,即為對(duì)應(yīng)的事情發(fā)生的概率(嚴(yán)格講是統(tǒng)計(jì)學(xué)意義下的概率)。這一描述,很相似于高數(shù)中數(shù)列極限的描述性定義,但有區(qū)別,我們仔細(xì)對(duì)比一下:高等數(shù)學(xué)數(shù)列極限定義會(huì)講,從某項(xiàng)開始以后,“所有的”數(shù)列的項(xiàng)會(huì)越來越接近某一數(shù)。而概率論呢,卻從不會(huì)說從某項(xiàng)以后開始,而是說越來越接近。也就是說不是所有的,那么顯然就有可能有溢出來的一部分情況了,只是說這種可能性較小罷了。
定義?在相同的條件下,進(jìn)行了n 次試驗(yàn), 在這 n 次試驗(yàn)中,事件 A 發(fā)生的次數(shù) 稱為事件 A 發(fā)生的頻數(shù)。?比值 稱為事件A 發(fā)生的頻率,并記成 。
顯然,頻率具有以下性質(zhì):
概率的統(tǒng)計(jì)定義:在相同條件下重復(fù)進(jìn)行n次試驗(yàn),當(dāng)試驗(yàn)次數(shù)n充分大時(shí),事件發(fā)生的頻率穩(wěn)于某個(gè)常數(shù)附近,我們稱為事件發(fā)生的概率。
顯然,由頻率得到概率統(tǒng)計(jì)定義是有缺陷的,統(tǒng)計(jì)學(xué)概率取值依賴于具體實(shí)驗(yàn),我們不可能對(duì)每個(gè)事件都做大量的試驗(yàn),從而得到頻率的穩(wěn)定值。用這種定義很難計(jì)算事件的概率。
由于理論研究的需要,受頻率性質(zhì)的啟發(fā),于是1933年蘇聯(lián)數(shù)學(xué)家Kolmogrov提出了概率的公理化結(jié) 構(gòu),給出了概率的嚴(yán)格定義
概率的公理化定義:設(shè)E為隨機(jī)試驗(yàn),為其樣本空間,對(duì)于E的任一個(gè)?事件,都有一實(shí)數(shù)與之對(duì)應(yīng),稱為事件A的概率,如果集函數(shù)滿足:(1)非負(fù)性:對(duì)任意事件A,P(A)≥0;(2)規(guī)范性:P(Ω)=1;(3)可列可加性:設(shè)A1?,A2 , ……是兩個(gè)互不相容的事件,則有:
顯然這一概念更加抽象和科學(xué)嚴(yán)謹(jǐn)。借助于實(shí)驗(yàn)次數(shù)的局限,在有限次的樣本空間下,規(guī)定了等可能性的古典概型的頻率統(tǒng)計(jì),也就基本等同于我們平時(shí)說的統(tǒng)計(jì)學(xué)概率了。即
下面就此我們給出一個(gè)例子:
例:某接待站在某一周曾接待過 12次來訪,已知所有這 12次接待都是在周一和周三進(jìn)行的。問是否可以推斷接待時(shí)間是有規(guī)定的?
假設(shè)接待站的接待時(shí)間沒有規(guī)定,個(gè)來訪者在一周的任一天中去接待是等可能的,那么一周內(nèi)接待12次的來訪共有712種。而12次接待來訪者都在周一,周三的概率為:=212/712=0.0000003
人們?cè)陂L期的實(shí)踐中總結(jié)得到“概率很小的事件在一次實(shí)驗(yàn)中幾乎是不發(fā)生的”(稱之為實(shí)際推斷原理)?,F(xiàn)在概率很小的事件在一次實(shí)驗(yàn)中竟然發(fā)生了,從而推斷接待站不是每天都接待來訪者,即認(rèn)為其接待時(shí)間是有規(guī)定的。
總結(jié):概率論與數(shù)理統(tǒng)計(jì)的許多概念比較抽象。由于研究的隨機(jī)現(xiàn)象具有不確定,與學(xué)生之前學(xué)習(xí)的研究確定性現(xiàn)象的學(xué)科如幾何、代數(shù)、微積分等有極大的不同,在教、學(xué)過程中給學(xué)習(xí)者和講授者都帶來很大難度。應(yīng)該本著仔細(xì)斟酌和聯(lián)系實(shí)踐的科學(xué)精神,認(rèn)真領(lǐng)會(huì)該學(xué)科的奧妙,不足之處敬請(qǐng)指正。
中原工學(xué)院 理學(xué)院?何建營?周瑞芳