魏滿滿 李石虎 周勤
【摘要】本文主要探究了假設(shè)檢驗(yàn)的基本思想和有關(guān)概念的教學(xué)設(shè)計(jì).首先,通過“女士品茶”的故事引入,提煉出假設(shè)檢驗(yàn)的基本思想;其次,通過分析項(xiàng)鏈含金量這一實(shí)際案例總結(jié)出假設(shè)檢驗(yàn)的基本步驟,并介紹了假設(shè)檢驗(yàn)的兩類錯(cuò)誤和p值的概念;最后,融入思政的元素,豐富了課堂教學(xué)內(nèi)容.
【關(guān)鍵詞】假設(shè)檢驗(yàn);教學(xué)設(shè)計(jì)
【基金項(xiàng)目】 江蘇師范大學(xué)課程思政專項(xiàng)研究(KCSZY17);江蘇師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院思政示范課程(XYKCSZ01)
一、引 言
概率論與數(shù)理統(tǒng)計(jì)課程是各個(gè)高校理工科的基礎(chǔ)必修課,它在理工科及經(jīng)管類各專業(yè)被廣泛應(yīng)用.假設(shè)檢驗(yàn)是概率論與數(shù)理統(tǒng)計(jì)中的重要知識(shí)點(diǎn),是統(tǒng)計(jì)推斷的主要方法之一,在概率統(tǒng)計(jì)的理論研究與實(shí)際應(yīng)用中都占有極其重要的地位.2019年3月18日,在學(xué)校思想政治理論課教師座談會(huì)上,習(xí)近平總書記明確提出[1]:要堅(jiān)持灌輸性和啟發(fā)性相統(tǒng)一,注重啟發(fā)性教育,引導(dǎo)學(xué)生發(fā)現(xiàn)問題、分析問題、思考問題,在不斷啟發(fā)中讓學(xué)生水到渠成得出結(jié)論.近年來,各大高校都十分重視思政建設(shè),通過教師培訓(xùn)、專家講座、示范課程等多種方式來加深教師對(duì)課程思政的理解.教師是高校的“第一主角”,作為專業(yè)課教師,也有責(zé)任和義務(wù)認(rèn)真挖掘所授課程的“思政元素”.例如,2021年,李晨和陳麗萍[2]在研究概率統(tǒng)計(jì)的思政元素時(shí),以概率學(xué)者的文化素養(yǎng)和科學(xué)治學(xué)精神為切入點(diǎn),通過多個(gè)實(shí)際案例剖析全概率公式的應(yīng)用,潛移默化地引入諸多思政元素來激發(fā)學(xué)生的學(xué)習(xí)興趣.受此啟發(fā),本文著重從概率論與數(shù)理統(tǒng)計(jì)課程中 “假設(shè)檢驗(yàn)”這一角度思考,通過教學(xué)設(shè)計(jì)來探索課程思政理念進(jìn)概率統(tǒng)計(jì)課堂的實(shí)踐方法,目的就是同大家交流如何上好“假設(shè)檢驗(yàn)”這一知識(shí)點(diǎn)的教學(xué)課.
首先,我們通過“女士品茶”這一廣為流傳且富有趣味性的故事引入,啟發(fā)學(xué)生思考,從中提煉出假設(shè)檢驗(yàn)的基本思想.其次,我們通過分析項(xiàng)鏈含金量這一實(shí)際案例總結(jié)出假設(shè)檢驗(yàn)的基本步驟.接著,我們介紹假設(shè)檢驗(yàn)的兩類錯(cuò)誤和p值的概念,并介紹假設(shè)檢驗(yàn)的一些應(yīng)用.最后,我們?nèi)谌胨颊脑?,以我?guó)著名數(shù)學(xué)家嚴(yán)加安院士的《悟道詩》為結(jié)尾,闡述了概率統(tǒng)計(jì)的基本思想,同時(shí)激勵(lì)學(xué)生向老一輩科學(xué)家學(xué)習(xí),樹立正確的價(jià)值觀,從而豐富了課堂教學(xué)內(nèi)容.
二、教學(xué)過程
(一)問題引入
首先,我們從一個(gè)經(jīng)典故事出發(fā),來體會(huì)假設(shè)檢驗(yàn)的基本思想.
例1[3] ?(女士品茶試驗(yàn))故事發(fā)生在英國(guó)劍橋大學(xué),那是20世紀(jì)20年代,一群大學(xué)精英們正在品茶.該茶是由牛奶和茶水混合而成的.在品茶過程中,一位女士宣稱:先加入牛奶還是先加入茶,不同的順序會(huì)使茶的口感不同.周圍人都認(rèn)為這位女士簡(jiǎn)直是在胡言亂語,這是不可能的?。∪欢趫?chǎng)的統(tǒng)計(jì)學(xué)家Fisher卻對(duì)這個(gè)話題很感興趣,他請(qǐng)人端來10杯調(diào)制好的茶讓該女士品嘗,其中有的是先加的牛奶,有的是先加的茶.結(jié)果,這位女士正確地鑒別出每一杯茶的制作順序.該如何判斷該女士是否有鑒別能力呢?
Fisher的想法:假設(shè)該女士沒有鑒別能力,這個(gè)時(shí)候她只能靠猜,從而她猜對(duì)的概率為1[]2.因此,她能同時(shí)判斷出10杯茶的概率為2-10<0.001,這個(gè)概率非常非常小,僅僅做一次試驗(yàn)是幾乎不會(huì)發(fā)生的,可是,它卻發(fā)生了!這表明原假設(shè)不恰當(dāng),應(yīng)予以拒絕,認(rèn)為該女士有鑒別能力!
假設(shè)檢驗(yàn)的基本思想:小概率反證法思想.先提出假設(shè),然后設(shè)計(jì)試驗(yàn),在原假設(shè)成立的條件下計(jì)算概率,依據(jù)小概率原理來判斷是否拒絕原假設(shè).那么多大的概率屬于小概率呢?對(duì)于不同的問題,會(huì)有不同的標(biāo)準(zhǔn),在統(tǒng)計(jì)學(xué)中,這個(gè)小概率稱為顯著性水平,常取0.05或0.01.
接下來,我們就通過生活中的一個(gè)實(shí)際案例來探索一下假設(shè)檢驗(yàn)的奧秘.
(二)實(shí)例分析
在生活中,經(jīng)常會(huì)遇到一組數(shù)據(jù),我們來看下面的例子.
例2[4] 質(zhì)檢部門接到投訴后,對(duì)某金店進(jìn)行調(diào)查,從標(biāo)有18K的一批項(xiàng)鏈中抽取20條,測(cè)得其含金量如下:
問:如何判斷這批項(xiàng)鏈有沒有達(dá)到標(biāo)準(zhǔn)呢?(顯著性水平α=0.05)
分析:觀察表1中的數(shù)據(jù),我們可以發(fā)現(xiàn):有的含金量大于18K,有的含金量小于18K,還有的恰好等于18K.那么我們能否直接說和標(biāo)準(zhǔn)值18K有顯著差別呢?根據(jù)所學(xué)的統(tǒng)計(jì)學(xué)思想方法,我們已經(jīng)了解到答案是否定的,因?yàn)檫@里看到的只是樣本數(shù)據(jù),我們無法直接做出判斷.那么應(yīng)該如何判斷呢?
我們的思路如下:
首先,計(jì)算出這20條項(xiàng)鏈含金量的平均值為17.8,它與標(biāo)準(zhǔn)值18存在0.2的差值.這0.2的差值是由抽樣引起的誤差,還是有本質(zhì)的差別?我們利用上述思想來檢驗(yàn)一下.
令ξ表示這批項(xiàng)鏈的含金量,由中心極限定理可知ξ~·N(μ,σ2),我們要檢驗(yàn)均值是否為μ=18,具體步驟如下:
1.建立假設(shè).原假設(shè)H0:μ=18,表示這批項(xiàng)鏈符合標(biāo)準(zhǔn);與之對(duì)立的備擇假設(shè)H1:μ≠18,表示這批項(xiàng)鏈不符合標(biāo)準(zhǔn).
2.在H0成立時(shí),由Fisher定理可知統(tǒng)計(jì)量
T=-μSn[]n~t(n-1)=t(19).
3.由T分布圖像(如圖1)可以看出:T的取值集中在零點(diǎn)附近.這表明:|T|越大,對(duì)應(yīng)的概率就越小.從而存在臨界值C,使得|T|大于或等于C是一個(gè)小概率事件,則C要滿足
P(|T|≥C|H0成立)=α,
再由T分布圖像的對(duì)稱性可知
C=t0.975(19)≈2.093.
從而,當(dāng)|T|≥2.093時(shí),非常小的概率事件在此就發(fā)生了,只能拒絕原假設(shè)H0.
我們將W={(ξ1,ξ2,…,ξn)||T|≥2.093}這一集合稱為拒絕域,如果樣本的觀測(cè)值落到W中,則原假設(shè)應(yīng)被拒絕.
4.代入樣本均值和樣本標(biāo)準(zhǔn)差進(jìn)行計(jì)算,得到所觀測(cè)的樣本統(tǒng)計(jì)量t的值:
|t|=|17.8-18|0.40393[]20≈2.214>2.093,
其落到拒絕域W中,因此原假設(shè)被拒絕,故這批項(xiàng)鏈沒有達(dá)到標(biāo)準(zhǔn).
為了更直觀地理解拒絕域的含義,同學(xué)們可以參考T分布圖像.
小結(jié) 本案例利用假設(shè)檢驗(yàn)思想得出了該金店項(xiàng)鏈的含金量不符合標(biāo)準(zhǔn)的結(jié)論,啟發(fā)我們對(duì)待任何事情都不要抱有僥幸心理,不要弄虛作假,要誠(chéng)信做人做事,方能贏得大家的信任.項(xiàng)鏈含金量不達(dá)標(biāo)可能只是使消費(fèi)者金錢方面的利益受損.試想一下:如果是某大型嬰兒奶粉企業(yè)檢測(cè)出質(zhì)量不達(dá)標(biāo)的產(chǎn)品呢?再或者是嬰兒霜經(jīng)檢測(cè)含有毒物質(zhì)呢?抑或是我們服用的某種藥物檢測(cè)出有危害健康的成分呢?這些案例都不是捕風(fēng)捉影,均上過各大網(wǎng)站熱搜,引起了消費(fèi)者的恐慌.利用假設(shè)檢驗(yàn)這個(gè)工具,有助于我們?nèi)娴卣J(rèn)識(shí)這類事件,既可以讓我們避免無謂的損失,又可以幫助我們找到有利的取舍依據(jù).
(三)假設(shè)檢驗(yàn)的基本步驟
通過對(duì)上述案例的分析,我們可以歸納出求解假設(shè)檢驗(yàn)的基本步驟:
第一步:從要研究的實(shí)際問題引入,先提出一個(gè)假設(shè),一般稱之為原假設(shè),記為H0,與其對(duì)立的假設(shè)稱為備擇假設(shè),記為H1.例如,在上述案例中,原假設(shè)為“這批項(xiàng)鏈符合標(biāo)準(zhǔn)”,備擇假設(shè)為“這批項(xiàng)鏈不符合標(biāo)準(zhǔn)”.
第二步:依據(jù)所研究總體服從的分布,我們來構(gòu)造合適的檢驗(yàn)統(tǒng)計(jì)量,并通過所學(xué)知識(shí)來確定統(tǒng)計(jì)量服從的分布.
第三步:接下來,我們需要確定檢驗(yàn)的拒絕域W使得
P((ξ1,ξ2,…,ξn)∈W|H0成立)≤α.
第四步:根據(jù)樣本數(shù)值計(jì)算統(tǒng)計(jì)量所對(duì)應(yīng)的觀測(cè)值.如果計(jì)算所得觀測(cè)值落進(jìn)了W中,則說明原假設(shè)不當(dāng),應(yīng)予以拒絕,否則原假設(shè)不可以被拒絕.
(四)假設(shè)檢驗(yàn)的兩類錯(cuò)誤
在“女士品茶”的例子中,如果該女士本來就沒有鑒別能力,但是她運(yùn)氣好,每次都猜對(duì)了,這時(shí)候我們的推斷就出錯(cuò)了.事實(shí)上,在假設(shè)檢驗(yàn)問題中,我們由樣本提供的信息來推斷總體信息,由于樣本只包含總體的一部分信息,這就不可能保證從來不會(huì)犯錯(cuò)誤.假設(shè)檢驗(yàn)可能犯的錯(cuò)誤有如下兩類:
(Ⅰ)是否在 “拒絕假設(shè)H0” 時(shí)用了“小概率原理”.注意小概率事件并非不可能事件,如果原假設(shè)本為真,但由于樣本值落進(jìn)了拒絕區(qū)域內(nèi)而得出“拒絕”的結(jié)論,這里犯的錯(cuò)誤為棄真錯(cuò)誤,通常稱為第一類錯(cuò)誤,記為α,即
P(拒絕H0|H0為真)=α.
(Ⅱ)反之,如果原假設(shè)H0本來是不成立的,卻由于樣本值未落進(jìn)拒絕區(qū)域而得出“不能拒絕”的結(jié)論.這里的錯(cuò)誤是納偽錯(cuò)誤,一般稱為第二類錯(cuò)誤,記作β,即
P(接受H0|H0不真)=β.
根據(jù)檢驗(yàn)法則知:當(dāng)H0成立時(shí),拒絕H0的概率小于或等于顯著性水平α,但是顯著性水平α取得越小越好,因?yàn)榇藭r(shí)拒絕域也會(huì)相應(yīng)地減小,從而導(dǎo)致犯第二類錯(cuò)誤的概率增大.這是一個(gè)矛盾的雙方,類似于區(qū)間估計(jì)時(shí)的做法,我們需要先固定顯著性水平α,再選擇合理的檢驗(yàn)統(tǒng)計(jì)量來適當(dāng)?shù)販p小β的值.
下面我們?cè)俳Y(jié)合一個(gè)實(shí)際例子來理解兩類錯(cuò)誤:在新冠肺炎疫情發(fā)生初期,新聞報(bào)道中時(shí)常會(huì)出現(xiàn)“假陽”的檢測(cè)結(jié)果.我們可以從假設(shè)檢驗(yàn)的兩類錯(cuò)誤的角度來理解:事實(shí)上,任何檢驗(yàn)方法都會(huì)存在犯錯(cuò)誤的可能性,理想的試劑應(yīng)是“假陰”和“假陽”出現(xiàn)的概率都越小越好,但當(dāng)樣本量有限、檢測(cè)技術(shù)沒有明顯優(yōu)化提升時(shí),一類錯(cuò)誤概率的減少必會(huì)導(dǎo)致另一類錯(cuò)誤概率的增加,因此處理原則是:人為限定犯第一類錯(cuò)誤的概率α,為降低犯第二類錯(cuò)誤的概率,我們可以增大樣本容量.所以,從統(tǒng)計(jì)學(xué)的觀點(diǎn)看,新聞報(bào)道中的“假陰”“假陽”患者出現(xiàn)并不奇怪.
啟發(fā):小概率事件雖然在一次試驗(yàn)中不易發(fā)生,但絕非不可能事件,重復(fù)次數(shù)多了,發(fā)生的可能性也就增大了.這說明做任何事情都不要存在投機(jī)取巧的心理,俗話說“常在河邊走,哪有不濕鞋”“勿以惡小而為之,勿以善小而不為”.反之,再困難的事情,只要我們持之以恒,總是可以成功的,正所謂“鍥而不舍,金石為開”!
(五)假設(shè)檢驗(yàn)的p值
可以看出,顯著性水平α變小,對(duì)應(yīng)的拒絕域也會(huì)變小;當(dāng)顯著性水平α取得足夠小時(shí),使得樣本值不落在相應(yīng)的拒絕域中,從而在此顯著性水平α下不能拒絕假設(shè)H0.當(dāng)顯著性水平α由上述足夠小的值不斷增大時(shí),對(duì)應(yīng)的拒絕域也會(huì)變大,當(dāng)顯著性水平α大到一定程度時(shí),便可以使樣本值落入相應(yīng)的拒絕域中,從而在此顯著性水平α下可以拒絕假設(shè)H0.
對(duì)于一個(gè)確定的樣本值,存在一個(gè)實(shí)數(shù)p(0<p<1),當(dāng)顯著性水平α=p時(shí)可以拒絕H0,而當(dāng)α<p時(shí)原假設(shè)H0不可以被拒絕.可見,p是使依據(jù)給定樣本數(shù)值做出“拒絕H0”的最小的那個(gè)顯著性水平,我們稱之為檢驗(yàn)的p值.
在例2中,我們也可以通過統(tǒng)計(jì)軟件計(jì)算t統(tǒng)計(jì)量的值和p值:
給定顯著性水平α為0.05,由表2可知p值0.039<0.05,原假設(shè)應(yīng)被拒絕,認(rèn)為項(xiàng)鏈含金量與18K之間有顯著的統(tǒng)計(jì)差異,從而得出“項(xiàng)鏈不符合標(biāo)準(zhǔn)”的結(jié)論.
(六)課堂小結(jié)與思政
本節(jié)課我們主要通過“女士品茶”的案例引入假設(shè)檢驗(yàn)的基本思想,通過分析項(xiàng)鏈含金量這一實(shí)際案例總結(jié)出假設(shè)檢驗(yàn)的基本步驟,也給出了假設(shè)檢驗(yàn)的兩類錯(cuò)誤和p值的含義,這為接下來進(jìn)一步學(xué)習(xí)不同類型的、具體的假設(shè)檢驗(yàn)打下了必要的基礎(chǔ).
假設(shè)檢驗(yàn)不僅是一種重要的統(tǒng)計(jì)方法,更是一種思維方式,告訴我們用數(shù)據(jù)來說話,理性地看待問題.正因?yàn)槿绱?,假設(shè)檢驗(yàn)在我們的現(xiàn)實(shí)生活中有著十分重要的應(yīng)用.比如,專家利用假設(shè)檢驗(yàn),結(jié)合臨床數(shù)據(jù)分析不同采樣點(diǎn)、人群、年齡的新冠病毒核酸檢測(cè)的結(jié)果,給有關(guān)部門的決策提供參考.假設(shè)檢驗(yàn)的理論方法不僅被廣泛應(yīng)用于醫(yī)學(xué)檢驗(yàn)、生物制藥等諸多領(lǐng)域,在我們的生產(chǎn)生活,特別是工業(yè)產(chǎn)品的質(zhì)量判斷中也有著十分廣泛的應(yīng)用[5],因?yàn)樵诠S的實(shí)際生產(chǎn)過程中,產(chǎn)品的尺寸總是左右浮動(dòng)的,存在一定的誤差,那么如何判斷這些誤差是否在允許的范圍內(nèi)?這就要用到假設(shè)檢驗(yàn)的思想方法.不僅如此,假設(shè)檢驗(yàn)的理論還可應(yīng)用于文學(xué)研究.例如,東南大學(xué)韋博成教授在2009年[6]利用假設(shè)檢驗(yàn)的理論方法分析了《紅樓夢(mèng)》前80回與后40回的某些文風(fēng)差異,得到的結(jié)論是“這兩部分內(nèi)容在寫作風(fēng)格方面存在明顯的差異”,給關(guān)于《紅樓夢(mèng)》作者的論斷提供了一個(gè)強(qiáng)有力的證據(jù).在現(xiàn)實(shí)生活中,數(shù)據(jù)是無處不在的,學(xué)習(xí)假設(shè)檢驗(yàn)的思想方法有助于我們正確地挖掘數(shù)據(jù)背后的規(guī)律,做出更客觀的判斷.
如今,我們身處一個(gè)大數(shù)據(jù)時(shí)代,通過學(xué)習(xí)假設(shè)檢驗(yàn),更重要的是培養(yǎng)透過現(xiàn)象看本質(zhì)這一統(tǒng)計(jì)思維.這里,調(diào)查得來的數(shù)據(jù)是現(xiàn)象,規(guī)律是從數(shù)據(jù)中探索出來的本質(zhì)屬性.我們需要借助數(shù)學(xué)模型,并結(jié)合統(tǒng)計(jì)方法來尋找這其中的規(guī)律和隨機(jī)性,在潛移默化中培養(yǎng)統(tǒng)計(jì)思維.正如我國(guó)著名的數(shù)學(xué)家嚴(yán)加安院士在《悟道詩》中所題:隨機(jī)非隨意,概率破玄機(jī);無序隱有序,統(tǒng)計(jì)解迷離.
注:課后同學(xué)們?nèi)粝脒M(jìn)一步了解統(tǒng)計(jì)學(xué)的發(fā)展歷程,可以讀一讀《20世紀(jì)統(tǒng)計(jì)怎樣變革了科學(xué):女士品茶》[7] 這一科普著作.
【參考文獻(xiàn)】
[1]習(xí)近平主持召開學(xué)校思想政治理論課教師座談會(huì)[N].新華社,2019-03-18,20:57.
[2]李晨,陳麗萍.概率論與數(shù)理統(tǒng)計(jì)課程教學(xué)中思政元素的挖掘與實(shí)踐[J].大學(xué)教育,2021(9):104-106.
[3]茆詩松,程依明,濮曉龍.概率論與數(shù)理統(tǒng)計(jì)教程:第3版[M].北京:高等教育出版社,2019.
[4] 朱元澤,李賢彬.概率論與數(shù)理統(tǒng)計(jì)[M].上海: 上海交通大學(xué)出版社,2015.
[5] 喬靜.假設(shè)檢驗(yàn)在工業(yè)產(chǎn)品質(zhì)量判斷中的應(yīng)用[J].機(jī)電信息,2020(27):142-143.
[6] 韋博成.《紅樓夢(mèng)》前80回與后40回某些文風(fēng)差異的統(tǒng)計(jì)分析(兩個(gè)獨(dú)立二項(xiàng)總體等價(jià)性檢驗(yàn)的一個(gè)應(yīng)用)[J].應(yīng)用概率統(tǒng)計(jì),2009(4):441-448.
[7] 薩爾斯伯格.20世紀(jì)統(tǒng)計(jì)怎樣變革了科學(xué):女士品茶[M].北京:中國(guó)統(tǒng)計(jì)出版社,2004.
數(shù)學(xué)學(xué)習(xí)與研究2022年8期