呂建聚++張艷
DOI:10.16660/j.cnki.1674-098X.2017.25.233
摘 要:假設(shè)檢驗(yàn)是工科概率統(tǒng)計(jì)教學(xué)過(guò)程中學(xué)生反映比較難懂的章節(jié)。本文就假設(shè)檢驗(yàn)原理理解中的一些難點(diǎn)和模糊點(diǎn),給出了進(jìn)一步的解釋?zhuān)康氖鞘箤W(xué)生更加清晰地理解知識(shí),進(jìn)一步提高學(xué)生的分析問(wèn)題和解決問(wèn)題的實(shí)踐創(chuàng)新能力。
關(guān)鍵詞:假設(shè)檢驗(yàn) 否定域 原假設(shè) 備擇假設(shè)
中圖分類(lèi)號(hào):G71 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1674-098X(2017)09(a)-0233-02
Abstract: Hypothesis testing is a difficult chapter in the teaching of probability and statistics in engineering. This paper gives a further explanation about some difficulties and fuzzy points in understanding the test principle. The purpose is to make students more clearly understand the knowledge, to further improve the students' ability of analyzing and solving problems.
Key Words: Hypothesis testing; Critical region; Null hypothesis; Alternative hypothesis
假設(shè)檢驗(yàn)是概率論與數(shù)理統(tǒng)計(jì)課程中的教學(xué)重點(diǎn)和難點(diǎn)。由于這部分內(nèi)容包含了豐富的思想和原理,公式很多,初學(xué)者常常覺(jué)得暈頭轉(zhuǎn)向、內(nèi)容深不可測(cè),大部分學(xué)生只能死記硬背公式,應(yīng)付考試;由于課時(shí)有限,教師在課堂上也不可能充分講深講透。本文針對(duì)以上問(wèn)題對(duì)教學(xué)過(guò)程中的一些難點(diǎn)和模糊點(diǎn),談一些自己的認(rèn)識(shí)和教學(xué)體會(huì)。
1 檢驗(yàn)統(tǒng)計(jì)量及否定域的構(gòu)造思想及方法
檢驗(yàn)統(tǒng)計(jì)量及否定域的構(gòu)造是假設(shè)檢驗(yàn)的核心工作和難點(diǎn)。用通俗的語(yǔ)言來(lái)說(shuō),否定域就是否定原假設(shè)的條件,歸納起來(lái)必須滿足兩條:一是觀察到的樣本對(duì)原假設(shè)不支持,或者說(shuō)出現(xiàn)了相對(duì)于原假設(shè)成立的不合理現(xiàn)象,二是,這種不合理要非常明顯,用概率的語(yǔ)言來(lái)說(shuō),就是出現(xiàn)幾乎不可能發(fā)生的小概率事件。這兩條之中,尋找不合理現(xiàn)象是工作的方向,而不合理的標(biāo)準(zhǔn)可以根據(jù)研究對(duì)象人為設(shè)定?;谝陨侠斫?,構(gòu)造否定域分3個(gè)步驟:
第一步,選擇一個(gè)和被檢驗(yàn)對(duì)象貼近度高的檢驗(yàn)統(tǒng)計(jì)量,在原假設(shè)成立的前提下可以直觀看出檢驗(yàn)統(tǒng)計(jì)量的大致取值規(guī)律。
關(guān)于單個(gè)正態(tài)總體均值μ的單邊、雙邊檢驗(yàn)中,可選用統(tǒng)計(jì)量,因?yàn)槭铅桃粋€(gè)良好的無(wú)偏估計(jì),與μ同向增減;同理,兩個(gè)正態(tài)總體的均值差μ1-μ2的有關(guān)檢驗(yàn)當(dāng)中,可以選用統(tǒng)計(jì)量;總體方差有關(guān)的檢驗(yàn)可以選用樣本標(biāo)準(zhǔn)差S2。
為了計(jì)算概率,必要時(shí)對(duì)初步選定的統(tǒng)計(jì)量進(jìn)行簡(jiǎn)單加工,得到分布已知的統(tǒng)計(jì)量。
第二步,假定原假設(shè)成立,分析擬用統(tǒng)計(jì)量取值不合理的情景,對(duì)于統(tǒng)計(jì)量不合理的取值有一個(gè)定性的認(rèn)識(shí)。
第三步,根據(jù)對(duì)不合理程度的要求,選定一個(gè)閾值,即顯著性水平來(lái)作為檢驗(yàn)標(biāo)準(zhǔn),于是可得否定域。
具體來(lái)看正態(tài)總體均值μ的右邊檢驗(yàn),第一步,選用作為檢驗(yàn)統(tǒng)計(jì)量;第二步,分析在什么情景下不合理,原假設(shè)成立的情景下,通常要比μ0小一些,如果比μ0大很多,就是明顯的不合理;第三步,設(shè)定出一個(gè)標(biāo)準(zhǔn)值k,成立就否定原假設(shè)。
為了解題過(guò)程標(biāo)準(zhǔn)化和增加可比性,可將進(jìn)行再加工,在未知時(shí),用作為檢驗(yàn)統(tǒng)計(jì)量,T是的線性函數(shù),T值很大就不合理,≥作為否定原假設(shè)的條件即否定域,α為顯著性水平。學(xué)會(huì)了這種分析方法,就能夠根據(jù)具體的檢驗(yàn)問(wèn)題選擇檢驗(yàn)統(tǒng)計(jì)量及構(gòu)造否定域。
這種思想其實(shí)很樸素,生活當(dāng)中有很多體現(xiàn),比如某地區(qū)種植小麥,原來(lái)畝產(chǎn)量在500kg左右,改種新品種后,平均畝產(chǎn)量比500kg僅僅稍多一些,一般不會(huì)認(rèn)為新品種產(chǎn)量會(huì)提高,如果新品種平均畝產(chǎn)達(dá)到600kg以上,比500kg明顯的多,農(nóng)民就會(huì)得出新品種產(chǎn)量高的結(jié)論。
從上面說(shuō)明中,也能體會(huì)到顯著性水平中“顯著”二字的含義。
2 原假設(shè)及備擇假設(shè)的設(shè)置
原假設(shè)和備選假設(shè)的設(shè)置問(wèn)題,理論上的困惑是單邊檢驗(yàn)中等號(hào)一定放在原假設(shè)當(dāng)中,實(shí)際操作中的困惑是如何正確設(shè)置原假設(shè)和備選假設(shè)。
(1)等號(hào)放在原假設(shè)里面,是精確控制第一類(lèi)錯(cuò)誤的需要。
關(guān)于兩類(lèi)錯(cuò)誤的取舍思路教材上都有說(shuō)明,就是控制第一類(lèi)錯(cuò)誤的前提下,盡量減少第二類(lèi)錯(cuò)誤。廣泛使用的假設(shè)檢驗(yàn)的評(píng)價(jià)標(biāo)準(zhǔn)N-P準(zhǔn)則,大意就是犯第一類(lèi)錯(cuò)誤的概率不超過(guò)α的前提下,犯第二類(lèi)錯(cuò)誤的概率小者為優(yōu)。
原假設(shè)不含等號(hào)的話,第一類(lèi)錯(cuò)誤無(wú)法控制。比如正態(tài)總體的單邊假設(shè)檢驗(yàn),,假設(shè)已知,用Z檢驗(yàn),否定域?yàn)椤?,第一?lèi)錯(cuò)誤的概率
隨μ的增大(不超過(guò)μ0)而增大,當(dāng)μ=μ0時(shí)達(dá)到最大值α,第一類(lèi)錯(cuò)誤精確限制,否定域邊界確定。如果原假設(shè)不含等號(hào),否定域就不能精確界定。其他參數(shù)的單邊檢驗(yàn)也具有同樣的性質(zhì)。
(2)關(guān)于原假設(shè)和備擇假設(shè)的設(shè)置思路,綜合起來(lái)有以下幾點(diǎn):
一是,純粹從方便記憶和做題的角度看,原假設(shè)含有等號(hào),于是考慮問(wèn)題時(shí),先將提高、降低等不含等號(hào)的提法確定為備擇假設(shè),反過(guò)來(lái)確定原假設(shè)。
二是,從原理上理解假設(shè)檢驗(yàn)方法具有保護(hù)原假設(shè)的特點(diǎn),即沒(méi)有特別明顯的不利于原假設(shè)的證據(jù),不拒絕原假設(shè),實(shí)踐上看,接受原假設(shè)比接受備擇假設(shè)容易得多。因此將輕易不能得出的結(jié)論或者有可能產(chǎn)生嚴(yán)重后果的結(jié)論比如改進(jìn)工藝后產(chǎn)品指標(biāo)提高、藥品副作用小的情景放在備擇假設(shè),或者體現(xiàn)一定的傾向性,故意將主觀上不希望得出的一些判斷放到備擇假設(shè)。
三是,假設(shè)檢驗(yàn)方法是用來(lái)解決對(duì)已有的認(rèn)知是否改變以及改變方向進(jìn)行定性的判斷問(wèn)題的,僅適用于對(duì)參數(shù)已經(jīng)有比較充分了解的情況,若對(duì)參數(shù)一無(wú)所知的話一般不適合這種方法。設(shè)置原假設(shè)時(shí),把歷史狀態(tài)、已有的認(rèn)知放在原假設(shè)里邊,抓住原假設(shè)的“原”字,既好理解也好記憶。
參考文獻(xiàn)
[1] 茆詩(shī)松.高等數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社,2004.
[2] 陳希儒.數(shù)理統(tǒng)計(jì)學(xué)教程[M].合肥:中國(guó)科學(xué)技術(shù)大學(xué)出版社,2015.
[3] 盛驟.概率論與數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社,2006.endprint