賀樂平 莫宏敏
摘 要: 本文對統(tǒng)計(jì)推斷理論中區(qū)間估計(jì)和參數(shù)假設(shè)檢驗(yàn)的相關(guān)性問題進(jìn)行了分析,并對區(qū)間估計(jì)和假設(shè)檢驗(yàn)的內(nèi)在聯(lián)系和區(qū)別進(jìn)行了探討.
關(guān)鍵詞: 統(tǒng)計(jì)推斷 置信區(qū)間 假設(shè)檢驗(yàn) 拒絕域 區(qū)間估計(jì)
1.引言
數(shù)理統(tǒng)計(jì)是數(shù)學(xué)中的一個重要分支,具有廣泛的應(yīng)用.假設(shè)檢驗(yàn)和區(qū)間估計(jì)作為兩種重要統(tǒng)計(jì)推斷方法,在金融保險(xiǎn)、經(jīng)濟(jì)管理、科學(xué)研究、工程技術(shù)、質(zhì)量控制乃至國防安全、災(zāi)害防治等各方面等領(lǐng)域的應(yīng)用日趨廣泛.其在科學(xué)決策中的作用也被越來越多的人所認(rèn)知.表面上看,假設(shè)檢驗(yàn)和區(qū)間估計(jì)從是兩個不同的概念,但實(shí)際上它們之間的聯(lián)系是很密切的,掌握它們之間的關(guān)系、各自的適用范圍和應(yīng)用條件,以及應(yīng)注意的問題對作出正確的統(tǒng)計(jì)推斷至關(guān)重要.本文初步探討了區(qū)間估計(jì)與假設(shè)檢驗(yàn)問題的內(nèi)在聯(lián)系和區(qū)別,討論了如何利用置信區(qū)間解釋假設(shè)檢驗(yàn)的有關(guān)問題的新思路、新方法.
2.參數(shù)的區(qū)間估計(jì)與假設(shè)檢驗(yàn)的內(nèi)在聯(lián)系
統(tǒng)計(jì)推斷的基本問題分為兩類:一類是參數(shù)估計(jì),另一類是假設(shè)檢驗(yàn).它們是兩個不同的統(tǒng)計(jì)概念,但又有著密切的聯(lián)系,從某種意義上來講,是同一問題的不同表達(dá)方式,參數(shù)區(qū)間估計(jì)與假設(shè)檢驗(yàn)雖然提法不同,但解決問題的方法、途徑是相通的,統(tǒng)計(jì)推斷的基本思想是一樣的,都是利用樣本信息推斷總體的性質(zhì),即用部分推斷總體.它們選取的都是同一個統(tǒng)計(jì)量,然后計(jì)算出這個統(tǒng)計(jì)量落在某個區(qū)間上的概率,而據(jù)由此作出判斷.利用區(qū)間估計(jì)可以建立假設(shè)檢驗(yàn),反之亦然.
例:設(shè)總體X~N(μ,σ■),σ■未知,試求未知參數(shù)u的區(qū)間估計(jì).
解:選取統(tǒng)計(jì)量
t=■~t(n-1),按置信度1-α確定一個大概率事件
p|■|≤t■=1-α,由此得到u的置信度為1-α的置信區(qū)間為[■-■t■,■+■t■].該區(qū)間估計(jì)恰好是原假設(shè)H■μ=μ■的一個接受域,其中顯著性水平為α.
對假設(shè)檢驗(yàn)問題,則提出假設(shè):H■∶μ=μ■;H■∶μ≠μ■,選擇統(tǒng)計(jì)量t=■
對給定的顯著性水平為α,得到一個小概率事件p|■|>t■=α,由實(shí)測值,
|■|>t■是否成立,決定是否拒絕原假設(shè),拒絕域?yàn)閨■|>t■,接受域?yàn)閨■|≤t■,則結(jié)果正是u的置信度為區(qū)間估計(jì).
3.參數(shù)的區(qū)間估計(jì)與假設(shè)檢驗(yàn)之間的區(qū)別
參數(shù)的區(qū)間估計(jì)與假設(shè)檢驗(yàn)的統(tǒng)計(jì)處理確有相通之處.某種意義上是從不同的角度回答同一問題,但兩者之間又有區(qū)別,主要體現(xiàn)以下幾點(diǎn).
第一,參數(shù)估計(jì)解決的是定量問題,是多少(或范圍)問題,假設(shè)檢驗(yàn)解決的是定性問題,則判斷結(jié)論是否成立的問題.各自的要求不盡相同.區(qū)間估計(jì)是確定置信度1-α(一定的概率)下給出未知參數(shù)的接受范圍.而假設(shè)檢驗(yàn)是在給定的置信水平α下,確定未知參數(shù)能否接受已給定的值.
第二,區(qū)間估計(jì)與假設(shè)檢驗(yàn)對問題的了解程度不盡相同.假設(shè)檢驗(yàn)原假設(shè)H■的設(shè)定對結(jié)果影響很大,其中考慮了某些非樣本信息,原假設(shè)必須選有足夠理由認(rèn)為其成立概率很大的假設(shè),因?yàn)闆]有非常充足的證據(jù)是不能輕易推翻原假設(shè)的,而區(qū)間估計(jì)則只依據(jù)樣本作出推斷.因而在實(shí)際應(yīng)用中,究竟選擇哪種方法進(jìn)行統(tǒng)計(jì)推斷,需要根據(jù)實(shí)際問題的情況確定相應(yīng)的處理方法.否則將會產(chǎn)生不同的結(jié)論,得出錯誤的統(tǒng)計(jì)推斷.
例:已知某廠生產(chǎn)的維尼綸纖度服從正態(tài)分布,規(guī)定標(biāo)準(zhǔn)為纖度不低于100,某日抽取6根纖維,測得纖度為分別85,90,95,97,100,103.問能否認(rèn)為這天的維尼綸是合格的?(a=0.05)
解法一:①提出待檢假設(shè):H■∶u≥100,H■∶u<100
②選取統(tǒng)計(jì)量:t=■
③對于給定的檢驗(yàn)水平α=0.05,查表確定臨界值t■(5)=2.015,從而給出拒絕域:P{t<-t■=-2.015}=α=0.05,拒絕域?yàn)椋?∞,-2.015)
④計(jì)算判斷:易得■=95,s=6.6030
t=■=-1.8558
因統(tǒng)計(jì)量觀察值沒有落入拒絕域中,應(yīng)當(dāng)接受原假設(shè)H■,可以認(rèn)為這天的維尼綸是合格的.
解法二:提出待檢假設(shè):H■∶u≤100,H■∶u>100
其拒絕域?yàn)椋?.015,+∞),統(tǒng)計(jì)量的觀察值也沒有落入拒絕域中,理應(yīng)接受H■,結(jié)論是這天的維尼綸是不合格的,為何當(dāng)交換原假設(shè)和備擇假設(shè)作檢驗(yàn)時,卻得出截然相反的結(jié)論呢?這主要是由樣本的隨機(jī)性所引起的.事實(shí)上,第一種解法的拒絕域?yàn)椋╰■,+∞),第二種解法的拒絕域?yàn)椋?∞,-t■),兩種方法的接受域有一個公共的交集(-t■,t■).由于樣本的隨機(jī)性,當(dāng)樣本觀測值落入兩者的交集時,兩種解法都是接受原假設(shè),從而得出截然相反的檢驗(yàn)結(jié)果.
假若從區(qū)間估計(jì)的角度分析,由已知條件,利用樣本數(shù)據(jù),可以算出,置信度為0.95的置信區(qū)間大約是(90,100),而所給樣本數(shù)據(jù)中超過100的概率只有約5%.因而從數(shù)據(jù)來看,很難認(rèn)為這天的維尼綸是合格的.區(qū)間估計(jì)與第二種推斷方法結(jié)果相同,卻與解法一大相徑庭,其中的原因值得研究.
如果我們知道該廠的生產(chǎn)過程一直很穩(wěn)定,裝配工人技術(shù)嫻熟,以往的檢驗(yàn)很少有生產(chǎn)不正常的情況出現(xiàn),被判定為不合格,犯錯誤的概率較大,則我們選擇假設(shè)檢驗(yàn)的解法一.盡管這次檢驗(yàn)所給樣本數(shù)據(jù)似乎不太理想,但經(jīng)檢驗(yàn),我們還是有理由相信,這天的維尼綸是合格的.這時,若用區(qū)間估計(jì)的方法進(jìn)行檢驗(yàn),則結(jié)論為這天的維尼綸是不合格的,檢驗(yàn)并沒有考慮到我們已有的非樣本信息,因此該結(jié)論是不全面的.如果樣本僅如例2所列,除此之外并無其他值得重點(diǎn)考慮的信息,則用區(qū)間估計(jì)檢驗(yàn),并據(jù)之判斷,按區(qū)間估計(jì)的結(jié)果認(rèn)為該認(rèn)為這天的維尼綸是不合格的并無不當(dāng).因此,從例2的情況可知,區(qū)間估計(jì)與假設(shè)檢驗(yàn)適用的情況應(yīng)有所不同,而且假設(shè)檢驗(yàn)中,在某些情況下,所得結(jié)論與原假設(shè)及備擇假設(shè)的設(shè)定有關(guān),這關(guān)乎單側(cè)假設(shè)檢驗(yàn)中原假設(shè)的設(shè)定原則問題,這里不再贅述.
綜上所述,在常規(guī)情況下如果我們對問題的總體的某些非樣本信息,如歷史經(jīng)驗(yàn)等有很多實(shí)際的了解,則應(yīng)選取假設(shè)檢驗(yàn)方法,如果我們對待檢驗(yàn)問題除樣本信息外的其他信息一無所知,則用區(qū)間估計(jì)方法檢驗(yàn)較妥當(dāng),據(jù)此作出判斷較客觀,失誤相對較少.總之,在學(xué)習(xí)和應(yīng)用中,準(zhǔn)確把握住數(shù)理統(tǒng)計(jì)中區(qū)間估計(jì)與假設(shè)檢驗(yàn)這兩種統(tǒng)計(jì)推斷方法內(nèi)在聯(lián)系和區(qū)別是得出正確結(jié)論的關(guān)鍵,我們必須注意它們各自適用的范圍和條件,這對作出正確的統(tǒng)計(jì)推斷至關(guān)重要.
參考文獻(xiàn):
[1]鄧集賢等.概率論與數(shù)理統(tǒng)計(jì)(下)[M].北京高等教育出版社,2009.
[2]茆詩松,王靜龍.數(shù)理統(tǒng)計(jì)[M].上海華東師范大學(xué)出版社,1986.
[3]茆詩松等.高等數(shù)理統(tǒng)計(jì)[M].北京高等教育出版社,2000.
[4]杜世平.對區(qū)間估計(jì)與假設(shè)檢驗(yàn)的關(guān)系的思考[J].西南民族大學(xué)學(xué)報(bào),2005,31(3):339-341.
項(xiàng)目:吉首大學(xué)新開課程建設(shè)立項(xiàng)項(xiàng)目:2012KCB04,吉首大學(xué)教改課題:民族地區(qū)統(tǒng)計(jì)學(xué)專業(yè)應(yīng)用型人才培養(yǎng)模式改革的理論與實(shí)踐(2013JSUJGA13)