文小波
[摘? ? ? ? ? ?要]? 以單因子變量法為手段,兩兩對照研究影響假設(shè)檢驗(yàn)結(jié)論的一些因素.原假設(shè)與備擇假設(shè)的互換,不同顯著性水平,參數(shù)與非參數(shù)假設(shè)檢驗(yàn)的對照,不同統(tǒng)計(jì)量的選擇等,都可能造成假設(shè)檢驗(yàn)得出矛盾的結(jié)論,在實(shí)際應(yīng)用中這些問題應(yīng)得到重視,合理做出選擇.
[關(guān)? ? 鍵? ?詞]? 假設(shè)檢驗(yàn);統(tǒng)計(jì)量;顯著性水平
[中圖分類號]? O211.1? ? ? ? ? ? ? ? [文獻(xiàn)標(biāo)志碼]? A? ? ? ? ? ? ? ?[文章編號]? 2096-0603(2020)01-0010-02
假設(shè)檢驗(yàn)是最常用的統(tǒng)計(jì)推斷方法之一,在統(tǒng)計(jì)學(xué)中有廣泛的應(yīng)用.假設(shè)檢驗(yàn)分為參數(shù)與非參數(shù)假設(shè)檢驗(yàn).根據(jù)中心極限定理,在樣本量足夠大時,其他的分布也可以做正態(tài)近似,因此在做假設(shè)檢驗(yàn)時,常對總體做正態(tài)假設(shè).
假設(shè)檢驗(yàn)的步驟為建立假設(shè)、構(gòu)造檢驗(yàn)統(tǒng)計(jì)量、選定顯著性水平、給出拒絕域的形式、做出判斷.
一、原假設(shè)與備擇假設(shè)的互換
原假設(shè)與備擇假設(shè)的互換,可能會得出相反的結(jié)論.
(一)參數(shù)假設(shè)檢驗(yàn)下原假設(shè)與備擇假設(shè)的互換
本文首先通過一個方差已知的單個正態(tài)總體均值假設(shè)檢驗(yàn)的例子來加以分析說明原假設(shè)與備擇假設(shè)互換之后,檢驗(yàn)結(jié)論的問題.
為何會出現(xiàn)兩種截然相反的結(jié)果呢,這其實(shí)是接受域的構(gòu)成較為復(fù)雜的原因引起的.相同的原假設(shè)和備擇假設(shè)互換以后,就可能將模糊域推向另一面,從而得出兩個矛盾的結(jié)果.由此有結(jié)論1.
結(jié)論1 參數(shù)假設(shè)檢驗(yàn)下原假設(shè)與備擇假設(shè)的互換可能會引起對立結(jié)果.
(二)非參數(shù)假設(shè)檢驗(yàn)下原假設(shè)與備擇假設(shè)的互換
非參數(shù)假設(shè)檢驗(yàn)之中,原假設(shè)和備擇假設(shè)的互換亦可能得出矛盾的結(jié)論.常用非參數(shù)檢驗(yàn)的方法有游程檢驗(yàn)、符號檢驗(yàn)、符號秩和檢驗(yàn)等,本文以符號檢驗(yàn)為例,加以闡述說明上述問題.
例2 煙廠稱每只香煙的尼古丁含量在12mg以下,抽取12只香煙,測得其尼古丁含量為16.7 17.7 14.1 11.4 13.4 10.5 13.6 11.6 12.0 12.6 11.7 13.7,是否該煙廠所說的尼古丁比實(shí)際含量少?
由此可見,在非參數(shù)假設(shè)檢驗(yàn)中,原假設(shè)和備擇假設(shè)的對換亦可能得出相反的結(jié)論.故在假設(shè)檢驗(yàn)之中,應(yīng)以期待接受的假設(shè)作為原假設(shè),這樣容易使原假設(shè)獲得成立,由此有結(jié)論2.
結(jié)論2 非參數(shù)假設(shè)檢驗(yàn)下原假設(shè)與備擇假設(shè)的互換可能會引起對立結(jié)果的出現(xiàn).
二、不同的顯著性水平
在相同的原假設(shè)和備擇假設(shè)及統(tǒng)計(jì)量選取之下,不同的顯著性水平亦可能有相反的結(jié)果.
例3 某纖維長度符合正態(tài)分布,其均值為240,先抽取5件產(chǎn)品,得其長度為239.7 239.6 239 240 239.2,判斷該纖維長度是否滿足要求.
在相同的假設(shè)檢驗(yàn)之中,不同的顯著性水平得出相反的結(jié)論是常見的事情.一般默認(rèn)的顯著性水平是α=0.05,在具體應(yīng)用中可根據(jù)要求具體選擇.由此有結(jié)論3.
結(jié)論3 同一假設(shè)檢驗(yàn)之下,不同的顯著性水平可能會引起對立結(jié)果的出現(xiàn).
三、參數(shù)和非參數(shù)假設(shè)檢驗(yàn)
接下來,本文進(jìn)一步研究參數(shù)和非參數(shù)假設(shè)檢驗(yàn)方法對相同問題結(jié)果的影響.
例4 某保險(xiǎn)公司,從索賠數(shù)額中抽取15個數(shù)據(jù)為4632?4728 5052 5064 5484 6972 7596 9480 14760 15012 18720 21240 22836 52788 67200,已知上年索賠中位數(shù)和均值皆為5063,問今年與上年的索賠金額是否有變化.
參數(shù)假設(shè)檢驗(yàn)與非參數(shù)假設(shè)檢驗(yàn)沒有哪一個方法明確更加優(yōu)良,各有各的優(yōu)勢之所在,使用的前提條件與假設(shè)并不一致.當(dāng)然在一般情況下,如果能使用參數(shù)假設(shè)檢驗(yàn)的地方,盡量使用參數(shù)的假設(shè)檢驗(yàn).由此有結(jié)論4.
結(jié)論4? 同一問題,參數(shù)與非參數(shù)假設(shè)檢驗(yàn)可能會引起對立結(jié)果的出現(xiàn).
四、不同的統(tǒng)計(jì)量
最后本文探討相同的原假設(shè)和備擇假設(shè)及顯著性水平,不同的統(tǒng)計(jì)量也可能會有相反的結(jié)果.
例5 從甲地到乙地傳輸信號,現(xiàn)在乙地接收到5個信號值,分別為8.05 8.15 8.2 8.1 8.25,已知信號值服從正態(tài)分布N(μ,0.22),是否有理由猜測信號值為8.
由上例可以看出檢驗(yàn)統(tǒng)計(jì)量的選擇可能會造成得出相反的結(jié)論.題干之中正態(tài)總體的方差是已知的,一般采用μ檢驗(yàn),但spss軟件計(jì)算之中,t檢驗(yàn)是非常方便操作的.最終統(tǒng)計(jì)量的選擇需根據(jù)實(shí)際情況來加以選擇.由此有結(jié)論5.
結(jié)論5 同一問題,檢驗(yàn)統(tǒng)計(jì)量的不同可能會引起對立結(jié)果的出現(xiàn).
假設(shè)的建立,參數(shù)與非參數(shù)假設(shè)檢驗(yàn)的選擇,不同的顯著性水平,不同的檢驗(yàn)統(tǒng)計(jì)量等都可能得到矛盾的結(jié)論.這也是假設(shè)檢驗(yàn)被很多人排斥的地方,認(rèn)為其不科學(xué).但這是不對的,概率與統(tǒng)計(jì)是一門研究隨機(jī)變量規(guī)律性的一個學(xué)科,本就具有一定的隨機(jī)性,很多問題不能像純數(shù)學(xué)一樣表示為確切的函數(shù)關(guān)系,這也正是統(tǒng)計(jì)學(xué)的特別之處.當(dāng)然引起假設(shè)檢驗(yàn)出現(xiàn)對立結(jié)果的因素不僅僅只有文中所提到的因素,如單側(cè)還是雙側(cè)假設(shè)檢驗(yàn)的選擇,犯第一類錯誤和犯第二類錯誤等因素也都有可能得出自相矛盾的結(jié)論,在運(yùn)用中也是需要注意,本文不再贅述.在應(yīng)用之中,只要合理地選擇假設(shè)檢驗(yàn)方法、統(tǒng)計(jì)量和顯著性水平,對最終的結(jié)果做出合理的解釋,就可以很好地利用假設(shè)檢驗(yàn)來做統(tǒng)計(jì)推斷分析.當(dāng)然在假設(shè)檢驗(yàn)之中,雖然假設(shè)檢驗(yàn)有著看起來的很多問題,但是只要合理選擇,其仍然是最重要的統(tǒng)計(jì)推斷方法之一.
參考文獻(xiàn):
[1]茆詩松,程依明,濮曉龍.高等數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社,2006.
[2]杜強(qiáng),賈麗艷,嚴(yán)先鋒.spss統(tǒng)計(jì)分析從入門到精通[M].北京:人民郵電出版社,2014.
[3]胡曉華.解析顯著性水平及應(yīng)用[J].統(tǒng)計(jì)與決策,2017(13):88-91.
編輯 馮永霞