• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      “假設檢驗”決策的誤區(qū)——一場由全國大學生數(shù)學建模競賽引發(fā)的爭論

      2013-07-06 02:03:00易昆南程勛杰
      關鍵詞:假設檢驗總體方差

      易昆南,程勛杰

      (中南大學數(shù)學與統(tǒng)計學院,長沙 410075)

      1 問題的提出

      問題1[1]是這樣提出的:分析附件1中 A、B兩組評酒員對27組酒樣的評價結果有無顯著性差異,哪一組結果更可信?

      2 方差分析法

      方差分析法解法思路:取A、B兩組評酒員對27組酒樣打分的平均值(或打分之和)作單因素方差分析,用檢驗結果來判斷兩組評酒員對27組酒樣的評價結果有無顯著性差異。

      方差分析[2](analysis of variance,ANOVA)又稱“變異數(shù)分析”或“F檢驗”,是由 R.A.Fisher發(fā)明的,用于對兩個及兩個以上樣本均數(shù)差別的顯著性檢驗。對于給定的顯著性水平α∈ (0 ,1),若p=P{ F ≥F0}<α,則拒絕原假設H0(F0為F統(tǒng)計量的觀測值),可以認為所考慮的因素對相應變量有顯著性影響;否則,不能拒絕H0,認為所考慮的因素對相應變量無顯著性影響。

      方差分析的最重要的假定條件為:①各處理條件下的樣本是相互獨立的,否則可能出現(xiàn)無法解析的輸出結果;② 各處理條件下的樣本分別來自正態(tài)分布總體,否則使用非參數(shù)分析;③各處理條件下的樣本方差相同,即具有齊效性。

      假設條件①、②容易得到滿足,而假設條件③恰恰是不滿足的!通過對題目提供的紅葡萄酒、白葡萄各27種樣本數(shù)據(jù)的計算,在顯著性水平α=0.05下,兩總體的方差都有顯著性差異(例如對紅葡萄酒的計算,在方差是否相等的檢驗檢驗中,第1組樣本方差=53.91,第2組樣本方差=15.82,F(xiàn)=3.14,p 值為 0.002 6,檢驗結果認為兩正態(tài)總體方差不等)。所以直接由上述方法得出的結論是一種很糟糕的結果。

      另一種處理方法:按每一種酒樣(共27個酒樣),對兩組評酒員的打分結果做單因素方差分析,這樣可以得到相應的結果,見表1。

      表1 27個酒樣的兩組評酒員打分的方差分析結果(α=0.05)

      在27個酒樣對應的兩組樣本的方差分析中,當水平α=0.05時,仍有3個不滿足方差齊性的要求(見表1中黑體數(shù)字)。

      即使27個酒樣對應的兩個總體都滿足方差齊性,分析表1中的數(shù)據(jù),發(fā)現(xiàn)大于顯著性水平的數(shù)值共有19個,也就是說給定α=0.05,27種紅葡萄酒評價結果中可以認為無顯著性差異的結果所占的比例為,由此可以認定在給定α=0.05水平下,以0.704的概率接受,兩組評酒員的評價結果無顯著性差異。

      但是當改變一下顯著性水平α的值,比如取α=0.06時,可以發(fā)現(xiàn)大于0.06的結果共有11個,那么無顯著性差異的結果所占的比例為40.7%,和α=0.05相比,比例直接下降了將近30百分點。對兩組評酒員的評價結果無顯著性差異越來越缺乏自信。

      通過上面的分析可以得出,應用上述方差分析的方法(且不說未檢驗兩組樣本的方差齊性!)作出判斷的關鍵變成了α的選取,當α取的較小時(如α≤0.05),得出的結果是兩組評價結果之間沒有顯著性差異,當α取的稍微有些大時(如α=0.06),則得出的結果就是兩組評價結果之間有顯著性差異!

      事實上,假設檢驗難免要犯錯誤,假設犯第1類錯誤[3]的概率為α=0.05,并假設27次檢驗都是獨立進行的,正確接收全部原假設的概率為(1-α)27=0.9527≈7.45 ×10-36,概率幾乎為 0,錯誤的拒絕其中至少一個假設的概率為1-(1-0.05)27,幾乎為1。雖然這種方法看似比第1種方法更合乎邏輯,但實質上解法也是錯誤的。

      用單因素方差分析處理兩組評酒員對27組酒樣的評價結果有無顯著性差異的問題,實質上是兩個正態(tài)總體的方差相等條件下的均值是否相同的檢驗問題,方差分析與t檢驗的方法等價。問題的關鍵在于:27組酒樣有著自身的質量排名,A組10人對每一酒樣打分的平均分所得到的27個樣本不能看作取自同一總體N(μ1,σ2)的樣本;同樣來自B組的27個樣本不能看做取自同一總體N(μ2,σ2)的樣本。即使方差齊性滿足,無論使用這兩種方法中的哪一種,樣本中都參雜了27組酒樣的差異,無法保證得到正確的結論。

      3 配對t檢驗

      兩獨立樣本 t檢驗[4,6]就是根據(jù)樣本數(shù)據(jù)對兩個配對樣本來自的兩總體的均值是否有顯著性差異進行推斷。

      兩配對樣本t檢驗的前提條件:① 需要克服試驗因素帶來的干擾,否則無法區(qū)分結果的差異究竟是兩總體均值的差異還是試驗因素帶來的差異;②樣本來自的兩個總體應該服從正態(tài)分布,或配對數(shù)據(jù)之差服從正態(tài)分布。

      以白葡萄酒為例,設來自A組28個樣本與B組28個樣本的配對數(shù)據(jù)之差為取自“兩組對白葡萄酒評價的差異”這一總體的簡單隨機樣本,假設這個總體服從正態(tài)分布 N(μ,σ2),μ,σ2均未知,檢驗假設H0:μ=0,若拒絕原假設,則認為兩組對白葡萄酒評價有顯著性差異。注意:不要設“A組對白葡萄酒的評分”為一正態(tài)總體N(μ1,σ2),A組28個樣本為取自該總體的樣本,前面已經提及,這種提法本身是有問題的。

      用配對t檢驗方法步驟:① 檢驗配對數(shù)據(jù)之差服從正態(tài)分布;② 進行兩正態(tài)總體均值是否相同的配對t檢驗。

      具體檢驗如下(以白葡萄酒為例)。

      首先通過計算兩組白葡萄酒配對樣本的差值,繼而計算對應的均值、方差,做正態(tài)分布的擬合檢驗。整個計算可通過 SPSS 19.0來完成[5]。檢驗結果見表2。

      表2 擬合檢驗結果

      檢驗結果符合正態(tài)性假設。配對數(shù)據(jù)之差的P-P圖見圖1。

      圖1 配對數(shù)據(jù)之差的P-P圖

      從圖1中可以發(fā)現(xiàn),數(shù)據(jù)分布在直線附近。P-P圖同時也是對上述結論的佐證,因此可以用配對t檢驗進行求解。得到的結果見表3。

      從表3中可以看到概率p值等于0.038,小于0.05,故認為兩組評酒員的評價結果有顯著性差異。對紅葡萄酒進行類似的分析,得到的結果見表4。

      表4中概率 p值為0.021,也小于0.05。

      表3 白葡萄酒配對t檢驗結果

      表4 紅葡萄酒配對t檢驗結果

      兩次檢驗結果都表明:兩組評酒員的評價結果之間存在顯著性的差異,所以有理由相信兩組評酒員的評價結果是存在顯著性差異的。

      4 結束語

      在討論哪一組結果更可信時,有的參賽隊以哪一組評酒打分方差最小來簡單選擇哪一組結果更可信,其實方差小只能說明該組對問題的看法比較一致,只能從一個側面說明問題,但該組打分可能存在系統(tǒng)的偏差(即該組打分與真實排名的差距),這可能是更重要、更要命的問題,處理的常見方法有字典序法[7-9]等。

      統(tǒng)計分析方法繁多,只有充分認識問題是否滿足該統(tǒng)計分析方法的條件時,才能正確地使用該統(tǒng)計分析方法,這是在前期的數(shù)學建模培訓中特別要注意的。

      [1]2012年全國大學生數(shù)學建模競賽試題[EB/OL].http://ishare.iask.sina.com.cn/f/33790432.html.

      [2]何曉群,劉文卿.應用回歸分析[M].北京:人民大學出版社,2007.

      [3]魏宗舒.概率論與數(shù)理統(tǒng)計教程[M].北京:高等教育出版社,2009.

      [4]膝龍.包其郁.配對t檢驗誤區(qū)與率轉化配對t檢驗方法介紹及各自應用范圍[J].醫(yī)學研究通訊,2003,32(7):21-23.

      [5]杜強,賈麗燕.SPSS從入門到精通[M].北京:人民郵電出版社,2011.

      [6]陳佩珍,陸守曾.關于配對t檢驗效能的研究[J].中國衛(wèi)生統(tǒng)計,1996,13(6):19-22.

      [7]司守奎,孫璽菁.數(shù)學建模算法與應用[M].北京:國防工業(yè)出版社,2011.

      [8]明日科技 .Visual C++從入門到精通[M].北京:清華大學出版社,2012.

      [9]龔純,王正林.MATLAB語言常用算法程序集[M].北京:電子工業(yè)出版社,2008.

      猜你喜歡
      假設檢驗總體方差
      方差怎么算
      概率與統(tǒng)計(2)——離散型隨機變量的期望與方差
      用樣本估計總體復習點撥
      2020年秋糧收購總體進度快于上年
      外匯市場運行有望延續(xù)總體平穩(wěn)發(fā)展趨勢
      中國外匯(2019年6期)2019-07-13 05:44:06
      計算方差用哪個公式
      方差生活秀
      直擊高考中的用樣本估計總體
      統(tǒng)計推斷的研究
      時代金融(2017年6期)2017-03-25 12:02:43
      雙冪變換下正態(tài)線性回歸模型參數(shù)的假設檢驗
      普宁市| 仪陇县| 莱州市| 永嘉县| 南昌市| 靖边县| 鱼台县| 岳阳市| 离岛区| 汝南县| 元谋县| 靖远县| 濮阳市| 秀山| 称多县| 江口县| 泰州市| 巫山县| 都江堰市| 临西县| 正安县| 蓝田县| 林芝县| 蒙山县| 上犹县| 屯昌县| 施秉县| 鄂伦春自治旗| 沁源县| 介休市| 昭觉县| 保德县| 绥芬河市| 科尔| 马尔康县| 岚皋县| 集贤县| 临城县| 克什克腾旗| 宜黄县| 朝阳区|