• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      全局檢驗(yàn)與事后檢驗(yàn)之間的聯(lián)系:ANOVA 方差分析中F 檢驗(yàn)結(jié)果的一項(xiàng)調(diào)查

      2018-05-13 19:28:32TianCHENManfeiXUJustiTUHongyueWANGXiaohuiNIU
      上海精神醫(yī)學(xué) 2018年1期
      關(guān)鍵詞:均數(shù)全局均值

      Tian CHEN, Manfei XU, Jus ti n TU, Hongyue WANG, Xiaohui NIU

      1.背景

      組間比較是大多數(shù)生物醫(yī)學(xué)和社會(huì)心理學(xué)研究中常見的問題。 在許多研究中,有兩個(gè)以上的組,在這種情況下,兩個(gè)(獨(dú)立)組的 t 檢驗(yàn)不再適用,必須使用比較兩個(gè)以上組的模型,例如方差分析ANOVA模型[1]。 比較兩個(gè)以上的組時(shí),我們采用分層分析的方法。在這種方法下,首先進(jìn)行全局檢驗(yàn),檢驗(yàn)的零假設(shè)為各組之間無顯著性,即所有組具有相同的均值。如果這個(gè)檢驗(yàn)沒有統(tǒng)計(jì)學(xué)意義,那么在數(shù)據(jù)中沒有證據(jù)表明可以拒絕零假設(shè),然后結(jié)論可以認(rèn)為沒有證據(jù)表明組間有差異。否則,執(zhí)行事后檢驗(yàn)以找出差異來源。

      在事后檢驗(yàn)過程中,我們對(duì)各組進(jìn)行兩兩比較,并找到有顯著差異的所有組別。這種分層分析方法的前提是,如果全局檢驗(yàn)是有顯著性的,那么至少存在兩個(gè)組之間是有顯著差異的,反之亦然。

      分層分析方法在基礎(chǔ)和高級(jí)統(tǒng)計(jì)課程中均有教授,并且內(nèi)置于許多流行的統(tǒng)計(jì)軟件包中。例如,當(dāng)執(zhí)行方差分析(ANOVA)模型來比較多個(gè)組時(shí),全局檢驗(yàn)由F統(tǒng)計(jì)進(jìn)行[1]。 對(duì)于事后檢驗(yàn),可以使用一些特殊的程序,如 Tukey’s 和 Scheffe’s 檢驗(yàn)[1]。執(zhí)行事后檢驗(yàn)需要進(jìn)行特殊的統(tǒng)計(jì)檢驗(yàn),因?yàn)樵趫?zhí)行多重檢驗(yàn)以識(shí)別具有不同均值的組別時(shí),出現(xiàn) I 類錯(cuò)誤的可能性會(huì)增加。Tukey’s,Scheffe’s 和其他事后檢驗(yàn)都進(jìn)行了這種多重比較的調(diào)整,以確保多重檢驗(yàn)中具有正確的 I 類錯(cuò)誤概率。

      然而,在實(shí)踐中,當(dāng)全局檢驗(yàn)是有顯著性時(shí),似乎常常沒有任何事后檢驗(yàn)是有統(tǒng)計(jì)學(xué)意義的。反過來也是如此; 雖然一些事后檢驗(yàn)是有顯著性的,但全局檢驗(yàn)差異并不顯著。據(jù)我們所知,目前并沒有一種普遍接受的方法來處理這種情況。在本次研究中,我們研究了這種分層分析方法,并且使用模擬的數(shù)據(jù)看到它的分析效果。我們想知道一個(gè)有意義的全局檢驗(yàn)是否能保證至少一次事后檢驗(yàn)有意義,反之亦然。盡管比較多個(gè)組的統(tǒng)計(jì)學(xué)問題與所有的統(tǒng)計(jì)模型相關(guān),但我們本次只專注于相對(duì)簡(jiǎn)單的方差分析(ANOVA)模型,并從簡(jiǎn)要概述這種比較兩個(gè)以上組別的普遍分析模型開始。

      2.單因素方差分析(ANOVA)

      2.1 統(tǒng)計(jì)模型

      方差分析(ANOVA)模型被廣泛用于比較多個(gè)組的研究中。 該模型將比較兩個(gè)(獨(dú)立)組的 t 檢驗(yàn)擴(kuò)展至兩個(gè)以上組別之間的比較[1]。

      考慮一個(gè)感興趣的連續(xù)性結(jié)果變量 Y,并讓I表示組數(shù)。 我們對(duì)于比較 I 組間 Y 的(總體)均值感興趣。經(jīng)典的方差分析(ANOVA)模型具有如下形式:

      其中Yij是第 i 組內(nèi)第j個(gè)樣本的結(jié)果,μi= E(Yij)是第 i 組的(總體)均值,εij是誤差項(xiàng),表示均值為μ和方差為σ2的正態(tài)分布,ni是第 i 組的樣本量。

      利用等式(1)中的統(tǒng)計(jì)模型,組間比較的主要目的可以用如下的統(tǒng)計(jì)假設(shè)來表示。首先,我們想知道所有的組別是否有相同的均數(shù)。在上面的方差分析模型下,這種比較的無效假設(shè)和備擇假設(shè)表述如下:

      對(duì)于所有的

      對(duì)于至少一對(duì) i和 k,1 ≤ i ≤ k ≤ I, Hα: μi≠ μk

      因此,在零假設(shè)H0下,所有組的平均值相同。如果拒絕H0支持Hα,那么至少有兩組均數(shù)不同。

      當(dāng)進(jìn)行方差分析時(shí),首先檢驗(yàn)公式(2)中的假設(shè)。如果這個(gè)全局檢驗(yàn)沒有被拒絕,那么可以得出結(jié)論,證據(jù)表明各組間的均數(shù)相同。否則,證據(jù)表明拒絕無效假設(shè)支持備擇假設(shè),然后進(jìn)入下一步,以確定各組間均數(shù)不同。對(duì)于I個(gè)組,總共有 I(I - 1)/2 對(duì)組別需要進(jìn)行檢驗(yàn)。在事后檢驗(yàn)階段,我們進(jìn)行I(I - 1)/2 次檢驗(yàn)來識(shí)別具有不同均數(shù)μi的組。這個(gè)數(shù)字 I(I - 1)/2可能很大,尤其是在有大量組的情況下。因此,執(zhí)行所有這些檢驗(yàn)可能會(huì)增加I類錯(cuò)誤的概率。使用比較兩個(gè)(獨(dú)立)組的流行的 t 檢驗(yàn)此處是不適合的,必須使用專門設(shè)計(jì)的檢驗(yàn)方法來解釋由于多重檢驗(yàn)而產(chǎn)生的累積 I 類錯(cuò)誤,以確保 I 類錯(cuò)誤概率正確。接下來我們回顧一下全局檢驗(yàn)和一些事后檢驗(yàn),這些檢驗(yàn)稍后會(huì)在我們的模擬研究中使用。

      2.2 組間無差異的全局 F 檢驗(yàn)

      在方差分析中同時(shí)比較所有組間均數(shù)的全局檢驗(yàn)是F檢驗(yàn)。 F檢驗(yàn)由所謂的ANOVA表中的變量定義。要建立這個(gè)表格,我們需定義以下變量:

      其中N是總樣本大小,=1Aj表示所有Aj的總和,=1=1Aij表示所有不同i和j的組合Aij之和,即,

      方差分析表由下表定義:

      ?

      在上面的ANOVA表中,SS(R)稱為回歸平方和,SS(E)稱為誤差平方和,SS(Total)稱為總平方和,MS(R)稱為回歸平方和均值,SS(E)被稱為誤差平方和均值。這些平方和表征(1)當(dāng)忽略組內(nèi)均值差異(SS(Total)) 和(2)考慮這些差異(SS(R))后的所有組間變異性。 例如,可以證明

      因此,如果各組均數(shù)能解釋大部分組間差異的變異,則SS(R)將接近SS(TOTAL),SS(E)則較小,在這種情況下,組間均數(shù)可能不同。 否則,SS(R)較小,SS(E)較接近SS(TOTAL),在這種情況下,組間均數(shù)不太可能不同。使用組數(shù)對(duì)SS(R)和使用總樣本大小對(duì)SS(E)進(jìn)行標(biāo)化,可以使用均方MS(R)和MS(E)來量化SS(R) 和SS(E)的相對(duì)差異,來幫助辨別哪組均數(shù)不同。

      在零假設(shè)H0下,比值,或者說F統(tǒng)計(jì)量,,服從以下F-檢驗(yàn):

      其中FI-1,N-1表示服從自由度為 I - 1(分子)和自由度為 N - I(分母)的F分布。 如前所述,相對(duì)于MS(E)的更大的MS(R)表示證據(jù)不支持零假設(shè),反之亦然。這與 F 統(tǒng)計(jì)量的值較大,表示零假設(shè)被拒的事實(shí)一致,反之亦然。

      2.3 事后組間比較的檢驗(yàn)

      如果F檢驗(yàn)拒絕零假設(shè)(無組間差異),則進(jìn)入下一步檢驗(yàn),以識(shí)別具有不同均值的組別。 通過保證I類錯(cuò)誤概率,可以使用多個(gè)專門的程序來執(zhí)行這種事后檢驗(yàn)。 例如,如果所有組的樣本大小相同,即對(duì)于所有 1 ≤ i ≤ I,ni= n,我們可以使用圖基(Tukey)檢驗(yàn)。首先對(duì)各樣本組的平均值進(jìn)行排序,然后根據(jù)下面的標(biāo)準(zhǔn),利用樣本均數(shù)檢驗(yàn)兩組(總體)均數(shù)是否相同,即μi= μK:

      其中 S2= MS(E),qα(I,N - I)是比較 I 組的 studentized range統(tǒng)計(jì)量的上臨界值,N是常用的樣本量大小。

      2.4 模擬研究

      當(dāng)應(yīng)用方差分析比較多個(gè)組時(shí),我們首先執(zhí)行全局F檢驗(yàn),如果全局檢驗(yàn)是顯著的,則進(jìn)行事后兩兩組間比較。否則,我們停止檢驗(yàn)并得出結(jié)論:沒有證據(jù)表明可以拒絕組間無差異的零假設(shè)。該方法隱含的假設(shè)是,有意義的全局檢驗(yàn)意味著至少有一對(duì)組間比較有統(tǒng)計(jì)學(xué)意義,反之亦然。如果這個(gè)假設(shè)不成立,這個(gè)方法將會(huì)(1)產(chǎn)生假陽性(顯著的全局檢驗(yàn),但無顯著的組間成對(duì)檢驗(yàn))或(2)假陰性結(jié)果(沒有顯著的全局檢驗(yàn),但至少有一個(gè)顯著的事后檢驗(yàn))。在第一種情況下,很難在邏輯上調(diào)和這些差異并報(bào)告結(jié)果,而第二種情況也會(huì)導(dǎo)致錯(cuò)失找到組間差異的機(jī)會(huì)。在本節(jié)中,我們使用模擬數(shù)據(jù)來檢驗(yàn)這種分層分析方法所依據(jù)的假設(shè)。

      為了簡(jiǎn)潔并且不失一般性,我們考慮有四個(gè)組并且假定各組樣本大小均為 n。那么,該模擬研究的ANOVA模型為:

      我們假設(shè)前三組具有相同的均值,即μ1= μ2=μ3,它與第四組平均值相差 d,即 μ4= μ + d,其中d>0。 對(duì)于模擬研究,我們?cè)谒心M中假定μ = 1 和σ2= 1 ,但是改變組樣本大小 n 和 I 類錯(cuò)誤概率α,以查看當(dāng)這些參數(shù)變化時(shí)分層分析過程如何變化。

      使用分層分析方法比較各組,我們首先檢驗(yàn)零假設(shè)為四個(gè)組無均值差異的情況:

      Hα:對(duì)于某些 i和 k,μi≠ μk, 1 ≤ i < k ≤ 4

      如果上述零假設(shè)被拒絕,那么我們繼續(xù)執(zhí)行四個(gè)組的成對(duì)比較以識(shí)別彼此顯著不同的組,即,

      在模擬研究假設(shè)中,共進(jìn)行次事后檢驗(yàn)。

      為了查看分層分析對(duì)模擬數(shù)據(jù)的分析效果如何,我們使用蒙特卡羅重復(fù)并將蒙特卡羅樣本大小設(shè)置為M = 1,000。因此,對(duì)于給定的各組樣本大小n,我們根據(jù)公式(3)中的ANOVA模型模擬數(shù)據(jù)Yij,然后執(zhí)行F檢驗(yàn)以檢驗(yàn)公式(4)中各組無均差的零假設(shè)。如果F檢驗(yàn)是有統(tǒng)計(jì)學(xué)意義的,我們通過在公式(5)中執(zhí)行6個(gè)成對(duì)組間比較來進(jìn)行事后檢驗(yàn)過程。

      表1中顯示的是,當(dāng)蒙特卡羅重復(fù)M = 1,000時(shí),作為樣本大小 n、差值 d 和 I 類錯(cuò)誤概率 α 的函數(shù),“F”下顯示的是F檢驗(yàn)對(duì)于檢驗(yàn)無組間均數(shù)差異的零假設(shè)有顯著性的次數(shù)百分比,“Tukey”下顯示的是至少一個(gè)事后Tukey檢驗(yàn)是有顯著性的次數(shù)的百分比。這個(gè)百分比實(shí)際上是效能或經(jīng)驗(yàn)效能的一個(gè)估計(jì)值,表示當(dāng)零假設(shè)為假時(shí)拒絕相應(yīng)的零假設(shè)的能力。由于效能隨著樣本大小以及均值之間的差異而增加,因此當(dāng)α= 0.5和α = 0.001時(shí),樣本量n從20增加到40,并且組間均值的差值 d 從0.5增加到1,百分比增加。而且,正如預(yù)期的那樣,隨著α從α = 0.05降低到α = 0.001,百分比變小。

      比較多個(gè)組別的目的是找出具有不同均值的組別。分層分析方法旨在通過首先執(zhí)行“篩選”檢驗(yàn)來查看是否有必要進(jìn)一步深入研究,詳細(xì)比較各個(gè)組別。從這個(gè)意義上說,我們可以使用由以下定義的“假陽性”(FP)和“假陰性”(FN)率表征分層分析方法的效果:

      FP = Pr(事后檢測(cè)沒有顯著性| F檢驗(yàn)有顯著性),

      FN = Pr(事后檢測(cè)有顯著性| F檢驗(yàn)沒有顯著性),

      其中Pr(B|A)表示給定事件A發(fā)生事件B的概率。因此,F(xiàn)P是在給定F檢驗(yàn)有顯著性的情況下沒有任何事后檢驗(yàn)有顯著性的概率,而FN是給定F檢驗(yàn)無顯著性而至少一個(gè)事后檢驗(yàn)有顯著性的概率。在FP的情況下,我們會(huì)得到一個(gè)錯(cuò)誤警告,而在FN的情況下,我們錯(cuò)過了找到組間差異的機(jī)會(huì)。

      表1中“FP”下所示的是FP的估計(jì)值,即F檢驗(yàn)有顯著性時(shí)事后檢驗(yàn)無顯著性的百分比。有趣的是,當(dāng)α從α = 0.05變?yōu)棣?= 0.001時(shí),F(xiàn)P大大增加。例如,對(duì)于n = 20和d = 0.5,當(dāng)α = 0.05時(shí),F(xiàn)P約為10%,但當(dāng)α = 0.001時(shí),F(xiàn)P增加到接近20%。換句話說,當(dāng)α = 0.05時(shí),我們有大約10%的概率得到一個(gè)錯(cuò)誤警告,但當(dāng)α= 0.001時(shí),我們得到錯(cuò)誤警告的概率近20%。

      表1中“FN”下所示的是FN的估計(jì)值,即F檢驗(yàn)無顯著性時(shí)事后檢驗(yàn)有顯著性的百分比。與FP情況類似,F(xiàn)N也隨著α的變化而變化。但是,與FP不同,當(dāng)α從α = 0.05變?yōu)棣?= 0.001時(shí),F(xiàn)N降低。另外,與FP相比,F(xiàn)N更小。例如,對(duì)于n = 20和d = 0.5,當(dāng)α = 0.05時(shí),F(xiàn)N約為4%,當(dāng)α = 0.001時(shí),F(xiàn)N小于1%。換句話說,當(dāng)α = 0.05時(shí),我們有大約4%的概率得到一個(gè)錯(cuò)誤警告,但當(dāng)α = 0.001時(shí),我們得到錯(cuò)誤警告的概率小于1%。

      3.討論

      在本文中,我們使用模擬數(shù)據(jù)調(diào)查了全局檢驗(yàn)的性能。分層分析方法是比較多個(gè)(多于兩個(gè))組的一種廣泛使用的方法[1]。全局檢驗(yàn)旨在沒有組間差異的情況下通過減少不必要的事后檢驗(yàn)來保證 I 類錯(cuò)誤概率。然而,我們的模擬研究表明,分層分析方法不能保證一直有效。全局檢驗(yàn)和事后檢驗(yàn)并不總是一致的。由于我們比較多個(gè)組的目的是找到具有不同均值的組,所以如果沒有任何事后檢驗(yàn)是有顯著性的,則有顯著性的全局檢驗(yàn)會(huì)給出錯(cuò)誤警告。但是,最重要的是,如果全局檢驗(yàn)無顯著性,我們也可能錯(cuò)過檢驗(yàn)組間差異的機(jī)會(huì),因?yàn)樵谶@種情況下,部分或全部事后檢驗(yàn)可能仍然有顯著性。

      雖然本文中我們聚焦經(jīng)典ANOVA模型,但同樣的考量和結(jié)論也適用于比較多個(gè)組的比較復(fù)雜的模型,如縱向數(shù)據(jù)模型[2]。因?yàn)閷?duì)于大多數(shù)模型而言,針對(duì)多重檢驗(yàn)調(diào)整了顯著水平的事后檢驗(yàn)并沒有像方差分析的情況那樣具有與全局檢驗(yàn)完全相同的 I 類錯(cuò)誤概率,因此評(píng)估分層分析方法的效果將更加困難。例如,Bonferroni修正通常是比較保守的。

      根據(jù)我們的研究結(jié)果,無論全局檢驗(yàn)的顯著性結(jié)果如何,似乎有必要總是進(jìn)行組間比較,并基于這種組間比較進(jìn)行結(jié)果的報(bào)告。

      參考文獻(xiàn)

      1.Kutner MH, Nachtsheim CJ, Neter J, Li W.Applied Linear Models, 5thed.New York: McGraw-Hill/Irwin; 2005

      2.Tang W, He H, Tu XM.Applied Categorical and Count Data Analysis.FL: Chapman & Hall/CRC; 2012

      猜你喜歡
      均數(shù)全局均值
      Cahn-Hilliard-Brinkman系統(tǒng)的全局吸引子
      量子Navier-Stokes方程弱解的全局存在性
      落子山東,意在全局
      金橋(2018年4期)2018-09-26 02:24:54
      均值不等式失效時(shí)的解決方法
      均值與方差在生活中的應(yīng)用
      關(guān)于均數(shù)與偏差
      關(guān)于均值有界變差函數(shù)的重要不等式
      新思路:牽一發(fā)動(dòng)全局
      對(duì)偶均值積分的Marcus-Lopes不等式
      關(guān)于均數(shù)與偏差
      廊坊市| 措美县| 潞城市| 花垣县| 长汀县| 新巴尔虎右旗| 新源县| 高青县| 旺苍县| 衡山县| 嵩明县| 岳普湖县| 鄂托克旗| 平遥县| 通化市| 峨边| 二连浩特市| 建平县| 凤冈县| 沂南县| 抚顺县| 如东县| 宁南县| 青龙| 溆浦县| 依安县| 武功县| 万全县| 吐鲁番市| 林州市| 南郑县| 上饶县| 昌平区| 罗平县| 湟源县| 共和县| 定兴县| 广灵县| 陵水| 博乐市| 林甸县|