• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      方差不齊時(shí)兩組及以上均數(shù)比較時(shí)不同分析方法的穩(wěn)健性和把握度比較

      2016-12-27 08:49:10復(fù)旦大學(xué)公共衛(wèi)生學(xué)院生物統(tǒng)計(jì)教研室衛(wèi)生部衛(wèi)生技術(shù)評(píng)估重點(diǎn)實(shí)驗(yàn)室
      關(guān)鍵詞:穩(wěn)健性均數(shù)樣本量

      復(fù)旦大學(xué)公共衛(wèi)生學(xué)院生物統(tǒng)計(jì)教研室,衛(wèi)生部衛(wèi)生技術(shù)評(píng)估重點(diǎn)實(shí)驗(yàn)室

      蔣 丹 趙耐青

      方差不齊時(shí)兩組及以上均數(shù)比較時(shí)不同分析方法的穩(wěn)健性和把握度比較

      復(fù)旦大學(xué)公共衛(wèi)生學(xué)院生物統(tǒng)計(jì)教研室,衛(wèi)生部衛(wèi)生技術(shù)評(píng)估重點(diǎn)實(shí)驗(yàn)室

      蔣 丹 趙耐青

      目的 本文著重比較秩和檢驗(yàn)、調(diào)整自由度的t′檢驗(yàn)、混合效應(yīng)模型(mixed model)以及方差加權(quán)最小二乘法(VWLS)等方法在方差不齊時(shí),用于兩組/多組獨(dú)立樣本均數(shù)比較時(shí)的穩(wěn)健性和把握度。方法 本文通過(guò)模擬分析方法,分別設(shè)計(jì)總體均數(shù)相等或不等時(shí),在不同標(biāo)準(zhǔn)差和樣本量的條件下,用幾種統(tǒng)計(jì)方法比較2組及3組樣本均數(shù)的Ⅰ類(lèi)錯(cuò)誤和Power度。結(jié)果 (1)證實(shí)樣本量相等時(shí),t檢驗(yàn)對(duì)于方差不齊的2組樣本均數(shù)比較具有穩(wěn)健性,但是樣本量相等方差不齊的3組獨(dú)立樣本均數(shù)比較時(shí),方差分析方法卻不具有穩(wěn)健性。(2)不論是2組還是3組樣本均數(shù)比較,秩和檢驗(yàn)在特定條件下對(duì)于方差不齊具有穩(wěn)健性。(3)兩組方差不齊樣本均數(shù)比較時(shí),t′檢驗(yàn)和mixed model因?yàn)棰耦?lèi)錯(cuò)誤更穩(wěn)健,比VWLS方法更穩(wěn)定,且這三種方法的Power值相互比較接近。(4)三組方差不齊樣本均數(shù)比較,mixed model方法在樣本量較少時(shí)比VWLS方法Ⅰ類(lèi)錯(cuò)誤更穩(wěn)健,但是隨著樣本量增加,這一優(yōu)勢(shì)消失,而VWLS的Power值明顯高于mixed model統(tǒng)計(jì)方法。結(jié)論 2組方差不齊樣本均數(shù)比較時(shí),可以使用t′檢驗(yàn)、mixed model及VWLS等方法,其中首選更為穩(wěn)健的t′檢驗(yàn)、mixed model,3組方差不齊樣本均數(shù)比較時(shí)可以使用mixed model及VWLS等方法,當(dāng)樣本量較小時(shí)首選mixed model方法,樣本量增大時(shí),以VWLS方法更優(yōu)。

      方差不齊 均數(shù)比較 第Ⅰ類(lèi)錯(cuò)誤 把握度

      比較兩組總體均數(shù)是否相同,通常使用t檢驗(yàn)進(jìn)行統(tǒng)計(jì)推斷,比較三組及以上總體均數(shù)是否相同,則可使用ANOVA方差分析。然而,不論t檢驗(yàn)還是ANOVA,均要求數(shù)據(jù)滿(mǎn)足獨(dú)立性、正態(tài)性、方差齊性等前提假設(shè)。而數(shù)據(jù)是否具有獨(dú)立性在研究設(shè)計(jì)時(shí)已經(jīng)明確;大數(shù)定律則告訴我們:在樣本量足夠的情況下不論數(shù)據(jù)本身是否服從正態(tài)分布,樣本均數(shù)的抽樣分布都可以逼近正態(tài)分布[1]。因此,在樣本量較大情況下,偏態(tài)分布的資料也可以用t檢驗(yàn)或方差分析。所以,對(duì)于t檢驗(yàn)或方差分析,樣本資料是否滿(mǎn)足方差齊性就顯得尤為重要。

      倘若方差齊性檢驗(yàn)的統(tǒng)計(jì)學(xué)結(jié)論為方差不齊,則傳統(tǒng)醫(yī)學(xué)統(tǒng)計(jì)教材往往會(huì)給出如下建議:2組總體均數(shù)比較使用調(diào)整自由度的t′檢驗(yàn)或者非參數(shù)統(tǒng)計(jì)分析方法如Wilcoxon秩和檢驗(yàn),3組及以上總體均數(shù)比較使用非參數(shù)統(tǒng)計(jì)分析方法如Kruskal-Wallis檢驗(yàn)。然而,Wilcoxon秩和檢驗(yàn)和Kruskal-Wallis檢驗(yàn)的無(wú)效假設(shè)為:兩個(gè)或多個(gè)樣本來(lái)自同一總體[2]。當(dāng)出現(xiàn)方差不齊情況時(shí),也就是對(duì)應(yīng)的已經(jīng)不是同一總體而是兩個(gè)總體或多個(gè)總體了。此時(shí),如果還用上述秩和檢驗(yàn)就存在明顯的邏輯問(wèn)題,當(dāng)然不排除在特殊情況下,方差不齊對(duì)于秩和檢驗(yàn)也可能是穩(wěn)健的(robust)。正如2組總體均數(shù)比較的情況下,2組樣本量相同,t檢驗(yàn)對(duì)于方差不齊具有穩(wěn)健性[3](即2組樣本量相同情況下,可以忽略方差不齊情況,t檢驗(yàn)仍然有效)。從線性模型的角度考慮,混合效應(yīng)模型(mixed model)和方差加權(quán)最小二乘法(variance-weighted least squares,VWLS)也可以用于方差不齊的2組或多組均數(shù)比較。綜上所述,本文研究目的有二:一是探究方差不齊時(shí),使用以下4種方法比較2組獨(dú)立樣本均數(shù)的穩(wěn)健性和把握度:調(diào)整自由度的t′檢驗(yàn)、Wilcoxon秩和檢驗(yàn)、混合效應(yīng)模型(mixed model)以及方差加權(quán)最小二乘法(VWLS);二是探究方差不齊時(shí),3組及以上獨(dú)立樣本均數(shù)比較用以下3種分析方法的穩(wěn)健性和把握度:混合效應(yīng)模型(mixed model)、Kruskal-Wallis檢驗(yàn)、方差加權(quán)最小二乘法(VWLS)。

      研究方法

      根據(jù)研究目的,有必要對(duì)方差不齊程度、樣本量之比歸類(lèi)來(lái)觀察不同條件下Ⅰ類(lèi)錯(cuò)誤和把握度(power)的大小變化情況,從而對(duì)各種方法的穩(wěn)健性和把握度進(jìn)行比較分析,因而需要在不同的情況下進(jìn)行模擬分析,下面對(duì)各種模擬情境作簡(jiǎn)單介紹。

      A、成組獨(dú)立樣本均數(shù)比較的模擬情境

      A1:設(shè)兩組總體均數(shù)相等為25,總體標(biāo)準(zhǔn)差之比為 1、1.5、2、2.5、3、4,使樣本量之比為 1、2、3、4,在不同情況下產(chǎn)生兩組服從正態(tài)分布的獨(dú)立樣本,觀察Ⅰ類(lèi)錯(cuò)誤大小。

      A2:設(shè)兩組總體均數(shù)不等,第1組為24,第2組為25,總體標(biāo)準(zhǔn)差之比和樣本量之比的考慮同上,在不同情況下產(chǎn)生均服從正態(tài)分布的兩個(gè)獨(dú)立樣本,比較power值大小。

      B、三組獨(dú)立樣本均數(shù)比較的模擬情境

      B1:設(shè)三組總體均數(shù)相等均為25,考慮σ1=σ2<σ3和σ1<σ2<σ32種情形,并考慮3組樣本量相等、3組中有2組樣本量相等、3組樣本量互不相等的三種情況,在不同情形下產(chǎn)生均服從正態(tài)分布的3個(gè)樣本,觀察Ⅰ類(lèi)錯(cuò)誤大小的變化。

      B2:設(shè)三組總體均數(shù)互不相等,分別為24.5、25、25.5,總體標(biāo)準(zhǔn)差和樣本量的考慮同上,得到不同情況下均服從正態(tài)分布的3個(gè)樣本,比較power值大小。

      上述4種模擬情境,在每種情形下獨(dú)立模擬2000次,將Ⅰ類(lèi)錯(cuò)誤α設(shè)為0.05;使用SAS9.3和stata11.0統(tǒng)計(jì)軟件進(jìn)行模擬分析。

      結(jié) 果

      1.兩組獨(dú)立樣本連續(xù)型定量資料比較

      ——使用 t′檢驗(yàn)、VWLS、mixed model和秩和檢驗(yàn)統(tǒng)計(jì)方法

      (1)觀察Ⅰ類(lèi)錯(cuò)誤的變化

      由表1可知 t′檢驗(yàn)、VWLS、mixed model這三種方法始終表現(xiàn)出穩(wěn)健性,Ⅰ類(lèi)錯(cuò)誤大小隨機(jī)波動(dòng),與標(biāo)準(zhǔn)差之比、樣本量之比無(wú)任何關(guān)聯(lián);但是 VWLS統(tǒng)計(jì)方法分析時(shí)Ⅰ類(lèi)錯(cuò)誤的發(fā)生比例高于其他2種方法;此外,表1中t檢驗(yàn)Ⅰ類(lèi)錯(cuò)誤大小的穩(wěn)定性,證實(shí)了文獻(xiàn)中提到的當(dāng)樣本量相等時(shí),t檢驗(yàn)對(duì)方差不齊的穩(wěn)健性;因?yàn)闃颖玖肯嗟葧r(shí)t檢驗(yàn)是mixed model的特例,所以由模擬結(jié)果可知兩種方法的Ⅰ類(lèi)錯(cuò)誤大小完全一致。

      表1 兩組樣本量和總體標(biāo)準(zhǔn)差不同比例下幾種方法Ⅰ類(lèi)錯(cuò)誤比較

      雖然秩和檢驗(yàn)在樣本量相等時(shí)Ⅰ類(lèi)錯(cuò)誤會(huì)隨著標(biāo)準(zhǔn)差之比的擴(kuò)大而增加,但是表1結(jié)果顯示秩和檢驗(yàn)的Ⅰ類(lèi)錯(cuò)誤大小在特定條件下增幅不十分顯著,比如總體標(biāo)準(zhǔn)差之比為2時(shí),Ⅰ類(lèi)錯(cuò)誤發(fā)生的比例增大5%;如果樣本量之比與標(biāo)準(zhǔn)差之比大小變化方向一致,那么隨著兩組樣本量或總體標(biāo)準(zhǔn)差之間差距拉大,Ⅰ類(lèi)錯(cuò)誤呈遞減趨勢(shì)(見(jiàn)表1上半部分),相反地,樣本量之比與總體標(biāo)準(zhǔn)差之比大小變化方向相反,那么隨著差距拉大,Ⅰ類(lèi)錯(cuò)誤呈遞增趨勢(shì)(見(jiàn)表1),其變化幅度與樣本量之比成正比。所以當(dāng)樣本量相等且標(biāo)準(zhǔn)差之比不超過(guò)2時(shí),秩和檢驗(yàn)具有穩(wěn)健性。

      (2)觀察power值的變化

      不論樣本量之比和總體標(biāo)準(zhǔn)差之比大小如何變化,t′檢驗(yàn)、VWLS、mixed model統(tǒng)計(jì)方法的 power值相互都比較接近;秩和檢驗(yàn)當(dāng)樣本量相等和標(biāo)準(zhǔn)差之比不超過(guò)2時(shí),power值同樣靠近其他方法。因?yàn)闃?biāo)準(zhǔn)差之比大于2后秩和檢驗(yàn)不具有穩(wěn)健性,所以power值不被納入比較范疇。

      表2 兩組樣本量和總體標(biāo)準(zhǔn)差不同比例下幾種方法power值比較

      2.三組獨(dú)立樣本連續(xù)型定量資料比較

      ——使用秩和檢驗(yàn)\mixed model\VWLS統(tǒng)計(jì)方法

      (1)觀察Ⅰ類(lèi)錯(cuò)誤變化(3組標(biāo)準(zhǔn)差存在形式如下:σ1=σ2<σ3\σ1<σ2<σ3)

      當(dāng)樣本量相等時(shí),表3和表4的結(jié)果說(shuō)明發(fā)現(xiàn)方差分析、秩和檢驗(yàn)的Ⅰ類(lèi)錯(cuò)誤隨著標(biāo)準(zhǔn)差之比的增加而增加;mixed model方法和VWLS方法的Ⅰ類(lèi)錯(cuò)誤大小穩(wěn)定,且其變化隨機(jī)波動(dòng),與標(biāo)準(zhǔn)差之比無(wú)任何關(guān)聯(lián);但是在表3和表4中,當(dāng)每組樣本量為30時(shí),VWLS方法Ⅰ類(lèi)錯(cuò)誤的發(fā)生比例明顯高于mixed model方法,尤其當(dāng)標(biāo)準(zhǔn)差形式是 σ1<σ2<σ3,由此說(shuō)明當(dāng)樣本量較小時(shí),mixed model方法比VWLS方法對(duì)于方差不齊更為穩(wěn)健。

      遇到樣本量不等時(shí),秩和檢驗(yàn)Ⅰ類(lèi)錯(cuò)誤大體的變化趨勢(shì)如下:當(dāng)樣本量之比和標(biāo)準(zhǔn)差之比大小變化方向一致時(shí),Ⅰ類(lèi)錯(cuò)誤隨著樣本量或者標(biāo)準(zhǔn)差之間差距增大呈現(xiàn)降低趨勢(shì);當(dāng)樣本量之比與標(biāo)準(zhǔn)差之比大小變化方向相反時(shí),Ⅰ類(lèi)錯(cuò)誤隨著樣本量或者標(biāo)準(zhǔn)差之間差距拉大呈現(xiàn)遞增趨勢(shì)(見(jiàn)表3、4后半部分),變化幅度與樣本量之比成正比;表中結(jié)果說(shuō)明了mixed model和VWLS的Ⅰ類(lèi)錯(cuò)誤發(fā)生比例的穩(wěn)定性,與樣本量和標(biāo)準(zhǔn)差之比無(wú)關(guān)聯(lián)的趨勢(shì)性改變。(見(jiàn)表3、4后半部分)。

      表3 3組獨(dú)立樣本在不同情況下幾種方法Ⅰ類(lèi)錯(cuò)誤比較(1)

      *:每種情況重復(fù)獨(dú)立模擬2000次,標(biāo)準(zhǔn)差存在形式為σ1=σ2<σ3

      (2)比較power值大?。?組標(biāo)準(zhǔn)差存在形式如下:σ1=σ2<σ3\σ1<σ2<σ3)

      由表5、表6可知,不論標(biāo)準(zhǔn)差之比和樣本量之比大小如何變化,VWLS方法的 power值始終高于mixed model方法。

      討論與結(jié)論

      從統(tǒng)計(jì)學(xué)背景看,方差不齊的多組獨(dú)立樣本比較已經(jīng)不符合非參數(shù)秩和檢驗(yàn)的原假設(shè)H0,即總體分布相同。當(dāng)方差不齊時(shí),總體分布已經(jīng)為偏離H0假設(shè),為符合H1的情況。所以,方差不齊的程度越大,即越偏離H0假設(shè),Ⅰ類(lèi)錯(cuò)誤越不穩(wěn)健。如本研究發(fā)現(xiàn),當(dāng)樣本量相等時(shí),Ⅰ類(lèi)錯(cuò)誤大小隨方差之比的增加而增加,樣本量不等時(shí),Ⅰ類(lèi)錯(cuò)誤大小隨著樣本量之比的增大而拒絕比例漸漸遠(yuǎn)離檢驗(yàn)水準(zhǔn) α(本研究 α=0.05);然而縱觀 t′檢驗(yàn)、mixed model、VWLS,原假設(shè)是總體均數(shù)相同,方差不齊不屬于這些統(tǒng)計(jì)檢驗(yàn)方法的目標(biāo),且這3種方法容許存在方差不齊的情況而進(jìn)行分析計(jì)算,所以才使得Ⅰ類(lèi)錯(cuò)誤保持穩(wěn)健性,未隨著方差之比的變化而變化。

      從模擬結(jié)果來(lái)看,在表1中樣本量之比為1∶2,標(biāo)準(zhǔn)差之比 3時(shí),t′檢驗(yàn)、mixed model、VWLS的Ⅰ類(lèi)錯(cuò)誤全部增至0.06左右,因?yàn)樯鲜霈F(xiàn)象是獨(dú)立出現(xiàn)的,樣本量之比改變使其恢復(fù)正常,又因?yàn)樵摤F(xiàn)象涉及了研究所用的所有參數(shù)檢驗(yàn)方法,且這些方法的數(shù)學(xué)計(jì)算容許方差不齊的情況存在,因此考慮種子數(shù)設(shè)置引起的誤差所致,調(diào)整模擬所需種子數(shù)后,上述現(xiàn)象消失,Ⅰ類(lèi)錯(cuò)誤回歸至0.05附近(結(jié)果未顯示)。

      方差不齊的2組獨(dú)立樣本均數(shù)比較證實(shí)了樣本量相等的t檢驗(yàn)對(duì)于方差不齊具有穩(wěn)健性,同時(shí)說(shuō)明秩和檢驗(yàn)在樣本量相等、標(biāo)準(zhǔn)差之比不超過(guò)2時(shí)是穩(wěn)健的。因?yàn)?t′檢驗(yàn)、mixed model、VWLS這 3種參數(shù)檢驗(yàn)中,VWLS方法的Ⅰ類(lèi)錯(cuò)誤發(fā)生比例最大,所以mixed model和t′檢驗(yàn)比VWLS方法更穩(wěn)健,并且這三種方法的把握度又相互接近,所以t′檢驗(yàn)和mixed model方法更優(yōu)。

      當(dāng)方差不齊的3組獨(dú)立樣本均數(shù)比較時(shí),證實(shí)當(dāng)樣本量相等時(shí),方差分析對(duì)于方差不齊是不穩(wěn)健的,此結(jié)果與ROGAN文中的結(jié)果一致[4]。而秩和檢驗(yàn)在樣本量相等、方差之比較小如不超過(guò)2時(shí)才算穩(wěn)健,Ⅰ類(lèi)錯(cuò)誤偏頗不至太大。

      3組獨(dú)立樣本均數(shù)比較的模擬結(jié)果顯示,當(dāng)樣本量偏小時(shí),VWLS方法Ⅰ類(lèi)錯(cuò)誤發(fā)生比例易過(guò)大增至0.06左右,主要是因?yàn)閂WLS的加權(quán)方差由樣本的方差決定,所以樣本量較小時(shí)方差偏差較大,導(dǎo)致Ⅰ類(lèi)錯(cuò)誤發(fā)生比例增大;因?yàn)閙ixed model方法的Ⅰ類(lèi)錯(cuò)誤仍在0.05(本研究設(shè)置的α值)附近,所以樣本量較小時(shí)mixed model更穩(wěn)??;但是樣本量增加使VWLS的Ⅰ類(lèi)錯(cuò)誤大小恢復(fù)至設(shè)定值附近,又因?yàn)閂WLS的把握度明顯高于mixed model,這時(shí)以VWLS方法更優(yōu)。

      表4 3組獨(dú)立樣本在不同情況下幾種方法Ⅰ類(lèi)錯(cuò)誤比較(2)

      表5 3組獨(dú)立樣本在不同情況下幾種方法的power值大?。?)

      表6 3組獨(dú)立樣本在不同情況下幾種方法的Power值大小(2)

      [1]趙耐青,陳鋒主編.衛(wèi)生統(tǒng)計(jì)學(xué).北京:高等教育出版社,2008:49-61.

      [2]方積乾主編.衛(wèi)生統(tǒng)計(jì)學(xué).北京:人民衛(wèi)生出版社,2008:177-192.

      [3]Posten HO,ChengHY,Owen DB,et al.Robustness of the two-sample t-test under violations of the homogeneity of variance assumption.Communications in Statistics Theory and Methods,1982,11(2):109-126.

      [4]Rogan JC,Keselman HJ.Is the ANOVA F-Test Robust to Variance Heterogeneity When Sample Sizes Are Equal?:An Investigation via a Coefficient of Variation.American Educational Research Journal,1977,14(4):493-498.

      A Comparison of Different Statistical Methods of Their Robustness and Power When Analyzing the Population Mean Difference of Unequal-variance Data

      Jiang Dan,Zhao Naiqing
      (Biostatistical Department of Public Health School of Fudan University;Key Lab of Health Technology Assessment,Ministry of Health(Fudan University),(200032)Shanghai)

      Objective To compare the Type I error and power of different statistical methods,such as Rank Sum Test/t′test/Mixed Model and VWLS,for analyzing independent unequal variance data.Methods Under the hypothesis of equal population means and unequal population means,two/three independent groups with various ratios of standard deviation and sample size are simulated and compared using above statistical ways for thousands of times to acquire their each Type I Error and Power.Results (1)t test is robust to unequal variance data with equal sample size.However,ANOVA lacks its robustness to unequal variance data with equal sample size.(2)The method of Rank Sum Test is robust to unequal variance data only when special conditions are met.(3)t′test and Mixed Model are better than VWLSbecause of their model stable Type I Error when analyzing independent samples with unequal variance.Plus,the Power of these method is very close to each other.(4)When analyzing three independent unequal variance groups,Mixed Model is more robust than VWLS if the sample size is small;with the size getting bigger,VWLS gets robust and is better than Mixed Model for higher power.Conclusion When it comes to the analysis of two independent quantitative samples with unequal variance,t′test/Mixed Model/VWLS all can be used but the first two methods are better.When it comes to the analysis of three or more unequal variance groups,Mixed Model is better than VWLSunder the situation of small sample size,but with the size getting bigger,VWLSis getting better than Mixed Model.

      Unequal variance;Means compare;Type I error;Power

      郭海強(qiáng))

      猜你喜歡
      穩(wěn)健性均數(shù)樣本量
      醫(yī)學(xué)研究中樣本量的選擇
      會(huì)計(jì)穩(wěn)健性的定義和計(jì)量
      商情(2019年3期)2019-03-29 12:04:52
      航空裝備測(cè)試性試驗(yàn)樣本量確定方法
      會(huì)計(jì)穩(wěn)健性的文獻(xiàn)綜述
      財(cái)訊(2018年22期)2018-05-14 08:55:57
      Sample Size Calculations for Comparing Groups with Binary Outcomes
      貨幣政策、會(huì)計(jì)穩(wěn)健性與銀行信貸關(guān)系探析
      關(guān)于均數(shù)與偏差
      Effect of Ammonia on the Performance of Catalysts for Selective Hydrogenation of 1-Methylnaphthalene
      關(guān)于均數(shù)與偏差
      關(guān)于均數(shù)與偏差
      沅江市| 邯郸县| 大洼县| 高邮市| 玉门市| 鸡东县| 千阳县| 汉阴县| 平顶山市| 桂东县| 隆德县| 信阳市| 嘉黎县| 柞水县| 大同县| 忻城县| 盘山县| 易门县| 塘沽区| 涞水县| 连南| 武陟县| 闽清县| 财经| 靖江市| 米脂县| 贵阳市| 新乡县| 神木县| 黑山县| 双鸭山市| 巫山县| 泰兴市| 彭泽县| 西丰县| 丹凤县| 尼木县| 白银市| 金沙县| 桓台县| 屯留县|