王北琪 汪 鵬 尹 平 周基元△
【提 要】 目的 提出一種適用于偏態(tài)分布的多樣本變異系數(shù)比較的平方秩檢驗,并與現(xiàn)有的D’AD與SRT方法進行模擬比較。方法 借鑒Levene檢驗的構造思想,對原始數(shù)據(jù)做一種新的變換,由此構造出一種適用于偏態(tài)分布的多樣本變異系數(shù)比較的MSRT檢驗統(tǒng)計量。在不同參數(shù)設置下,經過Monte Carlo模擬,比較新提出方法與現(xiàn)有方法的第一類錯誤率。同時,將新提出方法與現(xiàn)有方法應用于鉛致肝損傷指標的數(shù)據(jù),對這些方法做進一步的比較。結果 MSRT方法可以避免D’AD方法對樣本正態(tài)分布假設的依賴;相比于SRT方法,在偏態(tài)分布下,MSRT方法可以更好地控制第一類錯誤率。在對鉛致肝損傷指標γ-GT與ALT的變異系數(shù)的比較分析中,三種方法對兩個指標的分析結果存在差異。結論 MSRT方法是一種穩(wěn)健且普遍適用的可靠方法。
為消除數(shù)據(jù)間量綱不同的影響,通常使用變異系數(shù)(coefficient of variation,CV)比較兩組或多組數(shù)據(jù)間的離散程度[1-2]。在醫(yī)學指標的篩選中,一般認為變異系數(shù)大的指標更加重要,因此可以通過比較多樣本變異系數(shù)來判斷指標的穩(wěn)健性與敏感性[3]。目前,比較多樣本變異系數(shù)是否存在差異的方法主要有三種:D’AD方法[4]、LRT方法[5]和SRT方法[6],其中D’AD方法與LRT方法均要求樣本服從正態(tài)分布,并且D’AD方法由于其形式簡單而且檢驗效能高,因而比LRT方法使用更廣泛。然而,當數(shù)據(jù)不是嚴格服從正態(tài)分布時,D’AD方法與LRT方法的第一類錯誤率可能會膨脹。因此,Miller提出了SRT方法[6],雖然該方法適用于服從偏態(tài)分布的數(shù)據(jù),但是其第一類錯誤率仍然偏高,從而非常有必要提出一種適用于偏態(tài)分布數(shù)據(jù)而且能很好地控制第一類錯誤率的多樣本變異系數(shù)比較的方法[7]。因此,本文將提出一種適用于偏態(tài)分布數(shù)據(jù)的多樣本變異系數(shù)比較的方法,并與現(xiàn)有的D’AD、SRT方法的第一類錯誤率進行模擬比較,同時將這些方法應用于鉛致肝損傷指標數(shù)據(jù),對這些方法做進一步的比較。
用于做方差齊性檢驗的Levene檢驗被證實是一種穩(wěn)健的方法[8]。多樣本變異系數(shù)比較的SRT方法就是基于Levene檢驗的構造思想構建出來的。具體而言,設X為隨機變量,則由變異系數(shù)的定義可得
(1)
通過改變正態(tài)分布μ、σ2的值來獲得不同的CV值;通過改變均勻分布a、b的值來獲得不同的CV值;類似地,shiftχ2分布χ2(n,δ)中固定n值為4,shift gamma分布G(k,λ,δ)中固定k= 4、λ= 1,改變形狀系數(shù)δ取值以得到不同的變異系數(shù)CV值。模擬數(shù)據(jù)分別從正態(tài)分布、均勻分布、shiftχ2(4)分布與shift gamma(4,1) 分布中進行抽樣。
四種方法在四種分布下針對不同樣本量和變異系數(shù)設置的第一類錯誤率結果見表1。由表1知,在正態(tài)分布下,D’AD方法能很好地控制第一類錯誤率;對均勻分布,D’AD方法的第一類錯誤率偏保守。對Shiftχ2(4)分布與Shift gamma(4,1)分布,當CV≤0.20時,D’AD方法的第一類錯誤率會膨脹;當CV=0.50時,其第一類錯誤率又偏保守。當CV=0.50且分布為Shiftχ2(4)分布與Shift gamma(4,1)分布時,SRT方法能很好地控制第一類錯誤率,其他情況下其第一類錯誤率會膨脹。對于新提出的MSRT方法,當分布為對稱分布時,MSRT1方法的第一類錯誤率均被控制在0.05附近;當分布為偏態(tài)分布時,所有方法中MSRT2方法的第一類錯誤率控制得最好,然而部分情況下其第一類錯誤率仍會偏保守。
在鉛中毒導致肝損傷研究中[9],為評價鉛致肝損傷的最佳診斷指標,采用平行對照的動物實驗。將65只小白鼠隨機分為4組,分別為陰性對照組、10mg/kg鉛組、30mg/kg鉛組和60mg/kg鉛組,樣本量分別為17、16、16和16。獲取小白鼠γ-GT與ALT指標數(shù)據(jù),其描述統(tǒng)計量見表2。由于樣本量較小,且原始數(shù)據(jù)變異較大,所以考慮截取兩側10%的數(shù)據(jù)后用樣本均數(shù)估計位置參數(shù)。分別用D’AD、SRT和MSRT1方法比較兩指標組間變異系數(shù),結果見表3。
表1 不同CV值D’AD、SRT、MSRT1和MSRT2方法第一類錯誤率模擬比較
表2 鉛中毒大鼠血清肝酶活力(nkat/L)變化
表3 γ-GT與ALT組間變異系數(shù)檢驗結果
結果顯示,D’AD方法在γ-GT的組間變異系數(shù)比較中結果最為保守(χ2=1.12,P=0.772),而在ALT的結果中最為敏感(χ2=46.59,P=4.250×10-10)。對γ-GT指標,SRT方法的P值小于0.05(χ2=9.13,P=0.028),MSRT1方法的P值大于0.05(χ2=7.22,P=0.065);對ALT指標,SRT方法與MSRT1方法的P值均小于0.05。根據(jù)以上三種方法的結果,ALT的變異系數(shù)在不同劑量組間差異有統(tǒng)計學意義,但是尚不能認為 γ-GT變異系數(shù)在各組之間存在差異。接下來使用MSRT1方法對γ-GT與ALT的變異系數(shù)在組內是否存在差異進行檢驗,結果見表4。由MSRT1方法的檢驗結果可知,除了60mg/kg鉛組內γ-GT與ALT的變異系數(shù)之間差異無統(tǒng)計學意義外 (χ2=1.32,P=0.250),其余各組的γ-GT與ALT變異系數(shù)之間差異均有統(tǒng)計學意義。
表4 γ-GT與ALT在不同組別內的變異系數(shù)比較的檢驗結果
多樣本變異系數(shù)的比較可以廣泛應用于醫(yī)學、經濟學等領域?,F(xiàn)有的方法中,目前應用較多的是D’AD方法與SRT方法,然而當樣本服從偏態(tài)分布時,其第一類錯誤率會膨脹。因此,本文提出適用于各種分布的多樣本變異系數(shù)比較的MSRT方法。模擬結果顯示,MSRT方法對所有對稱分布,不論變異系數(shù)和樣本量的大小,其第一類錯誤率都可以控制在預設的檢驗水平附近;在偏態(tài)分布下用中位數(shù)估計位置參數(shù)的MSRT2方法的第一類錯誤率被控制得最好。因此,本文提出的MSRT2方法適用于各種分布,是一個較為穩(wěn)健、可靠的比較多樣本間變異系數(shù)的方法。