胡純嚴 ,胡良平 ,2*
(1.軍事科學院研究生院,北京 100850;2.世界中醫(yī)藥學會聯(lián)合會臨床科研統(tǒng)計學專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
為了分析來自病例對照研究設計的g×2×2表資料,需要完成以下4項任務:其一,檢驗各層2×2表資料的優(yōu)勢比是否滿足齊性;其二,估計共同優(yōu)勢比的數(shù)值;其三,估計共同優(yōu)勢比的置信區(qū)間;其四,檢驗共同優(yōu)勢比是否等于1。本文將對后三項任務有關內容進行介紹。
設高維表g×2×2表的表達模式如下,見表1。
表1 病例對照研究設計下g×2×2表的第h層2×2表資料的表達模式
在分析“病例對照研究設計”的二維表資料時,可以很方便地依據(jù)公式“OR=ad/bc”計算出優(yōu)勢比OR的數(shù)值。然而,對于“g×2×2表資料”,卻無法直接計算出OR的數(shù)值。從概念上來說,似乎可以采取某種舉措,將“g×2×2表資料”降維或壓縮成一個“2×2表資料”。但事實上,這種理想的“2×2表資料”是無法直接呈現(xiàn)出來的。于是,統(tǒng)計學家通過統(tǒng)計學方法來體現(xiàn)出各層“2×2表資料”之間的“微小差別”,這就是求出各層“2×2表資料”的“權重系數(shù)wh”。通過它將各層“2×2表資料”進行加權平均,從而間接獲得合并后的優(yōu)勢比OR的數(shù)值。在SAS/STAT的FREQ過程中,將其稱為“common odds ratios”[1],常譯成“共同或普通或合并優(yōu)勢比”。
基于“g×2×2表資料”計算共同優(yōu)勢比的前提條件是高維表資料應滿足齊性,針對“優(yōu)勢比”,檢驗高維表資料是否滿足齊性的檢驗方法有5種,分別是“Breslow-Day檢驗”“Breslow-Day-Tarone檢驗”“Q檢驗”“I2度量統(tǒng)計量及其不確定性限值”和“Zelen's精確檢驗”。
SAS/STAT中的FREQ過程[1]采用3種方法估計共同優(yōu)勢比及置信區(qū)間,分別是:①校正的計算方法,Mantel-Haenszel估計法;②校正的計算方法,logit估計法;③基于條件分布的精確法。
2.1.1 高維表資料優(yōu)勢比分析的具體內容
高維表資料優(yōu)勢比分析的具體內容包括以下4項[1]:其一,檢驗資料是否滿足齊性要求;其二,估計共同優(yōu)勢比;其三,估計共同優(yōu)勢比的置信區(qū)間;其四,檢驗共同優(yōu)勢比是否等于1。
2.1.2 高維表資料共同優(yōu)勢比的點估計及置信區(qū)間估計
2.1.2.1 Mantel-Haenszel估計量
基于Mantel-Haenszel估計量(簡稱MH估計量)估計高維表資料共同優(yōu)勢比,見式(1):
注意:當nh較小時,MH估計量不如logit估計量敏感。
2.1.2.2 Logit估計量
Woolf于1955年提出了logit估計量[1],見下式:
式(7)中,ORh是第h層的優(yōu)勢比,其100(1-α)%置信區(qū)間見下式:
在式(7)和式(8)中,wh是第h層的權重系數(shù),其定義見下式:
在式(9)中,Var[ln(ORh)]的定義見下式:
當?shù)趆層的表格中出現(xiàn)0頻數(shù)時,在計算ORh和wh之前,需要給該層的所有格加上 0.5[1]。
2.1.3 高維表資料共同優(yōu)勢比的精確置信區(qū)間估計
假定所有各層2×2表的優(yōu)勢比是一個常數(shù)。精確置信限的構造原理:在各層2×2表的邊際總數(shù)固定的條件下,基于S=∑hnh11的分布來構造精確置信限。精確置信區(qū)間的精度:Agresti于1992年指出,由于擬解決的問題是一個離散問題,所以,所構造的精確置信區(qū)間的“置信水平”不會恰好等于100(1-α)%,但至少是100(1-α)%。因此,所求得的置信限是保守的[1]。精確置信限算法的來源:SAS/STAT中的FREQ過程計算共同優(yōu)勢比的置信限是依據(jù)Vollset、Hirji和Elashoff于1991年提出的算法,還可參考Mehta、Patel和Gray于1985年發(fā)表的有關文獻[1]。
算法的詳細描述:在第h層2×2表的邊際總數(shù)固定的條件下,讓隨機變量Sh代表第h層2×2表中(1,1)網(wǎng)格內的頻數(shù)。給定行合計nh1·、nh2·,列合計nh·1、nh·2,Sh的下限與上限是 lh、uh,則它們的計算公式分別見式(11)和式(12):
讓s0代表所有q張表第(1,1)格上頻數(shù)之和。通過迭代計算方法求解下列兩個方程中的共同優(yōu)勢比置信限的下限值與上限值,φ1與 φ2,見式(16)、式(17):
當觀測結果的和s0等于下界l時,SAS/STAT中的FREQ過程就將置信限的下限設置為0,并基于顯著性水平α來決定置信限的上限值;同理,當觀測結果的和s0等于上界u時,SAS/STAT中的FREQ過程就將置信限的上限設置為∞,并基于顯著性水平α來決定置信限的下限值。
2.1.4 高維表資料共同優(yōu)勢比是否等于1的精確檢驗
在運用SAS/STAT中的FREQ過程時,若在exact語句中使用了選項“COMOR”,該過程可以計算精確檢驗。設φ=1,在無效假設成立的條件下,S的條件分布變成如下形式:
在無效假設成立且滿足分層2×2表的邊際固定的條件下,這個精確檢驗的點概率就是觀測和s0出現(xiàn)的概率,這個概率可以用P0(s0)表示。在無效假設成立的條件下,S的期望值由下式定義:
單側精確概率P值(記為P1)可從條件分布P0(S≥s0)或P0(S≤s0)計算得到,取決于觀測結果的和s0大于還是小于E0(S),分別見下式:
基于下面3種定義,可分別計算出雙側精確概率P值(記為P2)。
定義1:雙側概率為單側概率的2倍。若該值超過1,將其設置為1。見下式:
定義2:雙側概率為所有小于等于觀測結果的和s0的點概率的概率之和,求和范圍是s的所有可能取值,即l≤s≤u,公式如下:
定義3:雙側概率為單側P值與分布的對側尾端(與期望值等距)相對應的面積之和,計算公式如下:
2.2.1 問題與數(shù)據(jù)
【例1】文獻[2]提供了如下資料,試對5項研究的共同優(yōu)勢比進行分析。見表2。
表2 吸煙與肝細胞癌關系的5項病例對照研究結果
【例2】文獻[2]提供了如下資料,試對6項研究的共同優(yōu)勢比進行分析。見表3。
表3 鼻咽癌與EB病毒感染關系的6項病例對照研究結果
2.2.2 共同優(yōu)勢比分析的SAS實現(xiàn)
【例3】沿用例1中的“問題與數(shù)據(jù)”,試對5項研究的共同優(yōu)勢比進行分析。
【分析與解答】設所需要的SAS程序如下:
【程序說明】“exact語句”中的選項“eqor”要求對各層優(yōu)勢比OR是否滿足齊性進行Zelen's精確檢驗;選項“comor”要求對共同優(yōu)勢比進行精確檢驗。
【SAS輸出結果及解釋】
以上輸出的是“普通優(yōu)比和相對風險”的計算結果,其中,“普通優(yōu)比”也叫做“共同優(yōu)比”。實際上,就是基于“Mantel-Haenszel法”和“l(fā)ogit法”計算出來的校正“共同優(yōu)比”的估計值及其95%置信區(qū)間。在本例中,因95%置信區(qū)間不包含1,說明共同優(yōu)比與1之間的差別具有統(tǒng)計學意義。
此處原本是各層2×2表優(yōu)比齊性檢驗結果,結果顯示,此資料滿足齊性(這部分計算結果在本期“科研方法專題”的《如何正確運用χ2檢驗——高維表資料齊性檢驗與SAS實現(xiàn)》中已經(jīng)呈現(xiàn)了,限于篇幅,此處從略)。關于共同優(yōu)比的估計和置信區(qū)間的計算,直接利用前面的“校正計算結果”即可。但在SAS/STAT的FREQ過程中,還可采取精確計算法,以獲得更加可靠的計算結果如下:
以上輸出的是共同優(yōu)比的點估計值及其精確置信區(qū)間,因95%置信區(qū)間不包含1,說明共同優(yōu)比與1之間的差別具有統(tǒng)計學意義。
以上輸出的是關于共同優(yōu)比是否等于1的精確檢驗結果。其中,“S=307”是高維表資料中各層2×2表中第(1,1)格上頻數(shù)之和;“SH0=345.0348”是 H0(即“共同優(yōu)比=1”)成立條件下推導出各層2×2表中第(1,1)格上頻數(shù)之和;點概率P(S=307)=0.0002,與其對應的單側概率為0.0008;與其對應的雙側概率P2有3個,分別基于不同的定義而算得,即基于定義1,得=0.0016;基于定義2,得=0.0016;基于定義3,得=0.0014。
【結論】無論是基于單側檢驗還是雙側檢驗,所得P值都小于0.01,說明應拒絕H0(即“共同優(yōu)比=1”),接受H1(即“共同優(yōu)比≠1”)。因優(yōu)比的點估計值為0.7836(MH法),說明吸煙組的優(yōu)勢(odd值)小于不吸煙組的優(yōu)勢(odd值);更明確的專業(yè)結論是:吸煙者患肝細胞癌的風險小于不吸煙者患肝細胞癌的風險(注意:這個結論與臨床專業(yè)知識不相符,具體原因可能是原始資料中存在過失誤差,有待進一步核實)。
【例4】沿用例2中的“問題與數(shù)據(jù)”,試對6項研究的共同優(yōu)勢比進行分析。
【分析與解答】設所需要的SAS程序如下:
【SAS輸出結果及解釋】
以上輸出的是“普通優(yōu)比和相對風險”的計算結果,其中,“普通優(yōu)比”也叫做“共同優(yōu)比”。實際上,就是基于“Mantel-Haenszel法”和“l(fā)ogit法”計算出來的校正“共同優(yōu)比”的估計值及其95%置信區(qū)間。在本例中,因95%置信區(qū)間不包含1,說明共同優(yōu)比與1之間的差別具有統(tǒng)計學意義。
此處原本是各層2×2表資料優(yōu)比齊性檢驗結果,結果顯示,此資料不滿足齊性(這部分計算結果在本期“科研方法專題”的《如何正確運用χ2檢驗——高維表資料齊性檢驗與SAS實現(xiàn)》中已經(jīng)呈現(xiàn)了,限于篇幅,此處從略)。關于共同優(yōu)比的估計和置信區(qū)間的估計,通常的做法是基于隨機效應模型推導出的公式進行計算。而在SAS/STAT的FREQ過程中,采取精確計算法,輸出結果如下:
以上輸出的是共同優(yōu)比的點估計值及其精確置信區(qū)間,因95%置信區(qū)間不包含1,說明共同優(yōu)比與1之間的差別具有統(tǒng)計學意義。
以上輸出的是關于共同優(yōu)比是否等于1的精確檢驗結果。其中,“S=242”是高維表資料中各層2×2表中第(1,1)格上頻數(shù)之和;“SH0=201.3895”是 H0(即“共同優(yōu)比=1”)成立條件下推導出各層2×2表中第(1,1)格上頻數(shù)之和;點概率P(S=242)<0.0001,與其對應的單側概率<0.0001;與其對應的雙側概率P2有3個,分別基于不同的定義而算得,即基于定義1,得<0.0001;基于定義2,得<0.0001;基于定義3,得<0.0001。
【結論】無論是基于單側檢驗還是雙側檢驗,所得P值都小于0.0001,說明應拒絕H0(即“共同優(yōu)比=1”),接受H1(即“共同優(yōu)比≠1”)。因優(yōu)比的點估計值為3.2135(MH法),說明EB陽性組的優(yōu)勢(odd值)大于EB陰性組的優(yōu)勢(odd值);更明確的專業(yè)結論是:EB陽性者患鼻咽癌的風險大于EB陰性者患鼻咽癌的風險。
欲基于g×2×2表資料求共同優(yōu)勢比,需要先檢驗資料是否滿足齊性要求,即檢驗各層2×2表資料所對應的優(yōu)勢比是否相等。常規(guī)的做法[2-8]如下:若資料滿足齊性要求,可基于固定效應模型推導出的公式估計優(yōu)勢比及其置信區(qū)間;若資料不滿足齊性要求,可基于隨機效應模型推導出的公式估計優(yōu)勢比及其置信區(qū)間。然而,在SAS/STAT的FREQ過程中,若資料滿足齊性要求,可通過CMH χ2檢驗方法給出校正的計算結果,包括“校正的共同優(yōu)勢比的點估計值”及其“校正的95%置信區(qū)間”;若資料不滿足齊性要求,可通過各層2×2表中(1,1)網(wǎng)格內的頻數(shù)的條件分布來構造計算公式,可求得“共同優(yōu)勢比的精確點估計值”“精確95%置信區(qū)間”以及“共同優(yōu)勢比是否等于1”的精確單側概率和精確雙側概率。
本文對g×2×2表資料進行了優(yōu)勢比分析,其全部內容包括“各層2×2表資料齊性檢驗”“共同優(yōu)勢比的點估計和置信區(qū)間估計”和“共同優(yōu)勢比是否等于1的假設檢驗”。從計算的角度來看,內容涉及“校正算法”和“精確算法”。通過兩個實例,演示了基于SAS軟件實現(xiàn)優(yōu)勢比分析的內容,并對結果進行了解釋,做出了統(tǒng)計和專業(yè)結論。