胡純嚴(yán),胡良平,2*
(1. 軍事科學(xué)院研究生院,北京 100850;2. 世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計(jì)學(xué)專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu927@163.com)
在分析“人-時(shí)間資料”時(shí),若基于“人-年數(shù)”,在所考察的處理因素分別處于“暴露”與“非暴露”水平下,求出兩組受試對象各自的“發(fā)病密度”之后,再求出兩“發(fā)病密度”之比,就獲得了“率比”[1],它類似于分析通常四格表資料所采用的效應(yīng)指標(biāo)“相對危險(xiǎn)度”或“優(yōu)勢比”[2-5];但在文獻(xiàn)[6]中,直接將“率比”稱為“相對危險(xiǎn)度”。本文將介紹與“率比分析”有關(guān)的內(nèi)容以及基于SAS 軟件實(shí)現(xiàn)計(jì)算的方法。
分層人-時(shí)間資料的列表格式見表1。
表1 分層人-時(shí)間資料的列表格式
第i層“率比”是該層中“暴露水平”下的“發(fā)病密度(α1i/t1i)”與“非暴露水平”下的“發(fā)病密度(α2i/t2i)”之比值,相當(dāng)于通常定性資料中的“相對危險(xiǎn)度”或“優(yōu)勢比”[2-5]。計(jì)算方法見式(1):
第i層率比RRi的100(1-α)%置信區(qū)間的計(jì)算見式(2):
為了將各層資料合并起來估計(jì)“合并率比”,資料需滿足的前提條件是各層率比相等,這就需要進(jìn)行不同層間率比的齊性檢驗(yàn)[1,6]。設(shè)分層因素共有K個(gè)水平,齊性檢驗(yàn)的檢驗(yàn)假設(shè)如下:
H0:RR1=RR2=…=RRk;H1:至少兩個(gè)層的RRi不同;α=0.05。
檢驗(yàn)統(tǒng)計(jì)量見式(5):
式(5)中,RRi為第i層率比[見式(1)];Wi為第i層權(quán)重,RR為合并率比,其計(jì)算分別見式(6)、式(7):
在式(6)中,Var[ln(RRi)]為ln(RRi)的方差,計(jì)算方法見式(8):
在式(7)中,指數(shù)C的計(jì)算方法見式(9):
當(dāng)各層率比滿足齊性要求時(shí),可以對合并率比進(jìn)行點(diǎn)估計(jì)和置信區(qū)間估計(jì)[1,6]。合并率比的點(diǎn)估計(jì)見式(7)和式(9);合并率比的100(1-α)%置信區(qū)間估計(jì)見式(10):
文獻(xiàn)[1]提供了一個(gè)分層人-時(shí)間資料,見表2。
表2 絕經(jīng)后期婦女是否使用口服避孕藥(OC)患乳腺癌情況的調(diào)查結(jié)果
【例1】試分析表2 資料中“過去使用OC”與“從不使用OC”兩組婦女各年齡組中,乳腺癌發(fā)病的率比是否滿足齊性要求。
【分析與解答】設(shè)所需要的SAS程序[6-7]如下:
以上輸出結(jié)果為:χ2het=0.30263、P=0.98964,說明各層率比滿足齊性要求。
【例2】如表2資料,試分析“過去使用OC”與“從不使用OC”兩組婦女各年齡組中乳腺癌發(fā)病的率比點(diǎn)估計(jì)及置信區(qū)間估計(jì);進(jìn)而求“過去使用OC”與“從不使用OC”兩組婦女乳腺癌發(fā)病合并率比的點(diǎn)估計(jì)及置信區(qū)間估計(jì)。
【分析與解答】設(shè)所需要的SAS程序[6-7]如下:
【SAS輸出結(jié)果及解釋】
以上輸出結(jié)果是5 個(gè)年齡組各自率比(RR_a)及其95%置信區(qū)間的下限(c_low)與上限(c_up)的估計(jì)值,5個(gè)置信區(qū)間都包含1,說明各年齡組“過去使用OC”與“從不使用OC”的婦女乳腺癌發(fā)病率比與1 之間差異無統(tǒng)計(jì)學(xué)意義,即各層中“過去使用OC”與“從不使用OC”的婦女乳腺癌發(fā)病密度相等。
以上輸出結(jié)果是合并率比(RR)及其95%置信區(qū)間下限(c_low)和上限(c_up)的估計(jì)值。
【統(tǒng)計(jì)結(jié)論和專業(yè)結(jié)論】由以上輸出可知,置信區(qū)間包含1,說明“過去使用OC”與“從不使用OC”兩組婦女乳腺癌發(fā)病率比與1 之間差異無統(tǒng)計(jì)學(xué)意義,即整體而言,“過去使用OC”與“從不使用OC”的婦女乳腺癌發(fā)病密度相等。
假設(shè)有一個(gè)暴露變量(或危險(xiǎn)因素)E,而E有k個(gè)水平,第j個(gè)暴露水平組用得分Sj表示,這個(gè)Sj可以是該組內(nèi)平均暴露水平,如果沒有明顯的計(jì)分方法,也可以用整數(shù)1,2,…,k代表k個(gè)計(jì)分。見表3。
表3 有k個(gè)暴露水平的分層的人-時(shí)間資料的列表格式
基于表3 中的符號,設(shè)pij代表第i層中第j暴露水平上的真實(shí)發(fā)病密度;p^ij代表第i層中第j暴露水平上的觀察發(fā)病密度[1,6]。
假設(shè)ln(pij)=αi+βSj,使用雙側(cè)檢驗(yàn)及顯著性水平為α。
第一步:建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)。
H0:β=0;H1:β≠0;α=0.05。
第二步:計(jì)算檢驗(yàn)統(tǒng)計(jì)量。
上式中分子與分母的計(jì)算分別見式(14)、式(15):
上面兩式中,Lxy和Lxx的計(jì)算分別見式(16)、式(17):
在式(16)中,A、B、C的計(jì)算公式分別見式(18)、式(19)、式(20):
在式(17)中,D、E的計(jì)算分別見式(21)、式(22):
在上面各式中,wij=αij=第i層第j暴露水平上的病例數(shù)。
第三步:根據(jù)檢驗(yàn)統(tǒng)計(jì)量的值確定P值,并作出統(tǒng)計(jì)推斷和專業(yè)結(jié)論。
【例3】某地鎳精煉工人肺癌死亡資料如表4 所示[6],試問鎳精煉工人的肺癌死亡密度是否隨著鎳暴露量的增加呈增高趨勢?
表4 某地鎳精煉工人肺癌死亡情況調(diào)查結(jié)果
【分析與解答】設(shè)所需要的SAS程序如下:
【統(tǒng)計(jì)結(jié)論和專業(yè)結(jié)論】由以上SAS輸出結(jié)果可知,Z=1.58907,P=0.11204>0.05,說明β^=0.25453 與0之間差異無統(tǒng)計(jì)學(xué)意義;可以認(rèn)為:肺癌死亡密度不隨鎳暴露量的增加呈線性增高趨勢。
對人-時(shí)間資料進(jìn)行分析,與對通常的定性資料[2-5]進(jìn)行分析是大同小異的。從效應(yīng)指標(biāo)上來看,用“發(fā)病密度”取代了“發(fā)病率”,用“率比”取代了“相對危險(xiǎn)度(適用于隊(duì)列研究設(shè)計(jì)四格表資料)”和/或“優(yōu)勢比(適用于病例對照研究設(shè)計(jì)四格表資料)”。稍有不同的是:在分析通常的定性資料時(shí),若各層間滿足或不滿足齊性要求,分別由基于“固定效應(yīng)模型”或“隨機(jī)效應(yīng)模型”導(dǎo)出的公式去估計(jì)“合并或共同”相對危險(xiǎn)度或優(yōu)勢比及其置信區(qū)間[2-5,8-13];而分析人-時(shí)間資料時(shí),若各層間滿足齊性要求,有方法估計(jì)“合并或共同”率比及其置信區(qū)間[1,6];而當(dāng)各層間不滿足齊性要求時(shí),目前尚沒有方法估計(jì)“合并或共同”率比及其置信區(qū)間。
本文介紹了“分層人-時(shí)間資料中第i層率比的點(diǎn)估計(jì)和置信區(qū)間估計(jì)”“不同層間率比的齊性檢驗(yàn)”“合并率比的點(diǎn)估計(jì)與置信區(qū)間估計(jì)”和“分層人-時(shí)間資料線性趨勢性檢驗(yàn)”等方法;通過兩個(gè)實(shí)例,介紹了基于SAS 軟件實(shí)現(xiàn)前述各種場合下的統(tǒng)計(jì)計(jì)算的過程,對SAS輸出結(jié)果進(jìn)行解釋,并做出統(tǒng)計(jì)結(jié)論和專業(yè)結(jié)論。