程 義 李冬冬 陳 峰 郭 威 吳 騁△
1.海軍軍醫(yī)大學(xué)衛(wèi)生勤務(wù)學(xué)系軍隊(duì)衛(wèi)生統(tǒng)計(jì)學(xué)教研室(200433) 2.解放軍94969部隊(duì)保障部衛(wèi)生隊(duì)
未亡時(shí)間偏倚(immortal time bias)又稱為保證時(shí)間偏倚(guarantee time bias),是一種特殊的選擇性偏倚[1],廣泛地存在于觀察性研究和藥物臨床試驗(yàn)中。Gail[2]分析心臟移植的研究時(shí),首次提出了未亡時(shí)間偏倚,認(rèn)為移植組生存時(shí)間的延長(zhǎng),部分歸因于未亡時(shí)間偏倚的存在。
在進(jìn)行生存分析時(shí),如果暴露/處理發(fā)生在隨訪期間,在研究開始時(shí),所有的受試者都?xì)w為非暴露/對(duì)照組。隨著隨訪的進(jìn)行,部分患者或早或晚地接受暴露/處理,進(jìn)入暴露/處理組。從進(jìn)入研究隊(duì)列(如移植注冊(cè))到接受暴露/處理(如接受心臟移植)的隨訪時(shí)間稱為“未亡時(shí)間”(immortal time)。在“未亡時(shí)間”內(nèi),暴露/處理組患者的生存時(shí)間要足夠長(zhǎng),直到接受暴露/處理;而非暴露/對(duì)照組則沒有這種生存時(shí)間的要求。
在生存分析中,由于不恰當(dāng)?shù)姆纸M方法、未能正確處理“未亡時(shí)間”,或者沒有采用正確的統(tǒng)計(jì)學(xué)方法,都可能產(chǎn)生偏倚,使得分析結(jié)果夸大了暴露/處理效果。
Michele Iudici[3]等分析了風(fēng)濕病領(lǐng)域,近5年發(fā)表在頂尖雜志上(如新英格蘭醫(yī)學(xué)雜志、柳葉刀、美國(guó)醫(yī)學(xué)會(huì)雜志等)的78項(xiàng)觀察性研究,其中的8項(xiàng)研究(10%)存在未亡時(shí)間偏倚,這種偏倚的存在,產(chǎn)生了有利于暴露/處理組的結(jié)果。在一項(xiàng)評(píng)估二甲雙胍能否提高胰腺癌患者生存率的研究中[4],由于未亡時(shí)間偏倚的存在,使得二甲雙胍對(duì)胰腺癌的保護(hù)作用降低了18%。在藥物流行病學(xué)研究中[5],未亡時(shí)間偏倚也廣泛存在,甚至難以識(shí)別,因此識(shí)別并控制這種偏倚,在實(shí)踐中至關(guān)重要。
本文綜述了處理未亡時(shí)間偏倚常用的統(tǒng)計(jì)學(xué)方法,包括界標(biāo)分析(landmark method)、時(shí)依性Cox模型(time-varying Cox model)以及逆概率加權(quán)(inverse probability weighting,IPW),介紹了每種方法的適用條件和優(yōu)缺點(diǎn),以及其最新進(jìn)展和案例應(yīng)用,并進(jìn)行了實(shí)例分析,以期為相關(guān)領(lǐng)域的研究者提供參考。
1.界標(biāo)分析
(1)界標(biāo)分析簡(jiǎn)介
界標(biāo)分析是目前處理生存分析中未亡時(shí)間偏倚的主要方法之一。該方法旨在無偏地估計(jì)暴露/處理組患者和非暴露/對(duì)照組患者在界標(biāo)時(shí)間的生存概率。Anderson[6]等在腫瘤學(xué)中進(jìn)行應(yīng)答組與非應(yīng)答組的生存分析時(shí),提出了界標(biāo)分析。Charity J[7]等簡(jiǎn)要介紹了界標(biāo)分析。
在界標(biāo)分析中,首先選取一個(gè)固定的時(shí)間作為界標(biāo)時(shí)間,以此為研究起始時(shí)間,僅保留界標(biāo)時(shí)間點(diǎn)仍然存活且可隨訪的患者。根據(jù)患者在界標(biāo)時(shí)間前是否接受暴露/處理進(jìn)行分組。然后使用生存分析的基本方法比較兩組的生存情況,如Kaplan-Meier法、log-rank檢驗(yàn)、Cox比例風(fēng)險(xiǎn)模型等。在解釋結(jié)果時(shí)需要注意,界標(biāo)分析得到的結(jié)果僅適用于在界標(biāo)時(shí)間時(shí)仍存在風(fēng)險(xiǎn)的患者[1,7]。常用統(tǒng)計(jì)軟件均可實(shí)現(xiàn)界標(biāo)分析,如R軟件、SAS、SPSS、stata等。
(2)界標(biāo)分析的優(yōu)勢(shì)和局限性
界標(biāo)分析具有操作簡(jiǎn)便、描述直觀以及清晰的圖形化呈現(xiàn)方式[8]等優(yōu)點(diǎn),用于控制暴露/處理的時(shí)依性屬性導(dǎo)致的偏倚,如未亡時(shí)間偏倚、領(lǐng)先時(shí)間偏倚[9-10]等?;诮鐦?biāo)分析,一些更復(fù)雜的模型可用于患者生存概率的動(dòng)態(tài)預(yù)測(cè),如界標(biāo)分析超級(jí)模型(landmark supermodels)[11-12]、界標(biāo)治愈率模型(landmark cure rate model)[13]。
但是界標(biāo)分析存在一定的局限性。首先,界標(biāo)時(shí)間選取具有主觀性。選取不同的界標(biāo)時(shí)間,得到的分析結(jié)果也不盡相同,某個(gè)界標(biāo)時(shí)間的結(jié)論難以在其他界標(biāo)時(shí)間推廣。因此,研究者首先需要確定,界標(biāo)分析是否能夠?yàn)樗芯康膯栴}提供有意義的估計(jì),并根據(jù)疾病進(jìn)程,選取有臨床意義的時(shí)間作為界標(biāo)時(shí)間,并且有必要選取多個(gè)界標(biāo)時(shí)間進(jìn)行敏感性分析,以評(píng)價(jià)結(jié)果的穩(wěn)健性。
其次,統(tǒng)計(jì)效能和精確性下降。界標(biāo)分析排除了界標(biāo)時(shí)間之前的結(jié)局事件和刪失數(shù)據(jù),降低了統(tǒng)計(jì)效能和精確性。因此,在選取界標(biāo)時(shí)間時(shí)需要權(quán)衡:選取過早的界標(biāo)時(shí)間,會(huì)忽略界標(biāo)時(shí)間之后發(fā)生的暴露/處理,無法進(jìn)行有效的生存率的比較;選取過晚的界標(biāo)時(shí)間,則會(huì)排除更多的患者,從而降低了統(tǒng)計(jì)效能。
此外,界標(biāo)分析是基于觀察性研究的,缺少了隨機(jī)化屬性,當(dāng)結(jié)果顯示組間差別有統(tǒng)計(jì)學(xué)意義時(shí),干預(yù)與結(jié)局之間只能解釋為“相關(guān)關(guān)系”,而非“因果關(guān)系”。
2.時(shí)依性Cox模型
(1)時(shí)依性Cox模型簡(jiǎn)介
Cox比例風(fēng)險(xiǎn)模型(Cox proportional-hazards model)是生存分析中最常用的回歸分析方法,常用于探究多個(gè)協(xié)變量對(duì)患者生存時(shí)間的影響。當(dāng)暴露/處理具有時(shí)依性屬性時(shí),可以納入一個(gè)(或多個(gè))時(shí)依性的協(xié)變量(time-dependent covariates),采用時(shí)依性Cox模型加以控制。
時(shí)依性Cox模型本質(zhì)上是增加了一個(gè)(或多個(gè))時(shí)依性的協(xié)變量,這個(gè)變量的取值可以隨時(shí)間改變,也就是說允許病人的分組在隨訪過程中改變。這樣,暴露/處理組患者的生存時(shí)間就分為兩部分:干預(yù)前和干預(yù)后。雖然分析中存在時(shí)依性的變量,但是分組后的區(qū)間里的協(xié)變量的值是不變的。通過構(gòu)建風(fēng)險(xiǎn)函數(shù),得到對(duì)風(fēng)險(xiǎn)比(hazard ratio)的估計(jì),來定量地表示時(shí)依性協(xié)變量對(duì)結(jié)局的影響。Jiannong Liu[14]等比較了四種處理未亡時(shí)間偏倚的方法,認(rèn)為“時(shí)依性Cox模型適用于分析時(shí)依性暴露/處理”。
時(shí)依性Cox模型可以通過多種統(tǒng)計(jì)軟件實(shí)現(xiàn),如R軟件的“survival”包、SAS、stata、SPSS等。章仲恒等[15]介紹了利用R語言執(zhí)行時(shí)依性Cox模型的具體步驟,有興趣的讀者可參考,此處不再贅述。
(2)時(shí)依性Cox模型的優(yōu)勢(shì)和局限性
與界標(biāo)分析不同,時(shí)依性Cox模型納入了時(shí)依性的協(xié)變量,允許患者分組隨時(shí)間改變,充分利用了所有患者的隨訪信息,具有更高的統(tǒng)計(jì)效能。時(shí)依性Cox模型得到風(fēng)險(xiǎn)比的估計(jì),可以定量的表示時(shí)依性協(xié)變量對(duì)結(jié)局的影響。此外,當(dāng)含有多個(gè)時(shí)依性協(xié)變量,并且協(xié)變量的取值隨時(shí)間的變化不止一次時(shí),時(shí)依性Cox模型同樣適用。
時(shí)依性Cox模型的局限性包括:首先,時(shí)依性的Cox模型通過風(fēng)險(xiǎn)比解釋時(shí)依性協(xié)變量對(duì)結(jié)局事件的影響,缺少生存曲線圖形化的直觀呈現(xiàn)。其次,由于時(shí)依性協(xié)變量的存在,風(fēng)險(xiǎn)比例模型在t=0時(shí)的軌跡是未知的,不能簡(jiǎn)單地根據(jù)風(fēng)險(xiǎn)計(jì)算生存概率,這就意味著時(shí)依性Cox模型喪失了預(yù)測(cè)的功能。當(dāng)基于具有時(shí)依性的協(xié)變量進(jìn)行預(yù)測(cè)時(shí),界標(biāo)分析可能更加適用[16]。此外,由于時(shí)依性協(xié)變量通常伴隨著混雜因素,因此時(shí)依性Cox模型很難探究其中的因果關(guān)系。關(guān)于其中的數(shù)理機(jī)制,F(xiàn)isher和Lin[17]進(jìn)行了簡(jiǎn)要的闡述。
3.逆概率加權(quán)
(1)逆概率加權(quán)簡(jiǎn)介
逆概率加權(quán)是一種基于傾向性評(píng)分(propensity score)[18]的統(tǒng)計(jì)方法,是處理觀察性數(shù)據(jù)的強(qiáng)有力工具。傾向性評(píng)分是指患者進(jìn)入暴露/處理組的概率,常用于控制已觀測(cè)的混雜因素,郭申陽等對(duì)傾向性評(píng)分進(jìn)行了詳細(xì)的介紹[19]。
利用逆概率加權(quán)進(jìn)行統(tǒng)計(jì)分析,首要的一步就是構(gòu)建傾向性評(píng)分估計(jì)模型。在清晰地了解某種疾病的發(fā)展進(jìn)程或治療過程后,以患者臨床、人口學(xué)、預(yù)后和治療特征等作為預(yù)測(cè)變量,構(gòu)建多因素的傾向性評(píng)分估計(jì)模型,如logistic回歸,使得每個(gè)患者在隨訪的每個(gè)階段,都會(huì)產(chǎn)生一個(gè)進(jìn)入試驗(yàn)組的概率估計(jì)值。然后利用第一步產(chǎn)生的概率估計(jì)值的倒數(shù)作為權(quán)重進(jìn)行加權(quán),構(gòu)建逆概率加權(quán)模型。這些權(quán)重,部分地消除了由于未隨機(jī)化分組產(chǎn)生的偏倚。
在構(gòu)建傾向性模型時(shí),需要滿足一個(gè)重要的假設(shè):無遺漏的未觀測(cè)混雜因素[20],即所有的混雜因素都考慮在內(nèi)。因此,在研究中,需要盡可能全面地考慮所有會(huì)影響到干預(yù)與結(jié)局關(guān)系的混雜因素。
(2)逆概率加權(quán)的優(yōu)勢(shì)和局限性
由于時(shí)依性暴露/處理的存在,研究分組缺少了隨機(jī)化的過程,使得非暴露/對(duì)照組和暴露/處理組間存在混雜因素。通過逆概率加權(quán),使得各組的基線數(shù)據(jù)更加均衡,具有可比性。逆概率加權(quán)也使用了所有的患者數(shù)據(jù),具有較高的統(tǒng)計(jì)效能。逆向概率加權(quán)還可以處理刪失數(shù)據(jù)[21],例如在Cox模型的框架下通過逆概率加權(quán)方法來估計(jì)存在刪失的協(xié)變量的效應(yīng)[22]。此外,Agogo[23]提出了基于逆概率加權(quán)的共享參數(shù)聯(lián)合模型(IPTW-weighted joint model),來估計(jì)縱向測(cè)量數(shù)據(jù)對(duì)二分類結(jié)局的效應(yīng),有效地控制了混雜因素。
但是,逆概率加權(quán)只是部分控制了各組間的混雜因素,一定程度彌補(bǔ)了缺少隨機(jī)化的不足,不可能完全替代隨機(jī)化步驟,可以作為界標(biāo)分析、時(shí)依性Cox模型的補(bǔ)充方法。并且,逆概率加權(quán)在軟件實(shí)現(xiàn)上更具有挑戰(zhàn)性,Van der Wal[24]等介紹了如何使用R軟件包“ipw”實(shí)現(xiàn)逆概率加權(quán)。
我們將Cox模型、界標(biāo)分析和時(shí)依性Cox模型,在R軟件包“JM”中的原發(fā)性膽汁性肝硬化(PBC)數(shù)據(jù)集[25]中進(jìn)行應(yīng)用,來比較上述方法處理未亡時(shí)間偏倚的效果。PBC數(shù)據(jù)集納入了312名原發(fā)性膽汁性肝硬化的患者,包括患者的一般情況(年齡、性別)、用藥情況、癥狀體征(肝腫大、腹水、蜘蛛痣)等。比較出現(xiàn)腹水的PBC患者與非腹水PBC患者的生存情況。將年齡、性別、用藥情況和是否有腹水,分別納入Cox模型、界標(biāo)分析和時(shí)依性Cox模型進(jìn)行分析。由于腹水是肝硬化失代償期產(chǎn)生的體征,而PBC失代償期從發(fā)病到確診平均為27個(gè)月[26],因此在界標(biāo)分析中,選取tLM=2作為界標(biāo)時(shí)間,分析結(jié)果如表1。
表1 出現(xiàn)腹水對(duì)原發(fā)性膽汁性肝炎化患者死亡風(fēng)險(xiǎn)影響分析結(jié)果
由表1知,由于腹水是PBC患者晚期出現(xiàn)的癥狀,從確診到出現(xiàn)腹水需要經(jīng)過一段“未亡時(shí)間”,由于Cox模型受到未亡時(shí)間偏倚的影響,低估了腹水組PBC患者死亡風(fēng)險(xiǎn)(HR=2.98)。界標(biāo)分析和時(shí)依性Cox模型,在一定程度上校正了未亡時(shí)間偏倚,得到了較為準(zhǔn)確的結(jié)果。其中部分腹水患者,早期無腹水,產(chǎn)生腹水后,經(jīng)過治療體征消失,時(shí)依性Cox模型準(zhǔn)確分析了每一段產(chǎn)生腹水的時(shí)間,因此得到了較大的風(fēng)險(xiǎn)比。此外,Cox模型和界標(biāo)分析以可視化的形式展示,生存曲線分別見圖1和圖2。統(tǒng)計(jì)分析使用了SAS 9.4、R軟件。
圖1 腹水與非腹水PBC患者Cox模型生存曲線
圖2 腹水與非腹水PBC患者界標(biāo)分析生存曲線
本文介紹了幾種常用的未亡時(shí)間偏倚處理方法,包括界標(biāo)分析、時(shí)依性Cox模型以及逆概率加權(quán)。界標(biāo)分析是處理未亡時(shí)間偏倚較為有效的方法,它以直觀性、簡(jiǎn)便性的特點(diǎn)在醫(yī)學(xué)研究中被廣泛應(yīng)用。時(shí)依性Cox模型可以通過風(fēng)險(xiǎn)比的估計(jì)定量地描述時(shí)依性協(xié)變量對(duì)結(jié)局的影響。IPW可以作為界標(biāo)分析的替代和補(bǔ)充方法。三種方法的特點(diǎn)總結(jié)見表2。
表2 處理未亡時(shí)間偏倚的常用統(tǒng)計(jì)方法比較
近幾年,統(tǒng)計(jì)學(xué)家提出了更多的處理方法,或多種方法綜合使用,對(duì)未亡時(shí)間偏倚的處理日趨成熟。M.A.Nicolaie[11]等構(gòu)建了界標(biāo)分析的超級(jí)模型(supermodels),將界標(biāo)分析進(jìn)行拓展,對(duì)競(jìng)爭(zhēng)風(fēng)險(xiǎn)中含有時(shí)依性協(xié)變量的問題進(jìn)行動(dòng)態(tài)預(yù)測(cè)。對(duì)于不能在任意時(shí)刻測(cè)量的內(nèi)生性時(shí)依性協(xié)變量,提出了縱向生存數(shù)據(jù)的聯(lián)合模型(joint models)[25],并且允許測(cè)量誤差的存在[16]。在一項(xiàng)關(guān)于冠脈造影和不良結(jié)局關(guān)系的研究中,Pierluigi Tricoci等[27]同時(shí)使用了IPW和界標(biāo)分析,部分地彌補(bǔ)了界標(biāo)分析缺少隨機(jī)化屬性的缺陷。
然而,當(dāng)時(shí)依性變量滿足以下條件時(shí):隨時(shí)間變化、是結(jié)局的影響因素、受到前一次干預(yù)的影響又會(huì)影響后一次的干預(yù),則稱之為時(shí)依性混雜。存在時(shí)依性混雜的情況下,需要進(jìn)行因果推斷,則需要通過其他的方法處理,如構(gòu)建邊緣結(jié)構(gòu)模型(marginal structural model,MSM)[28]。
隨著循證醫(yī)學(xué)的不斷發(fā)展和人們對(duì)醫(yī)學(xué)研究認(rèn)識(shí)的完善,未亡時(shí)間偏倚逐漸受到越來越多的關(guān)注,在處理時(shí)依性自變量、時(shí)依性混雜因素方面,將會(huì)有更多、更先進(jìn)的方法提出,以消除其產(chǎn)生的偏倚。本文僅對(duì)處理未亡時(shí)間偏倚的常用統(tǒng)計(jì)方法進(jìn)行了綜述,并進(jìn)行了實(shí)例分析,尚需進(jìn)一步的研究,對(duì)這些處理方法的適用條件、穩(wěn)健性、效能進(jìn)行定量的比較。
中國(guó)衛(wèi)生統(tǒng)計(jì)2022年1期