姜棋予 孫麗君 畢京峰
[摘要] 通過對(duì)敏感性分析新方法E-value的解讀,向讀者介紹一種簡單實(shí)用的觀察性研究敏感性分析方法。該方法以相對(duì)危險(xiǎn)度(RR)作為主要研究指標(biāo),構(gòu)建了RR敏感性分析的統(tǒng)計(jì)學(xué)模型,從而預(yù)測(cè)能夠?qū)⒀芯拷Y(jié)果(RR值)解釋掉的,未知混雜因素與暴露因素及結(jié)局的最小關(guān)聯(lián)強(qiáng)度。該方法還通過統(tǒng)計(jì)學(xué)轉(zhuǎn)換,將RR推廣到優(yōu)勢(shì)比、風(fēng)險(xiǎn)比及結(jié)局變化的均值的敏感性分析。該方法為觀察性研究的敏感性分析提供了一種簡單、可靠的分析方法,建議在以后的觀察性研究報(bào)告及論文發(fā)表中提供相應(yīng)的敏感性分析結(jié)果,但須注意,該敏感性分析并不能替代嚴(yán)謹(jǐn)?shù)目蒲性O(shè)計(jì)。
[關(guān)鍵詞] 觀察性研究;敏感性分析;E-value;解讀
[中圖分類號(hào)] C81 ? ? ? ? ?[文獻(xiàn)標(biāo)識(shí)碼] A ? ? ? ? ?[文章編號(hào)] 1673-7210(2020)04(b)-0181-06
Sensitivity analysis of observational studies: “E-value” interpretation
JIANG Qiyu ? SUN Lijun ? BI Jingfeng▲
Clinical Research Management Center, the Fifth Medical Center, Chinese PLA General Hospital, Beijing ? 100039, China
[Abstract] Through the interpretation of the new sensitivity analysis method E-value, a simple and practical sensitivity analysis method for observational research is introduced to readers. In this method, Relative Risk (RR) was used as the main research index to construct a statistical model of RR sensitivity analysis, so as to predict the minimum correlation strength of unknown confounders with exposure factors and outcomes that can explain away the research results (RR values). The method also extended RR to sensitivity analysis of Odds ratio, Hazard ratio and mean of outcome changes through statistical transformation. This method provides a simple and reliable method for sensitivity analysis of observational research, and it is suggested to provide corresponding results of sensitivity analysis in future observational research reports and papers, but it should be noted that this sensitivity analysis cannot replace rigorous scientific research design.
[Key words] Observational study; Sensitivity analysis; E-value; Interpretation
在觀察性研究中,臨床研究的結(jié)局可能受多種因素的影響,即使研究者已經(jīng)根據(jù)前期調(diào)研結(jié)果采集到了足夠的影響因素,但仍可能存在未知的混雜因素影響結(jié)果的可靠性。從流行病學(xué)的角度,研究者更希望知道研究結(jié)果的穩(wěn)定性或可靠性有多高,即假如存在一個(gè)或幾個(gè)未知的影響因素,這些影響因素需要有多大的“效力”可以完全解釋掉該研究結(jié)果。國外的學(xué)者已經(jīng)提出了多種探索敏感性分析的分析方法[1-19],但這些分析方法在學(xué)術(shù)界也引起了一定的爭議,部分技術(shù)被認(rèn)為太過主觀,研究者往往通過選擇更為靈敏的參數(shù),使結(jié)果相對(duì)于未知混雜因素的影響更為穩(wěn)健[20]。其他批評(píng)包括,假設(shè)通常規(guī)定未測(cè)量的混雜因素是二元的[3],或者只有一個(gè)未測(cè)量的混雜因素[4-5],或者未測(cè)量的混雜因素與治療結(jié)果之間沒有相互作用[2-5]。
加州大學(xué)伯克利分校統(tǒng)計(jì)系丁鵬博士與哈佛大學(xué)公共衛(wèi)生學(xué)院流行病學(xué)系博士Tyler J. VanderWeele利用混雜因素與暴露因素及結(jié)局的關(guān)聯(lián)性,提出并構(gòu)建了觀察性研究的敏感性分析理論[14,20-21],并組織編寫了名為“EValue”的R包,為觀察性研究的敏感性分析提供了一種簡單、可靠的分析方法。本文將針對(duì)該方法進(jìn)行介紹,以期為國內(nèi)研究者提供觀察性研究敏感性分析的新思路。
1 基本原理
1.1 統(tǒng)計(jì)學(xué)原理
設(shè)暴露因素為E,已經(jīng)獲得的協(xié)變量(混雜因素)為C,結(jié)局變量(二分類)為D,未測(cè)量的混雜因素為U(可以為兩分類,多分類,連續(xù)變量,U=1,2……k)。將未測(cè)量混雜因素U與暴露因素E的關(guān)聯(lián)強(qiáng)度稱之為RREU,將未測(cè)量混雜因素U與結(jié)果D的關(guān)聯(lián)強(qiáng)度稱之為RRUD。RREU、RRUD與暴露因素、結(jié)局以及已經(jīng)獲得的協(xié)變量的關(guān)系見圖1[21]。
2.2 E-value分析的3個(gè)擴(kuò)展
在觀察性研究中,針對(duì)不同研究設(shè)計(jì)和結(jié)果數(shù)據(jù),logistic回歸、Cox比例風(fēng)險(xiǎn)模型、多重線性回歸是最為常用的多因素統(tǒng)計(jì)分析方法,其輸出的統(tǒng)計(jì)結(jié)果分別是優(yōu)勢(shì)比(odds ratio,OR)、風(fēng)險(xiǎn)比(hazard ratio,HR)、結(jié)局變化的均值及其置信區(qū)間。E-value也通過RR的統(tǒng)計(jì)學(xué)轉(zhuǎn)換為上述結(jié)果提供了敏感性分析方法。
2.2.1 OR值的敏感性分析 ?如前所述,E-value的敏感性分析主要針對(duì)的是RR指標(biāo),關(guān)于OR值的敏感性分析則是基于RR值與OR值的相關(guān)性統(tǒng)計(jì)學(xué)理論取近似值,在E-value中,當(dāng)結(jié)局事件的發(fā)生率<15%或>85%時(shí),按RR=OR計(jì)算,當(dāng)結(jié)局事件的發(fā)生率介于15%~85%時(shí),按如下公式計(jì)算[21,23]RR=■,將OR近似地替換為RR,從而可以利用該RR的近似值進(jìn)行敏感性分析。如在“基于劑量-反應(yīng)關(guān)系的體力活動(dòng)對(duì)血清肌酐水平的影響及其性別差異”[25]中,能量代謝當(dāng)量大于821.50MET-min/week組(肌酐異常發(fā)生率35.24%)發(fā)生肌酐水平異常的OR值為1.47, 95%的置信區(qū)間為(1.13~1.92),肌酐異??偘l(fā)生率為(192+216)/(804+613)×100%=28.79%(介于15%~85%)。其E-value的R軟件實(shí)現(xiàn):在R軟件EValue包中,可直接利用以下函數(shù)進(jìn)行估算:evalues.OR(X,low,high,rare =0或1),其中X表示觀察性研究結(jié)果OR值,low表示OR值置信區(qū)間的下限,high表示OR值置信區(qū)間的上限,rare即結(jié)局事件的發(fā)生率是否在15%~85%之間,當(dāng)在這個(gè)區(qū)間時(shí)rare=0,當(dāng)<15%或>85%時(shí),rare=1。將上述值代入EValue包“evalues.OR(1.47,1.13,1.92,rare =0)”,得到E-value=1.72,其值置信區(qū)間的低限為1.32,即如果存在某種未測(cè)量(未知)的混雜因素,其與暴露因素及結(jié)局的RR各達(dá)到1.32時(shí)(RREU=RRUD=1.32),就可以完全解釋掉原研究結(jié)果RR=1.47。
2.2.2 HR值的敏感性分析 ?Cox比例風(fēng)險(xiǎn)模型輸出的主要統(tǒng)計(jì)結(jié)果是HR值,同OR值相似,當(dāng)結(jié)局事件的發(fā)生率<15%或>85%時(shí),按RR=HR計(jì)算,當(dāng)結(jié)局事件的發(fā)生率介于15%~85%時(shí),E-value[21]按如下公式計(jì)算:RR≈[1-0.5sqrt(HR)]/[1-0.5sqrt(1/HR)]。R軟件實(shí)現(xiàn):同OR值敏感性的計(jì)算一樣,在R軟件EValue包中,可直接利用以下函數(shù)進(jìn)行估算:evalues.HR(X,low,high,rare =0或1),其中X表示觀察性研究結(jié)果HR值,low表示HR值置信區(qū)間的下限,high表示HR值置信區(qū)間的上限,rare即結(jié)局事件的發(fā)生率是否在15%~85%之間,當(dāng)在這個(gè)區(qū)間時(shí)rare =0,當(dāng)<15%或>85%時(shí),rare =1。
2.2.3 結(jié)局指標(biāo)變化均值及其置信區(qū)間的敏感性分析 ?多重線性回歸分析結(jié)果輸出的是回歸系數(shù)及其標(biāo)準(zhǔn)誤。回歸系數(shù)是指當(dāng)調(diào)整了其他協(xié)變量后,研究變量每變化一個(gè)單位,結(jié)局指標(biāo)的變化平均值。如Reinisch等[25]研究了苯巴比妥宮內(nèi)暴露對(duì)男性智力的影響,暴露組為母親在懷孕期間應(yīng)用過苯巴比妥的男性,對(duì)照組為母親在懷孕期間未應(yīng)用過苯巴比妥的男性,經(jīng)對(duì)家庭社會(huì)經(jīng)濟(jì)狀況、教育、母親是否嘗試墮胎、母親婚姻狀況等協(xié)變量調(diào)整后。苯巴比妥對(duì)智力影響的估計(jì)值均數(shù)為-4.77,95%的置信區(qū)間為(-7.96~-1.58),標(biāo)準(zhǔn)誤差為1.63,所有樣本的總方差為11.83。研究者沒有獲得關(guān)于父母智力的數(shù)據(jù),這可能是一個(gè)未測(cè)量的混雜因素。與OR、HR屬于分類資料不同,上述研究中對(duì)智力影響的估計(jì)值屬于連續(xù)性計(jì)量資料,首先需要將其轉(zhuǎn)化為RR,才能夠進(jìn)行敏感性分析。E-value基于方差分解的統(tǒng)計(jì)學(xué)理念,通過計(jì)算結(jié)局指標(biāo)變化均值占總方差的比例來獲得RR,具體方法是:用對(duì)智力影響的估計(jì)值均數(shù)和標(biāo)準(zhǔn)誤除以總樣本的標(biāo)準(zhǔn)差,得到D=-4.77/11.38=-0.42和SD=1.63/11.38=0.14的結(jié)果。然后應(yīng)用公式[21,22,26-27]:RR≈exp(0.91×d),置信區(qū)間:exp(0.91×d-1.78×sd),exp(0.91×d+1.78×sd),計(jì)算得到RR≈1.46,95%置信區(qū)間約為(1.14~1.88),再利用公式2即可以獲得E-value值及其95%的置信區(qū)間,結(jié)果E-value=2.29,其95%的置信區(qū)間的下限為1.54。之所以在計(jì)算RR的估計(jì)值時(shí),代入公式的是0.42而不是-0.42,是因?yàn)?0.42僅代表苯巴比妥對(duì)智力影響的估計(jì)值降低了0.42,“-”在這兒僅表示一個(gè)方向。R軟件EValue包同樣提供了相應(yīng)的函數(shù):evalues.MD(D,SD),如本例,evalues.MD(0.42,0.14),即可獲得上述結(jié)果。
2.3 關(guān)于E-value幾個(gè)需要說明的問題
2.3.1 RR值應(yīng)>1 ?許多研究獲得的RR往往<1,E-value一般要求如果RR<1,則應(yīng)取該值的倒數(shù)使之>1。其實(shí)這不矛盾,RR本身是一個(gè)相對(duì)概念,一般代表的是暴露組與對(duì)照組的發(fā)病率之比,其倒數(shù)代表的是對(duì)照組與暴露組的發(fā)病率之比,在結(jié)果解釋上是相同的。
2.3.2 E-value值代表什么? ?E-value值可用于估算未測(cè)量的混雜因素能夠?qū)⒀芯拷Y(jié)果解釋掉的,需要與結(jié)局指標(biāo)相關(guān)聯(lián)的最小關(guān)聯(lián)強(qiáng)度,從而可以評(píng)估暴露因素與結(jié)局指標(biāo)之間關(guān)聯(lián)的穩(wěn)健程度,并且當(dāng)在E-value值比較大情況下,可能提供支持因果關(guān)系的有力證據(jù)。然而,在沒有確鑿證據(jù)的情況下,不能以E-value值的大小來判斷原研究結(jié)果的對(duì)與錯(cuò)。從公式2中可以看出,E-value值與研究結(jié)果RR值(或由OR、HR等推導(dǎo)出的RR值)的大小是密切相關(guān)的,當(dāng)RR值較小時(shí),E-value值也較小。不能因?yàn)镽R值較小,同時(shí)E-value值也較小就認(rèn)為研究結(jié)果可能是錯(cuò)誤的,因?yàn)楸┞杜c結(jié)局的相關(guān)性事實(shí)上可能就是這個(gè)結(jié)果。
2.3.3 E-value需不需要確定一個(gè)固定的域值? ?既然獲得了E-value,研究者可能會(huì)問,能不能象P值(P < 0.05被公認(rèn)為有統(tǒng)計(jì)學(xué)差異)一樣確定一個(gè)固定的域值,當(dāng)E-value>該值時(shí)研究結(jié)果可認(rèn)為更穩(wěn)健,而當(dāng)<該值時(shí)被視為不夠穩(wěn)???“推薦Evalue”[22]認(rèn)為,不應(yīng)該設(shè)置這樣一個(gè)域值。因?yàn)镋-value值僅表示,假如有未測(cè)量的混雜因素能夠解釋掉研究結(jié)果RR,其與暴露因素及結(jié)局指標(biāo)最小的關(guān)聯(lián)程度。如上所述,可能在事實(shí)上,暴露與結(jié)局的相關(guān)性本身就是這個(gè)結(jié)果。
2.3.4 E-value還可以用于評(píng)估研究結(jié)果被低估的關(guān)聯(lián)強(qiáng)度 ?E-value值除了可用于估算未測(cè)量的混雜因素能夠?qū)⒀芯拷Y(jié)果解釋掉的,需要與結(jié)局指標(biāo)相關(guān)聯(lián)的最小關(guān)聯(lián)強(qiáng)度外,也可以評(píng)估由未測(cè)量的混雜因素導(dǎo)致的,暴露因素與結(jié)局指標(biāo)相關(guān)聯(lián)的被低估的關(guān)聯(lián)強(qiáng)度。二者的方法學(xué)原理是相似的。例如“血清白蛋白對(duì)心力衰竭患者院內(nèi)死亡的影響”[23]研究中,RR=2,當(dāng)我們想知道未測(cè)量的混雜因素需要具備多大的RREU和RRUD,會(huì)導(dǎo)致RR=3時(shí),則RR′=2/3,然后利用公式2,將RR′替換RR即可獲得相應(yīng)的E-value值。
2.3.5 有了E-value還需要進(jìn)行多因素分析嗎? ?答案是肯定的。E-value評(píng)價(jià)的是觀察性研究結(jié)果可能被未測(cè)量混雜因素解釋掉的程度,多因素分析的結(jié)果無疑將更加穩(wěn)健,其可能存在的未測(cè)量混雜因素的范圍將更小,所獲得的E-value值也更加確切。
2.4 E-value的局限性
如同任何一種統(tǒng)計(jì)學(xué)方法都有其局限性一樣,E-value學(xué)說的發(fā)表也引起了一些爭議,JPA等[28]認(rèn)為,E-value方法在觀察性研究中很容易被誤用。E-value提供的是一個(gè)具有線性關(guān)系性質(zhì)的一個(gè)比較簡單的值[28],是在假設(shè)未測(cè)量的混雜因素對(duì)暴露因素與結(jié)局具有相同的關(guān)聯(lián)度的前提下獲得的,代表的是一種最小關(guān)聯(lián)強(qiáng)度。在醫(yī)學(xué)實(shí)踐中,這種關(guān)聯(lián)程度未必相同,因此E-value值僅僅且只能作為一個(gè)參考指標(biāo),其是否反應(yīng)了臨床實(shí)際值得商榷。
E-value僅僅提供了一種敏感性分析結(jié)果,不能替代觀察性研究所必須的,嚴(yán)謹(jǐn)?shù)目蒲性O(shè)計(jì)。E-value是在科學(xué)、嚴(yán)謹(jǐn)?shù)脑O(shè)計(jì),實(shí)施,統(tǒng)計(jì),分析基礎(chǔ)上所建立的一種相對(duì)簡單、線性的敏感性分析方法,只能對(duì)假設(shè)的未知混雜因素能夠?qū)⒀芯拷Y(jié)果(RR值)解釋掉的最小關(guān)聯(lián)強(qiáng)度進(jìn)行預(yù)測(cè)。由于這僅僅是一種未知的假設(shè),其在評(píng)價(jià)過程中只能起一定的輔助作用,不能因?yàn)楂@得了較大的E-value值就認(rèn)為結(jié)果一定是穩(wěn)健的,也不能因?yàn)楂@得了較小的E-value值就認(rèn)為結(jié)果不可靠。觀察性研究結(jié)果的科學(xué)性決定于必須按照流行病學(xué)的研究原理,進(jìn)行科學(xué)、嚴(yán)謹(jǐn)?shù)脑O(shè)計(jì),實(shí)施,統(tǒng)計(jì),分析,并進(jìn)行規(guī)范的報(bào)告[29],方能得出令人信服的結(jié)論。準(zhǔn)確地說,觀察性研究結(jié)果的科學(xué)性和可靠性只與科學(xué)、嚴(yán)謹(jǐn)?shù)脑O(shè)計(jì),實(shí)施,統(tǒng)計(jì),分析相關(guān),E-value值只是為該研究結(jié)果提供了一種補(bǔ)充信息。
3 致謝
在本文的成文過程中,得到了E-value方法的原創(chuàng)者,加州大學(xué)伯克利分校統(tǒng)計(jì)系丁鵬教授的大力支持,并對(duì)文章進(jìn)行了悉心指導(dǎo)和修改,在此謹(jǐn)表示衷心感謝并致以崇高的敬意。
[參考文獻(xiàn)]
[1] ?Bross ID. Spurious effects from an extraneous variable [J]. J Chronic Dis,1966,19(6):637-647.
[2] ?Schlesselman JJ. Assessing effects of confounding variables [J]. Am J Epidemiol,1978,108(1):3-8.
[3] ?Rosenbaum PR,Rubin DB. Assessing sensitivity to an unobserved binary covariate in an observational study with binary outcome [J]. J R Stat Soc Series B,1983,45:212-218.
[4] ?Lin DY,Psaty BM,Kronrnal RA. Assessing the sensitivity of regression results to unmeasured confounders in observational studies [J]. Biometrics,1998,54(3):948-963.
[5] ?Imbens GW. Sensitivity to exogeneity assumptions in program evaluation [J]. Amer Econ Rev,2003, 93:126-132.
[6] ?Vanderweele TJ,Arah OA. Bias formulas for sensitivity analysis of unmeasured confounding for general outcomes,treatments,and confounders [J]. Epidemiology,2011,22(1):42-52.
[7] ?Bross ID. Pertinency of an extraneous variable [J]. J Chronic Dis,1967,20(7):487-495.
[8] ?Lee WC. Bounding the bias of unmeasured factors with confounding and effectmodifying potentials [J]. Stat Med,2011,30(9):1007-1017.
[9] ?Robins JM,Rotnitzky A,Scharfstein DO. Sensitivity analysis for selection bias and unmeasured confounding in missing data and causal inference models [M]// Statistical Models in Epidemiology, the Environment, and Clinical Trials. Springer New York,2000:1-94.
[10] ?McCandless LC,Gustafson P,Levy A. Bayesian sensitivity analysis for unmeasured confounding in observational studies [J]. Stat Med, 2007,26(11):2331-2347.
[11] ?Brumback BA,Hernán MA,Haneuse SJ. Sensitivity analyses for unmeasured confounding assuming a marginal structural model for repeated measures [J]. Stat Med,2004,23(5):749-767.
[12] ?VanderWeele TJ. Explanation in Causal Inference:Methods for Mediation and Interaction [M]. New York:Oxford University Press,2015,Chapter 3.
[13] ?VanderWeele TJ. Sensitivity analysis for contagion effects in social networks [J]. Sociol Methods Res,2011,40(2):240-255.
[14] ?Ding P,VanderWeele TJ. Sensitivity analysis without assumptions [J]. Epidemiology,2016,27(3):368-377.
[15] ?Gilbert PB,Bosch RJ,Hudgens MG. Sensitivity analysis for the assessment of causal vaccine effects on viral load in HIV vaccine trials [J]. Biometrics,2003,59(3):531-541.
[16] ?Chiba Y,VanderWeele TJ. A simple method for principal strata effects when the outcome has been truncated due to death [J]. Am J Epidemiol,2011,173(7):745-751.
[17] ?Huang TH,Lee WC. Bounding formulas for selection bias [J]. Am J Epidemiol,2015,182(10):868-872.
[18] ?Robins J,Orellana L,Rotnitzky A. Estimation and extrapolation of optimal treatment and testing strategies [J]. Stat Med,2008,27(23):4678-4721.
[19] ?Hernán MA,Lanoy E,Costagliola D. Comparison of dynamic treatment regimes via inverse probability weighting [J]. Basic Clin Pharmacol Toxicol,2006,98(3):237-242.
[20] ?Ding P,VanderWeele TJ. Sharp Sensitivity Bounds for Mediation Under Unmeasured Mediator-Outcome Confounding [J]. Biometrika,2016,103(2):483-490.
[21] ?VanderWeele TJ,Ding P. Sensitivity Analysis in Observational Research:Introducing the E-Value [J]. Ann Intern Med,2017,167(4):268-274.
[22] ?于彤彤,宋嬌磊,劉雙雙,等.基于傾向性評(píng)分匹配法探討血清白蛋白對(duì)心力衰竭患者院內(nèi)死亡的影響[J].中華內(nèi)科雜志,2015,54(11):959-964.
[23] ?VanderWeele TJ. On a square-root transformation of the odds ratio for a common outcome [J]. Epidemiology,2017, 28(6):e58-e60
[24] ?許春杰,劉曉宇,尹素鳳,等.基于劑量-反應(yīng)關(guān)系的體力活動(dòng)對(duì)血清肌酐水平的影響及其性別差異[J].鄭州大學(xué)學(xué)報(bào):醫(yī)學(xué)版,2018,53(2):225-229.
[25] ?Reinisch JM,Sanders SA,Mortensen EL. In utero exposure to phenobarbital and intelligence deficits in adult men [J]. JAMA,1995,274(19):1518-1525.
[26] ?Hasselblad V,Hedges LV. Meta-analysis of screening and diagnostic tests [J]. Psychol Bull,1995,117(1):167-178.
[27] ?Borenstein M,Hedges LV,Higgins JPT,et al. Introduction to Meta-Analysis [M]. Wiley:2009,Chapter 7.
[28] ?JPA I,Tan YJ,Blum MR. Limitations and Misinterpretations of E-Values for Sensitivity Analyses of Observational Studies [J]. Ann Intern Med,2019,170(2):108-111.
[29] ?von EE,Altman DG,Egger M,et al. The Strengthening the Reporting of Observational Studies in Epidemiology(STROBE)statement:guidelines for reporting observational studies [J]. Lancet,2007,370(9596):1453-1457.
(收稿日期:2019-09-02 ?本文編輯:顧家毓)