許 吉 鄧宏勇
上海中醫(yī)藥大學(xué)科技信息中心,201203上海
meta分析(meta-analysis)是對臨床原始研究的二次綜合分析與評價,是系統(tǒng)評價(systematic review, SR)中一種定量合并結(jié)果的方法,其結(jié)論質(zhì)量不僅依賴于科學(xué)的meta分析操作流程,更依賴于原始研究本身的質(zhì)量。多數(shù)meta分析以發(fā)表的原始研究文獻為數(shù)據(jù)來源,因此對納入的臨床研究文獻進行質(zhì)量評價是其不可或缺的環(huán)節(jié)。臨床研究文獻質(zhì)量包括內(nèi)部真實性、臨床重要性、外部真實性、報告質(zhì)量等方面,其中內(nèi)部真實性反映的是研究方法學(xué)質(zhì)量,即偏倚風(fēng)險(risk of bias, RoB),是meta分析文獻質(zhì)量評價的主要內(nèi)容。本文重點討論系統(tǒng)評價中最普遍的情況,基于干預(yù)性臨床研究文獻的meta分析,即所謂傳統(tǒng)meta分析中偏倚風(fēng)險評價的相關(guān)問題。
偏倚(bias)又稱系統(tǒng)誤差(systematic error),是指研究結(jié)果與真實情況之間存在的系統(tǒng)性偏差[1]。偏倚風(fēng)險即研究的設(shè)計、實施、測量、分析等方法學(xué)因素導(dǎo)致結(jié)果誤差的可能性,對偏倚風(fēng)險進行評價,主要是判斷偏倚來源是否存在、偏倚的大小和方向等。偏倚風(fēng)險評價工具采用定量評價量表(scale)或定性評價領(lǐng)域/條目/清單(domain/item/checklist)的形式,對臨床研究文獻的方法學(xué)質(zhì)量進行評價,前者如Jadad量表,后者如Cochrane RoB評價工具等。偏倚風(fēng)險評價相關(guān)研究最早可以追溯到1961年[2],目前國際上已經(jīng)發(fā)布了上百種偏倚風(fēng)險評價工具應(yīng)用于不同的研究類型[3],其中部分較常用的工具見表1。
表1 傳統(tǒng)meta分析常用偏倚風(fēng)險評價工具
隨機對照試驗(randomized controlled trial, RCT)是干預(yù)性臨床試驗的“金標(biāo)準(zhǔn)”,也是傳統(tǒng)meta分析納入的主要研究類型。隨機對照試驗的偏倚風(fēng)險評價工具較多,其中Cochrane協(xié)作網(wǎng)發(fā)布的偏倚風(fēng)險評價工具應(yīng)用最為廣泛。2008年,Cochrane協(xié)作網(wǎng)通過《Cochrane系統(tǒng)評價手冊》正式發(fā)布并推薦用于制作Cochrane系統(tǒng)評價的偏倚風(fēng)險評價工具(RoB),2011年進行了更新[13]。RoB從選擇偏倚(隨機序列產(chǎn)生和分配隱藏)、實施偏倚(研究對象和干預(yù)實施者盲法)、檢測偏倚(結(jié)局測量評價者盲法)、失訪偏倚(不完整結(jié)局?jǐn)?shù)據(jù))、報告偏倚(選擇性報告)和其他偏倚6個領(lǐng)域,對RCT偏倚風(fēng)險進行評價,得到定性結(jié)果(低風(fēng)險、高風(fēng)險和不清楚),并以“risk of bias graph”和“risk of bias summary”圖形式呈現(xiàn)。RoB相對于既往評價工具在科學(xué)性和實用性上有更好的表現(xiàn),因此,即使是非Cochrane系統(tǒng)評價也多采用,從而成為了當(dāng)前meta分析的文獻質(zhì)量評價主流方法和工具。RoB的特點是克服了它之前評價工具項目不完整或過于復(fù)雜、量表評分權(quán)重不合理等問題,但同時也存在未明確區(qū)分RCT研究設(shè)計類型等不完善之處。為此,Cochrane方法學(xué)工作組對RoB進行了更新,于2016年推出了偏倚評價工具2.0版本(RoB2)。RoB2是一個領(lǐng)域評價式(domain-based evaluation)工具,其特點是涵蓋平行設(shè)計、交叉設(shè)計和整群設(shè)計,明確了RoB中一些容易造成混淆的概念,并調(diào)整了部分評價項目[14]。盡管RoB2在全面性和科學(xué)性上得到了提升,但其操作復(fù)雜性也相應(yīng)提高,同時RoB2評價對象是結(jié)局而非單個研究,因此在實際應(yīng)用中并不能完全取代RoB,而是形成了當(dāng)前兩者共存的局面。
在RoB之前,Jadad量表曾經(jīng)在包括meta分析等需要評價RCT文獻質(zhì)量的應(yīng)用場景中被廣泛使用,但因為存在評價內(nèi)容不夠全面等問題,目前已較少使用。
出于倫理、外部真實性等原因,未采用隨機分組進行觀察的一類干預(yù)性研究,稱為非隨機干預(yù)性研究(non-randomised studies of the effects of interventions, NRSI),如對照試驗(controlled trials)、隊列研究(cohort study)和病例對照研究(case-control study)等,NRSI也是傳統(tǒng)meta分析重要的數(shù)據(jù)來源。紐卡斯?fàn)?渥太華量表(the Newcastle-Ottawa scale,NOS)是評價隊列研究和病例對照研究最常用的工具,NOS充分考慮了非隨機分組觀察性研究的特點,以及不同設(shè)計間的共性和差異,從人群選擇性(selection)、組間可比性(comparability)、結(jié)局(outcome, 隊列研究)或暴露(exposure, 病例對照研究),3方面共8個條目進行半定量評價。2016年,Cochrane發(fā)布了其NRSI偏倚風(fēng)險評價工具(ROBINS-I)。作為RoB工具家族成員,ROBINS-I和RoB2在評價思路和方法上有一定相似性,如設(shè)置7個評價領(lǐng)域,每個領(lǐng)域?qū)?yīng)多個信號問題(signaling question),通過信號問題判斷偏倚風(fēng)險等級[15]。ROBINS-I被Cochrane推薦為非隨機對照試驗系統(tǒng)評價和meta分析的RoB工具,普遍適用于對照試驗、隊列研究、病例對照研究等非隨機干預(yù)性研究。
除上述較明顯區(qū)分研究類型的評價工具外,還有一些工具適合多種研究類型,如Downs-Black清單可同時應(yīng)用于RCT和NRSI,但其在評價效能、操作便利性和接受度等方面還存在差距。此外,牛津大學(xué)、JBI和美國國立衛(wèi)生研究院等國際循證研究機構(gòu),也發(fā)布了系列偏倚風(fēng)險評價工具,在一定范圍內(nèi)得到使用。
偏倚風(fēng)險評價的重要性不言而喻,正確掌握使用合適的工具方法是進行科學(xué)評價的基礎(chǔ)。由于偏倚風(fēng)險評價工具眾多,且操作簡繁不一,多數(shù)需要評價人員經(jīng)過適當(dāng)培訓(xùn)和具備一定的專業(yè)知識。因此,在實際meta分析過程中,經(jīng)常會在偏倚風(fēng)險評價環(huán)節(jié)出現(xiàn)處理不當(dāng)情況,以下結(jié)合案例進行分析。
案例1?!癙LoS ONE”(2009)報告了一項評估出生體質(zhì)量與青少年和成人閑暇時間體育活動關(guān)系的隊列研究meta分析。該meta分析納入了13項隊列研究,主要是未發(fā)表數(shù)據(jù),作者宣稱采用了一種“優(yōu)于標(biāo)準(zhǔn)meta分析和系統(tǒng)性文獻評價的方法”,其方法學(xué)和結(jié)果部分均未報告偏倚風(fēng)險評價的相關(guān)內(nèi)容。
該案例沒有對納入的13項臨床研究進行偏倚風(fēng)險評價,這一環(huán)節(jié)的缺失可能對meta分析的最終結(jié)果產(chǎn)生負(fù)面影響。隨著meta分析方法逐漸成熟和普及,近年發(fā)表的系統(tǒng)評價和meta分析文獻,缺失偏倚風(fēng)險評價的情況相對少見。
案例2?!癢omen′s Health”(2007)報道了一項評估激素治療對絕經(jīng)后婦女認(rèn)知功能影響的meta分析,文章未描述偏倚風(fēng)險評價方法,但結(jié)果表格中有隨機和盲法的內(nèi)容,且將隨機區(qū)分為充分隨機化(A類)和隨機化不明確(B類)2種結(jié)果。
上述案例中,作者未詳細(xì)透明地描述所采用的偏倚風(fēng)險評價方法,報告結(jié)果也較簡單,因此無法有效評估納入文獻質(zhì)量。不合理使用偏倚風(fēng)險評價方法的一種情形,是對評價對象使用不恰當(dāng)?shù)脑u價工具,如采用專為RCT類型設(shè)計的Cochrane RoB評價隊列研究或病例對照研究,或采用評價合并后證據(jù)體質(zhì)量的GRADE工具評價文獻質(zhì)量等;還有少數(shù)文獻混淆了報告規(guī)范和評價工具的區(qū)別,將臨床試驗報告規(guī)范CONSORT聲明用于臨床研究的質(zhì)量評價。
案例3?!讹L(fēng)濕病年鑒》(Annals Of The Rheumatic Diseases)雜志2009年發(fā)表一篇meta分析,研究利妥昔單抗、阿巴西普和阿那金治療類風(fēng)濕性關(guān)節(jié)炎期間導(dǎo)致嚴(yán)重感染的風(fēng)險。文章在方法學(xué)部分聲明是按照Cochrane系統(tǒng)評價手冊完成meta分析,并采集了原始研究的方法學(xué)內(nèi)容[單盲或雙盲、是否采用意向性分析(ITT)、完成隨訪人數(shù)],但沒有完整報告,也沒有進一步描述偏倚風(fēng)險評價方法和結(jié)果的內(nèi)容。
案例4。2022年發(fā)表在某刊的一篇meta分析,研究克霉唑陰道給藥制劑治療念珠菌性陰道病的療效、安全性和經(jīng)濟性。該研究“方法學(xué)質(zhì)量評價”描述“按照Cochrane系統(tǒng)評價員手冊(5.0版)對納入試驗進行方法學(xué)質(zhì)量評價”,“評價條目包括:①隨機分配方法;②分配隱藏;③研究者/患者盲法;④結(jié)局測量者盲法;⑤結(jié)局?jǐn)?shù)據(jù)的完整性;⑥選擇性報告結(jié)果;⑦其他偏倚來源,每條1分共7分?!睂?yīng)結(jié)果“所有文獻質(zhì)量評分高于1分?!?/p>
Cochrane RoB是一個定性偏倚風(fēng)險評價工具,包含6個評價條目,針對每個條目給出“高風(fēng)險/低風(fēng)險/不清楚”三者選一的評價結(jié)果,并以圖文形式進行結(jié)果呈現(xiàn)。案例3采集的信息不足以進行RoB評價,且沒有完整地報告結(jié)果;案例4未嚴(yán)格按照RoB評價方法進行操作,采用定量方式對評價結(jié)果進行打分,且以總分形式評價文獻質(zhì)量。以上2種情況均是對RoB工具的誤用,無法充分發(fā)揮該工具的評價功用和效能。
綜上所述,傳統(tǒng)meta分析中文獻質(zhì)量評價的重要性不可忽視,其首要任務(wù)是選擇合適的偏倚風(fēng)險評價工具,同時必須嚴(yán)格執(zhí)行評價標(biāo)準(zhǔn)和流程,確保評價結(jié)果的真實性和可靠性,為臨床實踐和決策提供有力的證據(jù)支持。