王瑞平
(上海市皮膚病醫(yī)院臨床研究與創(chuàng)新轉(zhuǎn)化中心 上海 200443)
隨著信息化技術(shù)的發(fā)展和大數(shù)據(jù)時代的來臨,醫(yī)學研究數(shù)據(jù)的可及性和采集便捷性大幅提升,真實世界研究(real world study, RWS)成為醫(yī)學研究的熱點之一。RWS是通過收集真實世界環(huán)境中與患者有關(guān)的數(shù)據(jù),即真實世界數(shù)據(jù)(real world data, RWD),通過數(shù)據(jù)清洗、治理和統(tǒng)計分析,獲得醫(yī)療產(chǎn)品的使用價值及潛在獲益和風險的臨床證據(jù)。基于RWS產(chǎn)生的真實世界證據(jù)(real world evidence, RWE)提供了洞察藥物和醫(yī)療器械在日常醫(yī)療實踐中實際的使用方式、使用問題以及毒性和療效結(jié)果的真實信息。因此,RWS是臨床試驗和藥品上市后再評價藥物療效的一種現(xiàn)代醫(yī)學研究新方法。RWS作為臨床研究的一種新形式同樣需要遵循臨床研究的一般原則,經(jīng)過良好的設(shè)計、高質(zhì)量的數(shù)據(jù)和可靠的統(tǒng)計方法從而產(chǎn)生高質(zhì)量RWD。本文從RWS的概念入手,介紹真實世界臨床研究的分類,設(shè)計特點和要點,并舉例說明,以期為研究人員真實世界臨床研究提供依據(jù)和參考。
RWS是指運用流行病學研究方法,在真實無偏倚或偏倚較少的人群中收集與患者有關(guān)的數(shù)據(jù),通過分析,獲得醫(yī)療產(chǎn)品的使用價值及潛在獲益或風險的臨床證據(jù),是臨床試驗和藥品上市后再評價藥物療效的一種現(xiàn)代醫(yī)學研究新方法。RWS概念的提出可追溯至1993年,Kaplan等[1]首次以發(fā)表論文的形式明確提出了RWS的概念。十余年來RWS逐漸興起,尤其是2016年底,美國國會公布的《21世紀治愈法案》提出,將采用RWE用于藥品醫(yī)療器械審批,引發(fā)業(yè)內(nèi)極大關(guān)注[2]。2019年4月,美國FDA基于RWD批準了輝瑞的愛博新一項新適應(yīng)證后,RWS成為制藥巨頭拓展的重要方向[3]。
2007年,RWS的概念首次出現(xiàn)在中文科技文獻[4]。隨著歐美國家對RWS相關(guān)法案的提出和實踐,我國學者也逐步開展了對RWS的探索和應(yīng)用。2018年8月,在第八屆中國腫瘤學臨床試驗發(fā)展論壇上,吳階平醫(yī)學基金會和中國胸部腫瘤研究協(xié)作組攜手發(fā)布中國首個《中國真實世界研究指南(2018年版)》[5]。2019年4月,國家藥品監(jiān)督管理局啟動實施中國藥品監(jiān)管科學行動計劃,把“將真實世界數(shù)據(jù)用于醫(yī)療器械臨床評價的方法學研究”列為首批9個行動計劃項目中的一項,標志著中國藥品監(jiān)管部門正式啟動將RWD/RWE用于審評審批方面的探索與研究[6]。2019年12月,國家藥品監(jiān)督管理局醫(yī)療器械技術(shù)審評中心發(fā)布《真實世界數(shù)據(jù)用于醫(yī)療器械臨床評價技術(shù)指導(dǎo)原則(征求意見稿)》[7]。2020年1月,國家藥品監(jiān)督管理局的第一號文件、國內(nèi)首個《真實世界證據(jù)支持藥物研發(fā)與審評的指導(dǎo)原則(試行)》[8]發(fā)布,就此,我國藥品的研發(fā)與評價進入一個新的階段。2020年8月,國家藥品監(jiān)督管理局藥品審評中心發(fā)布《真實世界研究支持兒童藥物研發(fā)與審評的技術(shù)指導(dǎo)原則(試行)》[9]。2020年11月,國家藥品監(jiān)督管理局發(fā)布《真實世界數(shù)據(jù)用于醫(yī)療器械臨床評價技術(shù)指導(dǎo)原則(試行)》[10]。2021年3月,國家藥品監(jiān)督管理局印發(fā)《國家藥監(jiān)局關(guān)于認定第二批重點實驗室的通知》[11],海南RWD研究與評價重點實驗室獲得國家藥監(jiān)局認定,標志全國首個RWD研究與評價重點實驗室落戶海南,RWS在我國進入新階段。
如前所述,RWS的方法仍歸屬于經(jīng)典的流行病學研究,包括描述性研究和臨床試驗研究。如圖1所示,根據(jù)研究者在開展RWS設(shè)計時是否采取干預(yù)措施,RWS可以分為觀察性真實世界研究(observational real world study, ORWS)和干預(yù)性真實世界研究(interventional real world study, IRWS)。對于ORWS,可以根據(jù)是否設(shè)置對照組分為描述性研究(descriptive study)和分析性研究(analytical study)。描述性研究包括“基于健康信息系統(tǒng)(health information system, HIS)數(shù)據(jù)分析”“現(xiàn)況研究(cross-sectional study)”和“縱向研究(longitudinal study)”,而分析性研究包括經(jīng)典的病例對照研究(case control study)和隊列研究(cohort study),縱向研究和隊列研究又可以統(tǒng)稱為注冊登記研究。對于IRWS,主要采用實用性臨床試驗(pragmatic clinical trial, PCT)開展。傳統(tǒng)臨床試驗要求有嚴格定義和篩選的受試者、有經(jīng)驗的研究者以及較小的樣本量開展,檢驗理想條件下干預(yù)措施的療效,容易高估臨床獲益和安全性,可能不適合指導(dǎo)臨床實踐。為了揭示干預(yù)措施在真實世界人群中的有效性,PCT的開展十分必要,其研究對象的納入條件相對寬泛,干預(yù)措施貼近臨床實際,研究結(jié)論有更好的臨床適用性,受到廣泛關(guān)注。
圖1 RWS分類
例如經(jīng)典流行病學,其對“病因探索”和“干預(yù)效果評價”的研究方案選擇一般遵循“描述性研究-分析性研究-實驗性研究”的順序,從揭示現(xiàn)象到探索病因,由淺入深。在缺少研究經(jīng)費支持、研究者的臨床研究經(jīng)驗不足或?qū)茖W問題認知較淺的情況下,研究者可選擇“基于HIS數(shù)據(jù)分析”的RWS方案開展研究。如在李家誠等[12]一篇題為“便秘患者的特征及中藥治療用藥歸經(jīng)特點分析”的研究中,作者便是利用醫(yī)院HIS系統(tǒng)數(shù)據(jù),經(jīng)數(shù)據(jù)清理和統(tǒng)計分析,探討了便秘患者的臨床特征,中藥治療療效及藥物歸經(jīng)特點。該類RWS的優(yōu)點是,研究數(shù)據(jù)基于HIS系統(tǒng)既往產(chǎn)生數(shù)據(jù),反映臨床客觀事實,獲取方便,數(shù)據(jù)量大,研究成本低,適合臨床關(guān)注問題的前期探索。但由于缺少前期研究設(shè)計,數(shù)據(jù)質(zhì)量較差,多中心研究時設(shè)計數(shù)據(jù)標準化問題,數(shù)據(jù)庫清洗須花費較大精力。
現(xiàn)況研究:又稱為橫斷面研究,是描述性研究最常用的類型,一般通過描述某個特定時間點或時期和特定范圍人群中的疾病或健康分布情況,以及暴露因素在人群中的分布特點,來初步探討暴露與疾病或健康的關(guān)系。由于現(xiàn)況研究,不設(shè)置對照組,僅能計算疾病的患病率,因此也稱為患病率研究。例如筆者作為通信作者于《Frontiers in Medicine》發(fā)表的一篇研究“銀屑病患者吸煙率及其與銀屑病嚴重程度關(guān)系:橫斷面調(diào)查”[13]就是一項橫斷面研究。
縱向研究:是指在不同的時間點對同一人群的疾病、健康狀況和某些因素進行調(diào)查,以了解這些因素隨時間的變化情況。例如對事先建立的銀屑病患者隊列人群每間隔一年開展一次隨訪,觀察銀屑病患者的疾病復(fù)發(fā)特征,代謝綜合征發(fā)病情況等,就屬于縱向研究。縱向研究在時間上是前瞻性的,在性質(zhì)上屬于描述性研究,可以是若干次橫斷面結(jié)果的串聯(lián)分析。通常,縱向研究可以用于病因分析,研究疾病的發(fā)生、發(fā)展和轉(zhuǎn)歸研究。
病例對照研究:是分析性研究最基本、最重要的一種研究類型。如圖2所示,病例對照研究以現(xiàn)有確診患有某種疾病的患者作為病例,以未患有該種疾病但具有可比性的個體作為對照,通過詢問、實驗室檢測、環(huán)境因素暴露測量等方式收集既往各種可能的危險因素暴露史,測量比較病例組和對照組中各因素的暴露比例差異,若經(jīng)統(tǒng)計學檢驗差異有統(tǒng)計學意義,則可以認為暴露因素與疾病之間存在統(tǒng)計學關(guān)聯(lián)。在評估各種偏倚對研究結(jié)果的影響后,借助病因推斷技術(shù),綜合判定某個或某些暴露因素是否為疾病的危險因素,達到探索或檢驗疾病病因假設(shè)的目的。
圖2 病例對照研究原理示意圖
隊列研究是分析性研究另外一種重要研究類型。如圖3所示,隊列研究是在一個特定人群中選擇所需的研究對象,根據(jù)研究對象目前或過去某個時期是否暴露于研究的因素或不同的暴露水平將研究對象分為不同組別,如暴露組和非暴露組,高劑量暴露組和低劑量組;通過詢問、實驗室檢測和問卷調(diào)查等方法采集相關(guān)信息;隨訪觀察一段時間后,觀察登記不同暴露人群的結(jié)局事件發(fā)生情況,比較各組結(jié)局的發(fā)生率,從而評估和檢驗危險因素與結(jié)局的關(guān)系。
圖3 隊列研究原理示意圖
PCT是指盡可能接近真實世界臨床實踐的臨床試驗,又稱實效臨床試驗,其概念由Schwartz和Lellouch在1967年首次提出[14]。PCT整體上仍須遵循隨機對照實驗(randomized controlled trial, RCT)研究設(shè)計的指導(dǎo)原則,其實用性主要體現(xiàn)在研究者與受試者招募、干預(yù)措施及其實施、研究隨訪和研究結(jié)果的確定與分析等方面。2005年,由25個國際研究者和方法學專家組成團隊提出了PRECIS(pragmatic-explanatory continuum indicator summary)工具,幫助研究者從9個維度了解某項臨床試驗的實用程度,在試驗設(shè)計階段明確試驗設(shè)計目標及其結(jié)果的實用性,以保證臨床試驗的實施和最初預(yù)期研究目標一致。此外,隨機對照試驗報告統(tǒng)一標準(consolidated standards of reporting trials, CONSORT)聲明專家組亦發(fā)布了基于CONSORT聲明的實用性補充條款,幫助研究者評估臨床試驗結(jié)果的實用性。
不同類別RWS的設(shè)計應(yīng)相應(yīng)地參考同類的流行病學研究開展研究設(shè)計,包括研究現(xiàn)場的選擇,研究對象的確定,樣本量估算,資料采集,干預(yù)措施實施和評估(IRWS),質(zhì)量控制和統(tǒng)計分析等內(nèi)容。本文僅介紹PCT的設(shè)計要點,其余類別的RWS設(shè)計要點和規(guī)范可參考其他工具書和教材。
PCT是測量干預(yù)效果(effectiveness)的臨床試驗,指在常規(guī)條件或?qū)嶋H臨床情況下,干預(yù)措施產(chǎn)生的效果。而解釋性RCT評價的干預(yù)措施的特異性療效(efficacy),是指干預(yù)措施在嚴格控制的理想條件下,在經(jīng)過嚴格標準篩選后的受試者產(chǎn)生的治療作用。PCT的特征包括:①PCT本質(zhì)上屬于RCT研究,因此必須隨機分組;②PCT主要用于評估臨床中實際應(yīng)用2種或多種干預(yù)措施綜合臨床效果的差異;③因其設(shè)計為貼近臨床實際的RWS,常用標準治療作為對照,不設(shè)安慰劑對照;④沒有受試者盲法,克服信息偏倚的能力弱于常規(guī)RCT研究,常通過信息采集者、結(jié)局評價者、統(tǒng)計分析人員盲法提高研究結(jié)果的可靠性。表1概括了PCT和RCT的特點和差異性比較,供參考。
表1 RCT和PCT的比較
在開展PCT研究設(shè)計時,應(yīng)遵循“代表性、真實性、可比性和顯著性”的指導(dǎo)思想。代表性是保證研究結(jié)果科學性的基礎(chǔ),研究者應(yīng)重視研究對象的隨機化選擇,提高樣本代表性。同時在研究開展過程中,關(guān)注研究對象的失訪率,評估脫落對研究結(jié)果的影響。真實性是反映客觀事物的正確程度。研究者在開展研究設(shè)計時應(yīng)重視資料收集和試驗指標的測量方法,采取措施控制研究過程中可能存在的3種類型偏倚??杀刃允强茖W性的表現(xiàn)。兩事物之間有比較才能有鑒別,有比較才能發(fā)現(xiàn)差異,而比較的前提是兩事物之間具有可比性。臨床研究強調(diào)全過程的可比性(對象選擇、測量、資料收集)。顯著性要求研究者在進行PCT設(shè)計時應(yīng)從統(tǒng)計學顯著性檢驗角度,評價抽樣誤差大?。é粒?.05),在樣本量估算和統(tǒng)計分析描述中給予體現(xiàn)。具體到設(shè)計的細節(jié),研究者同樣應(yīng)根據(jù)PICO原則和CONSORT聲明,從“研究對象選擇”“納入標準和排除標準”“樣本量估算”“隨機化分組”“盲法及設(shè)置”“干預(yù)措施實施”“療效評估”“質(zhì)控控制”“數(shù)據(jù)集”“統(tǒng)計分析”等10個維度進行認真考量,撰寫并執(zhí)行規(guī)范的PCT。
盡管PCT具有較好的外推性,但其實施過程中也存在一些挑戰(zhàn):第一,研究設(shè)計限制較少,研究方案較簡單,研究者和受試者存在異質(zhì)性,尤其當干預(yù)效果依賴于實施人員的專業(yè)性時,例如手術(shù)類臨床試驗,樣本量需要足夠大才能揭示研究的異質(zhì)性并保證檢驗效能;第二,干預(yù)措施通常不設(shè)盲,可能引入更多偏倚,但可對結(jié)局指標的測量實施評估者盲法;第三,研究數(shù)據(jù)的收集主要依賴于電子醫(yī)療信息和健康檔案系統(tǒng),部分國家和地區(qū)數(shù)字化和信息化水平較低時難以開展;第四,研究終點的選擇應(yīng)為重要臨床事件,部分由患者自報,其收集、判定、分析和解讀受到數(shù)據(jù)類型和質(zhì)量的影響而面臨挑戰(zhàn)。