周世燦, 張權, 李興旺, 王晨宇, 張軍杰, 葛政, 胡軍紅
結直腸癌是大腸黏膜上皮和腺體發(fā)生的惡性腫瘤,包括結腸癌和直腸癌[1]。2012年世界范圍內診斷的結直腸癌共有136萬例,在男性最常見癌癥中排第3位,在女性中排第2位[2-3]。我國結直腸癌的發(fā)病率在男性中排第5位,在女性中排第4位[4]。由于人口老齡化和西方化的生活方式,結直腸癌對社會造成的經濟負擔會進一步增加[5]。目前,結直腸癌的治療多采用以手術治療為主, 放、化療和靶向治療為輔的多學科綜合治療模式[6]。
臨床實踐指南(clinical practice guidelines,CPGs)是針對患者特定的臨床問題,基于系統(tǒng)評價形成的證據及對各種備選干預方式進行利弊評價之后提出的最優(yōu)臨床指導意見[7-8]。目前國際公認的指南質量評價工具為AGREE-Ⅱ(the Appraisal of Guidelines Research and Evaluation Ⅱ instrument)[9]。為了滿足現(xiàn)階段對中國臨床指南進行評價的需要,我國學者在國外公認的AGREE-Ⅱ的框架下,制定了具有實質性等效的“中國臨床指南評價體系” (AGREE-China)[10]。
近年來,國內許多結直腸癌臨床實踐指南紛紛發(fā)表,但其質量如何尚缺少評價報道。我們采用AGREE-China對中國近3年發(fā)布的結直腸癌診療指南進行質量評價,為今后我國結直腸癌指南制定和更新提供參考。
計算機檢索中國知網數據庫(CNKI)、萬方數據庫(Wanfang Data)、中國生物醫(yī)學文獻數據庫(CBM)、維普中文科技期刊數據庫(VIP),搜集中國的結直腸癌臨床實踐指南,檢索時限為2016年1月1日至2018年12月31日。檢索詞包括:結直腸癌、直腸癌、結腸癌、指南、共識和規(guī)范。如CNKI檢索策略見框1。
框1 CNKI檢索策略
#1 結直腸癌#2 結腸瘤#3直腸癌#4 指南#5 規(guī)范#6 共識#7(#1 OR #2 OR #3)AND(#3 OR #4 OR #5)
研究的疾病為結直腸癌;符合指南定義的文獻,包括臨床指南、診療規(guī)范和專家共識;對疾病的干預提出指導性意見。指南排除標準:重復發(fā)表的文獻;對國外指南的翻譯或改編;非診療指南;中醫(yī)指南等。
由2位研究者獨立篩選文獻、導入至endnote,使用endnote的查重功能,刪除重復指南,先后閱讀指南題目與文獻摘要,篩除不符合本研究需求的指南。再對指南全文進行查閱,瀏覽全文,最終確定入選指南。
正式評價前,2位評價員進行AGREE-China條目的系統(tǒng)培訓,確保對每個條目的理解基本一致。評價員根據AGREE-China對納入的指南進行質量評價。AGREE-China包括5個領域15個條目,5個領域分別為:科學性/嚴謹性;有效性/安全性;經濟性;可用性/可行性;利益沖突。每個條目的分值標準從0分(完全不符合)到5分(完全符合)。每個領域根據評分公式計算得分率,公式為:(實際得分-最低可能得分)/(最高可能得分-最低可能得分)×100%。評價完成后,根據對該指南整體的印象,分為強推薦(臨床上可應用性很好)、弱推薦(臨床上可應用性差)和不推薦。
AGREE-China各領域最終得分運用Excel 2016軟件進行整理并用平均數表示。在開始評價前進行預評價,并使用SPSS19.0軟件進行組內相關系數分析(interclass correlation coefficient,ICC)。當 ICC>0.9時才開始正式評價,以確保不同研究者間評價的一致性。
共納入10部指南[11-20],文獻篩選流程及結果見圖1。納入指南的基本特征見表1,結果顯示:在應用類別方面,3部為診療指南[12,16-17],1 部為診斷指南[18],6部為治療指南[11,13-15,19-20];發(fā)表時間方面:2016 年1部[11],2017年4部[12-15],2018年5部[16-20];報告基金資助和利益聲明情況:所有指南均未報告有無基金資助和利益沖突;更新情況:僅1部[12]提及會進行適時更新,但未清楚說明更新周期及步驟。
圖1 文獻篩選流程及結果*所檢索的數據庫及檢出文獻數具體如下:CBM(n=887)、Wanfang Data(n=1 082)、CNKI(n=303)、VIP(n=177)
表1 2016—2018年發(fā)表的中國結直腸癌臨床實踐指南的基本特征
指南名稱發(fā)表年制定機構是否為循證指南是否為更新版參考文獻結直腸癌營養(yǎng)治療指南[11]2016中國抗癌協(xié)會、中國抗癌協(xié)會腫瘤營養(yǎng)與支持治療專業(yè)委員會、中國抗癌協(xié)會腫瘤康復與姑息治療專業(yè)委員會、中國醫(yī)師協(xié)會營養(yǎng)醫(yī)師專業(yè)委員會、中國營養(yǎng)學會臨床營養(yǎng)分會否否12結直腸癌腹膜轉移診治中國專家意見(2017)[12]2017中國醫(yī)師協(xié)會結直腸腫瘤專委會腹膜腫瘤專業(yè)委員會否否41結直腸癌術中腹腔化療專家意見(2017 版)[13]2017中國醫(yī)師協(xié)會結直腸腫瘤專業(yè)委員會否否21結直腸腫瘤經自然腔道取標本手術專家共識(2017)[14]2017中國NOSES聯(lián)盟、中國醫(yī)師協(xié)會結直腸腫瘤專業(yè)委員會NOSES專委會否否18直腸癌經肛全直腸系膜切除專家共識及手術操作指南(2017版)[15]2017中華醫(yī)學會外科學分會結直腸外科學組、中華醫(yī)學會外科學分會腹腔鏡與內鏡外科學組否否51中國結直腸癌診療規(guī)范(2017年版)[16]2018中華人民共和國衛(wèi)生和計劃生育委員會醫(yī)政醫(yī)管局、中華醫(yī)學會腫瘤學分會否是0中國結直腸癌肝轉移診斷和綜合治療指南(2018版) [17]2018中華醫(yī)學會外科分會胃腸外科學組、中華醫(yī)學會外科分會結直腸外科學組、中國抗癌協(xié)會大腸癌專業(yè)委員會、中國醫(yī)師協(xié)會外科醫(yī)師分會結直腸外科醫(yī)師委員會、中國醫(yī)師協(xié)會肛腸醫(yī)師分會腫瘤轉移委員會、中國醫(yī)師協(xié)會結直腸腫瘤專業(yè)委員會、中國臨床腫瘤學會(CSCO)結直腸癌專家委員會、中國醫(yī)療保健國際交流促進會結直腸癌肝轉移治療專業(yè)委員會是是353結直腸癌分子生物標志物檢測專家共識[18]2018《結直腸癌分子生物標志物檢測專家共識》編寫組否否18腹腔鏡結直腸癌根治術操作指南 (2018版)[19]2018中華醫(yī)學會外科學分會腹腔鏡與內鏡外科學組、中華醫(yī)學會外科學分會結直腸外科學組、中國醫(yī)師協(xié)會外科醫(yī)師分會結直腸外科醫(yī)師委員會、中國抗癌協(xié)會大腸癌專業(yè)委員會腹腔鏡外科學組否是33結直腸癌肺轉移多學科綜合治療專家共識(2018版)[20]2018中國醫(yī)師協(xié)會外科醫(yī)師分會多學科綜合治療專業(yè)委員會、中國抗癌協(xié)會大腸癌專業(yè)委員會否否115
5個領域中,科學性/嚴謹性得分較為均衡,利益沖突、經濟性領域得分普遍較低。結果見表2。
2.2.1 科學性與嚴謹性領域 該領域的評價指標包括指南制定小組是否由相關的多學科團隊組成;制定指南的背景、目的和應用對象;是否使用了正確、全面的文獻檢索策略進行證據檢索,并提供了全部參考文獻列表;是否對檢索到的證據進行質量評價,并對證據/證據體進行分級;是否說明了從證據到形成推薦意見的方法;是否列出了推薦意見的推薦等級;發(fā)表前有無經過外部專家的評議;是否有指南的更新計劃。評價結果為21.10%,該領域評分較低。所納入指南都是由相關的多學科團隊參與制定,但都未強調是否有方法學專家參與指南制定。大多數指南都有明確的制定背景和目的,僅1部指南[17]有明確的使用者和使用對象,大部分指南使讀者不能很快分辨此指南是否與其相關,是否應該參考。
表2 2016—2018年發(fā)表的中國結直腸癌臨床實踐指南的質量評價
指南名稱各領域評價結果科學性/嚴謹性有效性/安全性經濟性可用性/可行性利益沖突結直腸癌營養(yǎng)治療指南[11]10.91%0053.30%0結直腸癌腹膜轉移診治中國專家意見(2017)[12]17.27%10.00%060.00%0結直腸癌術中腹腔化療專家意見(2017 版)[13]14.55%10.00%060.00%0結直腸腫瘤經自然腔道取標本手術專家共識(2017)[14]14.55%10.00%060.00%0直腸癌經肛全直腸系膜切除專家共識及手術操作指南(2017版)[15]14.55%0060.00%0中國結直腸癌診療規(guī)范(2017年版)[16]10.91%10.00%060.00%0中國結直腸癌肝轉移診斷和綜合治療指南(2018版)[17]53.64%10.00%60.00%93.00%0結直腸癌分子生物標志物檢測專家共識[18]14.55%0060.00%0腹腔鏡結直腸癌根治術操作指南 (2018版)[19]45.55%0073.00%0結直腸癌肺轉移多學科綜合治療專家共識(2018版)[20]14.55%0060.00%0
大多數指南都有PICO問題,并附以文獻,但未列出關鍵詞、檢索策略、與主題相關的數據庫、文獻篩查標準、時間、檢索流程等。僅1部指南[16]未列出參考文獻。僅2部指南[17,19]有證據級別,并有證據級別定義、從證據級別到推薦意見的形成過程的說明,但是不具體,如投票情況,也沒有考慮證據以外的其他因素。僅2部指南[17,19]的推薦意見有非常明確的等級定義和等級,如強推薦或弱推薦。所納入指南發(fā)表前均不可知是否有制定小組之外的專家審閱。僅1部指南[12]報道指南會適時更新,但未清楚描述更新周期及具體步驟,這些都是指南制定科學性與嚴謹性的不足。
2.2.2 安全性與有效性領域 此領域評價指標主要包括:推薦方案的有效性:同一臨床問題,如有備選方案,列出備選方案,列出效應大小的具體數據;推薦方案的安全性:推薦意見考慮了不良作用和安全性,列出安全性相關具體數據。評價結果為 5%。10部指南在安全性與有效性領域得分均較低。10部指南[11-20]對所有的推薦方案的療效均無明確的療效說明,更無具體數據來支持。有5部指南[11,15,18-20]考慮到了有效性問題,但很少的推薦方案(<25%)提及有不良反應,且沒有具體數據。其余5部指南[12-14,16-17]均未考慮各個推薦方案的安全性問題和不良反應。
2.2.3 經濟性領域 此領域評價指標主要包括:推薦方案是否經過了衛(wèi)生經濟學的評價,如進行了成本-效果分析,推薦的方案應該是有效而經濟的。評價結果為6%。納入的大部分指南均未進行衛(wèi)生經濟學的評價。
2.2.4 可用性與可行性領域 此領域評價指標主要包括:指南表達清晰,推薦意見明確不含糊,容易理解;指南容易獲得和推廣;指南檢索和評估了中國研究的證據。評價結果為63.97%。納入的10部指南在此領域的得分均較高。其中僅1部指南[11]在此領域的得分<60%。
2.2.5 利益沖突領域 此領域評價指標主要包括:指南制定過程有“利益沖突聲明”。評價結果為0。所納入的10部指南均未說明指南制定小組成員是否有利益沖突,如果有利益沖突,是否會影響到指南的推薦意見。指南中也未出現(xiàn)藥物或器械的商品名、對贊助商的致謝。
2.2.6 總體評價 所有指南AGREE-China的5個領域平均得分率從高到低依次為:可用性/可行性為 63.97%,科學性/嚴謹性為21.10%,經濟性為6.00%,有效性/安全性為5.00%,利益沖突為0。其中可用性/可行性為63.97%,所納入指南的得分均>50.00%,而其他各領域的得分則均<30.00%。在10篇指南中《中國結直腸癌肝轉移診斷和綜合治療指南(2018版)》[17]的綜合得分最高。通過比較不同年份發(fā)表的臨床實踐指南各領域平均得分率情況發(fā)現(xiàn),2018年臨床實踐指南的質量較2016年、2017年有所提高,尤其是在領域1、領域3和領域4。另外,通過比較循證指南與非循證指南各領域平均得分率情況發(fā)現(xiàn),除安全性/有效性及利益沖突兩個領域外,循證指南[17]在其他所有領域的得分率均高于非循證指南(圖2)。我國近3年結直腸癌診療指南的質量較低。全面評估后,納入指南僅有2部[17,19]為強推薦,其余8部均為弱推薦。
圖2 2016、2017、2018年發(fā)表的中國結直腸癌臨床實踐指南質量評價結果的比較Ⅰ:科學性/嚴謹性;Ⅱ:安全性/有效性;Ⅲ:經濟性;Ⅳ:可用性/可行性;Ⅴ:利益沖突
圖3 循證和非循證指南AGREE-China各領域平均得分率比較Ⅰ:科學性/嚴謹性;Ⅱ:安全性/有效性;Ⅲ:經濟性;Ⅳ:可用性/可行性;Ⅴ:利益沖突
隨著醫(yī)學的不斷發(fā)展,我國制訂的臨床指南數量逐年增長,但其質量卻參差不齊。本文納入的10篇指南總體質量不高,納入指南僅有2部為強推薦,其余8部均為弱推薦。
在AGREE-China的5個領域中,利益沖突領域平均得分率最低。這10篇指南在檢索策略、檢索證據的納入和排除標準、有無贊助單位以及制訂小組成員的利益沖突方面全無描述,也均未考慮或收集目標人群的觀點和選擇,同時在發(fā)表之前均未經外部專家評審。另外,我國指南的制訂小組成員中往往只包括臨床專家,缺少統(tǒng)計學專家、方法學專家、其他相關專業(yè)人員及患者的參加。
在納入的所有指南中,《中國結直腸癌診療規(guī)范(2017年版)》[16]、《中國結直腸癌肝轉移診斷和綜合治療指南(2018版)》[17]和《腹腔鏡結直腸癌根治術操作指南(2018版)》[19]均屬于更新指南,更新時間分別為2年、2年和10年。Paul Shekelle等[21]指出當原有干預措施利弊平衡發(fā)生改變、出現(xiàn)新干預措施、結局指標改變或醫(yī)療資源發(fā)生改變時,為保證指南的高質量應及時進行更新修訂。同時有研究表明指南的更新時間不應超過3年[22],然而目前我國只有10% 的指南進行了更新修訂,而且平均更新時間為5.1年[23]。同時,這10篇指南在今后是否會進行更新、更新過程與方法上均鮮有描述。
在所有指南中只有1篇是循證指南,即《中國結直腸癌肝轉移診斷和綜合治療指南(2018版)》[17],同時這篇也是得分最高的指南。循證指南將推薦意見與證據質量結合起來,通過證據質量評價結果來確定推薦意見,被譽為是證據與臨床實踐之間的紐帶[24]。因此循證指南的質量往往要明顯高于非循證指南。當前我國在CPGs制訂的方法學上與國際仍存在較大差距,納入的10部指南大多是非循證指南,指南的推薦意見大部分是依靠制訂小組的專家經驗達成共識,缺少循證證據的支持。因此,我們要用循證醫(yī)學的方法努力制訂出高質量和服務于臨床的實踐指南。
本文的局限性:僅納入結直腸癌診療方面的臨床指南,而將中醫(yī)指南及預防、診斷等不含治療性質的指南或共識排除,可能存在選擇偏倚;納入的指南可能受到版面篇幅及政策發(fā)布格式的限制而不能將指南制訂的全部內容展現(xiàn)出來,可能影響AGREE-China對指南的評價結果;AGREE-China并未明確指出哪些評價條目和質量維度是評估指南質量必不可少的,也未對強弱推薦給出一個客觀的指標,從而使評價結果的主觀性加大;雖然AGREE-China更容易被學習和使用,但評價員可能對AGREE-China的某些條目理解不夠透徹,從而影響了指南的最終評價結果。
綜上所述,為了今后我國能夠科學、規(guī)范地制訂出更多高質量的結直腸癌CPGs,我們建議:制訂小組成員中應有統(tǒng)計學、方法學及其他相關專業(yè)的專家參與,由專業(yè)人員進行相關證據的全面檢索搜集,并且明確說明方法學專家的角色以及在指南制定中所起的作用;指南不僅要說明制定指南的背景、目的也要明確應用對象和使用者;注重以循證醫(yī)學為基礎的CPGs制訂方法,提前制訂出詳細的檢索策略及證據的納入和排除標準;指南中要有對證據的任何質量評價和分級,并有證據級別定義和證據概要表;運用 GRADE系統(tǒng)將最終的推薦意見與證據的質量緊密聯(lián)系起來,并且要并清晰寫明形成過程以及存在爭議時的處理方法,并同時考慮了上述的各種因素的利弊平衡;推薦意見應該有非常明確的等級定義和等級,如強推薦或弱推薦。盡量保證每一條推薦意見,都有明確的推薦等級;制訂的指南需通過外部專家的評審后才能予以公開發(fā)布,并要說明外部專家組成結構的合理性和專家的相關性和權威性;成立專門的指南更新小組,定期監(jiān)測評估證據的變化并及時對指南做出更新修訂,提高指南質量;對于同一臨床問題,如果有不同的備選方案,應該都寫清楚,方便不同的臨床醫(yī)師選擇。對不同方案的效果要有客觀的評價,有具體的數據支持。同時也要注意制定推薦意見時不僅要考慮療效,也要考慮不良反應和安全性,在指南中應該說明該推薦方案的安全性問題,會導致什么不良反應并給出相關數據;指南中應明確描述贊助單位及制訂小組成員的利益沖突,并經過衛(wèi)生經濟學的評價。
總之,近3年我國結直腸癌臨床實踐指南的質量評價結果顯示,臨床實踐指南制定已逐步趨于規(guī)范,但高質量的臨床實踐指南仍然相對缺乏,與歐美國家有較大差距,究其原因可能與高質量的臨床研究不足、參與指南制定的團隊分工不明確等因素密切相關。國內研究者應逐步做到指南制定的規(guī)范、準確,并在強調質量控制的同時加強多中心合作,實施更高質量的結直腸癌相關RCT研究,為指南制定提供高級別證據支持,推動我國在臨床實踐指南制定領域的進一步快速發(fā)展。