李新旭
博濟(jì)醫(yī)藥科技股份有限公司
博濟(jì)數(shù)據(jù)科技(北京)有限公司
橋接研究(bridging study)和多區(qū)域臨床試驗(multiregional clinical trial,MRCT)是藥物研發(fā)全球化背景下衍生出的不同概念,兩者在減少全球重復(fù)研究以及縮短全球上市時間等方面發(fā)揮了不同程度的積極作用。早在1998 年ICH 就發(fā)布了E5,后編碼更新為E5(R1),為了在接受國外臨床試驗數(shù)據(jù)時評估種族因素影響,提出國外臨床試驗數(shù)據(jù)橋接研究的概念[1];2003年ICH 發(fā)布了E5 問答,后編碼更新為E5 問答(R1),首次提及MRCT 的概念[2]。然 而,直到2017 年ICH 才發(fā)布 了E17,提出MRCT 計劃與設(shè)計的一般原則,正式確定MRCT 的概念[3]。我國已經(jīng)在2019 年11 月開始適 用ICH E5(R1)、E5 問 答(R1)和E17[4]。雖然橋接研究和MRCT 均有各自的ICH 指南,但兩者在方法學(xué)上仍處于百家爭鳴的狀態(tài),而且在實踐中兩者的方法學(xué)經(jīng)常被混淆。為了幫助申辦者正確理解和合理應(yīng)用確證藥物有效性的橋接研究和MRCT,本文從統(tǒng)計學(xué)角度對兩者進(jìn)行了系統(tǒng)性比較,并闡述了在方法學(xué)上的不同考慮。如無特別說明,本文中“區(qū)域”可指地理區(qū)域、國家或監(jiān)管區(qū)域[3]。
當(dāng)在國外已經(jīng)完成全部臨床研發(fā)過程的藥物在新目標(biāo)區(qū)域申請注冊審批時,如果國外臨床試驗數(shù)據(jù)符合新目標(biāo)區(qū)域監(jiān)管機(jī)構(gòu)的注冊要求,基于盡可能減少重復(fù)的臨床研究并盡快為患者提供可獲益的藥物的目的,推薦接受國外臨床資料;如果認(rèn)為種族因素可能改變藥物在新目標(biāo)區(qū)域人群中的安全性或有效性,則可能需要在新目標(biāo)區(qū)域獲得額外臨床數(shù)據(jù),從而能將國外臨床數(shù)據(jù)外推到新目標(biāo)區(qū)域,以滿足新目標(biāo)區(qū)域的監(jiān)管要求。這些為了在新目標(biāo)區(qū)域獲得額外臨床數(shù)據(jù)而開展的臨床研究被稱為橋接研究[1]。在ICH E5/E5(R1)中,橋接研究包括臨床藥理學(xué)終點、臨床終點和安全性的橋接研究等[1]。如無特別說明,本文主要指臨床終點的橋接研究。
為了推進(jìn)藥物在全球同步研發(fā)和同步上市,在滿足各目標(biāo)區(qū)域監(jiān)管機(jī)構(gòu)的注冊要求的前提下,可按照同一個方案在多個目標(biāo)區(qū)域同步實施臨床試驗,其數(shù)據(jù)可以用于同步提交至多個目標(biāo)區(qū)域監(jiān)管機(jī)構(gòu)申請藥物的注冊審批或用于滿足這些監(jiān)管機(jī)構(gòu)所要求的上市后研究,以實現(xiàn)減少各目標(biāo)區(qū)域單獨實施臨床研究的數(shù)量,從而盡可能減少不必要的重復(fù)研究和提高藥物研發(fā)效率的目的。這些按照同一個方案在多個目標(biāo)區(qū)域同步實施的臨床試驗被稱為MRCT[3]。ICH E17 提及了早期的(如探索性階段)MRCT 和確證性MRCT[3],本文主要指確證藥物有效性的MRCT。
2.1.1 其目的都是減少重復(fù)研究
在新目標(biāo)區(qū)域開展橋接研究,以少量的額外臨床數(shù)據(jù)作為補充,促進(jìn)新目標(biāo)區(qū)域接受國外臨床試驗數(shù)據(jù),即允許將國外臨床試驗數(shù)據(jù)外推到新目標(biāo)區(qū)域,以實現(xiàn)盡可能減少重復(fù)的臨床研究且能支持藥品在新目標(biāo)區(qū)域注冊的目的[1]。MRCT 可以推進(jìn)藥物在全球同步研發(fā),從而減少各目標(biāo)區(qū)域單獨實施臨床研究的數(shù)量,以實現(xiàn)盡可能減少不必要的重復(fù)研究和提高藥物研發(fā)效率的目的[3]。
2.1.2 都需要滿足各目標(biāo)區(qū)域的監(jiān)管要求
國外臨床試驗數(shù)據(jù)必須符合新目標(biāo)區(qū)域的研究設(shè)計和實施標(biāo)準(zhǔn),遵循新目標(biāo)區(qū)域的監(jiān)管要求。當(dāng)種族因素可能改變藥物在新目標(biāo)區(qū)域人群中的安全性或有效性時,通過橋接研究,以少量的額外臨床數(shù)據(jù)作為補充,促進(jìn)國外臨床試驗數(shù)據(jù)滿足新目標(biāo)區(qū)域的監(jiān)管要求[1]。在MRCT 計劃階段,鼓勵申辦者與各目標(biāo)區(qū)域監(jiān)管機(jī)構(gòu)進(jìn)行有效溝通,目的是獲得這些監(jiān)管機(jī)構(gòu)對全球研究設(shè)計方法的認(rèn)可[3]。
2.1.3 都需要評價區(qū)域間治療效應(yīng)一致性
如果橋接研究證實,在新目標(biāo)區(qū)域的量效關(guān)系、安全性和有效性與國外相似,或者在新目標(biāo)區(qū)域不同劑量下的安全性和有效性結(jié)果與原區(qū)域沒有較大差異,通??蓪馀R床試驗數(shù)據(jù)外推到新目標(biāo)區(qū)域[1]。MRCT 的統(tǒng)計分析策略包括評價各目標(biāo)區(qū)域或各亞群治療效應(yīng)一致性,治療效應(yīng)的一致性定義為不同目標(biāo)區(qū)域或亞群中的治療效應(yīng)無臨床相關(guān)差異[3]。
2.1.4 其定義存在相互交叉的情況
可以在全球研發(fā)計劃開始時、進(jìn)行中或結(jié)束時開展橋接研究,即可以在計劃全球同步注冊的研發(fā)方案中實施出于橋接目的的MRCT[2]。如果MRCT 是作為橋接策略的數(shù)據(jù)來源,則MRCT可提供比單區(qū)域試驗更可靠的證據(jù)用于研究結(jié)果的外推[3]。為了便于區(qū)別,在本文后述內(nèi)容中,將出于橋接目的的MRCT 歸入“MRCT”,不歸入“橋接研究”。
2.2.1 實施的前提條件不同
相對的種族敏感性有助于決定是否進(jìn)行橋接研究以及進(jìn)行何種類型的橋接研究。對于種族因素敏感的藥物,如果兩個目標(biāo)區(qū)域人群有差異,如藥效學(xué)數(shù)據(jù)提示治療效應(yīng)有差異,藥動學(xué)數(shù)據(jù)顯示代謝方式存在本質(zhì)區(qū)別,醫(yī)學(xué)實踐在聯(lián)合用藥方面存在顯著差異,或者輔助治療可能改變藥物的安全性或有效性,通常需要開展橋接研究。對于沒有使用國外臨床試驗數(shù)據(jù)進(jìn)行藥品注冊經(jīng)驗的目標(biāo)區(qū)域,即使該藥物無種族敏感性,該監(jiān)管機(jī)構(gòu)仍可要求開展橋接研究[1]。
MRCT 是在假設(shè)治療效應(yīng)對整個目標(biāo)人群均適用的基礎(chǔ)上,基于所有目標(biāo)區(qū)域受試者的數(shù)據(jù)評價整體治療效應(yīng)。但是,內(nèi)在因素和外在因素在不同目標(biāo)區(qū)域?qū)λ幬锓磻?yīng)的影響可能會不同,因此在計劃MRCT 時應(yīng)予以考慮。在設(shè)計確證性MRCT 前,可在探索階段考察對藥物研發(fā)項目有重要影響的內(nèi)在因素和外在因素,仔細(xì)考慮區(qū)域差異影響研究結(jié)果可解釋性的可能性,以確定MRCT 在藥物研發(fā)策略中可以發(fā)揮的作用。如果預(yù)期治療效應(yīng)存在重大差異,則應(yīng)評價現(xiàn)有數(shù)據(jù),決定開展MRCT 是否合適且可行;或者,在預(yù)期治療效應(yīng)存在重大差異的情況下,可剔除部分目標(biāo)區(qū)域或同一目標(biāo)區(qū)域內(nèi)的既定亞組,也可按目標(biāo)區(qū)域分層,以增大開展MRCT 的可能性[3]。
2.2.2 實施的先后順序不同
新目標(biāo)區(qū)域的監(jiān)管機(jī)構(gòu)將評估包括國外臨床數(shù)據(jù)的臨床數(shù)據(jù)集,以確定該數(shù)據(jù)的性質(zhì)和質(zhì)量是否符合該區(qū)域所有的監(jiān)管標(biāo)準(zhǔn)。臨床數(shù)據(jù)集中的國外臨床數(shù)據(jù)是否被接受,取決于它能否外推到新目標(biāo)區(qū)域人群中。當(dāng)國外臨床數(shù)據(jù)不符合新目標(biāo)區(qū)域的監(jiān)管要求時,該監(jiān)管機(jī)構(gòu)可能會要求增加臨床試驗,即開展橋接研究[1]。因此,新目標(biāo)區(qū)域的橋接研究一般在國外臨床試驗完成之后才開始實施。
MRCT 可以使不同目標(biāo)區(qū)域的藥物研發(fā)時間同步,推動在多個目標(biāo)區(qū)域同步遞交上市許可申請,促進(jìn)新藥能夠及早在世界各地上市,從而避免在部分目標(biāo)區(qū)域上市明顯滯后[3]。因此,MRCT 強(qiáng)調(diào)的是藥物在不同目標(biāo)區(qū)域的同步研發(fā)和同步上市。
2.2.3 臨床試驗的設(shè)計思路不同
雖然橋接數(shù)據(jù)集需要與國外臨床數(shù)據(jù)集一起組成完整臨床數(shù)據(jù)集用于滿足新目標(biāo)區(qū)域的監(jiān)管要求,但是新目標(biāo)區(qū)域橋接研究本身是獨立于國外臨床試驗的平行研究。在藥物對種族因素敏感的情況下,橋接研究的設(shè)計思路是為了滿足新目標(biāo)區(qū)域監(jiān)管機(jī)構(gòu)所要求的額外臨床數(shù)據(jù)。種族敏感性的相對程度決定著橋接研究的類型。例如,在藥效學(xué)數(shù)據(jù)提示區(qū)域間治療效應(yīng)有差異、藥動學(xué)數(shù)據(jù)顯示代謝方式存在本質(zhì)區(qū)別、醫(yī)學(xué)實踐在聯(lián)合用藥方面存在顯著差異,或者輔助治療可能改變藥物的安全性或有效性時,橋接研究應(yīng)設(shè)計為一項對照臨床試驗,可以重復(fù)國外臨床試驗,或采用標(biāo)準(zhǔn)的臨床終點進(jìn)行短期研究,或采用經(jīng)過驗證的替代終點等[1]。
MRCT 可用來考察一種處理對不同人群的適用性,允許探索在同一個研究方案框架下治療效應(yīng)在不同目標(biāo)區(qū)域和不同人群間的差異,以及這種差異如何由內(nèi)在因素和外在因素進(jìn)行解釋,并計劃一個用于假設(shè)檢驗和整體治療效應(yīng)估計的主要分析方法,以便所有目標(biāo)區(qū)域監(jiān)管機(jī)構(gòu)都可以接受試驗結(jié)束后同步遞交上市許可申請。此外,在疾病/疾病狀態(tài)罕見或特殊人群或需要的受試者數(shù)量龐大的情況下,MRCT 可作為一種在合理時間內(nèi)招募到足夠受試者的有效方法[3]。
2.2.4 對主要研究終點的考慮不同
橋接研究是在盡可能減少重復(fù)研究的前提下滿足新目標(biāo)區(qū)域監(jiān)管機(jī)構(gòu)所要求的額外臨床數(shù)據(jù),因此根據(jù)種族敏感性的不同程度,可以采用與國外臨床試驗相同的主要研究終點,也可以采用標(biāo)準(zhǔn)的臨床終點進(jìn)行短期研究,或采用經(jīng)過驗證的替代終點,如血壓或膽固醇(國外Ⅲ期臨床試驗中可能已采用更長時間的研究和其他研究終點)[1]。
對于MRCT,主要研究終點均應(yīng)為所有目標(biāo)區(qū)域監(jiān)管機(jī)構(gòu)所接受,以確保對MRCT 成功或失敗的解釋能夠在這些監(jiān)管機(jī)構(gòu)間保持一致。另外,各目標(biāo)區(qū)域監(jiān)管機(jī)構(gòu)對主要研究終點的一致意見能夠確?;诮y(tǒng)一的研究終點來確定MRCT 的總樣本量和檢驗效能。如果經(jīng)過充分論證仍無法在各目標(biāo)區(qū)域間達(dá)成一致,應(yīng)在MRCT 方案中增加關(guān)于主要研究終點的相關(guān)(亞)章節(jié),闡述不同目標(biāo)區(qū)域監(jiān)管機(jī)構(gòu)的相應(yīng)要求[3]。
2.2.5 對樣本量的考慮不同
ICH E5/E5(R1)未闡述 對于橋接研究樣本量的考慮[1]。根據(jù)統(tǒng)計學(xué)的一般原則,樣本量與研究類型和研究假設(shè)緊密相關(guān),橋接研究的樣本量也應(yīng)與其研究類型和假設(shè)相關(guān)。而對橋接研究的類型和假設(shè)的考慮是為了滿足新目標(biāo)區(qū)域監(jiān)管機(jī)構(gòu)所要求的額外臨床數(shù)據(jù)。因此,橋接研究的樣本量受新目標(biāo)區(qū)域監(jiān)管要求的影響,與國外臨床試驗的樣本量無直接關(guān)聯(lián)。
MRCT 總樣本量的關(guān)鍵考慮是確??倶颖玖孔阋栽u價MRCT所有目標(biāo)區(qū)域全部受試者的平均治療效應(yīng)(估計和檢驗)。MRCT可以評價各目標(biāo)區(qū)域間治療效應(yīng)的一致性,目標(biāo)區(qū)域樣本量分配應(yīng)在科學(xué)基礎(chǔ)(而不是任意目標(biāo))上支持治療效應(yīng)的一致性評價,提供目標(biāo)區(qū)域監(jiān)管機(jī)構(gòu)所需信息。區(qū)域樣本量分配應(yīng)考慮各目標(biāo)區(qū)域疾病的患病情況,各目標(biāo)區(qū)域規(guī)模及預(yù)期入組率,已知(或假設(shè))影響治療效應(yīng)的內(nèi)在因素和外在因素,各目標(biāo)區(qū)域上述因素的發(fā)生率,以及認(rèn)為影響入組率的其他操作層面的考慮。一個平衡好上述考察因素的目標(biāo)區(qū)域樣本量分配策略,將有助于確保及時完成入組,并達(dá)成MRCT 的主要目的。在對MRCT 總樣本量進(jìn)行各目標(biāo)區(qū)域間分配時,必須注意確保不存在單個或多個目標(biāo)區(qū)域樣本量占主導(dǎo)地位,從而主導(dǎo)試驗結(jié)果的情況。各目標(biāo)區(qū)域樣本量分配應(yīng)事先與各目標(biāo)區(qū)域監(jiān)管機(jī)構(gòu)達(dá)成一致意見[3]。
2.2.6 區(qū)域間治療效應(yīng)一致性評價方法不同
為了將國外臨床試驗數(shù)據(jù)外推到新目標(biāo)區(qū)域,需要比較新目標(biāo)區(qū)域橋接研究結(jié)果與國外臨床試驗有無較大差異,但I(xiàn)CH E5/E5(R1)未闡述對于區(qū)域間治療效應(yīng)一致性評價方法的考慮[1]。考慮到一般情況下實施橋接研究的前提條件是藥物的種族敏感性在區(qū)域間存在某個方面某種程度的差異,而且新目標(biāo)區(qū)域的橋接研究與原區(qū)域的國外臨床試驗是相互平行和獨立的,觀察時間和研究終點也可能不一致,因此無法要求新目標(biāo)區(qū)域與原區(qū)域的研究結(jié)果在數(shù)值上保持某種程度上的一致。新目標(biāo)區(qū)域和原區(qū)域的一致性評價應(yīng)該以研究結(jié)論是否一致為標(biāo)準(zhǔn)。
MRCT 主要分析對應(yīng)的是對治療效應(yīng)的假設(shè)檢驗以及估計,考慮的數(shù)據(jù)來自試驗中所有目標(biāo)區(qū)域和亞群。各目標(biāo)區(qū)域和各亞群治療效應(yīng)的一致性評價也是MRCT 統(tǒng)計分析策略的重要方面。治療效應(yīng)的一致性定義為不同目標(biāo)區(qū)域或亞群中的治療效應(yīng)無臨床相關(guān)差異。該評價的各種分析方法(可能聯(lián)合使用)包括但不限于描述性總結(jié)、圖示(如森林圖)、包括協(xié)變量校正分析在內(nèi)的基于模型的估計,以及區(qū)域與處理交互作用的檢驗。上述任何方法都有優(yōu)點和局限性(例如,交互作用檢驗往往具有極低的檢驗效能)[3]。
考慮到MRCT 總樣本量是由各目標(biāo)區(qū)域樣本量組成,MRCT整體研究結(jié)論基于所有目標(biāo)區(qū)域所有受試者的平均治療效應(yīng),各目標(biāo)區(qū)域樣本量的檢驗效能一般不足以推斷出各自可靠的研究結(jié)論,因此無法要求對各目標(biāo)區(qū)域間的研究結(jié)論進(jìn)行比較,更無法要求對各目標(biāo)區(qū)域的研究結(jié)論與MRCT 整體研究結(jié)論進(jìn)行比較。ICH E17 提供的一些治療效應(yīng)一致性評價方法,如描述性總結(jié)、圖示法,主要是從研究結(jié)果的數(shù)值上對各目標(biāo)區(qū)域間以及各目標(biāo)區(qū)域與MRCT 整體的治療效應(yīng)一致性進(jìn)行直接或直觀比較[3],但尚無公認(rèn)的一致性評價標(biāo)準(zhǔn)。
對于橋接研究,ICH E5/E5(R1)未闡述對于區(qū)域間治療效應(yīng)一致性評價方法的考慮[1]。為了解決這個問題,很多學(xué)者圍繞橋接研究的“相似性”“一致性”評價對橋接策略進(jìn)行深入探討,劉晉等[5]和劉澤宇等[6]對這些研究進(jìn)行了綜述。目前,尚無監(jiān)管機(jī)構(gòu)宣稱其認(rèn)可某個或某些方法。
Shih[7]將所有在原區(qū)域已完成的臨床試驗當(dāng)作是一個多中心試驗,把新目標(biāo)區(qū)域的臨床試驗當(dāng)作是多中心試驗中的一個新中心,以檢驗研究中心間的治療效應(yīng)一致性。假設(shè)臨床試驗由試驗藥組與安慰劑組構(gòu)成,試驗效應(yīng)為標(biāo)準(zhǔn)樣本均差(standardized sample mean difference,SSMD),服從正 態(tài)分布N(μ,1),構(gòu)造SSMD 的預(yù)測密度函數(shù)。如果新目標(biāo)區(qū)域試驗的SSMD預(yù)測似然值不比原區(qū)域中最小的SSMD 預(yù)測似然值小,則認(rèn)為新目標(biāo)區(qū)域與原區(qū)域的治療效應(yīng)具有一致性,以此判斷是否可以將原區(qū)域數(shù)據(jù)橋接至新目標(biāo)區(qū)域。
有學(xué)者提出重建概率和概括概率的概念[8-10]。所謂重建概率是指在新區(qū)域重復(fù)原區(qū)域的臨床試驗結(jié)果的概率,當(dāng)無明顯證據(jù)表明兩區(qū)域間的種族差異對藥物治療效應(yīng)產(chǎn)生影響時,通過計算重建概率判斷是否需要進(jìn)行橋接研究;概括概率則為在已有信息表明新區(qū)域和原區(qū)域藥物治療效應(yīng)可能存在差異的條件下,新區(qū)域得到治療效應(yīng)存在的概率。具體地說,根據(jù)效應(yīng)信息量估計新目標(biāo)區(qū)域的重建概率,如果能夠達(dá)到事先規(guī)定的具有“可重復(fù)性”的概率,則可以停止新目標(biāo)區(qū)域的橋接研究,將原區(qū)域的臨床試驗數(shù)據(jù)借用至新目標(biāo)區(qū)域。
Lan 等[11]提出加 權(quán)Z檢 驗方法。在進(jìn)行新目標(biāo)區(qū)域的橋接研究時,對原區(qū)域的效應(yīng)信息量“打折”,賦予權(quán)重。其基本思想是將原區(qū)域和新區(qū)域的近似正態(tài)性Z檢驗統(tǒng)計量(ZForeign,ZBridging),按照預(yù)先指定的權(quán)重(w)相加,得到新統(tǒng)計量Zw,對Zw進(jìn)行假設(shè)檢驗,若小于預(yù)定檢驗水準(zhǔn)α,則認(rèn)為橋接成功。
Huang 等[12-13]提出由 國際MRCT 附加一個局部區(qū)域臨床試 驗(local clinical trial,LCT)的藥物全球同步研發(fā)項 目(simultaneous global drug development program,SGDDP)試驗設(shè) 計。其基本設(shè)計如下:假設(shè)已有獨立的Ⅲ期MRCT,根據(jù)注冊區(qū)域的目標(biāo)種族將MRCT 分為目標(biāo)種族(targeted ethic,TE)人群和非目標(biāo)種族(non-targeted ethic,NTE)人群,同步或序貫地開展針 對TE 人群的LCT,則TE 人群包括MRCT 和LCT 中 的TE人 群。對NTE 和TE 人群效 應(yīng)信息量賦予權(quán)重,適當(dāng)降低NTE人群的權(quán)重,采用加權(quán)Z統(tǒng)計量合 并TE 和NTE 人群的治療效應(yīng)(其中ZTE、ZNTE為標(biāo)準(zhǔn)正態(tài)分布檢驗統(tǒng)計量,w為NTE 人群對整體試驗效應(yīng)的信息貢獻(xiàn)比例)。
Hsiao 等[14-15]將橋接研究視為在統(tǒng)一框架下分兩階段(原區(qū)域階段和新區(qū)域階段)進(jìn)行的臨床試驗。在此基礎(chǔ)上,將兩階段設(shè)計和成組序貫設(shè)計引入橋接研究的設(shè)計與分析中。該方法的主要步驟為:第一階段對原區(qū)域獲得的試驗結(jié)果進(jìn)行t檢驗,若檢驗統(tǒng)計量T0大于預(yù)定界值C0則試驗進(jìn)入第二階段(新區(qū)域試驗),否則試驗中止。當(dāng)?shù)诙A段(橋接階段)完成后,對第一、二階段的累計數(shù)據(jù)進(jìn)行最終分析。若檢驗統(tǒng)計量TN大于預(yù)定界值CN,認(rèn)為可以將第一階段原區(qū)域結(jié)果外推至第二階段的新區(qū)域。
也有一些學(xué)者考慮到上述方法存在某些局限性,在此基礎(chǔ)上提出了一些改進(jìn)方法[16-18]。還有許多學(xué)者對各種貝葉斯統(tǒng)計方法在橋接研究設(shè)計與分析中的應(yīng)用進(jìn)行了大量研究,其代表性方法有貝葉斯最合理預(yù)測法[7]、經(jīng)驗貝葉斯法[19-20]、混合先驗法[21]、冪次先驗法[22]、公度冪次先驗法[23]和貝葉斯動態(tài)借用法[24]。
對 于MRCT,ICH E17 提 供了一些治療效應(yīng)一致性評價方法,如描述性總結(jié)、圖示法,但未闡述一致性評價標(biāo)準(zhǔn)[3]。2007 年日本厚生勞動省通過問答的形式闡述了全球臨床試驗的基本原則,基于使用定量終點的安慰劑對照研究,推薦了兩種一致性評價方法,目的是期望通過考慮納入的目標(biāo)區(qū)域數(shù)量、試驗規(guī)模、目標(biāo)疾病以及研究總?cè)巳号c日本亞組人群之間的相關(guān)比例等因素,確定合適的日本亞組樣本量,以平衡研究總?cè)巳号c日本亞組人群之間獲得一致性結(jié)果的可能性[25]。
日本方法1:假設(shè)安慰劑組和試驗組之間的差值為D,則研究總?cè)巳旱目鐓^(qū)域差值為Dall,日本亞組人群內(nèi)的差值為DJapan。確定日本受試者的數(shù)量,使DJapan/Dall>π的發(fā)生概率≥80%。π應(yīng)設(shè)為適當(dāng)?shù)闹担话憬ㄗh取0.5以上。使用此方法時,將觀察到以下關(guān)系:嘗試最小化日本樣本量將增加總樣本量,嘗試最小化總樣本量將增加日本樣本量。
日本方法2:假設(shè)安慰劑組和試驗組在研究總?cè)巳褐锌鐓^(qū)域差值為Dall,如果假設(shè)試驗包括3個目標(biāo)區(qū)域,則安慰劑組和試驗組在每個目標(biāo)區(qū)域的差值分別為D1、D2和D3。確定樣本量大小,使D1、D2和D3中的每一個都顯示出相似的趨勢。例如,在D>0的情況下,確定受試者數(shù)量,使得D1、D2和D3中的每一個大于0 的概率≥80%。如果每個目標(biāo)區(qū)域的受試者數(shù)量相等,這種可能性就會增加。該方法允許在不改變總樣本量的情況下考慮日本樣本量。然而,應(yīng)該注意的是,在這種方法中,當(dāng)日本成分比率很小且受試者人數(shù)很少時,可能無法進(jìn)行充分的目標(biāo)區(qū)域間比較。
除了日本監(jiān)管機(jī)構(gòu)推薦的方法之外,很多學(xué)者也從不同方面探討了MRCT 的治療效應(yīng)一致性評價方法。Liu 等[26]使用離散分布的隨機(jī)效應(yīng)模型評估跨區(qū)域治療效應(yīng)的異質(zhì)性。Quan 等[27-28]討論了經(jīng)驗收縮估計量和James-Stein 型收縮估計量在評價跨區(qū)域治療效應(yīng)一致性上的應(yīng)用。也有學(xué)者推薦使用圖形法評價MRCT的目標(biāo)區(qū)域間治療效應(yīng)一致性,如漏斗圖和正態(tài)概率圖[29-30]。
Chen 等[29]對MRCT 的 治療效應(yīng)一致性評價方法進(jìn)行了系統(tǒng)綜述,歸納為三類方法:①全局方法:基于一個單一的全局統(tǒng)計量評價所有目標(biāo)區(qū)域的數(shù)據(jù),如采用類似于Meta 分析的異質(zhì)性評價方法。②多元定量方法:評價目標(biāo)區(qū)域之間的所有成對差異是否在預(yù)先指定范圍內(nèi),如果多個區(qū)域之間治療效應(yīng)的所有成對比較在名義檢驗水準(zhǔn)上均無統(tǒng)計學(xué)顯著性,則接受區(qū)域之間治療效應(yīng)無差異的無效假設(shè)。③多元定性方法:評價各個目標(biāo)區(qū)域的所有點估計值是否都優(yōu)于相應(yīng)的閾值,如日本方法1 和方法2,或者評價預(yù)先指定的目標(biāo)保留效應(yīng)是否被所有單個區(qū)域的置信區(qū)間所覆蓋。所歸納的三類方法的共同點都是要求所有目標(biāo)區(qū)域均達(dá)到相同標(biāo)準(zhǔn)才能認(rèn)為具有一致性。
但在實踐中,目標(biāo)區(qū)域的監(jiān)管機(jī)構(gòu)更關(guān)心該區(qū)域的治療效應(yīng)是否與MRCT 整體具有一致性。Guo 等[31]根據(jù)國家之間某些特征如人類發(fā)展指數(shù)的相似性來建立樹狀圖(即層次聚類),用分支或分叉來表示國家之間治療效應(yīng)的關(guān)系;為了估計某個感興趣的國家的治療效應(yīng),可以從在同一分支或分叉上的相鄰國家借用信息。Huang 等[32]提出用混合先驗信息的經(jīng)驗貝葉斯方法來綜合目標(biāo)區(qū)域和其他區(qū)域的數(shù)據(jù),以評價目標(biāo)區(qū)域的治療效應(yīng)與整體的一致性。
除此之外,部分學(xué)者提出了檢驗水準(zhǔn)調(diào)整和區(qū)間估計的思路對目標(biāo)區(qū)域與整體的治療效應(yīng)一致性進(jìn)行評價。Tsong 等[33]建議基于MRCT 的檢驗效能,根據(jù)目標(biāo)區(qū)域樣本量反過來調(diào)整該區(qū)域可接受的I 類錯誤率,來評估該區(qū)域的治療效應(yīng)的統(tǒng)計學(xué)顯著性。Tanaka 等[34]對Gail-Simon 和Sasabuchi 單側(cè)多元似然比檢驗進(jìn)行擴(kuò)展,評估這些方法用于定性評價治療效應(yīng)一致性的特性,并探討對于給定數(shù)量的目標(biāo)區(qū)域設(shè)置檢驗水準(zhǔn)和一致性界限的準(zhǔn)則。Chen 等[35]提出在目標(biāo)區(qū)域選擇不同(增大)的檢驗水準(zhǔn)α′,采用與MRCT 相同的假設(shè)檢驗進(jìn)行統(tǒng)計推斷,并比較了該方法與日本方法1 之間的相互關(guān)系,認(rèn)為目標(biāo)區(qū)域樣本量在MRCT 中所占比例固定的情況下,該方法的α′與日本方法1 的π被滿足的概率相互匹配。Teng 等[36]進(jìn)一步提出了一個統(tǒng)一的一致性條件,該條件中同時包括兩個參數(shù),即日本方法1 的π和目標(biāo)區(qū)域的檢驗水準(zhǔn)α′。Chiang 等[37]使用區(qū)間估計法設(shè)計和評估MRCT,認(rèn)為該方法能夠正確地確定所需樣本量,并把Ⅰ類錯誤率控制在名義水平。
在實踐中,橋接研究和MRCT 經(jīng)常被混淆,尤其是兩者的目標(biāo)區(qū)域間治療效應(yīng)一致性評價方法。申辦者經(jīng)常把評價MRCT 區(qū)域間治療效應(yīng)一致性的日本方法1 和方法2 用于橋接研究的設(shè)計和評價。產(chǎn)生這種混淆的主要原因是未分析橋接研究和MRCT 之間的聯(lián)系和區(qū)別。因此,本文系統(tǒng)梳理了橋接研究和MRCT 的異同點。相同點包括都是以減少重復(fù)研究為目的、都需要滿足各目標(biāo)區(qū)域的監(jiān)管要求、都需要評價區(qū)域間治療效應(yīng)一致性,而且兩者的定義存在相互交叉的情況。不同點包括實施的前提條件不同、實施的先后順序不同、臨床試驗的設(shè)計思路不同、對主要研究終點的考慮不同、對樣本量的考慮不同,以及區(qū)域間治療效應(yīng)一致性評價方法不同。橋接研究和MRCT 的諸多不同點決定了兩者在方法學(xué)上的設(shè)計和評價不能混用。
學(xué)者提出了不少針對橋接研究的目標(biāo)區(qū)域間治療效應(yīng)一致性評價方法,這些方法的共同點都是把新目標(biāo)區(qū)域的橋接研究視為國外臨床試驗的附屬研究,僅納入較少樣本量,通過構(gòu)建或轉(zhuǎn)變某些統(tǒng)計量從而避開對Ⅰ類錯誤率的評價,以達(dá)到獲得區(qū)域間治療效應(yīng)一致性的結(jié)論的目的[7-24]。小樣本量橋接研究中新目標(biāo)區(qū)域的治療效應(yīng)與大型國外臨床試驗中整體治療效應(yīng)之間的一致性評價的統(tǒng)計指標(biāo)一直存在爭議,因為它們的樣本量極不相稱[38]。事實上,ICH E5/E5(R1)強(qiáng)調(diào)橋接研究的目的是減少重復(fù)研究,但這并不意味著橋接研究應(yīng)該是非獨立、小樣本量的。
廣義的橋接研究包括臨床藥理學(xué)終點的、臨床終點的和安全性的橋接研究等[1]。如果國外臨床試驗數(shù)據(jù)符合新目標(biāo)區(qū)域監(jiān)管機(jī)構(gòu)的注冊要求,則可以不開展橋接研究;如果新目標(biāo)區(qū)域監(jiān)管機(jī)構(gòu)評估國外臨床試驗數(shù)據(jù)后認(rèn)為存在區(qū)域間的種族差異,則應(yīng)開展臨床藥理學(xué)終點的橋接研究;如果臨床藥理學(xué)終點的橋接研究提示區(qū)域間的治療效應(yīng)差異,則需開展臨床終點的橋接研究即對照臨床試驗[1]。因此,橋接研究是逐步遞進(jìn)的,如果前序橋接研究可以滿足新目標(biāo)區(qū)域監(jiān)管要求,則無需開展后序橋接研究;只有前序橋接研究提示存在區(qū)域間差異時,才需開展后序橋接研究進(jìn)一步驗證。這可能是ICH E5/E5(R1)強(qiáng)調(diào)的減少重復(fù)研究的初衷。
此 外,ICH E5/E5(R1)指出臨床終點的橋接研究即對照臨床試驗可以重復(fù)國外臨床試驗,可以縮短研究周期,可以采用替代終點[1],但從這些要求中并不能引申出“臨床終點的橋接研究應(yīng)作為國外臨床試驗的附屬部分而僅需納入較少樣本量”的結(jié)論。況且當(dāng)需要開展臨床終點的橋接研究時,意味著前序橋接研究提示存在區(qū)域間的治療效應(yīng)差異,此時若采用非獨立、小樣本量的臨床試驗獲得區(qū)域間治療效應(yīng)一致性的結(jié)論,則將面臨較大的Ⅰ類錯誤率膨脹的風(fēng)險。因此,上述分析說明,為了進(jìn)一步驗證區(qū)域間是否存在治療效應(yīng)差異,臨床終點的橋接研究應(yīng)該獨立于國外臨床試驗,其樣本量應(yīng)該有足夠的檢驗效能,在進(jìn)行研究設(shè)計時可以適當(dāng)調(diào)整某些設(shè)計要素,這可能更符合ICH E5/E5(R1)的要求。如果獨立的橋接研究與國外臨床試驗的統(tǒng)計結(jié)論一致,則可認(rèn)為具有一致性。
對MRCT 區(qū)域間治療效應(yīng)一致性評價產(chǎn)生較為深遠(yuǎn)影響的是日本方法1 和方法2,因為這是全球首個由監(jiān)管機(jī)構(gòu)提出的評價方法[25]。從2007 年至2017年,即從日本監(jiān)管機(jī)構(gòu)推薦的治療效應(yīng)一致性評價方法實施至ICH E17 實施前,日本監(jiān)管機(jī)構(gòu)通過MRCT 共批準(zhǔn)了130 個藥品,涉及167 個研究(138 個全球MRCT,29 個亞洲MRCT)[39]。雖然日本方法影響深遠(yuǎn),但存在諸多局限性。①未考慮區(qū)域特征,如人口數(shù)量、患病率。②主觀性較強(qiáng),如方法1 中效應(yīng)保留比例(參數(shù)π)的設(shè)定。③無明確的統(tǒng)計學(xué)理論支持,如采用點估計值進(jìn)行統(tǒng)計推斷,忽略了對Ⅰ類錯誤率膨脹的考慮。④僅適用于定量終點的優(yōu)效檢驗,能否適用于定性終點或非劣效檢驗(非劣效界值也具有一定程度的主觀性)等尚無定論。ICH E17 在MRCT區(qū)域樣本量分配方法和各目標(biāo)區(qū)域治療效應(yīng)一致性評價方法等方面并未推薦日本方法,雖然提及了效應(yīng)保留的方法(日本方法1),但也指出,在試驗中多個目標(biāo)區(qū)域均要求保留一定比例整體治療效應(yīng)時,效應(yīng)保留的分配不切實際[3]。
在MRCT 框架下,如果目標(biāo)區(qū)域基于較少樣本量所測量的治療效應(yīng)在檢驗水準(zhǔn)α=0.05 時無統(tǒng)計學(xué)顯著差異,但卻得出其與MRCT 整體治 療效應(yīng)(α=0.05時有統(tǒng)計學(xué)顯著差異)具有一致性的結(jié)論,則將面臨較大的Ⅰ類錯誤率膨脹的風(fēng)險。因此,目標(biāo)區(qū)域監(jiān)管機(jī)構(gòu)在作出一致性結(jié)論時需關(guān)注Ⅰ類錯誤率膨脹程度以及可接受程度。雖然有學(xué)者對MRCT 區(qū)域間治療效應(yīng)一致性評價方法進(jìn)行了諸多探討,但大多數(shù)方法是通過構(gòu)建或轉(zhuǎn)變某些統(tǒng)計量從而避開對Ⅰ類錯誤率的評價,并著重探討在不同參數(shù)設(shè)置情況下達(dá)到一致性的成功概率或保證概 率[26-32]。ICH E17 僅 推薦了一些描述性方法用于治療效應(yīng)一致性評價[3],這些方法同樣具有較強(qiáng)的主觀性且避開了對Ⅰ類錯誤率膨脹的考慮。因此,以上方法均未能找準(zhǔn)監(jiān)管機(jī)構(gòu)評價MRCT 區(qū)域間治療效應(yīng)一致性的關(guān)注點。
此外,ICH E17 并未將區(qū)域樣本量分配方法和區(qū)域間治療效應(yīng)一致性評價方法放在一起考慮[3]。但是,從統(tǒng)計學(xué)理論的角度,臨床試驗的樣本量估算應(yīng)該與用于統(tǒng)計推斷的假設(shè)檢驗保持一致,這同樣適用于MRCT 各目標(biāo)區(qū)域。因此,目標(biāo)區(qū)域監(jiān)管機(jī)構(gòu)應(yīng)結(jié)合治療效應(yīng)一致性評價方法來考慮該區(qū)域樣本量在總樣本量中所占比例的合理性。
基于以上分析,借鑒前述的檢驗水準(zhǔn)調(diào)整和區(qū)間估計的思路[33-37],把MRCT 中目標(biāo)區(qū)域的名義檢驗水準(zhǔn)、樣本量、區(qū)間估計與治療效應(yīng)一致性評價結(jié)合起來考慮,可以較好地抓住監(jiān)管機(jī)構(gòu)的關(guān)注點。即,目標(biāo)區(qū)域監(jiān)管機(jī)構(gòu)可考慮其所能接受的Ⅰ類錯誤率膨脹程度(可接受的名義檢驗水準(zhǔn)α′),采用與MRCT 一致的樣本量估算參數(shù)(預(yù)估療效、檢驗效能)估算該區(qū)域樣本量,并基于α′建立該區(qū)域的統(tǒng)計學(xué)假設(shè),優(yōu)效界值、非劣效界值或等效界值與MRCT 保持一致,如果目標(biāo)區(qū)域的100(1-α′)%置信區(qū)間與MRCT 的100(1-α)%置信區(qū)間的統(tǒng)計結(jié)論一致,則可認(rèn)為具有一致性。
該方法與ICH E17 并不矛盾,只是將目標(biāo)區(qū)域監(jiān)管機(jī)構(gòu)根據(jù)ICH E17 區(qū)域樣本量分配方法所能接受的樣本量,在除α之外的其他估算參數(shù)與MRCT 總樣本量估算參數(shù)保持一致的情況下,轉(zhuǎn)化為對該區(qū)域Ⅰ類錯誤率膨脹的可接受程度,即調(diào)整名義檢驗水準(zhǔn)α′。該方法的主要優(yōu)點是在認(rèn)可MRCT 研究設(shè)計的前提下,目標(biāo)區(qū)域監(jiān)管機(jī)構(gòu)在與申辦者討論樣本量分配時只需考慮對Ⅰ類錯誤率膨脹的可接受程度,有明確的治療效應(yīng)一致性評價標(biāo)準(zhǔn),而且在作出一致性結(jié)論時可以清楚地量化Ⅰ類錯誤率膨脹程度。
綜上所述,本文基于ICH 指導(dǎo)原則比較了橋接研究和MRCT的定義和異同點,并結(jié)合相關(guān)文獻(xiàn)比較了兩者常用的目標(biāo)區(qū)域間治療效應(yīng)一致性評價方法,分析了兩者在認(rèn)識上可能存在的一些誤區(qū),并從統(tǒng)計學(xué)角度提出了在方法學(xué)上的不同考慮。其目的是,鼓勵申辦者將中國納入到全球研發(fā)體系中,根據(jù)對橋接研究和MRCT 的不同考慮評估研發(fā)成本,以制定更加科學(xué)合理的全球研發(fā)策略。但囿于經(jīng)驗,本文所述觀點可能存在偏頗之處,有待與學(xué)術(shù)界、工業(yè)界和監(jiān)管機(jī)構(gòu)專家進(jìn)一步交流和探討。