摘要:白蛋白在臨床中的應用廣泛,其臨床試驗設計的合理性直接影響研究結果的可靠性和臨床應用價值。本文綜述了白蛋白臨床試驗設計中的關鍵統(tǒng)計學考量,包括對主要終點的選擇、統(tǒng)計學假設及非劣效界值的設定、腹水改善的臨床評價標準、樣本量的估計、中期分析等問題進行探討,旨在為臨床研究者提供方法學參考,以優(yōu)化臨床試驗設計、提高其科學性和可行性。
關鍵詞:白蛋白類;臨床試驗;統(tǒng)計學(主題)
基金項目:國家重點研發(fā)計劃(2023YFC2306902,2023YFC2306900);北京市衛(wèi)生健康委高層次公共衛(wèi)生技術人才建設項目(學科骨干-010-018)
Statistical considerations in the design of albumin clinical trials
KONG Yuanyuan 1 ,YAO Chen 2 ,JIA Jidong 3
1. Department of Clinical Epidemiology and Evidence-Based Medicine,Beijing Friendship Hospital,Capital Medical University,National Clinical Research Center for Digestive Diseases,Beijing 100050,China;2. Department of Medical Statistics,Peking University First Hospital,Beijing 100034,China;3. Liver Research Center,Beijing Friendship Hospital,Capital Medical University,Beijing 100050,China
Corresponding author:KONG Yuanyuan,kongyy@ccmu.edu.cn (ORCID:0000-0002-2586-1443)
Abstract:Albumin is widely used in clinical practice,and the rationality of trial design directly affects the reliability of research findings and clinical application value. This article reviews the key statistical considerations in the design of albumin clinical trials,including the selection of primary endpoints,the establishment of statistical hypotheses and non-inferiority margins,clinical evaluation criteria for ascites improvement,sample size,and interim analyses,in order to provide methodological guidance for clinical researchers to optimize clinical trial design and enhance its scientific rigor and feasibility.
Key words:Albumins;Clinical Trials;Statistics as Topic Research funding:National Key Research and Development Program (2023YFC2306902,2023YFC2306900);Beijing Municipal Health Commission High level Public Health Technical Talent Construction Project (Subject-backbones-010-018)
白蛋白作為一種重要的血漿蛋白,在多種臨床病癥的治療中發(fā)揮著重要作用[1-3]。但人血白蛋白逐漸進入臨床應用是國內外長期臨床實踐的結果,大多并未經過設計嚴謹?shù)年P鍵臨床試驗。此外,因血液來源不足,故需要大量進口,這也是一項潛在的安全性問題。目前,采用基因工程技術制備的人血白蛋白已經進入臨床試驗階段,為了驗證其療效和安全性,設計合理的臨床試驗至關重要。但目前評估白蛋白治療的注冊臨床試驗的終點選擇存在較大異質性。此外,已發(fā)表的在失代償期肝硬化患者中評估白蛋白治療效果的臨床研究中,終點選擇也不盡相同,如ATTIRE研究采用治療失敗率(包括感染、肝性腦病、腎衰竭、多器官衰竭或死亡)[4],ANSWER研究采用18個月生存率[5],MATCH研究采用并發(fā)癥發(fā)生率(如感染、肝腎綜合征等),MACHT研究采用住院時間[6-7]。
試驗設計其他方面的差異也值得注意,包括入組標準、給藥方案、隨訪時間、統(tǒng)計假設、非劣效界值等。以上因素影響了不同臨床試驗結果的可比性和臨床應用的普適性。本文將主要從統(tǒng)計學角度探討白蛋白注冊臨床試驗設計中的若干關鍵問題,包括主要終點的選擇、統(tǒng)計學假設、非劣效界值、樣本量計算以及腹水改善標準的確定等,以期為白蛋白臨床試驗設計提供參考。
1 主要終點的選擇
研究終點是臨床試驗設計的核心要素之一,不僅能決定試驗的成敗,還直接影響研究樣本量的確定。通常,終點的選擇應基于臨床重要性進行排序,同時考慮終點事件的預期頻率和藥物作用的預期效果。
對于研究終點排序的考量,研究者需要權衡臨床重要性與統(tǒng)計學效力之間的關系。當臨床重要性高的終點發(fā)生頻率較低時,可能導致研究效力不足。在這種情況下,可以考慮選擇臨床重要性相對次要、但統(tǒng)計效力更高的終點作為主要終點,以提高研究的統(tǒng)計學效力,增加研究的可行性。
在臨床試驗中,主要終點的數(shù)量可以是單一指標或多指標。多終點設計包括復合終點、共同終點和多終點。對于旨在證明肝硬化腹水患者臨床獲益的白蛋白試驗,可考慮雙主要終點設計,即將血漿白蛋白水平改善和腹水改善作為雙主要終點,或將白蛋白水平改善作為主要終點,腹水改善作為關鍵次要終點,以全面評估藥物的療效。
2 統(tǒng)計學假設及非劣效界值的設定
在白蛋白治療肝硬化腹水合并低白蛋白血癥患者的臨床試驗中,對于白蛋白水平改善可以考慮等效性假設,即對試驗藥物與陽性對照藥物進行生物等效性統(tǒng)計學檢驗;對于臨床獲益如腹水改善,則可以考慮非劣效假設,即對試驗藥物的療效終點不劣于陽性對照藥物進行統(tǒng)計學檢驗[8]。對于非劣效檢驗,要合理設定非劣效界值,通常需要綜合權衡臨床意義和統(tǒng)計學效力[9]。在白蛋白臨床試驗中,可考慮有效率的非劣效界值設定為10%~15%。具體設定時,需要結合陽性對照藥物的腹水改善標準的定義及有效率、臨床專家意見及前期臨床試驗數(shù)據(jù)綜合考慮。
3 腹水改善標準對有效率及樣本量的影響
腹水改善標準的設定直接影響樣本量的估算。在白蛋白臨床試驗中,腹水改善的評價指標并不統(tǒng)一,例如采用體質量、腹圍或腹水深度的變化等。此外,有關具有臨床意義的腹水改善的定義及有效率的具體標準亦存在爭議。
以腹水量相對基線的變化作為腹水改善的評價指標為例,腹水改善的標準為腹水程度較基線時下降一級(基線腹水1級者腹水消失),或腹水深度測量值較基線下降達到一定標準,一般被認為有臨床意義。腹水改善標準的不同定義會影響試驗藥物與對照藥物間有效率差值的方向和樣本量的大小。
假設將腹水改善標準分別定義為腹水深度較基線下降≤20%、25%、30%、40% 或 50%,陽性對照藥有效率的估計值為 45%~70%,有效率的差值(試驗組-對照組)設為0或?5%,非劣效界值分別采用?10%、?15%,把握度(power)=0.8,單側α=0.025時,對試驗所需的樣本量估算模擬結果詳見表1、2。由此可見,若率差=0,非劣效界值=?10%,n=734~874;非劣效界值=?15%,n=328~390。若率差=?5%,非劣效界值=?10%,n=3 054~3 472;非劣效界值=?15%,n=766~870。
腹水改善標準直接影響療效的高低及率差方向。模擬結果顯示,當腹水下降標準定義為lt;30%時,組間療效相近,率差=0概率顯著增加;當腹水下降標準定義為≥30%時,腹水改善率降低,試驗組療效可能低于對照組,率差lt;0概率顯著增加(表3)。
4 中期分析樣本量重估的考量
在臨床試驗中,可基于中期分析的效應量或變異性估計值對本量進行重新估計[10-12]。但應注意,由于非劣效設計的目標是證明試驗組的療效不顯著低于對照組(效應量≥?Δ),因此樣本量重估更容易導致非劣效設計的Ⅰ類錯誤膨脹[11,13-15],主要是由于以下原因:(1)非劣效設計的假設檢驗邊界(Δ)是人為設定的,樣本量調整可能改變試驗對Δ的敏感性;(2)增加樣本量會導致置421臨床肝膽病雜志第41卷第3期2025年3月 J Clin Hepatol,Vol.41 No.3,Mar.2025信區(qū)間變窄,更容易滿足非劣效標準(即置信區(qū)間的上限小于Δ),從而增加錯誤得出非劣效結論的可能性;(3)如果中期分析的效應量估計值存在偏差,樣本量調整可能進一步放大這種偏差,導致Ⅰ類錯誤膨脹。
但對于優(yōu)效假設來說,在滿足相關條件時,采用希望區(qū)域法對樣本量重估能夠有效控制Ⅰ類錯誤[11,16]。
主要是由于以下原因:本方法的核心思想是基于中期分析結果,將試驗分為“希望區(qū)域”和其他區(qū)域,并在希望區(qū)域內調整樣本量以提高試驗成功的可能性[12,17-18]。
希望區(qū)域法通過中期分析將試驗分為以下幾種情況:(1)不可能區(qū)域:中期數(shù)據(jù)表明試驗成功的可能性極低,此時通常停止試驗。(2)希望區(qū)域:中期數(shù)據(jù)表明試驗有一定成功的可能性,但統(tǒng)計效能不足,此時可以通過增加樣本量來提高效能。(3)成功區(qū)域:中期數(shù)據(jù)表明試驗已經非常接近成功,此時無須調整樣本量。樣本量的調整僅在希望區(qū)域內進行,而不在其他區(qū)域進行。在優(yōu)效假設下,假設檢驗的邊界(如效應量為零)是固定的,不依賴于人為設定的參數(shù)(如非劣效界值Δ),樣本量調整不會改變假設檢驗的邊界,因此不會引入額外的偏倚。
鑒于白蛋白臨床試驗的主要終點為等效設計,關鍵次要終點為非劣效設計,針對非劣效假設的樣本量重估即使采用希望區(qū)域法也可能會導致Ⅰ類錯誤膨脹,故在預先決定是否進行期中分析對樣本量進行重估時,應仔細權衡上述影響因素。
5 小結
白蛋白臨床試驗設計中仍存在諸多挑戰(zhàn),在堅持科學性和嚴謹性的同時,也應充分考慮臨床試驗的具體情況和可實施性。目前亟需建立標準化的療效評價終點,特別是臨床改善的客觀評價指標,并合理設定樣本量估計參數(shù)。可通過增加上市后的長期隨訪,以進一步確證血漿白蛋白水平提升與遠期臨床獲益的關聯(lián)。未來的研究應繼續(xù)探索這些因素的優(yōu)化,通過方法學創(chuàng)新和跨學科合作,以推動白蛋白臨床試驗的健康發(fā)展,從而為廣大患者提供來源充足、質量可靠、療效穩(wěn)定的白蛋白制品。
利益沖突聲明:本文不存在任何利益沖突。
作者貢獻聲明:孔媛媛負責數(shù)據(jù)分析、文章撰寫;姚晨負責統(tǒng)計內容指導、論文審閱;賈繼東負責臨床內容指導、論文審閱。
參考文獻:
[1] Chinese Society of Hepatology, Chinese Medical Association. Guide?lines on the management of ascites and complications in cirrhosis[J].J Clin Hepatol, 2017, 33(10): 1847-1863. DOI: 10.3969/j.issn.1001-5256.2017.10.003.中華醫(yī)學會肝病學分會. 肝硬化腹水及相關并發(fā)癥的診療指南[J]. 臨床肝膽病雜志, 2017, 33(10): 1847-1863. DOI: 10.3969/j.issn.1001-5256.2017.10.003.
[2] European Association for the Study of the Liver. EASL Clinical Prac?tice Guidelines for the management of patients with decompensated cirrhosis[J]. J Hepatol, 2018, 69(2): 406-460. DOI: 10.1016/j.jhep.2018.03.024.
[3] RUNYON BA, AASLD PRACTICE GUIDELINES COMMITTEE. Man?agement of adult patients with ascites due to cirrhosis: An update[J]. Hepatology, 2009, 49(6): 2087-2107. DOI: 10.1002/hep.22853.
[4] CHINA L, FREEMANTLE N, FORREST E, et al. A randomized trial of albumin infusions in hospitalized patients with cirrhosis[J]. N Engl J Med, 2021, 384(9): 808-817. DOI: 10.1056/nejmoa2022166.
[5] CARACENI P, RIGGIO O, ANGELI P, et al. Long-term albumin ad?ministration in decompensated cirrhosis (ANSWER): An open-label randomised trial[J]. Lancet, 2018, 391(10138): 2417-2429. DOI: 10.1016/S0140-6736(18)30840-7.
[6] FERNáNDEZ J, CLàRIA J, AMORóS A, et al. Effects of albumin treatment on systemic and portal hemodynamics and systemic inflam?mation in patients with decompensated cirrhosis[J]. Gastroenterol?ogy, 2019, 157(1): 149-162. DOI: 10.1053/j.gastro.2019.03.021.
[7] THéVENOT T, BUREAU C, OBERTI F, et al. Effect of albumin in cir?rhotic patients with infection other than spontaneous bacterial peritoni?tis. A randomized trial[J]. J Hepatol, 2015, 62(4): 822-830. DOI: 10.1016/j.jhep.2014.11.017.
[8] ICH Harmonised Tripartite Guideline. Statistical principles for clinical trials. International Conference on Harmonisation E9 Expert Working Group[J]. Stat Med, 1999, 18(15): 1905-1942.
[9] Committee for Medicinal Products for Human Use (CHMP). Guide?line on the choice of the non-inferiority margin[M]. London: Euro?pean Medicines Agency, 2005.
[10] GOULD AL. Sample size re-estimation: Recent developments and practical considerations[J]. Stat Med, 2001, 20(17-18): 2625-2643.DOI: 10.1002/sim.733.
[11] PROSCHAN MA, HUNSBERGER SA. Designed extension of studies based on conditional power[J]. Biometrics, 1995, 51(4): 1315-1324.
[12] MEHTA CR, POCOCK SJ. Adaptive increase in sample size when in?terim results are promising: A practical guide with examples[J]. Stat Med, 2011, 30(28): 3267-3284. DOI: 10.1002/sim.4102.
[13] FRIEDE T, KIESER M. Sample size recalculation in internal pilot study designs: A review[J]. Biom J, 2006, 48(4): 537-555. DOI: 10.1002/bimj.200510238.
[14] SCHUMI J, WITTES JT. Through the looking glass: understanding non-inferiority[J]. Trials, 2011, 12: 106. DOI: 10.1186/1745-6215-12-106.
[15] SNAPINN SM. Noninferiority trials[J]. Curr Control Trials Cardiovasc Med, 2000, 1(1): 19-21. DOI: 10.1186/cvm-1-1-019.
[16] DENNE JS. Sample size recalculation using conditional power[J].Stat Med, 2001, 20(17-18): 2645-2660. DOI: 10.1002/sim.734.
[17] JOSHUA CHEN YH, DEMETS DL, GORDON LAN KK. Increasing the sample size when the unblinded interim result is promising[J]. Stat Med, 2004, 23(7): 1023-1038. DOI: 10.1002/sim.1688.
[18] CUI L, HUNG HM, WANG SJ. Modification of sample size in group sequential clinical trials[J]. Biometrics, 1999, 55(3): 853-857. DOI:10.1111/j.0006-341x.1999.00853.x.
收稿日期:2024-12-23;錄用日期:2024-12-30
本文編輯:王瑩
引證本文:KONG YY, YAO C, JIA JD. Statistical considerations in the design of albumin clinical trials[J]. J Clin Hepatol,2025, 41(3): 420-423.
孔媛媛, 姚晨, 賈繼東 . 白蛋白臨床試驗設計中的統(tǒng)計學考量[J]. 臨床肝膽病雜志, 2025, 41(3): 420-423.