翟靜波 鄭文科 雷 翔 曹紅波 王 輝 商洪才
零膨脹模型在藥品安全性計數(shù)資料分析中的應(yīng)用※
翟靜波 鄭文科 雷 翔 曹紅波 王 輝 商洪才*
(天津中醫(yī)藥大學(xué),天津300193)
零膨脹模型是一類用于處理存在零膨脹現(xiàn)象計數(shù)資料的統(tǒng)計模型,廣泛應(yīng)用于保險費率厘定、車禍發(fā)生頻次等研究。藥品安全性分析中的計數(shù)資料可能存在零膨脹現(xiàn)象。poisson回歸模型或負(fù)二項回歸模型用于擬合存在零膨脹現(xiàn)象的計數(shù)數(shù)據(jù)可能存在擬合不良的問題。零膨脹模型可能是一類更優(yōu)的替代模型,且已有相關(guān)實例研究報道。將零膨脹模型用于不良事件/反應(yīng)發(fā)生頻次的影響因素分析,可以有效處理數(shù)據(jù)中可能存在的零膨脹現(xiàn)象,對于提高參數(shù)估計精度、探索藥品(特別是中藥注射劑)安全性事件的發(fā)生規(guī)律、識別重要危險因素以及預(yù)測等均具有重要意義。
零膨脹模型;藥品安全性;計數(shù)資料
自從Singh S在1963年首次提出零膨脹模型以來,零膨脹模型得到不斷的改進(jìn)和完善,同時在保險理賠、林火預(yù)測、交通安全預(yù)測等多個領(lǐng)域都得到廣泛應(yīng)用,但是在藥品安全性評價領(lǐng)域的應(yīng)用較少。本文將通過介紹零膨脹模型和藥品安全性計數(shù)數(shù)據(jù)的特點,探討零膨脹模型用于藥品安全性計數(shù)資料分析的可行性。
在科學(xué)研究的計數(shù)數(shù)據(jù)中常存在大量個體取值為零的現(xiàn)象,相同零值可能表示不同的含義,零值的比例超出了poisson回歸或負(fù)二項回歸等模型的擬合能力,稱為零膨脹現(xiàn)象[1]。零膨脹現(xiàn)象在公共健康領(lǐng)域較為常見[2]。
為了解決計數(shù)數(shù)據(jù)中零膨脹現(xiàn)象導(dǎo)致的模型擬合問題,Lambert(1992)[3]詳細(xì)論述了零膨脹模型。該模型的基本原理是將數(shù)據(jù)分解為全部由數(shù)字零構(gòu)成的數(shù)據(jù)集和服從poisson分布或負(fù)二項分布數(shù)據(jù)集[4]。該模型將事件的發(fā)生看成兩種可能的情況:第一種是假定事件發(fā)生取值只能為0;第二種是假定對應(yīng)事件發(fā)生數(shù)取值為0或正的事件數(shù),且服從poisson或負(fù)二項分布[3-4]。研究者通過一些特征變量識別和排除全零數(shù)據(jù)集,然后對服從poisson分布或負(fù)二項分布的數(shù)據(jù)集進(jìn)行建模分析[5]。若數(shù)據(jù)的均值與方差基本相等,認(rèn)為屬于等離散,近似服從poisson分布,可以擬合零膨脹泊松回歸模型(zeroinflated poisson regression models,ZIP);若數(shù)據(jù)的方差明顯大于均值,認(rèn)為屬于過離散,近似服從負(fù)二項分布,可以擬合零膨脹負(fù)二項回歸模型(zero-inflated negative binomial models,ZINB)[5]。
零膨脹模型是對poisson回歸或負(fù)二項回歸模型的改進(jìn),包括一系列模型,在處理存在零膨脹、個體聚集性等現(xiàn)象的大樣本、低發(fā)生率數(shù)據(jù)方面優(yōu)于poisson回歸或負(fù)二項回歸模型。
零膨脹模型廣泛應(yīng)用于小概率事件發(fā)生頻次影響因素或預(yù)測研究,例如:Jiang X等[6]采用零膨脹模型評估車禍碰撞傷害的危險因素;Kilic D等[7]將零膨脹負(fù)二項回歸模型用于煙草消耗與性別之間的關(guān)系研究;項氏[2]用零膨脹poisson回歸模型擬合汽車保險索賠頻率數(shù)據(jù)并對變量選擇和參數(shù)估計進(jìn)行比較;王氏[8]使用零膨脹模型進(jìn)行避孕知情選擇對中國人工流產(chǎn)的影響研究,結(jié)果表明零膨脹模型的擬合曲線比poisson回歸和負(fù)二項回歸模型更逼近真實觀測值的分布。
研究者還將零膨脹模型用于療效評價,例如:Lu CY等[9]采用零膨脹模型評估治療時期對療效的影響;Haroon N等[10]使用零膨脹負(fù)二項回歸模型評價腫瘤壞死因子抑制劑對強(qiáng)直性脊柱炎患者進(jìn)展性脊柱損害的療效;Ritter AV等[11]將零膨脹負(fù)二項回歸模型用于木糖醇防治齲齒的療效評價。
藥品臨床安全性評價中的計數(shù)資料主要指不良事件或不良反應(yīng)的計數(shù)資料。分析內(nèi)容常包括發(fā)生率、發(fā)生頻次、影響因素分析等。其中,不良事件或不良反應(yīng)的發(fā)生頻次數(shù)據(jù)分析非常重要。有研究表明,在公共衛(wèi)生規(guī)劃和質(zhì)量管理規(guī)劃評估領(lǐng)域中,不良反應(yīng)發(fā)生頻次研究更為重要[12]。
當(dāng)臨床研究進(jìn)入Ⅲ、Ⅳ期之后,不良事件或不良反應(yīng)發(fā)生頻次數(shù)據(jù)具有樣本量大、發(fā)生率低、多次重復(fù)發(fā)生且相互獨立、多種混雜因素干擾等特點。同時,不良事件或不良反應(yīng)計數(shù)數(shù)據(jù)屬于公共健康領(lǐng)域的計數(shù)資料,該類計數(shù)資料的特點決定其可能存在零膨脹現(xiàn)象。
目前,研究者常假設(shè)不良事件或不良反應(yīng)發(fā)生頻次數(shù)據(jù)服從poisson分布或負(fù)二項分布,通過擬合poisson回歸或負(fù)二項回歸模型進(jìn)行影響因素分析。但是,許多研究表明,poisson回歸或負(fù)二項回歸模型并非不良事件或不良反應(yīng)發(fā)生頻次影響因素分析的最優(yōu)模型。李嬋娟等[13]研究表明,poisson回歸模型過低估計不良事件頻次為“零”的發(fā)生,過高估計不良事件頻次為“1”、“2”的發(fā)生。在處理個體聚集性現(xiàn)象時,負(fù)二項回歸模型優(yōu)于泊松回歸模型,但是也存在事件分布偏離負(fù)二項分布的現(xiàn)象。Khokan C Sikdar等[14]研究表明,老年住院患者不良反應(yīng)發(fā)生頻次影響因素的建模中,ZIP和ZINP模型的擬合效果要優(yōu)于poisson和負(fù)二項模型。
模型應(yīng)用條件與數(shù)據(jù)特點的不匹配是模型擬合不良的一個重要原因。Poisson回歸模型和負(fù)二項回歸模型在擬合過程中未考慮數(shù)據(jù)中可能存在的零膨脹現(xiàn)象,可能是藥品不良事件或不良反應(yīng)發(fā)生頻次影響因素的poisson回歸和負(fù)二項回歸模型擬合不良的重要原因。識別和控制不良事件或不良反應(yīng)發(fā)生頻次數(shù)據(jù)中可能存在的零膨脹現(xiàn)象對于改善模型擬合效果具有重要意義。零膨脹模型可能是更優(yōu)的一類替代模型。
零膨脹模型的特點決定了其非常適合用于不良事件或不良反應(yīng)發(fā)生頻次數(shù)據(jù)的分析。為了解零膨脹模型在藥品安全性評價領(lǐng)域中的應(yīng)用現(xiàn)狀,本文以CNKI、CBM、Pubmed、SCI Expanded數(shù)據(jù)庫為檢索庫,adverse event(s)、adverse drug reaction(s)、zero-inflated為主題詞,時間設(shè)定為截止到2013年10月15日,經(jīng)計算機(jī)檢索和人工核查,共檢索到3篇相關(guān)文獻(xiàn)[14-16],均被SCI收錄。最早1篇由C.E.Rose等[15]發(fā)表于2006年,內(nèi)容為零膨脹模型和Hurdle模型用于疫苗不良事件計數(shù)資料建模的研究。SCI Expanded數(shù)據(jù)庫檢索結(jié)果表明,截止到2013年10月15日,該文已被引用44次。A.L.Baughman等[16]于2007年發(fā)表了1篇文章,對Rose在2006年發(fā)表的這篇文章進(jìn)行了更深入的研究。Khokan C Sikdar等[14]在2012年發(fā)表的老年住院患者不良反應(yīng)發(fā)生頻次影響因素研究采用了零膨脹模型。
盡管目前相關(guān)文獻(xiàn)數(shù)量有限,但是這些研究表明,零膨脹模型用于藥品不良事件或不良反應(yīng)發(fā)生頻次影響因素分析具有一定的可行性且優(yōu)于poisson回歸模型和負(fù)二項回歸模型。
綜上所述,將零膨脹模型用于不良事件或不良反應(yīng)發(fā)生頻次的影響因素建模,是處理數(shù)據(jù)中可能存在的零膨脹現(xiàn)象、個體聚集性等問題的重要統(tǒng)計分析方法,對于提高參數(shù)估計精度、探索藥品不良事件、不良反應(yīng)及其他安全性事件的發(fā)生規(guī)律、識別重要危險因素以及預(yù)測等均具有重要意義。
中藥(特別是中藥注射劑)的臨床安全性是社會關(guān)注焦點。2012年5月,國家食品藥品監(jiān)督管理局(SFDA)發(fā)布的2011年國家藥品不良反應(yīng)監(jiān)測年度報告[17]中指出,中藥注射劑依然是中藥制劑的主要風(fēng)險。中藥上市后臨床安全性急需大樣本、多中心、高質(zhì)量的臨床安全性再評價研究進(jìn)行論證??紤]到poisson回歸模型和負(fù)二項回歸模型處理存在零膨脹現(xiàn)象計數(shù)數(shù)據(jù)的不足,將零膨脹模型用于中藥上市后臨床安全性計數(shù)資料的分析,可在豐富中藥上市后安全性再評價分析方法的同時,為提高中藥臨床安全性研究質(zhì)量和證據(jù)強(qiáng)度提供依據(jù)。
[1]王婷,曾平.ZIP模型在臨床研究中的應(yīng)用及SAS實現(xiàn)[J].中國衛(wèi)生統(tǒng)計,2011,28(6):670-673.
[2]項麗雅.ZIP回歸模型的變量選擇及其在保費厘定中的應(yīng)用[D].復(fù)旦大學(xué),2012:5-8.
[3]田嬌妮,劉桂芬,張軍鋒.多水平零膨脹計數(shù)模型在骨關(guān)節(jié)疼痛影響因素中的應(yīng)用研究[J].中國衛(wèi)生統(tǒng)計,2012,29(1):44-46.
[4]徐濤.零頻數(shù)過多資料的統(tǒng)計學(xué)模型應(yīng)用研究-亞健康狀態(tài)研究中的應(yīng)用[D].北京:北京協(xié)和醫(yī)學(xué)院,2011:17-18.
[5]王存同.零膨脹模型在社會科學(xué)實證研究中的應(yīng)用-以中國人工流產(chǎn)影響因素的分析為例[J].社會學(xué)研究,2010,(5):130-148.
[6]Jiang X,Huang B,Zaretzki RL,et al.Investigating the influence of curbs on single-vehicle crash injury severity utilizing zero-inflated ordered probit models[J].Accid Anal Prev,2013,57:55-66.
[7]Kilic D,Ozturk S.Gender differences in cigarette consumption in Turkey:Evidence from the Global Adult Tobacco Survey[J].Health Policy,2013.
[8]王存同.避孕知情選擇對中國人工流產(chǎn)的影響分析[J].人口與發(fā)展,2010,16(3):17-26.
[9]Lu CY,Srasuebkul P,Drew AK,et al.Trastuzumab therapy in Australia:Which patients with HER2+metastatic breast cancer are assessed for cardiac function[J].Breast,2013,22(4):482-487.
[10]Haroon N,Inman RD,Learch TJ,et al.The Impact of TNF-inhibitors on radiographic progression in Ankylosing Spondylitis[J].Arthritis Rheum,2013.
[11]Ritter AV,Bader JD,Leo MC,et al.Tooth-surface-specific effects of xylitol:randomized trial results[J].J Dent Res,2013,92(6):512-517.
[12]Donaldson MG,Sobolev B,Cook WL,et al.Analysis of recurrent events:a systematic review of randomised controlled trials of interventions to prevent falls[J].Age Ageing,2009;38:151-5.
[13]李嬋娟.新藥臨床研究中安全性評價的統(tǒng)計方法[D].西安:第四軍醫(yī)大學(xué),2005:9-13.
[14]Khokan C Sikdar,Jdffrey Dowden,Reza Alaghehbandan,et al.Adverse Drug Reactions in Elderly Hospitalized Patients:A 12-Year Population-Based Retrospective Cohort Study[J].The Annals of Pharmacotherapy,2012,46(7):960-971.
[15]C.E.Rose,S.W.Martin,K.A.Wannemudhler,et al.On the Use of Zero-Inflated and Hurdle Models for Modeling Vaccine Adverse Event Count Data[J].ouranl of Biopharmaceutical Statistics,2006,16(4):463-481.
[16]A.L.Baughman.Mixture Model Framework Facilitates Understanding of Zero-Inflated and Hurdle Models for Count Data[J].Jouranl of Biopharmaceutical Statistics,2007,17(5):943-946.
[17]2011年國家藥品不良反應(yīng)監(jiān)測年度報告.http://www.sda.gov.cn/WS01/CL0078/72193.html.
Application of Zero-inflated Models in Drug Safety Analysis of Count Data
Zhai Jingbo Zheng Wenke Lei Xiang Cao Hongbo Wang Hui Shang Hongcai?
(Tianjin University of TCM,Tianjin,300193,China)
Abastact:Zero-inflated model is a statistical model for handling zero-inflated count data.It's widely used in modeling insurance data,investigating the influence of curbs on single-vehicle crash injury severity and so on.Zero-inflated phenomenon may existed in drug safety analysis of count data.There is the problem of poor fit in modeling zero-inflated count data by poisson regression or negative binomial regression model.Zero-inflated model may be a better alternative and the related examples have been reported.The zero-inflated models could be used to model adverse events or adverse reactions count data.It consider the zero-inflated phenomenon and Improve accuracy of parameter estimation.There is great significance in exploring drugs(especially traditional Chinese medicine injections)security events occurrence,identifing important risk factors and so on.
Zero-inflated model;Drug safety;Count data
10.3969/j.issn.1672-2779.2013.21.116
1672-2779(2013)-21-0164-02
吳義紅
2013-07-08)
國家自然科學(xué)基金[No:81303093];“十二五”重大新藥創(chuàng)制項目[No:2011ZX09304]
*通訊作者