彭榮榮,劉蕓男,楊冬燕,王含柔,趙明烽,楊小麗
1)重慶醫(yī)科大學(xué)公共衛(wèi)生與管理學(xué)院;醫(yī)學(xué)與社會(huì)發(fā)展研究中心;健康領(lǐng)域社會(huì)風(fēng)險(xiǎn)預(yù)測(cè)治理協(xié)同創(chuàng)新中心 重慶 400016 2)重慶市血液中心 重慶 400015
自《獻(xiàn)血法》頒布實(shí)施以來(lái),我國(guó)已建立起橫向到邊、縱向到底、覆蓋城鄉(xiāng)的采供血服務(wù)體系,形成了以血液中心為龍頭、中心血站為基礎(chǔ)、中心血庫(kù)為補(bǔ)充的三級(jí)服務(wù)網(wǎng)絡(luò),血液供應(yīng)能力、臨床合理用血能力以及血液安全水平顯著提高。根據(jù)世界衛(wèi)生組織研究報(bào)告,當(dāng)無(wú)償獻(xiàn)血率達(dá)1%~3%時(shí)才能滿足該國(guó)基本的用血需求,2017年我國(guó)無(wú)償獻(xiàn)血率為1.05%,總體上看,我國(guó)血液保障能力尚處于“緊平衡”狀態(tài)[1]。近些年隨著地市級(jí)醫(yī)療機(jī)構(gòu)服務(wù)能力的提高和醫(yī)院規(guī)模的不斷擴(kuò)張,以前不得不去省級(jí)綜合型醫(yī)療機(jī)構(gòu)就醫(yī)的患者選擇到中心血站覆蓋的地市級(jí)醫(yī)療機(jī)構(gòu)接受治療,造成地市級(jí)醫(yī)療機(jī)構(gòu)血液用量迅速增長(zhǎng),中心血站血液供應(yīng)面臨巨大壓力和挑戰(zhàn),血液供應(yīng)緊張的現(xiàn)象已呈現(xiàn)常態(tài)化趨勢(shì),區(qū)域性、季節(jié)性和結(jié)構(gòu)性缺血現(xiàn)象時(shí)有發(fā)生[2]。據(jù)報(bào)道,2014~2016年,重慶市中心血站供血量增長(zhǎng)5%,而同期床位數(shù)、住院人次數(shù)及手術(shù)人次數(shù)均以兩位數(shù)增長(zhǎng),其中手術(shù)人次數(shù)的增長(zhǎng)是血液供應(yīng)量增長(zhǎng)的3倍[3]。如何科學(xué)地預(yù)測(cè)臨床用血需求,確保血液供給與需求之間的平衡值得深入研究。目前對(duì)臨床用血需求的預(yù)測(cè)主要是依據(jù)相關(guān)人員既往經(jīng)驗(yàn)進(jìn)行粗略估計(jì)。自回歸移動(dòng)平均模型(autoregressive integrated moving average model,ARIMA)是一種時(shí)間序列模型,描述時(shí)間序列數(shù)據(jù)的變化規(guī)律和行為,可用于包含趨勢(shì)變動(dòng)、季節(jié)變動(dòng)等不同特征的時(shí)間序列建模并進(jìn)行預(yù)測(cè)。本研究擬采用時(shí)間序列分析方法探究臨床用血?dú)v史數(shù)據(jù)隨時(shí)間發(fā)展變化的規(guī)律,通過(guò)建立ARIMA模型預(yù)測(cè)臨床用血需求,為中心血站科學(xué)制定招募及采集計(jì)劃提供依據(jù)。
1.1數(shù)據(jù)來(lái)源收集2006年1月~2016年12月重慶市萬(wàn)州中心血站每月向醫(yī)院提供的懸浮紅細(xì)胞的原始數(shù)據(jù)。臨床用血量以U為單位計(jì)算,1 U懸浮紅細(xì)胞由200 mL全血分離制備。
1.2ARIMA模型的建立①時(shí)間序列情況分析及序列平穩(wěn)化處理:根據(jù)原始序列圖判斷該序列是否平穩(wěn),若不平穩(wěn),則需對(duì)序列的趨勢(shì)和季節(jié)性趨勢(shì)進(jìn)行差分和季節(jié)差分處理使其平穩(wěn)。②模型識(shí)別:繪制平穩(wěn)序列的ACF和PACF圖,判斷其拖尾或截尾情況以便為目標(biāo)模型定階,并選定1~2個(gè)模型作為備選模型。③模型參數(shù)估計(jì)與檢驗(yàn):對(duì)備選模型進(jìn)行參數(shù)估計(jì)與假設(shè)檢驗(yàn),并依據(jù)BIC準(zhǔn)則確定最佳模型。然后對(duì)模型的殘差序列進(jìn)行白噪聲診斷,根據(jù)殘差序列ACF和PACF是否落在95%CI內(nèi),或Ljung-Box統(tǒng)計(jì)量有無(wú)統(tǒng)計(jì)學(xué)意義進(jìn)行判定。④模型預(yù)測(cè):運(yùn)用選定模型預(yù)測(cè)需求值,計(jì)算95%CI以及相對(duì)誤差,并與同期實(shí)際值比較,以驗(yàn)證模型的擬合效果。
1.3統(tǒng)計(jì)學(xué)處理運(yùn)用Excel建立數(shù)據(jù)庫(kù),采用SPSS 19.0進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析。其中2006年1月~2016年6月的懸浮紅細(xì)胞臨床用量原始數(shù)據(jù)用于模型建立,2016年7月~2016年12月的原始數(shù)據(jù)用于驗(yàn)證模型的預(yù)測(cè)效果。
2.1時(shí)間序列分析及平穩(wěn)化處理有鑒于原始序列存在明顯的趨勢(shì)性和季節(jié)性,故選用ARIMA乘積季節(jié)性模型,即ARIMA(p,d,q)(P,D,Q)s。序列的季節(jié)周期為12個(gè)月,故S=12;因進(jìn)行了一階差分和一階季節(jié)差分,故d=1,D=1。繪制2006年1月~2016年6月每月懸浮紅細(xì)胞臨床用量原始序列圖(圖1上),可見(jiàn)2006~2011年臨床紅細(xì)胞用量逐年上升,2012~2016年逐漸變緩;同時(shí)該序列還存在明顯的季節(jié)周期性,以12個(gè)月為一個(gè)周期,每年的7~8月是供血高峰,1~2月則是低谷。經(jīng)過(guò)一階差分和一階季節(jié)差分后序列中每個(gè)值都圍繞在固定值附近波動(dòng),為平穩(wěn)序列(圖1下)。
圖1 原始(上)、一階差分和一階季節(jié)差分后(下)的序列圖
2.2模型識(shí)別繪制ACF和PACF圖(圖2),可見(jiàn)PACF第1~3期特別突出,第4期后明顯收縮,判斷PACF呈3階截尾,故p取3;ACF第1、3、5、10、13期都有突出,因此判斷ACF拖尾或者截尾特征不明顯,故q取0;同時(shí),ACF在12階顯著不為0,故q=1;PACF在12階附近顯著不為0,故p=0或1。由此獲得2個(gè)備選模型,即ARIMA(3,1,0)(0,1,1)12和ARIMA(3,1,0)(1,1,1)12。
圖2 一階差分和一階季節(jié)差分后的ACF和PACF圖
2.3模型參數(shù)估計(jì)與檢驗(yàn)2個(gè)備選模型的參數(shù)估計(jì)及假設(shè)檢驗(yàn)結(jié)果見(jiàn)表1。根據(jù)貝葉斯判定準(zhǔn)則[4],模型ARIMA(3,1,0)(0,1,1)12的BIC值小于模型ARIMA(3,1,0)(1,1,1)12,故最終選擇模型ARIMA(3,1,0)(0,1,1)12。
表1 2個(gè)備選模型的參數(shù)估計(jì)及假設(shè)檢驗(yàn)
對(duì)模型ARIMA(3,1,0)(0,1,1)12的殘差序列進(jìn)行白噪聲診斷,結(jié)果見(jiàn)圖3。殘差序列ACF和PACF落在95%CI內(nèi);Ljung-Box統(tǒng)計(jì)量無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05),說(shuō)明殘差是隨機(jī)分布的,模型充分提取了原序列中的數(shù)據(jù)信息,適用于臨床懸浮紅細(xì)胞需求量的預(yù)測(cè)。
圖3 ARIMA(3,1,0)(0,1,1)12殘差序列ACF和PACF圖
2.4模型預(yù)測(cè)應(yīng)用ARIMA(3,1,0)(0,1,1)12模型對(duì)2016年7~12月每月的懸浮紅細(xì)胞臨床用量進(jìn)行預(yù)測(cè),并將預(yù)測(cè)值與同期實(shí)際值進(jìn)行比較,平均相對(duì)誤差為4.27%(表2),模型擬合圖中預(yù)測(cè)值與實(shí)際值的趨勢(shì)相同(圖4)。平均相對(duì)誤差小于5%說(shuō)明模型的預(yù)測(cè)結(jié)果精度較高,預(yù)測(cè)擬合效果好[5-7]。
表2 2016年7~12月份懸浮紅細(xì)胞臨床用量預(yù)測(cè)值與實(shí)際值的比較
圖4 懸浮紅細(xì)胞臨床用量ARIMA(3,1,0)(0,1,1)12模型擬合效果圖
時(shí)間序列是指對(duì)于隨時(shí)間變化的某種現(xiàn)象,根據(jù)時(shí)間間隔順序記錄下的一列有序數(shù)據(jù);時(shí)間序列分析是探究包含在這組按時(shí)間間隔順序記錄下的真實(shí)數(shù)據(jù)中的所有信息,研究其在長(zhǎng)期變動(dòng)過(guò)程中所存在的統(tǒng)計(jì)規(guī)律性,并通過(guò)建立統(tǒng)計(jì)模型實(shí)現(xiàn)預(yù)測(cè)和控制將來(lái)事件的目的[8]。時(shí)間序列分析方法主要有兩大功能:一是描述功能,通過(guò)建立模型來(lái)描述某種現(xiàn)象隨時(shí)間推移的變化規(guī)律;二是預(yù)測(cè)功能,利用某現(xiàn)象過(guò)去和現(xiàn)在的數(shù)據(jù)資料預(yù)測(cè)將來(lái)事件[9]。ARIMA模型是時(shí)間序列分析中最重要和常用的方法之一,它針對(duì)隨時(shí)間變動(dòng)的序列建模,對(duì)每個(gè)季節(jié)周期中同時(shí)間點(diǎn)的序列值進(jìn)行分析,提取季節(jié)趨勢(shì),并對(duì)每個(gè)季節(jié)周期內(nèi)部序列值的變化提取非季節(jié)性成分來(lái)做預(yù)測(cè)[10]。近年來(lái)ARIMA模型在醫(yī)療衛(wèi)生領(lǐng)域中的應(yīng)用已較為廣泛,主要集中于發(fā)病趨勢(shì)的預(yù)測(cè)[11-13],如梅毒發(fā)病率預(yù)測(cè)、乙肝發(fā)病數(shù)預(yù)測(cè)等。有文獻(xiàn)[14]報(bào)道,ARIMA模型在預(yù)測(cè)醫(yī)院臨床血液需求量方面優(yōu)于其他時(shí)間序列模型。
懸浮紅細(xì)胞是一種紅細(xì)胞成分血,是將采集的全血中絕大部分的血漿分離之后,向剩余的部分加入紅細(xì)胞添加液而制成,它有減少輸血不良反應(yīng)發(fā)生、增強(qiáng)運(yùn)氧能力等優(yōu)點(diǎn),但保存期限較短(低于35 d)。本研究將近些年血液供需矛盾較為突出的中心血站納入研究視野,以重慶市采供血量最大的中心血站萬(wàn)州中心血站為研究對(duì)象,利用該血站2006年1月~2016年6月每月懸浮紅細(xì)胞臨床用量建立ARIMA模型,經(jīng)模型識(shí)別、參數(shù)估計(jì)與檢驗(yàn),得出ARIMA(3,1,0)(0,1,1)12模型為最優(yōu)模型;然后,運(yùn)用該模型對(duì)萬(wàn)州中心血站2016年7~12月每月懸浮紅細(xì)胞臨床用量進(jìn)行預(yù)測(cè),結(jié)果顯示預(yù)測(cè)值均在95%CI內(nèi),且預(yù)測(cè)值和實(shí)際值的動(dòng)態(tài)趨勢(shì)基本一致,平均相對(duì)誤差較小(4.27%),說(shuō)明該模型的預(yù)測(cè)精度較高,可以用于該中心血站未來(lái)懸浮紅細(xì)胞臨床用量的預(yù)測(cè)。
建立懸浮紅細(xì)胞臨床用量數(shù)學(xué)模型,不僅有助于血站科學(xué)地制定招募采血計(jì)劃,為加大團(tuán)體獻(xiàn)血的宣傳力度、構(gòu)建穩(wěn)固的獻(xiàn)血隊(duì)伍、提高血液供給及需求之間的契合度提供科學(xué)的依據(jù);同時(shí)也能幫助醫(yī)院在模型預(yù)測(cè)的、采供血機(jī)構(gòu)可以提供的懸浮紅細(xì)胞用量的基礎(chǔ)上,科學(xué)合理地進(jìn)行輸血治療和手術(shù)安排,這對(duì)指導(dǎo)臨床工作具有極其重要的作用。然而,ARIMA模型也具有一定的局限性,它是依靠歷史數(shù)據(jù)建立的數(shù)學(xué)模型,是基于數(shù)據(jù)本身規(guī)律進(jìn)行的預(yù)測(cè),并未考慮國(guó)家重大政策改變和調(diào)整、突發(fā)事件等外部因素的影響[15]。因此,ARIMA模型僅適用于短期結(jié)果預(yù)測(cè),在懸浮紅細(xì)胞未來(lái)臨床需求的預(yù)測(cè)中,預(yù)測(cè)時(shí)間不宜過(guò)長(zhǎng),以1 a較為恰當(dāng)[16]。預(yù)測(cè)時(shí)間過(guò)長(zhǎng)會(huì)增大預(yù)測(cè)誤差,影響預(yù)測(cè)精度。近年來(lái),健康中國(guó)戰(zhàn)略的實(shí)施、二孩政策的推行、人口老齡化的加速等都促發(fā)了臨床用血?jiǎng)傂孕枨蟮脑鲩L(zhǎng),尤其是2018年互助獻(xiàn)血取消以后,臨床用血的缺口加大,這些均可能對(duì)預(yù)測(cè)效果產(chǎn)生影響。因此,每年應(yīng)及時(shí)更新懸浮紅細(xì)胞臨床用量信息,根據(jù)最新數(shù)據(jù)重新選定ARIMA模型,以確保預(yù)測(cè)的精度。