呂藝通 劉志泉 莫巧頻 王東 謝慶歡 劉曼麗
近年來, 隨著醫(yī)療衛(wèi)生的改革, 順德地區(qū)多家三甲、二甲醫(yī)院由國內(nèi)知名醫(yī)科大學(xué)托管, 醫(yī)院診療水平顯著提升, 臨床用血量也逐年上升。順德區(qū)中心血站作為轄區(qū)內(nèi)唯一的采供血機(jī)構(gòu), 承擔(dān)著全區(qū)的采供血任務(wù), 年采供血量達(dá)13 噸。作為一個基層中心血站, 其轄區(qū)面積、常住人口數(shù)量、人力物力的投入以及對血液應(yīng)急調(diào)配的權(quán)限和靈活度都不如市級中心血站及血液中心。因此, 如何精準(zhǔn)把控血液庫存, 既要滿足臨床的用血需求, 又要避免因血液庫存過高而過期報廢, 是基層血站庫存管理工作需要考慮的重要問題之一。血小板作為挽救患者的重要血液成分, 被廣泛應(yīng)用于血小板數(shù)量減少或功能障礙等引起的出血患者的輸血治療[1]。因其采集方式特殊, 保存時間特別短,保存期僅為5 d, 不宜大量貯存, 采供矛盾最為突出, 所以對如何科學(xué)合理地規(guī)劃庫存提出了更高的要求, 是一個值得深入研究的課題。ARIMA 模型是一種被廣泛應(yīng)用的數(shù)學(xué)模型, 通過分析時間序列前后數(shù)據(jù)的相關(guān)性, 利用歷史數(shù)據(jù)的規(guī)律預(yù)測疾病發(fā)生的趨勢[2]。本研究擬運(yùn)用ARIMA 模型對順德區(qū)中心血站2012 年1 月~2022 年6 月的單采血小板臨床使用量進(jìn)行分析并建立模型, 并用于預(yù)測2022 年7 月~2023 年3 月臨床單采血小板需求量, 為順德區(qū)中心血站單采血小板的招募采集、制定合理的血小板庫存提供科學(xué)依據(jù),現(xiàn)報告如下。
1.1 數(shù)據(jù)來源 通過SHINOW9.5 現(xiàn)代血站管理信息系統(tǒng), 獲取順德區(qū)中心血站2012 年1 月~2022 年6 月的單采血小板使用量數(shù)據(jù)(因本研究時間段內(nèi), 順德區(qū)中心血站所制備的濃縮血小板量極少, 所以不納入本次研究對象)。臨床單采血小板使用量以治療量計算[3],1 個治療量血小板計數(shù)≥2.5×1011/L。
1.2 建立ARIMA 模型 建立ARIMA 模型的步驟:①原始時間序列及平穩(wěn)化處理。繪制2012 年1 月~2022 年6 月順德區(qū)中心站單采血小板臨床使用量的原始時間序列圖, 分析原始序列圖是否為具有趨勢和季節(jié)性趨勢的不平穩(wěn)序列, 對不平穩(wěn)序列進(jìn)行差分, 使序列平穩(wěn)化。②ARIMA 模型識別和參數(shù)估計。根據(jù)ACF 圖和PACF 圖的特征, 以及是否出現(xiàn)拖尾或截尾的情況來推斷出p、d、q 值, 并初步建立若干個備選的ARIMA 模型, 如果時間序列有明顯的趨勢和季節(jié)性趨勢, 應(yīng)選擇建立ARIMA(p, d, q)(P, D, Q)s 乘積季節(jié)性模型, 其中p、q 分別為非季節(jié)自回歸和移動平均的階數(shù), P、Q 分別為季節(jié)性自回歸和移動平均的階數(shù), d、D 分別為差分和季節(jié)性差分的次數(shù), s 為循環(huán)的季節(jié)周期[4]。對備選模型參數(shù)P 值進(jìn)行檢驗(yàn), 若P<0.05, 則差異有統(tǒng)計學(xué)意義, 參數(shù)檢驗(yàn)通過。根據(jù)時間序列的識別規(guī)則, 結(jié)合ACF 圖、PACF 圖和貝葉斯準(zhǔn)則(BIC準(zhǔn)則), 對各個模型的標(biāo)準(zhǔn)化BIC 值的大小進(jìn)行比較,BIC 值越小的模型, 擬合效果越好[5,6], 從而選出最優(yōu)模型。③ARIMA 模型檢驗(yàn)。根據(jù)殘差序列的自相關(guān)圖、偏相關(guān)圖和殘差序列Ljung-Box Q 的統(tǒng)計結(jié)果判斷殘差是否存在自相關(guān)性, 若P>0.05, 則殘差通過白噪聲顯著性檢驗(yàn), 所建模型擬合效果較好。④模型預(yù)測。利用建立的最優(yōu)模型, 預(yù)測2022 年7 月~2023 年3 月順德區(qū)臨床單采血小板的使用量, 并與實(shí)際使用量進(jìn)行比較, 計算平均相對誤差, 以驗(yàn)證模型的擬合效果。
1.3 統(tǒng)計學(xué)方法 應(yīng)用SPSS23.0 統(tǒng)計學(xué)軟件對單采血小板臨床使用量進(jìn)行數(shù)據(jù)錄入, 并對數(shù)據(jù)進(jìn)行統(tǒng)計分析, 建立ARIMA 模型。對確立的模型進(jìn)行白噪聲檢驗(yàn), P<0.05 為差異有統(tǒng)計學(xué)意義。
2.1 原始時間序列分析及平穩(wěn)化處理 通過繪制順德區(qū)中心血站2012 年1 月~2022 年6 月單采血小板臨床使用量的原始序列圖(見圖1), 由原始序列圖可見, 單采血小板臨床使用量呈逐年上升趨勢, 而且序列圖存在明顯的季節(jié)性周期波動, 以12 個月為1 個周期, 每年的1、2 月份單采血小板使用量最低, 每年的7、8、11、12 月份使用量最高。原始序列圖不平穩(wěn), 因此,對數(shù)據(jù)進(jìn)行1 階差分和1 階季節(jié)性差分, 差分后的序列圖圍繞0 值上下波動, 為平穩(wěn)序列(見圖2)。
圖1 單采血小板臨床使用量的原始序列圖
2.2 模型的識別和參數(shù)估計 因2012 年1 月~2022 年6 月單采血小板臨床使用量呈逐年上升趨勢, 而且序列圖存在明顯的季節(jié)性周期波動, 所以選用ARIMA(p, d, q)(P, D, Q)s 乘積季節(jié)性模型, 由2.1 分析可知,季節(jié)性周期為12 個月, 故s=12, 對數(shù)據(jù)進(jìn)行平穩(wěn)化處理時, 分別進(jìn)行了1 階差分和1 階季節(jié)性差分。因此, d=1, D=1。通過分析差分后的ACF 圖(見圖3)和PACF 圖(見 圖4)可 知, ACF 圖 在 滯 后1, 2, 5, 7, 12,13 階時均有突起, 拖尾和截尾特征不明顯, 故q=0;PACF 圖在滯后1, 2 階突起, 第2 階后明顯回縮, 呈2 階截尾, 故p=2。另外, ACF 圖在滯后12 階時顯著不為0, 故Q=1;PACF 圖在滯后12 階附近顯著不為0,故P=0 或1。因此, 初步識別的模型為ARIMA(2, 1, 0)(0, 1, 1)12和ARIMA(2, 1, 0)(1, 1, 1)12。對所識別的模型進(jìn)行參數(shù)估計和參數(shù)檢驗(yàn)(見表1), 由表1 可知, 模型ARIMA(2, 1, 0)(0, 1, 1)12的BIC 值 小 于 模 型ARIMA(2, 1, 0)(1, 1, 1)12的BIC 值, 且模型參數(shù)差異有統(tǒng)計學(xué)意義(P<0.05), 因此, 確定模型ARIMA(2, 1, 0)(0, 1, 1)12為最優(yōu)模型。
表1 單采血小板臨床使用量識別模型的參數(shù)估計和參數(shù)檢驗(yàn)
圖3 單采血小板臨床使用量經(jīng)1 階差分和1 階季節(jié)差分后ACF 圖
圖4 單采血小板臨床使用量經(jīng)1 階差分和1 階季節(jié)差分后PACF 圖
2.3 模型檢驗(yàn) 對最優(yōu)模型ARIMA(2, 1, 0)(0, 1, 1)12殘差序列進(jìn)行白噪聲檢驗(yàn)(見圖5), 結(jié)果可見殘差序列ACF 和PACF 落 在95%CI 內(nèi);Ljung-BoxQ 統(tǒng) 計 量 為24.941, 差異無統(tǒng)計學(xué)意義(P>0.05), 說明殘差是隨機(jī)分布的, 殘差不存在相關(guān)性, 為白噪聲序列, 模型檢驗(yàn)通過, 適合用于單采血小板使用量的預(yù)測。
圖5 模型ARIMA(2, 1, 0)(0, 1, 1)12 殘差序列ACF 和PACF 圖
2.4 模型預(yù)測 應(yīng)用模型ARIMA(2, 1, 0)(0, 1, 1)12對順德區(qū)2022 年7 月~2023 年3 月的單采血小板臨床使用量進(jìn)行預(yù)測, 預(yù)測結(jié)果與實(shí)際值均在95%CI 范圍內(nèi), 平均相對誤差為7.06%(見表2)。由2012 年1 月~2022 年6 月的模型擬合圖可知, 預(yù)測值與實(shí)際值的曲線趨勢擬合程度較高(見圖6)。大量研究顯示[7-9], 平均相對誤差<10%, 則說明所建模型擬合效果較好, 精確度較高。
表2 2022 年7 月~2023 年3 月單采血小板臨床實(shí)際使用量與預(yù)測量比較(治療量)
圖6 單采血小板臨床使用量ARIMA(2, 1, 0)(0, 1, 1)12 模型擬合效果圖
ARIMA 模型通過對具有趨勢和季節(jié)性趨勢的時間序列進(jìn)行建模, 對每個季節(jié)周期中同時間點(diǎn)的序列值進(jìn)行分析, 提取季節(jié)趨勢, 并對每個季節(jié)周期內(nèi)部序列值的變化提取非季節(jié)性成分來做預(yù)測[10]。它充分考慮了時間序列上的依存關(guān)系和隨機(jī)波動造成的干擾, 具有建模相對簡單、短期預(yù)測精度較高、經(jīng)濟(jì)實(shí)用等優(yōu)點(diǎn), 目前已被廣泛應(yīng)用于衛(wèi)生領(lǐng)域的病毒疫情發(fā)展趨勢[11]、疾病發(fā)展情況[12,13]、臨床用血趨勢[14]等的預(yù)測。有研究顯示[15], ARIMA 模型在預(yù)測臨床用血需求的精確性優(yōu)于其他時間序列模型。
盡管目前國內(nèi)已經(jīng)有不少學(xué)者運(yùn)用不同的數(shù)學(xué)模型對臨床用血量進(jìn)行預(yù)測[16,17], 但大部分都是基于省級血液中心和市級中心血站的歷史用血數(shù)據(jù)而進(jìn)行的預(yù)測, 而對縣、區(qū)級血站的相關(guān)研究報道甚少, 對基層血站的臨床用血預(yù)測缺乏參考依據(jù)。本研究通過按月份對順德區(qū)中心血站2012 年1 月~2022 年6 月的單采血小板使用量進(jìn)行統(tǒng)計分析, 并運(yùn)用ARIMA 時間序列模型進(jìn)行建模, 經(jīng)過參數(shù)檢驗(yàn)和BIC 準(zhǔn)則對初步確定的模型進(jìn)行檢驗(yàn), 最終確定模型ARIMA(2, 1, 0)(0, 1, 1)12為最優(yōu)模型。運(yùn)用最優(yōu)模型對順德區(qū)中心血站2022 年7 月~2023 年3 月的單采血小板臨床使用量進(jìn)行預(yù)測, 結(jié)果顯示預(yù)測值與實(shí)際值的曲線趨勢基本一致, 預(yù)測結(jié)果值與實(shí)際值均在95%CI 范圍內(nèi), 平均相對誤差為7.06%, 說明預(yù)測效果較精確, 預(yù)測效果好。所建模型適合用于順德區(qū)的臨床血小板需求量預(yù)測。
目前, 順德區(qū)中心血站的單采血小板供應(yīng)方式有兩種:①對于常規(guī)患者, 醫(yī)院提前預(yù)約下單, 獻(xiàn)血科招募采集, 檢測合格后發(fā)放給臨床。②對于危急患者, 醫(yī)院電話向血站提出緊急用血申請, 血站評估通過后, 發(fā)放應(yīng)急庫存。但在實(shí)際工作中, 由于臨床血小板的需求難以估計, 當(dāng)血小板需求劇增時, 會導(dǎo)致預(yù)約的單采血小板供應(yīng)延遲和應(yīng)急庫存貯備不足等情況的發(fā)生。通過利用ARIMA 模型提前預(yù)測每個月的血小板需求量, 獻(xiàn)血服務(wù)科可根據(jù)預(yù)測結(jié)果, 有效規(guī)劃獻(xiàn)血者的招募和保留工作, 提高招募效率, 供血服務(wù)科可根據(jù)預(yù)測結(jié)果, 合理地制定動態(tài)的單采血小板應(yīng)急庫存和對臨床醫(yī)院采取必要的用血管理措施, 在一定程度上彌補(bǔ)了基層血站依靠工作經(jīng)驗(yàn)來預(yù)測庫存的不足, 有利于維持單采血小板的采供平衡, 既保證了臨床用血, 也避免了血液的過期報廢。但該模型也有一定局限性, 研究顯示, 該模型是通過歷史數(shù)據(jù)的慣性趨勢而建立的,忽略了國家的重大政策調(diào)整和突發(fā)事件等外在因素,只適用于短期預(yù)測[18]。因此, 在今后的研究工作中,需要不斷更新數(shù)據(jù), 及時對模型進(jìn)行修正和調(diào)整, 以提高預(yù)測結(jié)果和實(shí)際結(jié)果的擬合精確度。