謝忠杭,歐劍鳴,張瑩珍,黃文龍,王靈嵐
戊型肝炎(戊肝)是由戊型肝炎病毒引起的一種人獸共患病,臨床癥狀類似于甲型肝炎,但病死率相對較高,主要經(jīng)糞-口途徑傳播,可經(jīng)水、食物等途徑傳播引起散發(fā)或暴發(fā)流行[1-2];目前該病尚缺乏特效的治療方法,也沒有特異性免疫制劑可供預防[1-2],因此監(jiān)測資料的分析與預警是及時控制并減少其危害的關鍵之一;自2004年啟動《疾病監(jiān)測信息報告管理系統(tǒng)》至今,在全國范圍內(nèi)針對戊肝疫情做到了連續(xù)、系統(tǒng)、統(tǒng)一、高效、快速的收集,為其預測預警奠定了基礎;故本文通過對福建省2004-2010年戊肝分月發(fā)病數(shù)的分析,根據(jù)其序列特點采用適當?shù)腁RIMA(autoregressive integrated moving-average,求和自回歸移動平均)模型擬合其流行趨勢,并對其進行為期1年的預測,為及時發(fā)現(xiàn)異常疫情提供科學依據(jù)。
1.1 資料來源 《疾病監(jiān)測信息報告管理系統(tǒng)》收集的福建省2004-2010年以發(fā)病日期統(tǒng)計的戊肝分月發(fā)病數(shù)(僅分析臨床診斷和實驗室診斷病例的已終審卡,但不包括刪除卡)。
1.2 研究方法 利用SAS 9.0軟件的 PROC ARIMA綜合軟件包進行ARIMA模型的建模與分析[3]。
2.1 序列的預處理
2.1.1 判斷序列的平穩(wěn)性:福建省2004-2010年戊肝分月發(fā)病數(shù)見表1,其時序圖(圖1)顯示序列含有以年為周期的季節(jié)效應,雖表現(xiàn)出一定程度的上升趨勢但總體趨勢平穩(wěn);其自相關圖(圖2)呈現(xiàn)出明顯的正弦波動規(guī)律,具有周期變化規(guī)律的非平穩(wěn)序列的典型特征。
表1 福建省2004-2010年戊肝分月發(fā)病情況(例)Table 1 The monthly cases of hepatitis E from 2004 to 2010 in Fujian province
表2 12步差分后序列的白噪聲檢驗Table 2 White Noise Test of the cases series by taken the differences of lag12
2.1.2 對原序列進行差分運算 為提取原序列的季節(jié)效應,對原序列作12步差分,差分后序列的時序圖(圖3)和ADF檢驗結果(圖4)示差分后序列平穩(wěn)。
2.1.3 判斷差分后序列的純隨機性 通過對差分后序列進行白噪聲檢驗,考察其純隨機性,檢驗結果(表2)顯示,該差分后序列為非白噪聲序列。
2.2 對差分后序列擬合ARMA模型 差分后序列的自相關圖(圖5)和偏自相關圖(圖6)均顯示:延遲12步自相關系數(shù)和偏自相關系數(shù)顯著大于2倍標準差范圍,其他幾乎95%的都落在2位標準差的范圍以內(nèi),說明差分后序列仍蘊含著顯著的季節(jié)效應,即差分后序列仍存在季節(jié)相關性。故充分考慮各種可能,采用條件最小二乘法進行參數(shù)估計,并經(jīng)模型和參數(shù)的顯著性檢驗,擬合了2個顯著有效模型(表3),經(jīng)采用AIC準則和BIC準則評判其相對優(yōu)劣,結果顯示以 MA((12))模型為相對最優(yōu)模型[3],用于預測最為合適,綜合考慮前面的差分運算,該模型實際為乘積季節(jié)模型 ARIMA(0,0,0)×(0,1,1)12,其數(shù)學表達式為:
式中Xt為福建省戊肝分月發(fā)病數(shù),B為延遲算子,εt為隨機干擾。
圖6 12步差分后序列偏自相關圖Fig.6 The pattern of the partial autocorrelation chart of the cases series by taking the differences of lag12
2.3 進行序列預測 根據(jù)擬合的相對最優(yōu)模型ARIMA(0,0,0)×(0,1,1)12對未來12月戊肝發(fā)病數(shù)進行預測,結果見表4。
通過將該序列實際值、擬合值及預測值、95%置信區(qū)間上限聯(lián)合作圖(見圖7),可以直觀地看出該模型對序列的擬合效果良好。
表3 顯著有效的2個備選模型參數(shù)估計比較Table 3 Parameter estimation of four ARIMA models
表4 預測2011年福建省戊肝分月發(fā)病數(shù)及其95%置信區(qū)間Table 4 Forecastings and limits of 95%UCL and LCL of Hepatitis E in Fujian province in 2011
圖7 福建省戊肝分月發(fā)病數(shù)序列實際值、擬合值及預測值圖Fig.7 The pattern of the actual cases and the fit cases of hepatitis ENote:Cases was showed on the Y axis with the date shown on X axis.The green lines with star marks showed the actual cases,the blue lines showed the fit curve(including forecasting values),the red lines with plus signs showed the line of 95%UCL,and the pink lines with circle signs showed the line of 95%LCL,respectively
從近年福建省戊肝分月發(fā)病數(shù)時序圖(圖1)中可以看出近年來福建省戊肝疫情平穩(wěn),無暴發(fā)或流行現(xiàn)象,控制效果良好。但因戊肝是一種急性人獸共患病,宿主多樣且與人群接觸密切[1-2];傳播途徑多樣,其中以糞-口途徑傳播為主,人群普遍易感,易引起食物或水源性流行爆發(fā)[1-2];2003年起戊肝已成為本省福州地區(qū)急性病毒性肝炎的主要原因[4];我省是乙肝高流行區(qū)[5],可因混合感染導致病情加重[6];普通人群戊肝病毒的感染率較高,提示亞臨床感染的存在[7],故其防控工作不可以掉以輕心,應密切關注其流行態(tài)勢,并做好預測預警以嚴防暴發(fā)流行的出現(xiàn)。
ARIMA模型主要從序列自相關的角度揭示時間序列的發(fā)展規(guī)律[3],既吸取了回歸分析的優(yōu)點又發(fā)揮了移動平均的長處,它根據(jù)數(shù)據(jù)序列的自相關系數(shù)、偏自相關系數(shù)建立起線性的數(shù)據(jù)間相互依賴的定量模型,既能解決數(shù)據(jù)自相關問題,又支持具有季節(jié)效果的數(shù)據(jù)建模,能較好地模擬歷史疫情,并得到較好的預測效果,國內(nèi)已有不少同行論證了該方法的適用性[8-13]。同時,結合本文資料特征,使用ARIMA模型相對優(yōu)于其他預測模型:如需求序列值呈指數(shù)函數(shù)變化的灰色預測模型,對變量的分布有特殊要求、且要求變量獨立、無法考慮變量間自相關性的回歸模型或對數(shù)據(jù)要求較高的傳播動力學模型等。
本文采用ARIMA模型建模,由圖7可見擬合的相對最優(yōu)模型 ARIMA(0,0,0)×(0,1,1)12對福建省近年戊肝發(fā)病數(shù)的擬合效果良好;該模型對未來12月內(nèi)的預測值在疫情態(tài)勢未發(fā)生顯著變更時,能較好地預測疫情的未來走勢及發(fā)病數(shù);在疫情態(tài)勢發(fā)生顯著變更時(如暴發(fā)或流行時),則在疫情趨勢變更至顯著點(如超過95%的上限值)時,即可直觀且客觀地判定出疫情態(tài)勢變更,并產(chǎn)出預警信息,為盡早介入并采取針對性防控措施提供有力的科學依據(jù)。
本文戊肝歷史發(fā)病數(shù)的時間序列資料,其統(tǒng)計規(guī)則在地域上是以省為單位、在時間上是以自然月為單位、在例數(shù)統(tǒng)計上是以發(fā)病日期進行統(tǒng)計,故其預測預警受到這些統(tǒng)計規(guī)則的限制。但在實際應用中,可以根據(jù)需求適當調(diào)整這些規(guī)則,并建立其相應模型進行預測預警,如在地域上以地市或縣區(qū)為單位,或時間上以周為單位,或在例數(shù)統(tǒng)計上包含疑似病例或以審核日期進行統(tǒng)計等。
但是,時間序列數(shù)據(jù)通常只適合做短期預測,如MA(q)序列理論上只能預測q步之內(nèi)的序列走勢[3],故在實際應用中,應適時組織專家建立預警模型,如一年一度的疫情分析年會等;同時,應結合基于電腦的網(wǎng)絡直報系統(tǒng),增強其功能,方可在年度內(nèi)實現(xiàn)預測值的自動修正預測功能以提高預測精度,并在疫情態(tài)勢發(fā)生顯著變更時及時、自動地發(fā)布預警信息。
綜上所述,通過擬合戊肝發(fā)病數(shù)的相對最優(yōu)ARIMA模型進行預測和預警,具有加強其防控工作的實際應用價值。
[1]仇家軍,喻榮彬.戊型肝炎流行病學研究進展[J].中華疾病控制雜志,2009,13(5):572-576.
[2]吳婷,江浪.戊型病毒性肝炎研究進展[J].中國疫苗和免疫,2009,15(4):375-378.
[3]王燕,主編.應用時間序列分析[M].2版.北京:中國人民大學出版社,2008:142-170.
[4]黃素欽,鄭秀奇,吳秋芳.2000-2006年福州市傳染病院急性病毒性肝炎流行病學分析[J].海峽預防醫(yī)學雜志,2007,13(6):39-40.
[5]陳彩粼,黃文龍,洪榮濤,等.福建省2000—2008年乙型肝炎流行特征分析[J].海峽預防醫(yī)學雜志,2010,16(1):46-48.
[6]張金良,高學武,辛克峰,等.散發(fā)性戊型肝炎的臨床和流行病學特征分析[J].實用肝臟病雜志,2008,11(3):182-183.
[7]王惠榕,嚴延生,蕭劍雄,等.福建省不同人群中戊型肝炎病毒感染的血清流行病學調(diào)查分析[J].中國人獸共患病學報,2007,23(4):370-372.
[8]黃春萍,鄧晶,張磊,等.ARIMA模型在麻疹預警中的應用[J].疾病監(jiān)測,2008,23(1):53-55.
[9]馮丹,韓曉娜,趙文娟,等.中國內(nèi)地法定報告?zhèn)魅静☆A測和監(jiān)測的 ARIMA模型[J].疾病控制雜志,2007,11(2):140-143.
[10]吳家兵,葉臨湘,尤爾科.時間序列模型在傳染病發(fā)病率預測中的應用[J].中國衛(wèi)生統(tǒng)計,2006,23(3):276.
[11]鐘球,蔣莉,周琳,等.廣東省結核病發(fā)病趨勢的時間序列分析[J].中國防癆雜志,2010,32(9):515-519.
[12]張彥琦,唐貴立,王文昌,等.ARIMA模型及其在肺結核預測中的應用[J].現(xiàn)代預防醫(yī)學 ,2008,35(9):1608-1615.
[13]周水森,黃芳,沈毓祖.ARIMA模型在瘧疾發(fā)病預測中的應用[J].中國病原生物學雜志,2007,2(4):284-286.