• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      SARFIMA模型在腎綜合征出血熱發(fā)病預測中的應用*

      2021-03-16 09:54:18劉利利李春雨朱雨辰張丹丹王志強李秀君
      中國衛(wèi)生統(tǒng)計 2021年1期
      關鍵詞:記憶性季節(jié)性差分

      齊 暢 劉利利 李春雨 朱雨辰 張丹丹 王志強 李秀君△

      【提 要】 目的 研究季節(jié)性自回歸分數差分移動平均(SARFIMA)模型預測腎綜合征出血熱(HFRS)發(fā)病率的效果,并與SARIMA模型進行比較。方法 收集山東省2009年1月至2018年12月HFRS月發(fā)病數據,考慮時間序列的短記憶性和長記憶性,構建SARFIMA模型,以SARIMA模型作為對比,比較兩個模型的預測準確性。結果 山東省2009-2018年HFRS月發(fā)病率具有明顯周期性和季節(jié)性特征。模型評估表明,SARFIMA模型具有更好的擬合度和預測能力。SARFIMA(1,0.33,3)(1,0,0)12:AIC=-629.76;RMSE=0.028;SARIMA(1,0,3)(1,1,0)12:AIC=-356.43;RMSE=0.033。結論 SARFIMA模型能較好地擬合山東省HFRS月發(fā)病率的動態(tài)變化,且預測效果優(yōu)于SARIMA模型。因此,SARFIMA模型可用于HFRS發(fā)病率的預測。

      腎綜合征出血熱(hemorrhagic fever with renal syndrome,HFRS)是一種自然疫源性疾病,在世界各地廣泛流行,并且報告HFRS的國家數量不斷增加[1]。中國是疫情最嚴重的國家[2],其中山東省自1962年報告第一例HFRS以來,一直是發(fā)病最嚴重的地區(qū)之一[3]。時間序列分析被廣泛用于傳染病預測研究[4-6],其中,季節(jié)性自回歸移動平均(seasonal autoregressive integrated moving average,SARIMA)模型已用于預測許多傳染病的短期波動[7-9]。SARIMA模型的數據準備和操作相對簡單易行,定量預測結果較為準確[10]。然而,在許多時間序列中存在長記憶過程[11],盡管長期觀測值之間的相關性很小,但在分析時不應被忽略[12-13]。季節(jié)性自回歸分數差分移動平均(seasonal autoregressive fractionally integrated moving average,SARFIMA)模型同時考慮了序列的短記憶性和長記憶性,有助于提高模型擬合和預測的準確性[14]。

      本研究將SARFIMA模型應用于HFRS月發(fā)病率序列,同時考慮序列的短記憶性和長記憶性以進行更準確的預測。

      資料與方法

      1.研究資料

      收集山東省2009年1月至2018年12月HFRS的發(fā)病報告數據,數據來源于山東省疾病預防控制中心疾病報告信息系統(tǒng)。病例診斷標準為《流行性出血熱診斷標準》(WS278-2008)。人口數據來源于《山東統(tǒng)計年鑒》。

      2.SARFIMA模型介紹

      ARFIMA模型由Granger于1980年提出[15-16],Porter-Hudak于1990年對其進一步擴展,提出了SARFIMA模型[17]。長記憶性序列的自相關函數的衰減比短記憶性序列所具有的幾何衰減慢,稱為雙曲線衰減。SARFIMA模型允許對序列進行分數差分,從而使差分參數d可以采用分數值,同時考慮了序列的季節(jié)性。

      簡單分數差分的季節(jié)性類似模型如下:

      (1-Bs)dxt=εt

      (1)

      其中d是分數差分分量,d∈(-0.5,0.5),將模型(1)推廣為具有分數差分季節(jié)性分量的模型,即SARFIMA模型,可以表示為:

      (1-Bs)dΩ(B)xt=Θ(B)εt

      (2)

      其中Ω(B)和Θ(B)分別是自回歸多項式和移動平均多項式(均包括季節(jié)分量)。d取整數值時將簡化為SARIMA模型。對于平穩(wěn)過程,d在-0.5到0.5之間變化,其中d=0表示短記憶性,-0.50.5,則表示一個長記憶性時間序列[20]。

      3.建立模型

      山東省2009年1月至2018年12月HFRS月發(fā)病率根據山東省同期人口數求得。用Hurst指數檢驗HFRS月發(fā)病率序列的長記憶性。如果序列具有足夠強的長記憶性,則可以構建SARFIMA模型。繪制HFRS月發(fā)病率的時序圖,并用單位根檢驗(Augmented Dickey-Fuller,ADF)判斷其是否平穩(wěn),若為非平穩(wěn)序列,通過差分轉換為平穩(wěn)序列后,用季節(jié)性分解查看序列的季節(jié)性[21]。計算自相關系數(autocorrelation function,ACF)和偏自相關系數(partial autocorrelation function,PACF),確定模型階數。在SARFIMA模型的擬合函數中指定模型階數和季節(jié)性分量?;诖嬖诙喾N模式的假設,SARFIMA擬合函數將從多個起點開始優(yōu)化,通過比較對數似然值得到最優(yōu)模型[20]。同時建立SARIMA模型,利用赤池信息準則(Akaike information criterion,AIC)比較兩者的擬合優(yōu)度。建模步驟如圖1。

      圖1 SARFIMA模型建模步驟

      4.統(tǒng)計學處理

      采用R軟件(3.6.0版)進行統(tǒng)計分析,統(tǒng)計建模采用“arfima”和“ts”程序包。2009年1月至2017年12月的數據用于構建模型,2018年1月至12月的數據用于驗證預測。假設檢驗的水準為0.05。

      結 果

      山東省2009-2018年HFRS月發(fā)病率呈現明顯的周期性和季節(jié)性(圖2)。2010年2月發(fā)病率最低,為0.02/10萬,2012年11月發(fā)病率最高,為0.48/10萬。ADF檢驗表明原序列平穩(wěn)(Dickey-Fuller=-3.95,P=0.01),不需要進行差分。原序列的ACF和PACF圖顯示了季節(jié)性滯后的緩慢衰減(圖3)。使用季節(jié)性差分(在滯后12個周期后減去觀測值)消除季節(jié)性特征。季節(jié)差分序列的ACF和PACF有一些明顯的峰值。由此確定AR(p)和MA(q)的階數。Hurst指數(H=0.68>0.5)表明HFRS序列具有較強的長記憶性。SARFIMA模型計算了非季節(jié)性和季節(jié)性分數差分參數,并通過比較模型的對數似然值,得到SARFIMA擬合的最佳模型SARFIMA(1,0.33,3)(1,0,0)12,AIC =-629.76,模型表達式為(1+0.959B)(1-0.305B12)(1-B)0.325xt=(1+1.590B+0.611B2-0.020B3)εt。殘差圖和Ljung-Box檢驗表明殘差是白噪聲。作為對比,我們同時構建了SARIMA模型SARIMA(1,0,3)(1,1,0)12,AIC=-356.43。

      圖2 山東省2009-2018年HFRS月發(fā)病率時序圖與季節(jié)性分解圖

      圖3 序列自相關圖(ACF)和偏自相關圖(PACF)

      圖4顯示了兩個模型的擬合與預測效果,從圖中可以看出,兩個模型的擬合值與原序列的接近程度相當。SARFIMA模型的預測趨勢比SARIMA更接近實際值,95%置信區(qū)間比SARIMA窄,并且其區(qū)間覆蓋了所有實際值。通過RMSE、MAE和MAPE對兩個模型的比較,可以發(fā)現SARFIMA模型對HFRS序列的預測更準確(表1)。

      圖4 HFRS月發(fā)病率擬合及預測結果

      表1 SARFIMA和SARIMA模型的準確性比較

      討 論

      山東省是我國HFRS發(fā)病最多的省份之一,分析預測山東省HFRS的發(fā)病趨勢具有重要的公共衛(wèi)生意義,可以為疾病防控提供依據。時間序列將各種因素的綜合效應歸于時間變量中,根據歷史數據隨時間變化的規(guī)律,建立模型進行外推[22]。SARIMA模型是常見的時間序列分析方法之一,被廣泛用于傳染病預測。對于具有長記憶性的時間序列,SARFIMA可能比SARIMA模型的預測更為準確[23]。本研究分析了山東省HFRS月發(fā)病率的季節(jié)性與長期趨勢,并對SARIMA與SARFIMA模型的預測效果進行了比較。

      基于足夠的觀察(觀測值大于50)所構建的時間序列模型可以獲得較為滿意的預測結果[10]。若觀測數較少,則參數估計效果較差。對于SARFIMA模型,應考慮數據的時間跨度大,并且其長期記憶性較強。在我們的研究中,用于構建模型的HFRS數據的長度為108,時間跨度為2009年1月至2017年12月,Hurst指數顯示其長記憶性較強。山東省HFRS月發(fā)病率的季節(jié)性明顯,存在一個較高的秋冬峰與一個較低的春峰。研究中的兩個模型均考慮了季節(jié)性成分,并取得了良好的擬合效果。模型構建的結果表明,在模型擬合中考慮分數差分的SARFIMA模型優(yōu)于SARIMA模型,AIC差值為73.33,擬合效果得到了提升。通過比較兩個模型的精度指標可以發(fā)現,SARFIMA的預測效果明顯優(yōu)于SARIMA。

      Granger和Joyeux提出,ARFIMA可能會提供更好的長期預測[11]。因此,我們對HFRS月發(fā)病率進行了長期預測(以3年預測為例),SARFIMA與SARIMA的長期預測準確性相當,SARFIMA的長期預測沒有明顯優(yōu)勢,超過12步(1年)的預測值比真實值要低,偏差較大??赡芨鶕v史數據進行估算的模型,預測時間越長,預測誤差越大[24],此外我們的數據有限,根據更多的觀測數據得到的長期預測結果可能更好,傳染病受多種因素影響,進行長期預測時,變動分量會更大。

      SARFIMA模型作為時間序列分析方法,有其自身的局限性。由于HFRS等傳染病受多種因素的影響,各種影響因素隨時間而不斷變化,所以SARFIMA模型更適用于影響因素較為穩(wěn)定的短期預測。因為模型無法將影響發(fā)病的其它因素納入模型,所以其預測精度有限。在以后的研究中,可以將SARFIMA-X模型與其他外生解釋變量進行擬合[25],或者與其他預測模型相結合[11],作進一步的探索。

      本研究通過對山東省HFRS月發(fā)病率數據建立SARFIMA模型進行擬合及預測,并與SARIMA模型進行比較,證實了SARFIMA模型能較好地擬合山東省HFRS月發(fā)病率的動態(tài)變化,且預測效果優(yōu)于SARIMA模型,可用于HFRS發(fā)病率的短期預測。

      猜你喜歡
      記憶性季節(jié)性差分
      粕類季節(jié)性規(guī)律:豆粕篇
      湖南飼料(2021年3期)2021-07-28 07:05:58
      數列與差分
      器官移植中記憶性T細胞的研究進展
      季節(jié)性需求放緩 鉀肥價格下行
      蔬菜價格呈季節(jié)性回落
      黏膜記憶性T 細胞功能
      遠離季節(jié)性過敏
      Coco薇(2017年12期)2018-01-03 21:34:42
      記憶性B細胞體外擴增影響因素的研究進展①
      超聲修復有記憶性鉛蓄電池研究
      電源技術(2015年1期)2015-08-22 11:16:08
      基于差分隱私的大數據隱私保護
      池州市| 黑河市| 化隆| 闽清县| 华阴市| 黑河市| 闸北区| 宁陵县| 巩义市| 肥乡县| 晋中市| 阿瓦提县| 五华县| 西安市| 永吉县| 东安县| 台北市| 浦城县| 连江县| 遵化市| 广丰县| 上饶县| 灵丘县| 平安县| 忻城县| 拉萨市| 浮山县| 神农架林区| 渝北区| 万盛区| 乐亭县| 大渡口区| 永清县| 三河市| 孟津县| 湘阴县| 应城市| 溧阳市| 徐闻县| 正蓝旗| 吐鲁番市|