• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于ARIMA模型的市內(nèi)人群移動預測

      2016-03-01 06:28:57戴蓉蓉朱海紅
      測繪工程 2016年2期
      關鍵詞:ARIMA模型建模預測

      戴蓉蓉,朱海紅,李 霖

      (武漢大學 資源與環(huán)境科學學院,湖北 武漢 430079)

      ?

      基于ARIMA模型的市內(nèi)人群移動預測

      戴蓉蓉,朱海紅,李霖

      (武漢大學 資源與環(huán)境科學學院,湖北 武漢 430079)

      城市人群移動模式研究在疾病傳播與防控[1]、交通網(wǎng)絡規(guī)劃設計[2-4]和城市規(guī)劃[5-6]等領域具有重要應用價值。近年來,互聯(lián)網(wǎng)飛速發(fā)展產(chǎn)生了大量數(shù)據(jù),例如社交網(wǎng)絡簽到數(shù)據(jù)[7-8]、志愿者定位數(shù)據(jù)[9]、浮動車行駛軌跡數(shù)據(jù)[10]、移動手機終端數(shù)據(jù)[11]、公交IC卡刷卡記錄[12]、自行車租賃記錄[13]等數(shù)據(jù),都極大地豐富了地理信息及其應用,為探究人群的移動模式提供了有力工具。其中社交網(wǎng)絡簽到數(shù)據(jù),如微博(Twitter、新浪微博),基于位置的簽到數(shù)據(jù)(Foursquare、Gowalla)都產(chǎn)生了大量的關于特定位置和簽到時間的信息。相比于其他大數(shù)據(jù),簽到數(shù)據(jù)更容易獲取,為人群移動的研究提供更為便捷的數(shù)據(jù)基礎。

      已有很多研究從時間尺度上通過建立人群移動模型來解釋觀察到的人群移動規(guī)律?;跁r間序列的人群移動性建模研究主要是基于出行數(shù)據(jù),例如出租車軌跡數(shù)據(jù)和自行車租賃數(shù)據(jù)來挖掘人群的移動模式[13-15],此類出行數(shù)據(jù)由于國內(nèi)相關數(shù)據(jù)政策的限制,通常較難獲取且費用較高,對于免費開放的位置簽到數(shù)據(jù),目前尚缺乏采用其進行人群移動性的時間序列建模研究。

      本文基于武漢市一年間新浪微博位置簽到數(shù)據(jù),考慮到人群移動季節(jié)性規(guī)律,采用ARIMA時間序列建模方法從時間尺度上來預測武漢市人群變化。結果表明,ARIMA(3,0,2)(1,1,0)12模型能夠很好探測出一年中人群變化的季節(jié)性規(guī)律,具有較好擬合和預測精度,能夠促進城市或區(qū)域的合理規(guī)劃,且對基于位置的商業(yè)服務具有重要應用價值。

      1實驗區(qū)域與數(shù)據(jù)

      武漢市位于 113.68°E~115.08°E,29.96°N~31.36°N之間,占地面積為8 494 km2,2013年末全市常住人口為1 022萬人。本研究通過新浪微博的API,從武漢市149 390個用戶的有效簽到中提取858 429條簽到記錄,時間跨度為:2013年3月1日至2014年2月28日,總簽到地點數(shù)為27 858。

      2時間序列建模方法

      本研究從時間序列建模角度出發(fā),引入統(tǒng)計學時間序列分析ARIMA建模方法,通過對武漢市每日簽到人群隨著時間變化的序列進行建模,包括每日和每時的人群量變化情況,提取并分析簽到人群變動的季節(jié)項、趨勢循環(huán)項及不規(guī)則項,研究武漢市人群變動的年內(nèi)特征、每日變動特征,從而預測人群變動趨勢及構建人群變動強度序列。

      ARIMA模型全稱是自回歸積分移動平均模型,是由Box和Jenkins提出的一種著名時間序列預測方法,在時間序列預測中有著廣泛應用[16]。ARIMA模型基本原理是將非平穩(wěn)時間序列轉(zhuǎn)化為平穩(wěn)時間序列,然后將因變量僅對它滯后值以及隨機誤差項現(xiàn)值和滯后值進行回歸所建立的模型。ARIMA模型將預測指標隨時間推移而形成的數(shù)據(jù)序列看作是一個隨機序列,這組隨機變量所具有的依存關系體現(xiàn)著原始數(shù)據(jù)在時間上的延續(xù)性,可用一定的數(shù)學模型來近似描述這個序列。一般地,ARIMA(p,d,q)模型的數(shù)學表達式[16]如式(1)所示

      (1)

      其中,I(B)稱為自回歸算子;φ(B)=I(B)▽d稱為通用自回歸算子,非平穩(wěn)時間序列轉(zhuǎn)化為平穩(wěn)時間序列需要進行d階差分;θ(B)稱為移動平均算子。

      ARIMA模型一旦被識別后就可以從時間序列的過去值及現(xiàn)在值來預測未來值。在模型識別的過程中,具有兩個非常重要的參數(shù),分別為ACF(Auto Correlation Function)自相關函數(shù)ρk=γk/γ0和PACF(Partial Auto Correlation Function)偏自相關函數(shù)φkk[16]。如果某一時間序列的自相關函數(shù)隨著滯后k的增加而很快地下降為0,則該序列為平穩(wěn)序列;如果自相關函數(shù)不隨著k的增加而迅速下降為0,就表明該序列不平穩(wěn)。如果一個時間序列的自相關和偏相關圖沒有任何模式,而且數(shù)值很小, 那么該序列可能就是一些互相獨立的無關的隨機變量。其中自相關函數(shù)與偏相關函數(shù)又具有兩個非常重要的性質(zhì),分別為拖尾性和截尾性,拖尾性是指隨著滯后k的增加,函數(shù)漸變?yōu)?;截尾性是指當滯后k>p,或者k>q處,函數(shù)突然下降為0。函數(shù)的拖尾性和截尾性對時間序列模型的識別具有重要作用。

      3武漢市人群移動的時間序列預測

      3.1季節(jié)性ARIMA模型的建立

      圖1為武漢市一年期間每月簽到人群的每日變動的原始時間序列,可以看出城市簽到人數(shù)在不同月份的每日變化趨勢是一致的,同樣可以看出不同月份簽到總?cè)藬?shù)的差異,3月份為高峰期,而1月、2月份則為低谷期,所以判定此序列為周期性時間序列,對其建立相應的模型。由于人群變動具有一定的季節(jié)性規(guī)律,一般的ARIMA模型不適用,本研究根據(jù)每個節(jié)假日的變化情況建立季節(jié)性ARIMA模型(Seasonal ARIMA Model)[17]。季節(jié)性ARIMA模型為ARIMA模型的延伸,一個時間序列{Zt∣t=1,2,…,k}可以將其表述為

      其中,(p,d,q)表示模型的非季節(jié)性部分,而(P,D,Q)m表示季節(jié)性部分。

      圖1 武漢市簽到人數(shù)每月的變化情況

      建立合適的季節(jié)性ARIMA模型,除了需要選擇季節(jié)性和非季節(jié)性部分的AR和MA參數(shù),模型的建立過程與非季節(jié)性ARIMA模型幾乎一樣。由原始時間序列的ACF和PACF,可以看出該時間序列不平穩(wěn),帶有一定的季節(jié)性,對其進行季節(jié)差分運算的結果見圖2。由圖2可知偏自相關函數(shù)PACF在滯后12階后截尾,但ACF中沒有明顯的季節(jié)滯后。這表明季節(jié)性自回歸參數(shù)為AR(1),在非季節(jié)滯后中,在PACF中有兩個明顯的峰值,表明非季節(jié)性自回歸參數(shù)為AR(2)。因此,初步分析適合武漢市一年間簽到人數(shù)變化數(shù)據(jù)的模型為ARIMA(2,0,0)(1,1,0)12。此外需要對這一模型進行測試,并對參數(shù)作調(diào)整進行測試,根據(jù)AICc最小的原則最終確定合適的模型為ARIMA(3,0,2)(1,1,0)12。AIC即赤池信息量準則(Akaike information criterion),是衡量統(tǒng)計模型擬合優(yōu)良性的一種標準,是由日本統(tǒng)計學家赤池弘次創(chuàng)立和發(fā)展的[18]。赤池信息量準則建立在熵的概念基礎上,可以權衡所估計模型的復雜度和此模型擬合數(shù)據(jù)的優(yōu)良性。一般情況下,AIC可表示為:

      (2)

      其中,k為參數(shù)的數(shù)量,L是對數(shù)似然值,n是觀測值數(shù)目。在樣本小的情況下,AIC轉(zhuǎn)變?yōu)锳ICc:

      AICc=AIC+2k(k+1)/(n-k-1)

      當n增加時,AICc收斂成AIC。所以AICc可以應用在任何樣本大小的情況下[18]。表1呈現(xiàn)的是測試不同模型計算出的AICc值,本文選擇AICc值最小的ARIMA(3,0,2)(1,1,0)12模型,該模型的參數(shù)見表2。

      圖2 季節(jié)差分后的簽到人數(shù)

      ModelAICcSARIMA(2,0,0)(2,1,0)12-459.82SARIMA(2,0,1)(2,1,0)12-426.48SARIMA(2,0,2)(2,1,0)12-461.23SARIMA(2,0,1)(1,1,0)12-464.12SARIMA(2,0,1)(1,1,1)12-464.10SARIMA(3,0,1)(1,1,0)12-462.77SARIMA(3,0,2)(1,1,0)12-473.31SARIMA(3,0,2)(1,1,1)12-465.30

      表2 模型參數(shù)列表

      3.2模型參數(shù)的檢驗與預測

      若模型被正確識別,且估計的模型參數(shù)合適,表明模型與真實時間序列擬合很好,即殘差近似于具有白噪聲性質(zhì),均勻出現(xiàn)在0值附近,并且沒有上下趨勢,表現(xiàn)為獨立同分布的具有零均值和相同標準差的正態(tài)變量。由tsdiag()檢驗結果可知,殘差沒有明顯的自相關性,Ljung-Box測試顯示所有的

      p-value>0.1,說明殘差為白噪聲,模型合格。圖3為殘差分位圖,可以看出QQ圖中點的分布近似一條直線,只有在兩端存在較小的偏差,大部分數(shù)據(jù)分布很好,說明殘差有很好的正態(tài)性。因此,本研究最終使用模型ARIMA(3,0,2)(1,1,0)12來模擬和預測武漢市人群的變化趨勢。

      圖3 殘差分位圖

      本文使用模型ARIMA(3,0,2)(1,1,0)12預測了2014年2月份簽到人群的變化情況,預測結果見圖4。由圖可知,所預測月份2014年2月份為春節(jié)期間,武漢市簽到人群數(shù)量要明顯小于其他月份,經(jīng)過與實際簽到數(shù)據(jù)進行比較,本文發(fā)現(xiàn)該模型的預測結果與實際數(shù)據(jù)擬合較好,表明選擇的模型參數(shù)合理,且預測精度較高。

      注:深灰色陰影為95%置信區(qū)間,淺灰色陰影為90%的置信區(qū)間圖4 模型ARIMA(3,0,2)(1,1,0)12的預測結果

      4結論

      社交網(wǎng)絡簽到數(shù)據(jù)已經(jīng)為人群移動模型研究提供了強大的數(shù)據(jù)基礎。現(xiàn)有的人群移動模型大多數(shù)沒有考慮人群移動的時間規(guī)律性,而事實上人群移動在不同時間呈現(xiàn)明顯的波動規(guī)律。本研究引入統(tǒng)計學中ARIMA模型,并根據(jù)武漢市實際簽到人群變動規(guī)律建立了適合此類數(shù)據(jù)的季節(jié)性ARIMA模型,結果表明,模型ARIMA(3,0,2)(1,1,0)12能較好地擬合一年間人群的變動趨勢,且具有較高的預測精度。

      參考文獻:

      [1]MELONI S, PERRA N, ARENAS A, et al.Modeling human mobility responses to the large-scale spreading of infectious diseases[R].Scientific Reports.1,62;DOI:10.1038/srep00062,2011.

      [2]JUNG W S, WANG F Z, STANLEY H E. Gravity model in the Koreanhighway[J].Europhysics Letters, 81:48005, 2008.

      [3]楊澤運,楊金玲,李秀海,等.基于ArcGIS Server的網(wǎng)絡地圖服務系統(tǒng)設計與實現(xiàn)[J].測繪工程,2015,24(10):41-44.

      [4]孔繁宇.基于GIS的“一張圖”規(guī)劃成果管理體系設計[J].測繪工程,2015,24(9):66-70.

      [5]ZHENG Y, LIU Y C, YUAN J, et al. Urban computing with taxicabs[C]. In Proceedings of the 13th international conference on Ubiquitous computing, pages 89-98, Beijing, China, 2011. ACM.

      [6]YUAN J, ZHENG Y, XIE X. Discovering Regions of Different Functions in a CityUsing Human Mobility and POIs[A]. In Proceedings of the 18th ACM SIGKDD internationalconference on Knowledge discovery and data mining, pages 186-194, Beijing, China, 2012.ACM.

      [7]LIU Y, SUI Z, KANG C, et al. Uncovering patterns of inter-urbantrip and spatial interaction from social media check-In data[M]. PloS ONE, 9(1):e86026,2014.

      [8]LUN W,YE Z,ZHENG W S,et al. Intra-Urban Human Mobility and Activity Transition:Evidence from Social MediaCheck-In Data[M].PloS ONE,9(5):e97010,2014.

      [9]ZHENG Y, XIE X, MA W Y. GeoLife: A collaborative socialnetworking service among user, location and trajectory[M]. IEEE Data(base) Engineering Bulletin, 33(2):32-39, 2010.

      [10] LIU Y, KANG C, GAO S, et al. Understanding intra- urbantrip patterns from taxi trajectory data[J]. Journal of GeographicalSystems, 14(4):463-483,2012.

      [12] ROTH C, KANG S M, BATTY M, et al. Structure of urbanmovements: polycentric activity and entangled hierarchicalflows[M]. PloS one, 6(1):e15923,2011.

      [13] FROEHLICH J, NEUMANN J, OLIVER N. Sensing and predictingthe pulse of the city through shared bicycling[A]. International Joint Conferences on Artificial Intelligence.Pages:1420-1426. 2009.

      [14] PHITHAKKITNUKOON S, VELOSO M, BENTO C, et al. Taxi-Aware Map: identifying and predicting vacant taxis in the city[C]. In: Proceedings of the 1st International Joint Conference on Ambient Intelligence.2010, 86-95.

      [15] KALTENBRUNNER A, MEZA R, GRIVOLLA J, et al. Urban cyclesand mobility patterns: exploring and predicting trends in a bicyclebasedpublic transport system[J]. Pervasive and Mobile Computing, 2010,6(4): 455-466.

      [16] BOX G, JENKINS G, REINSEL G. Time Series Analysis: Forecasting and Control[M]. 4th ed. Hoboken: John Wiley & Sons, 2008.

      [17] CHATFIELD C. The Analysis of Time Series: An Introduction[M]. Sixth Edition.Chapman and Hall.2004.

      [18] BURNHAM K P, ANDERSON D R. Multimodel inference: understanding AIC and BIC in Model Selection[J]. Sociological Methods & Research 33: 261-304, 2004.

      [責任編輯:王文福]

      摘要:城市內(nèi)部人群移動模式的研究在城市規(guī)劃、交通量預測和疾病的防控等領域具有重要的應用價值。已有研究多基于出行數(shù)據(jù)探索人群移動模式,文中基于新浪微博位置簽到數(shù)據(jù),從時間序列建模角度結合ARIMA模型,建立武漢市人群移動的季節(jié)性模型實驗表明,模型ARIMA(3,0,2)(1,1,0)12能較好地擬合并預測武漢市人群移動趨勢,對城市規(guī)劃和決策具有重要參考價值。

      關鍵詞:ARIMA模型;簽到數(shù)據(jù);人群移動;建模;預測

      Intra-urban human mobility prediction based on ARIMA modelDAI Rongrong, ZHU Haihong, LI Lin

      (School of Resource and Environmental Sciences, Wuhan University, Wuhan 430079, China)

      Abstract:Investigation of intra-urban human mobility patterns has great importance in the fields of urban planning, traffic forecasting, and disease prevention.Most of the current studies focus on the human mobility patterns based on travel data. The seasonal human mobility model of Wuhan is established based on SinaWeibo check-in data from the perspective of time series ARIMA model in this paper. Experiments indicate that ARIMA(3,0,2)(1,1,0)12model can be well fitted with the change trend of human mobility in Wuhan and can achieve better prediction results, which has important application value in the research of city planning and decision-making.

      Key words:ARIMA model; check-in data; human mobility; modeling; prediction

      通訊作者:朱海紅(1964-),副教授,博士.

      作者簡介:戴蓉蓉(1991-),女,碩士研究生.

      收稿日期:2015-10-09

      中圖分類號:P963

      文獻標識碼:A

      文章編號:1006-7949(2016)02-0038-04

      猜你喜歡
      ARIMA模型建模預測
      無可預測
      黃河之聲(2022年10期)2022-09-27 13:59:46
      選修2-2期中考試預測卷(A卷)
      選修2-2期中考試預測卷(B卷)
      聯(lián)想等效,拓展建模——以“帶電小球在等效場中做圓周運動”為例
      基于PSS/E的風電場建模與動態(tài)分析
      電子制作(2018年17期)2018-09-28 01:56:44
      不對稱半橋變換器的建模與仿真
      不必預測未來,只需把握現(xiàn)在
      基于時間序列模型的中國出口總額分析及預測
      基于R軟件的金融時間序列的預測分析
      基于Eviews上證綜合指數(shù)預測
      時代金融(2016年29期)2016-12-05 16:12:09
      高雄县| 台前县| 益阳市| 开平市| 泽库县| 龙山县| 民和| 尉氏县| 祁门县| 禹城市| 双峰县| 盈江县| 青阳县| 措勤县| 松原市| 恩平市| 新龙县| 临高县| 高淳县| 孝义市| 玛曲县| 大安市| 榆林市| 西乡县| 康平县| 平陆县| 南皮县| 屏边| 汶上县| 永定县| 富锦市| 延长县| 嫩江县| 抚宁县| 莱阳市| 大兴区| 库车县| 尼木县| 韶山市| 大港区| 中阳县|