• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于XGBoost算法的大型活動期間軌道進(jìn)出站量預(yù)測*

      2020-10-19 09:06:56翁劍成錢慧敏蔣錦港
      關(guān)鍵詞:客流量進(jìn)站客流

      付 宇 翁劍成* 錢慧敏 蔣錦港

      (北京工業(yè)大學(xué)交通工程北京市重點(diǎn)實(shí)驗(yàn)室1) 北京 100124) (武漢理工大學(xué)交通學(xué)院2) 武漢 430063)

      0 引 言

      以文藝活動、體育賽事為代表的短時性大型活動在舉辦期間對場館周邊軌道站點(diǎn)的出行需求影響顯著,有針對性的對其進(jìn)行時空影響分析及客流預(yù)測有助于管理者把握軌道站點(diǎn)進(jìn)出量的變化規(guī)律,為安保策略制定和軌道交通車輛調(diào)度提供數(shù)據(jù)支撐[1],也有利于出行者更合理的選擇出行時間及線路.

      目前,國內(nèi)外針對大型活動期間客流變化及需求預(yù)測方面開展了較多有針對性的研究.孫根年等[2]依據(jù)多種調(diào)查資料和旅游本底趨勢線理論,對2008年北京奧運(yùn)會背景下的旅游客流量變化進(jìn)行預(yù)測,并給出了各月客流量的預(yù)測值.王田田等[3]利用青島世園會實(shí)時客流數(shù)據(jù)分析其客流規(guī)模特點(diǎn)及影響因素,對入園客流的時間變化特征進(jìn)行總結(jié),并提出了世園會期間乘客進(jìn)出站量預(yù)測的方法.王興川等[4]針對2014年廣交會期間的客流成分構(gòu)建了活動客流與背景客流預(yù)測模型,基于城市軌道交通自動檢票系統(tǒng)(AFC)采集到的刷卡數(shù)據(jù)實(shí)現(xiàn)了對展會期間城市軌道交通站點(diǎn)客流量的預(yù)測.Arun等[5]對美國亞利桑那州舉辦的贊助類型活動進(jìn)行了數(shù)據(jù)收集和交通集散特征分析,建立軌道需求預(yù)測模型并預(yù)測了活動舉辦當(dāng)天特定軌道站點(diǎn)的客流量.Li等[6]提出了一種新的多尺度徑向基函數(shù)(MSRBF)網(wǎng)絡(luò)預(yù)測模型,結(jié)合公交智能卡數(shù)據(jù)完成了對北京某次演唱會當(dāng)天的公交客流預(yù)測.

      總計而言,現(xiàn)有研究側(cè)重于宏觀需求預(yù)測,通常是針對整個大型活動期間進(jìn)行客流需求分析,集中在月、日、時級別的中長期維度[7-8].然而短時性大型活動具有短時間內(nèi)誘增交通量大、進(jìn)出站客流量時空波動性明顯等特點(diǎn),使得中長期客流預(yù)測方法無法滿足軌道運(yùn)營管理中實(shí)時監(jiān)控、預(yù)防突發(fā)事件等需求的精度要求[9-10].

      因此,文中針對分鐘級別的城市軌道站點(diǎn)進(jìn)出量短時預(yù)測開展相關(guān)研究.采集2017—2018年的北京市軌道AFC刷卡數(shù)據(jù)和短時性大型活動數(shù)據(jù)為基礎(chǔ),在分析活動舉辦期間場館周邊軌道交通客流集散特征的基礎(chǔ)上,總結(jié)影響客流變化的關(guān)鍵因素,構(gòu)建了基于極端梯度提升決策樹的站點(diǎn)進(jìn)出客流量預(yù)測模型,并通過案例進(jìn)行精度驗(yàn)證.

      1 數(shù)據(jù)采集及影響因素分析

      1.1 活動定義

      本文所研究的短時性大型活動是指活動開始時間和結(jié)束時間明確、集中,持續(xù)數(shù)小時,活動參與人數(shù)超過5 000人的集中式活動,如演唱會、體育賽事等.

      1.2 數(shù)據(jù)基礎(chǔ)

      北京工人體育場位于北京市朝陽區(qū)工人體育場北路,是中超俱樂部北京國安隊的主場,也是各大演唱會舉辦的熱門場館.以北京工人體育場為例探究短時性大型活動的舉辦對周邊軌道進(jìn)出站量的影響規(guī)律,選取東四十條站、東大橋站及團(tuán)結(jié)湖站為研究對象.

      AFC數(shù)據(jù)中主要包含卡ID、進(jìn)出站線路編號、進(jìn)出站站點(diǎn)編號、進(jìn)站時間、出站時間等共16個字段.以北京為例,軌道AFC系統(tǒng)數(shù)據(jù)質(zhì)量良好,站點(diǎn)定位準(zhǔn)確且字段完整率高,可以實(shí)現(xiàn)工作日均超過500萬條的數(shù)據(jù)記錄量.

      從北京市交通管理部門獲取以上三個軌道站點(diǎn)2017年7月1日—2018年10月30日期間,每日05:00—23:00時段15 min粒度的AFC刷卡數(shù)據(jù)作為目標(biāo)函數(shù)導(dǎo)入樣本庫,總樣本量跨18個月共34 600余條.

      北京工人體育場大型活動數(shù)據(jù)主要包含活動舉辦日期、星期、氣象信息、活動名稱、活動上報規(guī)模及開始和結(jié)束時間,數(shù)據(jù)格式見表1.

      表1 短時性大型活動數(shù)據(jù)樣例表

      1.3 影響因素分析

      1) 時段特征軌道交通客運(yùn)量在不同周期范圍內(nèi)均呈現(xiàn)出相應(yīng)的規(guī)律性波動,具有明顯的時段特征:1、2月份軌道客流總體呈現(xiàn)低位運(yùn)行狀態(tài),7、8月則處于較高水平.周變化中,周一早高峰、周五晚高峰軌道運(yùn)行壓力較大;日變化中又分為高峰、平峰時段.故將月份、星期、時段三個特征指標(biāo)納入因素集.

      2) 日期屬性日期屬性主要分別工作日、雙休日及節(jié)假日.不同日期屬性下的軌道交通客運(yùn)量存在差異,故將日期屬性作為特征指標(biāo)納入因素集.

      3) 活動性質(zhì)及上報人數(shù)短時性大型活動種類繁多,包括以演唱會等為主的文藝活動,以籃球賽、足球賽為主的體育活動,以產(chǎn)品發(fā)布為主的商業(yè)類活動等.不同性質(zhì)的大型活動所吸引的人數(shù)不同,活動規(guī)模的大小直接影響前來參加人數(shù)的總量,是影響場館周邊軌道站點(diǎn)的決定性因素.

      4) 天氣狀況對于現(xiàn)場購票的短時性大型活動而言,惡劣天氣將直接影響到居民的前往意愿.對于預(yù)約購票的大型活動,特殊天氣會將部分采用小汽車、步行出行方式的居民轉(zhuǎn)移到乘坐軌道交通中來,同時特殊天氣下的交通系統(tǒng)應(yīng)急保障會提出更高要求.

      5) 舉辦時間舉辦時間是指活動的開始、結(jié)束時間.短時性大型活動主要集中在15:00及19:00左右開始,對于工作日而言15:00是工作時段,會對軌道客流會有一定的影響.對于結(jié)束時間而言,當(dāng)結(jié)束時間過早,居民可能會在場館周邊逗留、餐飲,導(dǎo)致進(jìn)站客流峰值不明顯.當(dāng)活動結(jié)束時間較晚時,客流需要在較短的時間內(nèi)疏散,客流峰值相對集中.

      6) 距離活動開始、結(jié)束時間基于上文分析,選取活動開始前3 h至活動開始后0.5 h、活動結(jié)束前0.5 h至活動結(jié)束后1 h作為影響特征,按照15 min為最小單元進(jìn)行劃分.

      2 活動期間周邊軌道站點(diǎn)客流集散特征分析

      本文針對2017年8月25日舉辦的“周杰倫2017北京演唱會”進(jìn)行案例分析,活動時間為19:00—22:00,上報參與人數(shù)為37 000人,活動開始前軌道站點(diǎn)誘增客流合計達(dá)20 009人·次,占總規(guī)模人數(shù)的54%.選取東四十條、東大橋及團(tuán)結(jié)湖三個站點(diǎn)當(dāng)天進(jìn)出站客流數(shù)據(jù)與同期未有大型活動時的客流數(shù)據(jù)進(jìn)行對比,探究活動開始前后觀眾進(jìn)出周邊軌道站點(diǎn)的集散特征.

      2.1 開場前軌道出站客流特征

      演唱會當(dāng)天與歷史同期的出站客流數(shù)據(jù)對比見圖1.可以看出東四十條、東大橋及團(tuán)結(jié)湖三個站點(diǎn)具有相同的規(guī)律變化特征,在16:30(活動前2.5 h)左右誘增客流量逐漸上升,站點(diǎn)出站量明顯增長;在18:30—18:45(活動前0.5 h)時段出現(xiàn)客流高峰;出站客流于19:30(活動開始后0.5 h)回歸到正常水平,回復(fù)速率明顯高于增長速率;影響時段共計3 h,累計誘增客流分別達(dá)到9 005,5 110,5 023人·次.

      圖1 演唱會開始前東大橋、東十四橋、團(tuán)結(jié)湖站點(diǎn)出站客流

      2.2 散場后軌道進(jìn)站客流特征

      為了更直觀準(zhǔn)確的刻畫活動結(jié)束后軌道站點(diǎn)客流量的變化情況,明確活動影響時段及影響程度,以15 min為統(tǒng)計粒度,將以上三個站點(diǎn)在演唱會結(jié)束后的進(jìn)站客流數(shù)據(jù)與同期歷史客流數(shù)據(jù)進(jìn)行對比,見表2.

      表2 周杰倫2017北京演唱會結(jié)束后進(jìn)站客流

      當(dāng)天演唱會22:00結(jié)束,可以看出三個軌道站點(diǎn)在活動結(jié)束后進(jìn)站客流量均顯著增長,但與活動開始前出站量相比影響時段相對較短,呈現(xiàn)快增快退的趨勢.分析可得活動結(jié)束后對軌道客流的影響時長為1 h,進(jìn)站高峰時段出現(xiàn)在22:15—22:30,15 min進(jìn)站量超2 000人,高于出站客流峰值,客流增幅分別高達(dá)956.9%,664.8%和286.2%.

      3 基于Xgboost的軌道站點(diǎn)進(jìn)出量預(yù)測

      3.1 模型構(gòu)建

      Gradient Boosting算法學(xué)習(xí)機(jī)制是共迭代構(gòu)建K個不同的個體學(xué)習(xí)器:f1(x),…,fK(x),每添加一個新的學(xué)習(xí)器時要使得整體預(yù)測損失更小.其中第t輪迭代的學(xué)習(xí)器為

      ft(x)=ft-1(x)+L(x,ft(x))

      (1)

      式中:ft-1(x)為從第1到第(t-1)輪迭代的學(xué)習(xí)器;L(x,ft(x))為第t輪的損失函數(shù).

      假設(shè)第(t-1)輪迭代得到的學(xué)習(xí)器為ft-1(x),損失函數(shù)為L(x,ft-1(x)),那么本輪的迭代目標(biāo)就是找到一個L(x,ft(x)),來最小化目標(biāo)函數(shù).

      基于以上思想,極端梯度推進(jìn)決策樹回歸算法總結(jié)如下.

      1) 定義目標(biāo)函數(shù)

      (2)

      (3)

      式中:T為葉子結(jié)點(diǎn)個數(shù);ω為葉子節(jié)點(diǎn)的分?jǐn)?shù);γ與λ為控制參數(shù),用來防止過擬合.

      2) 基于GB思想,第t輪的學(xué)習(xí)器等于前t-1輪的學(xué)習(xí)器加上ft

      (4)

      則目標(biāo)函數(shù)可以表示為

      (5)

      3) 在構(gòu)建第t個學(xué)習(xí)器時要尋找最佳的ft,來最小化目標(biāo)函數(shù).利用ft=0處的泰勒二階展開來近似它,則目標(biāo)函數(shù)可以近似為

      (6)

      式中:gi為一階導(dǎo)數(shù);hi為二階導(dǎo)數(shù).

      4) 前t-1輪學(xué)習(xí)器的預(yù)測分?jǐn)?shù)與yi的殘差對目標(biāo)函數(shù)優(yōu)化不影響,可以去掉,并將同一葉子節(jié)點(diǎn)的樣本進(jìn)行重組

      (7)

      5) 將目標(biāo)函數(shù)改寫成關(guān)于葉子結(jié)點(diǎn)分?jǐn)?shù)ω的一個一元二次函數(shù),求解最優(yōu)ω和目標(biāo)函數(shù)值就變得很簡單了,直接使用頂點(diǎn)公式代入即可.因此,最優(yōu)的ω和目標(biāo)函數(shù)的表達(dá)式變換為

      (8)

      3.2 實(shí)例驗(yàn)證

      以東大橋站點(diǎn)為例,選取北京市2017年7月1日—2018年10月30日期間該站點(diǎn)內(nèi)的AFC刷卡數(shù)據(jù)、短時性大型活動數(shù)據(jù)及其他影響因素數(shù)據(jù)構(gòu)建數(shù)據(jù)集,期間共包含94場短時性大型活動.為了提高模型泛化程度,防止過擬合現(xiàn)象,將前70%日期的數(shù)據(jù)作為訓(xùn)練集,后30%作為測試集進(jìn)行模型訓(xùn)練.本文使用Python編程語言構(gòu)建預(yù)測模型,并使用scikit-learn代碼包中的GridSearchCV工具實(shí)現(xiàn)模型參數(shù)最優(yōu)化調(diào)整.

      利用XGBoost模型對北京市2018年11月7日、12月22日2天北京工體舉辦短時性大型活動時的軌道客流量進(jìn)行預(yù)測,并用實(shí)際數(shù)據(jù)進(jìn)行精度檢驗(yàn)評估.活動數(shù)據(jù)見表3.

      表3 大型活動數(shù)據(jù)實(shí)例

      選取的兩場活動具有不同的日期屬性、天氣、活動類型與規(guī)模、舉辦時間,能夠體現(xiàn)出模型在不同因素影響下的預(yù)測性能,具有較強(qiáng)的代表性.針對活動舉辦前后以15 min為粒度進(jìn)行軌道客流預(yù)測,進(jìn)出站量預(yù)測結(jié)果見圖2.

      圖2 東大橋站客流預(yù)測結(jié)果

      預(yù)測精度方面:

      1) 11月7日東大橋進(jìn)出站客流預(yù)測精度分別為91.2%和89.1%,12月22日東大橋進(jìn)出站客流預(yù)測精度為93.5%和92.9%,平均預(yù)測精度可以達(dá)到91%以上.

      2) 12月22日整體預(yù)測精度較高,這是因?yàn)檠莩獣^眾規(guī)模較小,軌道客流波動相對平穩(wěn).

      3) 活動開始前出站客流預(yù)測精度高于活動結(jié)束后進(jìn)站客流精度,說明活動結(jié)束后軌道出行需求集中且波動性較大.

      4 結(jié) 論

      1) 短時性大型活動的開展對周邊軌道站點(diǎn)客流進(jìn)出量會產(chǎn)生顯著影響.影響時段方面,距活動開始前2.5~3 h誘增客流開始出現(xiàn),在活動開始前0.5 h出站客流達(dá)到峰值;誘增客流于活動結(jié)束后 1 h內(nèi)疏散完畢.

      2) 影響幅度方面,活動開始前客流增長幅度呈初步增大的趨勢,與背景客流相比增幅在100%~250%;活動結(jié)束后進(jìn)站客流增長更為顯著,呈現(xiàn)快增塊降的趨勢.

      3) 提出了影響堆到站點(diǎn)客流的6個主要因素:時段、日期、上報人數(shù)、天氣、舉辦時間、距離活動開始結(jié)束時間,并構(gòu)建極端梯度提升決策樹預(yù)測模型.對工人體育場舉辦的兩場短時性大型活動進(jìn)行實(shí)例驗(yàn)證,預(yù)測平均精度超過90%.

      4) 模型適用性方面,當(dāng)要對其他場館周邊軌道站點(diǎn)客流量進(jìn)行預(yù)測時,僅需按照本文所構(gòu)建因素集的格式,輸入目標(biāo)站點(diǎn)的AFC刷卡數(shù)據(jù)及該場館的活動相關(guān)信息,即可完成相關(guān)預(yù)測,模型具有移植性高、通用性強(qiáng)的優(yōu)勢.

      猜你喜歡
      客流量進(jìn)站客流
      客流增多
      進(jìn)站口上下行載頻切換時引起ATP制動問題分析
      春運(yùn)期間北京西站共有154.8萬人次刷臉進(jìn)站
      祖國(2018年6期)2018-06-27 10:27:26
      閱讀(科學(xué)探秘)(2018年8期)2018-05-14 10:06:29
      基于嵌入式系統(tǒng)的商場客流量統(tǒng)計算法
      基于自學(xué)習(xí)補(bǔ)償?shù)氖覂?nèi)定位及在客流分析中的應(yīng)用
      基于AFC數(shù)據(jù)的城軌站間客流量分布預(yù)測
      人工免疫算法在電梯客流時段劃分的應(yīng)用
      重慶軌道交通三號線列車進(jìn)站警示功能接口電路的分析
      城市軌道交通運(yùn)營客流數(shù)據(jù)分析缺陷及應(yīng)對
      昌邑市| 东至县| 莆田市| 平凉市| 手机| 阳东县| 丰宁| 商河县| 四平市| 宣恩县| 巴彦淖尔市| 弥勒县| 富蕴县| 梅河口市| 无棣县| 中卫市| 孝义市| 虞城县| 广河县| 屯留县| 长海县| 湖口县| 安福县| 阳新县| 蒲城县| 东城区| 瓦房店市| 翁牛特旗| 文水县| 平遥县| 门头沟区| 茶陵县| 大新县| 安岳县| 防城港市| 郁南县| 徐州市| 苏州市| 巴塘县| 峡江县| 台南县|