• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于Xgboost算法的共享自行車短時(shí)需求預(yù)測(cè)研究*

      2019-04-30 06:29:12胡郁蔥張筑杰王曉晴
      關(guān)鍵詞:借車需求預(yù)測(cè)站點(diǎn)

      胡郁蔥 張筑杰 王曉晴

      (華南理工大學(xué)土木與交通學(xué)院1) 廣州 510641) (華南師范大學(xué)生命科學(xué)學(xué)院2) 廣州 510631)

      0 引 言

      共享自行車系統(tǒng)由于利用移動(dòng)互聯(lián)網(wǎng)與傳統(tǒng)的公共自行車結(jié)合而擺脫了傳統(tǒng)停車樁的限制,通過(guò)與公共交通“最后一公里”銜接,給居民帶來(lái)了極大的便利.然而,共享自行車需求的區(qū)域不均衡性,導(dǎo)致局部區(qū)域的資源過(guò)剩與資源短缺矛盾突出,影響了用戶對(duì)共享自行車的使用意愿.合理確定使用需求,優(yōu)化投放規(guī)模和調(diào)度策略是提高共享自行車資源使用效率的重要途徑,而其核心技術(shù)就是對(duì)共享自行車的短時(shí)需求進(jìn)行預(yù)測(cè),即在前一時(shí)段預(yù)測(cè)下一時(shí)段各站點(diǎn)的共享自行車需求數(shù)量,利用調(diào)度手段調(diào)整各站點(diǎn)自行車規(guī)模,以最大限度地滿足用戶需求.

      國(guó)外對(duì)于有固定站點(diǎn)的公共自行車系統(tǒng)需求預(yù)測(cè)研究比較深入,針對(duì)性地對(duì)自行車站點(diǎn)的數(shù)據(jù)的規(guī)律進(jìn)行研究,包括考慮自行車的歷史使用模式,乘客出行習(xí)慣的影響.其主要使用的預(yù)測(cè)方法主要包括數(shù)據(jù)挖掘的方法、機(jī)器學(xué)習(xí)方法及傳統(tǒng)的參數(shù)方法(如ARMA)[1-2].國(guó)內(nèi)學(xué)者主要是基于交通出行理論[3],對(duì)公共自行車需求進(jìn)行預(yù)測(cè),以預(yù)測(cè)結(jié)果來(lái)確定調(diào)度車數(shù)并建立租賃點(diǎn)短期需求預(yù)測(cè)模型;也有對(duì)不同用地性質(zhì)租賃點(diǎn)借還需求進(jìn)行分析,對(duì)交通小區(qū)的公共自行車的需求量進(jìn)行預(yù)測(cè)[4],國(guó)內(nèi)學(xué)者們關(guān)注的多是宏觀上公共自行車系統(tǒng)整體的調(diào)配需求總量,較少對(duì)具體公共自行車站點(diǎn)的短時(shí)借還需求研究.

      基于此,目前對(duì)無(wú)樁式共享自行車的短時(shí)需求預(yù)測(cè)的研究成果幾乎未見(jiàn)報(bào)道.總結(jié)國(guó)內(nèi)外研究成果,針對(duì)自行車短時(shí)需求預(yù)測(cè)研究,主要存在以下兩個(gè)問(wèn)題:

      1) 研究的相關(guān)因素太少,多數(shù)研究為了簡(jiǎn)化運(yùn)算,選擇的相關(guān)因素(特征向量)都比較理想化,并沒(méi)有將天氣,特殊節(jié)假日等因素考慮進(jìn)去,而自行車需求很大程度上會(huì)受到天氣,特殊節(jié)假日這些因素的影響;并且,現(xiàn)有研究多數(shù)只是針對(duì)單個(gè)站點(diǎn)的短時(shí)需求預(yù)測(cè),而忽略了站點(diǎn)與站點(diǎn)之間的相關(guān)性.

      2) 目前自行車短時(shí)需求預(yù)測(cè)方法,主要采用參數(shù)模型進(jìn)行預(yù)測(cè).常用的參數(shù)模型主要包括移動(dòng)平均法、指數(shù)平滑法、Box-Jenkins、ARIMA等,這類方法大多都是非常有效的,而且得到的結(jié)果是嚴(yán)格的.但是這些方法是建立在有效的先驗(yàn)知識(shí)(例如交通參數(shù))的前提下的,并且依賴于一系列的假設(shè),這往往無(wú)法解決一些高度非線性的,復(fù)雜的問(wèn)題.

      非參數(shù)模型在處理高度非線性數(shù)據(jù)比傳統(tǒng)參數(shù)模型具有優(yōu)勢(shì),其實(shí)現(xiàn)起來(lái)更加簡(jiǎn)單.近年來(lái),非參數(shù)模型開(kāi)始廣泛應(yīng)用于短時(shí)交通預(yù)測(cè),主要有高斯最大似然估計(jì)、Kalman濾波模型、支持向量機(jī)模型、小波分析法、貝葉斯網(wǎng)絡(luò)等.非參數(shù)模型的優(yōu)點(diǎn)是處理快速,可以對(duì)大量非線性,復(fù)雜的數(shù)據(jù)進(jìn)行處理.

      Xgboost算法屬于非參數(shù)模型,也是監(jiān)督學(xué)習(xí)的一種[5].它是一種基于分類和回歸樹(shù)的算法,屬于連續(xù)的集成學(xué)習(xí)模型,其基本思想通過(guò)一系列弱分類器的迭代計(jì)算實(shí)現(xiàn)準(zhǔn)確的分類效果.使用Xgboost的優(yōu)勢(shì)在于快速對(duì)特征級(jí)數(shù)據(jù)進(jìn)行訓(xùn)練,預(yù)測(cè)結(jié)果精度高,并且Xgboost可以有效解決高維度問(wèn)題,避免了“維度的詛咒”.由于其具有數(shù)據(jù)處理快和準(zhǔn)確度較高的特點(diǎn),Xgboost活躍于各種大型數(shù)據(jù)競(jìng)賽中,在2015年的Kaggle的29個(gè)賽題中,17個(gè)賽題的解決方案使用了Xgboost算法.

      為準(zhǔn)確實(shí)現(xiàn)對(duì)共享自行車站點(diǎn)短時(shí)需求的預(yù)測(cè),文中考慮加入天氣、特殊節(jié)日和站點(diǎn)之間相關(guān)性因素的影響,這會(huì)增加計(jì)算的復(fù)雜度,而應(yīng)用Xgboost算法進(jìn)行短時(shí)需求預(yù)測(cè)可以提高預(yù)測(cè)的精確度,并且能高效的處理短時(shí)需求預(yù)測(cè)問(wèn)題.由于共享自行車企業(yè)一般不直接提供數(shù)據(jù),本文以某市公共自行車系統(tǒng)數(shù)據(jù)模擬聚類后的共享自行車站點(diǎn)需求,使用Xgboost算法進(jìn)行站點(diǎn)需求短時(shí)預(yù)測(cè),并對(duì)該方法的效果進(jìn)行了檢驗(yàn).

      1 基于Xgboost算法的預(yù)測(cè)

      極端梯度提升樹(shù)(extreme gradient boosting,Xgboost)是梯度提升機(jī)器算法(gradient boosting machine)的擴(kuò)展[6].Boosting是一種連續(xù)的集成學(xué)習(xí)模型,其基本思想通過(guò)一系列弱分類器的迭代計(jì)算實(shí)現(xiàn)準(zhǔn)確的分類效果.該模型不斷迭代,每次迭代生成一棵新的樹(shù),如何在每一步生成合理的樹(shù)是boosting分類器的核心.gradient boosting machine算法在生成每一棵樹(shù)的時(shí)候采用梯度下降的思想,以上一步生成的所有樹(shù)為基礎(chǔ).在合理的參數(shù)設(shè)置下,Boosting算法往往要生成一定數(shù)量的樹(shù)才能達(dá)到令人滿意的準(zhǔn)確率.

      Xgboost的目標(biāo)函數(shù)(包括訓(xùn)練誤差和正則化項(xiàng))為

      (1)

      2 實(shí)例分析

      2.1 數(shù)據(jù)準(zhǔn)備

      數(shù)據(jù)主要來(lái)源于某市2015年1—8月的公共自行車數(shù)據(jù),將其類比成已經(jīng)過(guò)一次聚類后的共享自行車數(shù)據(jù).整個(gè)數(shù)據(jù)集一共有2 132 694條記錄,訓(xùn)練集里只有318個(gè)站點(diǎn)的數(shù)據(jù).對(duì)于一些數(shù)據(jù)記錄不完整或者記錄較少的站點(diǎn)給予剔除,最后得出有效站點(diǎn)117個(gè).數(shù)據(jù)包含的主要的信息包括:借車日期、借車時(shí)間、騎行分鐘、超時(shí)分鐘、借車站點(diǎn)號(hào)、車位、車卡、借車卡、還車站點(diǎn)號(hào)、還車車位、還車日期、還車時(shí)間、操作類型、操作名稱.另外,抓取該市2015年1—8月份的天氣信息,將天氣分成了四種情況晴天、陰天、雨天、暴雨.

      主要選取2015年1月1日—8月24日的公共自行車的各站點(diǎn)借車數(shù)據(jù)作為訓(xùn)練數(shù)據(jù).考慮到每天站點(diǎn)借車數(shù)量較小,選取1 d作為時(shí)間間隔進(jìn)行劃分,得出117個(gè)站點(diǎn)中,每個(gè)站點(diǎn)包含216組數(shù)據(jù),將2015年8月25—31日1周的各站點(diǎn)借車數(shù)據(jù)作為測(cè)試數(shù)據(jù),117個(gè)站點(diǎn)中每個(gè)站點(diǎn)包含7組數(shù)據(jù).

      2015年1月1日—8月31日部分站點(diǎn)的借車數(shù)量圖見(jiàn)圖1.由圖1可知,數(shù)據(jù)呈非線性,站點(diǎn)的借車數(shù)量的波動(dòng)并沒(méi)有強(qiáng)規(guī)律性,隨時(shí)間波動(dòng)的規(guī)律也不是很明顯,初步分析站點(diǎn)的借車數(shù)量受多種因素的影響,用傳統(tǒng)的參數(shù)方法難以準(zhǔn)確預(yù)測(cè).

      圖1 部分站點(diǎn)借車數(shù)量圖

      2.2 聚類分析

      當(dāng)站點(diǎn)數(shù)量較少時(shí),可以直接進(jìn)行相關(guān)分析之后再選取相關(guān)系數(shù)高的站點(diǎn)進(jìn)行下一步分析.但是考慮到目前共享自行車的現(xiàn)狀,一個(gè)大城市虛擬停車站點(diǎn)數(shù)量通常超過(guò)幾千個(gè),此時(shí)相關(guān)分析的時(shí)間復(fù)雜度為O(n)=n·n·y,n為站點(diǎn)數(shù),y為站點(diǎn)的數(shù)據(jù)量,因此,當(dāng)n和y都變得很大時(shí),直接進(jìn)行相關(guān)分析的時(shí)間復(fù)雜度呈指數(shù)級(jí)增加.此時(shí),先進(jìn)行聚類,再針對(duì)聚類的結(jié)果進(jìn)行相關(guān)分析,可以提高算法的效率.

      目前,主流的聚類算法有k-means (KM),EM算法(expectation maximization algorithm)還有sIB算法(sequential Information-bottleneck)[7].另外,在進(jìn)行聚類分析之前要先確定聚類的類別的數(shù)量.主要的方法有DBI(davies-bouldin index)方法[8]、DI(dunn index)方法[9].DBI越小,說(shuō)明聚類效果越好.相反,DI越高,聚類效果越好.DBI方法使用歐氏距離,在應(yīng)用于k-means聚類方法上具有良好的效果.本文主要使用k-means聚類方法,并且采用歐式距離進(jìn)行聚類,因此本文采用DBI方法來(lái)判斷聚類的類別的數(shù)量.

      本文將自行車的站點(diǎn)定義為初始點(diǎn),假設(shè)任意一點(diǎn)X為維度d,對(duì)于A,B兩點(diǎn),則A=[a1,a2,…,ad],B=[b1,b2,…,bd],則A與B點(diǎn)的歐氏距離被定義為

      (2)

      然后根據(jù)DBI方法對(duì)聚類數(shù)量進(jìn)行判斷,見(jiàn)圖2.由圖2可知,在k=9次,DBI值降到最低.根據(jù)肘部法則,確定最佳的聚類數(shù)量的值為9.

      圖2 DBI指標(biāo)圖

      訓(xùn)練數(shù)據(jù)中包含117個(gè)站點(diǎn),以每個(gè)站點(diǎn)2015年1月1日—8月24日的每日借車數(shù)量作為該站點(diǎn)的向量,每個(gè)向量包含237個(gè)元素,共計(jì)117個(gè)向量,利用k-means聚類算法對(duì)這117個(gè)向量進(jìn)行聚類,距離測(cè)度選用歐式距離,算法采用誤差平方和準(zhǔn)則函數(shù)作為聚類準(zhǔn)則函數(shù),當(dāng)算法迭代至14次,達(dá)到損失值最小,之后保持不變.

      2.3 相關(guān)分析

      常用的相關(guān)分析的方法主要有圖表相關(guān)分析、協(xié)方差及協(xié)方差矩陣、相關(guān)系數(shù)(相關(guān)系數(shù)主要有Pearson相關(guān)系數(shù)、Spearman秩相關(guān)系數(shù)、Kendall相關(guān)系數(shù))[10].由于圖表的相關(guān)分析局限于低維度的數(shù)據(jù),當(dāng)數(shù)據(jù)超過(guò)二維時(shí),難以通過(guò)觀察圖表得出特征之間的相關(guān)性.另外,協(xié)方差通過(guò)數(shù)字衡量變量間的相關(guān)性,正值表示正相關(guān),負(fù)值表示負(fù)相關(guān),但無(wú)法對(duì)相關(guān)的密切程度進(jìn)行度量.因此,本文選擇相關(guān)系數(shù)法進(jìn)行相關(guān)分析.考慮到Spearman秩相關(guān)系數(shù),Kendall 相關(guān)系數(shù)均需要利用數(shù)據(jù)的秩,在進(jìn)行高維的相關(guān)分析均比較復(fù)雜,因此本文選擇Pearson相關(guān)系數(shù)進(jìn)行相關(guān)分析.當(dāng)相關(guān)系數(shù)超過(guò)0.5則認(rèn)為兩種因素呈強(qiáng)相關(guān)關(guān)系.

      根據(jù)聚類分析的結(jié)果,對(duì)各類別的站點(diǎn)之間進(jìn)行相關(guān)分析.本文一共得出9類數(shù)據(jù),表1為第3類的相關(guān)系數(shù)數(shù)據(jù).

      表1 部分站點(diǎn)相關(guān)系數(shù)表

      由表1可知,各站點(diǎn)之間的相關(guān)系數(shù)均大于0.6,表示各站點(diǎn)呈強(qiáng)相關(guān)關(guān)系,這也反映出聚類結(jié)果的有效性.

      但是,由于此時(shí)的相關(guān)分析是針對(duì)各站點(diǎn)同時(shí)期進(jìn)行的,然而在進(jìn)行某一站點(diǎn)需求預(yù)測(cè)時(shí),并不能獲取其他與之相關(guān)站點(diǎn)的需求量,因?yàn)槠渌军c(diǎn)的需求量同樣是未知的.所以,要進(jìn)一步對(duì)與該站點(diǎn)相關(guān)的幾個(gè)站點(diǎn)前幾期的需求進(jìn)行相關(guān)分析, 得出該站點(diǎn)當(dāng)天的需求量與其他與之相關(guān)的站點(diǎn)的前1 d的需求量相關(guān)性最高,并且隨著時(shí)間越長(zhǎng),相關(guān)性越低,因此,主要選取與該站點(diǎn)相關(guān)的其他站點(diǎn)的前1 d的需求量作為特征值.并對(duì)聚類行成的站點(diǎn)當(dāng)天需求量與其他站點(diǎn)前1 d需求量進(jìn)行相關(guān)分析,部分站點(diǎn)數(shù)據(jù)見(jiàn)表2.

      表2 站點(diǎn)20與其他站點(diǎn)的前1 d需求量相關(guān)系數(shù)表

      通過(guò)相關(guān)相關(guān)分析結(jié)果選取相關(guān)程度高的站點(diǎn)的前1 d需求量作為特征向量.如站點(diǎn)20,根據(jù)商標(biāo),站點(diǎn)30和170對(duì)應(yīng)的相關(guān)系數(shù)大于0.5,故選取站點(diǎn)30,170的前1 d需求量作為其特征向量.

      2.4 構(gòu)建特征向量

      本文選取的特征向量主要包括前2周每天的借車數(shù)量、工作日、周末、天氣、寒暑假、特殊節(jié)假日、季節(jié),其中前兩周每天的借車數(shù)量一共包含14個(gè)特征,工作日包含星期一至星期五5個(gè)特征,周末包括星期六,星期天2個(gè)特征,寒暑假則包含寒假,暑假2個(gè)特征,特殊節(jié)假日不具體細(xì)分,包含1個(gè)特征,季節(jié)包含冬天,春天,夏天3個(gè)特征,一共27個(gè)特征.根據(jù)相關(guān)分析的結(jié)果,加入新的特征向量.構(gòu)建的特征向量為:前兩周每天的借車數(shù)量,工作日,周末,天氣,寒暑假,特殊節(jié)假日,季節(jié),相關(guān)程度高的站點(diǎn)的前1 d借車數(shù)量.

      2.5 利用Xgboost進(jìn)行預(yù)測(cè)

      而優(yōu)化Xgboost的目標(biāo)函數(shù)主要通過(guò)求解CART樹(shù)(回歸樹(shù))的結(jié)構(gòu)和葉分?jǐn)?shù).首先,目標(biāo)函數(shù)的訓(xùn)練誤差主要通過(guò)加法訓(xùn)練進(jìn)行優(yōu)化,具體步驟如下.

      (2)

      運(yùn)用加法訓(xùn)練,分步驟優(yōu)化目標(biāo)函數(shù),首先優(yōu)化第一棵樹(shù),結(jié)束之后再優(yōu)化第二棵樹(shù),直至優(yōu)化完K棵樹(shù).首先假設(shè)模型初始估計(jì)值,每次添加一個(gè)新的函數(shù)(樹(shù)),迭代計(jì)算第t輪模型輸出預(yù)測(cè)值.

      然后對(duì)模型正則化項(xiàng)進(jìn)行優(yōu)化,將模型正則化項(xiàng)定義為葉結(jié)點(diǎn)總數(shù)和葉節(jié)點(diǎn)權(quán)值平方和函數(shù).

      (3)

      Xgboost算法中對(duì)樹(shù)的復(fù)雜度項(xiàng)增加了一個(gè)L2正則化項(xiàng),針對(duì)每個(gè)葉結(jié)點(diǎn)的得分增加L2平滑,目的也是為了避免過(guò)擬合.

      然后將上文提到的特征值進(jìn)行構(gòu)建特征向量,利用Xgboost法進(jìn)行預(yù)測(cè)當(dāng)前時(shí)段的借還車數(shù)量,并計(jì)算目標(biāo)函數(shù) ,并找出最優(yōu)樹(shù)結(jié)構(gòu)和葉子節(jié)點(diǎn)的值.并對(duì)特征向量進(jìn)行評(píng)分,按照特征向量的重要性進(jìn)行排序.

      對(duì)所有站點(diǎn)的特征重要性進(jìn)行分析得出,前1 d借車數(shù)量對(duì)預(yù)測(cè)當(dāng)天的借車數(shù)量影響最大,117個(gè)站點(diǎn)中105個(gè)站點(diǎn)的前1 d借車數(shù)量的重要性都是排第一的,所占比率為89.7%;當(dāng)天的前2 d,前3 d的借車數(shù)量同樣對(duì)預(yù)測(cè)當(dāng)天的借車數(shù)量影響也很大,前2 d借車數(shù)量的重要性都是排第二的站點(diǎn)所占比率為77.8%,前3 d的借車數(shù)量的重要性都是排第三的站點(diǎn)所占比率為52.1%.其他特征的重要性依次下降,因不同站點(diǎn)而異.

      另外,冬天這個(gè)因素對(duì)大部分站點(diǎn)影響則很少,有14個(gè)站點(diǎn)中的冬天的重要性幾乎為0.而天氣因素的重要性在所有因素中除了前2周的借車數(shù)量這些因素之外,重要性最大.寒暑假因素則對(duì)于個(gè)別站點(diǎn)影響較大,比如,站點(diǎn)30,70,78則受暑假的影響較大,而站點(diǎn)84,158則受寒假的影響較大.特殊假節(jié)日這個(gè)因素對(duì)于部分站點(diǎn)影響較大,比如站點(diǎn)8,101,其重要性排在第六.

      3 共享自行車短時(shí)需求預(yù)測(cè)結(jié)果評(píng)估

      文中使用平均絕對(duì)誤差(mean absolute error,MAE),平均絕對(duì)百分比誤差(mean absolute percentage error,MAPE),均方根誤差(root mean square error,RMSE),模型訓(xùn)練時(shí)間(time)四項(xiàng)指標(biāo)對(duì)模型的精度和有效性進(jìn)行評(píng)價(jià).

      2015年8月25—31日部分站點(diǎn)1周的預(yù)測(cè)值與真實(shí)值的對(duì)比圖見(jiàn)圖3,總體上利用Xgboost進(jìn)行預(yù)測(cè),預(yù)測(cè)值與真實(shí)值的十分接近,變化的趨勢(shì)也基本一致,比如,站點(diǎn)5,6,7(還有大部分站點(diǎn)),但是也有出現(xiàn)部分站點(diǎn)(如站點(diǎn)8),使用Xgboost對(duì)于一些波動(dòng)比較大的數(shù)據(jù)無(wú)法準(zhǔn)確預(yù)測(cè).

      圖3 部分站點(diǎn)真實(shí)值與預(yù)測(cè)值對(duì)比圖

      另外,為分析本文方法的預(yù)測(cè)準(zhǔn)確性與效率,將Xgboost和基于BP神經(jīng)網(wǎng)絡(luò)的、基于參數(shù)方法ARMA的、基于K最近鄰方法的短時(shí)需求預(yù)測(cè)方法結(jié)果進(jìn)行比較(訓(xùn)練時(shí)間是包括所有站點(diǎn)的訓(xùn)練時(shí)間).評(píng)價(jià)結(jié)果見(jiàn)表3.

      表3 四種算法的1周的指標(biāo)平均值對(duì)比表

      分析上面的評(píng)價(jià)結(jié)果圖和表,比較所有預(yù)測(cè)數(shù)據(jù)的預(yù)測(cè)結(jié)果,Xgboost算法的預(yù)測(cè)效果好于其他算法:

      1) Xgboost算法的MAE,MAPE均低于另外三個(gè)模型,說(shuō)明其預(yù)測(cè)結(jié)果與真值的差距更小,模型精度更高.

      2) Xgboost算法的RMSE也均低于另外三個(gè)模型,說(shuō)明其預(yù)測(cè)結(jié)果與真值的偏差波動(dòng)幅度更小,模型結(jié)果更可靠.

      3) 模型的訓(xùn)練時(shí)間,KNN與 Xgboost算法模型表現(xiàn)的最好,模型訓(xùn)練時(shí)間在2 min以內(nèi),ARMA模型耗時(shí)最長(zhǎng).Xgboost算法計(jì)算速度也相當(dāng)可觀,得益于其原生語(yǔ)言為C/C++,在進(jìn)行節(jié)點(diǎn)的分裂時(shí),支持各個(gè)特征多線程進(jìn)行增益計(jì)算,因此算法計(jì)算速度更快.

      而Xgboost的缺點(diǎn)使用Xgboost對(duì)于一些波動(dòng)比較大的數(shù)據(jù)無(wú)法準(zhǔn)確預(yù)測(cè).對(duì)于當(dāng)自行車站點(diǎn)數(shù)量比較少的情況下,整體站點(diǎn)的誤差容易受到個(gè)別誤差大的站點(diǎn)所影響,使得整體誤差變大.當(dāng)自行車站點(diǎn)數(shù)量比較大的情況下,使用Xgboost進(jìn)行預(yù)測(cè)整體的平均誤差比較小,使用Xgboost效果則比較好.

      4 結(jié) 束 語(yǔ)

      相對(duì)于以往的只是針對(duì)站點(diǎn)自身的需求數(shù)據(jù)進(jìn)行短時(shí)需求預(yù)測(cè)的研究,從特征級(jí)的角度考慮了天氣因素,節(jié)假日因素,還有站點(diǎn)之間的相關(guān)性,并將這些因素加入到特征向量應(yīng)用于共享自行車站點(diǎn)短時(shí)需求預(yù)測(cè).并利用Xgboost算法求解,將結(jié)果與BP神經(jīng)網(wǎng)絡(luò)模型、ARMA模型和K最近鄰算法進(jìn)行了對(duì)比分析,得出Xgboost算法預(yù)測(cè)的效果最為穩(wěn)定,各天的指標(biāo)值波動(dòng)都較小,具有很強(qiáng)的魯棒性.但是,在應(yīng)用Xgboost算法的過(guò)程中,Xgboost對(duì)于一些波動(dòng)比較大的數(shù)據(jù)無(wú)法準(zhǔn)確預(yù)測(cè),造成個(gè)別站點(diǎn)的誤差較大,后續(xù)可以針對(duì)這些特點(diǎn)對(duì)Xgboost算法進(jìn)行改進(jìn).另外,所采用的數(shù)據(jù)為公共自行車數(shù)據(jù),每日的借車數(shù)量相對(duì)較少,只是針對(duì)以天為時(shí)間間隔進(jìn)行預(yù)測(cè)的實(shí)時(shí)性較低,未來(lái)使用共享自行車數(shù)據(jù)時(shí),可以通過(guò)進(jìn)一步分時(shí)段進(jìn)行預(yù)測(cè)(例如分成每個(gè)小時(shí)的借車數(shù)量),以提高短時(shí)預(yù)測(cè)的實(shí)時(shí)性和精確度.

      猜你喜歡
      借車需求預(yù)測(cè)站點(diǎn)
      基于貝葉斯最大熵的電動(dòng)汽車充電需求預(yù)測(cè)
      吉林電力(2022年2期)2022-11-10 09:24:42
      基于Web站點(diǎn)的SQL注入分析與防范
      電子制作(2019年14期)2019-08-20 05:43:42
      2017~2018年冬季西北地區(qū)某站點(diǎn)流感流行特征分析
      安防巨頭借車聯(lián)網(wǎng)東風(fēng) 促智能交通發(fā)展升級(jí)
      首屆歐洲自行車共享站點(diǎn)協(xié)商會(huì)召開(kāi)
      基于計(jì)算實(shí)驗(yàn)的公共交通需求預(yù)測(cè)方法
      基本殺法能力訓(xùn)練之借車使炮殺法
      棋藝(2016年6期)2016-11-14 05:33:19
      怕被人認(rèn)出
      中國(guó)中長(zhǎng)期煤炭需求預(yù)測(cè)
      我國(guó)卷煙需求預(yù)測(cè)研究述評(píng)
      高安市| 隆昌县| 吴忠市| 安阳县| 天全县| 九龙城区| 渝中区| 扬州市| 军事| 宝清县| 元阳县| 延津县| 宁城县| 色达县| 同心县| 通海县| 承德县| 平果县| 台北市| 通许县| 陇川县| 德惠市| 霞浦县| 普宁市| 甘洛县| 焉耆| 达日县| 扶余县| 湖口县| 潢川县| 河池市| 古浪县| 吉木乃县| 瓦房店市| 孙吴县| 鄂托克前旗| 桃源县| 溆浦县| 云浮市| 宕昌县| 绵阳市|