• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于機(jī)器學(xué)習(xí)的公交站間運(yùn)行時(shí)間冪律分布分析①

      2019-12-20 02:32:04徐文進(jìn)尋晴晴
      關(guān)鍵詞:分站刷卡城際

      徐文進(jìn),尋晴晴,周 笛

      1(青島科技大學(xué) 信息科學(xué)技術(shù)學(xué)院,青島 266061)

      2(解放軍北部戰(zhàn)區(qū)91049部隊(duì),青島 266000)

      城際公交是指在城市群或大城市與周邊中小城鎮(zhèn)間設(shè)立的長途公交系統(tǒng),它作為行人出行的交通工具,即方便又價(jià)廉;城際公交具有自身的特點(diǎn),與一般的長途和城際快客有所不同,是在通勤距離在十幾到幾十公里的公交體系,在重要的城區(qū)之間開行的多班次,具有固定公交站點(diǎn)和較明確營運(yùn)計(jì)劃表的通勤系統(tǒng),是趨向公交化的短途旅客營運(yùn)車輛,是市內(nèi)公交車的延伸和拓展,對(duì)乘客來講更加便捷,票價(jià)相比城際長途客運(yùn)和軌道交通也更低廉,在我國有較大的發(fā)展空間.

      但是國內(nèi)對(duì)城際公交的研究不多,已有的研究主要集中在城際公交建立的政策和規(guī)劃領(lǐng)域,如文獻(xiàn)[1-6],較少涉及到城域公交的數(shù)據(jù)挖掘.近年來蓬勃發(fā)展的人工智能機(jī)器學(xué)習(xí)技術(shù)是利用機(jī)器學(xué)習(xí)[7,8]算法對(duì)已知數(shù)據(jù)進(jìn)行分析、計(jì)算得到合乎實(shí)際的規(guī)律、模型,并進(jìn)行合理的預(yù)測.實(shí)踐證明,利用人工智能機(jī)器學(xué)習(xí)算法進(jìn)行數(shù)據(jù)挖掘是分析城際公交運(yùn)行規(guī)律的有效方法.

      本文基于南方某城市和北方某城市公交線路的公交卡的交易記錄,通過對(duì)數(shù)據(jù)的合理分析,結(jié)合機(jī)器學(xué)習(xí)分類算法,合理設(shè)定分站標(biāo)準(zhǔn),找出公交站點(diǎn)[9];使用Python編程,通過智能公交卡記錄,對(duì)乘車的人群行為進(jìn)行挖掘和預(yù)測,分析得出乘坐公交車的習(xí)慣和偏好;同時(shí)在研究中證明城域公交車運(yùn)行時(shí)站間時(shí)間間隔遵循人類行為動(dòng)力學(xué)理論[10-13],滿足冪律分布.

      1 公交智能卡數(shù)據(jù)集和數(shù)據(jù)預(yù)處理

      1.1 公交智能卡數(shù)據(jù)集

      城際公交作為城市群間重要的交通聯(lián)系方式,蘊(yùn)含著大量的數(shù)據(jù).通過研究城際公交數(shù)據(jù)可提供大量、豐富的數(shù)據(jù),可以挖掘出助力城際公交發(fā)展的信息.本文主要通過提取公交IC卡的數(shù)據(jù)來進(jìn)行研究的;公交IC卡現(xiàn)在一般采用射頻識(shí)別技術(shù)進(jìn)行數(shù)據(jù)通信,使用集成電路芯片存儲(chǔ)用戶數(shù)據(jù),數(shù)據(jù)的可靠性和真實(shí)性有保障.因此圍繞著北方某城市和南方某城市城際公交的數(shù)據(jù),對(duì)公交IC卡的數(shù)據(jù)進(jìn)行分析和應(yīng)用,發(fā)現(xiàn)公交客流量出行的一個(gè)規(guī)律.如表1和表2描述了原始數(shù)據(jù)的類型.

      表1 南方某城市數(shù)據(jù)類型

      1.2 智能數(shù)據(jù)卡的預(yù)處理

      智能卡打卡數(shù)據(jù)首先要進(jìn)行數(shù)據(jù)的預(yù)處理,如對(duì)打卡數(shù)據(jù)的時(shí)間戳進(jìn)行轉(zhuǎn)換、合并重復(fù)數(shù)據(jù),數(shù)據(jù)的預(yù)處理由以下步驟組成:

      (1)不完整數(shù)據(jù)清洗;在智能卡打卡數(shù)據(jù)中,一組完整的數(shù)據(jù)至少應(yīng)該包括卡類型、卡號(hào)、智能終端號(hào)和打卡時(shí)間;缺失一個(gè),就會(huì)對(duì)后面的算法實(shí)驗(yàn)造成影響,因此對(duì)打卡數(shù)據(jù)中缺失數(shù)據(jù)項(xiàng)的進(jìn)行清洗.

      (2)剔除不合理的數(shù)據(jù),在數(shù)據(jù)處理時(shí)發(fā)現(xiàn)有的打卡數(shù)據(jù)是在凌晨,此時(shí)公交車并不運(yùn)行,所以應(yīng)該剔除這些不合理的數(shù)據(jù).

      (3)重復(fù)數(shù)據(jù)合并,在數(shù)據(jù)預(yù)處理中發(fā)現(xiàn),在短時(shí)間內(nèi)(1分鐘)有的卡打卡次數(shù)超過2次,這是由于不小心重復(fù)打卡或是在數(shù)據(jù)傳輸中的錯(cuò)誤造成的,重復(fù)的打卡數(shù)據(jù)其實(shí)對(duì)應(yīng)的同一次乘車行為,所以這些重復(fù)的打卡數(shù)據(jù)要合并成為一項(xiàng).

      表2 北方某城市數(shù)據(jù)類型

      1.3 智能數(shù)據(jù)卡的特征

      1.3.1 卡類型分布特征

      數(shù)據(jù)預(yù)處理后,對(duì)打卡數(shù)據(jù)的分布進(jìn)行分析.首先根據(jù)原始數(shù)據(jù)刷卡的情況,卡類型進(jìn)行分類,得到的殘疾卡,老人卡,普通卡,學(xué)生卡,員工卡,治安監(jiān)督卡所占的頻數(shù)和比例,如表3和表4所示.

      表3 南方某城市公交卡刷卡比例

      通過表3和表4發(fā)現(xiàn)老年卡、學(xué)生卡、普通卡的出行所占比例挺高的,但殘疾卡的比例相對(duì)較少,這可能與城際公交車設(shè)置無障礙設(shè)備有關(guān).

      1.3.2 客流量分布特征

      把城際公交線路全日客流情況的刷卡的數(shù)據(jù)累加起來,從中可得到該全日累計(jì)客流的時(shí)間分布的數(shù)據(jù).獲取的公交車的數(shù)據(jù)通過刷卡時(shí)間反映出刷卡乘客在全日內(nèi)的高峰期,如圖1選取了某一天的客流情況.

      表4 北方某市公交車刷卡比例

      圖1(a)是南方某城市數(shù)據(jù)的客流量折線圖,圖1(b)圖是北方某城市數(shù)據(jù)的客流量折線圖,橫軸表示的是刷卡的時(shí)間,從0點(diǎn)到24點(diǎn),縱軸表示的刷卡的次數(shù);可以從圖1中得出以下結(jié)論:

      (1)由圖1得出早晨5點(diǎn)后至上午8點(diǎn)是一個(gè)出行高峰,而且乘車人數(shù)幾乎是隨著時(shí)間成正比增加,符合上班、上學(xué)的出行時(shí)間規(guī)律,上午8點(diǎn)后乘坐公交車出行人數(shù)明顯下降,說明公共交通乘坐的主要人流還是上班族和上學(xué)族.

      (2)由圖1(a)顯示中午12點(diǎn),圖1(b)顯示13點(diǎn)乘車有一個(gè)小高峰,這是因?yàn)橹形缡俏缧輹r(shí)段,而且有的小學(xué)生下午不上課,這部分乘客利用中午時(shí)段乘坐公交車出行.

      (3)由圖1得出下午16點(diǎn)開始至傍晚18點(diǎn)乘車人數(shù)較多,刷卡數(shù)據(jù)一直在增長.18點(diǎn)左右達(dá)到高峰,是學(xué)生流和下班乘車疊加所致.

      圖1 客流量分布圖

      2 公交車站間運(yùn)行規(guī)律

      在經(jīng)過簡單公交車智能卡數(shù)據(jù)分析后,然后從時(shí)域角度分析公交車站間運(yùn)行時(shí)間.

      2.1 公交車分站算法

      本論文選取南方某城市和北方某城市數(shù)據(jù)的4條線路,對(duì)智能卡實(shí)際交易記錄進(jìn)行分站算法的研究;合理的設(shè)計(jì)的分站算法,進(jìn)而找出公交站間的運(yùn)行時(shí)間,算法1是本文設(shè)計(jì)的公共交通分站算法.

      算法1主要的思想是確定站間運(yùn)行時(shí)間的閾值,看查找的閾值是否符合實(shí)際的設(shè)站數(shù)量,若符合,算法結(jié)束;否則,繼續(xù)查找.由算法獲得分站數(shù)據(jù),可以進(jìn)一步進(jìn)行數(shù)據(jù)擬合,分析公交車站間運(yùn)行的時(shí)間間隔規(guī)律.

      算法1.公共交通分站算法1.輸入:data,Time//data輸入智能卡刷卡數(shù)據(jù),按照線路和POS終端號(hào)進(jìn)行排列,Time為公交智能卡打卡時(shí)間信息;2.Stime=House(Time)×3600+Minute(Time)×60+Second //將打卡的自然時(shí)間轉(zhuǎn)換為可以用于算法的以秒(s)為單位的時(shí)間;3.對(duì)打卡時(shí)間進(jìn)行排序;4.尋找排序后的打卡數(shù)據(jù)中時(shí)間相差最小閾值的兩個(gè)數(shù)據(jù),作為站間分割;5.找出所有的站間后,與實(shí)際設(shè)站數(shù)量進(jìn)行比較,如果大于時(shí)間設(shè)站數(shù)量,回到步驟4重新設(shè)置站間運(yùn)行時(shí)間閾值(一般是增大閾值,減少分站數(shù)量),否則說明分站成功;6.得到站內(nèi)打卡數(shù)據(jù)集并保存;7.end// 算法結(jié)束.

      2.2 線性擬合

      本文通過分站算法,得到公交車相鄰兩站的運(yùn)行時(shí)間,對(duì)相鄰兩站的運(yùn)行時(shí)間和相鄰兩站的運(yùn)行時(shí)間的累計(jì)頻數(shù)做雙對(duì)數(shù)運(yùn)算,再通過機(jī)器學(xué)習(xí)線性回歸[14-16]算法對(duì)其進(jìn)行擬合.

      2.2.1 最佳擬合函數(shù)

      本文用到線性模型是一元一次的方程,所以預(yù)測本文預(yù)測線性函數(shù)如式(1):

      式(1)得到的模型為數(shù)據(jù)預(yù)測的線性回歸模型,x表示的是站與站時(shí)間間隔進(jìn)行對(duì)數(shù)運(yùn)算的結(jié)果;θ0和θ1表示的是兩個(gè)變量建立聯(lián)系的相關(guān)系數(shù).hθ(x)用參數(shù)θ和x預(yù) 測出來的y值.

      對(duì)于式(1),為了找到最佳的 θ0和 θ1,使擬合線的預(yù)測值更加接近y,使用式(2):

      在式(2)中,m表 示訓(xùn)練樣本的個(gè)數(shù);y表示原訓(xùn)練樣本中的y值,也就是標(biāo)準(zhǔn)答案.

      式(2)函數(shù)被稱為平方誤差函數(shù),這個(gè)平方誤差函數(shù)結(jié)果越小,即各個(gè)數(shù)據(jù)點(diǎn)更加接近擬合的函數(shù),這時(shí)找到 θ0和 θ1也是最佳的值.得到的線性回歸方程也是最佳的擬合函數(shù).

      2.2.2 梯度下降法

      對(duì)于損失函數(shù),想要得到最優(yōu)解,找出最佳的 θ0和θ1,這里用到了梯度下降法.梯度下降法,就是沿著梯度下降最快的地方求偏導(dǎo),得到損失函數(shù)最小值時(shí)的 θ0和θ1.所以計(jì)算J(θ)關(guān)于 θT的偏導(dǎo)數(shù),也就得到了向量中每一個(gè) θ 的梯度.即式(3):

      再沿著梯度的反方向更新參數(shù) θ的值,即式(4):

      一直迭代下去,直到收斂某一個(gè)值,就是最終要找的θ值.

      3 實(shí)驗(yàn)結(jié)果和模型評(píng)價(jià)

      3.1 分站算法仿真結(jié)果

      對(duì)于本文提出的分站算法,用了4條線路上的數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn).仿真結(jié)果如圖2所示.

      圖2中,橫坐標(biāo)表示刷卡的時(shí)間間隔,縱坐標(biāo)表示分站的個(gè)數(shù);圖2(a)為南方某城市地區(qū)的某兩條公交路線的仿真結(jié)果,兩條路線的實(shí)際站數(shù)為32和33站,得到的實(shí)驗(yàn)結(jié)果與實(shí)際結(jié)果一致,對(duì)應(yīng)的站與站的時(shí)間間隔最小值分別為60秒和88秒;圖2(b)為北方某城市地區(qū)的某兩條公交路線的仿真結(jié)果;兩條路線的實(shí)際站數(shù)為52和31站,得到的實(shí)驗(yàn)結(jié)果與實(shí)際結(jié)果也一致,對(duì)應(yīng)的站與站的時(shí)間間隔最小值分別為56秒和81秒.由圖可知隨著刷卡時(shí)間間隔的增大,分站的個(gè)數(shù)也相應(yīng)的減少;所以對(duì)于用分站算法找出相應(yīng)的分站個(gè)數(shù),是可行的.如圖2中的特殊標(biāo)記就是得出的分站個(gè)數(shù)和最小的站與站的時(shí)間間隔.

      3.2 擬合結(jié)果

      本文對(duì)南方某城市北方某城市的城際公交刷卡的時(shí)間做了計(jì)算,所有的刷卡時(shí)間都是以秒為單位計(jì)算的,得出來刷卡的時(shí)間間隔,并對(duì)時(shí)間間隔和時(shí)間間隔累計(jì)的頻數(shù)做雙對(duì)數(shù)運(yùn)算,得出了數(shù)據(jù)的散點(diǎn)圖,如圖3所示,該散點(diǎn)圖是符合人類行為動(dòng)力學(xué).

      圖3橫坐標(biāo)表示每站與每站的時(shí)間間隔的對(duì)數(shù)運(yùn)算結(jié)果,縱坐標(biāo)表示是公交車每站與每站時(shí)間間隔的累計(jì)頻數(shù)的對(duì)數(shù)運(yùn)算結(jié)果.由圖3中可以看出數(shù)據(jù)是出現(xiàn)重尾特征,是符合人類行為動(dòng)力學(xué)的,即大部分公交車站間的時(shí)間間隔較短,而有少數(shù)部分公交車站間的時(shí)間間隔較長.這種分布可能與出行的高峰期有關(guān);在出行高峰期,由于乘車人數(shù)多、交通擁擠等狀況,可能出現(xiàn)公交車的站間時(shí)間間隔比較長;在其他時(shí)間,公交車站間的時(shí)間間隔相對(duì)較短.

      3.3 擬合線路

      本文通過線性回歸方程對(duì)公交車的時(shí)間間隔的冪指數(shù)運(yùn)算與累計(jì)的頻數(shù)的散點(diǎn)圖進(jìn)行擬合.如圖4所示.

      圖4是繪制出使用經(jīng)過函數(shù)優(yōu)化得出的最優(yōu)參數(shù)θ值所做預(yù)測的圖形.得到的曲線擬合方程是一元一次方程,即式(5)和式(6):

      3.4 模型評(píng)價(jià)

      對(duì)于本文得到的模型式(5)和式(6)進(jìn)行檢驗(yàn),判定模型是否符合,得到結(jié)果如表5.

      如表5所示,R方為判定系數(shù),一般認(rèn)為需要大于60%,用于判定線性方程擬合優(yōu)度的重要指標(biāo),體現(xiàn)了回歸模型解釋因變量變異的能力,越接近1越好.模型得到的R方分別為0.74和0.83,判斷模型擬合效果良好.顯著性為方差分析的顯著性,值都為0.000<0.01<0.05,表明由自變量時(shí)間間隔和因變量頻數(shù)建立的線性關(guān)系回歸模型具有極顯著的統(tǒng)計(jì)學(xué)意義,所建立的模型符合預(yù)期的規(guī)定.

      圖2 分站算法仿真結(jié)果

      圖3 散點(diǎn)圖

      對(duì)于式(7)和式(8)為原始數(shù)據(jù)得到的公式,N表示的是公交站間運(yùn)行時(shí)間出現(xiàn)的次數(shù),T表示公交站間的運(yùn)行時(shí)間.由于驗(yàn)證了模型式(5)和式(6)的模型擬合效果良好,式(7)和式(8)的模型擬合效果也良好.所以式(7)和式(8)滿足了冪指函數(shù)的判定準(zhǔn)則,由模型可以得出城市公交車站與站之間的運(yùn)行時(shí)間符合冪律分布.

      圖4 擬合圖

      表5 模型結(jié)果驗(yàn)證

      4 結(jié)論

      對(duì)于本文設(shè)計(jì)公交車分站算法,通過刷卡的時(shí)間間隔去找分站的個(gè)數(shù),這使得分站的結(jié)果可靠準(zhǔn)確;并且運(yùn)用2個(gè)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),都能夠準(zhǔn)確的找到分站的個(gè)數(shù)和相應(yīng)的最小的站與站的時(shí)間間隔,該算法具有可行性.

      對(duì)于用分站算法得到的站與站的時(shí)間間隔,實(shí)驗(yàn)結(jié)果證明了城際公交車站與站之間的運(yùn)行時(shí)間符合冪律分布;站與站的時(shí)間間隔符合人類行為動(dòng)力學(xué)的.可以得出,公交車站與站時(shí)間間隔序列具有強(qiáng)記憶和較弱的突發(fā)性.這意味著大多數(shù)站與站的時(shí)間間隔相對(duì)均勻,這個(gè)時(shí)間序列具有一定的記憶性,并且長時(shí)間間隔可能遵循較長的時(shí)間間隔,短時(shí)間間隔可能遵循較短的時(shí)間間隔,有比較弱的突發(fā)性.這與日常時(shí)間表一致,在高峰時(shí)段,有許多乘客在等車,刷卡的人較多,站與站的時(shí)間間隔相對(duì)長點(diǎn).但是在大多數(shù)人呆在家里的夜晚,乘客很少,刷卡的人相對(duì)較少,站與站的時(shí)間間隔相對(duì)較短.

      猜你喜歡
      分站刷卡城際
      佩雷茲獲賽季個(gè)人首個(gè)分站冠軍——2022 F1摩納哥大獎(jiǎng)賽
      世界汽車(2022年6期)2022-07-13 04:25:40
      城際列車
      城際鐵路CTC中自動(dòng)折返功能設(shè)計(jì)與實(shí)現(xiàn)
      萬科城際之光售樓部
      一種城際車載列控系統(tǒng)的結(jié)構(gòu)設(shè)計(jì)
      刷卡
      圓月前的戰(zhàn)役 2015長城潤滑油CTCC 中國房車錦標(biāo)賽第六分站
      車迷(2015年11期)2015-08-23 11:48:28
      成長日記
      出診量指標(biāo)對(duì)院前急救業(yè)務(wù)的指導(dǎo)作用
      刷臉就可以購物
      奧秘(2014年8期)2014-08-30 06:32:04
      鞍山市| 泸西县| 阿拉尔市| 临漳县| 那曲县| 登封市| 蕉岭县| 朝阳市| 松桃| 珲春市| 武城县| 德令哈市| 凌海市| 枣阳市| 楚雄市| 潮安县| 嘉义县| 阜新市| 广南县| 宣武区| 友谊县| 上杭县| 保靖县| 安塞县| 舟曲县| 鹿泉市| 东城区| 金门县| 台州市| 天等县| 淮阳县| 禹州市| 兰考县| 木兰县| 商都县| 阿城市| 新干县| 遂昌县| 道真| 天津市| 西昌市|