• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于深度學(xué)習(xí)的高鐵旅客出行選擇行為分析

      2024-12-04 00:00:00劉睿
      關(guān)鍵詞:深度學(xué)習(xí)

      摘 要:在高鐵大數(shù)據(jù)時(shí)代,基于海量出行數(shù)據(jù)對(duì)旅客選擇行為進(jìn)行精準(zhǔn)建模與預(yù)測(cè),不僅可為產(chǎn)品設(shè)計(jì)提供支持,還可進(jìn)行差異化運(yùn)力調(diào)整,意義重大。本文融合前沿深度學(xué)習(xí)技術(shù),聚焦北京滬線的工作日OD票務(wù)數(shù)據(jù),考量旅客進(jìn)行選擇決策時(shí)各類屬性(到達(dá)-出發(fā)站,到達(dá)-出發(fā)時(shí)間等)的綜合影響,構(gòu)建用戶偏好模型,通過挖掘?qū)傩蚤g的復(fù)雜關(guān)聯(lián)模式,對(duì)乘客選擇行為進(jìn)行準(zhǔn)確歸納與模擬。研究表明,與傳統(tǒng)模型相比,該方法可以顯著提升選擇預(yù)測(cè)精度。

      關(guān)鍵詞:出行選擇行為分析;深度學(xué)習(xí);客票數(shù)據(jù);京滬高鐵

      中圖分類號(hào):U 293" " " " " " 文獻(xiàn)標(biāo)志碼:A

      分析高鐵旅客出行選擇行為對(duì)高鐵產(chǎn)品設(shè)計(jì)和運(yùn)輸組織至關(guān)重要。相關(guān)研究主要有2類,即基于調(diào)查(RP/SP)數(shù)據(jù)的分解模型和基于客票大數(shù)據(jù)的聚合模型[1]。張航等[2]利用京滬高鐵旅客出行RP調(diào)查數(shù)據(jù)構(gòu)建了旅客出行計(jì)劃的MNL模型。陳凱[3]建立高鐵公司收入最大化的分時(shí)定價(jià)模型,并利用遺傳算法進(jìn)行求解,增加了高鐵運(yùn)營(yíng)企業(yè)的客運(yùn)收益。羅鈞韶[4]利用空間匹配算法挖掘車輛出行軌跡,分析乘客出行分布特征等,并將其應(yīng)用于城市交通規(guī)劃。隨著大數(shù)據(jù)處理技術(shù)發(fā)展,馬書紅等[5]將旅客屬性、心理感知和選擇行為進(jìn)行了融合,構(gòu)建了基于出行鏈的混合選擇模型。黃欣等[6]提出旅客行程服務(wù)記錄(PSR)概念,設(shè)計(jì)了鐵路電子客票技術(shù)方案。強(qiáng)麗霞等[7]基于離散選擇框架,建立描述旅客選擇行為的模型,闡明了出行分析的回歸方法。崔愿等[8]發(fā)揮不同數(shù)據(jù)源的比較優(yōu)勢(shì),構(gòu)建覆蓋多運(yùn)輸方式、旅客流總量和過境比例分析模型。

      本文以京滬虹橋高鐵平時(shí)的車票數(shù)據(jù)為基礎(chǔ),將車票數(shù)據(jù)的屬性作為深度學(xué)習(xí)模型的映射特征,研究旅客對(duì)不同類型列車的偏好,為運(yùn)用大數(shù)據(jù)支撐智能決策奠定基礎(chǔ)。

      1 高鐵旅客選擇的影響因素分析

      旅客出行選擇的影響因素主要有2個(gè)方面,即旅客社會(huì)經(jīng)濟(jì)特征和列車特征。有學(xué)者將影響因素分為旅客主因素、列車特性和隨機(jī)因素,研究了鐵路旅客的選擇行為,包括到發(fā)站、到發(fā)站的GDP(萬億元/年)、到發(fā)時(shí)間、車票票價(jià)、乘車時(shí)間和座次。此外,列車運(yùn)力約束和鐵路售票策略也會(huì)對(duì)旅客的實(shí)際選擇行為產(chǎn)生一定影響。從車票數(shù)據(jù)中可以反映出許多信息。1)OD里程。2)座位容量。座位容量與票務(wù)銷售策略有關(guān),列車運(yùn)力越大,選擇乘客的可能性就越大。3)負(fù)載系數(shù)。負(fù)載系數(shù)反映了列車張力和列車運(yùn)力,列車的載客率越高,列車運(yùn)力越緊張,乘客可選擇的自由度越小。4)原點(diǎn)站系數(shù)。起源站的車票較多,車票較容易購買,旅客也有較充裕的上車時(shí)間和較好的列車環(huán)境。5)服務(wù)頻率。服務(wù)頻率是一天內(nèi)相同OD可服務(wù)的列車數(shù)量,服務(wù)頻率越高,乘客的選擇性自由度越高。6)總?cè)舜???側(cè)舜畏从沉寺每蛯?duì)車票的競(jìng)爭(zhēng)程度。乘客總數(shù)越大,競(jìng)爭(zhēng)越激烈,乘客選擇的自由度就越小。

      2 基于深度學(xué)習(xí)的模型概述

      2.1 模型概述

      深度學(xué)習(xí)是一種從數(shù)據(jù)中學(xué)習(xí)表示的新方法,強(qiáng)調(diào)從連續(xù)層學(xué)習(xí),這些連續(xù)層對(duì)應(yīng)越來越有意義的表示。深度學(xué)習(xí)模型的基礎(chǔ)是感知器,感知器接收來自n個(gè)其他感知器Xn的輸入信號(hào)。這些輸入信號(hào)通過加權(quán)連接Wn傳輸。將感知器接收到的輸入值與感知器的偏置bn進(jìn)行比較,再通過激活函數(shù)σ(z)輸出感知器結(jié)果。它一般有3層或3層以上的神經(jīng)網(wǎng)絡(luò),包括一層輸入、一層輸出和幾個(gè)中間層。神經(jīng)網(wǎng)絡(luò)各層的輸出為σ(WnXn+bn)。

      目前,深度學(xué)習(xí)網(wǎng)絡(luò)模型主要分為密集前饋網(wǎng)絡(luò)模型、卷積網(wǎng)絡(luò)模型和遞歸網(wǎng)絡(luò)模型。由于本文中的數(shù)據(jù)沒有考慮時(shí)間,并且數(shù)據(jù)間沒有序列關(guān)系,因此采用前饋網(wǎng)絡(luò)模型。深度學(xué)習(xí)的前饋網(wǎng)絡(luò)模型可以通過一系列簡(jiǎn)單的數(shù)據(jù)轉(zhuǎn)換(層)并由一系列輸入特征映射到目標(biāo)。

      本文采用的深度學(xué)習(xí)前饋網(wǎng)絡(luò)與上層、下層完全連接,產(chǎn)生的信號(hào)向前傳輸,反饋誤差信號(hào)向后傳輸。將計(jì)算出的損失函數(shù)的輸出值作為反饋信號(hào),并對(duì)權(quán)重和偏置進(jìn)行微調(diào)以減小損失值,直到達(dá)到最小損失,從而得到訓(xùn)練好的網(wǎng)絡(luò)。此調(diào)整由優(yōu)化器完成。

      2.2 模型構(gòu)建

      數(shù)據(jù)處理完成后,將京滬高鐵客票數(shù)據(jù)的屬性作為深度學(xué)習(xí)全連網(wǎng)絡(luò)的輸入特征。通過一系列圖層變換,最終映射到選擇不同列車的人數(shù),得出不同列車的乘客選擇概率。建立深度學(xué)習(xí)網(wǎng)絡(luò)模型的步驟如下。

      2.2.1 數(shù)據(jù)處理

      數(shù)值和文本數(shù)據(jù)被處理為適合模型輸入的張量類型。將列車到達(dá)時(shí)間-出發(fā)時(shí)間作為0~1440的分鐘數(shù)進(jìn)行處理,并將距離系數(shù)擴(kuò)大100倍,以方便處理,文本數(shù)據(jù)通過one-hot編碼進(jìn)行處理。在本文中,到達(dá)和出發(fā)站、座位類型以及是否為始發(fā)站均通過one-hot編碼進(jìn)行處理。最后,對(duì)每個(gè)特征進(jìn)行標(biāo)準(zhǔn)化處理,即減去輸入數(shù)據(jù)的每個(gè)特征(輸入矩陣的列)的平均值,將其除以標(biāo)準(zhǔn)偏差,并使特征的平均值為0,標(biāo)準(zhǔn)差為1。

      2.2.2 損失函數(shù)

      在本文中,損失函數(shù)為MAE(平均絕對(duì)誤差),計(jì)算過程如公式(1)所示。

      (1)

      式中:yi為預(yù)測(cè)選定列車旅客數(shù);xi為實(shí)際選定列車旅客數(shù);n為樣本數(shù)據(jù)的大小。

      2.2.3 模型超參數(shù)調(diào)整

      模型超參數(shù)包括網(wǎng)絡(luò)層數(shù)、每個(gè)中間層的節(jié)點(diǎn)數(shù)以及優(yōu)化器。深度學(xué)習(xí)網(wǎng)絡(luò)模型包括輸入層、輸出層和若干中間層。為了獲得最適合模型數(shù)據(jù)的網(wǎng)絡(luò)層,選擇相對(duì)較少的層(3層)。在本文中,數(shù)據(jù)經(jīng)過一次one-hot編碼處理后具有64維。因此,選擇的中間點(diǎn)必須>64,以更好地表示數(shù)據(jù)形成的三維空間,并根據(jù)平均損耗逐步調(diào)整具有不同節(jié)點(diǎn)數(shù)的網(wǎng)絡(luò)層中間層,直至平均損耗無明顯變化,最終實(shí)現(xiàn)中間節(jié)點(diǎn)數(shù)的最優(yōu)組合為256-128-64-1。不同網(wǎng)絡(luò)層的平均最小預(yù)測(cè)損耗值如圖1所示。

      從圖1可以看出,隨著中間網(wǎng)絡(luò)層數(shù)逐漸增加,模型預(yù)測(cè)的平均最小損耗值逐漸變小,而模型的中間網(wǎng)絡(luò)層數(shù)>7,預(yù)測(cè)結(jié)果沒有明顯改善,因此模型最終選擇了7個(gè)中間層的組合。目前,Adam優(yōu)化器、隨機(jī)梯度下降(SGD)和RMSprop算法是深度學(xué)習(xí)模型中的常用算法。根據(jù)不同優(yōu)化器下的損失,選擇最合適的模型數(shù)據(jù)的優(yōu)化器。通常,RMSprop比SGD具有更好的優(yōu)化效果,而Adam獲得的損失值較小,因此本文將Adam作為該模型的優(yōu)化器。本文共有5617個(gè)訓(xùn)練樣本。為了盡快獲得最佳質(zhì)量和偏差并加快訓(xùn)練效率,批量大小選擇128。

      調(diào)試后選擇的深度學(xué)習(xí)模型的超參數(shù)結(jié)構(gòu)如下:一層輸入,7個(gè)中間層,一層輸出;每一層的節(jié)點(diǎn)分別為輸入層-256-128-64-1(輸出層);優(yōu)化器是Adam;激活函數(shù)選擇通常用于機(jī)器學(xué)習(xí)的Relu函數(shù)。深度學(xué)習(xí)開發(fā)環(huán)境為TensorFlow 2.0 PyCharm。

      2.3 參數(shù)設(shè)置

      本文模型中共有5個(gè)參數(shù),包括輸入序列的時(shí)間步長(zhǎng)T、預(yù)測(cè)序列的時(shí)間步長(zhǎng)T'、高鐵站附近的距離閾值D、空間子網(wǎng)的多頭注意機(jī)制數(shù)量K以及時(shí)間子網(wǎng)的隱藏狀態(tài)維數(shù)M。設(shè)T=18,T'=6,即利用過去3h內(nèi)多個(gè)車站的客流量來預(yù)測(cè)一個(gè)高鐵站未來1h內(nèi)的客流量。將一個(gè)高鐵站的距離閾值設(shè)定為1000m,即預(yù)測(cè)某一地點(diǎn)的車站未來客流量時(shí),考慮1000m內(nèi)的高鐵站客流對(duì)該車站未來客流量的影響。多頭注意機(jī)制的數(shù)量K和時(shí)間子網(wǎng)的隱藏狀態(tài)維數(shù)M均設(shè)置為16。

      3 案例分析

      將2019年4月某周二京滬高鐵線路的OD客票數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)。原因是這段時(shí)間列車運(yùn)力充裕,對(duì)乘客限制較少,因此可以盡可能選擇自己滿意的列車。樣本數(shù)為5617。將2019年5月的周二作為預(yù)測(cè)數(shù)據(jù),樣本總數(shù)為5373。為了減少個(gè)人主觀選擇的偶然性帶來的誤差,對(duì)于4月3個(gè)周二(20190410、20190417和20190424),以選擇不同列車的平均乘客數(shù)作為訓(xùn)練數(shù)據(jù)的目標(biāo);對(duì)于五一假期后的3個(gè)周二(20190508、20190515和20190522),選取平均人數(shù)作為預(yù)測(cè)目標(biāo),剔除人數(shù)較少(一般<10)的OD,以減少隨機(jī)誤差。部分原始票證數(shù)據(jù)見表1,數(shù)據(jù)包括日期、列車、始發(fā)站、始發(fā)時(shí)間到達(dá)站、到達(dá)時(shí)間、里數(shù)、座位類型、旅客和票價(jià)等。為了更好地分析旅客出行行為,對(duì)數(shù)據(jù)進(jìn)行擴(kuò)充和優(yōu)化,增加服務(wù)頻次、始發(fā)站以及達(dá)站GDP等數(shù)據(jù),處理后的數(shù)據(jù)見表2。

      由于同一地區(qū)的旅客具有相似的選擇特征,為了更好地進(jìn)行分類,利用模糊聚類分析方法,根據(jù)到發(fā)交通流量、車站節(jié)點(diǎn)的位置、經(jīng)濟(jì)水平以及人口水平,將京滬高鐵線路的站級(jí)劃分為4個(gè)等級(jí)。分類結(jié)果見表3。

      根據(jù)客票數(shù)據(jù),可以從深度學(xué)習(xí)網(wǎng)絡(luò)模型中獲得京滬高鐵不同ODs不同列車的實(shí)際選擇概率,并與擬合結(jié)果進(jìn)行比較,總體擬合效果良好。以北京南-上海虹橋?yàn)槔?,?shí)際乘客選擇與擬合結(jié)果的比較如圖2所示。可以看出,深度學(xué)習(xí)模型在預(yù)測(cè)上海虹橋到北京南的乘客選擇概率方面具有很好的擬合精度。不同節(jié)點(diǎn)的不同OD的選擇精度數(shù)據(jù)見表4。

      由于頭等艙節(jié)點(diǎn)通常是相對(duì)較大的綜合樞紐節(jié)點(diǎn),客流量較多,乘客的出行選擇行為非常復(fù)雜,并涉及大量影響因素。因此,第一級(jí)節(jié)點(diǎn)的OD與其他節(jié)點(diǎn)間的擬合效果不理想。對(duì)于這種類型的OD,在后續(xù)的研究中將進(jìn)一步增加映射特征維度,并增加票數(shù)據(jù)量,以提高擬合精確度。

      4 結(jié)論

      鑒于獨(dú)特的模式識(shí)別能力和數(shù)據(jù)規(guī)則提取能力,深度學(xué)習(xí)模型在大量數(shù)據(jù)的支持下不需要領(lǐng)域知識(shí),越來越多的非參數(shù)機(jī)器被用于新興的行為選擇研究。本文采用深度學(xué)習(xí)網(wǎng)絡(luò)模型對(duì)京滬高鐵市場(chǎng)進(jìn)行了分析,將車票數(shù)據(jù)的屬性作為深度學(xué)習(xí)模型的特征向量,映射出不同類型列車的高鐵旅客選擇概率。結(jié)果表明,深度學(xué)習(xí)模型可以較好地預(yù)測(cè)設(shè)計(jì)指標(biāo)。本文僅對(duì)周二的門票數(shù)據(jù)進(jìn)行分析,數(shù)據(jù)量有限。后續(xù)研究可以通過增加特征向量來提高預(yù)測(cè)精度,并增加數(shù)據(jù)訓(xùn)練量。

      參考文獻(xiàn)

      [1]曹堉,王成,王鑫,等.基于時(shí)空節(jié)點(diǎn)選擇和深度學(xué)習(xí)的城市道路短時(shí)交通流預(yù)測(cè)[J].計(jì)算機(jī)應(yīng)用,2020,40(5):1488-1493.

      [2]張航,趙鵬,喬珂,等.高速鐵路旅客出行時(shí)間選擇Logit模型與分析[J].鐵道運(yùn)輸與經(jīng)濟(jì),2017,39(1):55-60.

      [3]陳凱.基于旅客出行方式選擇的高速鐵路客運(yùn)分時(shí)定價(jià)方案研究[J].鐵路計(jì)算機(jī)應(yīng)用,2022,31(9):57-62.

      [4]羅鈞韶,潘嘉杰.基于GPS數(shù)據(jù)挖掘的出租車出行特征分析[J].交通與運(yùn)輸,2020,33(增刊2):49-54.

      [5]馬書紅,李陽,岳敏.考慮出行鏈的城際旅客換乘選擇行為研究[J].北京交通大學(xué)學(xué)報(bào),2020,44(6):74-81.

      [6]黃欣,張志強(qiáng),單杏花,等.基于電子客票的鐵路旅客智能出行研究[J].中國(guó)鐵路,2019(11):1-6.

      [7]強(qiáng)麗霞.基于客票數(shù)據(jù)的高速鐵路旅客出行選擇行為研究[J].鐵道運(yùn)輸與經(jīng)濟(jì),2018,40(4):52-57.

      [8]崔愿,陳璟,李可等.基于多源數(shù)據(jù)的區(qū)域綜合運(yùn)輸通道旅客出行特征研究[J].公路交通科技,2023,40(1):252-260.

      通信作者:劉睿(1993-),甘肅蘭州人,工程師,研究方向?yàn)殡娏δ茉?、城市軌道交通運(yùn)輸工程。

      電子郵箱:3382300395@qq.com。

      猜你喜歡
      深度學(xué)習(xí)
      從合坐走向合學(xué):淺議新學(xué)習(xí)模式的構(gòu)建
      面向大數(shù)據(jù)遠(yuǎn)程開放實(shí)驗(yàn)平臺(tái)構(gòu)建研究
      基于自動(dòng)智能分類器的圖書館亂架圖書檢測(cè)
      搭建深度學(xué)習(xí)的三級(jí)階梯
      有體驗(yàn)的學(xué)習(xí)才是有意義的學(xué)習(xí)
      電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識(shí)別研究
      利用網(wǎng)絡(luò)技術(shù)促進(jìn)學(xué)生深度學(xué)習(xí)的幾大策略
      考試周刊(2016年94期)2016-12-12 12:15:04
      MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場(chǎng)域建構(gòu)
      大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
      深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
      文安县| 海口市| 南投县| 洮南市| 开江县| 枣庄市| 南皮县| 闸北区| 鄂州市| 松原市| 红桥区| 抚远县| 土默特左旗| 桐城市| 宾阳县| 龙南县| 平乐县| 贺兰县| 沐川县| 拉萨市| 庆云县| 佛冈县| 英德市| 龙陵县| 分宜县| 绵阳市| 永昌县| 沾化县| 屯昌县| 山阴县| 合阳县| 五家渠市| 昭觉县| 平塘县| 若尔盖县| 赤水市| 聊城市| 城固县| 慈溪市| 宜宾市| 旺苍县|