• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于SVM的高原川道型城市通勤者出行方式選擇研究

      2021-12-17 10:44:12王劍坡
      關(guān)鍵詞:擁有率小汽車公共交通

      彭 輝,王劍坡,張 娜

      (長安大學(xué) 運輸工程學(xué)院,陜西 西安 710064)

      0 引 言

      高原川道型城市受地形條件限制,地形狹長,客流走廊集中,城市人口聚集。交通走廊都是單一通道,沒有網(wǎng)絡(luò)概念。走廊客流聚集效應(yīng)相對于平原城市更強,平均出行距離更長,公交分擔(dān)率更高,有利于公共交通線路的布置和運行。通勤出行為主要出行行為,交通結(jié)構(gòu)相對于其它城市較為簡單,居民出行方式選擇較為常規(guī),主要包括步行、公交、小汽車、出租車。針對這類城市典型特征,若能夠有效預(yù)測出行者的出行方式選擇,能為城市交通設(shè)施的規(guī)劃提供參考依據(jù),對交通管理意義重大。到目前為止,涉及到高原川道型城市居民出行方式選擇研究的文獻較為有限,已取得的居民出行方式預(yù)測成果,因方法傳統(tǒng)且假設(shè)條件過多,適用性受到局限。作為解決分類問題的新方法支持向量機(SVM)[1-8],被學(xué)者們廣泛利用,并有效地解決了諸多交通問題。

      在研究居民出行方式選擇上,程龍等[7]利用撫順市居民出行調(diào)查數(shù)據(jù),基于低收入通勤者的出行特征,采用SVM模型進行預(yù)測,得到出行方式選擇的最佳預(yù)測結(jié)果;宋永朝等[9]利用多源數(shù)據(jù),基于最短路徑算法以及公共交通選擇算法,對通勤高峰期居民的出行方式進行預(yù)測;梁泉等[10]針對公交通勤出行個體,借助圖譜可視化表達優(yōu)勢,分析了公交通勤個體出行特征。然而,針對具有典型特殊性的高原川道型城市通勤者的出行特征方面,目前還沒有利用新方法對其進行研究。筆者在借鑒各學(xué)者研究實踐的基礎(chǔ)上,建立SVM模型系統(tǒng)分析高原川道型城市通勤者出行方式選擇行為,探討該模型對出行方式選擇行為預(yù)測的精準(zhǔn)性和適用性,同時為具有類似特征的城市出行者的交通選擇行為提供一定的參考。

      1 數(shù)據(jù)來源與描述統(tǒng)計

      居民出行調(diào)查能夠全面、系統(tǒng)地把握城市交通現(xiàn)狀,了解居民出行需求。筆者數(shù)據(jù)來源為2016年5月9—29日青海省西寧市居民出行調(diào)查,采用最優(yōu)分配分層等距抽樣法,共發(fā)放問卷10 186份,實際調(diào)查人數(shù)30 558人,其中有效問卷9 029份,調(diào)查有效人數(shù)為27 086人,合格率為89%。從問卷可以得出西寧市的居民出行目的中,上班、上學(xué)、回程出行比例較高,約占了居民出行總量的78.70%。出行方式主要是步行、公交、出租車和小汽車,占出行比重達92.41%,各交通方式分擔(dān)率如表1。筆者主要針對小汽車與公交車2種交通出行方式進行識別,小汽車為私人交通,公交車為公共交通,根據(jù)出租車的出行特征,將其與小汽車同作為私人交通類。根據(jù)以上條件,筆者只研究通勤者選擇私人交通和公共交通的出行記錄,筆者所指私人交通為小汽車和出租車,公共交通為公交車,共篩選出29 960次出行樣本。調(diào)查內(nèi)容主要分為3部分內(nèi)容:① 家庭特征;②個人特征;③出行特征,具體調(diào)查情況見表2。

      表1 西寧市各交通方式分擔(dān)率Table 1 Sharing rate of traffic modes in Xi’ning city

      表2 調(diào)查統(tǒng)計表Table 2 Survey statistics

      調(diào)查數(shù)據(jù)涉及參數(shù)包括個人及家庭社會經(jīng)濟屬性,主要9項變量。為了識別并提取出行方式選擇的決策變量,確保有效性模型的構(gòu)建與分析,對變量間關(guān)系進行顯著性檢驗。在表2中各變量均是離散變量,故采用卡方檢驗(pearson’s chi-squared)對各變量與出行方式選擇之間進行顯著性檢驗。由檢驗結(jié)果可知,除描述職業(yè)類別的變量外,出行方式的選擇與其余各變量都具有顯著相關(guān)性。鑒于此,除職業(yè)變量之外,建模時將其他8項變量作為決策變量。

      2 研究方法

      2.1 支持向量機SVM基本原理

      支持向量機 (support vector machine, SVM)是VAPNIK教授等在1990年代提出的基于統(tǒng)計學(xué)習(xí)理論的機器學(xué)習(xí)算法[11]。SVM不僅能解決非線性回歸問題,還能解決分類問題。對分類問題,假如數(shù)據(jù)不能線性可分,可以將低維線性不可分?jǐn)?shù)據(jù)映射到高維后,變得線性可分,并找到無數(shù)個超平面將數(shù)據(jù)分開,從其中找到最好的一個。對于SVM就是希望超平面與最近的數(shù)據(jù)點之間的距離最大化,不僅要將樣本數(shù)據(jù)正確分類,對離超平面近的點也要有足夠大的確信度將其分開,這樣的超平面泛化能力強,對未知數(shù)據(jù)具有更好的分類預(yù)測能力。

      SVM的最終優(yōu)化問題轉(zhuǎn)化為了凸二次規(guī)劃求解問題,對于線性可分的訓(xùn)練樣本集T={(x1,y1),(x2,y2), …, (xi,yi), …, (xm,ym)},其中xi為n維特征向量,yi∈{-1,1},i=1,2,3,4,…,m。求解樣本集的最優(yōu)問題,如式(1):

      (1)

      s.t.yi((w·xi)+b)≥1 (i=1,2,3,…,m)

      式中:w為所求超平面的法向量;b為常數(shù)項;xi為第i個樣本的特征向量;yi為xi所屬的類。

      當(dāng)數(shù)據(jù)在低維空間線性不可分時,可以通過引入核函數(shù)K(xi,xj)將數(shù)據(jù)從低維空間映射到高維空間,實現(xiàn)對數(shù)據(jù)的線性可分。通過引入非負(fù)松弛變量εi≥0和懲罰因子C作為綜合權(quán)重來處理,則式(1)的優(yōu)化問題將變?yōu)槭?2):

      (2)

      s.t.yi[(w·xi)+b]≥1-εi(εi≥0,1,2,3,…,m)

      式中:εi為非負(fù)松弛變量;C為懲罰因子。

      通過引入拉格朗日系數(shù)αi,并將其轉(zhuǎn)化為對偶問題,如式(3):

      (3)

      用二次規(guī)劃法對此問題進行求解,得到分類超平面。

      2.2 建模流程

      構(gòu)建基于SVM的高原川道型城市通勤者出行方式選擇預(yù)測,建模流程如下:

      1)通過篩選并預(yù)處理8項決策變量的樣本數(shù)據(jù),得到建模所需數(shù)據(jù)集,分為訓(xùn)練樣本集和測試樣本集;

      2)通過學(xué)習(xí)訓(xùn)練樣本集數(shù)據(jù),確定帶有合適懲罰參數(shù)的徑向基核函數(shù)(RBF)作為SVM核函數(shù)。由文獻[12]可知,采用多項式核函數(shù)、RBF構(gòu)建的SVM模型對居民出行方式預(yù)測精度較高,優(yōu)先選擇RBF核函數(shù),其次是多項式核函數(shù)。RBF核函數(shù)如式(4):

      (4)

      3)對優(yōu)化問題進行求解,利用網(wǎng)格搜索法和5折交叉驗證對參數(shù)進行尋優(yōu)。5折交叉驗證是用于評價模型的精度,將訓(xùn)練集劃分為5組,將4組子集用于訓(xùn)練,其余1組子集用于驗證,將每個子集數(shù)據(jù)分別作為一次驗證集,這樣會得到5個模型。這5個模型最終的驗證集的分類準(zhǔn)確率的平均值被作為此5折交叉驗證下分類器的性能指標(biāo)。網(wǎng)格搜索算法用于對懲罰參數(shù)C和核函數(shù)參數(shù)r進行尋優(yōu),該算法屬于啟發(fā)式算法;

      4)通過尋找最優(yōu)解構(gòu)建的最優(yōu)分類超平面,利用測試樣本數(shù)據(jù)集預(yù)測其他通勤者的出行方式選擇結(jié)果。

      3 分析與預(yù)測

      3.1 SVM的建模

      基于python的sklearn庫實現(xiàn)對SVM模型參數(shù)的標(biāo)定。按4∶1的比例將數(shù)據(jù)隨機分為訓(xùn)練集(含驗證集)和測試集,采用訓(xùn)練集對模型參數(shù)進行標(biāo)定,尋找最優(yōu)參數(shù)。利用5折交叉驗證和網(wǎng)格搜索法對參數(shù)(C,r)進行優(yōu)化,當(dāng)訓(xùn)練集驗證的分類精度最高時,C=2,r=1。此時,訓(xùn)練集的分類準(zhǔn)確率為81.45%,這樣就可以訓(xùn)練出一個學(xué)習(xí)過程模型,該模型將用于對測試集數(shù)據(jù)進行預(yù)測。

      為了減少數(shù)據(jù)隨機分配產(chǎn)生的誤差,筆者選擇了不同的隨機因子對數(shù)據(jù)進行劃分,共做8次試驗,以減少數(shù)據(jù)隨機分配產(chǎn)生的誤差。表3總結(jié)了8次試驗的分類精度。結(jié)果表明,構(gòu)建的SVM分類器在訓(xùn)練集上的分類精度(85.61%)高于測試集上的分類精度(81.81%)。在樣本較大的情況下,分類器的分類準(zhǔn)確率較高,公共交通樣本數(shù)為18 309,私人交通樣本數(shù)為11 652,在訓(xùn)練集與測試集中,公共交通的平均分類準(zhǔn)確率比私人交通的平均分類準(zhǔn)確率分別高出了16.88%和18.93%。說明對于大樣本數(shù)據(jù),SVM有很好的分類能力。

      表3 SVM的分類準(zhǔn)確率Table 3 Classification accuracy of support vector machine %

      3.2 BL模型預(yù)測與SVM對比

      對比SVM和BL (Binary logistic)模型,以預(yù)測高原川道型城市通勤者出行方式的選擇?;谙嗤瑪?shù)據(jù),BL模型同樣進行8次試驗,每次實驗方式和SVM一致,結(jié)果如表4。

      表4 BL模型的分類準(zhǔn)確性Table 4 Classification accuracy of BL model %

      筆者選取分出行方式的分類預(yù)測準(zhǔn)確率、總體預(yù)測準(zhǔn)確率和平均絕對偏差3個指標(biāo)對2種模型進行比較。分出行方式的分類預(yù)測準(zhǔn)確率,是指某一種交通方式的預(yù)測準(zhǔn)確率的樣本數(shù)量占該方式的總樣本數(shù)的比值。總體分類預(yù)測準(zhǔn)確率,是指所有交通方式的預(yù)測準(zhǔn)確的樣本數(shù)占總樣本量的比例。分方式的分類預(yù)測準(zhǔn)確率變化與總體預(yù)測準(zhǔn)確率變化如圖1。

      圖1 2個模型分方式預(yù)測準(zhǔn)確率變化Fig. 1 Change of prediction accuracy of two models in different ways

      從表3 、表4 可知,私人交通方式預(yù)測中,SVM的預(yù)測準(zhǔn)確率比BL模型的預(yù)測準(zhǔn)確率高出8.08%,公共交通高出了2.76%。SVM的總體分類準(zhǔn)確率(81.81%)高于BL模型的預(yù)測準(zhǔn)確率(76.99%)。

      用預(yù)測值與實際值差值占實際值百分比的算術(shù)平均值,來表征平均絕對百分比誤差,如式(5):

      (5)

      式中:Ti為實際選擇第i種交通方式的樣本數(shù);Fi為第i種交通方式預(yù)測的樣本數(shù)。

      各指標(biāo)比較結(jié)果如表5,SVM預(yù)測的平均絕對百分比誤差均小于BL模型??傮w上,8次試驗的SVM預(yù)測的平均絕對百分比誤差小于BL模型。

      表5 平均絕對百分比誤差Table 5 Average absolute percentage error %

      通過分方式的分類預(yù)測準(zhǔn)確率、總體預(yù)測準(zhǔn)確率、平均絕對離差對比可以看出,針對高原川道型城市的通勤者出行方式選擇預(yù)測,SVM比BL模型有更好的預(yù)測能力,SVM在處理數(shù)據(jù)分類問題方面具有更高的能力,在出行方式選擇預(yù)測上有較好的適用性。

      3.3 一維敏感性分析及效果預(yù)測

      一維敏感性分析是指當(dāng)交通方式的某一屬性值改變一個單位,而其他屬性值保持不變時,出行者選擇交通方式i前后概率的變化[13],筆者基于小汽車擁有量,公交卡擁有率2個屬性對高原川道型城市居民出行方式進行敏感性分析,結(jié)果如下:

      1)提高小汽車擁有率

      將沒有小汽車的居民全部提高為擁有1輛小汽車,小汽車擁有率提高后各出行方式分擔(dān)率預(yù)測結(jié)果如表6。小汽車擁有率提高會増加私人小汽車出行方式的選擇概率,小汽車的分擔(dān)率從30.31%提高至32.53%。公交的分擔(dān)率有所下降,下降了2.22%。

      表6 小汽車擁有率提高后方式分擔(dān)率預(yù)測結(jié)果Table 6 Prediction results of mode sharing rate after the improvement of car ownership rate %

      2)提高公交卡擁有率

      表7顯示了公交卡持有量增加后,各出行方式的分擔(dān)率預(yù)測結(jié)果。隨著公交卡擁有率的提高,選擇公共交通的可能性也會增加,公共交通的比例提高了2.99%。由于私人交通包括小汽車出行和出租車出行,這部分客流最有可能是來源于出租車客流。

      表7 公交卡擁有率提高后方式分擔(dān)率預(yù)測結(jié)果Table 7 Prediction results of mode sharing rate after the increase of bus card ownership rate %

      4 結(jié) 語

      基于高原川道型城市西寧市居民出行調(diào)查數(shù)據(jù),發(fā)現(xiàn)高原川道型城市的通勤者出行方式較為單一,受地理條件與天氣因素影響,通勤者的出行方式主要為步行、公交、小汽車、出租車共4種。筆者主要選擇具有機動性的交通工具進行預(yù)測,基于所調(diào)查的屬性特征訓(xùn)練了SVM分類模型,將其用于預(yù)測通勤者的出行方式選擇,通過與BL模型的預(yù)測能力比較,私人交通方式預(yù)測中,SVM的預(yù)測準(zhǔn)確率比BL模型的預(yù)測準(zhǔn)確率高出8.08%,公共交通則高出了2.76%。SVM的總體分類準(zhǔn)確率比BL模型的預(yù)測準(zhǔn)確率高出4.82%。在一維敏感性分析上,當(dāng)提高小汽車擁有率后,私人交通的分擔(dān)率提高了2.22%,當(dāng)提高公交卡擁有率后,公共交通的分擔(dān)率提高了2.99%。以上表明SVM在分類數(shù)據(jù)處理方面具有良好的分類能力,在出行方式選擇預(yù)測中具有更好的適應(yīng)性,研究結(jié)論將為高原川道型城市的居民出行行為分析提供新思路。但是,筆者研究僅考慮了2類主要的機動性交通工具出行方式,僅分析了SVM與BL模型預(yù)測能力的對比,以后將進一步考慮SVM與Nested Logit等的預(yù)測能力的對比。

      猜你喜歡
      擁有率小汽車公共交通
      可愛的小汽車
      幼兒100(2023年33期)2023-09-22 07:17:44
      非裔在美住房擁有率低于十年前
      小汽車
      幼兒100(2021年12期)2021-04-25 12:49:52
      《城市公共交通》雜志社簡介
      拼一拼
      啟蒙(3-7歲)(2020年6期)2020-06-02 07:53:42
      公路的魅力
      基于計算實驗的公共交通需求預(yù)測方法
      公共交通一卡通TSM平臺研究
      交通運輸部發(fā)布通知推進城市公共交通智能化應(yīng)用工程建設(shè)事項
      質(zhì)疑中國九成家庭有住房
      中國工人(2012年7期)2012-08-15 00:42:21
      福贡县| 理塘县| 梅州市| 石棉县| 吉林市| 汝阳县| 喀什市| 博野县| 伊川县| 仙游县| 祁门县| 凌云县| 盐津县| 隆德县| 平安县| 阿拉尔市| 景宁| 额敏县| 田东县| 东明县| 宣城市| 枞阳县| 常山县| 普陀区| 商都县| 抚顺县| 昌江| 六盘水市| 衡南县| 新安县| 富顺县| 介休市| 谢通门县| 华容县| 乌什县| 集安市| 陕西省| 乐亭县| 冷水江市| 吴桥县| 广州市|