林鵬飛, 翁劍成, 胡 松, 梁 泉, 尹寶才
(北京工業(yè)大學(xué) 交通工程北京市重點(diǎn)實(shí)驗(yàn)室, 北京 100124)
共享單車作為一種新型低碳、綠色環(huán)保的出行方式,以其無樁和支持移動(dòng)支付的便捷性,解決了以政府為主導(dǎo)的公共自行車的缺陷,自2016年開始得到了迅速發(fā)展,目前共享單車已進(jìn)入國內(nèi)160多個(gè)城市. 共享單車有效地解決了出行最后1 km問題,成為人們短途出行的首選出行方式,較好地補(bǔ)充和完善了現(xiàn)有的公共交通系統(tǒng). 伴隨著其快速發(fā)展,共享單車日常運(yùn)營管理也顯現(xiàn)出一些問題,如違規(guī)停放占用道路資源、停放點(diǎn)規(guī)劃不完善等. 因此研究共享單車的需求影響因素對確定共享單車的投放規(guī)模和日常運(yùn)營調(diào)度具有重要意義.
國內(nèi)外學(xué)者對居民選擇自行車出行的影響因素及機(jī)理進(jìn)行了深入研究. 楊晨等[1]分析了個(gè)體特征、出行信息和交通方式服務(wù)水平主觀感知等3類影響因素對自行車交通方式選擇的影響權(quán)重和作用機(jī)理. 陳景旭等[2]以軌道交通站點(diǎn)為中心,考慮用地性質(zhì)、居住人口和自行車方式分擔(dān)率等因素提出分層分級(jí)布設(shè)公共自行車租賃點(diǎn)的布局方法. 李志斌等[3]根據(jù)南京市居民通勤出行問卷調(diào)查,基于出行態(tài)度對自行車通勤出行市場進(jìn)行劃分. 曹雪檸等[4]基于問卷調(diào)查數(shù)據(jù),從出行個(gè)體和土地利用2個(gè)角度研究引起出行者選擇公共自行車換乘軌道交通概率變化的影響因素. 舒詩楠等[5]基于公共自行車刷卡數(shù)據(jù)與問卷調(diào)查數(shù)據(jù)測算了公共自行車網(wǎng)點(diǎn)的吸引影響范圍,提出了影響網(wǎng)點(diǎn)規(guī)模的關(guān)鍵因素. Campbell 等[6]利用問卷調(diào)查數(shù)據(jù)研究居民的個(gè)人社會(huì)經(jīng)濟(jì)屬性、騎行距離以及天氣對選擇自行車出行的影響. Noland等[7]基于訂單數(shù)據(jù)研究紐約市公共自行車需求與人口就業(yè)分布、區(qū)域的土地利用以及公共交通可達(dá)性的關(guān)系. 以上研究主要針對固定站點(diǎn)的公共自行車,而目前針對共享單車需求的影響模型研究較少. Xu等[8]利用長短時(shí)記憶網(wǎng)絡(luò)方法對南京市的共享單車時(shí)空分布進(jìn)行短時(shí)預(yù)測. 普通最小二乘回歸(Ordinary Least Square OLS)是研究出行需求與建成環(huán)境之間復(fù)雜關(guān)系的常用方法之一[9-11],但該方法忽略了空間非平穩(wěn)性,即沒有考慮相鄰區(qū)域的建成環(huán)境對本區(qū)域的出行需求的影響. Fotheringham[12]提出了地理加權(quán)回歸模型(Geographical Weighted Regression GWR)可有效的解釋自變量的空間非平穩(wěn)性和空間依賴. Qian等[13]利用地理加權(quán)回歸模型研究交通小區(qū)出租車出行需求影響因素,考慮的變量包括道路密度、自行車道密度、公交和地鐵可達(dá)性等. Tu等[14]利用地理加權(quán)回歸探究交通小區(qū)內(nèi)出租車、地面公交、地鐵3種出行方式的需求與社會(huì)經(jīng)濟(jì)、用地屬性以及交通設(shè)施因素之間的關(guān)聯(lián). 馬曉磊等[15]在考慮空間相關(guān)性的基礎(chǔ)上,基于地理加權(quán)回歸模型探究軌道交通站點(diǎn)進(jìn)出站客流規(guī)模與站點(diǎn)周邊的用地屬性之間的關(guān)系. 因此本研究使用GWR模型構(gòu)建共享單車需求影響模型.
本研究結(jié)合北京市的共享單車訂單數(shù)據(jù)、POI數(shù)據(jù)以及公共交通刷卡數(shù)據(jù)等多源數(shù)據(jù),構(gòu)建影響共享單車需求的影響因素集,基于地理加權(quán)模型研究各因素對共享單車需求影響程度的空間非穩(wěn)態(tài)性,結(jié)合回歸系數(shù)的可視化結(jié)果,深入分析各影響因素對交通小區(qū)內(nèi)共享單車需求的影響. 本研究可為共享單車的規(guī)模確定、停放點(diǎn)規(guī)劃以及日常的再平衡調(diào)度提供參考依據(jù).
共享單車訂單數(shù)據(jù)由摩拜單車(https:∥mobike.com/global/)提供,摩拜單車已成為全球最大的智能共享單車運(yùn)營平臺(tái),日訂單量超過3 000萬. 數(shù)據(jù)集包含北京市五環(huán)以內(nèi)2017年5月的5個(gè)工作日的數(shù)據(jù),約100萬條記錄. 共享單車數(shù)據(jù)集主要包括用戶ID(已脫敏)、車輛ID、用戶的騎行起終點(diǎn)位置、開始和結(jié)束時(shí)間等字段. 圖1表明共享單車需求的空間分布具有明顯的空間集聚特征,熱點(diǎn)區(qū)域主要分布在北京市四環(huán)以內(nèi),中關(guān)村、望京、舊宮、豐臺(tái)科技園等區(qū)域需求旺盛;部分區(qū)域需求接近于0,主要原因是受管理部門的政策要求,部分區(qū)域如天安門廣場區(qū)域、長安街沿線區(qū)域和市內(nèi)部分公園、景區(qū)內(nèi)禁止使用共享單車.
空間地理數(shù)據(jù)主要包括交通小區(qū)空間矢量數(shù)據(jù)和建成環(huán)境數(shù)據(jù). 北京市交通小區(qū)矢量數(shù)據(jù)由北京市規(guī)劃部門提供,五環(huán)以內(nèi)主要包括644個(gè)交通小區(qū). 本研究使用各類興趣點(diǎn)(Point of Interest POI)的密度來表征每個(gè)交通小區(qū)的建成環(huán)境. 本研究使用的POI數(shù)據(jù)采集于高德地圖,每條記錄包括POI名稱、POI的類型以及經(jīng)緯度信息,涵蓋居住用地、工作用地、休閑娛樂、購物服務(wù)以及科教服務(wù)等6種類型. 各類POI的具體屬性如表1所示.
表1 各類POI的屬性
共享單車有效解決了公共交通出行最后1 km問題,相關(guān)研究表明:公交和地鐵站對該區(qū)域內(nèi)自行車的使用具有促進(jìn)作用[2,5,11]. 為了探究共享單車和公共交通出行的耦合關(guān)系,研究引入同期的公交IC卡刷卡數(shù)據(jù)和軌道交通AFC數(shù)據(jù). 地面公交IC卡刷卡數(shù)據(jù)字段主要包括卡號(hào)、乘客上下車時(shí)間、站點(diǎn)以及所乘坐的線路信息等. 軌道交通AFC數(shù)據(jù)主要包括卡號(hào)、乘客進(jìn)出站的時(shí)間、站點(diǎn)及線路等信息. 對刷卡數(shù)據(jù)進(jìn)行預(yù)處理,刪除刷卡時(shí)間間隔小于2 min,大于3 h的數(shù)據(jù),最終得到每天約1 300萬公交IC卡刷卡記錄和525萬條地鐵AFC刷卡記錄.
首先,將不同坐標(biāo)系的數(shù)據(jù)集進(jìn)行坐標(biāo)轉(zhuǎn)換,統(tǒng)一轉(zhuǎn)換為WGS84坐標(biāo)系;其次,將公交、軌道POI中的經(jīng)緯度與公交軌道刷卡數(shù)據(jù)關(guān)聯(lián),從而得到每位乘客上下車的經(jīng)緯度信息;然后,將共享單車訂單數(shù)據(jù)、POI數(shù)據(jù)通過ArcGIS軟件建立空間數(shù)據(jù)庫,建立相應(yīng)的點(diǎn)層;最后,利用ArcGIS軟件中的空間關(guān)聯(lián)工具箱,分別將不同的點(diǎn)層與交通小區(qū)進(jìn)行空間關(guān)聯(lián),獲得每個(gè)交通小區(qū)共享單車訂單量、公交和地鐵登降量和POI的分布情況.
傳統(tǒng)的線性回歸屬于全局模型,常用于解釋自變量與因變量的相互依存關(guān)系,基于OLS方法對參數(shù)進(jìn)行估計(jì),基本形式如式(1):
(1)
式中,yi為在觀測點(diǎn)i的因變量值;xik為在觀測點(diǎn)i的第k個(gè)自變量;β0為模型的截距;βk為k個(gè)自變量的回歸系數(shù);εi為隨機(jī)誤差,服從N(0,σ2)分布.
OLS方法獲得模型回歸參數(shù)反映了整個(gè)區(qū)域的平均水平,但是無法表征建成環(huán)境和公交登降量的空間變化對共享單車需求的影響. 由地理學(xué)第一定律可知,地球上的任意事物都是與其他事物相關(guān)的,且相近的事物關(guān)聯(lián)更緊密[16]. GWR模型是對傳統(tǒng)線性回歸模型的擴(kuò)展,即在回歸參數(shù)中加入了地理位置的距離權(quán)重函數(shù)[12]. 通過加權(quán)最小二乘方法在局部范圍內(nèi)實(shí)現(xiàn)對觀測點(diǎn)逐個(gè)參數(shù)估計(jì),空間位置不斷變化使得模型參數(shù)的估計(jì)值在回歸的過程中也不斷變化. 權(quán)重一般與距離成反比,即距離觀測點(diǎn)越近的觀測值權(quán)重越大,反之越小. GWR模型直觀地表征因地理位置不同而導(dǎo)致的變量之間關(guān)系或結(jié)構(gòu)的差異,即空間非平穩(wěn)性(Spatial Nonstationarity). GWR模型的基本形式如式(2):
(2)
參數(shù)估計(jì)用矩陣形式表示為式(3):
βk(ui,vi)=[XTW(ui,vi)X]-1XTW(ui,vi)Y
(3)
本研究選擇居住用地、辦公用地、休閑娛樂、購物服務(wù)、風(fēng)景名勝、科教服務(wù)、地鐵站點(diǎn)密度、公交站點(diǎn)密度、公交登降量以及地鐵登降量9個(gè)變量作為影響共享單車需求的影響因素. 對每個(gè)交通小區(qū)中的各個(gè)變量進(jìn)行統(tǒng)計(jì),統(tǒng)計(jì)結(jié)果如表2所示.
表2 模型變量的描述性統(tǒng)計(jì)
對變量進(jìn)行空間自相關(guān)檢驗(yàn),以確定變量是否存在空間自相關(guān)性. 空間自相關(guān)Moran’s I指數(shù)如式(4):
(4)
表2中列出每個(gè)變量的Moran’s I指數(shù)計(jì)算結(jié)果,每個(gè)變量的Moran’s I指數(shù)均>0,同時(shí)p值均小于顯著水平α=0.05,則所有變量均具有集聚特征即空間自相關(guān)性. 為了更直觀地反映變量的空間集聚特征,圖2列出了典型變量的空間分布,由于篇幅所限,僅列出居住用地、就業(yè)用地、公交登降量和地鐵登降量的空間分布,可看出變量的分布具有明顯的空間集聚特征和異質(zhì)性.
圖2 典型變量的空間分布圖
在構(gòu)建OLS模型和GWR模型之前,需要對變量進(jìn)行篩選,避免變量之間存在多重共線性. 變量之間的Pearson相關(guān)系數(shù)如圖3所示. 公交站點(diǎn)密度和公交登降量的相關(guān)系數(shù)為0.51,地鐵站點(diǎn)密度和地鐵登降量的相關(guān)系數(shù)為0.83,具有相關(guān)性,因此去除公交站點(diǎn)密度和地鐵站點(diǎn)密度2個(gè)變量,選擇居住用地、就業(yè)用地、風(fēng)景名勝、休閑娛樂、購物服務(wù)、公交登降量與地鐵登降量7個(gè)變量構(gòu)建回歸模型.
圖3 變量相關(guān)性分布
選擇模型的擬合優(yōu)度(R2)和赤池信息準(zhǔn)則(AIC)對模型進(jìn)行檢驗(yàn),R2越大,AIC越小表明模型的結(jié)果越顯著. 表3為OLS模型的參數(shù)回歸結(jié)果,在7個(gè)影響因素中只有居住用地、科教服務(wù)、地鐵登降量3個(gè)變量是顯著的,同時(shí)這3個(gè)因素對共享單車需求的影響是正相關(guān)的. OLS回歸模型結(jié)果中R2只有0.16,說明僅有16%的自變量得到解釋. 同時(shí)計(jì)算每個(gè)變量的方差膨脹因子(Variance Inflation Factor,VIF),每個(gè)變量的VIF值均<2,表明各個(gè)變量之間沒有多重共線性.
表3 OLS模型參數(shù)回歸結(jié)果
注:帶*的變量在顯著水平為0.05的條件下顯著
GWR模型準(zhǔn)確捕獲共享單車需求影響因素的空間異質(zhì)性,各個(gè)因素對共享單車需求的影響程度的最小值、25%位分位數(shù)、中位數(shù)、75%位分位數(shù)、最大值進(jìn)行統(tǒng)計(jì),統(tǒng)計(jì)結(jié)果如表4所示. 每個(gè)變量的回歸參數(shù)有正有負(fù),即各個(gè)因素對出在不同的區(qū)域各變量對共享單車需求的影響有促進(jìn)和抑制作用. 由各個(gè)變量的回歸系數(shù)的中位數(shù)可知,居住用地、科教服務(wù)、公交登降量、地鐵登降量4個(gè)變量對出行需求的影響是顯著正相關(guān)的,而休閑娛樂、購物服務(wù)兩個(gè)變量雖然也是正相關(guān)但影響程度相對較低,辦公用地和風(fēng)景名勝2個(gè)變量對出行需求的影響是負(fù)相關(guān).
GWR模型的R2比OLS模型提高了0.48,表明GWR模型更好地揭示了自變量與因變量之間的關(guān)系. GWR模型的AIC值比OLS模型的降低了347.44,表明GWR模型對數(shù)據(jù)更敏感,模型擬合的效果更好. 所以在描述自變量空間非穩(wěn)態(tài)對因變量的影響程度時(shí),GWR模型比OLS模型的解釋能力更強(qiáng).
表4 GWR模型的參數(shù)回歸結(jié)果
對每個(gè)變量的回歸系數(shù)采用Jenks自然間斷點(diǎn)法分類,分類結(jié)果的可視化如圖4所示,可看出各因素對共享單車需求的影響程度會(huì)隨著空間位置變化而變化. 居住用地變量是對共享單車需求的最重要影響因素,共享單車在工作日主要作為通勤方式之一,絕大部分區(qū)域居住用地對共享單車需求的影響為正相關(guān)關(guān)系,在南二環(huán)至南五環(huán)之間的區(qū)域集中了潘家園、方莊、宋家莊以及舊宮等大型居住區(qū),工作日通勤出行需求旺盛,導(dǎo)致共享單車使用的增長. 在城市中心區(qū)域,辦公用地變量對共享單車需求的影響是負(fù)相關(guān)或者是影響不顯著,在中關(guān)村區(qū)域、望京、亦莊經(jīng)濟(jì)技術(shù)開發(fā)區(qū)、豐臺(tái)科技園等區(qū)域,辦公用地變量對共享單車需求的影響是正相關(guān).
科教服務(wù)因素與共享單車需求的影響是正相關(guān),在海淀區(qū)高校和科研院所集中的區(qū)域,共享單車需求旺盛. 在工作日期間,休閑娛樂對共享單車需求的影響為正相關(guān),但相對微弱. 在城市外圍區(qū)域,購物服務(wù)變量對共享單車需求的影響為正相關(guān)關(guān)系,而在中心城區(qū)商圈周邊的公共交通系統(tǒng)發(fā)達(dá),同時(shí)人們以購物為目的的出行更傾向使用機(jī)動(dòng)化出行工具,長安街沿線的西單、王府井商圈區(qū)域限制使用共享單車,從而導(dǎo)致購物服務(wù)變量在中心城區(qū)商圈的影響程度較微弱. 風(fēng)景名勝因素對共享單車需求的影響呈負(fù)相關(guān)關(guān)系,主要原因是北京市部分景區(qū)、公園禁止共享單車駛?cè)?,同時(shí)市區(qū)內(nèi)的景區(qū)周邊公共交通的可達(dá)性較高. 在城市外圍區(qū)域,公交登降量與地鐵登降量2個(gè)變量與共享單車需求為正相關(guān)關(guān)系,在大興區(qū)、豐臺(tái)科技園等區(qū)域,公共交通出行需求旺盛,而共享單車解決了與公共交通系統(tǒng)末端“最后1 km”的銜接問題,從而促進(jìn)了共享單車的使用.
掌握共享單車需求的影響因素對于共享單車規(guī)模的確定以及運(yùn)營調(diào)度具有重要意義. 本研究采用北京市共享單車出行數(shù)據(jù)、公共交通刷卡數(shù)據(jù)以及空間地理數(shù)據(jù)等多源數(shù)據(jù)為基礎(chǔ),構(gòu)建影響共享單車出行的影響因素集,建立基于地理加權(quán)回歸模型的共享單車影響模型,探究各因素與騎行需求的關(guān)系,解釋共享單車需求空間分異的影響因素. 結(jié)果表明相比OLS模型,GWR模型能更好地解釋建成環(huán)境因素以及公共交通因素對共享單車需求影響程度的空間非平穩(wěn)性. 在工作日,居住用地、科教服務(wù)、公交登降量和軌道登降量4個(gè)變量對共享單車的使用具有明顯的促進(jìn)作用,而辦公用地和風(fēng)景名勝2個(gè)變量具有抑制作用,休閑娛樂和購物服務(wù)2個(gè)變量影響相對微弱. 未來將不斷完善影響因素集如考慮天氣因素,對共享單車需求的影響因素進(jìn)行更深入的建模分析.
致謝
感謝摩拜單車和北京市交通運(yùn)行監(jiān)測調(diào)度中心對本研究提供的數(shù)據(jù)支持.
圖4 典型變量對需求的影響