張若菡,何 穎
(1.湖南師范大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,湖南 長沙 410006;2.徐州工程學(xué)院 經(jīng)濟(jì)學(xué)院,江蘇 徐州 221008)
發(fā)端于傳統(tǒng)社會的共享經(jīng)濟(jì)作為一個新鮮事物在我們生活中的作用正日益凸顯。而享譽(yù)“中國新四大發(fā)明”之一的共享經(jīng)濟(jì)代表—共享單車,因其方便快捷、低碳環(huán)保的使用特質(zhì),得到人們的廣泛認(rèn)可,儼然已成為人們短途出行的重要交通工具之一,隨著在我國的迅速發(fā)展,現(xiàn)已推廣到國外。
毋庸置疑,共享單車以分時租賃的經(jīng)營模式、便捷環(huán)保的使用方式,備受人們推崇,使其呈爆發(fā)式迅速增長,迅速普及,在某種程度上減緩了城市的擁堵狀況,減少了空氣污染,方便短途出行,但正是其使用時的“方便”,反而給共享單車在資源配置、管理調(diào)度上增加了困難,甚至有時反倒加劇了交通的擁堵[1]。隨著市場上共享單車保有量的迅速增大,使得車輛在資源配置、運(yùn)營和管理中存在的問題日漸顯露。除了由于單車使用者個人素質(zhì)差異造成的不按規(guī)定地點(diǎn)停放、亂停亂放、損壞車輛等不道德行為外,更大的問題是因行業(yè)競爭激烈,管理粗放,調(diào)度滯后,不能科學(xué)合理地配置資源、管理資源,不能科學(xué)預(yù)判投放數(shù)量,造成車輛投放地區(qū)不平衡[2]。經(jīng)常出現(xiàn)有的地方車輛積壓阻礙交通,而有的地方又“一車難求”的局面,且共享單車運(yùn)營公司“各自為政”,單車投放數(shù)量盲目,比例失衡,使得某些城市的單車數(shù)量超過城市容納量,造成極大的資源浪費(fèi)。盡管很多共享單車公司為單車安裝了GPS定位系統(tǒng),能夠?qū)崿F(xiàn)動態(tài)化地監(jiān)測車輛數(shù)據(jù)、騎行分布數(shù)據(jù),但是如何充分利用智能化手段對共享單車科學(xué)調(diào)度、科學(xué)預(yù)測,提高車輛使用效率,減少擁堵發(fā)生,使共享單車這一新生事物健康有序的發(fā)展,是擺在我們面前亟待思考與解決的問題。
本文通過對北京市2017年一段時間內(nèi)的共享單車使用情況的數(shù)據(jù)進(jìn)行分析、挖掘,在數(shù)據(jù)預(yù)處理的基礎(chǔ)上,通過建立相應(yīng)的數(shù)學(xué)模型,預(yù)測北京不同區(qū)域的共享單車靜態(tài)需求量以及居住區(qū)、教學(xué)區(qū)、商業(yè)區(qū)等不同區(qū)域共享單車靜態(tài)需求數(shù)量的分配權(quán)重,考慮動態(tài)時間因素和單車轉(zhuǎn)運(yùn)的運(yùn)輸成本、建筑分布以及總體均衡等因素,求出北京共享單車動態(tài)需求下的合理調(diào)度方案,最后給出共享單車的經(jīng)濟(jì)效益分析,為共享單車在合理配置資源、科學(xué)調(diào)度、運(yùn)營管理、收益分析等方面給出優(yōu)化建議,以期為共享單車這一“中國式創(chuàng)新”事物的健康發(fā)展,為城市管理者、共享單車運(yùn)營者提供參考建議[3]。
由于采集得到的共享單車原始數(shù)據(jù)往往存在冗余、錯誤等問題,為了讓進(jìn)一步的數(shù)據(jù)挖掘及統(tǒng)計(jì)性研究有效可行,首先對采集到的數(shù)據(jù)進(jìn)行預(yù)處理。
搜集到的共享單車騎乘記錄數(shù)據(jù)共計(jì)20 000條。通過繪制數(shù)據(jù)散點(diǎn)圖,發(fā)現(xiàn)數(shù)據(jù)中有部分離群的異常點(diǎn),于是運(yùn)用LOF算法(局部異常因子算法)剝除了6個數(shù)據(jù)點(diǎn),得到了19 994條可用數(shù)據(jù)。
2.2.1 空間特征分析。要想使資源分配趨于合理,需要分析不同時空下的共享單車的需求量。若僅對空間而言,共享單車的空間分布往往成集群分布,這體現(xiàn)了空間分布的不均衡性,而這種不均衡往往是不同空間所具有的固定屬性決定的。在分析空間分布與需求量的關(guān)系時,考慮了空間固有的四個不同的固定屬性,分別是:騎乘者基數(shù)、騎乘者密度、附近交通設(shè)施數(shù)與附近騎乘目的地密集度。
騎乘者基數(shù)可由常住人口密度決定,搜集的數(shù)據(jù)是2017年一段時間內(nèi)北京市的騎乘數(shù)據(jù),因此查找了北京市不同區(qū)域常住人口密度。對于空間中給定的坐標(biāo)點(diǎn),選定與其最近的區(qū)域中心人口密度近似替代該點(diǎn)的常住人口密度。根據(jù)調(diào)查,對于市區(qū)而言,共享單車往往會與其他公共交通工具起到競爭的關(guān)系,因此采集了北京市地鐵口的坐標(biāo),計(jì)算出這些坐標(biāo)與騎車出發(fā)點(diǎn)的最短距離,作為第二項(xiàng)指標(biāo)。
為了得到與騎乘者密度以及騎乘目的地相關(guān)的數(shù)據(jù),通過K-means聚類算法,對騎行出發(fā)點(diǎn)與騎行目的地這兩項(xiàng)數(shù)據(jù)進(jìn)行了聚類分析[4]。由于北京市面積較大,選擇使用30個質(zhì)心進(jìn)行聚類分析。經(jīng)過多次迭代,得到聚類效果圖如圖1、圖2所示。
圖1 乘車起點(diǎn)聚類分析效果圖
圖2 乘車終點(diǎn)聚類分析效果圖
聚類分析得到的質(zhì)心,雖然并不一定恰好與騎乘者最密集的中心,即騎乘者最常去的目的地相吻合,但相差不大,可忽略不計(jì)。通過Google地圖對聚類分析得到的質(zhì)心進(jìn)行了考察,發(fā)現(xiàn)質(zhì)心基本都落在密集的居民區(qū)或商業(yè)區(qū),這也證明了前面的猜想。為了得到具體指標(biāo),參考LOF算法中的核心思想,將某一給定坐標(biāo)點(diǎn)到騎乘出發(fā)點(diǎn)聚類質(zhì)心的第k距離作為體現(xiàn)騎乘者密度的指標(biāo),將某一給定坐標(biāo)點(diǎn)到騎乘目的地聚類質(zhì)心的第k距離作為體現(xiàn)附近騎乘目的地密集度的指標(biāo)。其中,第k距離即對于A3、A4指標(biāo),將乘車起點(diǎn)對于聚類質(zhì)心的第k距離作為指標(biāo)d(p,o)(兩點(diǎn)p和o之間的距離)。
對于點(diǎn)p的第k距離dk(p)定義如下:dk(p)=d(p,o),并且滿足在集合中至少有不包括p在內(nèi)的k個點(diǎn)o'∈C{x≠p} ,滿足d(p,o')≤d(p,o);在集合中最多有不包括p在內(nèi)的k-1個點(diǎn)滿足d(p,o')≤d(p,o);p的第k距離,也就是距離p第k遠(yuǎn)的點(diǎn)的距離,不包括p,如圖3所示:
圖3 p的第k距離定義示意圖
這里選擇k=1,得到相應(yīng)的指標(biāo)后,在MATLAB上使用libsvm3.2通過支持向量機(jī)回歸建立空間特征與需求量的關(guān)系模型[5]。隨機(jī)選擇了1 000個數(shù)據(jù)作為訓(xùn)練集,同時用100個數(shù)據(jù)作為測試。在進(jìn)行支持向量機(jī)訓(xùn)練時,使用差分進(jìn)化算法,對支持向量機(jī)的兩個參數(shù)c、g進(jìn)行優(yōu)化尋參數(shù),其迭代過程如圖4所示。
圖4 差分進(jìn)化算法迭代次數(shù)
最終構(gòu)建了支持向量機(jī)回歸模型,其數(shù)據(jù)回測圖和殘差圖如圖5、圖6所示。
此處得到的預(yù)測值再乘以19 994,即為預(yù)測的單位空間內(nèi)一天的共享單車需求數(shù)量。其中預(yù)測數(shù)據(jù)的均方誤差(MSE)為2.770 5×10-4。
2.2.2 時間特征分析。通過前面的分析,得到了支持向量機(jī)回歸模型,輸入四個指標(biāo)即可得到某一空間一天的需求總量。下面,為了能得到某一空間在不同時間段中的需求量,對19 994條數(shù)據(jù)樣本進(jìn)行了統(tǒng)計(jì)性分析,條形統(tǒng)計(jì)圖如圖7所示。
為了使需求量的預(yù)測結(jié)果盡量精確,將原本以分鐘為精確度的數(shù)據(jù)轉(zhuǎn)換為以小時為精確度的數(shù)據(jù),由此可得到每小時不同時間段乘車數(shù)量的占比。故只需將支持向量機(jī)回歸預(yù)測得到的需求量與規(guī)定的時間段乘車數(shù)量的占比相乘即可獲得特定時空下的需求量。由此完整分析了不同時空下的需求量[6]。
2.2.3 各地區(qū)共享單車數(shù)量的分配權(quán)重。為了得到每個子空間內(nèi)部的共享單車分配方案,選取了四個典型的地區(qū),以及五個主要因素建立需求最高地區(qū)的層次分析模型。如圖8所示。
圖5 SVR數(shù)據(jù)回測圖
圖6 殘差圖
圖7 時間分布條形統(tǒng)計(jì)圖
圖8 層次分析模型
根據(jù)共享單車的情況,結(jié)合層次分析結(jié)構(gòu)中的各種因素,構(gòu)造判斷矩陣如下:
通過求解得權(quán)重向量如下:
wA=(0.428 2,0.230 2,0.168 7,0.105 7,0.067 2),一致性比率為CRA=0.038 4;
wB1=(0.255 3,0.148 6,0.550 7,0.045 5),一致性比率為CRB1=0.049 0;
wB2=(0.255 3,0.148 6,0.550 7,0.045 5),一致性比率為CRB2=0.048 6;
wB3=(0.310 6,0.149 0,0.490 6,0.049 8),一致性比率為CRB3=0.071 8;
wB4=(0.295 4,0.137 9,0.490 4,0.076 3),一致性比率為CRB4=0.098 8;
wB5=(0.155 1,0.283 7,0.085 4,0.479 8),一致性比率為CRB5=0.043 2。
最后求得各地區(qū)對目標(biāo)層的權(quán)重,即各地區(qū)共享單車數(shù)量的分配權(quán)重,見表1。
表1 各地區(qū)共享單車數(shù)量的分配權(quán)重
2.3.1 車輛流動模型。上一部分為了建立可以適用于整個大范圍區(qū)域,可以準(zhǔn)確預(yù)測其每個各異的子空間共享單車需求量的回歸模型,更多地關(guān)注于不同區(qū)域不同地區(qū)固有的空間特征,選擇性地忽略了一些時間特征,因此建立的模型屬于靜態(tài)的需求量模型,可以反映某一區(qū)域某個特定時段對共享單車的需求量,卻無法反映某時段、某區(qū)域共享單車使用數(shù)量的變化,從而無法反映供求關(guān)系是否失衡。而解決共享單車調(diào)度問題,還需建立動態(tài)的車輛流動模型,在上一部分基礎(chǔ)上對該地區(qū)的共享單車動態(tài)變化進(jìn)行進(jìn)一步的分析。
實(shí)際生活中,共享單車的調(diào)度能力是有限的,考慮到調(diào)度中心人力資源有限這一影響因素,規(guī)定共享單車調(diào)度中心一天只進(jìn)行兩次調(diào)度,分別對應(yīng)于使用早高峰與晚高峰時段。定義時間t內(nèi)單位子空間的需求變化量為Pt。通過計(jì)算早高峰時間段(07:00—09:00)和晚高峰時段(16:00—19:00)以及一整天的Pt,繪制出熱力圖,如圖9—圖11所示。
圖9 單日需求變化熱力圖
由熱力圖可以看出,無論是在早高峰還是晚高峰,需求量增加最多的地區(qū)基本處在北京市中心地帶。
2.3.2 共享單車動態(tài)需求量調(diào)度的雙目標(biāo)規(guī)劃模型。為了能更好地分析整個北京城中的局部動態(tài)變化,將數(shù)據(jù)中所覆蓋的北京城區(qū),均勻地分為100個子空間,如圖12所示。由左上角第一個子區(qū)域開始向右分別標(biāo)號為(1,2,…,100)。進(jìn)而將問題轉(zhuǎn)化為研究每一塊子空間之間共享單車數(shù)量的變化量以及共享單車調(diào)度方法。通過MATLAB中的numel函數(shù)得到了將北京市劃分為100個均勻子區(qū)間后的需求矩陣,并分別計(jì)算了早高峰以及晚高峰的需求變化量矩陣。
圖10 早高峰需求變化熱力圖
圖11 晚高峰需求變化熱力圖
圖12 北京市空間分區(qū)圖
為了建立共享單車的調(diào)度方案,依據(jù)計(jì)算得到的早、晚高峰期需求變化矩陣,將這些子空間劃分為供不應(yīng)求、供給過剩、供求均衡三種類型。這里選擇Pt<0為供不應(yīng)求,Pt>0為供給過剩,Pt=0為供求均衡。在調(diào)度方案中,由供給過剩的子空間向供不應(yīng)求的子空間調(diào)度共享單車,而供求均衡的子空間則可以根據(jù)子空間中實(shí)際的建筑分布情況,派遣人員對子空間中的共享單車按照靜態(tài)的需求量模型中的權(quán)重比例進(jìn)行調(diào)度。對于供給過剩與供不應(yīng)求的子空間,定義了全局共享單車分布不均衡度K。
為了讓整個市區(qū)在全局上擁有良好的共享單車分布狀態(tài),需要讓子空間互相調(diào)度單車,從而令目標(biāo)K最小化。而對于每個子空間自身的內(nèi)部調(diào)度,則需要考察子空間內(nèi)的建筑分布,按照靜態(tài)的需求量模型中的結(jié)論進(jìn)行調(diào)度[7]。在保證全局均衡度盡可能達(dá)到目標(biāo)的前提下,考慮到北京市區(qū)空間跨度大,單車的轉(zhuǎn)運(yùn)需要耗費(fèi)較多的財(cái)力、人力,建立雙目標(biāo)規(guī)劃模型如下。
目標(biāo)函數(shù)為:
約束條件為:
在目標(biāo)規(guī)劃中,單車空間分布的不合理將會造成乘客使用率減少,交通阻塞等現(xiàn)象。這些現(xiàn)象均會直接或間接地對經(jīng)濟(jì)造成一定的影響,故可以對兩個目標(biāo)進(jìn)行加權(quán),此處對運(yùn)輸成本加權(quán)d0,從而將雙目標(biāo)規(guī)劃問題轉(zhuǎn)換為單目標(biāo)規(guī)劃。
使用模擬退火算法對上述模型進(jìn)行求解,求解步驟如下:
(1)求解貨車行駛距離。A、B兩點(diǎn)的地理坐標(biāo)分別為(x1,y1),(x2,y2),由于地球表面不是平面而是球面,故兩點(diǎn)的實(shí)際距離為A、B兩點(diǎn)的劣弧長。地球半徑為R=6 370km,則A、B兩點(diǎn)坐標(biāo)可表示為:
A、B兩點(diǎn)實(shí)際距離為:
由式(5)可以得到兩個子空間的實(shí)際距離,用以近視替代貨車行駛的路程。
(2)產(chǎn)生初始解。通過rand函數(shù)隨機(jī)獲得一個匹配矩陣與匹配權(quán)重矩陣,通過多次循環(huán)選擇其中目標(biāo)值D最小的兩個矩陣作為初始解。
(3)產(chǎn)生新解。通過rand函數(shù)獲得隨機(jī)的nk與兩個隨機(jī)的nl的新匹配方式,以及隨機(jī)分配的新權(quán)重。
(4)計(jì)算適應(yīng)性,重復(fù)直到退火過程結(jié)束。如果新的匹配方式與權(quán)重得到的目標(biāo)值更小,則將匹配方式與權(quán)重替換掉原本的匹配矩陣與匹配參數(shù)。
此處由于篇幅問題,僅給出求解得出的早高峰過后的調(diào)度方案,見表2。
目前,共享單車企業(yè)資金來源為融資和投資,主要收入來源為單車租金。在共享單車的運(yùn)營過程中,大多數(shù)都出現(xiàn)了虧損的現(xiàn)象。由于共享單車押金、融資方面的內(nèi)容缺少數(shù)據(jù)支撐,暫不對這些方面進(jìn)行分析,沿用前面的結(jié)論,僅就收取騎乘費(fèi)這一方面,提出新的經(jīng)營模式并進(jìn)行論證。傳統(tǒng)的騎乘費(fèi)用都以騎乘時長為主要參考度,對于使用過程中出現(xiàn)的特殊情況,如惡意毀壞單車時會加收騎乘費(fèi)等不做考慮。利用共享單車的時間分布具有雙峰性,而空間上具有集群性這些特點(diǎn),可以考慮在騎乘高峰期加收費(fèi)用,即于早07:00—09:00,晚16:00—19:00這兩個時間段進(jìn)行騎乘費(fèi)用的加收。同時可以在節(jié)假日提供免費(fèi)騎乘的活動作為加收騎乘費(fèi)用的補(bǔ)償。
表2 早高峰過后的調(diào)度方案
根據(jù)上面的運(yùn)營方案,使用計(jì)算機(jī)進(jìn)行模擬,在周一至周六的騎乘高峰期進(jìn)行50%的費(fèi)用加收,而周日全天免費(fèi)使用。根據(jù)模擬得到這樣的結(jié)果:傳統(tǒng)收費(fèi)方式一周僅獲利139 958元,采用高峰時段加收費(fèi),周末回饋的方式,一周可以獲利146 013元。提高使用高峰期收費(fèi)所得利潤如圖13所示。
據(jù)此,又對10%—100%的提價區(qū)間進(jìn)行了進(jìn)一步分析,發(fā)現(xiàn)若乘客的騎乘數(shù)量不減少,僅需要提高40%的騎乘費(fèi)即可達(dá)到傳統(tǒng)收益的水平[8]。但由于市場經(jīng)濟(jì)規(guī)律的影響,騎乘費(fèi)的提高往往會帶來騎乘數(shù)量的下降,所以要想對這個問題進(jìn)行精確的研究,還需要再對不同品牌的共享單車之間的競爭因素做進(jìn)一步調(diào)查,從而得到更多的數(shù)據(jù)再做進(jìn)一步分析。
圖13 提高高峰期收費(fèi)利潤
本文對北京市2017年一段時間內(nèi)的共享單車使用情況進(jìn)行了數(shù)據(jù)分析和挖掘,通過建立數(shù)學(xué)模型,預(yù)測了北京不同區(qū)域的共享單車靜態(tài)需求量以及居住區(qū)、教學(xué)區(qū)、商業(yè)區(qū)等不同區(qū)域共享單車靜態(tài)需求數(shù)量的分配權(quán)重,考慮動態(tài)時間因素和單車轉(zhuǎn)運(yùn)的運(yùn)輸成本、建筑分布以及總體均衡等因素,求出了北京共享單車動態(tài)需求下的合理調(diào)度方案,最后,給出了共享單車的經(jīng)濟(jì)效益分析。該研究結(jié)果符合北京市共享單車的實(shí)際情況,為解決共享單車的需求、調(diào)度、管理等提供了一定的決策參考。同時,該研究方法也為其他城市解決共享單車問題提供了參考建議。