余 敏,張秀英
(鄭州鐵路職業(yè)技術(shù)學(xué)院,河南 鄭州 450052)
本文的案例來源于2013 年全國大學(xué)生數(shù)學(xué)建模競賽的D 題(http://www.mcm.edu.cn/problem/2013/cumcm2013problems.rar)。
公共自行車作為一種低碳、環(huán)保、節(jié)能、健康的出行方式,正在全國許多城市迅速推廣與普及。在公共自行車服務(wù)系統(tǒng)中,自行車租賃的站點(diǎn)位置及各站點(diǎn)自行車鎖樁和自行車數(shù)量的配置,對系統(tǒng)的運(yùn)行效率與用戶的滿意度有重要的影響。
附件1[1]為浙江省溫州市鹿城區(qū)公共自行車管理中心提供的某20 天借車和還車的原始數(shù)據(jù),所給站點(diǎn)的地理位置參見附件2[1]。在搞清楚公共自行車服務(wù)模式和使用規(guī)則的基礎(chǔ)上,根據(jù)附件提供的數(shù)據(jù),建立數(shù)學(xué)模型,討論以下問題:
(1)分別統(tǒng)計(jì)各站點(diǎn)20 天中每天及累計(jì)的借車頻次和還車頻次,并對所有站點(diǎn)按累計(jì)的借車頻次和還車頻次分別給出它們的排序。
(2)試統(tǒng)計(jì)分析每次用車時(shí)長的分布情況。
根據(jù)公共自行車服務(wù)模式和使用規(guī)則以及溫州市鹿城區(qū)公共自行車服務(wù)指南[4],結(jié)合實(shí)際情況,作出如下假設(shè):
(1)附件1[1]中的數(shù)據(jù)能夠反映該城區(qū)公共自行車服務(wù)系統(tǒng)的現(xiàn)狀;
(2)附件1[1]中借出車站號和還車車站號相同,且用車時(shí)長為小于等于1 分鐘的記錄為無效記錄,建立模型時(shí)該記錄中的數(shù)據(jù)均不予考慮;
(3)附件1[1]中還車車站號為0 的記錄,認(rèn)為該車丟失或損壞,統(tǒng)計(jì)借車頻次時(shí)有效,而統(tǒng)計(jì)還車頻次時(shí)無效;
(4)每次用車時(shí)長不超過24 小時(shí)(即1440 分鐘)的數(shù)據(jù)為有效數(shù)據(jù);
(5)各站點(diǎn)所提供的自行車型號相同,且每位用車人的車速基本相同,設(shè)為12km/h。
根據(jù)以上假設(shè),首先對附件1[1]中借車和還車的原始數(shù)據(jù)進(jìn)行預(yù)處理,把借出車站號與還車車站號相同且用時(shí)長小于等于1 分鐘的記錄以及每次用車時(shí)長超過24 小時(shí)(即1440 分鐘)的記錄刪除,得到20 天數(shù)據(jù)的預(yù)處理表。
對于問題(1),利用spss 軟件的頻數(shù)分析和excel 的計(jì)算與排序功能,得到:各站點(diǎn)20 天中每天及累計(jì)的借車頻次和還車頻次;按累計(jì)的借車頻次和還車頻次的排序,并根據(jù)用車頻次和用車時(shí)長的分布情況,分析各站點(diǎn)設(shè)置是否合理。
對于問題(2),利用spss 進(jìn)行頻數(shù)分析,得到每天的用車時(shí)長的分布情況;然后以用車頻次最多的一天的數(shù)據(jù),建立每次用車時(shí)長的分布函數(shù)模型。
由假設(shè)2 和假設(shè)4 可知,每次用車時(shí)長超過24小時(shí)(即1440 分鐘)以及借出車站號與還車車站號相同且用車時(shí)長小于等于1 分鐘的記錄為無效租車記錄,所以要對附件1[1]中借車和還車的原始數(shù)據(jù)進(jìn)行預(yù)處理。將20 天的數(shù)據(jù)表導(dǎo)入軟件spss,利用spss 軟件的數(shù)據(jù)篩選功能,刪除上述兩類記錄,得到20 天借車與還車數(shù)據(jù)的預(yù)處理表,并將它們導(dǎo)入spss,建立spss 數(shù)據(jù)文件。
利用spss 軟件,對預(yù)處理后的20 個(gè)spss 數(shù)據(jù)文件進(jìn)行頻數(shù)分析,計(jì)算各個(gè)站點(diǎn)每天的借車頻次和還車頻次,并將20 天各站點(diǎn)的借車頻次和還車頻次匯總成一個(gè)excel 表。然后,利用匯總后的excel 表計(jì)算20 天各站點(diǎn)的累計(jì)借車頻次、累計(jì)還車頻次、合計(jì)用車次數(shù)(即累計(jì)借車頻次與還車頻次之和)及每天的總用車次數(shù)。最后,再用rank 函數(shù)得到按累計(jì)借車頻次和還車頻次的排序結(jié)果,如表1 所示(由于數(shù)據(jù)量過大,這里只列出部分?jǐn)?shù)據(jù)及排名)。
表1 各站點(diǎn)20 天的累計(jì)借車頻次和累計(jì)還車頻次及排序
從統(tǒng)計(jì)出的每天的借車頻次、還車頻次及總用車次數(shù)可以看出:第13 天的合計(jì)使用公共自行車次數(shù)為38800,是用車次數(shù)最多的一天。
從統(tǒng)計(jì)數(shù)據(jù)還可以看出,各站點(diǎn)每天的借車頻次、還車頻次和累計(jì)借車頻次、累計(jì)還車頻次排名基本一致。如,街心公園、五馬美食林的累計(jì)借車頻次和還車頻次排名分別為第1 和第2 位,而且每天的用車次數(shù)最多的站點(diǎn)也是這些站;而婦女兒童中心、望江路廣化橋路口和時(shí)代海景的累計(jì)借車頻次和還車頻次較低,分別排名倒數(shù)第1、2 和3 位。結(jié)合附件2,可以看出:街心公園和五馬美食林附近有較多娛樂場所和辦公樓,這些地方的人流密度大,相應(yīng)的用車人數(shù)就會多;而婦女兒童中心、望江路廣化橋路口都是郊區(qū)位置,附近的娛樂場所和辦公樓較少,人流密度小,相應(yīng)的用車人數(shù)就少。這應(yīng)該是造成在這些車站借、還車頻次高和低的原因。結(jié)合該區(qū)的地圖,為了更好地提高自行車服務(wù)系統(tǒng)的效益、方便市民出行,可以在街心公園、五馬美食林等用車頻次較高的站點(diǎn)投放更多的車輛和鎖樁或增設(shè)新的站點(diǎn);而在用車頻次較少的婦女兒童中心等站點(diǎn),為了盡可能減少資源浪費(fèi),可以適當(dāng)減少車輛和鎖樁數(shù)。
設(shè)樣本的觀測值為(y1,y2,…,yn)。由統(tǒng)計(jì)學(xué)知識可知:均值、眾數(shù)、中位數(shù)能反映某變量所有取值的集中趨勢和集中位置;樣本方差和樣本標(biāo)準(zhǔn)差用來刻劃樣本觀測值離散程度;為了更全面地了解數(shù)據(jù)分布的特點(diǎn),可以用偏度和峰度來刻畫數(shù)據(jù)的分布形態(tài),其中偏度是描述變量取值分布形態(tài)對稱性的統(tǒng)計(jì)量,其定義為:
當(dāng)Sk >0 時(shí),分布曲線為正偏態(tài),當(dāng)Sk <0 時(shí),分布曲線為負(fù)偏態(tài)。峰度是用來描述變量取值分布形態(tài)陡緩程度的統(tǒng)計(jì)量,其定義為:
當(dāng)Ku >3 時(shí),分布曲線呈尖頂峰度,為尖頂曲線;當(dāng)Ku <3 時(shí),分布曲線呈較平坦曲線。
為了更直觀地反映觀測數(shù)據(jù)的分布情況,還可以作出觀測變量的直方圖、條形圖和Q-Q 圖,用分布函數(shù)進(jìn)一步刻劃變量的分布規(guī)律。下面將分別從以上幾個(gè)方面來研究每次用車時(shí)長的分布規(guī)律。
將預(yù)處理后的20 天借車、還車數(shù)據(jù)表導(dǎo)入spss,用頻數(shù)分析功能分別計(jì)算每天用車時(shí)長的均值、眾數(shù)、中位數(shù)、偏度、峰度等,見表2,并作出頻數(shù)條形圖。
表2 1~20 天每次用車時(shí)長的統(tǒng)計(jì)
從表2 及每天的用車時(shí)長頻數(shù)表(數(shù)據(jù)過大,表里略去一部分?jǐn)?shù)據(jù))可以看出,每次用車時(shí)長的分布均為偏正態(tài)分布,分布曲線均為尖頂曲線,而且大多數(shù)天中峰度都遠(yuǎn)遠(yuǎn)大于3,說明每天的每次用車時(shí)長均不符合正態(tài)分布,為正偏態(tài),且從每天的用車時(shí)長條形圖可以看出:每天用車時(shí)長的分布近似于指數(shù)分布。每天用車時(shí)長的眾數(shù)均為7~9 分鐘,中位數(shù)為11~13 分鐘,平均數(shù)為15~17 分鐘,用車時(shí)長不超過30 分鐘的用車次數(shù)均超過85%,用車時(shí)長不超過60 分鐘的用車次數(shù)均超過98%。
下面再以第一天和總用車次數(shù)最多的一天(第十三天)為例對用車時(shí)長的分布作進(jìn)一步的分析和研究。
第一天的用車時(shí)長分布為正偏態(tài);峰度大于3,分布曲線為尖頂曲線;用車時(shí)長的眾數(shù)為7,說明用車時(shí)長較為密集地分布在眾數(shù)7 的周圍。從輸出的四分位數(shù)可以看出,用車時(shí)長為1~7 分鐘的占25%,用車時(shí)長為1~13 分鐘的占50%,用車時(shí)長為1~20 分鐘的占75%,用車時(shí)長不超過60 分鐘的占98.8%。圖1 為第一天每次用車時(shí)長的分布條形圖,從圖1 可以看出,第一天每次的用車時(shí)長分布近似為指數(shù)分布。圖2 是第一天每次用車時(shí)長的正態(tài)概率圖(Q-Q 圖),圖中實(shí)線是正態(tài)分布的標(biāo)準(zhǔn)線,而散點(diǎn)是實(shí)際數(shù)據(jù)的分布??梢钥闯銎x正態(tài)分布線的點(diǎn)比較多,而用車時(shí)長在1~30 分鐘之間的點(diǎn)集中在正態(tài)線附近,這進(jìn)一步說明第一天的用車時(shí)長不符合正態(tài)分布,而是正偏態(tài)。作出用車時(shí)長在1~30 分鐘之間的分布直方圖,如圖3 所示。
圖1 第一天每次用車時(shí)長頻數(shù)的條形圖
圖2 第一天每次用車時(shí)長的Q-Q 圖
圖3 第一天用車時(shí)長在1~30 之間的直方圖
為了更好地描述每天用車時(shí)長的分布規(guī)律,可以將每天的用車時(shí)長進(jìn)行數(shù)據(jù)分組,以便建立用車時(shí)長的分布函數(shù)。以第十三天為例,將用車時(shí)長每隔10 分鐘分一組,統(tǒng)計(jì)出每組的頻數(shù)和頻率,如表3。
表3 第十三天每次用車時(shí)長分組的頻數(shù)分析表
根據(jù)表3 的數(shù)據(jù),利用spss 進(jìn)行曲線回歸分析,可以看出,用s 型曲線的擬合效果最好,擬合曲線如圖4 所示。
圖4 每次用車時(shí)長的分布曲線
得到用車時(shí)長的曲線回歸方程為:
綜合以上對用車時(shí)長的研究分析,可以看出:用車時(shí)長的分布為偏正態(tài),近似為s型曲線;用車時(shí)長不超過1 小時(shí)的用車次數(shù)超過98%,按現(xiàn)行的收費(fèi)標(biāo)準(zhǔn),有98%的租車是免費(fèi)的,這說明目前的收費(fèi)標(biāo)準(zhǔn)是合理的,有利于推廣普及這種綠色環(huán)保公共交通系統(tǒng);平均用車時(shí)長為15~17 分鐘,如果以公共自行車的平均速度為12km/h 來計(jì)算用車距離,可得該區(qū)平均用車距離為3~3.4km,這與國內(nèi)外的調(diào)查數(shù)據(jù)所得的公共自行車的合理用車距離為2~5.5km 是比較吻合的。
[1]全國大學(xué)生教學(xué)建模組委會D 題:公共自行車服務(wù).http://www.mcm,edu.cn/problem/2013/cumcm2013problems.rar.
[2]章文波,陳紅艷.實(shí)用數(shù)據(jù)統(tǒng)計(jì)分析及時(shí)性SPSS12.0[M].北京:人民郵電出版社,2009.
[3]李黎輝,陳華,孫小麗.武漢公共自行車租賃點(diǎn)布局規(guī)劃[J].城市交通,2009(7):39-44.
[4]李如婷.溫州市鹿城區(qū)公共自行車服務(wù)指南.http://www.wzrb.com.cn/article413173show.html,2013-9-15.
[5]鹿城區(qū)公共自行車服務(wù)站點(diǎn)列表.http://www.wzcard.com.cn/help/bikeAdress.aspx.