摘 要:文章首先對ReliefF特征選擇算法相關(guān)理論做了解析,分析了影響城市出租車保有量的相關(guān)因素;然后利用ReliefF算法對重慶、廣東相關(guān)數(shù)據(jù)進(jìn)行了處理,提取其中特征權(quán)重較大的特征;最后,基于降維后的特征進(jìn)行多元回歸分析,得到表征重慶、廣東出租車保有量的多元回歸方程。
關(guān)鍵詞:出租車保有量;特征選擇;ReliefF算法;多元回歸分析
引言
出租車保有量問題已經(jīng)成為出租車市場管理的重要依據(jù),對城市出租車保有量的預(yù)測也成為了城市交通中的重要研究課題。文獻(xiàn)[1]針對深圳市特區(qū)外的出租車保有量問題進(jìn)行了研究,建立了類比分析模型。文獻(xiàn)[2]通過對北京市出租車保有量問題的研究,提出了基于出行廣義成本預(yù)測模型。文獻(xiàn)[3]利用Bruce Schaller需求估計(jì)模型,對北京市出租車保有量進(jìn)行合理預(yù)測。
本文提出基于ReliefF特征選擇算法[4]的多元回歸分析方法對出租車保有量問題進(jìn)行研究。首先,利用ReliefF算法對眾多影響因素進(jìn)行權(quán)重排序,然后,利用多元回歸分析方法對具體城市數(shù)據(jù)進(jìn)行預(yù)分析。
1 ReliefF特征選擇算法
ReliefF特征選擇算法主要用于解決樣本的多分類問題。算法基本思想:從訓(xùn)練集中隨機(jī)選取一個樣本R,然后從與樣本R同類和不同類的樣本集中均選出k個最近鄰樣本,最后,更新每個特征的權(quán)重。
2 出租車保有量問題實(shí)例
選取廣東、重慶相關(guān)數(shù)據(jù)進(jìn)行研究,數(shù)據(jù)來源于中國統(tǒng)計(jì)年鑒[5]。
考查影響出租車保有量的影響因素:X1:地區(qū)生產(chǎn)總值(億元);X2:地區(qū)總?cè)丝冢ㄈf人);X3:城鎮(zhèn)居民家庭人均交通、通信消費(fèi)支出(元);X4:公共交通車輛運(yùn)營數(shù)(輛);X5:公共交通運(yùn)營線路總長度(公里);X6:公共交通客運(yùn)總量(萬人次);X7:城鎮(zhèn)居民家庭平均每百戶家用汽車擁有量(輛);Y:現(xiàn)有出租車保有量(輛)。標(biāo)準(zhǔn)化處理后的數(shù)據(jù)見表1。
3 結(jié)束語
文章基于ReliefF算法對影響出租車保有量的因素進(jìn)行了降維處理,對重慶、廣東2008-2012年相關(guān)數(shù)據(jù)進(jìn)行多元回歸分析,分別得到二者的多元回歸方程,對后續(xù)的研究工作有一定的指導(dǎo)作用。
參考文獻(xiàn)
[1]孫喜梅,李猛,韓彪.基于類比分析的深圳市特區(qū)外出租車需求量預(yù)測[J].交通信息與安全,2009(5):19-23.
[2]柳麗娜,陳艷艷,張文閣.北京市出租車乘客需求預(yù)測模型研究[J].交通標(biāo)準(zhǔn)化, 2010(13):89-92.
[3]范合君,杜博.特大城市出租車合理數(shù)量估計(jì)及實(shí)現(xiàn)路徑-以北京市為例[J].經(jīng)濟(jì)與管理研究,2015,36(8):91-95.
[4]Kononenko I. Estimating Attributes: Analysis and Extentions of RELIEF [C] // Machine Learning: ECML-94.Springer Berlin Heidelberg,1994:171-182.
[5]http://www.stats.gov.cn/tjsj/ndsj/中國統(tǒng)計(jì)年鑒.
作者簡介:王巖(1979-),男,吉林省吉林市人,工作單位:吉林化工學(xué)院,職務(wù):教師,研究方向:模式識別、機(jī)器視覺。