趙 鵬,翟茹雪,宋文波
(北京交通大學(xué) 交通運(yùn)輸學(xué)院,北京 100044)
高速鐵路的運(yùn)營為旅客出行需求提供了優(yōu)質(zhì)的服務(wù),提高了旅客的出行效率,然而旅客需求與高速鐵路能力之間仍存在不匹配現(xiàn)象,導(dǎo)致部分車次能力緊張,部分車次能力虛糜.在此背景下,準(zhǔn)確把握旅客的乘車選擇行為并制定相應(yīng)的策略,對提高鐵路部門收益及列車能力利用率、精細(xì)化管理列車席位能力具有重要意義.
關(guān)于旅客出行選擇行為的研究已有較多成果,既有研究主要集中在旅客對不同出行方式、不同出行線路的選擇:文獻(xiàn)[1]建立動態(tài)廣義費(fèi)用的Logit模型,研究了鄭州—西安運(yùn)輸通道內(nèi)交通方式能力配置問題;文獻(xiàn)[2]構(gòu)建二元Logit模型,預(yù)測了京滬線旅客的出行方式選擇;文獻(xiàn)[3]在分析滬杭通道內(nèi)客流結(jié)構(gòu)和旅客出行方式選擇特征的基礎(chǔ)上,針對不同月收入的旅客構(gòu)建Logit模型;文獻(xiàn)[4]將旅客的選擇因素分為主體因素、列車特性和隨機(jī)因素三類,研究了鐵路旅客乘車選擇行為;文獻(xiàn)[5]研究了旅客在G類和D類高速列車間的出行選擇行為;文獻(xiàn)[6]研究了京滬通道內(nèi)出發(fā)時(shí)間和出行距離對旅客出行方式選擇的影響.在既有模型中,通常假設(shè)旅客是“經(jīng)濟(jì)人”,即認(rèn)為個(gè)體的偏好是同質(zhì)的,然而這與實(shí)際不符,該假設(shè)忽略了個(gè)體異質(zhì)性,導(dǎo)致模型結(jié)果存在局限性.因此,國外部分學(xué)者開始在旅客出行選擇行為中考慮個(gè)體異質(zhì)性:文獻(xiàn)[7]基于潛在類別模型(LC模型)和考慮個(gè)體完整異質(zhì)性的混合Logit模型(ML模型),研究了旅客的不可觀測異質(zhì)性并對兩種模型進(jìn)行對比;文獻(xiàn)[8]利用ML模型,研究了個(gè)體異質(zhì)性對旅客支付意愿的影響;文獻(xiàn)[9]采用潛在類別方法,研究旅客對不同航線的選擇偏好,并對旅客進(jìn)行分類.然而,國內(nèi)交通領(lǐng)域?qū)€(gè)體異質(zhì)性的研究較少,并且鮮有在高速鐵路旅客乘車選擇行為中運(yùn)用.
本文作者在研究高速鐵路旅客乘車選擇行為時(shí),引入個(gè)體異質(zhì)性的影響.通過對影響旅客乘車選擇行為的因素分析,設(shè)計(jì)并進(jìn)行了旅客乘車選擇行為意愿調(diào)查(SP調(diào)查).在此基礎(chǔ)上,建立考慮個(gè)體異質(zhì)性和不考慮個(gè)體異質(zhì)性的旅客選擇行為模型.最后,通過調(diào)查數(shù)據(jù)對構(gòu)建的模型進(jìn)行標(biāo)定,根據(jù)模型結(jié)果對個(gè)體異質(zhì)性在旅客選擇行為中的影響進(jìn)行分析.
由于個(gè)體之間在文化程度、經(jīng)濟(jì)條件、消費(fèi)習(xí)慣等方面存在一定的差異,導(dǎo)致其對同一產(chǎn)品進(jìn)行選擇時(shí)會產(chǎn)生不同的偏好,這種差異性的選擇偏好即為個(gè)體間的異質(zhì)性[10].個(gè)體間的異質(zhì)性受到多種因素的影響,通??梢詫⑵浞譃榭捎^測到的異質(zhì)性與不可觀測到的異質(zhì)性.例如,性別、年齡、收入等是可以直接觀測到的個(gè)體間的差異,而如教育程度、出行習(xí)慣、價(jià)值觀念等是無法直接觀測到的個(gè)體間的差異.個(gè)體異質(zhì)性會影響個(gè)體的選擇行為,在對旅客選擇行為研究時(shí),忽略異質(zhì)性的存在會對結(jié)果產(chǎn)生顯著影響,就不能準(zhǔn)確把握旅客的選擇行為.因此,本文在旅客選擇行為研究中考慮個(gè)體異質(zhì)性的影響.
數(shù)據(jù)采集是定量研究個(gè)體異質(zhì)性與建模的基礎(chǔ).本文利用SP調(diào)查,對高速鐵路旅客乘車選擇意愿的相關(guān)數(shù)據(jù)進(jìn)行采集,其關(guān)鍵是確定影響旅客選擇行為的因素,然后在此基礎(chǔ)上設(shè)計(jì)調(diào)查問卷.由于目前旅客對高速列車的安全性、舒適性、車上環(huán)境等需求基本已得到了滿足,而列車在數(shù)據(jù)通信(即WiFi)和餐飲服務(wù)方面與旅客需求之間仍存在很大的差距,因此將這兩方面作為區(qū)別車上服務(wù)水平的因素.通過上述分析,選擇列車運(yùn)行時(shí)間、發(fā)車時(shí)段、票價(jià)和車上服務(wù)水平作為影響旅客選擇行為的屬性,并以北京—西安的高鐵列車為基準(zhǔn)設(shè)計(jì)各屬性的水平值,其中票價(jià)的水平值設(shè)置以高鐵二等座票價(jià)為基準(zhǔn),目前全價(jià)票為515.5元.SP調(diào)查的各屬性及其水平如表1所示.
表1 SP調(diào)查各屬性及其水平
從表1可以看出,SP調(diào)查時(shí)的運(yùn)行時(shí)間和車上服務(wù)水平有3個(gè)水平,發(fā)車時(shí)段有4個(gè)水平,票價(jià)有5個(gè)水平.將這些屬性的不同水平值之間進(jìn)行組合,可以得到180個(gè)情景,每種情境中有2列列車供旅客選擇,旅客可根據(jù)需求選擇更想乘坐的列車.為了最大程度降低旅客回答問題的數(shù)量,并保證構(gòu)建模型時(shí)采用數(shù)據(jù)的精確度,采用正交設(shè)計(jì)法設(shè)計(jì)調(diào)查情景.利用SPSS軟件進(jìn)行正交設(shè)計(jì)后得到49種情景,排除不合理的7種情景后,將剩下的42種情景分到6份調(diào)查問卷中,每份調(diào)查問卷中包含7個(gè)情景,每個(gè)情景的情況如表2所示.每種情景下的各屬性水平取值不同,旅客可根據(jù)相應(yīng)的情景進(jìn)行選擇.
表2 調(diào)查情景問卷
在構(gòu)建模型時(shí),先對特性變量進(jìn)行選取,然后在此基礎(chǔ)上構(gòu)建考慮個(gè)體異質(zhì)性和不考慮個(gè)體異質(zhì)性的旅客選擇行為模型,并通過對比分析來量化個(gè)體異質(zhì)性對高速鐵路旅客乘車選擇行為的影響.
在進(jìn)行建模時(shí),需要確定構(gòu)建模型所需要的特性變量.這里的乘車特性變量選取是指對影響旅客乘車選擇的因素進(jìn)行篩選,包括旅客主體屬性、列車出行屬性和列車服務(wù)屬性.綜合分析,將用于情景設(shè)計(jì)的屬性及旅客個(gè)體的部分屬性確定為模型的特性變量,其中旅客個(gè)體屬性的選取是根據(jù)參數(shù)標(biāo)定結(jié)果決定的.在進(jìn)行參數(shù)標(biāo)定時(shí),個(gè)人收入和費(fèi)用來源比較顯著,因此選取旅客的這兩個(gè)屬性作為特性變量,各變量的描述如表3所示.
表3 特性變量
表3中,票價(jià)與運(yùn)行時(shí)間可以用數(shù)值形式進(jìn)行定量描述,而發(fā)車時(shí)段和車上服務(wù)水平是0-1變量,其中發(fā)車時(shí)段和車上服務(wù)水平的取值較表1中各屬性的水平值分別少一個(gè).以發(fā)車時(shí)段為例,共有4個(gè)水平取值.從表3可以看出,可以由3個(gè)變量進(jìn)行描述:當(dāng)發(fā)車時(shí)段為水平2時(shí),DT1=1;當(dāng)發(fā)車時(shí)段為水平3時(shí),DT2=1;當(dāng)發(fā)車時(shí)段為水平4時(shí),DT3=1;則當(dāng)發(fā)車時(shí)段為水平1時(shí),DT1=DT2=DT3=0.同理,車上服務(wù)水平的3個(gè)水平值可以由2個(gè)變量進(jìn)行描述.
不考慮個(gè)體異質(zhì)性的多項(xiàng)Logit模型(MNL模型)是最基本的離散選擇模型,在旅客出行方式選擇中得到了廣泛的應(yīng)用.然而在建模時(shí),MNL模型是不考慮個(gè)體間差異性的,認(rèn)為個(gè)體之間是同質(zhì)的.以隨機(jī)效用理論為基礎(chǔ),模型中個(gè)體q選擇分肢i的效用函數(shù)Uiq為
Uiq=Viq+εiq
(1)
(2)
式中:Viq是與可觀測變量Xkiq相對應(yīng)的效用的確定項(xiàng),本文中Viq是Xkiq的線性函數(shù);εiq是不可觀測的隨機(jī)效用項(xiàng),假設(shè)其服從Gumbel分布;K為變量的個(gè)數(shù),Xkiq為選擇肢i的第k個(gè)變量;βk為其相對應(yīng)的待估參數(shù).
根據(jù)效用最大化理論,個(gè)體q選擇分肢i的概率為
Piq=prob[Uiq>maxUjq,i≠j,j∈An]
(3)
式中:An為各選擇分肢的集合;Uiq為個(gè)體q選擇分肢i時(shí)的效用,Ujq為個(gè)體q選擇其他分肢時(shí)的效用.
旅客選擇行為的MNL模型的選擇概率如下
(4)
由于該模型中個(gè)體間是同質(zhì)的,各變量的待估參數(shù)βk是固定值.本文基于MNL模型構(gòu)建不考慮個(gè)體異質(zhì)性的旅客選擇模型,其效用函數(shù)的固定項(xiàng)為
ViqMNL=β1P+β2T+β3DT1+β4DT2+
β5DT3+β6CF1+β7CF2
(5)
由于MNL模型具有IIA特性,并且認(rèn)為個(gè)體間是同質(zhì)的,所以無法處理個(gè)體之間選擇的差異性和個(gè)人偏好信息.針對MNL模型應(yīng)用中存在的不足,ML模型做了一些改進(jìn),它是一種高度適應(yīng)性的模型,形式與MNL模型相似,能夠清晰地表達(dá)個(gè)體之間的選擇偏好.與MNL模型相比,ML模型中解釋變量的系數(shù)不再是一個(gè)固定不變的值,而是一個(gè)隨機(jī)值并且服從某一分布函數(shù)[7],從而可以根據(jù)系數(shù)的分布函數(shù)來表現(xiàn)個(gè)體之間喜好的不同.其中,分布函數(shù)的參數(shù)一般可以通過估計(jì)得到,用來反映個(gè)體之間的異質(zhì)性,通常分布函數(shù)的均值可以用來反映偏好的平均值,而標(biāo)準(zhǔn)差可以反映偏好差異間的變化幅度.基于隨機(jī)效用理論,當(dāng)個(gè)體q選擇分肢i時(shí),ML模型的效用函數(shù)可以表示為
Uiq=βiXiq+εiq=μβiXiq+σβiXiq+εiq
(6)
因此,ML中個(gè)體q選擇分肢i時(shí)的概率表現(xiàn)形式為
(7)
式(6)和(7)中,βi不再是一個(gè)固定值,而是一個(gè)隨機(jī)變量,其分布函數(shù)為f(βi|θ),用來反映不同個(gè)體間的異質(zhì)性,其中分布函數(shù)的形式較多,如正態(tài)分布、均勻分布、三角分布等,在實(shí)際應(yīng)用中應(yīng)根據(jù)模型應(yīng)用的意義及其變量自身的特點(diǎn)進(jìn)行選擇.θ是需要進(jìn)行估計(jì)的未知數(shù),為βi的分布函數(shù)的特征參數(shù),如正態(tài)分布的均值和標(biāo)準(zhǔn)差.βi=μβi+σβi,其中μβi為βi的均值,σβi為βi的隨機(jī)誤差項(xiàng),反映了個(gè)體q的異質(zhì)性.σβiXiq+εiq是效用函數(shù)的誤差項(xiàng),μβiXiq+σβiXiq是包含了Logit模型誤差項(xiàng)εiq的隨機(jī)效用,使得隨機(jī)效用項(xiàng)不再相互獨(dú)立,從而避免了Logit模型的IIA特性[8].
本文利用MNL模型的變形形式來測量旅客間的可觀測異質(zhì)性,借鑒文獻(xiàn)[9],MNL模型變形形式的效用函數(shù)固定項(xiàng)為
(8)
式中:Xk為效用函數(shù)中選擇肢i的第k個(gè)變量;SEVh為個(gè)體q屬性中的第h個(gè)變量;βXk、βXk_SEVh為需要估計(jì)的參數(shù).
對于傳統(tǒng)的MNL模型而言,其效用函數(shù)中特性變量的系數(shù)為一個(gè)固定的數(shù)值,通常不考慮個(gè)體的社會經(jīng)濟(jì)屬性對特性變量的影響.為了研究個(gè)體的可觀測異質(zhì)性,本文在特性變量的系數(shù)中引入個(gè)體的社會經(jīng)濟(jì)屬性(參見式(8)),用來研究個(gè)體自身屬性對特性變量的影響,以此來體現(xiàn)個(gè)體可觀測的異質(zhì)性[10].將考慮個(gè)體可觀測異質(zhì)性的選擇模型稱為MNL-SOC模型,通過構(gòu)建的模型可以研究個(gè)體的社會經(jīng)濟(jì)屬性對票價(jià)和運(yùn)行時(shí)間的影響,從而得到個(gè)體的可觀測異質(zhì)性.在建模過程中,通過分析個(gè)體屬性對特性變量的影響,發(fā)現(xiàn)僅僅是個(gè)體收入和費(fèi)用來源(是否自費(fèi))對列車票價(jià)敏感.因此,最終確定的MNL-SOC模型效用函數(shù)的固定項(xiàng)為
ViqMNL-SOC=(β1+βP-II+βP-FF)P+β2T+
β3DT1+β4DT2+β5DT3+β6CF1+β7CF2
(9)
ML模型既可以測量個(gè)體的可觀測異質(zhì)性,也可以測量個(gè)體的不可觀測異質(zhì)性,因而構(gòu)建ML模型來研究旅客對票價(jià)和運(yùn)行時(shí)間的完整個(gè)體異質(zhì)性,效用函數(shù)的固定項(xiàng)為
ViqML=β1P+β2T+β3DT1+β4DT2+
β5DT3+β6CF1+β7CF2
拍攝X線片,測量比較術(shù)前、術(shù)后腰椎側(cè)凸角度(Cobb角)、腰椎前凸角度(LL)、椎間孔高度、椎間隙高度、椎間孔面積及椎管面積變化。
(10)
在式(9)中,所有特性變量的待估參數(shù)都是固定不變的值;在式(10)中,票價(jià)和運(yùn)行時(shí)間兩個(gè)特性變量的待估參數(shù)β1和β2是服從某一分布的隨機(jī)變量,而其他特性變量的待估參數(shù)為固定不變的值.
利用設(shè)計(jì)的調(diào)查問卷,于2017年7月在北京西站進(jìn)行了為期2 d的SP調(diào)查.共發(fā)出480份問卷,回收有效問卷446份,獲得有效數(shù)據(jù)3 122條,有效率為92.9%;其中男性285人,女性161人,男女旅客比例約為1.77∶1.受訪者年齡主要集中在18~23歲、24~30歲、31~40歲、41~50歲這4個(gè)年齡段,占總調(diào)查人數(shù)的90%.旅客職業(yè)分布、年收入分布、出行目的分布及出行費(fèi)用來源分布情況見圖1.
表4 各參數(shù)的估計(jì)值
圖1 調(diào)查結(jié)果Fig.1 Survey results
根據(jù)獲得的旅客選擇行為調(diào)查數(shù)據(jù),通過Biogeme軟件,對構(gòu)建的不考慮個(gè)體異質(zhì)性的MNL模型、考慮個(gè)體可觀測異質(zhì)性的多項(xiàng)Logit模型(MNL-SOC模型)和考慮個(gè)體完整異質(zhì)性的ML模型進(jìn)行標(biāo)定,結(jié)果如表4所示.其中:t-test統(tǒng)計(jì)量用于檢驗(yàn)變量的顯著性,當(dāng)其絕對值大于1.96時(shí)則認(rèn)為變量顯著;ρ2和Adjustedρ2用于檢驗(yàn)?zāi)P偷臄M合優(yōu)度,值越大說明擬合優(yōu)度越好[11].
如表4所示,MNL-SOC模型、MNL模型和ML模型中各特性變量系數(shù)估計(jì)值的t-test統(tǒng)計(jì)量的絕對值基本都大于1.96,因此所選取的各特性變量的顯著性都比較好,應(yīng)在模型中保留.在ML模型中,β1和β2兩個(gè)特性變量的系數(shù)都服從正態(tài)分布,這兩個(gè)分布函數(shù)的均值和標(biāo)準(zhǔn)差的t-test統(tǒng)計(jì)量的絕對值也大于1.96,從而說明了系數(shù)分布函數(shù)假設(shè)的合理性.根據(jù)參數(shù)的標(biāo)定結(jié)果,MNL模型、MNL-SOC模型、ML模型的效用函數(shù)分別為
ViMNL=-0.006 11P-0.568T+0.857DT1+0.644DT2+0.232DT3+0.41CF1+0.508CF2
(11)
ViMNL-SOC=(-0.0078+0.00109I+
0.00179F)P-0.569T+0.861DT1+0.649DT2+
0.230DT3+0.412CF1+0.508CF2
(12)
ViML=β1P+β2T+1.1DT1+0.857DT2+0.207DT3+0.549CF1+0.588CF2
(13)
根據(jù)參數(shù)標(biāo)定結(jié)果可知,列車票價(jià)、運(yùn)行時(shí)間、發(fā)車時(shí)段、車上服務(wù)水平均會影響旅客的乘車選擇行為.從票價(jià)來看,3個(gè)模型中票價(jià)的系數(shù)估計(jì)值均為負(fù)值,說明票價(jià)越高旅客選擇列車的效用越低.在MNL-SOC模型中,旅客的收入水平及費(fèi)用來源(是否自費(fèi))的系數(shù)均為正值,說明當(dāng)旅客的收入越高或者公費(fèi)出行時(shí),票價(jià)對旅客選擇列車效用的影響越小.從運(yùn)行時(shí)間來看,3個(gè)模型中運(yùn)行時(shí)間的系數(shù)估計(jì)值均為負(fù)值,表明列車運(yùn)行時(shí)間越長,旅客選擇列車的效用越小.從發(fā)車時(shí)段來看,3個(gè)模型中發(fā)車時(shí)段的系數(shù)估計(jì)值均為正值,并且結(jié)合各個(gè)發(fā)車時(shí)段的系數(shù)估計(jì)值大小,可以得到旅客對不同發(fā)車時(shí)段列車的偏好:首先選擇8:00—12:00的列車,
其次
選擇12:00—16:00的列車,然后是16:00之后的列車,最后選擇早上8:00前的列車.從車上服務(wù)水平來看,3個(gè)模型中,衡量車上服務(wù)水平的變量的系數(shù)估計(jì)值都為正值,說明提供免費(fèi)餐飲和WiFi都會對旅客選擇列車產(chǎn)生正效用;從系數(shù)估計(jì)值大小可以看出,WiFi對于旅客選擇列車的影響更大.從ρ2值和Adjustedρ2值來看,ML模型的最大,其次是MNL-SOC模型,最后是MNL模型,表明ML模型的擬合優(yōu)度最好,MNL-SOC模型次之,最后是MNL模型,充分說明:考慮個(gè)體異質(zhì)性較不考慮個(gè)體異質(zhì)性,更能反映旅客的實(shí)際選擇行為;當(dāng)考慮完整的旅客個(gè)體異質(zhì)性時(shí),旅客的乘車選擇行為能夠被更好地刻畫.
支付意愿可以用來分析旅客對影響列車選擇的各特性變量的偏好程度,根據(jù)各特性變量的系數(shù)估計(jì)值,能夠得到各特性變量的水平值變化時(shí)旅客支付意愿的變化.因此,可以根據(jù)模型參數(shù)的估計(jì)值來研究個(gè)體異質(zhì)性對旅客選擇行為的影響.由于ML模型的擬合優(yōu)度較MNL-SOC模型要好,并且能測量個(gè)體的可觀測和不可觀測異質(zhì)性,因此通過比較ML模型和MNL模型中不同特性變量的旅客支付意愿來研究個(gè)體異質(zhì)性對旅客乘車選擇行為的影響.根據(jù)各模型的效用函數(shù),可以得出旅客對某一變量Xk的支付意愿為
(14)
式(14)可以用來計(jì)算定量描述的特性變量變化時(shí)旅客的支付意愿.當(dāng)特性變量不能定量描述時(shí),如發(fā)車時(shí)段、車上服務(wù)水平等為0-1變量,對于此類特性變量,旅客支付意愿的計(jì)算公式為
(15)
式中:Vi1是變量水平值為1時(shí)旅客選擇列車i的效用;Vi0是變量水平值為0時(shí)旅客選擇列車i的效用.
根據(jù)式(14)和式(15),可以計(jì)算得到ML模型和MNL模型下各特性變量的旅客支付意愿,通過對比各特性變量的旅客支付意愿,可以得到個(gè)體異質(zhì)性對旅客乘車選擇的影響,各特性變量的旅客支付意愿如表5所示.
表5 各特性變量的旅客支付意愿
表5中多支付的比例是以北京—西安的高鐵二等座全價(jià)票為基準(zhǔn)計(jì)算得到的,數(shù)值變化中的水平1-2、1-3、1-4分別指的是水平值由1變到2、3、4.可以看出:相對于MNL模型,ML模型中各特性變量的旅客支付意愿都要低于MNL模型中的相應(yīng)狀態(tài),由于ML模型的擬合優(yōu)度較MNL模型的擬合優(yōu)度更好,因此ML模型下的旅客支付意愿更能反映旅客的實(shí)際選擇行為,從而表明當(dāng)忽略個(gè)體異質(zhì)性時(shí)旅客的支付意愿會被高估.
由于考慮旅客異質(zhì)性的模型所得到旅客的支付意愿更符合實(shí)際情況,因此可以利用表5中ML模型得到的旅客支付意愿,對具有差異性的列車進(jìn)行差別定價(jià).如果A車比B車快1h,則可以在A車原有票價(jià)的基礎(chǔ)上增加15%,或者給B車打8.5折;如果A車在8:00之前出發(fā),B車在8:00—12:00出發(fā),則可以給A車打8折或者在B車原有票價(jià)的基礎(chǔ)上增加20%;如果A車提供免費(fèi)WiFi而B車不提供WiFi,則A車在定價(jià)時(shí)可以適當(dāng)提高票價(jià),在原有票價(jià)基礎(chǔ)上增加約10%.根據(jù)旅客的支付意愿,對各列車采取差別定價(jià)的策略,可以滿足不同旅客的出行需求,均衡各列車的上座率.
1)通過對影響旅客乘車選擇行為的因素及個(gè)體異質(zhì)性分析,在確定影響旅客選擇行為的屬性及水平值的基礎(chǔ)上,利用SP調(diào)查的正交設(shè)計(jì),構(gòu)造旅客選擇情景并設(shè)計(jì)問卷.
2)在此基礎(chǔ)上,分別以MNL模型、MNL模型的變形形式及ML模型為基礎(chǔ),分別構(gòu)建了不考慮個(gè)體異質(zhì)性、考慮個(gè)體可觀測異質(zhì)性和考慮個(gè)體完整異質(zhì)性的旅客選擇模型.
3)通過對北京—西安的高速鐵路旅客進(jìn)行調(diào)查來獲取旅客乘車選擇數(shù)據(jù),并標(biāo)定模型參數(shù).結(jié)果表明:ML模型的擬合優(yōu)度最好,更能反映旅客實(shí)際的支付意愿;當(dāng)忽略旅客異質(zhì)性時(shí),旅客的支付意愿會被高估.