鄭 昭 邱海童
(北京公交有軌電車有限公司,北京 100080)
高速鐵路和地鐵的迅速發(fā)展和不斷完善,對乘客吸引力和吸引范圍不斷擴大,兩者之間的銜接必將直接影響城市綜合交通運輸的效率。相比普通地鐵換乘站,銜接樞紐地鐵站的車站設施布置更復雜,車站空間布置更加多樣,在大客流的影響下,乘客行為復雜多樣,異質性明顯。將乘客視為同質個體進行研究顯然已不符合實際。所以進行乘客異質性研究有重要的現實意義。
為更好地研究乘客異質性特點,本文吸納社會科學研究相關經驗,采用更具優(yōu)勢的潛在類別方法對出行乘客進行分類,以實現乘客異質性的客觀描述。在進行潛在類別分析時,將乘客在樓扶梯處的微觀選擇行為以及乘客的生理和行為特性全部引入盡可能多的外顯變量。
顧兆軍等[1]使用航空旅客訂票數據進行潛在類別模型分析,實現民航旅客的合理分類,以研究民航旅客的出行選擇偏好。楊倩倩[2]根據旅客的訂票行為、登記行為等進行聚類,將旅客劃分為不同的客戶群,在分析了不同客戶群的出行特點及偏好后,提供有針對性的旅客服務。文佳星[3]使用京滬高鐵和滬寧高鐵乘客訂票數據,運用潛在類別理論對高鐵乘客選擇行為進行詳細劃分,為票價優(yōu)惠設計方案。喬珂等[4]運用潛在類別模型對高鐵旅客市場進行細分,在完成類別劃分后,進一步使用模型進行聚類分析,了解不同類型旅客的出行特征。陳建冰[5]利用潛在類別模型進行通勤個體異質性研究,對通勤過程中不可預測因素進行研究。楊洋[6]根據SP 調查數據,將受訪者分為四個潛在類別,并分析每一類別的特征,可以用于輔助交通政策制定目標人群,以規(guī)劃停車換乘系統(tǒng)。
選取北京西站地鐵站為調研車站,通過人工觀測和視頻記錄的方法分別在車站站廳、站臺、樓扶梯及出站閘機處采集乘客個體特性和設備參數,包括乘客性別、年齡、速度、行李、同組伴、熟悉程度和設施的通過時間,共采集291 組數據(其中樓扶梯處采集數據83 組,車站站廳、站臺和出站閘機位置共采集208 組)。被調查對象的基本信息調查結果及分析如下:
(1)男性占本次調查對象的54.5%,女性占調查對象的45.5%。
(2)調查對象中97%的乘客為成年人,其中年齡主要集中在20-40 歲間,占總人數的75.1%。
(3)調查對象中同組伴乘客占比6%。
(4)調查對象攜帶行李多樣,對乘客攜帶行李比例進行統(tǒng)計,其中未攜帶行李的乘客41%,攜帶行李箱乘客15%,攜帶背包乘客15%,攜帶手提包乘客29%。
在交通研究中,考慮實際情形下,行人流中包含有具備不同行人個體屬性而產生不同交通特性和行為偏好的個體,因此應該充分考慮行人異質性,對乘客進行類別分類,按類別標定參數。
基于行人異質性對樞紐車站乘客微觀選擇行為進行分析。在既有研究的基礎上,根據調研數據,對行人站臺樓扶梯選擇進行分析,確定改進模型的回歸系數和預測準確率,本文選擇目前較為常見的二元Logit 模型進行分析。參考史芮嘉等[7]和朱昌穩(wěn)[8]的研究,選取排隊人數、攜帶行李數量、年齡和時間敏感性為主要因素進行建模分析。
2.1.1 模型構建
基于采集數據,進行二元Logit 回歸分析。
乘客選擇樓梯的效用函數表示為:
乘客選擇電扶梯的效用函數表示為:
式中:L表示選擇自動扶梯的乘客排隊長度;G表示乘客攜帶行李情況;N表示樣本乘客的年齡;T表示樣本乘客的時間敏感程度,速度高于1.5m/s可以認為乘客時間敏感性高[8]。
2.1.2 參數標定
根據樓扶梯處的實際采集數據(共采集83組),采用數據處理軟件對參數進行擬合,參數擬合結果如下式所示:
行人的選擇行為與排隊人數、攜帶行李數量、年齡和時間敏感性都相關,其中時間敏感性對選擇影響較為明顯。模型預測準確率如表1 所示,樓扶梯選擇行為的預測準確率為94%。其中選擇扶梯的預測準確率為97.1%,即實際69 人選擇扶梯,預測67 人選擇扶梯;選擇樓梯的預測準確率為78.6%,即實際14 人選擇樓梯,預測11 人選擇樓梯。
表1 樓扶梯選擇統(tǒng)計表
2.2.1 潛在類別模型構建
潛在類別模型(LCM)是用于探索分析潛在類別變量的一種模型化技術。該模型有機結合了類別數據和潛在變量,提高了類別分析的價值。建立一個完整的潛在類別模型分為三個步驟,首先進行概率參數化,然后完成模型估計,最后進行潛在分類(圖1)。
圖1 潛在類別模型建模步驟
Mplus 軟件是一個統(tǒng)計建模軟件,為研究者提供了靈活的數據分析工具,具有易于使用的圖形界面和展示數據分析結果的模式、估計和算法。本文借助Mplus 軟件展開潛在類別分析。
2.2.1.1 概率參數化
概率參數化是建立潛在類別模型的首要步驟,潛在類別模型中包含有潛在變量和外顯變量,因此對應的潛在類別模型參數包括潛在類別概率和條件概率。
潛在類別概率用來表達潛在變量X屬于T類別中某一水平t的概率,可以用表示其概率。顯然此概率受到潛在類別變量的相對大小和其水平數目T所決定,各潛在類別的概率和為1,即:
條件概率表示在潛在類別中隨機抽取一個樣本,樣本對外顯變量所顯示的概率。此概率可表示為,A表示外顯變量,i表示對應的外顯變量水平值。條件概率的成立需要滿足同一外顯水平間相互獨立和各外顯變量不同水平間也相互獨立。此時,外顯變量在各水平下的條件概率和為1,即:
在各潛在類別中,較大的條件概率值表示潛在變量對于該外顯變量比重較大,影響較強。在建立潛在類別模型前,需要進行外顯變量的分水平處理,保證分水平處理后的各外顯變量不同維度間相互完全獨立。在本文中,對乘客的六個外顯變量進行分水平處理,如性別分為男女兩個水平,速度按大小分為五個區(qū)間水平,組群行為分為有無兩個水平等。
2.2.1.2 模型估計
實測數據的外顯變量在考慮各觀察數據潛在屬性后,也應當滿足局部獨立性條件,如果把觀察數據的類別屬性考慮在內,外顯變量之間應該是完全獨立無關的。在潛在類別分析中,模型估計主要采用極大似然估計方法。對于一個具有t個潛在類別的潛在變量X的潛在類別模型,極大似然估計函數可以表示為:
將上述兩式做除法,就可以得到各潛在類別中外顯變量各水平的極大似然概率。
2.2.1.3 概率適配性
在模型構建完成后需要對模型進行評價,選擇出擬合度高、參數適當的模型。常見的模型適配方法有極大似然法,Pearsonχ2,AIC 和BIC 四種。
潛在類別模型利用極大似然法,對各單元格的觀察次數和期望次數的差異情形利用對數函數轉化成似然卡方統(tǒng)計量G2,來反映模型擬合度。另一種檢驗方法是直接使用Pearsonχ2來計算模型擬合度,公式如下:
AIC 指標是基于信息理論模型適配指標,用于不同模型適配優(yōu)劣比較。AIC 指標由極大似然算法推導而來。若存在h個需要比較的模型,則AIC 表示為:
其中:為第h個模型自由度, 為第h個模型適配度的卡方值。
BIC 指標是用于改善AIC 指標在數據樣本量大時漸進性不足的問題。定義為:
2.2.1.4 潛在分類
分類是潛在類別分析的最終目的,將所有樣本數據分到對應的潛在類別中,即通過新的類別變量來解釋觀察值的后驗類別屬性。利用貝氏分類法進行分類,計算方法如下。
利用式(15)求出旅客屬于各個潛在類別的后驗概率,根據后驗概率大小判斷乘客所屬潛在類別,進而實現分類。
2.2.2 乘客類別分析案例
對在車站站廳、站臺和出站閘機處采集的208組調研數據進行潛在類別分析。外顯變量選取是潛在類別分析的重要準備,結合調研統(tǒng)計信息數據,最終選擇外顯變量為以下六個:性別、年齡、行李量、同伴群行為、速度、對車站舒適程度和樓扶梯選擇行為。其中樓扶梯選擇行為根據2.1 節(jié)所構建的Logit 模型選擇概率進行判定。
2.2.2.1 數據準備
在實際建模過程中,考慮年齡、速度等數據取值范圍廣,行李攜帶形式多樣,若直接選擇自然值進行分析,會造成過多的參數估計,影響結果準確性。所以對原始數據進行編排處理,以數字表示外顯變量的程度水平,遵循規(guī)則和處理結果見表2。
表2 外顯變量分水平處置表
按照以上規(guī)則對采集的數據進行處理,將數據轉化成數值信息,作為模型輸入。
2.2.2.2 結果評價
模型擬合過程中,并不確定將潛在類別分為幾類最合適,所以采用逐次計算的方法,即設定潛在類別由1 開始逐一增加,直到找到最好的模型匹配結果為止。根據模型擬合結果,一般選用Pearson卡方(χ2)、似然比卡方(G2)和信息指數AIC 和BIC、aBIC 來對潛在類別模型的擬合優(yōu)度進行評價比較,這些指數均越小越好。
表3 列出了M1~M6 模型的擬合結果。根據適配指標可知,當潛在類別為4 時,模型滿足數值擬合的要求。潛在類別由1 至4 逐次增加,似然比Log (L)絕對值、似然比卡方(G2)和Pearson 卡方(χ2)逐漸減小,BIC 指標逐漸增大,但AIC 和aBIC指標在M4模型中達到最小值。綜合上述結果,可以認為潛在類別分為4 類時,更加接近樞紐地鐵車站乘客類別的理想模型。
表3 不同類別模型適配指標
2.2.2.3 參數估計結果
對調研數據采用M4 模型進行潛在類別分析,表4 表示不同類別人數及概率,可以看出,第3類別的乘客人數最多,占比為38.94%,占比最大。第4 類別和第1 類別次之,分別為26.92%和19.71%。第2 類別占比較少,為14.42%。
表4 潛在類別概率統(tǒng)計
2.2.2.4 不同類別乘客出行特征分析
為更好地區(qū)分樞紐地鐵車站內乘客異質性,需要對前文所得到的四個潛在類別進行形象化命名。如圖2 所示,將各類別乘客在不同外顯變量維度水平的條件概率進行統(tǒng)計,可以明顯看出各類別乘客間的差異。
圖2 各潛在類別條件概率分布圖
綜上,對四個類別乘客行為特征分析如下:
類別1:不熟悉環(huán)境低速乘客。該類乘客走行速度慢,半數乘客攜帶單件行李,對車站環(huán)境不夠熟悉,認為是首次或少次到達的鐵路旅客或地鐵乘客。
類別2:遠途組群乘客。該類乘客以中年和兒童為主,有明顯的組群行為,對車站環(huán)境一般熟悉,且多數攜帶箱包行李,認為是多次乘坐鐵路遠途出行的組群乘客。
類別3:地鐵通勤乘客。乘客以未攜帶行李和攜帶背包乘客為主,乘客對車站環(huán)境較為熟悉,且有半數乘客會選擇樓梯,認為是地鐵通勤乘客。
類別4:普通鐵路旅客。該類乘客對車站環(huán)境非常熟悉,乘客間存在組群行為,且走行速度高于平均速度,乘客攜帶行李形式豐富,認為是經常前往車站乘車的普通鐵路旅客。
隨著高速鐵路和地鐵的興起,兩者在乘客出行方式選擇中占比重越來越大,吸引了大量的客流。本文對高鐵-地鐵銜接樞紐站中的地鐵車站乘客行為異質性進行了深入分析和研究。對北京地鐵北京西站乘客基本參數(性別、年齡、速度、行李量等)進行采集,使用二元Logit 方法和潛在類別模型方法對乘客微觀選擇行為和乘客類別進行研究。選擇排隊人數、攜帶行李數量、年齡和時間敏感性作為主要因素構建了乘客樓扶梯選擇的概率模型,并根據實際采集數據實現模型參數標定,對采集樣本的選擇概率進行計算。以實際采集數據和行人樓扶梯選擇概率為外顯變量,使用潛在類別模型方法對車站行人異質性進行研究。借助Mplus 軟件進行建模分析,實現行人類別劃分。根據乘客在外顯變量各維度水平條件概率和生活實際經驗,將乘客分為不熟悉環(huán)境低速乘客、遠途組群乘客、地鐵通勤乘客和普通鐵路旅客四個潛在類別,結果良好合理,研究成果能夠為行人微觀仿真研究中乘客的異質性描述提供新的思路和方法。