傅 惠,姚奕鵬,陳賽飛
(廣東工業(yè)大學 機電工程學院,廣東 廣州 510000)
樞紐站客流存在流量大、流線復雜的特點。科學有效的客流組織優(yōu)化方案是提升站內(nèi)交通流效率的重要手段。智能體模型仿真可針對樞紐站內(nèi)實際交通流情況描述旅客站內(nèi)的運動特征,從實際數(shù)據(jù)出發(fā)評估站內(nèi)客流組織優(yōu)化方案,相較于采用數(shù)值仿真的方案能夠更加細致地描述站場交通流情況。為減少站內(nèi)客流組織優(yōu)化方案的構建成本,評估方案的有效性,基于自主學習智能體模型的樞紐站流線仿真技術十分必要。
現(xiàn)有的樞紐站客流組織優(yōu)化方案的制定方法大致可分為兩類。第1 類從宏觀旅客交通流建模出發(fā)[1],通過建立多種宏觀評價指標[2],利用宏觀交通流規(guī)律,指導生成樞紐站的客流組織優(yōu)化方案。例如,Liu 等[3]基于多層時間序列著色Petri 網(wǎng)絡和多目標優(yōu)化模型,研究地鐵站應急疏散場景下的人員疏散方案。Guo 等[4]建立地鐵站的疏散指標與乘客行為、電梯配置等運營因素之間的關系模型,結合多目標優(yōu)化模型獲得地鐵站客流疏散最優(yōu)化方案。第2 類從微觀角度出發(fā),依賴Anylogic、Legion 等基于智能體模型或元胞自動機的行人仿真軟件,細致刻畫行人個體的行為與交互[5-6],結合運營效果評估指標[7],生成組織優(yōu)化方案并做出評價[8-10]。例如,孫立山等[11]以北京市宋家莊交通樞紐為例建立微觀仿真模型,研究樞紐站的設施部署的合理性;Liu 等[12]基于Anylogic 仿真軟件,研究分層次的城市火車站行人網(wǎng)絡系統(tǒng)。
目前,采用宏觀交通流建模的方法缺乏對樞紐站場客流狀況的細致描述,難以生成可具體實施的應用方案;雖然微觀角度建模的方法是基于智能體模型的微觀仿真,但是缺少利用實際數(shù)據(jù)驗證行人行為模型的手段,難以保證模擬的交通流模型符合實際規(guī)律?,F(xiàn)有智能體仿真軟件無法超出單個計算節(jié)點的性能局限,仿真規(guī)模和效率受到較大限制。
針對上述問題,本文從微觀仿真角度出發(fā),構建基于自主學習智能體模型的樞紐站流線仿真框架,提供了仿真中行人智能體對實際數(shù)據(jù)的學習能力。同時,通過分布式的智能體仿真計算框架,提供仿真超出單個計算節(jié)點性能限制的能力,仿真規(guī)模和效率得到較大提升。最后,以廣州南站作為仿真場景,基于站場實際運營數(shù)據(jù),利用所提出的樞紐站流線仿真,對站內(nèi)客流組織優(yōu)化方案進行評估。
基于智能體模型構建的仿真,可以從樞紐站的各個要素出發(fā),設計每一個要素智能體模型之間的交互行為,以此達到符合現(xiàn)實規(guī)律的仿真效果。19 世紀80 年代Bratman 基于對理性和意圖的哲學分析,提出BDI 模型 (Belief-Desire-Intention, BDI),將個體的思維組成定義為信念 (belief)、愿望 (desire)、意圖 (intention) 3 個組件,提供了個體組成的抽象表達模型[13]。其中,信念表現(xiàn)為個體的能力和知識,代表個體對環(huán)境和自身的狀態(tài)的認知;意圖表現(xiàn)為個體為實現(xiàn)各種目標而采取的方法和計劃;愿望表現(xiàn)為個體的目標。
BDI 模型能夠有效描述實體的感知、決策、響應的過程,可體現(xiàn)人、機器等實體的行為邏輯,適合作為智能體模型的基本形式。該模型廣泛應用于機器人等智能體系統(tǒng)的智能體設計框架中[14-15]。但是,BDI 模型在實際應用過程中,難以對實體的抽象邏輯進行描述,因此,本文結合實體的實際行為數(shù)據(jù),提出能夠擬合實體抽象行為邏輯的自主學習智能體模型?;贐DI 模型,本文任意智能體個體的自我推理和決策過程可抽象為如下過程 (見圖1) :智能體通過信念組件獲取環(huán)境感知信息,由愿望組件基于環(huán)境信息生成當前的目標,意圖組件獲取當前目標結合環(huán)境信息,生成自身的動作或計劃并實施,進而更新自身狀態(tài)。
圖1 基于BDI 模型的智能體自我推理和決策過程Figure 1 Self-reasoning and decision-making processes of agents based on BDI model
考慮主要對樞紐站內(nèi)的旅客和設施智能體的狀態(tài)和行為進行仿真推演,本文基于BDI 模型,構建了可用于描述樞紐站內(nèi)旅客和設施智能體行為的基本屬性與屬性更新模型。
智能體包含兩類基本屬性,分別是參數(shù)屬性與方法屬性。任意智能體i的參數(shù)屬性如下。
1) 任務:智能體所需要完成的一系列任務流程,驅(qū)動智能體進行自身狀態(tài)和行為推演。例如旅客智能體在站內(nèi)的乘車流程。
2) 狀態(tài):智能體所具備的一系列需要被計算更新的狀態(tài)信息。例如旅客智能體的空間位置、移動速度等信息。
3) 目標:智能體經(jīng)過自我決策后生成的短期行動目標。例如旅客根據(jù)當前自身位置和檢票口位置,決定下一時刻到達的位置。
對任意智能體i,其在t時刻的屬性表示為
其中,Pi,t、Ai,t、Si,t分別為智能體i在t時刻的任務、目標、狀態(tài)。
假設t時刻下智能體數(shù)量為N,那么,仿真中所有智能體的參數(shù)屬性構成當前時刻環(huán)境Et= {Ci,t},i∈{1, 2, ···,N}。
任意智能體i的方法屬性如下。
1) 環(huán)境感知方法。
在t時刻下,智能體i的環(huán)境感知方法Fiu中,智能體獲取環(huán)境信息Et,結合自身參數(shù)屬性Ci,t,篩選出智能體自身可獲知的環(huán)境信息ei,t,獲得當前需完成的事項pi,t,返回獲知的環(huán)境信息ei,t和當前所需完成的事項pi,t。描述為
2) 動作決策方法。
在t時刻下,智能體i動作決策方法Fid中,智能體結合自身可獲知的環(huán)境信息ei,t、當前所需完成的事項pi,t和自身的狀態(tài)屬性Si,t,計算生成并返回當前短期決策目標Ai,t+1。描述為
3) 動作實施方法。
在t時刻下,智能體i的動作實施方法Fia中,智能體獲取當前短期決策目標Ai,t+1和自身的狀態(tài)屬性Si,t,計算生成并返回智能體下一時刻的狀態(tài)屬性Si,t+1。描述為
為實現(xiàn)智能體能夠準確描述對應實體的自我推理和決策行為,賦予智能體學習實際實體行為的能力,對智能體的方法屬性,采用如下兩類構建方式。
1) 根據(jù)實體的決策邏輯過程構建。
若所需構建的方法屬性行為的邏輯流程清晰且易于描述,可根據(jù)實體具體的推理決策過程,構建智能體的推理分析流程,對輸入的環(huán)境信息、所需完成的事項和自身狀態(tài)進行處理,輸出短期決策目標,構建獲得的方法作為該智能體的指定方法屬性。
2) 通過實體的行為特征學習構建。
若所需構建的方法屬性行為的邏輯流程復雜且難以描述,則考慮構建抽象描述模型對實體行為進行描述。首先需要構建實體的行為反饋模型,該模型旨在描述實體在自身的狀態(tài)為u時,所能做出的行為o。該模型依賴實體的實際行為數(shù)據(jù)進行構建,行為反饋模型描述為
其中,h為行為反饋函數(shù);U為已知的實體狀態(tài)集合;O為已知的實體行為集合。
其次,構建行為描述模型對智能體的行為進行描述,即對任意可能出現(xiàn)的狀態(tài)值u′,行為描述模型輸出該狀態(tài)下的行為o′。模型表述為
其中,g為行為描述函數(shù);ω 為行為描述模型的參數(shù);U′為實體所有行為集合;O′為實體所有狀態(tài)集合。
再次,建立參數(shù)優(yōu)化模型,對行為描述模型的參數(shù)進行優(yōu)化,使智能體通過行為描述模型學習實體的行為特征。
其中,J為所有數(shù)據(jù)標簽集合;uj、o′j、oj分別為第j個狀態(tài)值、實體行為反饋、智能體描述值。
最后,將優(yōu)化參數(shù)后的行為描述模型作為智能體的動作決策或動作實施方法,完成對智能體的動作決策或動作實施方法的構建。
該方法提供了智能體對實際數(shù)據(jù)的利用方法,通過該方法,可使智能體的描述更加符合實際規(guī)律,具備了基于實際數(shù)據(jù)的自學習能力。
基于智能體模型,根據(jù)實際樞紐站場內(nèi)要素補充對應仿真中各類要素的智能體模型的屬性,以建立樞紐站旅客流線仿真的要素智能體模型。
樞紐站內(nèi)要素包括旅客、人臉驗證閘機、安檢閘機、檢票閘機、扶梯、商鋪以及各種墻體,本文考慮建立邊界、服務臺和行人三類智能體模型抽象描述樞紐站內(nèi)的要素,智能體模型與樞紐站內(nèi)要素的抽象對照關系如表1 所示。
表1 樞紐站內(nèi)要素抽象對照表Table 1 The summary and comparison table of elements in a passenger transport hub
1.2.1 邊界智能體屬性建模
邊界根據(jù)墻體特性可抽象為不可穿透的邊界,并且不需要更新自身的狀態(tài)信息,在仿真中僅用于提供空間限制信息。因此,對仿真中邊界智能體集合W中的任意邊界w,其在t時刻的狀態(tài)Sw,t定義為
其中,Ew為邊界坐標序列,即按照在樞紐站場平面中該墻體的邊界折線的節(jié)點序列形成的坐標點序列,n為節(jié)點序列點個數(shù);Lw為邊界所在樓層。
在構建智能體仿真時,將所有墻體按照其空間信息,構建為邊界智能體。
1.2.2 服務臺智能體屬性建模
服務臺根據(jù)閘機、扶梯等設施特性,定義為可穿透的一塊功能區(qū)域,具備與行人交互、更新自身狀態(tài)的功能。對仿真中的服務臺集合E中的任意設施e,其在t時刻的狀態(tài)Se,t定義如下。
1) 服務臺的邊界,包括層和邊界坐標信息。
2) 服務臺交互的位置,包括層和邊界坐標序列信息,該邊界坐標序列即服務臺的服務區(qū)域多邊形的頂點序列。
3) 與服務臺交互后的位置LEe,包括層和邊界坐標序列信息,該邊界坐標序列即服務臺的離開服務區(qū)域多邊形的頂點序列。
4) 服務臺內(nèi)部包含的行人智能體信息集合,描述為Me,t,對任意信息,有,r為包含的行人,為集合中包含的第n個行人的進入時間。
5) 服務臺窗口數(shù)目。
6) 服務臺的單次服務時間Te。
7) 服務臺的工作狀態(tài)SOe,t,包括“開放”和“不開放”兩類狀態(tài)。
其任務屬性Pe,t定義為
其中,Pe,t為服務臺的運行時間表,服務臺按照該時間計劃調(diào)整自身服務的開放與否;tmax為最大仿真時間;為t時刻下服務臺e的工作狀態(tài),值為“開放”或“不開放”。
圖2 服務臺智能體方法屬性流程Figure 2 The framework of service agent method properties
對實際環(huán)境中的閘機與扶梯,將其入口抽象為服務臺的到達位置,出口抽象為服務臺的離開位置,工作區(qū)域抽象為服務臺的邊界,單次可通過人數(shù)抽象為服務臺的窗口數(shù)目,由此可構建閘機和扶梯智能體參數(shù)屬性。
1.2.3 行人智能體屬性建模
行人在仿真中,具備感知周邊邊界和服務設施,基于自身狀態(tài)做出行為決策的能力。對仿真中的行人集合R中的任意設施r,其在t時刻的參數(shù)屬性定義如下。
1) 行人的位置Lr,t,分別為行人二維空間位置的橫、縱坐標及其所在樓層。
2) 行人的任務序列,任務序列由一系列空間位置或服務臺智能體構成。
3) 行人當前的目標,即行人每一時刻下生成的短期目標。
行人的方法屬性定義如下。
1) 環(huán)境感知。
行人智能體根據(jù)自身位置以及感知范圍篩選所能獲取的仿真環(huán)境信息。同時,按照自身任務序列,結合當前位置判斷是否已完成目標。若已完成,則更新待實現(xiàn)事項為任務序列中的下一任務;若未完成,則保留待實現(xiàn)事項的值。
2) 動作決策。
行人智能體讀取待實現(xiàn)的事項,結合自身狀態(tài),判斷是否已到達實現(xiàn)待辦事項的位置。若未到達,則結合所需要到達的位置、可獲知的環(huán)境信息和自身狀態(tài)屬性,通過路徑規(guī)劃算法 (本文采用A*算法[16]),規(guī)劃生成行人智能體的路徑,選擇路徑的下一時刻位置作為行人智能體的目標。若已到達實現(xiàn)待辦事項的位置,且待辦事項為一個服務臺,則將該服務臺作為行人智能體的目標。
3) 動作實施。
行人智能體讀取當前目標,若目標為一個位置點,則按照行人運動學模型 (本文采用社會力模型[17])生成下一時刻行人的空間位置,并更新行人自身的狀態(tài)屬性。若目標為服務臺,行人智能體不處于服務臺中,且該服務臺仍有剩余服務空間,則將自身放置于該服務臺的行人智能體集合中。
行人智能體的所有方法屬性構成的更新流程如圖3 所示。
圖3 行人智能體方法屬性流程Figure 3 The framework of Process of pedestrian agent method properties
仿真推演的進行依賴于仿真環(huán)境中智能體的狀態(tài)屬性的同步更新。
在每一仿真時刻t時,環(huán)境中每一智能體i均按照以下更新模型生成下一時刻t+ 1 時的智能體屬性,基本更新模型描述如下。
基于上述的仿真推進過程,結合樞紐站內(nèi)旅客與設施實體的行為,補充旅客和設施智能體的屬性,在仿真過程中實時記錄各個智能體的屬性信息,即可獲得樞紐站場內(nèi)旅客流線仿真的運行數(shù)據(jù),進而對站場運營指標進行評估。
對任意智能體而言,每一次更新計算過程中,除與環(huán)境交換信息外,其計算過程均可獨立進行。因此,可構建多個計算容器,建立容器間的信息交換連接接口,使智能體在容器內(nèi)可通過信息交換連接接口與其他智能體進行信息交換,即可將多個仿真環(huán)境中的智能體分布在多個計算容器內(nèi),利用多個計算容器的計算能力進行仿真,以提高仿真的計算效率。
本文通過分布式計算的方式,將系統(tǒng)中的智能體平均分配至各個已有的計算容器中,構成計算集群。通過網(wǎng)絡代理方式接管集群中計算容器間智能體對環(huán)境信息的獲取。同時,建立一個仿真控制器,連接至網(wǎng)絡代理;構建屬性導入方法,將初始智能體屬性通過網(wǎng)絡代理下發(fā)至各計算容器構建智能體;構建仿真驅(qū)動方法,用以控制所有計算容器并同步所有智能體更新;在仿真進行過程中,仿真控制器將對每一智能體的屬性值進行匯總輸出,保留至仿真數(shù)據(jù)庫中。在計算集群中,智能體接收到仿真控制器的計算命令后,調(diào)用計算容器的計算資源,結合更新模型更新自身屬性。構建的智能體模型分布式仿真框架如圖4 所示。
圖4 基于分布式計算的智能體仿真計算框架Figure 4 The agent simulation computing framework based on distributed computing
以上構建的智能體仿真模型的優(yōu)點如下所示。
1) 實體模型構建更加真實。
相較于傳統(tǒng)仿真抽象的規(guī)律描述方式,基于BDI 模型構建的智能體模型具備更加細致的行為描述能力,結合智能體的自主學習模型,使得仿真模型具有更加符合現(xiàn)實實體行為規(guī)律的潛力。
2) 支持多類實體混合仿真。
該智能體模型具備描述任意具有自我推理和決策行為的實體的能力,行人、車輛等實體均具備這種行為,通過對智能體自我推理和決策過程的具象描述,即可搭建多類仿真智能體模型,實現(xiàn)在單個仿真內(nèi)多類實體的仿真推演。
3) 支持更大規(guī)模實體仿真。
傳統(tǒng)仿真軟件如Anylogic、Pathfinder 等,在行人仿真計算中,對計算性能的利用都局限于單臺計算機上。本文通過智能體分布式計算方式,充分利用多臺計算機的計算資源協(xié)同推進仿真,可支撐更大規(guī)模的仿真需求。
為評估智能體仿真計算框架中行人運動軌跡的誤差,以某校食堂為實驗場景,以133 名志愿者為實驗對象,開展室內(nèi)行人運動測試。實驗過程中,為志愿者定義了各自的任務序列,志愿者需按照任務序列完成到達指定位置或服務臺的任務。實驗采集了133 名志愿者在實驗場景中的運動時空軌跡,共3 296 份數(shù)據(jù),采集時長為25 min。將志愿者的開始時空斷面位置、結束時空斷面位置作為行人智能體的任務,啟動仿真獲得仿真中志愿者的行走軌跡。
對每一行人智能體,令任意行人的第j條實際軌跡時空數(shù)據(jù)為qj。
其中,xj、yj、tj分別為該行人的第j條實際軌跡的橫坐標、縱坐標、到達位置時間。
令行人智能體仿真中行人的第k條仿真軌跡時空數(shù)據(jù)為。
行人智能體運動軌跡誤差評估指標為
其中,K為行人仿真軌跡數(shù)據(jù)標簽集合。
該指標描述了單位仿真步長下行人智能體與實際行人運動的平均誤差距離。其中,仿真步長為1 s,誤差距離單位為m,指標單位為m/s。
使用上述指標對所有智能體的仿真運動軌跡進行誤差評估,得到誤差直方圖如圖5 所示。其中,91%行人智能體的運動誤差落在[0,12.6]的范圍內(nèi);9%行人智能體產(chǎn)生了大于12.6 m/s 的運動誤差,即大部分行人智能體在單次仿真下產(chǎn)生的平均偏差小于12.6 m/s。這說明本文建立的行人智能體動作決策和實施模型能夠在較小的誤差范圍內(nèi)擬合行人在設施內(nèi)部的運動行為。
圖5 行人智能體模型運動誤差Figure 5 Motion errors of the pedestrian agent model
樞紐站場運營過程中,在客流水平較低時期,通過減少各類服務設施的開放數(shù)量,可減少運營成本;在客流水平較高時期,樞紐站場的服務設施開放量應滿足旅客站內(nèi)的服務需求,提高旅客在樞紐站內(nèi)的服務體驗。樞紐站場的旅客進站流程分為實名驗證、乘坐扶梯、安檢候車。其中,實名驗證過程中的閘機數(shù)量和安檢候車過程中的安檢通道開放數(shù)量會影響旅客在站內(nèi)的服務體驗和站場運營成本。為降低設施運營成本并提高旅客在站內(nèi)的服務體驗,以廣州南站作為仿真場景,基于站場實際運營數(shù)據(jù),通過上述智能體仿真計算框架構建樞紐站旅客流線仿真。
廣州南站的日常規(guī)旅客出行量約為15 萬人,主要集中于8 時至20 時。取2021 年12 月15 日廣州南站的實際入站客流數(shù)據(jù)作為實驗數(shù)據(jù),當日入站旅客總量為165 306 人,每小時客流分布如圖6所示。根據(jù)廣州南站實際建筑布局和設施部署情況,實驗中于廣州南站模型的一層實名驗證的東北區(qū)、東南區(qū)、西北區(qū)、西南區(qū),分別部署了17、15、16、15 臺實名驗證設備;在一層與二層換層接駁處、二層與三層換層接駁處均部署3 臺雙向扶梯;在三層的候車區(qū)入閘處共計部署44 處安檢閘機?;诜植际阶灾鲗W習智能體模型的樞紐站旅客流線仿真如圖7 所示。根據(jù)仿真獲取設施運營成本和旅客站內(nèi)運動時間,通過調(diào)整優(yōu)化實名驗證閘機和安檢閘機的開放數(shù)目及時間計劃表,達到最小化樞紐站的設施運營成本和旅客站內(nèi)通行時間的目標。
圖6 客流需求和優(yōu)化方案Figure 6 Passenger flow demand and optimization solutions
圖7 廣州南站“實名驗證”、“乘坐扶梯”、“安檢候車”仿真 (下)、廣州南站旅客進站仿真 (上)Figure 7 The passenger simulation of Guangzhou South Railway Station (top), the simulation of "Real-Name Verification", "Escalator Riding","Security Checking and Waiting" in Guangzhou South Railway Station (bottom)
優(yōu)化模型為
其中,m為所有設施總體運行時間;l為旅客在站內(nèi)的平均通行時間;a1、a2分別為設施成本和通行時間成本的權重;F為廣州南站旅客流線仿真模型;Q、S分別為實名驗證閘機、安檢閘機的開放數(shù)目時間表;F為進站旅客數(shù)目時間表;f4,f5,···,f22分別表示廣州南站一天內(nèi)從4:00, 5:00, ···, 22:00 起始1 h 內(nèi)的進站旅客數(shù);q4,q5,···,q22表示對應時間段內(nèi)實名驗證閘機開放數(shù);s4,s5,···,s22表示對應時間段內(nèi)安檢閘機開放數(shù);M1和M2分別是實名驗證閘機和安檢閘機的數(shù)目。
輸入的客流需求及優(yōu)化結果如圖6 所示。圖6的客流需求為平峰時間段下的每小時進站旅客數(shù)。根據(jù)優(yōu)化結果可知,閘機開放數(shù)量與旅客數(shù)量成正比,在高客流時期應開放更多閘機口,且實名驗證與安檢閘機的平均服務時間相似,求得兩類閘機的開放數(shù)目也接近。
優(yōu)化前后所有閘機的平均排隊長度對比如圖8所示??梢娫趹脙?yōu)化方案后,閘機的平均排隊長度增加幅度較小,對旅客在樞紐站內(nèi)的運動不會造成較大影響。同時,相對于所有閘機開放的運營方案,選擇性開啟閘機的方案節(jié)省了大量閘機運營的成本,使閘機的負載率由100%降低至57%。
圖8 優(yōu)化前后閘機平均排隊長度Figure 8 Average queue lengths of gates before and after optimization
因此,在客流平峰期,南站可參照圖6 中實名驗證設施和安檢通道開放數(shù)目,調(diào)節(jié)站場的設施開放數(shù)目,降低站場的設施開放運營成本。
本文基于BDI 模型構建一種具備自主學習能力的智能體模型框架,結合其分布式仿真驅(qū)動,可支持規(guī)模大、種類多、邏輯復雜的實體仿真。在此基礎上,以樞紐站場的客流組織優(yōu)化工作為背景,構建樞紐站場的要素智能體模型,同時評估了行人智能體模型的誤差。搭建了基于廣州南站的“實名驗證”、“乘坐扶梯”、“安檢候車”流程的旅客流線仿真模型,構建設施計劃表優(yōu)化模型獲得了廣州南站各類設施的服務計劃表。本文得到以下結論。1) 通過本文建立的智能體模型及其構造方法可支撐樞紐站內(nèi)的行人流線仿真,以較低的誤差模擬行人在設施內(nèi)的運動行為;2) 廣州南站的入站流線的設施能夠滿足日常運營的入站客流需求,多余的設施能力能夠通過設施優(yōu)化方案得以節(jié)省。
本文僅對站內(nèi)旅客的行為進行整體的建模,未考慮到不同出行需求、不同出行時間下的旅客群體的行為差異。從站場運營服務的靈活性來看,考慮旅客行為的差異性,有助于站場更加靈活調(diào)整站內(nèi)設施部署方案,提供更加穩(wěn)定的出行服務。未來工作將從旅客群體角度出發(fā)構建旅客模型,進一步提升對站場旅客的描述水平。