• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      多源數(shù)據(jù)融合的出行者畫像研究

      2017-06-19 03:24呂明程歆
      科技創(chuàng)新導報 2017年10期

      呂明+程歆

      摘 要:用戶畫像分析利用用戶使用手機、PC時留下的網(wǎng)頁瀏覽痕跡等進行分析,確定并勾勒用戶在互聯(lián)網(wǎng)中的身份,完整地構建用戶畫像能夠相對明確地了解用戶需求,這對于互聯(lián)網(wǎng)時代提升用戶體驗非常重要。該文通過將用戶畫像的概念轉移應用到交通領域,利用多源出行數(shù)據(jù)描繪出行者與交通行為畫像,分析出行者交通選擇行為在不同交通狀況下的異同,為交通規(guī)劃決策提供量化支持和決策依據(jù)。

      關鍵詞:出行者畫像 出行選擇 多源數(shù)據(jù)融合 出行鏈

      中圖分類號:P208 文獻標識碼:A 文章編號:1674-098X(2017)04(a)-0143-03

      所謂用戶畫像,一是指單個用戶所有標簽的集合,通過可以獲取的用戶的社會屬性(如性別、年齡、工作、收入等),將用戶所有的選擇偏好綜合起來,勾勒出該用戶的整體特征與輪廓;二是根據(jù)其屬性或標簽集進行分類和預測,從而實現(xiàn)特定的目的,如信用評級、受眾類型等的劃分。用戶畫像更深層次的意義,是根據(jù)用戶數(shù)據(jù)和行為,為特定的客戶進行按需定制。在大數(shù)據(jù)分析中對特定的用戶群體進行分類分析,形成不同維度的屬性標簽,從而采取不同的商業(yè)行為和措施,以達到特定的利益目標。

      對于出行者行為的畫像來說,首先需要指出的是分析的對象不是特定的某個出行者,而是每個出行者參與到整個交通系統(tǒng)中所呈現(xiàn)的群體行為,從非集計的角度來分析和研究個體行為對整個交通系統(tǒng)的影響,同時對相同交通行為的選擇結果進行分析,找出影響群體交通選擇行為的主要因素,量化影響因素的程度和范圍。

      1 多源交通數(shù)據(jù)的搜集和應用

      隨著GPS設備和智能手機應用的普及,與交通相關的數(shù)據(jù)已經(jīng)從傳統(tǒng)的粗放型、局部性的數(shù)據(jù)逐漸細化,以下是大數(shù)據(jù)時代下產(chǎn)生的與交通相關的新型數(shù)據(jù)。

      (1)GPS數(shù)據(jù)是車載GPS設備在指定的時間間隔內(nèi)記錄的速度、方向角、經(jīng)緯度信息、時間戳以及其他信息。現(xiàn)階段GPS設備廣泛應用于公交車輛、出租車輛、網(wǎng)約車以及其他特種車輛,記錄了車輛在運營過程中的位置信息以及其他一些與運營相關的信息。

      (2)公交刷卡數(shù)據(jù)是指各個城市發(fā)行的針對公共交通(通常包括公交車和軌道運輸)的IC卡在使用時所記錄的刷卡信息。刷卡數(shù)據(jù)對于公交公司優(yōu)化企業(yè)運營、提高服務質量有很大的幫助,同時也可以反映出出行人流在空間和時間上的移動規(guī)律。

      (3)手機信令數(shù)據(jù)是由手機信號發(fā)射和接收所產(chǎn)生的數(shù)據(jù),通常指通訊運營商為維持移動通訊的正常運行而搜集和回收的數(shù)據(jù)。但是隨著GPS模塊在智能手機的廣泛運用,部分APP也可以定期收集并上傳使用者的位置以及其他一些與交通相關的信息。

      (4)網(wǎng)頁爬取數(shù)據(jù)是一個比較寬泛的概念,在這里主要是指從特定的網(wǎng)站如搜房網(wǎng)、58同城、美團、大眾等爬取的與出行者活動相關的設施如居住場所、辦公場所、餐館、運動場所、娛樂場所等。

      (5)卡口數(shù)據(jù)與路網(wǎng)數(shù)據(jù)??跀?shù)據(jù)指的是在某些控制性的道路路段斷面安裝線圈、微波、紅外等設備,監(jiān)測斷面的車流量和速度等信息,是監(jiān)測交通流量的主要方法。路網(wǎng)數(shù)據(jù)指的是道路路段的基本信息,如路段長度、寬度、車道數(shù)、設計通行能力以及拓撲結構;運行于其上的交通管理控制設施;實時的道路運營情況如道路大修、事故占道等信息。

      與交通相關的數(shù)據(jù)還有很多,現(xiàn)階段對交通數(shù)據(jù)的處理、應用和分析通常只是針對單數(shù)據(jù)源的。由于數(shù)據(jù)源本身的限制,導致數(shù)據(jù)分析的結果或多或少帶有偏差,多源數(shù)據(jù)融合的過程是將以上數(shù)據(jù)綜合起來分析,利用數(shù)據(jù)挖掘和分析的方法對整個城市的出行者的交通活動做更精準的提取、量化和擴樣,從而盡量避免單一數(shù)據(jù)源分析所帶來的樣本偏差。

      2 出行者行為畫像

      2.1 多源出行數(shù)據(jù)融合畫像

      出行者多源出行數(shù)據(jù)融合畫像就是基于以上的基本理論,整個多源數(shù)據(jù)融合過程其實是作為整個交通大數(shù)據(jù)應用的一部分,使用多源數(shù)據(jù)提取出行者的詳細出行信息,形成并探討其實際出行選擇與備選方案之間的差別;對出行鏈效用方程中的參數(shù)進行估計,并將出行根據(jù)大數(shù)據(jù)以及傳統(tǒng)的城市人口數(shù)據(jù)和土地規(guī)劃等結合起來對整個城市的出行者進行泛化和擴樣,利用非集計模型對整個城市的出行者進行仿真并將結果應用到實際工作中;同時,仿真模型再與大數(shù)據(jù)中的各項觀測數(shù)據(jù)進行對比,矯正模型參數(shù)和精度。整個過程循環(huán)遞進優(yōu)化,同時勾勒的出行者畫像也在不斷的迭代調(diào)優(yōu)中更加準確。

      2.2 出行鏈

      出行者通常會按照自己的意愿或作為社會一份子而產(chǎn)生的活動安排出行,而各項社會活動或生計需求就會產(chǎn)生各種時空上的移動,把出行者的各項活動之間用出行連接起來就形成了出行鏈。

      一般情況下,正是大量工作開始時間相近的剛性出行活動導致了交通系統(tǒng)的高峰期,而大量出行時間、地點等的彈性可變的非剛性出行導致了交通系統(tǒng)的不確定性。基于出行鏈的出行理論主要有以下5點:(1)出行的需求源于社會經(jīng)濟活動的需要;(2)人的行為受時空的限制要在不同時間和地點進行不同活動,并且去各個活動地點都要花費時間;(3)通常人的出行都是以家庭為基本單位,家庭影響個人的活動和出行決策。許多決策作為家庭決策的一部分,受家庭中其他成員的限制,所以家庭類型和生活方式也影響個人的選擇;(4)活動和出行決策是動態(tài)的,一次決策受過去和預期事件的影響[1],同時也受到當前環(huán)境的影響,出行計劃可能根據(jù)實際情況而實時變化;(5)出行過程中出行者將面臨一定數(shù)量的選擇,并在各個選項間衡量對比后做出決策,最終實施的出行計劃雖然可能由于路網(wǎng)的動態(tài)變化和交通系統(tǒng)的不確定性導致與預期有所差別,但卻是決策時選擇集中效用最大的一項。

      前文已經(jīng)提到,作為出行行為決策的出行者(或家庭)在出行活動中面臨的一系列可以選擇的、選擇分支相互獨立的集合中,會選擇他認為效用最大的選擇項,這個被稱為效用最大化行為假說。而量化這一過程中目前廣泛應用的模型為Logit模型,Logit模型正是以某次出行行為的選擇集為基礎設定效用函數(shù),計算各選項被選擇的概率并估計影響各選項的參數(shù),而將每一次的出行連接起來,就形成了基于一天活動的出行鏈。其效用方程如下所示:

      其中Sact為第q項活動如工作所產(chǎn)生的效用值,計算方法如下:

      Sdur,q為第q項活動持續(xù)時間所產(chǎn)生的效用值。

      Swait,q為第q項活動開始前等待所產(chǎn)生的效用,通常此項效用為負值,即等待時間越長,其產(chǎn)生的負效用越高。

      Slate.ar,q為第q項活動到達活動地點晚于預計時間的效用,通常用于衡量到達工作地點晚于規(guī)定時間的懲罰值。

      Searly,dp,q為第q項活動期間提前結束此項活動而產(chǎn)生的效用值,通常為負。

      Sshort.dur,q為第q項活動停留時間的效用值,與Searly,dp,q稍有不同,通常每項活動都設有一最短停留時間,有的活動即使遲到早退,只要停留時間超過規(guī)定閥值,就不會產(chǎn)生負效用,如周日的逛街購物計劃。

      Strav,mode(q)為活動間轉換產(chǎn)生的出行效用,通常計算方法如下:

      出行的計算考慮了出行模式Cmode,距離dtrav,q、出行時間ttrav,q、換乘因素Xtransfer,出行費用mq等,而其中的參數(shù)就是描述出行者畫像的主要量化指標。這些參數(shù)的值決定了不同出行者在面臨不同的選擇方式時的決策結果,對這些參數(shù)的估計就是多源數(shù)據(jù)融合的出行者畫像的最重要的部分,也是對出行者出行過程最精確的描述。

      2.3 出行者行為分析和仿真

      通過多源數(shù)據(jù)的融合,可以得到部分出行者的出行信息,再根據(jù)城市土地規(guī)劃、各區(qū)人口數(shù)據(jù)等將數(shù)據(jù)進行泛化擴樣,從而得到了整個城市所有出行者一天的交通活動的初始計劃,并利用MATSim對其進行仿真。為保證模型的仿真精度,使用MATSim對整個城市的交通系統(tǒng)的運行狀況及出行者的出行采取開放的方式,即出行者的出行畫像、基本出行集等按照多源交通大數(shù)據(jù)進行校正,每一次的數(shù)據(jù)矯正是建立在其他數(shù)據(jù)源的基礎上進行迭代尋優(yōu),以迭代收斂為主要目標,旨在充分利用和融合各數(shù)據(jù)源,從而使模型精度不斷提高。

      3 應用

      對出行者的出行行為進行畫像,根據(jù)其選擇偏好進行參數(shù)估計,最終通過仿真模型將整個城市的模型進行仿真,其主要的應用可以體現(xiàn)在以下幾個方面。

      3.1 交通相關政策的輔助決策

      通過對如擁堵收費、劃定公交車專用道、換乘優(yōu)惠、停車費用調(diào)控等相關交通政策實施前后整個交通系統(tǒng)運行狀況的仿真,可精確量化政策實施前后各項交通指標,如道路使用效率、出行者廣義出行費用的變化以及出行方式變化比例等,為相關政策和措施提供決策支持。

      3.2 片區(qū)交通改善的前后對比

      對于某一片區(qū)交通設施、交通組織方式等的改善方案進行仿真,針對改善目的對各個方案進行量化評價和對比,從而選出最優(yōu)改善方案。

      3.3 出行者出行的出行劃分和誘導建議

      對整個深圳市區(qū)域內(nèi)所有出行者的仿真過程,是對出行者出行時所面臨的一系列的決策進行分析,通過對這些離散選擇模型的分析和研究,了解其選擇過程中的決定因素,對整個系統(tǒng)對仿真和掌控了解可以很好地把握各項交通相關決策的臨界點,對出行進行誘導,從而降低路網(wǎng)交通壓力,提高出行者出行效率。

      3.4 公共交通優(yōu)化的對比與決策支持

      對整個深圳市的交通系統(tǒng)進行仿真,了解使用公交系統(tǒng)的實際情況,掌握公交、地鐵的客流集散情況,可根據(jù)實際的客流集散點對公交線路、班次進行優(yōu)化,同時對比優(yōu)化前后的交通狀況。

      3.5 交通狀況預測和預警

      通過設置仿真時間,基于現(xiàn)狀交通進行仿真,同時可以回撥或加快仿真對形式、對交通狀況進行預測,對交通擁堵區(qū)域提前預警,從而可以提前采取相應的管理、應對方案,對整個交通的運行狀況進行掌控。

      3.6 重大事件的交通疏散方案對比

      對重大交通事件的疏散方案進行仿真對比,對各方案的疏散效率進行分析評價,從而找出最終方案;或通過設置限定條件與疏散要求,對重大事件發(fā)生時的疏散進行仿真,從而自動獲取疏散方案。

      3.7 車輛調(diào)控方案評價

      通過仿真的手段可以了解全市機動車擁有量逐年增加的情況下動態(tài)和靜態(tài)交通設施的承載能力,有效地對機動車擁有量進行宏觀調(diào)控。

      3.8 路網(wǎng)可達性、可靠性評價

      通過分析出行者個人的出行鏈和出行方案,對整個深圳市的路網(wǎng)可達性以及可靠性進行有效的量化評價。

      4 結語

      在“互聯(lián)網(wǎng)+”的背景下,大數(shù)據(jù)技術在交通業(yè)務領域的應用不斷擴展,而智能手機、物聯(lián)網(wǎng)等技術的不斷更新,進一步觸發(fā)了交通規(guī)劃和管理模式的轉變。在妥善解決個人信息安全與隱私保護的前提下,多源數(shù)據(jù)的融合和應用在未來一段時間內(nèi)將成為趨勢。利用數(shù)據(jù)融合對出行者的交通相關行為的畫像,有利于各方充分利用現(xiàn)有的數(shù)據(jù)資源,有效實現(xiàn)規(guī)劃和管理的精準實施和相關政策、措施的支撐,同時在出行者行為和選擇模型方面也可進行創(chuàng)新性的探索和實踐。

      參考文獻

      [1] 余孟杰.產(chǎn)品研發(fā)中用戶畫像的數(shù)據(jù)模建——從具象到抽象[J].設計藝術研究,2014(6):60-64.

      [2] 劉海,盧慧,阮金花,等.基于“用戶畫像”挖掘的精準營銷細分模型研究[J].絲綢,2015(52):37-47.

      [3] 張慷.手機用戶畫像在大數(shù)據(jù)平臺的實現(xiàn)方案[J].信息通信,2014(2):266-267.

      汤原县| 斗六市| 龙州县| 罗源县| 开原市| 天台县| 青阳县| 如皋市| 平山县| 中江县| 阳曲县| 灯塔市| 青田县| 和田县| 安宁市| 微博| 大厂| 固安县| 渭源县| 彭山县| 晋中市| 承德市| 邵阳县| 栾城县| 灵川县| 西青区| 大港区| 云浮市| 义马市| 梓潼县| 始兴县| 农安县| 政和县| 英吉沙县| 勃利县| 鄂托克旗| 巴东县| 达州市| 湾仔区| 历史| 册亨县|