錢澤昊,劉 瑾,張佳樂
(上海立信會(huì)計(jì)金融學(xué)院 上海 201209)
近年來(lái),隨著社會(huì)經(jīng)濟(jì)的高速增長(zhǎng),我國(guó)旅游產(chǎn)業(yè)發(fā)展迅猛,由于生活水平的穩(wěn)步提高,旅游業(yè)已成為全世界人民休閑和生活方式的重要組成部分。根據(jù)世界旅行旅游理事會(huì)發(fā)布的數(shù)據(jù),2019 年旅游業(yè)是世界上國(guó)內(nèi)生產(chǎn)總值(GDP)增長(zhǎng)率的第三大產(chǎn)業(yè)。據(jù)報(bào)道,旅游業(yè)的增長(zhǎng)率為3.5%,明顯高于全球經(jīng)濟(jì)GDP 的增長(zhǎng)率2.5%。特別是,旅游業(yè)在中國(guó)創(chuàng)造了近8 000 萬(wàn)個(gè)就業(yè)機(jī)會(huì),占全國(guó)總勞動(dòng)力的10.3%。同時(shí),其產(chǎn)值估計(jì)為10.9 萬(wàn)億元,占中國(guó)經(jīng)濟(jì)的11.3%。世界旅游業(yè)的快速發(fā)展,促進(jìn)了中國(guó)自身旅游業(yè)的蓬勃發(fā)展。中國(guó)的旅游業(yè)已經(jīng)進(jìn)入“大眾旅游”階段,人們的旅游意愿不斷提高??梢灶A(yù)見,即使在后疫情時(shí)代,國(guó)內(nèi)旅游市場(chǎng)也將繼續(xù)蓬勃發(fā)展。然而,游客數(shù)量的大幅上升導(dǎo)致了景點(diǎn)游玩體驗(yàn)下降與安全事故的增多,對(duì)旅游場(chǎng)所造成了巨大的負(fù)面影響,目前人流量過載已經(jīng)成了各大旅游景點(diǎn)重點(diǎn)關(guān)注的問題。為應(yīng)對(duì)潛在風(fēng)險(xiǎn),有關(guān)部門提出了加強(qiáng)人流量檢測(cè)和管控的要求。傳統(tǒng)檢測(cè)人流量的工作方式是采用過往經(jīng)驗(yàn)判斷法,這種方法往往存在時(shí)效性弱以及準(zhǔn)確率低等問題,如何對(duì)人流量的預(yù)測(cè)更加快速與精準(zhǔn)便成了管理工作中至關(guān)重要的部分。本項(xiàng)目的研究是為了深化全域旅游、提升游客游玩體驗(yàn)、避免大規(guī)模游客滯留,在保障游客生命財(cái)產(chǎn)安全的同時(shí)提升對(duì)游客的服務(wù)質(zhì)量,更加有效地將游客分流到更廣闊的全域旅游,有利于旅游業(yè)態(tài)的拓展和全域旅游的深化推進(jìn)。
隨著數(shù)據(jù)預(yù)測(cè)在學(xué)術(shù)界的廣泛部署和如今數(shù)據(jù)獲取的便利性,出現(xiàn)了如何正確有效地使用數(shù)據(jù)的問題。時(shí)間序列是預(yù)測(cè)未來(lái)數(shù)據(jù)最廣泛使用的方法之一,被廣泛用于經(jīng)濟(jì)和商業(yè)領(lǐng)域。從20 年紀(jì)50 年代起,相關(guān)研究人員利用其他領(lǐng)域的一些預(yù)測(cè)模型對(duì)人流時(shí)間序列預(yù)測(cè)進(jìn)行了分析和處理,并在此基礎(chǔ)上進(jìn)行了持續(xù)改進(jìn)?!稁追N時(shí)間序列模型在客流量的比較》一文中提到[1]:數(shù)據(jù)預(yù)測(cè)是目前學(xué)術(shù)界的一個(gè)熱門話題。幾十年來(lái),它吸引了許多學(xué)者來(lái)研究天氣預(yù)報(bào)、食品生產(chǎn)、商場(chǎng)交通等。隨著大數(shù)據(jù)時(shí)代的到來(lái),對(duì)數(shù)據(jù)的獲取變得更加容易,我們現(xiàn)在可以方便地獲取各種數(shù)據(jù),如何明智地使用這些數(shù)據(jù)并使其作用最大化是大數(shù)據(jù)時(shí)代面臨的挑戰(zhàn)之一。一些相關(guān)領(lǐng)域的專業(yè)人士根據(jù)自己的個(gè)人經(jīng)驗(yàn)預(yù)測(cè)和分析本領(lǐng)域的最新趨勢(shì)[2-5]。基于這樣的分析,大部分時(shí)間都花在相關(guān)領(lǐng)域背景知識(shí)的研究上。由于時(shí)間序列在預(yù)測(cè)領(lǐng)域?qū)Ρ尘爸R(shí)的需求較低,吸引了更多的研究學(xué)者,在很大程度上促進(jìn)了時(shí)間序列的發(fā)展。
國(guó)外的研究人員很早就開始了對(duì)人流量分析的研究,預(yù)測(cè)城市流量對(duì)于交通管理、土地使用、公共安全等具有重要的戰(zhàn)略意義。對(duì)于城市管理者來(lái)說,他們可以預(yù)先發(fā)現(xiàn)城市中可能發(fā)生的交通擁堵,提前部署交通,緩解交通擁堵。對(duì)于公眾來(lái)說,他們可以提前完善自己的出行計(jì)劃,錯(cuò)開出行高峰,選擇更便捷的出行方式。從人的出行方式來(lái)看,城市交通流包括人流、交通流和公共交通流等[6-8]。旅游業(yè)是世界上任何國(guó)家發(fā)展的一個(gè)非常重要的經(jīng)濟(jì)活動(dòng)領(lǐng)域。對(duì)許多國(guó)家來(lái)說,這是一個(gè)最優(yōu)先的預(yù)算創(chuàng)收部門,因此有必要盡可能準(zhǔn)確地預(yù)測(cè)主要指標(biāo),特別是游客流量,以規(guī)劃發(fā)展戰(zhàn)略。李艾玲等[9-10]指出:傳統(tǒng)上,城市人口流量是根據(jù)調(diào)查數(shù)據(jù)采用四步法進(jìn)行估算的,這是勞動(dòng)密集型和資本密集型的,而且更新頻率也很低。一些研究處理從單個(gè)或多個(gè)閉路電視(CCTV)攝像機(jī)采集的視頻數(shù)據(jù),這些攝像機(jī)實(shí)時(shí)提供高精度的人流。然而,由于很少安裝監(jiān)控?cái)z像機(jī),這種方法不適用于大型網(wǎng)絡(luò)。其他一些使用被動(dòng)數(shù)據(jù)收集方法的研究包括GPS、藍(lán)牙或社交媒體網(wǎng)絡(luò)。然而,由于樣本量的限制和用戶屬性的偏差,這些方法無(wú)法有效部署[11-13]。
目前,我國(guó)的旅游產(chǎn)業(yè)發(fā)展勢(shì)頭迅猛,人流量過載一直是各大景點(diǎn)難以解決的問題,而景區(qū)的人流量數(shù)據(jù)符合時(shí)間序列數(shù)據(jù)的特征。綜上所述,為了旅游業(yè)態(tài)的拓展和全域旅游的深化推進(jìn),本項(xiàng)目將研究如何利用時(shí)間序列模型并優(yōu)化算法,從而準(zhǔn)確地預(yù)測(cè)各大景點(diǎn)的游玩人數(shù)。
人流量數(shù)據(jù)涉及高低峰期、進(jìn)出口人數(shù),人流量整體分布情況等多種因素,而時(shí)間序列的研究必須保證數(shù)據(jù)的精確性并且考慮到研究?jī)?nèi)容的多維度,因此本項(xiàng)目將研究如何準(zhǔn)確獲取所有按時(shí)間序列排列的相關(guān)人流量數(shù)據(jù)的因素,并對(duì)數(shù)據(jù)進(jìn)行綜合分析,提取其中有利于時(shí)間序列預(yù)測(cè)研究的成分。如今整個(gè)社會(huì)進(jìn)入互聯(lián)網(wǎng)時(shí)代,手機(jī)已成為人人必備的通信工具,IMSI 號(hào)被稱為國(guó)際移動(dòng)用戶識(shí)別碼,是區(qū)別移動(dòng)用戶的唯一標(biāo)志,而IMSI 號(hào)的采集與時(shí)間和地點(diǎn)有一定的對(duì)應(yīng)關(guān)系,將采集的數(shù)據(jù)按照時(shí)間序列分段進(jìn)行統(tǒng)計(jì),使得采用IMSI 數(shù)據(jù)模擬人流量數(shù)據(jù)并對(duì)之預(yù)測(cè)成為可能,而IMSI 數(shù)據(jù)的采集原理主要依據(jù)LTE的小區(qū)重選原理和手機(jī)終端與基站之間鑒權(quán)過程。采集系統(tǒng)見圖1。
經(jīng)典時(shí)間序列對(duì)數(shù)據(jù)的要求較高,受制于數(shù)據(jù)采集的精度,景區(qū)的人流量數(shù)據(jù)無(wú)法具有很高的明確性和準(zhǔn)確性,本項(xiàng)目將研究如何構(gòu)建模糊時(shí)間序列算法實(shí)現(xiàn)景區(qū)人流量預(yù)測(cè)。算法的架構(gòu)見圖2。
論域:合理的論域獲取會(huì)在很大程度上影響算法的精確性。
模糊集定義:現(xiàn)實(shí)生活中有很多帶有模糊現(xiàn)象的案例,例如“長(zhǎng)得高”“長(zhǎng)得矮”,還有“大風(fēng)”“大雪”等,諸如此類的概念均可被定義為模糊概念。這些概念的特點(diǎn)是無(wú)法精準(zhǔn)地量化事務(wù),主觀特質(zhì)相對(duì)較強(qiáng)[6-8]。由于這些概念描述了一個(gè)不準(zhǔn)確的量,無(wú)法確切地用數(shù)字以及類別來(lái)表達(dá),用傳統(tǒng)集合概念來(lái)描述該類元素顯得十分不合理。因此,本項(xiàng)目將建立模糊集來(lái)表達(dá)“亦此亦彼”的模糊性現(xiàn)象。
模糊關(guān)系的建立:自然界的萬(wàn)物之間夾雜著許多關(guān)系,相對(duì)比較簡(jiǎn)單的關(guān)系可以用有或無(wú)來(lái)對(duì)其進(jìn)行描述,然而還存在著一種界限相對(duì)于前者比較模糊的關(guān)系,這種類型的關(guān)系很難用決定性的回答,例如“是”或“否”來(lái)表達(dá),只能用一種描述關(guān)系的程度概念來(lái)表達(dá),即模糊關(guān)系。
去模糊化:為了使結(jié)果變?yōu)榭捎^測(cè)的,需要進(jìn)行去模糊化處理,通過使用反模糊矩陣得出最后的預(yù)測(cè)結(jié)果。
通過模糊均值聚類算法獲得論域:
步驟1:初始化設(shè)樣本集X,樣本數(shù)N,聚類數(shù)為C(2 ≤C≤N),K=1。現(xiàn)在要將樣本集劃分為C類,記為X1,X2,...,Xc。
步驟2:選定C 個(gè)初始聚類中心,記為m1(k),m2(k),...,mc(k)。
步驟3:計(jì)算所有樣本與各聚類中心的距離,按最小距離原則將樣本進(jìn)行聚類。
步驟4:重新計(jì)算聚類中心。
步驟5:若i∈{1,2,3,...,C},有mi(k+1)≠m1(k),則K=K+1,轉(zhuǎn)步驟3;否則算法結(jié)束。
算法流程見圖3。
在進(jìn)行初步的對(duì)于人流量聚類之后,數(shù)據(jù)仍然可能展現(xiàn)出不平穩(wěn)的特性,為了解決這個(gè)問題,需要對(duì)聚類后的數(shù)據(jù)進(jìn)行差分處理并套用粒子濾波模型進(jìn)行處理。
2.3.1 差分時(shí)間序列
Crammer 分解定理指出,任何一個(gè)時(shí)間序列{xt}都可以視為兩部分的疊加,其中,一部分是由時(shí)間t 的多項(xiàng)式?jīng)Q定的確定性成分,另一部分是由白噪聲序列決定的隨機(jī)性成分,即
式中,d <∞;β1,....,βd為常數(shù)系數(shù);{at}為一個(gè)零均值白噪聲序列;B 為延遲算子。
根據(jù)Crammer 分解定理,非平穩(wěn)序列都可以分解為如下形式:
式中,{at}為零均值白噪聲序列。
2.3.2 基于重抽樣粒子濾波的時(shí)間序列預(yù)測(cè)方法
基于重抽樣粒子濾波的時(shí)間序列預(yù)測(cè)方法的思想是采用貝葉斯濾波法來(lái)更新粒子濾波密度和采用重要采樣法來(lái)計(jì)算積分。將選取的指標(biāo)作為粒子xk,核心企業(yè)指標(biāo)的狀態(tài)方程粒子作為zk,濾波密度p(xk|z1:k)用粒子和粒子權(quán)值來(lái)表示:;權(quán)值表達(dá)式為,在使建議密度分布等于先驗(yàn)密度分布的前提下,重抽樣粒子濾波時(shí)間序列預(yù)測(cè)方法的步驟如下:
計(jì)算權(quán)值:
算法流程見圖4。
經(jīng)典時(shí)間序列對(duì)數(shù)據(jù)的要求較高,它對(duì)歷史數(shù)據(jù)的依賴大,要求數(shù)據(jù)較為完整,對(duì)于不具有完整性、準(zhǔn)確性和明確性的歷史數(shù)據(jù)無(wú)法進(jìn)行預(yù)測(cè),這在現(xiàn)實(shí)生活中是非??量痰臈l件。受制于數(shù)據(jù)采集的精度,景區(qū)的人流量數(shù)據(jù)無(wú)法具有很高的明確性和準(zhǔn)確性,本項(xiàng)目中使用的模糊時(shí)間序列模型通過結(jié)合模糊數(shù)學(xué)與時(shí)間序列很好地解決了這一問題。時(shí)間序列模型見圖5。
許多熱門景點(diǎn)經(jīng)常出現(xiàn)人口容量超出承載量的現(xiàn)象,直接導(dǎo)致游客的游玩體驗(yàn)下降,并且可能會(huì)導(dǎo)致一些公共安全事故。如果能準(zhǔn)確預(yù)測(cè)景點(diǎn)人流量,能夠避免大規(guī)模游客滯留的現(xiàn)象,使游客錯(cuò)峰出行,提升各大景點(diǎn)游客的游玩體驗(yàn)。
精準(zhǔn)預(yù)測(cè)景點(diǎn)人流量將有利于相關(guān)工作人員安排各類資源和公共服務(wù)的有效再配置,實(shí)現(xiàn)區(qū)域內(nèi)部資源的有機(jī)整合、產(chǎn)業(yè)的整合與發(fā)展、社會(huì)的共建與共享,帶動(dòng)和促進(jìn)經(jīng)濟(jì)社會(huì)與旅游業(yè)的協(xié)調(diào)發(fā)展,重新定位新階段我國(guó)的旅游發(fā)展戰(zhàn)略,即全域旅游的深化推進(jìn)有重大幫助。
本文通過使用IMSI 號(hào)完成了人流量數(shù)據(jù)的采集,從而準(zhǔn)確地獲取了所有按時(shí)間序列排列的相關(guān)人流量數(shù)據(jù)的因素,并對(duì)數(shù)據(jù)進(jìn)行綜合分析,提取了其中有利于時(shí)間序列預(yù)測(cè)研究的成分。此外通過運(yùn)用模糊時(shí)間序列分析算法完成了景區(qū)人流量預(yù)測(cè)算法構(gòu)建,本文通過結(jié)合模糊數(shù)學(xué)與時(shí)間序列很好地解決了數(shù)據(jù)采集產(chǎn)生的精度誤差。