• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于支持向量回歸的酒店入住情況預(yù)測(cè)

      2018-02-01 14:54武文斌

      武文斌

      摘 要:當(dāng)今社會(huì),屬于第三產(chǎn)業(yè)的旅游業(yè)對(duì)社會(huì)的發(fā)展起著越來越重要的作用。酒店入住是旅游業(yè)發(fā)達(dá)與否的一個(gè)重要體現(xiàn)。本文從維多利亞酒店入住情況數(shù)據(jù)出發(fā),應(yīng)用支持向量回歸機(jī)的方法對(duì)酒店入住情況相關(guān)的月度入住次數(shù)這一時(shí)間序列數(shù)據(jù)進(jìn)行建模和預(yù)測(cè),進(jìn)一步計(jì)算預(yù)測(cè)結(jié)果的均方根誤差來定量地評(píng)價(jià)預(yù)測(cè)精度。通過實(shí)驗(yàn)驗(yàn)證,我們可以對(duì)酒店入住情況進(jìn)行較為精準(zhǔn)的預(yù)測(cè),為維多利亞酒店未來營(yíng)業(yè)模式的安排提供有意義的參考。

      關(guān)鍵詞:支持向量回歸;時(shí)間序列預(yù)測(cè);實(shí)驗(yàn)驗(yàn)證

      中圖分類號(hào):U491 文獻(xiàn)標(biāo)志碼:A

      0 引言

      酒店入住情況對(duì)于每一家酒店,甚至對(duì)整座城市的旅游業(yè)起著至關(guān)重要的作用。酒店可以通過對(duì)以往入住情況的統(tǒng)計(jì),比如歷史的月住房次數(shù)數(shù)據(jù)來預(yù)測(cè)下一個(gè)月或者下幾個(gè)月的入住次數(shù)。這樣就可以在旅游旺季來臨之際提前做好準(zhǔn)備,從而實(shí)現(xiàn)人力物力的合理配置,減少不必要的損失,從而取得經(jīng)濟(jì)效益。通過對(duì)酒店入住情況的預(yù)測(cè),不僅可以探索其發(fā)展變化的規(guī)律,而且可以從一個(gè)側(cè)面反映社會(huì)經(jīng)濟(jì)現(xiàn)象的發(fā)展情況。

      對(duì)于月住房次數(shù)這樣的時(shí)間序列數(shù)據(jù),通過文獻(xiàn)調(diào)研,還沒有發(fā)現(xiàn)相關(guān)的研究。但是,對(duì)于其他領(lǐng)域的時(shí)間序列數(shù)據(jù),已有不少相關(guān)研究,并涉及到眾多技術(shù)。特別地,應(yīng)用支持向量回歸機(jī)(support vector machines regression, SVR)預(yù)測(cè)時(shí)間序列數(shù)據(jù)已有不少研究。楊金芳等人簡(jiǎn)要介紹了時(shí)間序列預(yù)測(cè)的研究狀況以及支持向量回歸的基本原理,將支持向量回歸用于對(duì)煤氣爐時(shí)間序列的預(yù)測(cè),并同其他神經(jīng)網(wǎng)絡(luò)進(jìn)行比較,實(shí)驗(yàn)表明支持向量回歸在預(yù)測(cè)性能方面明顯更優(yōu)。尉詢楷等人將支持向量機(jī)預(yù)測(cè)模型應(yīng)用于某型航空發(fā)動(dòng)機(jī)的滑油金屬含量監(jiān)測(cè)中,并與遞歸神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)器進(jìn)行比較,實(shí)驗(yàn)表明支持向量機(jī)表現(xiàn)出優(yōu)秀的泛化能力,可預(yù)測(cè)區(qū)間較長(zhǎng)且具有較高的準(zhǔn)確度。

      董輝、冷伍明詳細(xì)分析了支持向量機(jī)用于時(shí)間序列預(yù)測(cè)的理論基礎(chǔ),并采用支持向量機(jī)和其他兩種神經(jīng)網(wǎng)絡(luò)模型進(jìn)行對(duì)比,分別對(duì)仿真時(shí)序和工程滑坡變形時(shí)序進(jìn)行了回歸與預(yù)測(cè),結(jié)果表明在噪聲水平較低時(shí),SVR回歸效果稍好。

      曲文龍等人介紹了相空間重構(gòu)和基于支持向量機(jī)的時(shí)間序列預(yù)測(cè)建模技術(shù),提出了復(fù)雜時(shí)間序列的多尺度分解方法,對(duì)支持向量機(jī)回歸與預(yù)測(cè)的各項(xiàng)參數(shù)設(shè)置進(jìn)行了實(shí)驗(yàn)分析,通過對(duì)股票數(shù)據(jù)進(jìn)行建模和預(yù)測(cè)表明支持向量機(jī)對(duì)復(fù)雜時(shí)間序列具有較好的預(yù)測(cè)效果。夏國(guó)恩針對(duì)目前鐵路客運(yùn)量預(yù)測(cè)方法不足的問題,采用SVR對(duì)鐵路客運(yùn)量時(shí)間序列進(jìn)行預(yù)測(cè),通過與標(biāo)準(zhǔn)的反向傳播人工神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)比表明,SVR的預(yù)測(cè)精度更高。

      1 支持向量回歸

      支持向量機(jī)回歸是一種機(jī)器學(xué)習(xí)方法,并可以應(yīng)用于時(shí)間序列數(shù)據(jù)的預(yù)測(cè)。SVR采用了結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,通過多維輸入和輸出之間的實(shí)值映射來提高所建立模型的泛化能力。該映射可以表示為一種潛在函數(shù),并且當(dāng)引入非線性核函數(shù)K(xi,x)時(shí)該映射也是非線性的,將輸入空間轉(zhuǎn)換為的更高維特征空間的線性回歸函數(shù)。使用ε(也稱誤差邊界)不敏感損失函數(shù)的非線性SVR回歸函數(shù)可以表示為:

      其中,αi和αi*是求解目標(biāo)函數(shù)中的拉格朗日乘數(shù),ai、αi*和a 表示最優(yōu)值,C是預(yù)設(shè)值(也稱為懲罰因子),用來調(diào)節(jié)經(jīng)驗(yàn)誤差和泛化誤差的平衡。在公式(1)中,觀察到的輸入向量xi是實(shí)際對(duì)回歸函數(shù)有貢獻(xiàn)的支持向量,并且對(duì)應(yīng)于正的αi和αi*。在本文中,我們選擇了流行的高斯徑向基函數(shù)作為核函數(shù),可以表示為K(x,y)=exp(-(x-y)2/2σ2),其中σ是核函數(shù)參數(shù)。

      在SVR建模過程中,有3個(gè)參數(shù)ε,C和σ需要被確定。已有一些可用于參數(shù)選擇的智能方法,比如遺傳算法,粒子群優(yōu)化算法,模擬退火算法等。本文采用了啟發(fā)式算法直接從訓(xùn)練數(shù)據(jù)中計(jì)算ε和σ這兩個(gè)參數(shù)的取值。

      2 研究方法

      本文的整體研究框架大致分為以下幾個(gè)步驟:首先上網(wǎng)搜集維多利亞酒店入住情況數(shù)據(jù)并整理成“.csv”格式的數(shù)據(jù)文件,再將數(shù)據(jù)進(jìn)行預(yù)處理(將原始數(shù)據(jù)轉(zhuǎn)換格式、時(shí)間序列化等),然后將預(yù)處理后得到的數(shù)據(jù)劃分成訓(xùn)練集和測(cè)試集,并由此對(duì)訓(xùn)練集建立SVR模型,接著應(yīng)用SVR模型進(jìn)行預(yù)測(cè),最后將所得到的預(yù)測(cè)值計(jì)算預(yù)測(cè)精度。

      整個(gè)預(yù)測(cè)過程的實(shí)現(xiàn)程序如算法1所示。首先導(dǎo)入“rminer”的數(shù)據(jù)包,然后將酒店入住情況數(shù)據(jù)通過“read.csv("數(shù)據(jù)文件路徑名稱”,header=TRUE)”函數(shù)讀取進(jìn)來,并保存到“table”這個(gè)變量中;之后將table中的入住次數(shù)這一列數(shù)據(jù)通過代碼“Rm=table$Room_nights”從“table”中取出來并保存到“Rm”這個(gè)變量中;再使用“as.numeric()”、“as.character()”3個(gè)函數(shù)將取出的原始數(shù)據(jù)進(jìn)行預(yù)處理;接著通過代碼“Rm=ts(Rm,start=c(1980,1),frequency=12)”將“Rm”變量的時(shí)間序列周期設(shè)定為月度數(shù)據(jù)的潛在周期12,以便建立預(yù)測(cè)模型;然后將原始數(shù)據(jù)劃分為訓(xùn)練集和測(cè)試集;接下來使用時(shí)間序列建模函數(shù)“fit()”對(duì)訓(xùn)練集建立SVR模型;然后通過“l(fā)forecast()”函數(shù)建立預(yù)測(cè)模型并執(zhí)行預(yù)測(cè);最后使用“mgraph()”繪圖函數(shù)繪制預(yù)測(cè)結(jié)果。

      算法1:月度酒店入住次數(shù)預(yù)測(cè)

      輸入:往期酒店月入住次數(shù)

      輸出:未來酒店月入住次數(shù)

      1.library(rminer)

      2. table = read.csv(“文件路徑", sep=",", header=TRUE)

      3.Rm=table$Room_nights

      4.Rm=as.numeric(as.character(Rm))

      5.Rm=ts(Rm,start = c(1980,1),frequency = 12)endprint

      6.window=24

      7.H=6

      8.L=length(Rm)

      9.Target=Rm[181:186]

      10.d=CasesSeries(Rm,c(1:window))

      11.LD=nrow(d)

      12.dtr=1:(LD-H)

      13.SV=fit(y~.,d[dtr,],model="ksvm",C=NA,epsilon=NA,kpa="automatic",seed=1000)

      14. Pred=lforecast(SV,d,start=(LD-H+1),horizon=H)

      15. r=round(mmetric(Target,Pred,metric="RMSE"),3)

      16. txt=paste("SVM RMSE:",r,"\n")

      17.mgraph(Target,Pred,graph="REG",Grid=10,col=c("black","blue"),leg=list(pos="topright",leg=c("target","predictions")),main=txt)

      3 實(shí)驗(yàn)驗(yàn)證

      3.1實(shí)驗(yàn)準(zhǔn)備

      實(shí)驗(yàn)數(shù)據(jù)來源于對(duì)維多利亞1980年1月到1995年6月酒店入住情況的統(tǒng)計(jì)。該時(shí)間序列共計(jì)186個(gè)數(shù)據(jù)點(diǎn),設(shè)置前180個(gè)點(diǎn)為訓(xùn)練集,最后6個(gè)點(diǎn)為測(cè)試集。實(shí)驗(yàn)數(shù)據(jù)總體呈上升趨勢(shì),但也有周期性的波動(dòng),波峰主要出現(xiàn)在春秋兩季,此時(shí)正值旅游旺季。實(shí)驗(yàn)運(yùn)行環(huán)境為R語言和集成開發(fā)環(huán)境Rstudio。R是用于統(tǒng)計(jì)分析、繪圖展示的語言和操作環(huán)境。R語言免費(fèi)開源,并提供了對(duì)象、運(yùn)算符和函數(shù)來探索、建模和可視化數(shù)據(jù)。其中,Rminer是以開源數(shù)據(jù)挖掘工具WEKA為核心的R語言程序包。Rminer實(shí)現(xiàn)了大多數(shù)經(jīng)典和最新的數(shù)據(jù)挖掘算法,本文應(yīng)用Rminer作為SVR預(yù)測(cè)模型的實(shí)現(xiàn)方法。

      為了比較不同預(yù)測(cè)模型的優(yōu)劣,本文采用均方根誤差(root mean square error, RMSE)作為預(yù)測(cè)模型的度量指標(biāo)。RMSE的計(jì)算公式為

      RMSE

      其中,y和f分別表示時(shí)間序列的觀測(cè)值和模型輸出值,T為數(shù)據(jù)點(diǎn)的個(gè)數(shù)。本文通過對(duì)測(cè)試集計(jì)算RMSE來評(píng)價(jià)模型的預(yù)測(cè)精度,RMSE值越小,預(yù)測(cè)精度越高,預(yù)測(cè)模型性能越好。

      3.2 實(shí)驗(yàn)結(jié)果

      本實(shí)驗(yàn)通過改變窗口長(zhǎng)度這個(gè)模型參數(shù)來得到四個(gè)不同的SVR模型。每個(gè)模型的窗口長(zhǎng)度L都設(shè)為月度數(shù)據(jù)的潛在周期12的整數(shù)倍,在四個(gè)模型中分別為12、24、36、48。懲罰因子C均取默認(rèn)值3。誤差邊界ε和核函數(shù)σ參數(shù)通過啟發(fā)式算法從訓(xùn)練數(shù)據(jù)中計(jì)算獲得其取值。

      通過分析實(shí)驗(yàn)結(jié)果,可以看出以下幾點(diǎn):(1)RMSE值的數(shù)量級(jí)為105,而原始數(shù)據(jù)的數(shù)量級(jí)為106,說明我們的預(yù)測(cè)精度是比較高的;(2)RMSE的最小值為22759.41,此時(shí)窗口長(zhǎng)度為24,說明當(dāng)窗口長(zhǎng)度為24時(shí)預(yù)測(cè)精度最高,模型性能也最好;(3)隨著L的不斷增大,ε不斷增大,σ不斷減小,RMSE呈現(xiàn)出先減小后增大的趨勢(shì)。

      4 結(jié)論

      本文應(yīng)用支持向量回歸機(jī)模型對(duì)酒店入住情況相關(guān)的時(shí)間序列數(shù)據(jù)進(jìn)行預(yù)測(cè),預(yù)測(cè)精度(RMSE值)達(dá)到了22759.41?;谀壳肮ぷ?,后續(xù)還可以做進(jìn)一步研究,比如應(yīng)用自回歸移動(dòng)平均(autoregressive integrated moving average, ARIMA)、3次指數(shù)平滑(Hot-Winters)等模型進(jìn)行實(shí)驗(yàn),比較各種統(tǒng)計(jì)學(xué)和人工智能等不同預(yù)測(cè)模型的優(yōu)劣。

      參考文獻(xiàn)

      [1]楊金芳, 翟永杰, 王東風(fēng), 等.基于支持向量回歸的時(shí)間序列預(yù)測(cè)[J].中國(guó)電機(jī)工程學(xué)報(bào),2005, 25(17):110-114.

      [2]尉詢楷, 李應(yīng)紅, 張樸, 等.基于支持向量機(jī)的時(shí)間序列預(yù)測(cè)模型分析與應(yīng)用[J].系統(tǒng)工程與電子技術(shù), 2005,27(3):529-532.

      [3]董輝, 冷伍明.支持向量機(jī)的時(shí)間序列回歸與預(yù)測(cè)[J].系統(tǒng)仿真學(xué)報(bào), 2006, 18(7):1785-1788.

      [4]曲文龍, 樊廣佺, 楊炳儒.基于支持向量機(jī)的復(fù)雜時(shí)間序列預(yù)測(cè)研究[J].計(jì)算機(jī)工程,2005,31(23):1-3.

      [5]夏國(guó)恩, 曾紹華, 金煒東.支持向量回歸機(jī)在鐵路客運(yùn)量時(shí)間序列預(yù)測(cè)中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用研究,2006,23(10):180-182.endprint

      连平县| 浙江省| 八宿县| 定日县| 宜良县| 申扎县| 渝中区| 威海市| 金秀| 莱阳市| 临猗县| 溆浦县| 鸡西市| 万盛区| 威远县| 仪征市| 建平县| 夹江县| 永泰县| 霍城县| 利辛县| 乌恰县| 大英县| 达尔| 贵州省| 满洲里市| 昭觉县| 天水市| 河池市| 大冶市| 南和县| 宾川县| 祥云县| 德钦县| 海晏县| 合江县| 淳安县| 东源县| 萍乡市| 哈巴河县| 涡阳县|