劉 春
(四川建筑職業(yè)技術(shù)學院 網(wǎng)絡(luò)管理中心,德陽 618000)
隨著我國經(jīng)濟水平的不斷提高,人們住房、生活得到了大幅度的改善,出現(xiàn)了許多大型建筑. 在建筑構(gòu)建過程中,工程造價是大家關(guān)心的重要問題,其直接影響到工程的管理、成本以及其它方面,因此建立高精度的建筑工程造價預測模型一直是人們關(guān)注的焦點[1-3].
建筑工程造價建模常基于時間序列數(shù)據(jù)進行,把建筑工程造價看作是一種按時間前后順序組織在一起的數(shù)據(jù),數(shù)據(jù)之間存在明顯時序特性,同時受到其它因素影響,具有較強的非線性變化特點. 傳統(tǒng)建筑工程造價預測模型有:多元性線回歸,滑動平均模型等,它們屬于線性建模方法,無法描述建筑工程造價的非線性變化特征,建筑工程造價預測結(jié)果不太可靠[4,5]. 近些年,人們將神經(jīng)網(wǎng)絡(luò)引入到了建筑工程造價的建模中,由于具有非線性預測能力,獲得了比傳統(tǒng)模型更高的建筑工程預測精度[6-8]. 神經(jīng)網(wǎng)絡(luò)要求建筑工程造價的歷史數(shù)據(jù)多,如果歷史數(shù)據(jù)太少,會出現(xiàn)“過擬合”的建筑工程造價預測結(jié)果. 支持向量機(Support Vector Machine,SVM)是一種非線性建模能力強的算法,克服了神經(jīng)網(wǎng)絡(luò)對訓練樣本規(guī)模的約束條件,預測性能要優(yōu)于神經(jīng)網(wǎng)絡(luò),為建筑工程造價提供了一種新的建模工具[9]. 如何對歷史數(shù)據(jù)間的時間相關(guān)性進行有效挖掘十分關(guān)鍵,常采用拓階的方法實現(xiàn),拓階過程消耗時間長,而且屬于線性拓階方法,結(jié)果無法描述建筑工程造價的非線性變化特性. 為了精確對建筑工程造價進行預測,根據(jù)對建筑工程造價樣本時間相關(guān)性和非線性變化特點,構(gòu)建了基于地統(tǒng)計學與支持向量機相融合的建筑工程造價預測模型,并通過建筑工程造價預測實例對性能進行測試與分析.
基于支持向量機的建筑工程造價預測建模過程中,由于根據(jù)建筑工程造價數(shù)據(jù)間的時間相關(guān)性,由支持向量機自身無法確定表示時間相關(guān)性的嵌入維數(shù),地統(tǒng)計學(Geostatistics,GS)[10,11]是一種時序特性分析法,可以將變程作為時間序列的階數(shù),即嵌入維數(shù),而且工作過程簡單、執(zhí)行速度快,可以用于確定支持向量機的建筑工程造價時間序列拓階.
式中,w為權(quán)向量,b為閾值,為高維特征空間的映射函數(shù).
為了使預測結(jié)果的風險最小化,建立如下的經(jīng)驗風險函數(shù):
式中,L為損失函數(shù),具體為
式中,ε是回歸誤差的閾值[12].
對于小樣本預測問題,基于經(jīng)驗風險原理進行建??赡軐е骂A測結(jié)果差,為此支持向量機考慮了泛化風險,得到如下回歸函數(shù):
式(4)可以轉(zhuǎn)化為求解以下函數(shù)規(guī)劃問題:
約束條件為:
引入拉格朗日算子 得到式(6)的對偶問題,然后進行求解可得:
本文采用RBF函數(shù),其定義為
在建筑工程造價進行建模時,相關(guān)研究表明,下一時刻建筑工程造價與前m個建筑工程造價相關(guān),即時間序列的嵌入維數(shù),用yk+1表示當建筑工程造價,那么建筑工程造價的預測原理可以表示為:
協(xié)方差函數(shù)定義為:
式中,h表示時間間隔距離.
(1) 收集建筑工程造價相關(guān)數(shù)據(jù),得到數(shù)據(jù)形式為X={x1,x2,…,xn},并進行如下處理.
(2) 采用地統(tǒng)計學通過變程確定建筑工程造價的最優(yōu)嵌入維數(shù),具體為:根據(jù)不同h,由式(11)得到不同的γ(h),剛開始,h與γ(h)之間是一種線性變化關(guān)系,當h超過一定距離后,γ(h)得到第一個最大值,該γ(h)的值為基臺值,此時的h為變程,用α表示,即得到了時間序列的嵌入維值.
(3) 根據(jù)最優(yōu)嵌入維數(shù)和建筑工程造價的影響因素構(gòu)建支持向量機的輸入向量,與相應的建筑工程造價組成學習樣本.
(4) 將建筑工程造價訓練樣本集輸入支持向量機,并設(shè)置支持向量機參數(shù),建立建筑工程造價預測模型.GS-SVM的工程造價建模過程如圖1所示.
圖1 工程造價預測模型的工作流程
選擇某市2000~2016年的每月工程造價數(shù)據(jù)作為研究對象,共獲得180個樣本,采用單層面積、層數(shù)、層高、承載力、基深作為影響,工程造價數(shù)據(jù)如圖2所示,以130個月數(shù)據(jù)作為訓練樣本,建立建筑工程造價預測模型,其余50個樣本對建筑工程造價預測模型的泛化能力進行測試.
圖2 實驗對象
從圖2可知,2000~2016年的每月建筑工程造價數(shù)據(jù)具有明顯上升變化態(tài)勢,為此建立建筑工程造價模型之前,對原始數(shù)據(jù)進行去趨勢平穩(wěn)化法處理,具體如下:
首先對2000~2016年的每月建筑工程造價數(shù)據(jù)取對數(shù),然后進行擬合,即
根據(jù)式(14)得到去趨勢平穩(wěn)化后的2000~2016年的每月建筑工程造價數(shù)據(jù):
后續(xù)建模基于平穩(wěn)化后的建筑工程造價數(shù)據(jù).
建筑工程造價不僅與單層面積、層數(shù)、層高、承載力、基深等因素有關(guān),而且與前一段時間的建筑工程造價相關(guān),因此,建筑工程造價時間序列具有明顯的時間關(guān)聯(lián)特性,對平穩(wěn)化后的建筑工程造價數(shù)據(jù)進行地統(tǒng)計學分析,得到建筑工程造價的半變異函數(shù)如圖3所示. 從圖3可知,變程α=5,即建筑工程造價與前5個月的建筑工程造價相關(guān),因此嵌入維數(shù)為5. 前5個月的建筑工程造價數(shù)據(jù)與單層面積、層數(shù)、層高、承載力、基深作為輸入,構(gòu)建支持向量機的學習樣本.
通過十折交叉驗證法確定支持向量機的參數(shù):C=240.80,σ=1.784,GS-SVM的建筑工程造價預測結(jié)果如圖4所示. 從圖4可知,GS-SVM的建筑工程造價預測精度相當高,能夠較好描述建筑工程造價的變化特點,GS-SVM可以應用于實際的建筑工程造價中.
圖3 建筑工程造價的半變異函數(shù)圖
圖4 GS-SVM的建筑工程造價預測結(jié)果
比較采用多元線性回歸模型(MLR)、支持向量機(SVM)、地統(tǒng)計學與BP神經(jīng)網(wǎng)絡(luò)(GS-BPNN)作為對比模型,采用平均預測精度作為建筑工程造價預測結(jié)果好壞評價指標. 統(tǒng)計所有模型的建筑工程造價預測精度,得到結(jié)果如表1所示. 對表1的實驗結(jié)果進行分析,可知:
(1) 單一支持向量機(SVM)沒有考慮建筑工程造價數(shù)據(jù)的時序動態(tài)特性,沒有進行拓階操作,只是簡單采用影響因素作為輸入變量,導致建筑工程造價預測精度低.
(2) 多元線性回歸模型(MLR)的建筑工程造價最低,說明其不能準確描述建筑工程造價的變化特點,獲得了較高的建筑工程造價預測誤差,沒有什么實際應用價值.
(3) GS-BPNN的建筑工程造價平均預測精度得到了一定提升,這主要由于通過GS對建筑工程造價時間序列進行拓階處理,描述了數(shù)據(jù)的時序動態(tài)特性,大幅度降低了建筑工程造價的預測誤差,表明引入變程可以有效提高建筑工程造價預測精度.
(4) GS-SVM的建筑工程造價預測精度最高,這是因為采用支持向量機對建筑工程造價進行建模,克服了神經(jīng)網(wǎng)絡(luò)大樣本要求,泛化能力優(yōu)異,并通過GS描述建筑工程造價數(shù)據(jù)的時序特性,建立理想的建筑工程造價預測模型,相比對比模型,建筑工程造價預測精度具有明顯優(yōu)勢.
表1 建筑工程造價的預測精度對比
針對建筑工程造價中的訓練樣本選擇問題,以及非線性變化特點,綜合利用地統(tǒng)計學和支持向量機的優(yōu)點,設(shè)計了基于GS-SVM的建筑工程造價預測模型,通過地統(tǒng)計學快速確定時間序列的嵌入維數(shù),然后通過支持向量機建立建筑工程造價的非線性預測模型,具體應用實例測試結(jié)果表明,GS-SVM大幅度提高了建筑工程造價的預測精度,具有廣泛的應用前景.
1 陳鵬,劉亞南. 建筑工程造價管理的現(xiàn)狀與對策. 工業(yè)工程,2015,34(48):33-34.
2 張利榮. 多基元模糊算法在工程估價中的應用. 施工技術(shù),2010,39(6):64-66.
3 胡六星. 基于時間序列的建筑工程造價預測研究. 太原理工業(yè)大學學報,2012,43(6):706-709,714.
4 郭一斌,王紅革,王翔. 基于Vague集貼近度的工程項目投資快速估算方法. 現(xiàn)代經(jīng)濟信息,2011,12(2):50-55.
5 孟俊娜,梁巖,房寧. 基于BP神經(jīng)網(wǎng)絡(luò)的民用建筑工程造價估算方法研究. 建筑經(jīng)濟,2015,36(9):64-68.
6 胡曉娟. 多元線性回歸模型參數(shù)的STLS估計法及其在工程造價預測中的應用. 四川建筑科學研究,2016,42(4):142-147.
7 牛東曉,乞建勛,邢棉. 建筑工程造價預測的變結(jié)構(gòu)神經(jīng)網(wǎng)絡(luò)模型研究. 華北電力大學學報,2001,28(4):1-4.
8 李杰. 改進粒子群算法優(yōu)化支持向量機的工程造價預測.計算機系統(tǒng)應用,2016,25(6):202-206.
9 Li GQ,Deng M,Zhu JJ,et al. Spatial outliers detection considering distances among their neighbors. Journal of Remote Sensing,2009,13(2):197-202.
10 Petitgas P,Woillez M,Doray M,et al. A geostatistical definition of hotspots for fish spatial distributions.Mathematical Geosciences,2016,48(1):65-77. [doi:10.1007/s11004-015-9592-z]
11 劉莘,張紹良,王飛,等. 基于地統(tǒng)計學的空間離群點檢測算法的研究. 計算機應用研究,2016,33(12):3700-3704.[doi:10.3969/j.issn.1001-3695.2016.12.040]
12 王雪松. 改進支持向量機的網(wǎng)絡(luò)流量預測. 計算機系統(tǒng)應用,2017,26(3):230-233.