周學(xué)君,陳文秀
(1.黃岡師范學(xué)院 數(shù)理學(xué)院,湖北 黃州 438000;2.黃岡廣播電視大學(xué) 黃州分校,湖北 黃州 438000)
?
基于人工神經(jīng)網(wǎng)絡(luò)BP算法的黃岡市房?jī)r(jià)預(yù)測(cè)
周學(xué)君1,陳文秀2
(1.黃岡師范學(xué)院 數(shù)理學(xué)院,湖北 黃州 438000;2.黃岡廣播電視大學(xué) 黃州分校,湖北 黃州 438000)
利用2003年至2010年黃岡市區(qū)人均地區(qū)生產(chǎn)總值、房地產(chǎn)開(kāi)發(fā)投資、城鎮(zhèn)居民人均住房使用面積等相關(guān)數(shù)據(jù),根據(jù)人工神經(jīng)網(wǎng)絡(luò)BP算法,預(yù)測(cè)出2011年和2012年黃岡市區(qū)房?jī)r(jià),與已經(jīng)公布的這兩年房?jī)r(jià)數(shù)據(jù)比較,符合預(yù)期誤差范圍。在此基礎(chǔ)上,預(yù)測(cè)出2013年的房?jī)r(jià),可以看出黃岡市區(qū)房?jī)r(jià)總體保持增長(zhǎng)趨勢(shì),結(jié)合預(yù)測(cè)結(jié)果,給出合理化的解釋。
黃岡市房?jī)r(jià);房?jī)r(jià)預(yù)測(cè);BP神經(jīng)網(wǎng)絡(luò)算法;誤差
近年來(lái),在中國(guó)的許多地方,房地產(chǎn)業(yè)是國(guó)民經(jīng)濟(jì)增長(zhǎng)的引擎。而房?jī)r(jià)在市場(chǎng)經(jīng)濟(jì)中具有非常重要的功能和作用,它在一定程度上決定著市場(chǎng)總體價(jià)格水平,關(guān)乎著居民的生活水平。由于一、二線城市嚴(yán)厲的限購(gòu)政策和產(chǎn)能過(guò)剩,大量開(kāi)發(fā)商向三、四線城市進(jìn)軍和轉(zhuǎn)移,黃岡市作為湖北省的三線城市,房地產(chǎn)業(yè)得到飛速發(fā)展,房?jī)r(jià)也在不斷提高。
對(duì)于房?jī)r(jià)的分析和預(yù)測(cè),一直是經(jīng)濟(jì)社會(huì)的熱點(diǎn)問(wèn)題,它受到很多因素的影響和制約。本文通過(guò)搜集相關(guān)統(tǒng)計(jì)資料,主要考慮總?cè)丝?、人均地區(qū)生產(chǎn)總值、房地產(chǎn)開(kāi)發(fā)投資、人均住房使用面積、人均可支配性收入等因素,利用人工神經(jīng)網(wǎng)絡(luò)BP算法分析和預(yù)測(cè)房?jī)r(jià)的大致走勢(shì),為黃岡市房地產(chǎn)業(yè)的可持續(xù)發(fā)展提供科學(xué)決策咨詢。
人工神經(jīng)網(wǎng)絡(luò)算法是模仿生理神經(jīng)網(wǎng)絡(luò)的機(jī)構(gòu)和功能設(shè)計(jì)的一種信息處理方法,已經(jīng)在人工智能、模式識(shí)別等領(lǐng)域得到廣泛的應(yīng)用。BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)是1986年由Rumelhart和McCelland為首的科學(xué)家小組提出,是一種按誤差逆?zhèn)鞑ニ惴ㄓ?xùn)練的多層前饋網(wǎng)絡(luò),是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型之一[1-2]。它對(duì)于價(jià)格預(yù)測(cè)問(wèn)題有很好的效果[3-4],本文以2003~2010年數(shù)據(jù)為基礎(chǔ),分析預(yù)測(cè)2011年、2012年、2013年房?jī)r(jià),并與相關(guān)真實(shí)數(shù)據(jù)比較,進(jìn)行誤差分析,給出合理化的解釋。
BP神經(jīng)網(wǎng)絡(luò)算法的基本原理是,利用輸出后的誤差來(lái)估計(jì)輸出層的直接前導(dǎo)層的誤差,再用這個(gè)誤差估計(jì)更前一層的誤差,如此一層一層的反傳下去,就獲得了所有其他各層的誤差估計(jì)。利用該算法解決問(wèn)題大致上需要3步:(1)輸入輸出變量的確定及其數(shù)據(jù)的預(yù)處理,在這一步中需要對(duì)神經(jīng)網(wǎng)絡(luò)的輸入、輸出數(shù)據(jù)進(jìn)行一定的預(yù)處理,以便加快網(wǎng)絡(luò)的訓(xùn)練速度;(2)神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的確定,在這一步中,我們要確定網(wǎng)絡(luò)層數(shù)與隱層,選取初始權(quán)值、訓(xùn)練算法和參數(shù);(3)神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和結(jié)果,在這一步中,我們把輸入樣本輸入到神經(jīng)網(wǎng)絡(luò),計(jì)算網(wǎng)絡(luò)輸出值,然后與實(shí)際輸出相比較,使用選定的網(wǎng)絡(luò)訓(xùn)練算法,以一定的規(guī)則修改網(wǎng)絡(luò)的連接權(quán)值。反復(fù)計(jì)算誤差和修改權(quán)值,直到誤差達(dá)到一定的范圍以內(nèi),輸入檢驗(yàn)樣本,判斷檢驗(yàn)結(jié)果[5]。
在現(xiàn)有數(shù)據(jù)的基礎(chǔ)上,利用Matlab軟件對(duì)2003~2010年黃岡市人均地區(qū)生產(chǎn)總值、房地產(chǎn)開(kāi)發(fā)投資、城鎮(zhèn)居民人均住房使用面積、城鎮(zhèn)居民人均可支配收入、城鎮(zhèn)居民人均消費(fèi)性支出和貸款利率(5年以上)等主要因素?cái)?shù)據(jù)作為學(xué)習(xí)樣本,分析房?jī)r(jià)與這些因素之間的關(guān)系,預(yù)測(cè)黃岡市房?jī)r(jià)的變化趨勢(shì)[6-7]。
1.1 輸入輸出變量的確定及其數(shù)據(jù)的預(yù)處理
在BP神經(jīng)網(wǎng)絡(luò)中輸入變量即為待分析系統(tǒng)的內(nèi)生變量(影響因子),這里我們選取影響房?jī)r(jià)的6個(gè)主要因素:人均地區(qū)生產(chǎn)總值A(chǔ)1、房地產(chǎn)開(kāi)發(fā)投資A2、城鎮(zhèn)居民人均住房使用面積A3、城鎮(zhèn)居民人均可支配收入A4、城鎮(zhèn)居民人均消費(fèi)性支出A5和貸款利率(5年以上)A6。輸出變量即為系統(tǒng)待分析的外生變量(系統(tǒng)性能指標(biāo)),這里我們選取住宅平均售價(jià)B1。為了提高算法的訓(xùn)練速度和靈敏性,一般要求輸入數(shù)據(jù)的值在0~1之間,所以要對(duì)輸入數(shù)據(jù)進(jìn)行預(yù)處理,這里我們選用標(biāo)準(zhǔn)化方法(新數(shù)據(jù)=原數(shù)據(jù)/數(shù)據(jù)最大值)對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理。具體原始數(shù)據(jù)如表1(A1-A5欄數(shù)據(jù)來(lái)自于黃岡市歷年統(tǒng)計(jì)年鑒[8],A6欄數(shù)據(jù)來(lái)自于中國(guó)人民銀行公布的相關(guān)利率,B1欄數(shù)據(jù)來(lái)自于黃岡市房地產(chǎn)管理局[9]),預(yù)處理后的數(shù)據(jù)如表2。
表1 原始數(shù)據(jù)
表2 預(yù)處理后的數(shù)據(jù)
1.2 神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的確定
因?yàn)檩斎霐?shù)據(jù)有6個(gè)屬性,所以輸入層的維數(shù)是6,即為(A1,A2,A3,A4,A5,A6)=(人均地區(qū)生產(chǎn)總值,房地產(chǎn)開(kāi)發(fā)投資,城鎮(zhèn)居民人均住房使用面積,城鎮(zhèn)居民人均可支配收入,城鎮(zhèn)居民人均消費(fèi)性支出,貸款利率),則網(wǎng)絡(luò)的輸入節(jié)點(diǎn)數(shù)為6,輸出層的維數(shù)是1。
確定隱層節(jié)點(diǎn)數(shù)的最基本原則是,在滿足精度要求的前提下取盡可能緊湊的結(jié)構(gòu),即取盡可能少的隱層節(jié)點(diǎn)數(shù)。不妨根據(jù)Hornik公式
來(lái)計(jì)算隱層節(jié)點(diǎn)數(shù)N,其中n為輸入層節(jié)點(diǎn)數(shù),這里n=2,m為輸出層節(jié)點(diǎn)數(shù),這里m=1,可得隱層節(jié)點(diǎn)數(shù)N的范圍是3~13。為了確定最佳的隱層節(jié)點(diǎn)數(shù),我們利用Matlab的BP神經(jīng)網(wǎng)絡(luò)工具箱進(jìn)行實(shí)驗(yàn)測(cè)試,實(shí)驗(yàn)參數(shù)設(shè)置為學(xué)習(xí)精度goal=0.1,訓(xùn)練步數(shù)epochs=500,動(dòng)量因子α=0.9,學(xué)習(xí)率η=0.05,通過(guò)實(shí)驗(yàn)測(cè)試最后確定最佳的隱層節(jié)點(diǎn)數(shù)為9。這樣,設(shè)計(jì)的BP神經(jīng)網(wǎng)絡(luò)模型如圖1。
圖1 BP神經(jīng)網(wǎng)絡(luò)模型
1.3 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和結(jié)果
BP網(wǎng)絡(luò)的訓(xùn)練是通過(guò)應(yīng)用誤差反傳原理不斷調(diào)整網(wǎng)絡(luò)權(quán)值使網(wǎng)絡(luò)模型輸出值與已知的訓(xùn)練樣本輸出值之間的誤差平方和達(dá)到最小或小于某一期望值。這里利用Matlab的BP神經(jīng)網(wǎng)絡(luò)工具箱[10],不妨訓(xùn)練函數(shù)設(shè)為trainlm,學(xué)習(xí)函數(shù)設(shè)為learngdm,傳遞函數(shù)設(shè)為purelin,訓(xùn)練步數(shù)為500,訓(xùn)練精度為0.05。
利用2003~2010年各指標(biāo)數(shù)據(jù),輸入設(shè)計(jì)的BP神經(jīng)網(wǎng)絡(luò)中,得到網(wǎng)絡(luò)輸出值,與實(shí)際值作比較,按算法規(guī)則修改網(wǎng)絡(luò)的連接權(quán)值。不斷計(jì)算誤差和修改權(quán)值,直到誤差達(dá)到要求的范圍,再輸入需檢驗(yàn)樣本,由此判斷檢驗(yàn)結(jié)果,對(duì)結(jié)果進(jìn)行還原和分析,得到實(shí)際值。如果它在訓(xùn)練誤差的允許范圍內(nèi),則說(shuō)明設(shè)計(jì)的BP神經(jīng)網(wǎng)絡(luò)的推廣能力強(qiáng)。就可以利用訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)算法來(lái)預(yù)測(cè)2011年、2012年、2013年的房?jī)r(jià)發(fā)展情況。事實(shí)上,2011年、2012年的房?jī)r(jià)數(shù)據(jù)已經(jīng)公布,我們可以通過(guò)比較預(yù)測(cè)值與真實(shí)值,如表3,訓(xùn)練誤差都在允許的誤差范圍之內(nèi),于是這樣的BP神經(jīng)網(wǎng)絡(luò)算法有很好的推廣能力,可以用該算法來(lái)預(yù)測(cè)未來(lái)的房?jī)r(jià)情況。
表3 2011~2013年黃岡市區(qū)房?jī)r(jià)預(yù)測(cè)值與真實(shí)值的比較
*表3中2013年的真實(shí)值的數(shù)據(jù),來(lái)自黃岡市住房信息網(wǎng)上公布的1~5月份的數(shù)據(jù)[9]。
從預(yù)測(cè)數(shù)據(jù)的誤差數(shù)據(jù)來(lái)看,本文設(shè)計(jì)的BP神經(jīng)網(wǎng)絡(luò)算法模型對(duì)于黃岡市區(qū)房?jī)r(jià)預(yù)測(cè)達(dá)到了目標(biāo),有一定參考價(jià)值。特別是,預(yù)測(cè)的2013年房?jī)r(jià)雖然只是和1~5月份的數(shù)據(jù)進(jìn)行對(duì)比,但是該結(jié)果還是可控的,基本滿足設(shè)計(jì)要求。另一方面,由于房?jī)r(jià)的走勢(shì)不僅與文中提到的6個(gè)方面因素有關(guān),還與國(guó)家政策、經(jīng)濟(jì)環(huán)境、調(diào)控手段等一些不可控的因素也有關(guān)系,這在一定程度上影響了算法模型的客觀性。再者,所利用的原始數(shù)據(jù)有限,也影響了算法的精度和穩(wěn)定性。
近年來(lái),隨著武漢城市圈戰(zhàn)略上升為國(guó)家戰(zhàn)略,黃岡市的經(jīng)濟(jì)社會(huì)發(fā)展取得了跨越式發(fā)展,房地產(chǎn)業(yè)也得到了長(zhǎng)足的發(fā)展,房?jī)r(jià)也節(jié)節(jié)攀升。當(dāng)然,除了國(guó)家政策是今年黃岡市區(qū)房?jī)r(jià)增長(zhǎng)的誘因外,房地產(chǎn)開(kāi)發(fā)投資和城鎮(zhèn)居民人均可支配收入也是重要因素。
[1] 劉煥彬,庫(kù)在強(qiáng),廖小勇等. 數(shù)學(xué)模型與實(shí)驗(yàn)[M]. 北京:科學(xué)出版社,2008.
[2] 王鈺,周志華,周傲英. 機(jī)器學(xué)習(xí)及其應(yīng)用[M]. 北京:清華大學(xué)出版社,2006.
[3] 楊華.房?jī)r(jià)分析模型及對(duì)策[J].武漢工業(yè)學(xué)院學(xué)報(bào),2008,27(1):89-93.
[4] 胡六星,吳結(jié)飛.基于灰色系統(tǒng)理論的兩種房?jī)r(jià)預(yù)測(cè)方法比較[J].統(tǒng)計(jì)與決策,2010(7):22-24.
[5] 杜道淵,柏宏斌,周鋒. 基于BP神經(jīng)網(wǎng)絡(luò)自貢房地產(chǎn)價(jià)格走勢(shì)預(yù)測(cè)[J]. 四川理工學(xué)院學(xué)報(bào):自然科學(xué)版,2011,24(3):366-369.
[6] 閆鵬飛,王典,燕慧慧.基于GM(1,1)模型的鄭州市商品房房?jī)r(jià)預(yù)測(cè)[J].重慶交通大學(xué)學(xué)報(bào):社科版,2013,13(3):60-64.
[7] 閆海波,陳敬良.地價(jià)增長(zhǎng)率的GM(1,1)預(yù)測(cè)模型[J].統(tǒng)計(jì)與決策,2011(22):168-170.
[8] 湖北省統(tǒng)計(jì)局. 2003-2010年黃岡市統(tǒng)計(jì)年鑒[DB]. [2012-11-19]. http://www.stats-hb.gov.cn/szbmtjsj.htm.
[9] 黃岡市房地產(chǎn)管理局. http://www.hgfdcxx.com/PubInfo/StatData.asp.
[10] 朱凱,王正林. 精通MATLAB神經(jīng)網(wǎng)絡(luò)[M]. 北京:電子工業(yè)出版社,2009.
(李鑫)
Prediction of Housing prices in Huanggang City based on artificial neural network BP algorithm
ZHOU Xue-jun1, CHEN Wen-xiu2
(1.College of Mathematics and Physics,Huanggang Normal University,Huangzhou 438000,Hubei,China;2.Huangzhou Branch Campus, Huanggang Radio and TV University, Huangzhou 438000,Hubei,China)
Based on artificial neural network BP algorithm, referring to urban per capita GDP of Huanggang, investment in real estate development, the per-capita living space of urban residents and other related data from 2003 to 2010, we predict the 2011 and 2012 housing prices of Huanggang urban area. Compared with the data published, the data predicted meet the expected error bound. On this basis, we further predict housing prices in 2013, and find out that housing prices of Huanggang will keep increasing. From the results obtained, reasonable explanation is presented.
Huanggang housing prices; prediction of housing prices; BP neural network algorithm; error
TP183
A
1003-8078(2014)03-0013-03
2013-09-02 doi 10.3969/j.issn.1003-8078.2014.03.04
周學(xué)君,男,湖北蘄春人,講師,碩士,研究方向?yàn)闄C(jī)器學(xué)習(xí)及其應(yīng)用。
黃岡師范學(xué)院科學(xué)研究項(xiàng)目(2013020103);黃岡師范學(xué)院教學(xué)研究項(xiàng)目(2013ce21)。