葉楚義 高群霞 李晶 吳成云 曾曉玲 羅創(chuàng)謙 蔡程健
摘? 要:隨著大數(shù)據(jù)與人工智能技術(shù)的興起,深度學(xué)習(xí)方法在房?jī)r(jià)投資方面有極大發(fā)揮空間。文章設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)智能房?jī)r(jià)分析系統(tǒng),主要包括基于LSTM的“房?jī)r(jià)預(yù)測(cè)”和基于情感分析的“輿情輿論”兩大模塊,可較好實(shí)現(xiàn)房?jī)r(jià)未來(lái)趨勢(shì)預(yù)測(cè)及輿情分析,為企業(yè)和投資者提供參考和指引。
關(guān)鍵詞:房?jī)r(jià)預(yù)測(cè);LSTM;情感分析;數(shù)據(jù)可視化
中圖分類(lèi)號(hào):TP311.52? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ? ? ?文章編號(hào):2095-2945(2019)34-0030-03
Abstract: With the rise of big data and artificial intelligence technology, deep learning method has a great space in housing price investment. In this paper, an intelligent housing price analysis system is designed and implemented, which mainly includes two modules, "housing price prediction" based on LSTM and "public opinion" based on emotion analysis, which can better realize the future trend prediction and public opinion analysis of housing price, and provide reference and guidance for enterprises and investors.
Keywords: housingprice prediction; LSTM; emotion analysis; data visualization
1 研究背景及意義
房?jī)r(jià)在當(dāng)今金融市場(chǎng)中起著重要作用,是當(dāng)前社會(huì)的焦點(diǎn)話題,準(zhǔn)確預(yù)測(cè)房?jī)r(jià)的變化趨勢(shì)對(duì)購(gòu)房者、地產(chǎn)商及政府都有很大幫助[1]。以往的預(yù)測(cè)方式是要對(duì)各項(xiàng)相關(guān)數(shù)據(jù)粗糙羅列、經(jīng)驗(yàn)方式設(shè)計(jì)參數(shù)權(quán)重,未考慮購(gòu)房意愿、政府政策等人文因素的影響,預(yù)測(cè)準(zhǔn)確性和置信度不理想。
本文運(yùn)用機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘等方法,設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)包含基于LSTM的“房?jī)r(jià)預(yù)測(cè)”和基于情感分析的“輿情輿論”兩大模塊的智能房?jī)r(jià)分析系統(tǒng),可較好實(shí)現(xiàn)房?jī)r(jià)未來(lái)趨勢(shì)預(yù)測(cè)和輿論分析,為企業(yè)和廣大投資者提供指引和參考。
2 相關(guān)原理與技術(shù)
2.1 LSTM長(zhǎng)短期記憶網(wǎng)絡(luò)
長(zhǎng)短期記憶網(wǎng)絡(luò)LSTM(Long Short-Term Memory)是一種時(shí)間遞歸神經(jīng)網(wǎng)絡(luò),適合處理和預(yù)測(cè)時(shí)間序列中間隔和延遲相對(duì)較長(zhǎng)的重要事件[2]。LSTM是對(duì)RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))的改進(jìn),在算法中加入了一個(gè)判斷信息有用與否的“處理器”——cell,通過(guò)在cell中放置輸入門(mén)、遺忘門(mén)和輸出門(mén)三扇門(mén)實(shí)現(xiàn)判別。
2.2 情感分析算法
情感分析是自然語(yǔ)言處理(NLP)的一種,是一種可自動(dòng)識(shí)別文本中主觀觀點(diǎn)和情感傾向的文本挖掘方法,目前被廣泛應(yīng)用于Web信息挖掘、輿情追蹤等領(lǐng)域[3,4]?;谡Z(yǔ)義規(guī)則的情感分析模型是通過(guò)語(yǔ)義規(guī)則對(duì)帶有感情的主觀性文本進(jìn)行評(píng)估,從而挖掘出文本中隱藏的情緒傾向[5,6]。
3 系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
3.1 系統(tǒng)設(shè)計(jì)
系統(tǒng)主要包括房?jī)r(jià)預(yù)測(cè)和情感分析兩大模塊,系統(tǒng)整體架構(gòu)和功能框架分別如圖1和圖2所示。通過(guò)爬蟲(chóng)技術(shù)獲取房?jī)r(jià)數(shù)據(jù)和用戶評(píng)論數(shù)據(jù);構(gòu)建LSTM房?jī)r(jià)預(yù)測(cè)模型,結(jié)合歷史數(shù)據(jù)和各大決定因素預(yù)測(cè)未來(lái)房?jī)r(jià)走勢(shì);構(gòu)建情感分析模型,對(duì)投資者評(píng)論進(jìn)行情感分析,獲得積極度、消極度和置信度等數(shù)據(jù);通過(guò)Echarts繪圖庫(kù)和詞云圖將數(shù)據(jù)可視化處理后呈現(xiàn)給用戶。
3.2 系統(tǒng)實(shí)現(xiàn)
(1)數(shù)據(jù)分析統(tǒng)計(jì)與可視化
用戶登錄系統(tǒng)后,系統(tǒng)后臺(tái)將自動(dòng)獲取用戶所在定位,并從后臺(tái)數(shù)據(jù)倉(cāng)庫(kù)獲取對(duì)應(yīng)數(shù)據(jù),完成數(shù)據(jù)分析與統(tǒng)計(jì),并以折線圖、熱力圖等方式呈現(xiàn)給用戶,如圖3和圖4所示。
(2)房?jī)r(jià)預(yù)測(cè)
用requests庫(kù)和爬蟲(chóng)算法爬取安居客網(wǎng)站的房?jī)r(jià)數(shù)據(jù),構(gòu)建LSTM深度學(xué)習(xí)模型預(yù)測(cè)房?jī)r(jià)走勢(shì)。LSTM模型參數(shù)為:時(shí)間步time_step為20,rnn_unit參數(shù)為10,每一批次訓(xùn)練樣例為60,輸入層維度為2,輸出層維度為1,學(xué)習(xí)率為0.0006,每一區(qū)域模型訓(xùn)練的次數(shù)為5000次,為防止val_loss逐漸增大,導(dǎo)致過(guò)擬合現(xiàn)象,使用Dropout技術(shù)進(jìn)行控制,參數(shù)為0.5。
房?jī)r(jià)預(yù)測(cè)效果如圖5示,可看出預(yù)測(cè)數(shù)值和原始數(shù)值高度貼合,能提供一個(gè)未來(lái)走勢(shì)供用戶參考,y軸值將用來(lái)展示單位數(shù)據(jù)元/m2,x軸表示年月。
(3)情感分析
根據(jù)用戶輸入的樓盤(pán)地址爬取樓盤(pán)相關(guān)評(píng)論信息,使用jieba庫(kù)實(shí)現(xiàn)分詞和詞頻統(tǒng)計(jì),繪制彩色詞云圖;通過(guò)百度情感分析API實(shí)現(xiàn)語(yǔ)句情感傾向判斷,獲取消極度、中性,積極度,并以餅圖形式呈現(xiàn),如圖6所示。
4 結(jié)束語(yǔ)
本房?jī)r(jià)分析系統(tǒng)能很好實(shí)現(xiàn)房?jī)r(jià)預(yù)測(cè)、情感分析、數(shù)據(jù)可視化等功能,具有較好應(yīng)用前景。由于房?jī)r(jià)市場(chǎng)受多種因素的影響,增加多種數(shù)據(jù)集及數(shù)據(jù)量可進(jìn)一步提高預(yù)測(cè)效果。
參考文獻(xiàn):
[1]常誠(chéng).基于多模態(tài)信息融合的房地產(chǎn)價(jià)格預(yù)測(cè)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].北京郵電大學(xué),2019.
[2]張佳禹.基于深度學(xué)習(xí)算法的上市公司投資決策支持模型研究[D].遼寧師范大學(xué),2018.
[3]王曉艷.公眾輿情與房?jī)r(jià)波動(dòng)的灰色關(guān)聯(lián)分析——基于網(wǎng)絡(luò)輿情的內(nèi)容分析[J].上海商學(xué)院學(xué)報(bào),2018,19(03):39-46.
[4]KEVIN JATI KURNIAJAYA.基于新聞情感分析的房?jī)r(jià)預(yù)測(cè)研究[D].哈爾濱工業(yè)大學(xué),2018.
[5]吳江,唐常杰,李太勇,等.基于語(yǔ)義規(guī)則的Web金融文本情感分析[J].計(jì)算機(jī)應(yīng)用,2014,34(02):481-485+495.
[6]吳雁.金融微博細(xì)粒度情感分析研究與應(yīng)用[D].華南理工大學(xué),2018.