• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      上海寫字樓租金預(yù)測探究

      2018-12-20 08:10:16李貞良曹布陽
      軟件 2018年11期
      關(guān)鍵詞:寫字樓租金數(shù)量

      李貞良,曹布陽

      ?

      上海寫字樓租金預(yù)測探究

      李貞良,曹布陽

      (同濟(jì)大學(xué) 軟件學(xué)院,上海 201804)

      本課題研究的問題核心點(diǎn)是如何有效地利用寫字樓內(nèi)部及周邊環(huán)境的時空數(shù)據(jù)來對寫字樓的整體規(guī)劃進(jìn)行評估,由于規(guī)劃的優(yōu)劣在一定的程度上能在租金高低上反映出來,我們將著重于通過對寫字樓的租金預(yù)測,對寫字樓及周邊地塊規(guī)劃進(jìn)行評價和建議。文章從數(shù)據(jù)獲取、數(shù)據(jù)處理、影響因素分析、建模分析多個方面進(jìn)行介紹。本文也探討把此方法推廣到對于一般商業(yè)地塊的分析中去的可能性。

      商業(yè)地產(chǎn);預(yù)測;機(jī)器學(xué)習(xí);數(shù)控數(shù)據(jù)

      0 引言

      人近些年來,隨著經(jīng)濟(jì)的高速增長和第三產(chǎn)業(yè)的蓬勃發(fā)展,商業(yè)寫字樓已經(jīng)成為了國民經(jīng)濟(jì)發(fā)展的重要力量和主要空間形式。寫字樓對企業(yè)來說,與企業(yè)共生共榮,實(shí)力企業(yè)入駐高端寫字樓,好的寫字樓也能幫助企業(yè)發(fā)展[1]。對于城市經(jīng)濟(jì)來說,寫字樓承接了城市的經(jīng)濟(jì)發(fā)展面貌。正如國貿(mào)商務(wù)區(qū)之于北京,天河商務(wù)區(qū)之于廣州,陸家嘴之于上海[2-3]。在一定程度上,寫字樓可以視為城市經(jīng)濟(jì)地位的風(fēng)向標(biāo)。這些寫字樓代表著城市的鮮明形象,同時也逐漸成為城市經(jīng)濟(jì)發(fā)展的一個重要載體,蘊(yùn)藏著巨大的經(jīng)濟(jì)能量,創(chuàng)造著豐富的物質(zhì)財富,見證著城市的日益繁榮發(fā)展。

      隨著新寫字樓的規(guī)劃和建設(shè),投資回報率會擺到議事日程上。自然地,開發(fā)商和管理人員會十分關(guān)心幾個問題:一旦寫字樓開發(fā)之后,出租率和空置率大概是多少?采取什么樣的設(shè)施配備,可以讓租金提高?或者采用何種方案,才能使得整體經(jīng)濟(jì)效益最大化?

      因此設(shè)想,如果能夠在規(guī)劃期內(nèi),根據(jù)建筑指標(biāo)和以及周邊時空數(shù)據(jù)提前預(yù)估寫字樓樓房的大致出租情況包括可能的租金,那么會在在很大程度上為決策者和規(guī)劃者提供堅(jiān)實(shí)的決策依據(jù),不僅能提升經(jīng)濟(jì)利益和社會效應(yīng),同時還能幫助開發(fā)商和管理者及時調(diào)整寫字樓的規(guī)劃戰(zhàn)略和決策[4-5]。受此啟發(fā),本文結(jié)合上海及其他地區(qū)眾多寫字樓盤數(shù)據(jù),基于其本身及周邊時空數(shù)據(jù)提出了對寫字樓規(guī)劃評估和租金預(yù)測的相關(guān)研究。

      在房屋售價和租金的預(yù)測方面,回歸預(yù)測的場景十分適合與當(dāng)下熱門的機(jī)器學(xué)習(xí)相結(jié)合,而機(jī)器學(xué)習(xí)算法經(jīng)過若干年的演化和改良,已經(jīng)分化出了較多實(shí)際的應(yīng)用場景[6]。在這些場景中,眾多算法在回歸和預(yù)測方面也有著效果出眾的實(shí)際運(yùn)用,如較為常用且成熟決策樹,隨機(jī)森林,支持向量機(jī)等等[7-9]。這些算法對于不同的數(shù)據(jù)量、數(shù)據(jù)特征、具體場景都會有不同的預(yù)測表現(xiàn),因此需要根據(jù)自身的情況來對算法對比和調(diào)整。例如比較知名的“波士頓房價預(yù)測”案例[10],利用了UCI公開的波士頓房價數(shù)據(jù)集進(jìn)行建模預(yù)測,該數(shù)據(jù)集于1978年開始統(tǒng)計(jì),共506個數(shù)據(jù)點(diǎn),涵蓋了麻省波士頓地區(qū)不同的郊區(qū)房屋14種特征的信息。案例將房價數(shù)據(jù)分析與機(jī)器學(xué)習(xí)相結(jié)合,建立了一個簡單的基于房屋配置的房價預(yù)測模型,并利用該模型對一些新配置房屋進(jìn)行了具有參考價值的定價評估。

      作為在寫字樓租金預(yù)測方面的實(shí)際應(yīng)用,除了理論基礎(chǔ),還需要進(jìn)行數(shù)據(jù)收集與清洗、影響因子分析和選擇、算法選擇與調(diào)參優(yōu)化等一系列的工作,探索出一條科學(xué)可行的方案路線。

      本文通過“研究方法”、“計(jì)算實(shí)驗(yàn)”、“結(jié)果分析”等章節(jié)來介紹這一方案路線。在“研究方法”這一章節(jié)中,步驟分為了“數(shù)據(jù)收集清洗”、“數(shù)據(jù)相關(guān)性分析”和“建模分析”;在研究方法確立后,“計(jì)算實(shí)驗(yàn)”章節(jié)介紹了實(shí)驗(yàn)相關(guān)過程和數(shù)據(jù);最終在“結(jié)果分析”章節(jié)中對實(shí)驗(yàn)結(jié)果進(jìn)行了歸納和總結(jié)。

      1 數(shù)據(jù)收集

      本研究為數(shù)據(jù)驅(qū)動型的,故需要一定數(shù)量的相關(guān)數(shù)據(jù)支撐我們的研究。在前期的數(shù)據(jù)準(zhǔn)備階段,所收集的數(shù)據(jù)主要分為兩類:寫字樓租金信息和寫字樓配套屬性數(shù)據(jù)。

      由于租金信息的波動性和不確定性,受市場變化影響較大,因此需要找到一個數(shù)據(jù)更新及時、數(shù)據(jù)量充足,同時準(zhǔn)確度較高的數(shù)據(jù)來源。在多方面對比之后,決定從目前比較主流的一些寫字樓出租網(wǎng)站上獲取數(shù)據(jù)。由于當(dāng)下租賃網(wǎng)站的發(fā)展迅速,企業(yè)商戶和個人越來越重視線上的租賃渠道,相比線下租賃,線上網(wǎng)站十分便捷且信息公開。同時,對于我們的研究課題而言,租賃網(wǎng)站有如下幾個優(yōu)點(diǎn):

      (1)數(shù)據(jù)更新及時,可以拿到實(shí)時變動下最新的寫字樓出租信息;

      (2)寫字樓覆蓋較廣,在設(shè)定了上海市范圍之后幾乎所有有出租信息的寫字樓都能獲取到相應(yīng) 數(shù)據(jù);

      (3)由于直接的供需關(guān)系,價格相對貼近真實(shí)的成交租金,數(shù)據(jù)較為可信。

      另外,對于一些大型的租賃網(wǎng)站來說,網(wǎng)站上還展示了寫字樓的一些配套屬性數(shù)據(jù),如建筑等級,建成時間,物業(yè)費(fèi),地理位置等等。通過對該類網(wǎng)站上的數(shù)據(jù)進(jìn)行獲取之后即可同時獲取租金信息和一些寫字樓基本的數(shù)據(jù),能夠較為高效地擴(kuò)充所需數(shù)據(jù)和屬性。

      在對租賃網(wǎng)站的選擇上做了進(jìn)一步的調(diào)研和分析之后,在眾多主流網(wǎng)站中,我們選擇了安居客(https://sh.xzl.anjuke.com/loupan/)的寫字樓樓盤數(shù)據(jù)作為參考,通過所開發(fā)的爬蟲工具,可以獲得有關(guān)的寫字樓出租的信息,例如某一寫字樓的網(wǎng)頁展示數(shù)據(jù)如圖1。

      從上面所列出的眾多屬性中,我們可以獲取到諸如建筑等級、電梯數(shù)量、物業(yè)費(fèi)、車位數(shù)等對租金大小可能產(chǎn)生影響的屬性信息,以幫助我們進(jìn)行模型分析。

      同時,針對最重要的租金信息,在調(diào)研之后發(fā)現(xiàn),如果使用單一出租廣告的租價或是部分信息平均值來進(jìn)行代表的話,很容易因?yàn)樾畔l(fā)布人的隨意標(biāo)價或是為了吸引客戶過低標(biāo)價的行為導(dǎo)致數(shù)據(jù)不準(zhǔn)確,因此需要找到一個具有充足數(shù)據(jù)且做了平均租金處理的數(shù)據(jù)來源,消除個別特異租金造成的誤差和影響。比較幸運(yùn)的是,有另外一個網(wǎng)站:好租網(wǎng)(https://www.haozu.com/sh/zuxiezilou/)基于每個寫字樓所有目前的出租信息提供了平均租金,結(jié)合此網(wǎng)站所提供的信息,我們可以獲得更為精準(zhǔn)的寫字樓的租金數(shù)據(jù)。其統(tǒng)計(jì)方式如圖2。

      數(shù)據(jù)獲取:本課題所有數(shù)據(jù)獲取方式均為到相關(guān)網(wǎng)站進(jìn)行自動化的數(shù)據(jù)爬取,限于篇幅,同時爬取過程也不是本研究課題的重點(diǎn),故省略數(shù)據(jù)抓取的詳細(xì)步驟。

      除了基礎(chǔ)屬性,地理位置作為一項(xiàng)十分重要的空間屬性,能夠在很大程度上決定寫字樓的租金高低[11]。但是關(guān)于一個寫字樓的地理位置和區(qū)位情況較難量化,因此我們采取了對于寫字樓周邊的不同種類POI(Point of Interest)數(shù)量及類型進(jìn)行加權(quán)計(jì)算,近似代替一個寫字樓的地理位置熱度。例如,根據(jù)寫字樓周邊一定范圍內(nèi)的地鐵、酒店、停車場、商場和醫(yī)院等POI數(shù)量加權(quán)后得到一個地理位置特征值,作為空間屬性的量化指標(biāo)。

      對于寫字樓周邊的POI數(shù)據(jù)可以通過百度地圖POI接口批量檢索后獲得。

      有了基礎(chǔ)屬性,空間位置屬性,平均租金之后可以通過寫字樓名稱將寫字樓所有信息關(guān)聯(lián)起來:寫字樓名稱-平均租金(好租網(wǎng))-基礎(chǔ)屬性(安居客)-空間位置/POI數(shù)量(百度地圖POI)。

      圖2 好租網(wǎng)寫字樓租金情況網(wǎng)頁展示

      數(shù)據(jù)錄入需要進(jìn)行數(shù)據(jù)的清洗。過程大致如下:

      (1)將字符類型的字段量化后轉(zhuǎn)為數(shù)值類型,如建筑等級:甲乙丙級,將其對應(yīng)為數(shù)值的3、2、1。

      (2)出現(xiàn)屬性值為空(爬取時網(wǎng)站上缺少該屬性)的情況時,如果該屬性為空的樣本數(shù)占總體樣本超過15%,則在所有樣本中刪除該屬性,該屬性不加入模型分析;如果超過5%,則去除缺少該屬性的樣本;如比例在5%及以下,缺失該屬性的樣本對整體影響不大,則將缺失該屬性的樣本中該屬性值置位0。

      (3)對數(shù)值異常進(jìn)行處理,如租金超過50元/m2×天,等于0元/m2×天的樣本,都當(dāng)做異常直接去除整條樣本。盡可能排除噪音點(diǎn)和異常點(diǎn)對模型的干擾。

      2 相關(guān)性分析

      在數(shù)據(jù)收集階段,我們收集到很多寫字樓相關(guān)屬性,這些屬性是主觀判斷下認(rèn)為的寫字樓租金的影響因素。但是在這些屬性中,也有影響力的高低之分。因此我們應(yīng)該在最終的預(yù)測模型中進(jìn)行不同屬性權(quán)重的分配。

      上文中說到,使用寫字樓周邊不同POI數(shù)據(jù)進(jìn)行總和計(jì)算,以此來近似代替寫字樓的周邊區(qū)位、便利性、以及通勤優(yōu)勢等。但是不同類別的POI其實(shí)對于寫字樓租金的影響也是不同的,從直觀上我們可以做出猜測,對于辦公寫字樓來說,對周邊的公園和醫(yī)院等數(shù)量不是十分敏感;同時寫字樓周邊的商店數(shù)量對其租金的影響,遠(yuǎn)遠(yuǎn)沒有寫字樓短距離內(nèi)的地鐵站和地鐵線路數(shù)量對租金的影響大。因此,對于寫字樓的區(qū)位優(yōu)勢我們不能簡單用POI加和代表,而是需要對不同POI設(shè)置權(quán)重,建立模型進(jìn)行計(jì)算。

      要計(jì)算每種POI的權(quán)重,就需要分析每種POI和租金信息之間的相關(guān)性。

      在數(shù)據(jù)收集過程中,我們獲取了寫字樓周邊的以下幾類POI數(shù)量:酒店數(shù)量(hotel)、醫(yī)院數(shù)量(hospital),商場數(shù)量(mall),公園數(shù)量(park),商店數(shù)量(store)以及地鐵站以及站內(nèi)所含線路之?dāng)?shù)量(underground)。

      根據(jù)每種POI數(shù)量和其對應(yīng)的寫字樓平均租金,作出可視化的數(shù)據(jù)分布圖。

      圖3 寫字樓周邊各POI數(shù)量與租金的相關(guān)性分析

      根據(jù)經(jīng)驗(yàn)可以得出,寫字樓周邊POI數(shù)量應(yīng)該和寫字樓租金成一定線性關(guān)系,例如周邊便利店、商場越多,代表地區(qū)越繁華,寫字樓租金就越高;而周邊通勤的地鐵線路數(shù)量越多,代表交通越便利,則租金也會越高。而根據(jù)圖像顯示,也可以看出POI數(shù)量和租金成一定的正比關(guān)系。因此作出相關(guān)性的假設(shè):每類POI數(shù)量和租金保持大致的線性關(guān)系,即:POI數(shù)量增多時,相應(yīng)的租金也會有所增加。

      因此,要找到這個線性關(guān)系(根據(jù)經(jīng)驗(yàn)判斷),我們將對對數(shù)據(jù)點(diǎn)進(jìn)行線性回歸。線性回歸方式采用最小二乘法,即假設(shè)擬合直線形如:

      其中,X代表每類poi的數(shù)量,Y代表租金。a,b為該擬合直線的系數(shù)。

      最終擬合結(jié)果如圖4。

      我們最終的目標(biāo)是找到該類POI與租金的相關(guān)性強(qiáng)弱。從上圖中我們可以分析得知,如果一個POI和租金十分相關(guān)的話,那么點(diǎn)分布應(yīng)該更靠近擬合的直線(圖中紅線);相反的,如果POI與租金相關(guān)性較弱或是沒有直接相關(guān)性,那么點(diǎn)分布應(yīng)該更加離散。

      評估數(shù)據(jù)點(diǎn)到直線的離散程度可以使用每個點(diǎn)到擬合直線的距離平均值來評估,這個距離平均值即是回歸分析常用的評價指標(biāo):均方誤差MSE(Mean Squared Error)。

      圖4 線性關(guān)系下各POI數(shù)量與租金的擬合直線

      通過計(jì)算,得到各個屬性數(shù)據(jù)點(diǎn)到回歸直線的均方誤差MSE如下:

      表1 各屬性MSE表

      Tab.1 MSE attributes

      根據(jù)MSE越大相關(guān)性越小的原則,得到MSE與相關(guān)性的反比關(guān)系。根據(jù)以上特點(diǎn),我們可以定義一個描述某一寫字樓區(qū)位優(yōu)勢和地理位置熱度的量化指標(biāo),令其為f(x),則該量化指標(biāo)計(jì)算方式如下:

      其中n表示上述6類POI中的第幾類。

      由上述表達(dá)式我們可以得到一個由多個POI共同影響的寫字樓區(qū)位優(yōu)勢綜合評價。有了這一量化指標(biāo),我們就可以將寫字樓的區(qū)位優(yōu)勢作為一個租金的影響因子,投入模型進(jìn)行分析。

      3 建模分析

      對其余屬性影響權(quán)重的確定,本質(zhì)上就是對于寫字樓所有相關(guān)數(shù)據(jù)和其租金進(jìn)行回歸分析,建立輸入(各項(xiàng)屬性值)和輸出(租金)之間的關(guān)系。對這樣典型的回歸問題來說需要選擇一個合理的自學(xué)習(xí)回歸模型,也就是在大量數(shù)據(jù)中通過訓(xùn)練自動調(diào)整參數(shù)的機(jī)器學(xué)習(xí)模型。

      在模型選擇上,采用了當(dāng)下回歸預(yù)測問題廣泛采用,同時效果較好的“支持向量機(jī)”-SVM(Support Vector Machine)[12]。選擇SVM有以下一些理由:

      (1)在本問題中,收集到的寫字樓屬性較多,在高維的特征空間中SVM比其他回歸算法表現(xiàn) 更好。

      (2)SVM能夠處理非線性特征的相互作用。

      (3)因?yàn)楸菊n題收集的寫字樓數(shù)據(jù)均來自網(wǎng)絡(luò),可以預(yù)想有部分?jǐn)?shù)據(jù)其實(shí)是不準(zhǔn)確的,容易成為噪音點(diǎn)。該類噪音點(diǎn)因?yàn)閷傩暂^多也較復(fù)雜,不容易在數(shù)據(jù)清洗階段識別出來去除,因此需要模型 有較好的抗噪音能力。而SVM相比其他回歸模型有較強(qiáng)的魯棒性,模型建立后的泛化能力也更好。

      (4)由于SVM是借助二次規(guī)劃來求解支持向量,而求解二次規(guī)劃需要大量的存儲和計(jì)算,因此SVM計(jì)算效率是較為低下的,在大量訓(xùn)練數(shù)據(jù)面前比較吃力。但是在該課題中,網(wǎng)站上上海寫字樓數(shù)量有限,數(shù)據(jù)總量不大,樣本數(shù)不超過1000個,因此帶來的運(yùn)算代價在可接受范圍內(nèi)。

      4 計(jì)算實(shí)驗(yàn)

      SVM能夠解決分類和回歸問題,在本課題中主要使用支持向量機(jī)回歸SVR(Support Vector Regression),也就是找到一個回歸平面,讓一個集合中所有樣本點(diǎn)到該平面的距離最近。

      進(jìn)行回歸訓(xùn)練時,需要將數(shù)據(jù)分為訓(xùn)練集和測試集。在前文提到的數(shù)據(jù)收集處理階段我們對入庫的寫字樓數(shù)據(jù)進(jìn)行過清洗,包括對數(shù)據(jù)格式進(jìn)行統(tǒng)一規(guī)范,對一些租金、屬性值超出正常范圍的數(shù)據(jù)進(jìn)行去除。最終剩下有效數(shù)據(jù)量為890條。我們對有效數(shù)據(jù)進(jìn)行訓(xùn)練集和測試集劃分:95%數(shù)據(jù)作為訓(xùn)練集,5%數(shù)據(jù)作為測試集。

      在訓(xùn)練數(shù)據(jù)中,每一個樣本輸入包含的屬性有:

      表2 樣本屬性表

      Tab.2 Sample data attributes

      在進(jìn)行SVR訓(xùn)練時,需要調(diào)整參數(shù)達(dá)到最優(yōu)效果,在根據(jù)數(shù)據(jù)特點(diǎn)和訓(xùn)練結(jié)果進(jìn)行調(diào)整之后,得到一個回歸模型。SVR具體參數(shù)設(shè)置如表3。

      帶入測試集數(shù)據(jù)之后,得到一組預(yù)測的寫字樓租金。與測試集實(shí)際的租金對比效果如圖5。

      將每個預(yù)測租金點(diǎn)和實(shí)際租金點(diǎn)繪成折線圖進(jìn)行直觀的效果對比,如圖6。

      為了驗(yàn)證SVR模型的有效性,以及針對本課題數(shù)據(jù)特點(diǎn)擁有的獨(dú)特優(yōu)越性,還用相同的訓(xùn)練集和測試集數(shù)據(jù)用其他模型進(jìn)行了預(yù)測對比。例如在進(jìn)行效果對比時使用了“決策樹回歸”來進(jìn)行模型訓(xùn)練和預(yù)測。在決策樹回歸過程中經(jīng)過數(shù)次嘗試得到最佳參數(shù)設(shè)置:調(diào)整訓(xùn)練最大深度(max_depth),即建立樹時從根節(jié)點(diǎn)到葉子節(jié)點(diǎn)的路徑長度,將值設(shè)置為5。決策樹回歸模型的最終訓(xùn)練結(jié)果如圖7。

      表3 SVR參數(shù)設(shè)置表

      Tab.3 Parameter settings for SVR

      圖7 決策樹回歸模型預(yù)測租金與真實(shí)租金進(jìn)行柱形圖對比

      對應(yīng)的折線圖如下:

      圖8 決策樹回歸模型預(yù)測租金與真實(shí)租金進(jìn)行折線圖對比

      同時計(jì)算SVR模型和決策樹回歸模型下,預(yù)測集和測試集租金之前的差距。我們依然使用均方誤差:MSE來評估:

      表3 SVR和決策樹回歸預(yù)測結(jié)果均方誤差表

      Tab.3 MSE for DecisionTree Regression and SVR

      通過圖形和MSE指標(biāo)都可以看出,同樣在調(diào)整參數(shù)之后SVR模型預(yù)測效果優(yōu)于決策樹回歸。

      5 結(jié)果分析

      簡單從結(jié)果上來分析的話可以看到,在一些租金值較為極端的情況下預(yù)測效果較為保守。在一些租金較高點(diǎn)或者較低點(diǎn)預(yù)測不夠準(zhǔn)確,分析如下:

      (1)數(shù)據(jù)訓(xùn)練樣本不夠:目前在數(shù)據(jù)清洗之后上海寫字樓有效數(shù)據(jù)還不足900條,對于成熟可靠的模型來說來遠(yuǎn)遠(yuǎn)不足。之后可嘗試其他地區(qū)的寫字樓樓盤,擴(kuò)充訓(xùn)練集。

      (2)數(shù)據(jù)本身質(zhì)量不足:一些寫字樓發(fā)布人可能對發(fā)布的寫字樓租金隨意標(biāo)價。為了吸引瀏覽量刻意降低或者抬高標(biāo)價,導(dǎo)致能夠獲取到的標(biāo)價和真實(shí)成交價格有差距,最終模型訓(xùn)練效果不夠好。同時,對于寫字樓其他屬性來說也有可能存在部分錯誤信息,影響了訓(xùn)練結(jié)果。課題數(shù)據(jù)來源過于依靠網(wǎng)絡(luò)平臺,包括寫字樓各項(xiàng)數(shù)據(jù),POI數(shù)據(jù)等都來自網(wǎng)站爬取或者網(wǎng)絡(luò)查詢,數(shù)據(jù)質(zhì)量不可控。之后可以尋找更加正規(guī)或官方的渠道,盡量讓各個樣本的屬性接近真實(shí)值。

      (3)寫字樓的現(xiàn)有屬性利用不足:例如不同種類的POI數(shù)據(jù),只是用來簡單的進(jìn)行加權(quán)和,對于本身POI價值來說挖掘不夠。例如地鐵站數(shù)目其實(shí)可以極大影響到寫字樓租金價格,但是在計(jì)算時只是簡化成一種普通的POI指標(biāo),作為POI加權(quán)和的一部分。同時,一些寫字樓的入駐企業(yè)信息也有收集,但是因?yàn)榱炕^困難在此次課題中沒有作為屬性加入訓(xùn)練。

      (4)影響租金的屬性收集不全:例如對于寫字樓的空間屬性來說,簡單使用一些POI指標(biāo)進(jìn)行加權(quán)和來代表其實(shí)是不準(zhǔn)確的,并不能完美的反映一個寫字樓地理位置熱度信息。除了POI外,地理信息還包括了寫字樓周邊通勤,交通流量以及高峰擁堵程度等。同時,寫字樓租金還會受整個產(chǎn)業(yè)園區(qū)的整體租金水平、綠化、物業(yè)等等因素影響,這些屬性在本課題中都沒能收集加以考慮。

      但是總體上來說,模型對于不同樣本之間的預(yù)測結(jié)果與真實(shí)值保持了一致的變化趨勢。同時,預(yù)測結(jié)果在一定范圍內(nèi)是可靠的,可以作為寫字樓開發(fā)商和出租方租金定價的范圍參考。

      6 總結(jié)

      作為本課題來說,旨在嘗試一種方便、快捷并且智能化的地產(chǎn)分析評估方式,用自動化爬取的數(shù)據(jù)獲取方式代替?zhèn)鹘y(tǒng)的實(shí)地走訪或是人工收集錄入,同時在能力范圍內(nèi)盡可能地去擴(kuò)充寫字樓的維度信息,將這部分維度信息作為影響其租金定價的影響因子,最終通過機(jī)器學(xué)習(xí)等一系列智能化的建模分析方法來對影響因子與租金間的因果關(guān)系用模型進(jìn)行了歸納和描述,最終達(dá)到了預(yù)測估計(jì)的效果和目的。在文章中我們嘗試了一個數(shù)據(jù)來源公開且方便獲取、預(yù)測結(jié)果有參考價值的寫字樓租金學(xué)習(xí)、預(yù)測的技術(shù)方案。今后也可以在此基礎(chǔ)上繼續(xù)打磨,對上述不足之處作出改進(jìn),嘗試對模型參數(shù)進(jìn)行調(diào)優(yōu),并嘗試更多的機(jī)器學(xué)習(xí)模型并作出結(jié)果對比,分析利弊,把寫字樓預(yù)測模型做得更加健壯和并獲得更為精確的結(jié)果,產(chǎn)生更大的實(shí)用價值。

      [1] 葛大永. CBD寫字樓城市經(jīng)濟(jì)價值探討[J]. 科技信息, 2009(33): 674-675.

      [2] 陳曉婷. 上海甲級寫字樓市場淺析[J]. 才智, 2010(12): 31.

      [3] 中華寫字樓網(wǎng). 2016年上海甲級寫字樓市場年度報告[J/OL]. (2017-5-16) http: //news.officese.com/2017-5-1/153226. html.

      [4] 章輝. 如何確定旅店的出租率?[J]. 商業(yè)經(jīng)濟(jì)文薈, 1985, (01): 55-56.

      [5] 茹茜. 提高我國社區(qū)商業(yè)街出租率的對策[J]. 內(nèi)江科技, 2011, 32(09): 142+85.

      [6] Glaeser E L, Nathanson C G. An extrapolative model of house price dynamics[J]. Journal of Financial Economics, 2017.

      [7] 張寅. 用于回歸預(yù)測的高斯過程模型研究[D].河北工業(yè)大學(xué), 2014.

      [8] Chi Zhang, Haikun Wei, Xin Zhao, Tianhong Liu, Kanjian Zhang. A Gaussian process regression based hybrid approach for short-term wind speed prediction[J]. Energy Conversion and Management, 2016.

      [9] 張偉, 熊偉麗, 徐保國. 基于實(shí)時學(xué)習(xí)的高斯過程回歸多模型融合建模[J]. 信息與控制, 2015, 44(04): 487-492+498.

      [10] Boston Home Prices Prediction and Evaluation[J/OL]. https: //www.ritchieng.com/machine-learning-project-boston-home-prices/

      [11] 龔健雅, 李小龍, 吳華意. 實(shí)時GIS時空數(shù)據(jù)模型[J]. 測繪學(xué)報, 2014, 43(03): 226-232+275.

      [12] Yueming QI. GA-SVR Prediction of Failure Depth of Coal Seam Floor Based on Small Sample Data[A]. CBEES. Proceedings of 2013 2nd International Conference on Geological and Environmental Sciences (ICGES 2013)[C]. CBEES: 2013: 7.

      Research on Rent Prediction of Shanghai Office Building

      LI Zhen-liang, CAO Bu-yang

      (School of Software Engineering, Tongji University, Shanghai 210044, China)

      The concept of the research is how to effectively use the office buildings’ time and spacial data to evaluate the construction plan of buildings. Since the quality of the construction plan can be approximately reflected in the rent price level, we can focus on evaluation and suggestion for construction plan of these office buildings through rent prediction. The article introduced the research steps of data acquisition, data processing, influencing factor analysis and modeling analysis. This article also explored the approach to apply these research steps and prediction model to the analysis of general commercial estates.

      Commercial estate; Prediction; Machine learning; CNC data

      TP181

      A

      10.3969/j.issn.1003-6970.2018.11.036

      李貞良(1993-),男,研究生,主要研究方向:機(jī)器學(xué)習(xí)與大數(shù)據(jù);曹布陽(1958-),男,教授,主要研究方向:機(jī)器學(xué)習(xí)與大數(shù)據(jù)。

      李貞良,曹布陽. 上海寫字樓租金預(yù)測探究[J]. 軟件,2018,39(11):170-177

      猜你喜歡
      寫字樓租金數(shù)量
      租金320元!70斤iPhone官方自助維修包,里面有什么?
      新政府會計(jì)制度下保障性住房租金會計(jì)核算案例
      大樹爺爺收租金
      新天萌館:寫字樓里的“建筑夢工廠”
      中高檔寫字樓租賃市場營銷策略研究
      統(tǒng)一數(shù)量再比較
      一線城市寫字樓空置率分化
      頭發(fā)的數(shù)量
      臺商蕭俊丞在都市寫字樓里開菜地
      華人時刊(2016年13期)2016-04-05 05:50:12
      我國博物館數(shù)量達(dá)4510家
      成武县| 莱芜市| 南木林县| 定州市| 同德县| 海盐县| 西华县| 屯昌县| 麻城市| 临海市| 麟游县| 汤原县| 钟山县| 监利县| 晋中市| 汝南县| 龙江县| 黄梅县| 合水县| 阜南县| 庆安县| 平安县| 沙雅县| 余干县| 曲靖市| 安阳市| 印江| 屏边| 镇原县| 威远县| 黄骅市| 苏尼特右旗| 礼泉县| 中江县| 合山市| 荥经县| 株洲县| 清苑县| 揭阳市| 淳安县| 新兴县|