• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于機(jī)器學(xué)習(xí)的房產(chǎn)估價(jià)模型研究

      2024-10-10 00:00:00柳越劉從軍
      軟件工程 2024年10期
      關(guān)鍵詞:存量房

      關(guān)鍵詞:房產(chǎn)估價(jià);XGBoost;估價(jià)模型;存量房

      中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)志碼:A

      0 引言(Introduction)

      在商品房交易市場(chǎng)中,商品房的價(jià)格相對(duì)固定,其房產(chǎn)稅則依據(jù)國(guó)家規(guī)定的固定比例進(jìn)行征收。相比之下,存量房的價(jià)格具有波動(dòng)性[1],其交易過(guò)程需先對(duì)房屋的價(jià)值進(jìn)行評(píng)估,再根據(jù)規(guī)定的稅收政策交稅[2]。ANDERSON等[3]的研究認(rèn)為房產(chǎn)稅最早起源于中世紀(jì)的歐美發(fā)達(dá)國(guó)家。在我國(guó)存量房交易中,有一個(gè)存量房交易稅收的“取大優(yōu)先”規(guī)則:如果交易金額小于房產(chǎn)評(píng)估值,仍將基于評(píng)估值收稅;反之,則依據(jù)交易金額收稅。在此規(guī)則下,房產(chǎn)估價(jià)顯得尤為重要,它不僅有助于防止稅收流失,還對(duì)中國(guó)經(jīng)濟(jì)實(shí)現(xiàn)高質(zhì)量發(fā)展具有積極的意義[4],這也是本課題的核心研究意義所在。

      房產(chǎn)價(jià)格是在眾多特征因素綜合影響下的量化結(jié)果[5]。當(dāng)前,主流的房產(chǎn)價(jià)格研究大多聚焦于房屋的影響因素,并基于特征價(jià)格理論、區(qū)位理論、地租理論等知識(shí)體系構(gòu)建估價(jià)模型[6]。本文使用XGBoost模型研究并建立存量房的估價(jià)模型,并改進(jìn)了XGBoost模型的參數(shù)組合,使用真實(shí)樣本數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練和測(cè)試。結(jié)果顯示,改進(jìn)后的模型性能得到了顯著的提高。

      1 相關(guān)理論(Related theory

      其中:L(θ)為訓(xùn)練損失函數(shù),是衡量模型對(duì)訓(xùn)練數(shù)據(jù)擬合性能的關(guān)鍵指標(biāo);Ω(θ)為正則化懲罰項(xiàng),旨在控制模型的復(fù)雜性,防止過(guò)擬合。通過(guò)優(yōu)化訓(xùn)練損失函數(shù)和正則化懲罰項(xiàng)得到XGBoost模型的目標(biāo)函數(shù)。

      1.2 貝葉斯優(yōu)化理論

      超參數(shù)調(diào)整是機(jī)器學(xué)習(xí)中的一個(gè)重要概念[9]。XGBoost模型包含眾多超參數(shù),通過(guò)調(diào)整參數(shù),找到合適的參數(shù)組合,可以顯著提升模型性能。在機(jī)器學(xué)習(xí)模型中,常用的超參數(shù)優(yōu)化方法有網(wǎng)格搜索(Grid Search,GS)、隨機(jī)搜索(Random Search,RS)和貝葉斯優(yōu)化,但GS和RS并不適合超參數(shù)較多的XGBoost模型。相比之下,貝葉斯優(yōu)化更適用于參數(shù)空間連續(xù)、復(fù)雜或大型的場(chǎng)景;它通過(guò)建模和利用參數(shù)之間的關(guān)系,智能化地選擇下一個(gè)參數(shù)組合,從而在相對(duì)較少的迭代次數(shù)內(nèi)找到更好的結(jié)果。貝葉斯優(yōu)化提供的是一種更優(yōu)雅和高效的調(diào)參方法,因此本研究中,采用貝葉斯優(yōu)化調(diào)整XGBoost模型的參數(shù)。此外,設(shè)置動(dòng)態(tài)學(xué)習(xí)率和隨機(jī)種子提高模型的性能和可復(fù)現(xiàn)性。

      貝葉斯優(yōu)化是一種用于超參數(shù)調(diào)整的強(qiáng)大技術(shù),它通過(guò)對(duì)模型性能進(jìn)行反復(fù)評(píng)估,動(dòng)態(tài)地搜索超參數(shù)空間,以找到最優(yōu)的超參數(shù)組合。本文使用貝葉斯優(yōu)化工具Bayesian Optimization庫(kù),可以在給定的超參數(shù)范圍內(nèi)尋找最佳組合,從而提升模型的性能。貝葉斯參數(shù)優(yōu)化流程如圖1所示。

      2 房產(chǎn)估價(jià)模型構(gòu)建(Construction of propertyvaluation model)

      2.1 選取特征變量

      國(guó)外學(xué)者較早地開(kāi)展了住宅價(jià)格影響因素的研究,很多學(xué)者借鑒了國(guó)外學(xué)者的評(píng)估理論并結(jié)合我國(guó)的實(shí)際情況,客觀地分析影響我國(guó)房地產(chǎn)市場(chǎng)價(jià)格的主要特征因素,并總結(jié)了合適的特征變量[10]。在國(guó)內(nèi),很多學(xué)者依據(jù)理論從建筑、鄰里、區(qū)位3個(gè)方面選擇特征價(jià)格變量[11],但各地政府會(huì)根據(jù)每個(gè)城市的特性,因地制宜地制定一些房地產(chǎn)政策,這會(huì)涉及一些二手住宅的交易稅率、補(bǔ)貼政策等方面。本文參考了國(guó)內(nèi)學(xué)者的研究成果,并調(diào)研某市房地產(chǎn)市場(chǎng)的特點(diǎn),對(duì)變量的選擇進(jìn)行了總結(jié),一共有12個(gè)特征變量(表1)。

      2.2 特征工程

      本文實(shí)驗(yàn)中使用的房屋信息數(shù)據(jù)通過(guò)Python爬取某房產(chǎn)網(wǎng)的數(shù)據(jù)獲得,因此數(shù)據(jù)集存在數(shù)據(jù)項(xiàng)缺失或者異常情況。這些數(shù)據(jù)對(duì)后期的建模過(guò)程有一定的影響,進(jìn)而造成模型效果不理想。為了解決這一問(wèn)題,需要先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,處理缺失值,進(jìn)行離散化和歸一化。為了使數(shù)據(jù)格式統(tǒng)一,利用特征工程將數(shù)據(jù)處理為易于訓(xùn)練的數(shù)據(jù),針對(duì)各項(xiàng)特征變量采用了不同的方式進(jìn)行量化。特征變量包含建筑面積、房間數(shù)、所在樓層、房齡、朝向、裝修、電梯、價(jià)格、公交線路條數(shù)、附近公園、附近學(xué)校、附近醫(yī)院共計(jì)12個(gè)指標(biāo),各項(xiàng)指標(biāo)的具體量化方式如表2所示。例如,中間樓層因兼顧采光及樓梯層高而被視為最優(yōu)樓層;低樓層因樓層較低而被視為較差樓層;高樓層雖然采光好,但是因樓層高而被視為一般樓層[12]。價(jià)格采用的是某房產(chǎn)網(wǎng)的掛牌房?jī)r(jià),雖然并不是真正的交易價(jià)格,但是由于掛牌價(jià)和交易價(jià)格是線性相關(guān)的,所以不會(huì)影響評(píng)估模型的效果[13]。

      2.3 貝葉斯優(yōu)化調(diào)參

      在模型訓(xùn)練之前,設(shè)置超參數(shù)至關(guān)重要。為了提升XGBoost模型的性能,本文根據(jù)貝葉斯優(yōu)化思想和流程對(duì)其參數(shù)進(jìn)行調(diào)整。此外,引入動(dòng)態(tài)學(xué)習(xí)率可在訓(xùn)練過(guò)程中根據(jù)模型的性能自適應(yīng)地調(diào)整學(xué)習(xí)率,這有助于模型加速收斂并提高魯棒性。本文使用XGBoost的內(nèi)置參數(shù)learning_rates 實(shí)現(xiàn)動(dòng)態(tài)學(xué)習(xí)率的設(shè)置。設(shè)置隨機(jī)種子實(shí)現(xiàn)對(duì)模型的復(fù)現(xiàn),確保每次的訓(xùn)練結(jié)果可預(yù)測(cè),這有助于在不同運(yùn)行中獲得相似結(jié)果,具體通過(guò)XGBoost中的seed 參數(shù)實(shí)現(xiàn)。經(jīng)過(guò)這組操作,可得到一組優(yōu)化后的參數(shù),XGBoost的超參數(shù)優(yōu)化搜索空間如表3所示。

      2.4 構(gòu)建模型

      在本研究中,對(duì)XGBoost回歸模型的優(yōu)化是在已有研究的基礎(chǔ)上開(kāi)展的。首先篩選出對(duì)XGBoost模型準(zhǔn)確率和性能影響顯著的關(guān)鍵參數(shù)。這一過(guò)程旨在從眾多參數(shù)中識(shí)別出對(duì)模型性能影響最為關(guān)鍵的參數(shù),為后續(xù)優(yōu)化提供方向。其次利用貝葉斯優(yōu)化算法找到最優(yōu)的超參數(shù)組合,以提升模型性能。最后構(gòu)建XGBoost房產(chǎn)估價(jià)模型,其流程如圖2所示,其具體步驟如下。

      (1)收集研究相關(guān)數(shù)據(jù),了解數(shù)據(jù)特征和結(jié)構(gòu)。

      (2)清理數(shù)據(jù),處理缺失值、異常值,進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化或歸一化處理,確保數(shù)據(jù)質(zhì)量。

      (3)選擇研究相關(guān)特征,進(jìn)行特征工程,提取新的特征以提升模型的性能。

      (4)劃分訓(xùn)練集和測(cè)試集,其中80%作為訓(xùn)練集,20%作為測(cè)試集,確保模型在未見(jiàn)過(guò)的數(shù)據(jù)上進(jìn)行驗(yàn)證。

      (5)構(gòu)建XGBoost模型,用訓(xùn)練集訓(xùn)練XGBoost模型。

      (6)使用測(cè)試集評(píng)估模型性能,設(shè)置評(píng)價(jià)指標(biāo),與其他模型進(jìn)行對(duì)比。

      3 實(shí)驗(yàn)設(shè)計(jì)及結(jié)果分析(Experimental designand result analysis)

      3.1 實(shí)驗(yàn)環(huán)境與數(shù)據(jù)

      本研究數(shù)據(jù)來(lái)源于某房產(chǎn)網(wǎng)的某市存量房部分歷史成交數(shù)據(jù),交易時(shí)間跨度為2023年5月1日至2023年12月5日。

      本實(shí)驗(yàn)在一臺(tái)“聯(lián)想”筆記本電腦展開(kāi),系統(tǒng)為64位Windows 10操作系統(tǒng)。采用Python3編程語(yǔ)言,Python版本為3.7.6,軟件平臺(tái)為Pycharm。在機(jī)器學(xué)習(xí)模型方面使用XGBoost庫(kù)、LightGBM庫(kù)、sklearn.ensemble庫(kù)的函數(shù)分別構(gòu)建不同的機(jī)器學(xué)習(xí)評(píng)估模型。

      3.3 實(shí)驗(yàn)結(jié)果

      本研究中采用XGBoost庫(kù)中的XGBRegressor函數(shù)、LightGBM庫(kù)中的LGBMRegressor函數(shù),以及sklearn.ensemble庫(kù)的RandomForestRegressor函數(shù),分別構(gòu)建了XGBoost、LightGBM和隨機(jī)森林回歸模型。以影響房屋價(jià)格波動(dòng)的多個(gè)特征變量為自變量,房屋價(jià)格為因變量,建立3種房產(chǎn)估價(jià)模型。完成模型構(gòu)建后,使用模型對(duì)測(cè)試集的房屋樣本進(jìn)行價(jià)格評(píng)估預(yù)測(cè),并輸出模型評(píng)價(jià)指標(biāo)數(shù)值。評(píng)估效果如表4和圖3所示。從這些評(píng)估結(jié)果中可以看出,XGBoost模型在三者中的表現(xiàn)較為出色。因此,經(jīng)過(guò)優(yōu)化后的XGBoost模型性能得到了顯著提升。

      4 結(jié)論(Conclusion)

      對(duì)于存量房房產(chǎn)估價(jià)問(wèn)題,本文基于房屋的建筑、區(qū)位、鄰里等因素,并采用XGBoost、LightGBM 和隨機(jī)森林回歸等模型展開(kāi)研究。本研究旨在探討機(jī)器學(xué)習(xí)算法在房地產(chǎn)批量評(píng)估中的應(yīng)用潛力,以期實(shí)現(xiàn)估價(jià)準(zhǔn)確性和效率的提升。這些算法在處理復(fù)雜數(shù)據(jù)集和非線性關(guān)系方面展現(xiàn)出顯著優(yōu)勢(shì)。為了進(jìn)一步提高房產(chǎn)估價(jià)的效果,本研究引入了貝葉斯優(yōu)化方法,通過(guò)調(diào)整XGBoost模型的超參數(shù),提升了模型性能。此外,采用動(dòng)態(tài)學(xué)習(xí)率策略,以適應(yīng)不同情境下的數(shù)據(jù)特征,提高了模型的泛化能力和魯棒性。通過(guò)對(duì)XGBoost模型的優(yōu)化,使模型的估價(jià)效果得到顯著提升,其中MAE 指數(shù)提高了0.4百分點(diǎn),MAPE指數(shù)提高了1百分點(diǎn),RMSE指數(shù)提高了0.6百分點(diǎn),有效地提高了房產(chǎn)估價(jià)的準(zhǔn)確率,為存量房估價(jià)問(wèn)題提供了更為精準(zhǔn)和高效的解決方案。

      作者簡(jiǎn)介:

      柳越(1999-),女,碩士生。研究領(lǐng)域:智能信息處理。

      劉從軍(1974-),男,碩士,高級(jí)實(shí)驗(yàn)師。研究領(lǐng)域:智能信息處理。

      猜你喜歡
      存量房
      自動(dòng)核驗(yàn)交易主體之路徑與問(wèn)題思考
      淺談存量房交易監(jiān)管資金財(cái)務(wù)管理
      上海存量住房市場(chǎng)發(fā)展的相關(guān)分析與思考
      上海房地(2019年9期)2019-10-22 02:48:22
      加強(qiáng)存量房交易稅收征管的對(duì)策
      關(guān)于存量房網(wǎng)上備案系統(tǒng)建設(shè)的建議
      存量房轉(zhuǎn)租賃房的方式與激勵(lì)措施研究
      存量房網(wǎng)上合同備案系統(tǒng)的研究
      論存量房買(mǎi)賣(mài)網(wǎng)上備案制度
      “存量房”時(shí)代來(lái)臨,房產(chǎn)中介將取代開(kāi)發(fā)商成為市場(chǎng)主角霸主鏈家
      存量房資金監(jiān)管系統(tǒng)的分析與設(shè)計(jì)
      云和县| 雅江县| 郯城县| 郑州市| 得荣县| 莱州市| 秭归县| 平利县| 陆丰市| 阿克苏市| 新宁县| 肥东县| 积石山| 略阳县| 浦县| 新巴尔虎右旗| 赫章县| 湘潭市| 阳山县| 厦门市| 杨浦区| 宜州市| 鹤峰县| 双鸭山市| 六枝特区| 孙吴县| 巢湖市| 兴和县| 晋中市| 灵台县| 行唐县| 栾城县| 永丰县| 巴南区| 临朐县| 嘉禾县| 罗甸县| 宜章县| 璧山县| 日喀则市| 岳池县|