• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于網(wǎng)絡(luò)爬蟲和大數(shù)據(jù)分析的智能租房推薦研究

      2021-11-15 08:42:02汪洋
      科技信息·學(xué)術(shù)版 2021年24期
      關(guān)鍵詞:網(wǎng)絡(luò)爬蟲數(shù)據(jù)分析

      摘要:房地產(chǎn)中介第三方租房網(wǎng)站平臺存在租金價格制定不精準(zhǔn),租房者作為消費者也存在尋找合適房源困難等問題。通過采用網(wǎng)絡(luò)爬蟲和大數(shù)據(jù)分析等技術(shù)構(gòu)建智能租房推薦模型,可以解決第三方租房網(wǎng)站平臺和需要租房的消費者雙方共同的痛點,促使兩者最終達成滿意交易。本文以解決案例的形式印證了智能租房推薦模型的有效性,可以幫助租客推薦到合適房源,并為租客做出最終決策提供支持。

      關(guān)鍵詞:網(wǎng)絡(luò)爬蟲;數(shù)據(jù)分析;智能租房;推薦模型

      1 引言

      1.1 國內(nèi)住房租賃現(xiàn)狀

      近幾年,國內(nèi)住房租賃市場進入全新的發(fā)展階段,房屋租賃越來越受到廣泛的關(guān)注。站在第三方租賃網(wǎng)站平臺角度,如何合理制定房源租賃價格是促成交易的關(guān)鍵。站在租房者的角度,租客在選擇租房時考慮的第一因素便是租金,其次才是出租房屋的規(guī)模、面積、以及租賃的方式等。租房者希望在租房網(wǎng)站平臺找到符合自己心理預(yù)期的理想房源。如果消費者發(fā)現(xiàn)租房網(wǎng)站平臺上的心儀的房源租金價格沒有在自己的心理預(yù)期內(nèi),很可能會放棄在該租房網(wǎng)站平臺上達成交易意向,同時也浪費了時間和精力。

      1.2 貝殼找房網(wǎng)站

      貝殼找房是鏈家旗下的房源推廣平臺,于2020年8月在美上市,是目前中國最大的房屋交易和服務(wù)平臺。2020年貝殼找房全年總營收705億元,同比增長53.2%,全年凈利潤為27.78億元。本文以貝殼找房網(wǎng)站為例,具備標(biāo)桿意義和較高的應(yīng)用推廣價值。

      1.3 網(wǎng)絡(luò)爬蟲技術(shù)

      網(wǎng)絡(luò)爬蟲是一種按照一定的規(guī)則,自動地抓取萬維網(wǎng)信息的程序或者腳本。通過網(wǎng)絡(luò)爬蟲獲取網(wǎng)站數(shù)據(jù)主要有兩種方式——編寫網(wǎng)絡(luò)爬蟲程序和使用第三方數(shù)據(jù)采集器。目前比較適合編寫爬蟲程序的編程語言有Python、Java等,市面上流行的第三方數(shù)據(jù)采集器有八爪魚、后羿采集器等。但在實際應(yīng)用中,完成一個較復(fù)雜的網(wǎng)絡(luò)爬蟲項目經(jīng)常需要兩種方式結(jié)合起來使用。

      2 智能租房推薦模型

      2.1 模型思路

      首先通過網(wǎng)絡(luò)爬蟲獲取貝殼找房網(wǎng)站上的房源信息數(shù)據(jù),然后借助大數(shù)據(jù)處理和分析技術(shù)對房源信息數(shù)據(jù)進行處理和分析,建立預(yù)測模型和智能推薦模型。該模型可以為貝殼找房網(wǎng)站平臺和租客個人雙方的決策提供支持與建議,最大限度的幫助雙方達成滿意交易,從而實現(xiàn)雙方共贏的局面。如圖1所示。

      2.2 租客決策支持

      構(gòu)建的智能租房推薦模型可以為租房者提供強有力的決策支持,從而大大簡化了租房者選擇成本和試錯成本。比如今年剛畢業(yè)的軟件技術(shù)專業(yè)的小李同學(xué)在四川成都找了一份科技公司上班的工作。但小李不是成都本地人,屬于無房一族。所以需要為小李同學(xué)推薦一套滿意房源,并給出租房建議和推薦理由。

      結(jié)合小李同學(xué)實際情況,我們構(gòu)建智能租房推薦模型樂園通過對相關(guān)數(shù)據(jù)進行處理和分析。根據(jù)各類房源的環(huán)境舒適度和租金等分析結(jié)果可以得出鮮明清晰的可視化結(jié)果,最終并給小李同學(xué)最優(yōu)的租房建議。

      3 數(shù)據(jù)采集與分析

      3.1 目標(biāo)選取

      我們選取了貝殼找房網(wǎng)站作為我們大數(shù)據(jù)采集的目標(biāo)網(wǎng)址,從中選取了四川省成都市的租房信息作為采集對象。以網(wǎng)站平臺上出租房屋的租房方式、商圈、戶型、租金等作為采集指標(biāo)進行分析。

      3.2 采集步驟

      采集步驟包括(1)分析需要爬取內(nèi)容的網(wǎng)頁的鏈接規(guī)律;(2)偽裝瀏覽器,成功訪問我們需要爬取的頁面;(3)導(dǎo)入requests包,使用get()方法,動態(tài)傳入網(wǎng)頁鏈接;(4)使用xpath,獲取到HTML文檔中的相關(guān)租房指標(biāo)信息,如租房類型、租金、商圈等;(5)將爬取到的所有數(shù)據(jù)保存為CSV格式。

      3.3 數(shù)據(jù)處理

      通過編寫爬蟲算法,獲取到了成都市區(qū)的全部房源:租金、商圈、戶型面積、租房方式等。由于爬取到的信息不規(guī)則,得到的數(shù)據(jù)包含大量垃圾數(shù)據(jù),無意義臟數(shù)據(jù)。通過數(shù)據(jù)清洗、歸一處理、結(jié)構(gòu)化存儲最終得到有效租房信息共8000條。

      4 結(jié)果分析

      4.1 租房方式分析

      通過對所有爬取到的租房方式和租金數(shù)據(jù)信息進行統(tǒng)計計算分析,可以發(fā)現(xiàn)選擇整租比例高達71.07%,平均租金在3400元左右。而選擇合租的比例為28.93%,平均租金只有800元左右。依據(jù)小李的實際情況,作為剛畢業(yè)的學(xué)生來說整租的租金可能會很吃力,所以推薦小李選擇合租方式,平均租金在802元左右,符合小李工資承受范圍。

      4.2 商圈房源分析

      通過對所有爬取到的房源數(shù)量數(shù)據(jù)信息進行統(tǒng)計分析結(jié)果??梢杂嬎愠龀啥际懈鱾€區(qū)的房源所占的比例如表1所示。從表中可以看出,租房房源最多的市區(qū)是高新區(qū),占比達到了19.99%。

      我們結(jié)合房源數(shù)量、商圈情況、租金價格等多個角度從10個區(qū)中選取了高新區(qū)和錦江區(qū)作為小李租房的推薦市區(qū)。成都高新區(qū)是國家級高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)、國家高新技術(shù)產(chǎn)業(yè)標(biāo)準(zhǔn)化示范區(qū),能為小李這類專業(yè)畢業(yè)生日后提供更多的就業(yè)機會和發(fā)展渠道。錦江區(qū)是近代中國西部“洋務(wù)”和“興商”的發(fā)祥地,且具有春熙路等經(jīng)濟快速發(fā)展的商業(yè)地,較為繁榮,比較適合小李這樣的年輕人居住。

      4.3 環(huán)境分析

      房源多、周邊設(shè)施配套完善、環(huán)境優(yōu)越對于租客來說居住生活幸福指數(shù)高。所以我們結(jié)合各房源周邊環(huán)境影響因素在高新區(qū)中選擇了中和街道的房源,在錦江區(qū)選擇沙河堡社區(qū)的房源進行重點分析和推薦。

      4.4 租金分析

      以戶型和面積方面作為分析基礎(chǔ),我們把所爬取到的房源信息中70平方米以下的歸為小戶型類,70平方米到100平方米歸為中戶型,100平方米以上歸為大戶型。我們分析出了錦江區(qū)沙河堡和高新區(qū)中和房源的大戶型、中戶型、小戶型的分別平均租金。其中在高新區(qū),當(dāng)租房方式為合租時,戶型類型為大戶型的平均租金為800.3元,小戶型平均租金為757.5元,中戶型平均租金為740.5元。在高新區(qū),當(dāng)租房方式為合租時,大戶型平均租金為1093.3元,小戶型平均租金為907.7元,中戶型平均租金為830.5元。

      4.5 綜合推薦

      根據(jù)4.1-4.4的綜合分析,我們最終完成從8000條房源信息中預(yù)選出兩套適合小李的房源。這兩套房源具體對比信息如表2所示。

      結(jié)合小李的實際情況與經(jīng)濟條件來看,合租房屋租金對于小李經(jīng)濟情況而言壓力較小,所以推薦合租。高新區(qū)對于軟件專業(yè)的小李來說職業(yè)發(fā)展前景更好。大于100平米的出租房對于小李空間冗余量較大,而70平米到100平米的中戶型租房房源對于小李來說已經(jīng)有足夠的空余空間。表2中中和接到和沙河堡的兩套房源租金、面積等指標(biāo)比較接近,再結(jié)合小李所處行業(yè)和未來職業(yè)發(fā)展前景,我們選擇推薦小李采取合租方式租住高新區(qū)中和軍安衛(wèi)士花園這套房源。

      5 結(jié)論

      本文選取貝殼找房網(wǎng)站平臺和為畢業(yè)生小李尋找合適房源為案例。通過使用網(wǎng)絡(luò)爬蟲、數(shù)據(jù)預(yù)處理、數(shù)據(jù)分析等技術(shù)手段,構(gòu)建了完整的智能租房推薦模型。綜合考慮了租金、租房方式、商圈、環(huán)境等重要因素,最終幫助小李推薦到合適房源。實現(xiàn)了獲取數(shù)據(jù)、數(shù)據(jù)分析結(jié)果、得出租房推薦、幫助消費者做出決策的智能應(yīng)用過程。

      參考文獻

      [1]崔凱,劉德寰,燕熙迪.時間累積、用戶行為與匿名社區(qū)資本——基于豆瓣網(wǎng)網(wǎng)絡(luò)爬蟲數(shù)據(jù)的分析[J].青年研究,2017(1):28-36.

      [2]張麗.基于大數(shù)據(jù)的公租房供求匹配研究[D].西安建筑科技大學(xué).

      [3]項博良,唐淳淳,錢前,等.基于網(wǎng)絡(luò)爬蟲的就業(yè)數(shù)據(jù)分析[J].智能計算機與應(yīng)用,2020,000(001):P.223-226,230.

      [4]QiZhang,HongfeiZhan,JunheYu.Car Sales Analysis Based on the Application of Big Data - ScienceDirect[J].Procedia Computer Science,2017,107:436-441.

      基金項目:本文受瀘州職業(yè)技術(shù)學(xué)院2021年上半年校級科研項目“基于網(wǎng)絡(luò)爬蟲和大數(shù)據(jù)分析的智能租房推薦研究——以貝殼找房網(wǎng)站為例”資助,項目編號:K-2137。

      作者簡介:汪洋(1991-),男,河南信陽人,碩士,講師。主要研究方向:大數(shù)據(jù)技術(shù)、自然語言處理。

      猜你喜歡
      網(wǎng)絡(luò)爬蟲數(shù)據(jù)分析
      煉鐵廠鐵量網(wǎng)頁數(shù)據(jù)獲取系統(tǒng)的設(shè)計與實現(xiàn)
      我校如何利用體育大課間活動解決男生引體向上這個薄弱環(huán)節(jié)
      體育時空(2016年8期)2016-10-25 18:02:39
      Excel電子表格在財務(wù)日常工作中的應(yīng)用
      淺析大數(shù)據(jù)時代背景下的市場營銷策略
      新常態(tài)下集團公司內(nèi)部審計工作研究
      中國市場(2016年36期)2016-10-19 04:31:23
      淺析大數(shù)據(jù)時代對企業(yè)營銷模式的影響
      基于讀者到館行為數(shù)據(jù)分析的高校圖書館服務(wù)優(yōu)化建議
      科技視界(2016年22期)2016-10-18 14:37:36
      基于社會網(wǎng)絡(luò)分析的權(quán)威網(wǎng)頁挖掘研究
      主題搜索引擎中網(wǎng)絡(luò)爬蟲的實現(xiàn)研究
      淺析如何應(yīng)對網(wǎng)絡(luò)爬蟲流量
      中國市場(2016年23期)2016-07-05 04:35:08
      河间市| 黑水县| 金湖县| 宁化县| 富宁县| 若尔盖县| 道真| 秭归县| 广平县| 磴口县| 体育| 漯河市| 瑞昌市| 本溪| 禄丰县| 乌苏市| 沙田区| 安西县| 乌审旗| 静安区| 太湖县| 开化县| 浦东新区| 武安市| 永善县| 商水县| 呼伦贝尔市| 昌邑市| 乡宁县| 弥勒县| 孝义市| 铜鼓县| 珠海市| 鄂托克旗| 宜城市| 深州市| 万宁市| 东港市| 屯昌县| 会泽县| 无极县|