楊月 盧伊
摘要:大數(shù)據(jù)時代的到來使得對數(shù)據(jù)的迅速捕捉和實時分析顯得至關(guān)重要。相比傳統(tǒng)商業(yè)智能軟件,新型商業(yè)智能軟件使用的輕量建模形式能夠迅速響應(yīng)需求變動。Tableau正是這樣一款定位于數(shù)據(jù)可視化敏捷分析和完成商務(wù)智能的展示工具。利用Tableau進行初步可視化分析及高級可視化分析,極大地提高數(shù)據(jù)分析與操作的效率。此次研究以沿海城市三亞市為研究對象,從使用角度介紹Tableau數(shù)據(jù)分析軟件在房價分析中的使用技巧,并將數(shù)據(jù)以可視化形式展現(xiàn)出來,分析結(jié)果發(fā)現(xiàn)臨海距離是影響三亞市房產(chǎn)價格的主要因素之一,而交通狀況及住宅面積對于房價的影響并不是最為主要的,對研究影響三亞市房價乃至沿海城市的房價的主要驅(qū)動因素有著至關(guān)重要的作用。
關(guān)鍵詞:大數(shù)據(jù);商務(wù)智能;Tableau;數(shù)據(jù)可視化;旅游
中圖分類號:F293 文獻標(biāo)識碼:A
文章編號:1005-913X(2019)05-0053-03
Analysis of housing price main driving factors in coastal cities
——Take Sanya City as an example
Yang Yue1, LuYi2
(university of sanya, SanYa 572000;2. Taizhou Sunshine Property Insurance Co. Ltd, TaiZhou 318000)
Abstract: The arrival of the era of big data has made the rapid capture of data and real-time analysis essential. Compared with the drawbacks of traditional business intelligence software, the lightweight modeling used by new business intelligence software can quickly respond to changes in demand. Tableau is exactly such a display tool that is aimed at data visualization, agile analysis and completion of business intelligence. Use Tableau for preliminary visual analysis and advanced visual analysis to greatly improve the efficiency of data analysis and operation. This study takes the coastal city of Sanya as the research object, introduces the use of Tableau data analysis software in the analysis of house prices from the perspective of use, and presents the data in a visual form. The analysis found that the coastal distance is the price of real estate in Sanya. One of the main factors, and the impact of traffic conditions and housing area on housing prices is not the most important, and it is of crucial importance to study the main driving factors affecting housing prices in Sanya City and even coastal cities.
Key words: Big data; Business intelligence; Tableau; Bata visualization; Tourism.
隨著數(shù)字化技術(shù)的普遍使用和信息化程度的不斷提高,人類正在逐漸跨入大數(shù)據(jù)時代。當(dāng)然,發(fā)達國家充分意識到這一發(fā)展趨向,紛紛將大數(shù)據(jù)上升為國家的重要策略。[1]2015年8月中國國務(wù)院通過了《關(guān)于促進大數(shù)據(jù)發(fā)展的行動綱要》,推動了大數(shù)據(jù)的進一步發(fā)展。在企業(yè)中,數(shù)據(jù)已成為一種新的重要策略資產(chǎn),更多的企業(yè)選擇了強化數(shù)據(jù)資產(chǎn)管理,并且開設(shè)專門的組織或確定相干的責(zé)任部門,大力開展數(shù)據(jù)分析與運用。數(shù)據(jù)分析順應(yīng)時代發(fā)展的潮流,作用越來越大。[2]一方面,海量的數(shù)據(jù)中藏匿了諸多有價值的信息,通過有用的數(shù)據(jù)分析與發(fā)掘,提出適合的業(yè)務(wù)建議,能夠有效地提高企業(yè)競爭力;但從另一方面來看,這樣卻增加了數(shù)據(jù)監(jiān)測、分析任務(wù)的難度。傳統(tǒng)的數(shù)據(jù)分析理念、數(shù)據(jù)分析工具愈加難以順應(yīng)新的發(fā)展情勢。對此,急需提出新的手段和措施,于是高效率的數(shù)據(jù)分析方法與工具順運而生。Tableau作為一款定位在數(shù)據(jù)可視化敏捷開發(fā)和完成商業(yè)智能展示的工具,能夠用來實現(xiàn)交互式的、可視覺化的數(shù)據(jù)分析和儀表板使用,進而協(xié)助企業(yè)迅速地了解和知道數(shù)據(jù),以此面對不斷變化的市場環(huán)境與挑戰(zhàn)。[3]
一、Tableau的主要特性
一是極速高效。在Tableau的高性能數(shù)據(jù)引擎中導(dǎo)入數(shù)據(jù),它便會以極快的速度開始工作。結(jié)束時,只要一下單擊便可以完成,過程無需編程。Tableau 的內(nèi)置裝置能在操作的瞬間將數(shù)百萬行的數(shù)據(jù)轉(zhuǎn)變?yōu)榇鸢?。?dāng)然也能夠直接點擊 Tableau左上角的菜單鍵選擇連接到快速數(shù)據(jù)庫、多維數(shù)據(jù)集,分析實時數(shù)據(jù)。用戶可以依據(jù)自身需要在這兩選項間切換。[4]二是簡單易用。Tableau 是一個直接式的拖拽式工具,用戶能夠直觀的看到其操作帶給整體視圖的每一個變化,數(shù)據(jù)隨使用者的思路變化而變化演變的過程,得到極速的顯示。[5]三是便捷的數(shù)據(jù)源聯(lián)接功能。Tableau的數(shù)據(jù)源聯(lián)接功能最重要的在于隨時隨地,無需準備只要聯(lián)接任何一種數(shù)據(jù)源就能夠開始分析數(shù)據(jù)。它可以直接與任何文件、電子表格、數(shù)據(jù)體、數(shù)據(jù)庫以及數(shù)據(jù)倉庫相聯(lián)接。其動態(tài)連接方式讓用戶能夠?qū)γ糠昼姷臄?shù)據(jù)都十分清楚。四是完美的數(shù)據(jù)整合功能。強大的數(shù)據(jù)處理功能,專注結(jié)構(gòu)化數(shù)據(jù)(如Excel、數(shù)據(jù)庫)處理,數(shù)據(jù)引擎速度極快,在幾秒鐘內(nèi)可完成上億行數(shù)據(jù)處理,經(jīng)過智能化可視化模式的選擇,把干枯無味的數(shù)據(jù)用簡單、親和、美觀的圖表模式展示。[6]Tableau懂得辨認數(shù)據(jù)字段且會為字段歸類,自動創(chuàng)建劃分的維度和度量,在確定了維度和度量之后,在Tableau中就可以通過鼠標(biāo)拖拉拽的方式實現(xiàn)自主式分析。同時,它能夠把兩個數(shù)據(jù)源整合到同層,并且可以在一個數(shù)據(jù)源篩選出另一個數(shù)據(jù)源,并讓篩選出的數(shù)據(jù)在數(shù)據(jù)源里突出顯示,這種超強的數(shù)據(jù)整合能力實用性很大。五是優(yōu)秀的數(shù)據(jù)分析實踐工具。在斯坦福大學(xué)中問世,結(jié)合了諸多博士的智慧而最終實現(xiàn)的 Tableau,在成為優(yōu)秀的數(shù)據(jù)分析工具這條路上走上正軌。從活潑的顏填充模式,再到有豐富有內(nèi)涵的經(jīng)典模式,Tableau必定可以幫助使用者找到最適合的影響因素的數(shù)據(jù)描述方式。[7]
二、三亞市房價的成交情況
作為一款主打簡便智能操作的商業(yè)軟件,通過簡單的拖放數(shù)據(jù)字段信息即可形成可視化圖形。此外,Tableau除了沒有復(fù)雜的代碼編輯,儀表盤(控制臺)也可完全自定義配置。在儀表板上,不但可以監(jiān)測信息,而且還提供完整的分析能力。筆者通過收集整理鏈家網(wǎng)上的三亞市新房數(shù)據(jù),整理出三亞市房價統(tǒng)計數(shù)據(jù),利用輕量級的BI 軟件Tableau作為分析工具,對三亞市房價數(shù)據(jù)展開多維度分析,通過多種形式的圖表,呈現(xiàn)出房價與地段、空間等方面的關(guān)系。
(一)文字云分析
文字云作為一種優(yōu)秀的圖形展現(xiàn)方式,這種圖形可以看到三亞市所有出售的樓盤。通過連接到數(shù)據(jù)源三亞市房價統(tǒng)計數(shù)據(jù)后,做如下操作:將字段“樓盤”拖至【文本】標(biāo)記,將字段“成交平均價”設(shè)置度量“平均值”,并將該字段拖至【大小】標(biāo)記,將字段“區(qū)域”拖至【顏色】標(biāo)記。然后從【智能顯示】菜單鍵中挑選并單擊“填充氣泡圖”。從【標(biāo)記】菜單鍵下拉選項中選擇“文本”,此時結(jié)果如下圖1所示。
圖1中說明,字體越大,說明房屋成交額越高,當(dāng)鼠標(biāo)滑過任意字段,該字段中將出現(xiàn)該樓盤的詳細信息。
(二)條形圖分析
若要看三亞市2018年3月份各區(qū)域間樓盤成交價之間的對比情況。其操作如下:雙擊字段“區(qū)域”、“樓盤”自動顯示在列功能區(qū)。雙擊字段“成交平均價:萬元”自動顯示在行功能區(qū)。接著將字段“成交平均價:萬元”拖拽到【標(biāo)記】里附屬的【顏色】一欄,圖表就能夠依據(jù)數(shù)值的大小而變化顏色的深淺,十分直觀(柱形圖的高度代表著住房的總額)。在界面左上角處找到【分析】選項,為圖表添加每一個區(qū)的平均值線。得到如下圖2所示。
從圖2可以看出三亞市海棠區(qū)樓盤的平均成交額最高,為2674萬元。其中住房成交額最高的樓盤是吉陽區(qū)的亞龍灣壹號樓盤。就目前來看,房源最多的地區(qū)集中在三亞吉陽鎮(zhèn)。崖州地區(qū)的開售的樓盤數(shù)量最少。
三、主要驅(qū)動因素分析
本小節(jié)使用Tableau嘗試分析三亞市房價的某些重要的驅(qū)動因素。這里考慮的因素主要有:交通狀況(高鐵)、臨海距離、住宅面積等。
在因素分析中,首先考慮的是高鐵距離。操作如下:一是導(dǎo)入數(shù)據(jù)源,將字段中“城市”(三亞)的地理角色設(shè)置為“城市”,雙擊字段“城市”,此時Tableau會自動界定區(qū)域。為了能夠精確的知道每個樓盤所在的地理位置,以不同的顏色代表指定的位置,可以在地圖中導(dǎo)入各樓盤的經(jīng)緯度。選擇菜單【地圖】中的【編輯位置】操作,依次導(dǎo)入經(jīng)緯度。這里的經(jīng)緯度數(shù)據(jù)是從源數(shù)據(jù)中導(dǎo)入的,由于此次涉及的數(shù)據(jù)量較少,經(jīng)緯度的數(shù)據(jù)是在百度地圖中搜素位置查詢經(jīng)緯的。
這樣每個樓盤的具體位置得到精確,再次點擊字段“樓盤”,地圖中將出現(xiàn)多個藍色的點,每個點表示一套樓盤。當(dāng)鼠標(biāo)劃過各點,將出現(xiàn)相應(yīng)的樓盤名稱。二是將字段“樓盤”拖至【標(biāo)記】中的【標(biāo)簽】、【顏色】。字段“區(qū)域”拖至【標(biāo)記】中的【詳細信息】?!緲?biāo)記】的填充類型選擇“地圖”。菜單欄中選擇【地圖】——【地圖層】,勾選“街道和高速公路”“海岸線”及“地名”等選項。為了使地圖更加美觀,選擇背景顏色“黑色”。三是將字段“平均成交價:萬元”拖至標(biāo)記中的“大小”。然后將字段“高鐵距離”拖至標(biāo)記中的“顏色”,設(shè)置顏色“紅色—藍色發(fā)散”。這樣操作的目的是:設(shè)置“高鐵距離”為因子,住房的“成交額”為因變量。在地圖中,據(jù)高鐵距離影響圓圈的顏色,與高鐵距離越近的樓盤,其位置上的圓圈的顏色就越紅;與高鐵距離越遠的樓盤,其位置上的點就越藍。住房的成交額影響圓圈的大小,該房屋的價格越高,圓圈就越大。操作結(jié)果如下圖4所示。
從圖4中觀察到,無論是離高鐵距離近還是遠,住房的成交額都沒有呈現(xiàn)出明顯的趨勢變化。這就在一定程度上說明了據(jù)高鐵的距離并不是驅(qū)動高房價的主要因素。
其次,考慮的是住宅建筑面積,設(shè)置“住宅建筑面積”為因子,住房的“成交額”為因變量。步驟和上述高鐵距離因素分析類似,結(jié)果得到如下圖5所示。
從圖5中觀察到圓圈的面積大小差異不大,在一定角度上說明了房屋面積并不是房價高的主要因素。
然后考慮的是臨海距離。三亞市畢竟是以旅游業(yè)為重心發(fā)展的城市,三亞市的樓盤也大多為旅游地產(chǎn)。所以考慮到這一因素。為了驗證此猜想,設(shè)置“臨海距離”為因子,住房的“成交額”為因變量。結(jié)果得到如下圖6所示。
從圖6中可以清楚的發(fā)現(xiàn),圓點較大的大多都靠近海岸線一帶,離海越近的圓圈紅色顏色越深。到此可以由數(shù)據(jù)歸納出一個可能的結(jié)論:三亞市是以旅游業(yè)為發(fā)展的城市,其充分利用海景等資源推動三亞市旅游地產(chǎn)的發(fā)展。特別海棠灣、亞龍灣等地區(qū),離海距離近,風(fēng)景宜人,成為了該地區(qū)在三亞市內(nèi)房價較高的一個驅(qū)動因素。
通過利用Tableau數(shù)據(jù)分析軟件對三亞市樓盤地理位置、成交額和對樓盤附近交通狀況、臨海距離的比較及樓盤室內(nèi)空間大小、樓盤類型的分析,數(shù)據(jù)顯示,三亞市內(nèi)房源在吉陽鎮(zhèn)最為密集,天涯鎮(zhèn)房源最少。另外,通過觀察圖表可以得到這樣一個結(jié)論:三亞市作為一個旅游勝地,高房價的影響因素極大程度與樓盤所處的臨海距離有關(guān),而交通狀況及住宅面積對于房價的影響并不是最為主要的。從三亞也可以輻射出其他沿海城市房價的主要影響因素,對研究一些沿海城市的房價影響因素有著重要的意義。
參考文獻:
[1] 戴國忠,陳 為.信息可視化和可視分析: 挑戰(zhàn)與機遇——北戴河信息可視化戰(zhàn)略研討會總結(jié)報告[A].中國科學(xué):信息科學(xué),2013(1).
[2] 高 屹.信息可視化技術(shù)研究分析[J].科技創(chuàng)新與應(yīng)用,2016(1).
[3] 飛 揚.2015年度中國大數(shù)據(jù)綜合服務(wù)提供商Top100[J].互聯(lián)網(wǎng)周刊,2016(2).
[4] 張 志.Tableau在華設(shè)立分公司幫助客戶掌握數(shù)據(jù)的力量[J].技術(shù)前沿,2015(9).
[5] 王 眾.帶著蘋果基因的BI工具[J].IT經(jīng)理世界,2016(3).
[6] 馬正杰.商業(yè)智能軟件對比評測:FineBI和Tableau[J].中國IT研究中心,2016(4).
[7] 余國勇.Tableau9.3為數(shù)據(jù)分析、分享和協(xié)作提速[J].信息通信技術(shù),2016(4).
[責(zé)任編輯:譚志遠]