王鈳茗
【摘要】主成分分析是研究住宅屬性與價(jià)格關(guān)系的有效手段。本文將主成分分析模型用于杭州市二手房市場(chǎng)研究,分析2930個(gè)杭州市二手房的詳細(xì)情況,進(jìn)行多重回歸分析,并用SPSS軟件模擬特征價(jià)格模型。
【關(guān)鍵詞】住宅屬性 二手房
一、引言
特征價(jià)格法是目前國(guó)際上研究影響住宅價(jià)格微觀決定因素的最主流方法。自1974年Rosen提出完整的技術(shù)框架后,經(jīng)歷30余年的發(fā)展,業(yè)己十分成熟,在我國(guó)及很多發(fā)達(dá)國(guó)家的政府部門(mén)和產(chǎn)業(yè)界得到越來(lái)越廣泛的應(yīng)用。
二、研究區(qū)概況
杭州市房地產(chǎn)市場(chǎng)是我國(guó)最為發(fā)達(dá)的房地產(chǎn)市場(chǎng)之一,自2016年G20之后,杭州市的國(guó)際知名度大增,二手房交易流動(dòng)速度遠(yuǎn)高于我國(guó)房產(chǎn)交易平均水平。在二手房交易中,賣(mài)方和買(mǎi)方的信息對(duì)稱和知情權(quán)是目前制約二手房市場(chǎng)發(fā)展的主要原因之一。對(duì)賣(mài)方而言,由于復(fù)雜多變的政策、“一房一價(jià)”模式以及個(gè)人偏好問(wèn)題,導(dǎo)致售出過(guò)程受阻;而對(duì)買(mǎi)方而言,從浩瀚如煙的房產(chǎn)數(shù)據(jù)里搜尋出心儀的房產(chǎn),更是難事一樁。因此,快速準(zhǔn)確地為業(yè)主的房產(chǎn)估值或?yàn)橘?gòu)房者提供置業(yè)建議成為房產(chǎn)經(jīng)濟(jì)行業(yè)非常有意義的研究問(wèn)題。
三、樣本量的確定
本文從實(shí)際樣本量的可獲取量出發(fā),參考各個(gè)城區(qū)人口數(shù)量間的比例關(guān)系,其中西湖區(qū)編號(hào)為1,人口數(shù)量80.85萬(wàn)人,樣本數(shù)量510;上城區(qū)編號(hào)為2,人口數(shù)量35.30萬(wàn)人,樣本數(shù)量412;下城區(qū)編號(hào)為3,人口數(shù)量53.50萬(wàn)人,樣本數(shù)量330;江干區(qū)編號(hào)為4,人口數(shù)量71.09萬(wàn)人,樣本數(shù)量456;拱墅區(qū)編號(hào)為5,人口數(shù)量57.10萬(wàn)人,樣本數(shù)量640;濱江區(qū)編號(hào)為6,人口數(shù)量33.08萬(wàn)人,樣本數(shù)量582。
四、特征價(jià)格模型的構(gòu)建
(一)數(shù)據(jù)來(lái)源
變量數(shù)據(jù)的獲取主要依靠網(wǎng)絡(luò)。內(nèi)容包括:裝修程度、建筑類(lèi)型、朝向、附近生活便利情況、附近教育配套、附近醫(yī)療情況、附近交通情況、面積、戶型、樓層、建造年代等。以及區(qū)位特征和鄰里特征;對(duì)于特征不詳盡的住房,以實(shí)地調(diào)查的方式補(bǔ)充資料。
(二)樣本變量的選擇和量化
分等級(jí)賦值變量:有些特征變量需要通過(guò)主觀識(shí)別進(jìn)行評(píng)價(jià),為了便于賦值,所以進(jìn)行了等級(jí)的賦值的方法,這類(lèi)變量主要有:裝修程度、建筑類(lèi)型、朝向三個(gè)變量。賦值越高,對(duì)住宅價(jià)格的附加值就越高。裝修中毛坯、簡(jiǎn)裝、精裝分別賦值為3、6、9;樓層低中高分別對(duì)應(yīng)樓層2、7、10;給朝向排序綜合指標(biāo)變量。由于過(guò)多變量的共線性問(wèn)題不容忽視,故需對(duì)過(guò)多變量進(jìn)行概括與濃縮,形成一個(gè)綜合指標(biāo),包括15min步行范圍內(nèi)公交站數(shù);5公里內(nèi)醫(yī)院數(shù);1公里內(nèi)學(xué)校數(shù);15min步行范圍內(nèi)超市數(shù)。還對(duì)定量數(shù)據(jù)進(jìn)行量化,包括:幾室?guī)讖d、面積、建造年代、電梯有無(wú)。
(三)杭州二手房房產(chǎn)估值模型的建立
建立多元線性回歸模型,再用逐步回歸法對(duì)影響房?jī)r(jià)不大的因素移去,再利用線性最小二乘法對(duì)其他主要因素進(jìn)行擬合。
1.多元線性回歸模型的建立與求解:
由y=β0+β1x1+…+βkxk確定模型為:
Y=Xβ+ε
E(ε)=0,COV(ε,ε)=σ2In
為k元線性回歸模型,k=12,簡(jiǎn)記為(Y,Xβ,σ2In)
Y=-185.5261+3.0877*x3+3.9751*x4+8.7603*x5+17.2894*x6+0.7181*x9+5.1173*x1o+10.6264*x11+1.3616*x12
其中β0,βD,…,β12是13個(gè)帶估計(jì)參數(shù)。y為房?jī)r(jià),單位萬(wàn)元;x1為室數(shù),單位室;x2為廳數(shù),單位廳;x3為面積;x4為朝向;x5為裝修;x6為電梯有無(wú);x7為建造年代;x8為樓層高低;x9為周邊交通;x10為周邊醫(yī)療;x11為周邊教育;x12為周邊超市。
用最小二乘法求β0,…,βk的估計(jì)量做離差平方和:
選擇β0,…,βk使得Q達(dá)到最小。解得估計(jì)值:
此為經(jīng)驗(yàn)回歸平面方程,βi為經(jīng)驗(yàn)回歸系數(shù)。
進(jìn)行逐步回歸分析,從一個(gè)自變量開(kāi)始,視自變量y作用的顯著程度,從大到小地依次逐個(gè)引入回歸方程。當(dāng)引入的自變量由于后面變量的引入而變得不顯著時(shí),要將其剔除掉。對(duì)于每一步都要進(jìn)行y值檢驗(yàn),以確保每次引入新的顯著性變量前回歸方程中只包含對(duì)y作用顯著的變量。這個(gè)過(guò)程反復(fù)進(jìn)行,直至既無(wú)不顯著的變量從回歸方程中剔除,又無(wú)顯著變量可引入回歸方程時(shí)為止。最終得到回歸平面方程為:
y=-185.5261+3.0877x3*+3.9751*x4+8.7603*x5+17.2894*x6+0.7181*x9+5.1173*x1*+10.6264*x11+1.3616*x12
2.線性模型和回歸系數(shù)的檢驗(yàn):
利用R檢驗(yàn)法,解得R2=0.79802;修正后:,模型具有比較強(qiáng)的解釋能力。
與顯著性相關(guān)的P值=0<0.05,表示回歸方程顯著性強(qiáng),說(shuō)明住宅價(jià)格和各特征變量之間的線性關(guān)系能夠成立。
五、研究結(jié)果分果
根據(jù)本文得出的杭州市二手房特征價(jià)格模型,在其他變量不變的情況下,住房所處的地區(qū)分別為西湖區(qū)、上城區(qū)、下城區(qū)、江干區(qū)、拱墅區(qū)和濱江區(qū),其中西湖區(qū)房?jī)r(jià)最高,江干區(qū)房?jī)r(jià)最低;同時(shí),住房附近公交站點(diǎn)數(shù)增加,會(huì)使住房?jī)r(jià)格上升,住房?jī)r(jià)格增加可用公式△y=0.7181*x9表示,其中△y為住房?jī)r(jià)格增量,y為住房原價(jià),x9為公交站點(diǎn)數(shù)。影響特征中的電梯有無(wú),周邊學(xué)校個(gè)數(shù),裝修程度,周邊醫(yī)院個(gè)數(shù),房屋朝向,房屋面積,周邊超市個(gè)數(shù),周邊公交站個(gè)數(shù)這8個(gè)特征對(duì)二手房?jī)r(jià)格影響依次減少。其他影響特征不變的情況下,建筑面積越大的住房,住宅總價(jià)越高。