劉 冰 金躍強 李朝陽
(1.南京工業(yè)職業(yè)技術(shù)大學(xué)公共基礎(chǔ)課部, 江蘇南京 210043;2. 河南工業(yè)大學(xué)管理學(xué)院, 河南鄭州 450001)
隨著我國經(jīng)濟持續(xù)穩(wěn)定的發(fā)展及人均收入的不斷提高,人們對住房的需求也日益增加,房價也隨之不斷攀升。以南京為例,2005年城中新房住宅均價為7851元/,到了2015年城中新房均價已漲到28 061元/,十年間房價上漲了257.4%。
近些年來,許多學(xué)者對房價影響因素進行了研究:周爾民(2016)等利用2005—2013年數(shù)據(jù),就宏觀經(jīng)濟、房地產(chǎn)行業(yè)、人口和市場需求水平等,利用R語言找到了影響房價的主要因素[1];薛建譜(2013)等利用因果檢驗、長期均衡模型和誤差修正模型,從房價泡沫問題出發(fā)研究了我國房價,得出了短期內(nèi)收入和股價變動對房價影響顯著性較強,長期內(nèi)人均收入、造價和股價對房價影響顯著性較強的結(jié)論[2];王志(2014)等研究了城市人口、工資收入、城市土地供應(yīng)等因素對房地產(chǎn)供求關(guān)系的影響,得出了2002—2008年中國除幾個沿海城市外其他主要城市中供求關(guān)系的變化在實際住房價格升值的占有很大比重的結(jié)論[3];Baldi G(2014)利用房地產(chǎn)業(yè)的新凱恩斯主義動態(tài)隨機一般均衡模型,探討了在家庭借貸約束沖擊和偏好沖擊導(dǎo)致房價上漲和住房部門的擴張的情況下,央行通脹對房價以及自身產(chǎn)出增長率的影響[4];Kieran McQuinn(2008)等分析了銀行可貸款額與房價之間的聯(lián)系,推導(dǎo)出收入、利率與房價之間的相互關(guān)系,建立了房價影響因素的模型并用愛爾蘭房地產(chǎn)市場數(shù)據(jù)進行了驗證[5]。上述的研究主要從宏觀經(jīng)濟、供求關(guān)系等方面研究了整個房地產(chǎn)行業(yè)。本文從二手房自身特征出發(fā),利用Box-Cox變換對南京市二手房數(shù)據(jù)進行研究,通過建立南京市二手房單位面積房價影響因素模型,以便為購房者和賣房者對二手房的估價提供理論依據(jù)。
經(jīng)典的線性回歸模型為:
y=β0+β1x1+β2x2+…+βpxp+ε
其中β0為回歸常數(shù),β1,…,βp為回歸系數(shù),ε為誤差項。這里對誤差項有著零期望、等方差、零協(xié)方差的正態(tài)分布的要求。但在建立實際問題的模型時,經(jīng)常存在誤差項與假設(shè)違背的情況,為使誤差項滿足要求,經(jīng)常對y進行變量變換。Box-Cox變換就是一種常用的變換。Box-Cox變換是由Box和Cox在1964年提出的一種應(yīng)用廣泛的變換,具體對因變量y做如下變換:
其中λ為待定參數(shù)。此變換要求y的各分量都大于0,否則可用下面推廣的Box-Cox變換:
即先對y做平移,使得y+a各個分量都大于0后再做Box-Cox變換。它包含了對數(shù)變換、倒數(shù)變換等一些常用的變換,通過此變換尋找合適的λ,使得變換后的y(λ)~Nn(Xβ,σ2I)。
Box-Cox變換中參數(shù)λ通常可由極大似然估計給出,當(dāng)固定參數(shù)λ的取值時,β,σ2的似然函數(shù)為:
L(β,σ2)分別對β,σ2求偏導(dǎo),并令其為0,可得β,σ2的最大似然估計為:
對一系列λ取值,似然函數(shù)的最大值Lmax(λ)取最大時對應(yīng)的λ,就是Box-Cox變換中參數(shù)λ的估計值。
1.變量說明
本文數(shù)據(jù)采集時間為2018年3月,通過預(yù)處理最終選取了15 980條記錄,數(shù)據(jù)共包含11個變量、5個連續(xù)變量、6個離散變量。其中單位面積房價為因變量,其余為自變量,具體說明如表1:
表1 數(shù)據(jù)變量說明表
由于樓層這一定性變量有3個取值,不能簡單地給3個類別直接賦值,本文以高樓層作為基準,引入兩個0—1變量[6]235-265:
對于區(qū)域這一8個取值的定性變量,同樣以浦口作為基準,引入7個0—1變量x11~x17進行處理。
2.變量描述統(tǒng)計
不同的二手房具有不同的特征,這些特征共同決定二手房房價。在對單位面積房價影響因素模型建立之前,首先對各變量進行描述分析,從而對單位面積房價影響因素進行初步判斷,為后續(xù)研究做鋪墊。
圖1 單位面積房價直方圖
本文中,單位面積房價最低值為15 013元/平方米,所對應(yīng)的是江寧區(qū)江南青年城青楚門的一套非學(xué)區(qū)房,總面積49.96平方米;單位面積房價最高值為64 989元/平方米,所對應(yīng)的是鼓樓區(qū)西康新村的一套學(xué)區(qū)房,總面積38.93平方米。從圖1可以看出:單位面積房價呈現(xiàn)右偏分布,說明極少數(shù)價格高的住房拉高了房價的平均水平,這點從單位面積房價均值為29 842.73元/平方米,中位數(shù)為27 689元/平方米也可以得到印證。
從圖2可以看出:有學(xué)區(qū)住房的單位面積房價明顯高于無學(xué)區(qū)住房的單位面積房價;有地鐵住房的單位面積房價明顯高于無地鐵住房的單位面積房價,因此學(xué)區(qū)和地鐵是影響單位面積房價的兩個重要因素。
圖2 學(xué)區(qū)、地鐵與單位面積房價關(guān)聯(lián)
對于其他自變量,也可以類似討論??傊肽P偷淖兞慷际呛投址繂挝幻娣e房價有密切關(guān)系,至于對房價影響是否顯著,可以通過模型顯著性檢驗進行判斷。
3.二手房房價模型建立及模型診斷
首先建立簡單的線性回歸模型。將所有變量錄入SPSS 20.0,得到南京二手房房價回歸模型,如表2。
表2 回歸系數(shù)及顯著性檢驗表
模型中決定系數(shù)R2為0.497,擬合優(yōu)度尚可;并且F值為927.822,對應(yīng)的概率P值為0.000小于0.01,F(xiàn)檢驗應(yīng)該拒絕原假設(shè),引入的17個自變量在0.01的顯著水平下總體上對因變量有顯著性影響。每個自變量對應(yīng)的概率P值均小于0.01,說明引入的每個自變量在0.01的顯著水平下均對因變量有顯著影響。
接下來對模型進行診斷。表2中DW值1.914在2附近,說明模型無自相關(guān);最大VIF值3.682小于10,說明模型無多重共線性。由圖3可知,隨著擬合值的增大,殘差和標(biāo)準化殘差也隨之增大,說明模型可能存在異方差問題;標(biāo)準化殘差和標(biāo)準直線偏離較大,說明誤差項可能不服從正態(tài)分布。為了解決這些問題,本文考慮對模型進行改進。
圖3 線性回歸模型診斷圖
把y(-0.6)作為因變量,對自變量做線性回歸,得到Box-Cox變換下的南京市二手房房價模型,如表3。
表3 Box-Cox回歸系數(shù)及顯著性檢驗表
模型中決定系數(shù)R2為0.513,擬合優(yōu)度有所提高;并且F值為989.285,對應(yīng)的概率P值為0.000小于0.01,F(xiàn)檢驗應(yīng)該拒絕原假設(shè),引入的17個自變量在0.01的顯著水平下總體上對因變量有顯著性影響。每個自變量對應(yīng)的概率P值均小于0.01,說明引入的每個自變量在0.01的顯著水平下均對因變量有顯著影響。
表3中DW值1.903在2附近,說明模型無自相關(guān);最大VIF值3.682小于10,說明模型無多重共線性。由圖4可知,Box-Cox回歸模型相對于線性回歸模型異方差得到了極大的改善;殘差QQ圖上的點也大體在一條直線附近,說明誤差服從正態(tài)分布;Cook距離表現(xiàn)正常,說明模型沒有異常點。因此,使用Box-Cox回歸模型刻畫單位面積房價與自變量之間的關(guān)系更合理。
圖4 Box-Cox回歸模型診斷圖
根據(jù)Box-Cox回歸模型結(jié)果,學(xué)區(qū)和區(qū)域會使單位面積房價存在顯著差異,所以,在Box-Cox回歸模型的基礎(chǔ)上,本文考慮學(xué)區(qū)和區(qū)域交互作用,建立Box-Cox交互回歸模型,結(jié)果如表4。
當(dāng)考慮了“區(qū)域×學(xué)區(qū)”的交互效應(yīng)時,一個明顯的變化是:學(xué)區(qū)房變量系數(shù)估計成為負數(shù)。因為“區(qū)域”“區(qū)域×學(xué)區(qū)”兩個變量的基準組是浦口,所以對應(yīng)的結(jié)論為:在浦口區(qū),非學(xué)區(qū)房價格反而比學(xué)區(qū)房單位面積房價高(這一結(jié)論在原數(shù)據(jù)中也能得到體現(xiàn))。造成“浦口區(qū)非學(xué)區(qū)房價格反而比學(xué)區(qū)房單位面積房價高”的主要原因有二:第一,樣本中浦口學(xué)區(qū)房比例較低,只有19.5%;第二,與其他區(qū)域相比,浦口學(xué)區(qū)資源相對較差。
表4 box-cox交互回歸系數(shù)及顯著性檢驗表
通過引入臥室數(shù)等十個變量對南京市二手房單位面積房價進行分析,給出了單位面積房價影響因素的線性回歸模型,并利用Box-Cox變換對模型進行改進,最終確定采用Box-Cox交互回歸模型來刻畫各因素和單位面積房價的關(guān)聯(lián)。從模型中可以看出:第一,學(xué)區(qū)和區(qū)域兩個因素對單位面積房價影響較大;地鐵、裝修、廳數(shù)、樓層、電梯、臥室數(shù)次之;面積和房齡對單位面積房價有負影響。第二,“學(xué)區(qū)優(yōu)勢”對各區(qū)域單位面積房價影響有所區(qū)別。鼓樓、雨花臺和棲霞區(qū)的學(xué)區(qū)房房價明顯高于非學(xué)區(qū)房房價;但浦口區(qū)學(xué)區(qū)房價格反而比非學(xué)區(qū)房房價低。
本文建立的Box-Cox交互回歸模型,不但引入的自變量均通過了顯著性檢驗,而且誤差項滿足經(jīng)典回歸模型的零期望、等方差、零協(xié)方差和正態(tài)分布的要求。由于影響單位面積房價的因素有很多,比如國家政策、土地供應(yīng)、周邊配套、小區(qū)環(huán)境等,在未來的研究中可以繼續(xù)加入這些因素,使模型更精確。