荊晶
摘要:自1994年以來,房地產(chǎn)業(yè)得到了極大的發(fā)展,但是有關我國房產(chǎn)稅稅基評估的問題一直處于爭議,我國也實行了滬渝兩地的試點工作。圍繞房產(chǎn)稅評估的討論也由此展開,文章系統(tǒng)地總結(jié)了房產(chǎn)稅評估的模型,并針對地提出了幾點看法,最后,對房產(chǎn)稅評估的模型提出了拙見。
關鍵詞:房產(chǎn)稅;稅基;評估模型
中圖分類號:F810.422 文獻標識碼:A
文章編號:1005-913X(2019)03-0080-03
對房產(chǎn)稅稅基進行評估有許多評估模型,因傳統(tǒng)方法存在弊端,目前的評估模型主要是特征價格模型的應用及在此基礎上的優(yōu)化和改進:特征價格模型, 用來描述產(chǎn)品的特征與其價格的關系;參數(shù)模型, 即對回歸函數(shù)常帶有基本假設并提供大量附加信息。非參數(shù)模型,即針對一般在實際應用資料中,可以隨便做出樣本總體是符合某分布的假設。半?yún)?shù)模型,即將回歸函數(shù)分解成參數(shù)和非參數(shù)結(jié)構(gòu),直觀上看是參數(shù)模型和非參數(shù)模型的疊加;地理信息系統(tǒng)(GIS),即與計算機技術結(jié)合,以電子地圖的形式直觀地呈現(xiàn)出城市的狀況;人工神經(jīng)網(wǎng)絡(artificial neural network, ANN)。當然,還有不依賴特征價格模型的模型,如:隨機森林模型、回歸決策樹模型,具體而言。
一、特征價格模型
自Ridker(1976)[1]指出空氣污染會影響房屋價值,第一個把特征價格理論應用到住宅市場分析以來,大量Hedonic模型應用于歐美學術界住宅價格分析的研究。住宅的特征價格模型可以表達為:
P=f(Z)=f(L,S,N)
其中:P 為住宅的市場價格;Z 為住宅特征向量,包括 L、S、N 三個部分;L 為住宅的區(qū)位(Location)特征向量;S 為住宅的建筑結(jié)構(gòu)(Structure)特征向量;N為住宅的鄰里環(huán)境(Neighborhood)特征向量。
線性函數(shù)、對數(shù)函數(shù)、半對數(shù)函數(shù)和逆半對數(shù)線性函數(shù)的函數(shù)形式,我們稱之為基本函數(shù)形式。
(1)線性形式:
(2)對數(shù)形式:
(3)半對數(shù)形式:
(4)逆半對數(shù)形式:
其中:P為住宅的價格,β0為常數(shù)項,βi為住宅的特征價格,Qi為住宅特征向量,ε為誤差項。
此外,還有一種經(jīng)常使用的靈活的函數(shù)形式是Box-Cox變換,而下式是對P和Qi兩個變量進行Box-Cox變換:
其中λ為估計參數(shù)。
特征價格法根據(jù)房地產(chǎn)各個特征的隱含價格進行價格評估,避免評估者主觀原因造成的評估偏差。為了克服市場比較法等傳統(tǒng)方法的問題 ,取得了良好的評估效果,但也存在一定的問題,如錯誤設定的問題是不可避免的;由于研究人員的錯誤,可能導致模型函數(shù)形式的錯誤設定而得到錯誤的結(jié)果;多重共線性可能導致難以置信的回歸結(jié)果,甚至錯誤的參數(shù)符號;特征價格模型通常無法解釋空間自相關問題,但它不會導致回歸系數(shù)改變地理信息系統(tǒng)。而Box-Cox變換具有自適應性,可用于不同的經(jīng)濟過程,采用不同的變換,但是樣本數(shù)據(jù)的質(zhì)量與屬性極度地影響λ的估計值 。
二、參數(shù)模型、非參數(shù)模型、半?yún)?shù)模型
在計量經(jīng)濟學模型的參數(shù)回歸分析中,最小二乘法是我們對線性回歸模型參數(shù)估計方法,它使用回歸函數(shù),即選擇合適的參數(shù)來確定樣本,以便所有樣本值的殘差平方和(Residual Sum of Square,RSS)最小,即
其中, 為殘差平方和, 為樣本的真實值, 為樣本的估計值。
非參數(shù)回歸模型對函數(shù)形式?jīng)]有約束,對解釋變量和因變量的分布幾乎沒有限制,它試圖從數(shù)據(jù)本身獲得解決問題所需的信息,因此,比參數(shù)回歸模型具有更大的適應性。設Y 為因變量,是隨機變量; X 為解釋變量,它可以是確定的,也可以是隨機的。對于一組樣本觀察,建立非參數(shù)回歸模型:
Yi=m(Xi)+ui(i=1,2,......n)
其中,m⊙是未知的函數(shù),ui是隨機誤差項。
半?yún)?shù)回歸基于參數(shù)回歸和非參數(shù)回歸,并提出用于解決實際數(shù)據(jù)中遇到的問題而提出的。半?yún)?shù)模型分為線性、非線性,線性半?yún)?shù)模型的一般向量形式為:
Y=Xβ+S+ε
其中Y表示為n維觀測向量,X為n*p維列滿秩設計矩陣,β為 p 維參數(shù)向量,ε為n維偶然誤差向量,S 表示描述系統(tǒng)誤差的n維非參數(shù)向量。
非線性半?yún)?shù)模型形式如下:
Y =f(X,β)+S+ε
其中 f 是已知二次可微的函數(shù),其他的量與線性的半?yún)?shù)回歸模型相同。
參數(shù)回歸模型可以分析每個解釋變量對因變量的影響,但由于參數(shù)回歸模型會提前做出許多假設,此外,解釋變量和因變量的分布存在限制,導致結(jié)果存在偏差。非參數(shù)回歸模型比參數(shù)回歸模型接近更實際情況,具有廣泛的應用和較好的穩(wěn)定性,然而,非參數(shù)回歸并未充分利用樣本所攜帶的關于總體的信息,致使效率會降低,而且存在不能深入分析解釋變量、可能會受到限制。半?yún)?shù)回歸模型結(jié)合了參數(shù)回歸與非參數(shù)回歸的優(yōu)點,結(jié)果更接近實際情況,此外,它可以處理參數(shù)和非參數(shù)之間的許多模型,并且可以掌握因變量的總體趨勢,適合于預測。
三、地理信息系統(tǒng)
GIS是地理信息系統(tǒng),其英文全稱是Geographic Information Systems,是非參數(shù)模型與計算機技術的結(jié)合,用于房地產(chǎn)稅基評估。GIS系統(tǒng)具備綜合維護和管理多種數(shù)據(jù)的能力,如:集成電子地圖、遙感圖片、照片等數(shù)據(jù),適合管理房地產(chǎn)周邊地區(qū)的各種情況,有利于準確估計房地產(chǎn)的真實價值、實時監(jiān)控房地產(chǎn)對象的變更、管理各種類型的區(qū)域以及與這些區(qū)域相關的評稅因素的參數(shù)值、精準計算與地理位置相關的評稅因素、可以生成可視化視圖,實現(xiàn)空間信息和屬性信息的綜合管理,評估者可以根據(jù)GIS的輸出結(jié)果,經(jīng)過適當調(diào)整可以形成評估報告。
四、人工神經(jīng)網(wǎng)絡
神經(jīng)網(wǎng)絡通過樣本學習并根據(jù)樣本映射影響因子之間的相關性。評估過程就是利用描述某一區(qū)域房地產(chǎn)評估對象特征的信息,即影響房地產(chǎn)價格的因素,作為神經(jīng)網(wǎng)格的輸入向量,以及交易價格為選擇足夠數(shù)量的培訓樣本,并使用網(wǎng)絡內(nèi)分布的連接權(quán)重,通過對影響因素和房地產(chǎn)價格的培訓來表達學到的價格評估知識。對它們不斷的進行修正,直到滿足設定的誤差精度。最后,通過自適應學習從網(wǎng)絡的正確內(nèi)部表示獲得一組權(quán)值和閾值。訓練完畢后,即可用訓練好的模型對該地區(qū)的其它房屋價格進行評估,也是非參數(shù)統(tǒng)計與計算機技術的結(jié)合,其操作規(guī)則如下:
Ykj=f W Y
其中,Y 是k-1層第i個神經(jīng)元的輸出,也是第k個神經(jīng)元的輸入;W 是k-1層第i個元素與第k層第j個元素的連接權(quán)值;Y 是k層第j個神經(jīng)元的輸出,也是第k+1層神經(jīng)元的輸出;f通常是Sigmoid函數(shù),f(x)= 。
BP神經(jīng)網(wǎng)絡在計算中具有并行性的特點,網(wǎng)絡的計算速度得到了很大的提高。神經(jīng)網(wǎng)絡比其他數(shù)理模型更具有適應性,更接近人腦的運行規(guī)律;神經(jīng)網(wǎng)絡將知識存儲在連接權(quán)重中,并且可以實現(xiàn)各種非線性映射;神經(jīng)網(wǎng)絡具有很大的容錯性,整體輸出的規(guī)律受到之前錯誤數(shù)據(jù)的不會影響很大。然而,在實際使用中需要解決的另一個問題是數(shù)據(jù)的可獲得性,即如何在將來獲得快速評估,以及如何收集和存儲所收集的數(shù)據(jù)。
五、隨機森林模型
隨機森林是 2001加州大學伯克利分校統(tǒng)計系教授Breiman L[2]提出的統(tǒng)計學習理論,從而將非參數(shù)統(tǒng)計引入機器學習領域,所以出現(xiàn)了隨機森林模型,隨機森林模型的建立可以分為以下幾步:
首先,應用 Bootstrap 抽樣方法從總體樣本中抽取 K 輪形成原始訓練集 S形成訓練集序列。
其次,CART 算法用于為每個新生成的訓練集建立相應的決策樹以獲得分類器。
最后,將多個決策樹的預測結(jié)果的平均值作為隨機森林的最終回歸和猜測結(jié)果,由于最終的結(jié)果由很多樹的組合決定,因此將之稱為Forests。
隨機回歸森林具有如下定理:
當k→∞,
EX,Y[Y-avkh(X,θk)]2→EX,Y[Y-Eθ(X,θk)]2
假設對所有的θ,EY=EXh(X,θ),則
PE*(forest)≤ρPE*(tree)
其中,ρ是殘差Y-h(X,θ)和Y-h(X,θ')的加權(quán)相關系數(shù),且θ和θ'相互獨立。
隨機森林作為新型的機器學習統(tǒng)計模型,其需求樣本數(shù)據(jù)少、分類速度快,具有很高的預測準確率、對異常值和噪聲具有較好的容忍度,該算法具有需要調(diào)整的參數(shù)較少、不必擔心過度擬合、分類速度快、能高效處理大樣本數(shù)據(jù)、能估計特征因素的重要性以及有較強的抗噪音能力等特點。與傳統(tǒng)的線性回歸方法不同,隨機森林的使用可以充分證明數(shù)據(jù)挖掘的優(yōu)勢,而且該方法不用函數(shù)形式預先假定,避免了假設誤差。
六、回歸決策樹模型
回歸樹是一種特殊的回歸,實際上是非參數(shù)非線性回歸。該方法由Breiman(1884)提出,其在葉節(jié)點處具有常熟值,并且使用方差作為雜質(zhì)的量度。CART回歸樹分割選擇的測度方法如下:
其中c1,c2分別用下式估計:
avg{yi|xi∈R1(j,s)},avg{yi|xi∈R2(j,s)}
目的是使平方和 i(yi-U(xi))2最小,j 為分裂變量,s 為分裂點。
CART預測模型為:
U(x)= cmI(x∈Ri)
其中,Ri為區(qū)域,I 為節(jié)點處的信息,cm為區(qū)域?qū)獮閯葑畲蟮念?,M為所有的區(qū)域數(shù)量,x為待預測點。
回歸決策樹不需要任何先驗假設,因此,模型設定沒有問題;回歸結(jié)果簡單明了、易解釋;在構(gòu)建樹的過程中,分類和回歸樹不根據(jù)純度選擇最優(yōu)的分割變量,從而消除了選擇變量的麻煩。然而,回歸結(jié)果只限于幾個值,并且結(jié)果的經(jīng)濟影響尚未完全測量。
各類房產(chǎn)稅稅基的評估模型都有一定優(yōu)缺點,并不是相互排斥的。特征價格模型在國內(nèi)的研究雖然不成熟,但是具有廣闊的發(fā)展空間,對房產(chǎn)稅稅基的評估,可以基于特征價格模型,引入其他模型或技術,以特征價格模型為主,其他模型為輔,相互結(jié)合的房產(chǎn)稅稅基評估體系。隨著社會的進步,科學技術的不斷發(fā)展,可以結(jié)合人工智能、區(qū)塊鏈等高科技對房產(chǎn)稅進行批量評估,但必須指出的是使用前注意模型的適用性。
參考文獻:
[1] Ridker R G, Henning J A. The Determinants of Residential Property Values with Special Reference to Air Pollution[J].The Review of Economics and Statistics,1967(2).
[2] Breiman L. Statistical Modeling: The Two Cultures (with comments and a rejoinder by the author)[J]. Statistical Science, 2001(3).
[責任編輯:王 旸]