周文浩
摘? ?要:以洛侖茲曲線和中等收入問題為研究對象,對收入分配的分組數(shù)據(jù)進行擬合,得到參數(shù)估計值和均方誤差,發(fā)現(xiàn)其與現(xiàn)有的10種洛侖茲曲線相比具有更好的模擬效果。然后利用收入空間法、人口空間法定義中等收入人口。最后利用基尼系數(shù)和極化曲線的思想,給定兩種定義的中等收入人口的測算方法和數(shù)學模型。
關(guān)鍵詞:洛侖茲曲線;收入空間法;基尼系數(shù);中等收入
中圖分類號:F01? ? ? ?文獻標志碼:A? ? ? 文章編號:1673-291X(2023)17-0004-03
一、洛侖茲曲線模型
通過數(shù)學和統(tǒng)計學的相關(guān)概念,這里假設(shè)收入分配的密度函數(shù)為f(x),其對應(yīng)的分布函數(shù)為F(x),且假設(shè)F(x)的反函數(shù)存在,記為F-1(p)。記收入低于或等于x的人口群體占有的收入占總收入的比例為L(p),則應(yīng)有
L(P)稱之為收入分配的洛倫茲曲線。目前學界相關(guān)的擬合模型有以下幾種,包括幾何計算法、分布函數(shù)法與曲線擬合法,幾何計算法由于其根據(jù)幾何圖形分塊來計算基尼系數(shù),因此相對比較粗糙,分布函數(shù)法分析較為復(fù)雜,在實際研究中的應(yīng)用較少,故本文擬采用曲線擬合法,應(yīng)用非線性最小二乘法對模型的參數(shù)進行估計。
非線性最小二乘法是一種比較實用的參數(shù)估計方法。其原理如(2)式所示。
確定其中參數(shù)向量τ的估計值τ,然后用L(p,τ)=L(p)作為近似的洛倫茲曲線來進行收入分配分析,其中L(p,τ)是定義在[0,1]區(qū)間上、取值于[0,1]區(qū)間的函數(shù),滿足
即L(p,τ)在[0,1]上是凸增函數(shù)。本文將在后面的研究中略去參數(shù)τ以求表述簡練。
接下來本文將設(shè)置合適的模型使L(p,τ)滿足條件(3),近年來,不少學者提出了各式各樣的參數(shù)洛侖茲曲線模型。Sarabia構(gòu)造了形如S(p)=PaL(p)η的模型,其中L(p,τ)是參數(shù)洛侖茲曲線模型,Sarabia的模型成立的條件比較苛刻,見定理1:
定理1 當α≥0且η≥1,L(p,τ)的三階導(dǎo)數(shù)L'''(p,τ)≥0,此時S(p)=PaL(p)η滿足洛侖茲定理的條件。
因為Sarabia的定理要求非常嚴格,而且η≥1的條件大大限制了模型的擬合效果。王祖祥在Sarabia研究的基礎(chǔ)上改進了定理1,提出了定理2:
定理2 設(shè)L(p,τ)滿足洛倫茲曲線的條件且對于任何p∈[0,1],有L'''(p,τ)≥0,則當α≥0,η≥1/2,α+η≥1時,PaL(p)η滿足洛侖茲曲線的條件。
接下來進行參數(shù)變換轉(zhuǎn)化成可以應(yīng)用無約束最小二乘法進行參數(shù)的估計。
令α=(1+α2)sin2b,η=(1+α2)cos2b,β1=sin2c,β2=sin2d(5)
使用Levenberg-Marquardt算法求解非線性最小二乘問題,以估計其中參數(shù)。運用matlab軟件可以得到a,b,c,d的估計值分別為0.7849,1.1682,0.8131,0.8058。將參數(shù)帶入(5)(4)式進行擬合可以得到下圖:
上述擬合精度的好壞可以采用以下三種標準進行比較。
均方誤差(MSE,mean squared error):
平均絕對誤差(MAE,mean absolute error):
最大絕對誤差(MAS,maximum absolute error)
在這里我們采用第一種標準均方誤差,求得MSE=
5.7891e-005,表明模型擬合精度高。
二、收入空間法和人口空間法
對于中等收入者的界定是目前學界研究的一個焦點問題,一般有兩種界定方法,一種是根據(jù)給定的收入來界定,比如國家統(tǒng)計局城調(diào)總隊課題組提出家庭年收入6萬—50萬元為我國的中等收入上下限以及國外的一些定性觀點;另一種是根據(jù)人口比例來界定,主要有固定比例界定方法和食品收入占比的恩格爾系數(shù)界定方法。
中等收入是指在收入方面相對高收入和低收入處于中等水平的一種狀態(tài)。中等收入受空間條件制約,指它在不同地域受當?shù)貤l件限制而有所差別。我國各地區(qū)的發(fā)達程度有明顯的地域差別,目前東部地區(qū)中等收入水平高于中西部中等收入水平,城市中等收入水平高于農(nóng)村的中等收入水平。收入是可量化指標,中等收入當然也可量化,由此需要數(shù)值化的指標來度量中等收入。中等收入者是指全部有收入的人群中,相對于高收入者和低收入者而言,處于中等水平的一個群體。因此,中等收入水平必定是個區(qū)間,有上接近高收入人群的上限和下接近低收入人群的下限,而不是一個指標值。
收入空間法方面本文提出按照中位收入的一個比例來確定我國中等收入者的收入?yún)^(qū)間,其依據(jù)如下:在存在經(jīng)濟進步或通貨膨脹的情形下,收入?yún)^(qū)間的右移也會導(dǎo)致收入中位數(shù)的右移,這也克服了收入取值的任意性。
相關(guān)數(shù)據(jù)來自2013年全國研究生數(shù)學建模競賽E題:假設(shè)收入屬于(xl,xh)中的人口為中等收入人口,其中xl=0.6m,xh=1.6m,此時可以求出中等收入范圍和中等收入人口的數(shù)量或范圍。
在人口空間法方面本文將采用基尼系數(shù)的方法來確定中等收入人口比例,假設(shè)基準中等收入人口比例為60%,基準基尼系數(shù)為0.3。當基尼系數(shù)提高時,收入?yún)^(qū)間變得更加稀疏,兩級分化程度加劇,從而中等收入比例降低,假設(shè)實際基尼系數(shù)為G,中等收入比例MF為:
很顯然,當基尼系數(shù)低,即兩級分化程度也較低時,中等收入水平提高,比如基尼系數(shù)為0.1時,中等收入比例為70%;當基尼系數(shù)較高時,中等收入水平較低,比如基尼系數(shù)為0.9時,中等收入比例僅為30%。另外在確定人口區(qū)間時,假設(shè)比例在50%的兩端(即中位數(shù)兩端)均勻分布,比如當中等收入比例為60%時,中等收入人口區(qū)間為20%—80%。根據(jù)相關(guān)數(shù)據(jù)可得表2。
地區(qū)A相對年份1來說,年份2的中等收入人口的比例有所降低,地區(qū)B則是第二年的中等收入人口比例有所增加,從表中可以發(fā)現(xiàn)中等收入人口比例與基尼系數(shù)的對應(yīng)關(guān)系。
三、基尼系數(shù)與極化曲線
根據(jù)已經(jīng)得到的收入分配的洛侖茲曲線,我們可以得到描述收入不平等的基尼系數(shù)。
收入分配的兩極分化反映出貧富差距越拉越大,不利于社會資源的正常流動,財富的過于集中和分化會導(dǎo)致“中產(chǎn)階級”的空洞化。Wolfson提出了一種兩極分化指數(shù),先定義所謂的第一類極化曲線:
其中F-1是收入分配分布函數(shù)的反函數(shù),再定義第二類極化曲線:
其中μ是平均收入,L(p)是洛侖茲曲線,最后可以定義兩級分化指數(shù)為:
W越大,兩級分化越嚴重,中等收入人口比例也隨之下降,又因為W∈(0,1),因此可以設(shè)計中等收入比例指數(shù)如下所示:M=1-W,很顯然M∈(0,1),且M越大,中等收入比例越大,反之亦然。
四、模型分析
地區(qū)差異和時間差異是我們研究的兩個維度,具體的數(shù)據(jù)來自2013年研究生數(shù)學建模競賽,數(shù)據(jù)說明了兩個地區(qū)不同年份居民收入的動態(tài)變化。下面分別從基尼系數(shù)和中等收入指數(shù)的角度進行分析并畫出洛侖茲曲線。根據(jù)模型(4)進行非線性最小二乘法估計參數(shù)并擬合。
由表3可以發(fā)現(xiàn)A地區(qū)從第一年到第二年基尼系數(shù)升高,而中等收入比例增大;B地區(qū)從第一年到第二年基尼系數(shù)降低,而中等收入比例降低。富裕的地區(qū)基尼系數(shù)較小而且第二年得到了改進,而較不富裕的地區(qū)隨著年份的增長,基尼系數(shù)反而上升。因此提高全民的收入,讓收入?yún)^(qū)間右移間接降低了基尼系數(shù),改善了收入分配。
中等收入指數(shù)的變化趨勢與基尼系數(shù)是一致的,即收入不平等的加劇會降低中等收入人口,同時兩極的人口數(shù)得到了增長。
通過模型(4)求出洛侖茲曲線并采用Matlab分別對兩個地區(qū)不同年份的曲線進行繪制,如圖2所示:
圖中從上至下分別為B2、B1、A1、A2,研究發(fā)現(xiàn)B地區(qū)第二年收入分配的不平等程度最低,同時A地區(qū)的不平等程度顯著高于B地區(qū);A地區(qū)第二年收入分配的不平等程度上升而B地區(qū)第二年收入分配的不平等程度下降。收入分配的不平等程度與基尼系數(shù)的變化是一致的。
五、模型評價
一是對洛侖茲曲線模型的構(gòu)建參考了Sarabia的定理進行了建模,模型參數(shù)較多可以很好地滿足題設(shè)條件,文中應(yīng)用非線性最小二乘法擬合洛倫茲曲線模型是比較理想的方法。但是模型的擬合精度仍然不夠高,后續(xù)的研究可以考慮在模型中加入5個或5個以上的參數(shù)。二是對收入空間法和人口空間法分別運用了中位收入基準法和基尼系數(shù)基準法,模型簡明扼要,結(jié)果比較直觀,缺點是模型的復(fù)雜度有待提高。三是參考Wolfson的兩極分化指數(shù)來構(gòu)建中等收入指數(shù),模型比較合理,較好地解決了中等收入指數(shù)的測算問題。
參考文獻:
[1]? ?王祖祥,范傳強,何耀,等.農(nóng)村貧困與極化問題研究:以湖北省為例[J].中國社會科學,2009(11):73-88.
[2]? ?Sarabia J M,Castillo E,Pascual M,Sarabia M.Mixture Lorenz curves[J].Economics Letters,2005(89):89-94.
[3]? ?李培林.擴大中等收入者比重的對策思路[J].中國人口科學,2007(5):46-52.
[4]? ?Duangkamon Chotikapanich and William E. Griffiths.Estimating Lorenz curves using a Dirichlet distribution[J].Business and Economic
Statistics,2002(20):290-295.
[5]? ?王紅霞.基于一族新洛倫茲曲線的收入不平等測度:以湖北省城鎮(zhèn)及農(nóng)村的收入數(shù)據(jù)為例[J].經(jīng)濟評論,2009(3):22-28.
[6]? ?Duangkamon Chotikapanich,D.S.Prasada Rao,Kam Ki Tang.Estimating income inequality in China using grouped data and the generalized Beta distribution[J].The Review of Income and Wealth,2007(53).
[責任編輯? ?文? ?欣]