李戈輝
摘 要:為了分析城市化發(fā)展與人民生活水平的關系,本文從時序數據出發(fā),分別選出了11個反映城市化和體現人民生活的指標,以北京市為研究對象收集了2006年到2016年的數據,采用主成分分析的方法研究兩者之間的關系。本文首先分別求出各自的主成分,然后求出每年的得分值,再根據特征值將主成分得分分別合成城市發(fā)展指標綜合指標和人民生活水平綜合指標,對兩個綜合指標做線性回歸。結果表明,兩者成正相關關系,即隨著城市化發(fā)展,人民生活水平穩(wěn)步提高,進一步地,兩者回歸系數約為0.9。
關鍵詞:主成分分析;城市化發(fā)展;人民生活水平
中圖分類號:F291 文獻標識碼:A 文章編號:1671-2064(2018)21-0220-02
1 引言
城市化(又名城鎮(zhèn)化)包含一個地區(qū)生產力發(fā)展、科技進步以及產業(yè)結構調整,在人口從農村地區(qū)到城市集中的過程中完成從農業(yè)到工業(yè)和服務業(yè)的轉變過程。在這個過程中,伴隨著人口、社會、產業(yè)以及土地空間結構的變化,復雜的因素導致對城市化水平進行客觀評價并非易事。同時,城市化的發(fā)展是否有利于人民生活水平的不斷提高?由于衡量人民生活水平也需要考慮很多指標,這給問題的定量分析造成了一定難度。對多個指標的分析一種比較流行的方法是運用主成分分析對多變量進行降維,將多個變量轉化為少數幾個互不相關的綜合變量(即主成分),其中每個主成分都是原始變量的線性組合,能夠反映始變量的絕大部分信息,且所含的信息互不重疊[1]。利用主成分分析方法對城市化發(fā)展和人民生活水平進行分析已有很多研究,耿海清[2]、史文利[3]和岑曉雪[4]等主要從地理空間上進行分析,本文從指標時序數據出發(fā),研究北京市城市化和人民生活之間的關系。
2 主成分分析方法
2.1 主成分分析的數學原理
假設研究對象為p維隨機向量記為X=(X1,…,Xp)T,主成分分析的目標在于用k(
Fi=ai1X1+ai2X2+…+aipXp=aiX, (1)
其方差Var(Fi)最大能盡可能地反應原變量X所代表的信息。令系數矩陣A={aij},i=1,…,k,j=1,…,p,則主成分分析可以表示為求解:
(2)
其中Cov(Fm,Fn)為協方差,從幾何上理解系數矩陣A旋轉X1,…,Xp構成的坐標,使得新坐標系下的軸向樣本方差最大。
在滿足的條件下,運用拉格朗日乘子法,可以求得系數aij為X的協方差矩陣特征值λi(λ1≥λ2≥…≥λp)對應的單位正交特征向量。主成分一個重要的性質是因子載荷量,它反映主成分Fi與原變量Xj之間的相互關聯程度:
. (3)
2.2 主成分分析的計算流程
主成分分析的具體步驟如:(1)計算相關系數矩陣。為消除變量之間量綱的差異,先對數據進行標準化處理,假設每一隨機變量Xi有n個觀測樣本Xi=(xi1,…,xin),則X的協方差矩陣,相關系數矩陣為;(2)求矩陣R的特征值λi及相應的正交化單位特征向量ai,矩陣R的特征值λi對應第i個主成分Fi的方差,λi對應的單位特征向量ai就是Fi關于原變量的系數,即Fi=aiX,用主成分Fi的方差貢獻率βi來反映信息量的大小,;(3)選擇主成分。計算方差累計貢獻率βsum來確定βsum=滿足βsum>85%;(4)計算因子載荷量。因子載荷反映主成分Fi與原變量Xj之間的相互關聯程度;(5)計算主成分得分。計算樣本在m個主成分上的得分,Fi=ai1X1+ai2X2+…+aipXp,i=1,…,m。
3 主成分分析
3.1 城市化和人民生活水平指標數據
根據指標多樣性和代表性原則,從2006年到2016年的《中國統計年鑒》選取11個與城市化發(fā)展相關的指標和11個反應人民生活水平的指標,如表1所示。
3.2 城市化水平主成分分析
先對數據進行標準化處理,然后用R語言進行分析,前3個主成分如表2所示,其累計方差貢獻率為93%。主成分的因子載荷如表3所示,空白處表示因子載荷的絕對值小于0.1,表明主成分表示該因子的信息很小,幾乎可以省略。第一主成分各因子的系數相差不大,表示城市化基本水平,第二主成分主要體現人口土地指標。
3.3 人民生活水平主成分分析
先對數據進行標準化處理,然后用R語言進行分析,前3個主成分如表4所示,其累計方差貢獻率為93.6%。主成分的因子載荷如表5所示。第一主成分人民生活整體水平,第二主成分主要體現城市環(huán)境指標。
4 回歸分析
4.1 綜合指標
根據累計方差貢獻率大于85%和特征值大于1的規(guī)則,分別采用前兩個主成分信息,分別計算城市化發(fā)展和人民生活水平主成分得分F1c,F2c,F1r,F2r,城市化發(fā)展綜合指標得分Fc=,λic為城市化發(fā)展主成分特征值,同理計算可得人民生活水平綜合指標Fr,結果如表6所示。
4.2 線性回歸分析
首先求得Fc和Fr的相關系數為cor(Fc,Fr)=-0.948,對其進行回歸分析,得到兩者之間的關系為Fr=-0.899Fc,回歸的p值為8.76e-6,表明兩者顯著相關。由于城市化發(fā)展主成分因子載荷為負數,說明這里得到城市化綜和指標F1c,F2c,Fc與城市化發(fā)展是相反的關系,因此我們可以對回歸方程進行解釋,即隨著城市化的發(fā)展,人民生活水平也相應提高。
5 結語
本文定量分析了北京市城市化發(fā)展與人民生活水平之間的關系,通過主成分分析和回歸分析,城市化發(fā)展是促進人民生活水平提高的,如果將回歸系數理解為城市發(fā)展轉化為提升人民生活水平的轉化效率,則北京市的轉化效率為0.9,我們相信在不同的城市由于其自身原因轉化效率可能存在差異,這需要進一步的研究。
參考文獻
[1]高惠璇.應用多元統計分析[M].北京大學出版社,2005.
[2]耿海清,陳帆,詹存衛(wèi),等.基于全局主成分分析的我國省級行政區(qū)城市化水平綜合評價[J].人文地理,2009,(5):47-51.
[3]史文利,高天寶,王樹恩.基于主成分分析與聚類分析的城市化水平綜合評價[J].工業(yè)工程,2008,(3):112-115.
[4]岑曉雪,秦江濤.基于主成分分析法的西部人民生活水平價[J].改革與開放,2016,(2):81-84.