史亞楠
(西北師范大學 經(jīng)濟學院,甘肅 蘭州730070)
我國28個省、市、自治區(qū)社會經(jīng)濟發(fā)展的多元統(tǒng)計分析
——基于2012年統(tǒng)計數(shù)據(jù)
史亞楠
(西北師范大學 經(jīng)濟學院,甘肅 蘭州730070)
通過主成分分析、因子分子對我國28個省、市、自治區(qū)的8項社會經(jīng)濟發(fā)展指標數(shù)據(jù),旨在提取能近似且具有綜合性解釋社會經(jīng)濟發(fā)展的主因子成分,以據(jù)此對各地區(qū)社會經(jīng)濟發(fā)展狀況進行分類、比較和綜合排序評價。
經(jīng)濟發(fā)展;主成分分析;因子分析;綜合評價
本文選取了其中28個省 (其他三省的數(shù)據(jù)留待判別分析時使用)的8項指標來綜合評價各地的經(jīng)濟發(fā)展狀況:GDP(單位:億元)、居民消費水平(單位:元)、固定資產(chǎn)投資(單位:億元)、職工平均工資(單位:元)、貨物周轉(zhuǎn)量(單位:元)、居民消費價格指數(shù)(單位:%)、商品零售價格指數(shù)(單位:%)、工業(yè)總產(chǎn)值(單位:億元)。為了保證分析結(jié)果的有效性,需要將量綱不同的各指標值標準化。
因子分析的重要前提是要求原始變量具有較強的相關(guān)性。經(jīng)過計算相關(guān)系數(shù)矩陣后得得出,本文所選取的八個變量之間存在顯著的相關(guān)性,且通過了檢驗,可以進行主成分分析和因子分析。
為了保證分析結(jié)果的有效性,在這里運用巴特利特球體檢驗 (Bartlett’s test of sphericity)對所選指標進行再次檢驗。由檢驗結(jié)果可知,統(tǒng)計量的值比較大,為175.569,其對應(yīng)的伴隨概率值小于預先給定的顯著性水平(α=0.05)。所以認為與原始變量之間存在相關(guān)性,數(shù)據(jù)適合做因子分析。
一般而言,當分析中所選擇的變量具有不同的計量單位,或變量水平差異很大時,應(yīng)該選擇基于相關(guān)系數(shù)矩陣的主成分分析。否則,基于協(xié)方差陣作主成分分析效果可能更好。本文選擇用相關(guān)陣作分析。
做出變量共同度,從表中可以看出,除貨物周轉(zhuǎn)量和居民消費價格指數(shù)的共同度較低外,其余指標的共同度都大于0.85,表明提取的主成分對每個變量的解釋程度都較高。利用相關(guān)陣求得的特征根及對應(yīng)標準化特征向量如表1所示。
表1:總方差解釋(Total Variance Explained)
由表1可以看出,SPSS提取了三個主成分,其特征根的值均大于1。第一個主成分的特征根為3.852,方差貢獻率為48.149%,第二個主成分的特征根為1.377,方差貢獻率為17.212%,第三個主成分的特征根為1.336,方差貢獻率為16.696%,三個主成分的累計方差達到82.058%,即三個主成分共解釋了總變異的82.058%,進一步說明提取的三個主成分是比較合適的。
由碎石圖選擇主成分也可得到相同的結(jié)果。碎石圖是以主成分為橫坐標,特征根為縱坐標的圖形。根據(jù)本文所選數(shù)據(jù)做出的碎石圖如圖1所示。
圖1
實際上,碎石圖就是按特征根大小排列的主成分折線圖。圖1在第四個特征根處變得比較平緩,表明可以提取三個主成分。
因子載荷矩陣中的數(shù)值是主成分與原始變量的相關(guān)系數(shù),絕對值的大小代表了主成分與原始變量的相關(guān)程度,據(jù)此可以看出每一主成分所代表的原始變量的信息。提取的主成分在變量之間的載荷有時相差不大,所以無法明確解釋各個主成分所代表的信息,也就無法進行因子命名。因此,必須進行因子旋轉(zhuǎn)。
表2:旋轉(zhuǎn)后的總方差解釋
由表2可以發(fā)現(xiàn):前三個公因子的累計貢獻率相同(均為82.058%),但每個公因子的特征根發(fā)生了變化,其貢獻率也發(fā)生了變化。由此看來,因子旋轉(zhuǎn)相當于在確定公因子數(shù)目的前提下,將共同的累計貢獻率在各個公因子上重新分配。
表3:旋轉(zhuǎn)后的因子載荷矩陣
由表3可以看出,因子1在GDP、固定資產(chǎn)投資、工業(yè)總產(chǎn)值、貨物周轉(zhuǎn)量這四個變量上有較大載荷,所以因子1主要反映了這四個變量的信息,可命名為“經(jīng)濟發(fā)展總量因子”;因子2在居民消費水平和職工平均工資上有較大載荷,可命名為“消費因子”;因子3在居民消費價格指數(shù)和商品零售價格指數(shù)上有較大載荷,可命名為“價格因子”。
運用SPSS得出因子得分系數(shù)矩陣后,將系數(shù)代入因子得分函數(shù),所以綜合指標體系的因子得分函數(shù)為:
運用SPSS得到了“fac1_1”、“fac2_1”、“fac3_1”三列數(shù)據(jù),即為因子得分值,將其儲存,運用在后邊的綜合比較排序中。
表4為所選取的28個省、市、自治區(qū)的因子得分排名情況。
第一主因子(即經(jīng)濟發(fā)展總量因子)得分較高的省市主要有:廣東、江蘇、山東、浙江、上海、河南、遼寧、河北、湖北、湖南。從這項結(jié)果,我們不難得出以上這些省市之所以在第一主因子中排到較為靠前的位置,一方面是由于其經(jīng)濟實力本身較強,但另一方面也和其地域大小有關(guān)。比如,上海在這項因子中并未排得十分靠前,北京甚至不在此列,其原因在很大程度上是由于盡管北京、上海發(fā)展速度驚人,但其畢竟只是城市,從地域廣闊程度上講要大大小于其他某些省份,因此在總量上也要處于劣勢。
表4:各省、市、自治區(qū)的因子得分排名
第二主因子(即消費因子)能更為客觀地反映經(jīng)濟發(fā)展,其中得分較高的省市有:北京、上海、天津、浙江、廣東、江蘇。職工平均工資和居民消費水平從側(cè)面反映了人民生活水平的高低,但是其必須與物價水平高低相聯(lián)系,否則也不能解釋經(jīng)濟運行的真實狀況。由于此項因子去除了地域大小的影響,具體到每個居民身上,因此較為公平,也能提供更為清晰的認識。
第三主因子(即價格因子)得分較高的省市主要有:北京、天津、河北、山西、吉林、山東、河南、上海、四川、寧夏。這項因子可以在一定程度上反映各個省市的物價情況,在價格因子的得分上排名較為靠前的省市基本上在綜合因子得分上排名也較為靠前,但同樣可以看到在近年來的經(jīng)濟發(fā)展較有起色的地區(qū),如寧夏,它們的經(jīng)濟發(fā)展綜合得分并不十分靠前,均居全國平均水平之下,但是物價指數(shù)都比較高,在一定程度上也說明這些地區(qū)的居民生活水平有待提高。
[1]汪冬華.多元統(tǒng)計分析與SPSS應(yīng)用(第二版)[M].華東理工大學出版社,2011,(6).
[2]Wolfgang Hardle,Leopold Simar.應(yīng)用多元統(tǒng)計分析(第二版)[M],北京大學出版社,2011,(1).
[3]陳勝可.SPSS統(tǒng)計分析[M],清華大學出版社,2010,(8).
[4]馮燕,張梅青.我國各?。ㄊ?、自治區(qū))區(qū)域競爭力的多元統(tǒng)計分析[J].2007,(6).
[5]何雄浪.我國地區(qū)經(jīng)濟差異的實證分析[J].2004,(11).