李 華,唐義杰
(長(zhǎng)春大學(xué) 理學(xué)院,長(zhǎng)春130022)
在多元統(tǒng)計(jì)分析的學(xué)習(xí)中,我們知道了每一個(gè)傳統(tǒng)的統(tǒng)計(jì)分析方法都有其明顯的缺點(diǎn)和適用范圍。因此我們想看一下在實(shí)際數(shù)據(jù)分析中如何巧妙的利用所學(xué)的方法中的主成分分析,因子分析,聚類分析和非參數(shù)統(tǒng)計(jì)方法,巧妙地規(guī)避各個(gè)方法的局限性,使得在實(shí)際問(wèn)題的分析中有較好的統(tǒng)計(jì)說(shuō)明結(jié)果。
當(dāng)今世界經(jīng)濟(jì)全球化越來(lái)越明顯,各國(guó)經(jīng)濟(jì)依賴性逐漸加大,我國(guó)經(jīng)濟(jì)發(fā)展主要特點(diǎn)是呈現(xiàn)經(jīng)濟(jì)多年持續(xù)增長(zhǎng),經(jīng)濟(jì)規(guī)模和經(jīng)濟(jì)效益在全國(guó)范圍內(nèi)的發(fā)展出現(xiàn)不平衡的狀況也愈發(fā)明顯,因而分析我國(guó)各地區(qū)的經(jīng)濟(jì)效益發(fā)展?fàn)顩r就十分必要。本文分析了全國(guó)31 個(gè)省市自治區(qū)2011 年工業(yè)企業(yè)的經(jīng)濟(jì)效益的5 個(gè)指標(biāo)變量:全社會(huì)固定資產(chǎn)投資(億元)、單位地區(qū)生產(chǎn)總值能耗(等價(jià)值)(噸標(biāo)準(zhǔn)煤/萬(wàn)元)、經(jīng)營(yíng)單位所在地進(jìn)出口總額(千美元)、地區(qū)生產(chǎn)總值(億元)、地方財(cái)政稅收收入(億元)的數(shù)據(jù)進(jìn)行分析。主要用到統(tǒng)計(jì)學(xué)的一般方法以這些城市的經(jīng)濟(jì)效益劃分等級(jí)進(jìn)行比較分析,找出它們之間的差別并分析可能的原因。
采用的數(shù)據(jù)主要是從網(wǎng)上搜集的,關(guān)于全國(guó)31 個(gè)省市自治區(qū)2011 年工業(yè)企業(yè)的經(jīng)濟(jì)效益的5 個(gè)指標(biāo)變量:全社會(huì)固定資產(chǎn)投資(億元)、單位地區(qū)生產(chǎn)總值能耗(等價(jià)值)(噸標(biāo)準(zhǔn)煤/萬(wàn)元)、經(jīng)營(yíng)單位所在地進(jìn)出口總額(千美元)、地區(qū)生產(chǎn)總值(億元)、地方財(cái)政稅收收入(億元)數(shù)據(jù)的5 個(gè)指標(biāo)的數(shù)據(jù)都由國(guó)家統(tǒng)計(jì)局網(wǎng)(http://www.stats.gov.cn/tjsj/ndsj/2009/indexce.htm)收集整理得到。
2.3.1 評(píng)價(jià)經(jīng)濟(jì)效益相關(guān)指標(biāo)的選取
X1:全社會(huì)固定資產(chǎn)投資(億元)
X2;單位地區(qū)生產(chǎn)總值能耗(等價(jià)值)(噸標(biāo)準(zhǔn)煤/萬(wàn)元)
X3:經(jīng)營(yíng)單位所在地進(jìn)出口總額(千美元)
X4:地區(qū)生產(chǎn)總值(億元)
X5:地方財(cái)政稅收收入(億元)
2.3.2 評(píng)價(jià)經(jīng)濟(jì)效益的指標(biāo)含義
(1)稅收收入:國(guó)家憑借其政治權(quán)力,依據(jù)法定標(biāo)準(zhǔn),從單位和個(gè)人無(wú)償取得的一種財(cái)政收入。稅收歷來(lái)是國(guó)家財(cái)政收入的主要來(lái)源。從一定程度上稅收收入能反映一定的經(jīng)濟(jì)效益情況,更能體現(xiàn)地區(qū)間的差異。
(2)固定資產(chǎn)投資:是建造和購(gòu)置固定資產(chǎn)的經(jīng)濟(jì)活動(dòng),即固定資產(chǎn)再生產(chǎn)活動(dòng)。固定資產(chǎn)再生產(chǎn)過(guò)程包括固定資產(chǎn)更新(局部和全部更新)、改建、擴(kuò)建、新建等活動(dòng)。它是反映固定資產(chǎn)投資規(guī)模、速度、比例關(guān)系和使用方向的綜合性指標(biāo)。固定資產(chǎn)投資能反映國(guó)家經(jīng)濟(jì)建設(shè)以及經(jīng)濟(jì)活動(dòng)的情況,從而具有代表評(píng)價(jià)各省市經(jīng)濟(jì)效益的能力。
(3)地區(qū)生產(chǎn)總值:指本地區(qū)所有常住單位在一定時(shí)期內(nèi)生產(chǎn)活動(dòng)的最終成果。地區(qū)生產(chǎn)總值等于各產(chǎn)業(yè)增加值之和。國(guó)民經(jīng)濟(jì)各行業(yè)的增加值之和等于地區(qū)生產(chǎn)總值。國(guó)民經(jīng)濟(jì)各行業(yè)的增加值之和等于地區(qū)生產(chǎn)總值。
(4)單位地區(qū)生產(chǎn)總值能耗:是衡量一個(gè)地區(qū)能耗水平的綜合指標(biāo),通常以萬(wàn)元GDP 消耗的能源(折算為標(biāo)準(zhǔn)煤)來(lái)計(jì)算。它是衡量一個(gè)地區(qū)能耗水平的綜合指標(biāo)。常常用萬(wàn)元GDP 能耗的下降來(lái)考核一個(gè)地區(qū)的節(jié)能降耗的工作成效。
(5)進(jìn)出口:指國(guó)家(地區(qū))與國(guó)家(地區(qū))之間的貿(mào)易往來(lái),進(jìn)為購(gòu)入,出為外銷,進(jìn)口和出口的綜合。對(duì)于各省市的進(jìn)出口一定程度上能夠說(shuō)明該地區(qū)的貿(mào)易往來(lái),從而能夠說(shuō)明經(jīng)濟(jì)效益,可以作為評(píng)價(jià)各省市經(jīng)濟(jì)效益的指標(biāo)。
2.5.1 聚類分析的基本思想
所要研究的樣本數(shù)據(jù)和指標(biāo)變量之間存在一定程度的相似性。于是根據(jù)一批樣品的多個(gè)觀測(cè)指標(biāo),具體找出一些能夠度量樣品或指標(biāo)之間相似程度的統(tǒng)計(jì)量,將選定的這些統(tǒng)計(jì)量作為劃分不同類型的依據(jù)。把一些相似程度較大的樣品(或指標(biāo))聚合為一類,把另外一些彼此之間相似程度較大的樣品(或指標(biāo))又聚合為另一類,直到把所有的樣品(或指標(biāo))聚合完畢,這就是分類的基本思想。在聚類分析中,通常我們將根據(jù)分類對(duì)象的不同分為Q 型聚類分析和R 型聚類分析兩大類。
2.5.2 聚類分析的結(jié)果及分析
下面是對(duì)我國(guó)31 個(gè)省市地區(qū)運(yùn)用SAS 軟件進(jìn)行聚類分析得出的劃分情況如下:
圖1 聚類質(zhì)心之間的距離
由圖1 的軟件運(yùn)行結(jié)果結(jié)合實(shí)際得出的聚類結(jié)果如下:
第一類地區(qū):廣東;第二類地區(qū):北京、上海、江蘇、浙江、山東;第三類地區(qū):遼寧、福建、天津;第四類地區(qū):四川、海南、湖北、山西、陜西、吉林、西藏、黑龍江、貴州、安徽、江西、河南、湖南、廣西、重慶、云南、、新疆、內(nèi)蒙古、甘肅、青海、寧夏、河北。
2.6.1 因子分析的基本思想
因子分析的基本思想是研究如何以最少的信息丟失,將眾多原始變量濃縮成少數(shù)幾個(gè)主要的因子變量,以及如何使這幾個(gè)主要因子變量具有較強(qiáng)解釋性的一種多元統(tǒng)計(jì)分析方法。這幾個(gè)共同因素也稱之為公共因子,它們均是不可觀測(cè)的。因子分析主要反映了降維的思想,通過(guò)降維手段將相關(guān)性度較高的變量聚集在一起,以便提取容易解釋的某些特征,而以降低需要分析的變量數(shù)目和解釋問(wèn)題的復(fù)雜性和難度。
2.6.2 因子分析的結(jié)果及解釋
從表1、表2 的因子分析的結(jié)果中可以看出第一主因子在變量X1,X2,X3,X4,X5 上的因子載荷顯著的區(qū)別于第二主成分,第一主成分承擔(dān)了系統(tǒng)的大多數(shù)信息,根據(jù)兩個(gè)因子在各變量的載荷可以分別給第一第二因子命名為進(jìn)口-收入因子和地方財(cái)政因子。上述因子分析的因子載荷結(jié)果結(jié)合我們聚類的結(jié)果在下面的表格給出:
表1 旋轉(zhuǎn)因子模式
表2 每個(gè)因子已解釋方差
從上面表3 的分析結(jié)果可以看到由第一主成分和第二主成分作為劃分標(biāo)準(zhǔn)時(shí),出現(xiàn)較大的變異性,結(jié)果相差顯著,由綜合得分看到的分類結(jié)果在第一第二個(gè)聚類較為合理,第三第四聚類的結(jié)果會(huì)出現(xiàn)一定的差異性,但總體效果相對(duì)較好。
2.7.1 非參數(shù)統(tǒng)計(jì)的特點(diǎn)
非參數(shù)統(tǒng)計(jì)問(wèn)題中對(duì)分析數(shù)據(jù)的總體分布要求較為寬泛,因而針對(duì)某些總體分布不好給出的數(shù)據(jù)的問(wèn)題可以考慮構(gòu)造非參數(shù)統(tǒng)計(jì)的方法,加以分析,這樣可以不因?yàn)橛捎趯?duì)總體分布的假定不當(dāng)而導(dǎo)致重大錯(cuò)誤,因而這樣的分析方法往往有著較好的統(tǒng)計(jì)效果,可以視為穩(wěn)健統(tǒng)計(jì),由于這一重要的特點(diǎn)。由于使用非參數(shù)統(tǒng)計(jì)方法分析數(shù)據(jù)時(shí),需要照顧范圍很廣的數(shù)據(jù)分布,在某些情況下會(huì)導(dǎo)致其效率的降低。不過(guò),近代理論證明了:一些重要的非參數(shù)統(tǒng)計(jì)方法,當(dāng)與相應(yīng)的參數(shù)方法比較時(shí),即使在最有利于后者的情況下,效率上的損失也很小。
2.7.2 非參數(shù)統(tǒng)計(jì)的結(jié)果與解釋
進(jìn)行非參統(tǒng)計(jì)分析的目的在于分析我們上面給定的聚類分析的結(jié)果是否合理的問(wèn)題。首先在使用非參方法考慮四個(gè)樣本的差異時(shí),先考察四個(gè)樣本是否來(lái)自同一總體,這里僅假設(shè)總體服從正態(tài)或指數(shù)分布的情況,再考察四個(gè)樣本是否存在顯著性差異。這里分別以主成分1,主成分2 和綜合得分作為評(píng)判的依據(jù),分別對(duì)其進(jìn)行分析。下面是具體的分析過(guò)程和軟件的運(yùn)行結(jié)果。
(1)樣本分布的Kolmogorov-Smirnov 檢驗(yàn)
H0:四個(gè)樣本的分布相同;H1:四個(gè)總體的分布不同
表4
Cramer-vonMises 0.18937182 0.007 Anderson-Darling 1.26529374 <0.005
表5
從表4、表5 可以看到由第一主成分factor1 作為的分類依據(jù)時(shí),假設(shè)來(lái)自正態(tài)總體和指數(shù)分布總體,由上述總體可以看出顯著性水平均在0.05 以下,拒絕原假設(shè),不服從正態(tài)或是指數(shù)分布。
表6
表7
由表6、表7 第二主成分factor2 作為的分類依據(jù),由上述總體可以看出顯著性水平均在0.05 以下,拒絕原假設(shè),不服從正態(tài)或是指數(shù)分布。
表8
UNIVARIATE PROCEDURE Fitted Exponential Distribution for Factor2 Cramer-vonMises 0.29657377 <0.005 Anderson-Darling 1.76694749 <0.005
表9
由表8、表9 的綜合得分sum 作為的分類依據(jù),假設(shè)來(lái)自正態(tài)總體和指數(shù)分布總體,顯著性水平均在0.05 以下,拒絕原假設(shè),不服從正態(tài)或是指數(shù)分布。
綜上可以認(rèn)為四個(gè)樣本是來(lái)自于四個(gè)總體,下面再分析四個(gè)總體的差異性。
(2)獨(dú)立樣本位置的Kruskal-Wallis 檢驗(yàn)
H0:四個(gè)總體沒(méi)有顯著性差異;H1:四個(gè)總體至少有兩個(gè)存在顯著性差異
表10
表11
2 5 94.0 80.0 18.618987 18.800000 3 3 48.0 48.0 14.966630 16.000000 4 22 324.0 352.0 22.978251 14.727273 Kruskal-Wallis 檢驗(yàn)卡方 3.2762自由度 3 Pr >卡方 0.3510
表12
由上述表10、表11、表12 的四個(gè)表格分析四個(gè)總體的Kruskal-Wallis 檢驗(yàn)的結(jié)果可以看到,當(dāng)以第一主成分作為分類的依據(jù)時(shí),顯著性水平達(dá)到0.0041,顯著小于0.05,拒絕原假設(shè),認(rèn)為組間存在顯著性差異,當(dāng)以第二主成分作為分類依據(jù)時(shí),顯著性水平達(dá)到0.351,不能拒絕原假設(shè),不能認(rèn)為類間差異顯著。當(dāng)以綜合得分作為分類的依據(jù)時(shí),可以看到顯著性水平達(dá)到0.0009,拒絕原假設(shè),認(rèn)為上述4 個(gè)總體是相互獨(dú)立的。因而結(jié)合實(shí)際考慮的對(duì)聚類結(jié)果做出的調(diào)整具有合理性。
2.8.1 廣東省分析情況:
廣東省被作為單獨(dú)的一類,是由于其特殊的地理位置。廣東省作為我國(guó)發(fā)展較早的一批城市,從我們數(shù)據(jù)分析的結(jié)果中可以看出,廣東省的稅收收入和固定資產(chǎn)投資均處于中等水平,分析可知廣東省的經(jīng)濟(jì)增長(zhǎng)不是由于能源消耗型企業(yè)的大量存在,而主要是進(jìn)出口外貿(mào)行業(yè)和綜合服務(wù)型行業(yè)的主要作用,第三產(chǎn)業(yè)在廣東省的經(jīng)濟(jì)發(fā)展中的重要作用。因此,廣東省進(jìn)出口貿(mào)易較為發(fā)達(dá),因此對(duì)于能源資源的消耗就較低。廣東省的發(fā)展更多的是外向型和服務(wù)型的社會(huì)經(jīng)濟(jì)形態(tài)。
2.8.2 北京市、上海市、江蘇省、浙江省、山東省分析情況:
表13
表14
表13、表14 中我們采用因子分析的方法確定2 個(gè)因子來(lái)解釋這組變量認(rèn)為是合適的,由因子分析的結(jié)果如下:
第2 個(gè)因子在X3 變量上的因子載荷較大,而在其他變量上的載荷較小,因而可以將其命名為進(jìn)出口因子。第1 個(gè)因子第二個(gè)變量在X2,X4,X5 變量上的因子載荷較其他變量的載荷更大且與第2 個(gè)因子的載荷顯著不同,因而第1 個(gè)因子可以命名為生產(chǎn)要素因子。分析數(shù)據(jù)可以得出這幾個(gè)發(fā)達(dá)地區(qū)由于靠近沿海地區(qū)。較早的發(fā)展了工業(yè),商業(yè)也發(fā)展的快速且高效,且由于所處的地理位置,經(jīng)濟(jì)的發(fā)展有很強(qiáng)的地方政府財(cái)政補(bǔ)助的因素,以及國(guó)家相關(guān)政策的支持作用,因而總體而言發(fā)展的情況較好。
2.8.3 天津市、遼寧省、福建省分析情況:
表15
表16
表15、16 是對(duì)于第三類地區(qū)天津、遼寧、福建而言,五種經(jīng)濟(jì)效益的指標(biāo)都對(duì)其有相關(guān)影響。但同時(shí)運(yùn)用多元統(tǒng)計(jì)回歸主成分分析法,研究得出三所城市的進(jìn)出口得分相對(duì)其稅收收入、固定資產(chǎn)投資、地區(qū)生產(chǎn)總值以及單位地區(qū)生產(chǎn)總值能耗這四種經(jīng)濟(jì)效益指標(biāo)相對(duì)較低,說(shuō)明這三類地區(qū)的經(jīng)濟(jì)效益相對(duì)不發(fā)達(dá),可能是由于缺乏相應(yīng)的政策支持和資源缺乏,后期發(fā)展動(dòng)力缺乏,這三省在四類中經(jīng)濟(jì)效益居于中等水平,尚有改進(jìn)的空間。
2.8.4 河北省、山西省、內(nèi)蒙古自治區(qū)、吉林省、黑龍江省、安徽省、江西省、河南省、湖南省、湖北省、廣西自治區(qū)、海南省、重慶市、四川省、貴州省、云南省、西藏自治區(qū)、陜西省、甘肅省、青海自治區(qū)、寧夏自治區(qū)、新疆自治區(qū)情況分析:
表17
表18
從表17、表18 可知這些省市劃分為一類最主要的原因之一這些省市地區(qū)的單位地區(qū)生產(chǎn)總值能耗較其他省市較高,從因子分析結(jié)果也顯示了單位地區(qū)生產(chǎn)總值能耗與其他經(jīng)濟(jì)效益因素有所不同,因此可將此類劃分省市的原因歸結(jié)為單位地區(qū)生產(chǎn)總值能耗型地區(qū),由于技術(shù)相對(duì)落后,而資源相對(duì)較多,發(fā)展資源型企業(yè)使得發(fā)展水平一般。稅收收入或者其他經(jīng)濟(jì)效益因素也能反映了這一問(wèn)題,主成分分析法得出了分類依據(jù),四類地區(qū)屬消耗型地區(qū),看出四類地區(qū)生產(chǎn)總值也較低。從而影響了稅收水平,進(jìn)而影響了固定資產(chǎn)投資水平及進(jìn)出口貿(mào)易。過(guò)分依賴其資源消耗性企業(yè)的發(fā)展,第三產(chǎn)業(yè)匱乏,上述各省市經(jīng)濟(jì)效益較差。
[1] 李裕奇,趙聯(lián)文,王芯,等.非參數(shù)統(tǒng)計(jì)方法[M].成都:西南交通大學(xué)出版社.
[2] 王學(xué)民.應(yīng)用多元分析[M].上海:上海財(cái)經(jīng)大學(xué)出版社.
[3] 阮敬,紀(jì)宏.實(shí)用SAS 統(tǒng)計(jì)分析教程[M].北京:中國(guó)統(tǒng)計(jì)出版社.
[4] 陳在余,陶應(yīng)龍.統(tǒng)計(jì)學(xué)原理與實(shí)務(wù)[M].北京:清華大學(xué)出版社.
[5] 胡平,崔文田,徐青川.應(yīng)用統(tǒng)計(jì)分析教學(xué)實(shí)踐案例集[M].北京:清華大學(xué)出版社.
[6]汪遠(yuǎn)征,徐雅靜.SAS 軟件與統(tǒng)計(jì)應(yīng)用教程[M].北京:機(jī)械工業(yè)出版社.
長(zhǎng)春大學(xué)學(xué)報(bào)2015年12期