郝 樂, 景 云
(1. 沈陽大學 經(jīng)濟學院, 遼寧 沈陽 110044; 2. 遼寧大學 化學院, 遼寧 沈陽 110036)
?
線性關(guān)聯(lián)分析的方法及應(yīng)用——以城鎮(zhèn)居民人均各項支出與工資收入之間的關(guān)聯(lián)分析為例
郝樂1, 景云2
(1. 沈陽大學 經(jīng)濟學院, 遼寧 沈陽110044; 2. 遼寧大學 化學院, 遼寧 沈陽110036)
摘要:給出了具有定向相關(guān)性質(zhì)的數(shù)據(jù)樣本之間的關(guān)聯(lián)分析方法,并依此分析了城鎮(zhèn)居民人均各項支出與工資收入之間的關(guān)聯(lián)程度,二者成正相關(guān).
關(guān)鍵詞:城鎮(zhèn)居民; 人均各項支出; 工資收入; 線性; 關(guān)聯(lián); 關(guān)聯(lián)度
任何事物都不是孤立的,幾乎所有的事物之間都存在著不同類型、不同程度的關(guān)聯(lián).在處理問題的時候,為抓住問題的主要矛盾和主要特征,往往需要分析各種事物之間的關(guān)聯(lián)類型和關(guān)聯(lián)程度.然而,事物之間的關(guān)聯(lián)往往是模糊的[1]、不確定的,很難確定哪些事物之間的關(guān)聯(lián)密切,而哪些事物之間的關(guān)聯(lián)不密切.
從嚴格的意義上講,兩個事物之間是否有關(guān)聯(lián),應(yīng)該通過反映這兩個事物的數(shù)量特征之間的關(guān)系來研究.
定義1設(shè)有變量X和變量Y,若Y=f(X),則稱變量Y與變量X按關(guān)系f相關(guān)聯(lián).
但是,按定義1來研究兩個事物之間的關(guān)聯(lián)未免有些太理想化了,也是很難做到的,因為大多數(shù)事物之間的關(guān)聯(lián)都是不確定的. 相關(guān)關(guān)系與函數(shù)關(guān)系既有聯(lián)系又有區(qū)別,相關(guān)關(guān)系比函數(shù)關(guān)系包含的范圍更廣泛,通常情況下,應(yīng)該用實際發(fā)生的數(shù)據(jù)樣本進行分析.
設(shè)反映兩個事物的數(shù)據(jù)樣本為
(1)
(2)
它們是通過相等的時間間隔觀測得到的,即對k=2,3,…,n-1,有tk+1-tk=tk-tk-1.
嚴格地講,Xi(t)與Xj(t)兩組數(shù)據(jù)之間按關(guān)系f的關(guān)聯(lián)程度可以定義為
(3)
式中:Rij是介于0和1之間的數(shù),Rij越接近1,說明Xi(t)與Xj(t)的關(guān)聯(lián)程度越高,即Xi(t)與Xj(t)的關(guān)系越密切;而Rij越接近0,說明Xi(t)與Xj(t)的關(guān)聯(lián)程度越低,即Xi(t)與Xj(t)的關(guān)系越疏遠.
不難看出,Rij不僅依賴于數(shù)據(jù)樣本(1)和(2),而且與f的選擇有關(guān).但問題的關(guān)鍵在于f是未知的,事先并不知道Xi(t)與Xj(t)究竟按怎樣的關(guān)系f關(guān)聯(lián);在種類繁多的f中,選擇什么樣的f對問題的研究更有意義?不同的f對應(yīng)的Rij是不同的.
傳統(tǒng)的關(guān)聯(lián)分析的方法是依賴于數(shù)理統(tǒng)計的理論得到的[2].
對于觀測到的數(shù)據(jù)樣本(1)和(2),Xi(t)與Xj(t)之間的線性關(guān)聯(lián)系數(shù)定義為
傳統(tǒng)的方法為關(guān)聯(lián)分析提供了有力的支撐,但由于它是在統(tǒng)計的基礎(chǔ)上得到的,當然會顯得不十分嚴謹,下面舉例指出統(tǒng)計意義下關(guān)聯(lián)分析方法的誤差:
通過觀察不難發(fā)現(xiàn),X1(t)、X2(t)、X3(t)與X0(t)具有相同的方向相關(guān),即前4個節(jié)點都是負相關(guān);而去掉中間3個點直接到第5點又都是正相關(guān).但r01的分子為5×65-15×21=325-315=10>0,r02的分子為5×60-15×20=300-300=0,r03的分子為5×57.5-15×19.5=287.5-292.5=-5<0,即與通過統(tǒng)計意義下的關(guān)聯(lián)分析方法計算的結(jié)果是矛盾的.
以下給出具有定向相關(guān)性質(zhì)的數(shù)據(jù)樣本之間的關(guān)聯(lián)分析方法.
設(shè)反映兩個事物的數(shù)據(jù)樣本(1)及(2)是通過相等的時間間隔觀測得到的.即對于k=2,3,…,n-1,有tk+1-tk=tk-tk-1.首先進行如下定義:
若[xi(tk+1)-xi(tk)][xj(tk+1)-xj(tk)]>0(k=1,2,3,…,n-1),則稱Xi(t)與Xj(t)正相關(guān);
若[xi(tk+1)-xi(tk)][xj(tk+1)-xj(tk)]<0(k=1,2,3,…,n-1),則稱Xi(t)與Xj(t)負相關(guān).
正相關(guān)和負相關(guān)可統(tǒng)稱為定向相關(guān).
盡管應(yīng)用這種定義檢驗方向相關(guān)的計算量較大,但卻是很嚴格的,避免了統(tǒng)計意義下的檢驗所造成的誤差. 其實,用直觀的方法檢驗方向相關(guān)性也是可行的,而且是很方便的.
對于數(shù)據(jù)樣本(1)和(2),假定xi(t1)≠xi(t2),xj(t1)≠xj(t2),定義:
(4)
(5)
分別稱為數(shù)據(jù)組Xi(t)和Xj(t)在tk時刻的線性變化率[3].
這里規(guī)定:如果分母xi(tk)-xi(tk-1)=0(或xj(tk)-xj(tk-1)=0),那么去掉對應(yīng)時刻的這兩項,用xi(tk-1)-xi(tk-2) (或xj(tk-1)-xj(tk-2))來替換……直至分母不為0.顯然,當xi(tk+1)=xi(tk)=xi(tk-1)時,Xi(t)在tk時刻呈線性水平狀態(tài).當ωi(tk)=1時,Xi(t)在tk時刻呈線性遞增或線性遞減狀態(tài);當ωi(tk)>1時,Xi(t)在tk時刻呈加速遞增或加速遞減狀態(tài);當0<ωi(tk)<1時,Xi(t)在tk時刻呈減速遞增或減速遞減狀態(tài).
ωi(tk)與ωj(tk)越接近,Xi(t)與Xj(t)在tk時刻的線性關(guān)聯(lián)程度就越高.因此,對于數(shù)據(jù)樣本(1)和(2),定義:
(6)
稱為Xi(t)與Xj(t)在tk時刻的線性關(guān)聯(lián)系數(shù).式中,若Xi(t)與Xj(t)正相關(guān),則取“-”號;若Xi(t)與Xj(t)負相關(guān),則取“+”號.
定義2
(7)
稱為Xi(t)與Xj(t)的線性關(guān)聯(lián)度.
關(guān)于定義2的合理性,可以如下證明.
事實上,若Rij=1,則對于任意的k=2,3,…,n-1,必有ξij(tk)=1. 即對于任意的k=2,3,…,n-1,假設(shè)Xi(t)與Xj(t)正相關(guān),應(yīng)有
于是有
整理得
所以
這表明,點列
(8)
在一條非水平直線上,即Xj(t)與Xi(t)線性關(guān)聯(lián).
反之,如果Xj(t)與Xi(t)線性關(guān)聯(lián),則對于任意的k=1,2,3,…,n,均有
于是,對于任意的k=2,3,…,n-1,均有
所以,對于任意的k=2,3,…,n-1,有ξij(tk)=1,于是Rij=1.
特別地,如果點列
(9)
在一條直線上,點列
(10)
也在一條直線上,那么,點列(8)一定在一條直線上.
事實上,設(shè)點列(9)在直線y=a1x+b1上,點列(10)在直線y=a2x+b2上,即對于任意的k=1,2,3,…,n,均有
xi(tk)=a1tk+b1,xj(tk)=a2tk+b2.
由上述論證可以說明:若a1≠0且a2≠0 或a1=0且a2=0,即點列(9)與點列(10)都不在水平線上或都在水平線上(都不變),則Xj(t)與Xi(t)線性關(guān)聯(lián);若a1=0但a2≠0或a1≠0但a2=0,即點列(9)與點列(10)其中一個在水平線上而另一個不在水平線上(一個變,但另一個不變),則可以理解為Xj(t)與Xi(t)非線性關(guān)聯(lián).
線性關(guān)聯(lián)分析法還可以采用下面的形式:
對于數(shù)據(jù)樣本(1)和(2),應(yīng)用最小二乘法擬合點列(8),設(shè)得到的近似關(guān)系為xj(tk)≈axi(tk)+b,則定義
(11)
稱為Xi(t)與Xj(t)的線性關(guān)聯(lián)度.
很顯然,這樣的定義也是合理的.
需要說明的是,以上分析是在假設(shè)沒有第三因素干擾的前提下進行的,但實際上并不完全這樣,要比理論上的分析復(fù)雜得多,n個因素在相互作用、相互制約,其中任何一個因素可能受到其他n-1個因素的綜合作用,這是個多元數(shù)關(guān)系的問題.
例根據(jù)文獻[4]提供的城鎮(zhèn)居民人均工資性總收入及各項支出數(shù)據(jù)(見表1),分析城鎮(zhèn)居民人均工資性總收入與各種支出的相關(guān)度.
不難發(fā)現(xiàn),表1中7個支出數(shù)據(jù)樣本與工資性總收入數(shù)據(jù)樣本均呈正相關(guān). 下面分別用線性關(guān)聯(lián)分析法分析人均工資性總收入與各種支出的相關(guān)度.
表1 城鎮(zhèn)居民人均工資性總收入及各項支出數(shù)據(jù)
應(yīng)用式(4)計算城鎮(zhèn)居民人均工資性總收入及各種支出在不同時刻的線性變化率(見表2).
應(yīng)用式(6)計算城鎮(zhèn)居民人均工資性總收入與各種支出之間在不同時刻的線性關(guān)聯(lián)系數(shù)(見表3).
應(yīng)用式(7)計算城鎮(zhèn)居民人均工資性總收入與各種支出之間的線性關(guān)聯(lián)度(見表4).
表2 城鎮(zhèn)居民人均工資性總收入及各種支出在不同時刻的線性變化率
表3 城鎮(zhèn)居民人均工資性總收入與各種支出之間在不同時刻的線性關(guān)聯(lián)系數(shù)
表4 城鎮(zhèn)居民人均工資性總收入與各種支出之間的線性關(guān)聯(lián)度
不難發(fā)現(xiàn):R04>R02>R07>R06>R03>R01>R05.即城鎮(zhèn)居民人均各項支出與工資性總收入的關(guān)系的密切程度的排序是:設(shè)備及用品消費支出與工資性總收入的關(guān)系最密切;衣著消費支出與工資性總收入的關(guān)系次之;文教娛樂服務(wù)消費支出與工資性總收入的關(guān)系再次之;以下分別是交通和通信消費支出、居住消費支出、食品消費支出、醫(yī)療保健消費支出.
參考文獻:
[1] 鄧聚龍. 灰色系統(tǒng)理論教程[M]. 武漢:華中理工大學出版社, 1990:78-84.
(Deng Julong. The Grey System Theory[M]. Wuhan: Huazhong University of Science and Technology Press, 1990:78-84.)
[2] 葉中行. 概率論與數(shù)理統(tǒng)計[M]. 北京:北京大學出版社, 2010:402-407.
(Ye Zhongxing. Probability Theory and Mathematical Statistics[M]. Beijing: Peking University Press, 2010:402-407.)
[3] 郝一凡. 數(shù)據(jù)鏈之間的關(guān)聯(lián)分析[J]. 沈陽教育學院學報, 2005,7(3):134-137.
(Hao Yifan. The Analysis of Relevance Between Data Chains[J]. Journal of Shenyang College of Education, 2005,7(3):134-137.)
[4] 中華人民共和國國家統(tǒng)計局[OL]. 年度數(shù)據(jù):人民生活:城鎮(zhèn)居民家庭基本情況. http:∥www.stats.gov.cn/workspace/index?m=hgnd.
【責任編輯: 李艷】
(National Bureau of Statistics of the People’s Republic of China[OL]. http:∥www.stats.gov.cn/workspace/index?m=hgnd.)
Linear Correlation Analysis Method and its Application
----Taking Relationship between Urban Residents Per Capita Expenditures and Income Analysis as an Example
HaoLe1,JingYun2
(1. School of Economy, Shenyang University, Shenyang 110044, China; 2. College of Chemistry, Liaoning University, Shenyang 110036, China)
Abstract:A correlation analysis method between data samples with property of directional correlation are presented. The relational degree of the relationship between urban residents per capita expenditures and income is analyzed, there is a positive correlation between the two.
Key words:urban resident; per capita expenditures; income; linear; relevance; relational degree
收稿日期:2014-08-17
中圖分類號:O 159
文獻標志碼:A
作者簡介:郝樂(1984-),女,遼寧沈陽人,沈陽大學講師,碩士.
基金項目:遼寧省社會科學基金資助項目(L13CJY052).
文章編號:2095-5456(2015)01-0083-04