嚴(yán)忠權(quán)
(黔南民族師范學(xué)院,貴州 都勻 558000)
對(duì)隨機(jī)變量相依性度量的研究和文獻(xiàn)很多,常見的有度量變量線性相依的Pearson相關(guān)系數(shù)[1],基于Copula的非線性相依變量的度量指標(biāo) kendall’s tau,Spearman’s rhos、Gini’s系數(shù)等[2],且這些相依性度量指標(biāo)在金融、保險(xiǎn)、可靠性理論、統(tǒng)計(jì)推斷與決策等方面得到了廣泛應(yīng)用[3]??v觀所有文獻(xiàn),對(duì)隨機(jī)事件的相依性度量僅有張堯庭的《定性資料的的統(tǒng)計(jì)分析》[4]聯(lián)中將隨機(jī)事件變量化用列聯(lián)表,通過卡方檢驗(yàn)討論二事件間的相依與獨(dú)立。何蘊(yùn)理[5]對(duì)相依事件的度量作了一個(gè)簡單討論,在概率與統(tǒng)計(jì)的其它文獻(xiàn)中僅在討論獨(dú)立隨機(jī)事件時(shí)提及“當(dāng)兩個(gè)事件不獨(dú)立時(shí)稱之為相依”這一概念,沒有給出二相依隨機(jī)事件的度量指標(biāo),而相依隨機(jī)事件卻大量存在,建立怎樣的指標(biāo)來度量兩個(gè)隨機(jī)事件的相依性及相依程度,這顯然是一個(gè)很有實(shí)際意義和理論意義的問題,本文給出了度量兩個(gè)相依隨機(jī)事件的三個(gè)相依度量指標(biāo):關(guān)聯(lián)系數(shù)、相依系數(shù)和相關(guān)系數(shù),論述了這三個(gè)指標(biāo)的性質(zhì),從三個(gè)指標(biāo)所具有的性質(zhì)可見三個(gè)指標(biāo)定義的合理性和科學(xué)性。
定義1 設(shè)A,B是同一樣本空間下的兩個(gè)隨機(jī)事件,若P(A∩B)=P(A)P(B),則稱隨機(jī)事件 A,B 相互獨(dú)立。 若 P(A∩B)≠P(A)P(B),則稱隨機(jī)事件 A,B 是相依的。
定義2 設(shè)A,B是同一樣本空間下的兩個(gè)隨機(jī)事件,稱數(shù)量 δ(A,B)=P(A∩B)-P(A)P(B)為隨機(jī)事件 A 與隨機(jī)事件B的關(guān)聯(lián)系數(shù)。若δ(A,B)>0,則稱隨機(jī)事件A與隨機(jī)事件B是正相依的,若δ(A,B)<0,則稱隨機(jī)事件A與隨機(jī)事件B是負(fù)相依的。
由關(guān)聯(lián)系數(shù)的定義可得如下基本性質(zhì):
定理1 設(shè)A,B是同一樣本空間下的兩個(gè)隨機(jī)事件,則A與B的關(guān)聯(lián)系數(shù)具有性質(zhì):
(1)δ(A,B)=0當(dāng)且僅當(dāng)隨機(jī)事件A與隨機(jī)事件B相互獨(dú)立;
(2)δ(A,B)=δ(B,A);
(4)δ(ΣAj,B)=Σδ(Aj,B)(ΣAj表示有限或可數(shù)個(gè)兩兩相互排斥的事件);
(5)δ(A∪C,B)=δ(A,B)+δ(C,B)-δ(A∩C,B)。
證明:(1)、(2)由 δ(A,B)的定義顯然成立。
(4):對(duì)于有限或可數(shù)個(gè)兩兩相互排斥的事件Aj,j=1,2,…,有
(5):δ(A∪C,B)=P(A∪C)∩B)-P(A∪C)P(B)=P((A∩C)∪(C-B))-P[P(A)+P(C)-P(A∪C)]P(B)=δ(A,B)+δ(C,B)-δ(A∩C,B)
證畢。
由關(guān)聯(lián)系數(shù)的定義和定理1有:對(duì)任意兩個(gè)隨機(jī)事件通過關(guān)聯(lián)系可知它們是獨(dú)立、正相依、負(fù)相依。且兩個(gè)隨機(jī)事件獨(dú)立當(dāng)且僅當(dāng)它們的關(guān)聯(lián)系數(shù)等于零,關(guān)聯(lián)系具有對(duì)稱性和類似概率可加性。除此之外,關(guān)聯(lián)系數(shù)還有如下系列性質(zhì)。
由關(guān)聯(lián)系數(shù)定義可得如下性質(zhì)。
系 1:若 A?B,A≠φ,則 δ(A,B)=P(A)=P(A)>0,即若 A?B,A≠φ,則隨機(jī)事件A與隨機(jī)事件B是正相依的;若A與B是互斥事件且均不是不可能事件,則δ(A,B)<0,即互斥事件是負(fù)相依的。后面將會(huì)看到,其逆不真。
系3:由乘法公式和關(guān)聯(lián)系數(shù)的定義有:P(A|B)=P(A)+,從這一表達(dá)式可知,當(dāng)A與B是正相依時(shí),在其中一事件發(fā)生的情況下會(huì)使另一個(gè)事件發(fā)生概率增大,而當(dāng)A與B是負(fù)相依時(shí),其中一個(gè)事件發(fā)生的情況下會(huì)使另一個(gè)事件發(fā)生的概率減小。
定理2 同一樣本空間下的任意兩個(gè)兩個(gè)隨機(jī)事件A與B的關(guān)聯(lián)系數(shù)滿足不等式max{-P(A)P(B),-[1-P(A)][1-P(B)]}≤δ (A,B)≤min{P(A)[1-P(B)],[1-P(A)]P(B)}稱 之 為Freshe-Hoefding不等式。 由此得δ(A,B。
由定理1(3),可得如下性質(zhì):
系 2:δ(A,A)=-δ(A,A) =P(A)[1-P(A)],即任一事件與它自身是正相依的,而與它的對(duì)立事件是負(fù)相依的;δ(A,B)=δ(A,B),即任一事件組與它的對(duì)立事件組有相同的相依性。
證明:因?yàn)?P(A∩B)≤min{P(A),P(B)},所以有
δ(A,B)=P(A∩B)-P(A),P(B)≤P(A)-P(A)P(B)=P(A)[1-P(B)]同時(shí)又有:δ(A,B)≤P(B)[1-P(A)]
所以有 δ(A,B)≤min{P(A)[1-P(B)],[1-P(A)]P(B)}
另一方面:由 P(A∩B)≥0、P(A∪B)≤0 有:
δ(A,B)=P(A∩B)-P(A)P(B)≥-P(A)P(B)和
因此有 δ(A,B)≥max{-P(A)P(B),-[1-P(A)][1-P(B)]
如果我們對(duì)任一事件A發(fā)生與不發(fā)生用一個(gè)示性指標(biāo)變量表示:當(dāng)事件A發(fā)生時(shí)令I(lǐng)A=1,當(dāng)事件A不發(fā)生令I(lǐng)A=0,則有 E(IA)=P(A),且
Cov(IA,IB)=E(IA,IB)-E(IA)E(IB)=E(IA∩B)-P(A)P(B)=δ(A,B)
因此,兩個(gè)隨時(shí)機(jī)事件的關(guān)聯(lián)系數(shù)是它們的示性指標(biāo)變量的協(xié)方差。
關(guān)聯(lián)系數(shù)描述了兩個(gè)事件的相依關(guān)系:獨(dú)立、正相依、負(fù)相依,不能描述兩個(gè)隨機(jī)事件的相依程度,因?yàn)閮蓚€(gè)隨機(jī)事件最強(qiáng)相依應(yīng)是在A=B的情況,此時(shí),它們的關(guān)聯(lián)系數(shù)為
δ(A,B)=P(A)-P2(A)
假如有 A=B 且 P(A)=0.05,則 δ(A,B)=0.0475,又假如 P(A)=0.3,P(B)=0.4,P(A|B)=0.6 則 δ(A,B)=(0.6-0.3)(0.4)=0.12。顯然,后者沒有前者的相依性強(qiáng),而后者的關(guān)聯(lián)系數(shù)卻比比前者的要大。為此,我們定義一個(gè)相依度系數(shù)用來度量相個(gè)隨機(jī)事件的相依程度。
由條件概率P(A|B)的定義,當(dāng)P(B)=0時(shí),條件概率P(A|B)沒有定義,為了定義相依度系數(shù),我們規(guī)定,當(dāng)P(B)=0時(shí),P(A|B)=P(A)。
定義3 對(duì)同一樣本空間下的任意兩個(gè)兩個(gè)隨機(jī)事件A與B,定義rB(A)=P(A|B)-P(A|B)為事件A關(guān)于事件B的相依度系數(shù)(簡稱相依系數(shù))。
由相依系數(shù)的定義可得計(jì)算公式:
由相依系數(shù)的定義我們有
定理3 設(shè)A、B是同一樣本空間下的兩個(gè)隨機(jī)事件,則它們的相依系數(shù)具有如下性質(zhì):
(1)rB(A)=rA(B)=0成立當(dāng)且僅當(dāng)與相互獨(dú)立;
(2)rA(A)=1,rA(A)=-1;
(3)rS(A)=rφ(A)=0;
(4)rB(ΣAj)=ΣrB(Aj);
(5)對(duì)任意的 A≠B 有 rBˉ(A)=-rB(A),rB)=-rB(A);
(6)對(duì)任間兩個(gè)隨機(jī)事件 A、B 有-1≤rB(A)≤1;-1≤rA(B)≤1。
由相依系數(shù)的定義和定理3可得如下的系。
系4:
(1)當(dāng) rB(A)=1 時(shí),由 rBˉ(A)=P(A|B)-P(A)的定義,當(dāng)且僅當(dāng) P(A|B)=1,P(A)=0,由此得到 A=B,此時(shí)也有 rA(B)=1。因此當(dāng)rB(A)=rA(B)=1時(shí),A與B最強(qiáng)正相依(當(dāng)A=B時(shí)稱A與B最強(qiáng)正相依)。
(2)同理,當(dāng) rB(A)=-1 時(shí)有 B=,當(dāng) rA(B)=-1 有 A=,此時(shí)表明A與B是最強(qiáng)負(fù)相依。
(4)等式rB(A)=rA(B)成立的充分必要條件是P(A)[1-P(A)]=P(B)[1-P(B)]。
(5)由 rB(A當(dāng)A與B是正相依時(shí)有rB(A)>0、rA(B)>0,而 A當(dāng) B與負(fù)相依時(shí)有 rB(A)<0、rA(B)<0。
(6)當(dāng) A?B 時(shí),δ(A,B)=P(A)[1-P(B)]=P(A)P(B)>0,則 A與B正相依,且由rB(A)=P(A)/P(B),則有A關(guān)于B的相依系數(shù)隨事件A發(fā)生的概率增大而增大且有rB(A)→1(表示向著1方向變化)。 與此同時(shí),,rA(B)=P()。 從而 B 關(guān)于 A的相依系數(shù)是隨事件B的概率的增大而減小。
(7)當(dāng) A∩B=φ 時(shí),δ(A,B)=-P(A)P(B),即 A 與 B 互斥時(shí),A與B負(fù)相依,且由rB(A)=-P(A)/P),則有A關(guān)于B的相依系數(shù)的絕對(duì)值隨事件A的概率的增大而增大且有rB(A)→-1。同樣的rA(B)=-P(B)/P(A),此B關(guān)于A的相依系數(shù)的絕對(duì)值也是隨事件B的概率的增大而增大且有rA(B)→-1。
(8)當(dāng)A∩B≠φ時(shí),A與B可以是正相依也可以是負(fù)相依。例如:若P(A)=P(B)=0.5,P(A∩B)=0.3,此時(shí)A與B是正相依的;但若P(A)=P(B)=0.5,此時(shí)A與B是負(fù)相依的。
由由定理3和系3可知,相依系數(shù)是相依性度量的一個(gè)有效指標(biāo),正負(fù)相依和相依系數(shù)的絕對(duì)值的變化是與A?B,A?B,A∩B≠φ以及兩個(gè)事件獨(dú)立的程度變化是一致的。
按照相依系數(shù)與零的距離,可將隨機(jī)事件的相依性分為五個(gè)等級(jí):當(dāng)|rB(A)|≤0.05時(shí),A與B幾乎獨(dú)立;當(dāng)0.05<|rB(A)|≤0.2時(shí),A 與 B為弱相依;當(dāng) 0.2<|rB(A)|≤0.45時(shí),A 與 B為適度相依;當(dāng)0.45<|rB(A)|≤0.8時(shí),A與B為一般相依的;而當(dāng)0.8<|rB(A)|時(shí)為強(qiáng)相依的。有了這五個(gè)級(jí)后,我們?cè)谧鹘y(tǒng)計(jì)推斷決策時(shí)就可采用相應(yīng)的策略。
定理4 相依系數(shù)具有下列不等式:
該不等式稱之為相依系數(shù)的Freshe-Hoefding不等式。
定義4 設(shè)A是B兩個(gè)隨機(jī)事件,稱
為隨機(jī)事件A與B隨機(jī)事件的相關(guān)系數(shù),其符號(hào)與正負(fù)相依的符號(hào)相同。
對(duì)于相關(guān)系數(shù)有如下計(jì)算公式
定理4 設(shè)A、B是同一樣本空間下的兩個(gè)隨機(jī)事件,則它們的相關(guān)系數(shù)具有如下性質(zhì):
(1)RA,B=0當(dāng)且僅當(dāng)隨機(jī)事件A與隨機(jī)事件B相互獨(dú)立。
(2)-1≤RA,B≤1,且 RA,B=1當(dāng)且僅當(dāng) A=B,即 A 與 B 最強(qiáng)正相依,RA,B=-1當(dāng)且僅當(dāng)A=,即A與B最強(qiáng)負(fù)相依。
(3)RA,B=RA,B=-RA,B;RA,B=RA,B。
由相關(guān)系數(shù)的定義和定理可得
系5
(1)兩個(gè)隨機(jī)事件的相關(guān)系數(shù)RA,B等于隨機(jī)事件A與隨機(jī)事件B的示性指標(biāo)變量IA與IB的相關(guān)系數(shù)ρIA,IB。
(2)RAA=1,RAA=-1,RA,S=RA,θ。
(3)相關(guān)系數(shù) RA,B可用于計(jì)算后驗(yàn)概率 P(B|A)
兩個(gè)隨機(jī)事件相依關(guān)系的度量指標(biāo):關(guān)聯(lián)系數(shù)、相依系數(shù)、相關(guān)系數(shù)分別都是由的概率表示,因此我們可在重復(fù)試驗(yàn)下得到它們的估計(jì)值。
設(shè)在N次獨(dú)立試驗(yàn)或觀測中,事件A發(fā)生了kA次,事件B發(fā)生了kB次,事件A∩B發(fā)生了kA∩B次。則各相依指標(biāo)的估計(jì)分別為:
可以證明上述估計(jì)是有效的,無偏的和一致的。
通過上面對(duì)隨機(jī)事件三個(gè)相依指標(biāo)的討論,對(duì)于同一樣本空間下的任意兩對(duì)隨機(jī)事件(A,B)和(A,C),我們可用相依系數(shù)的絕對(duì)值的大小來比較兩對(duì)事件的相依程度,若
|rB(A)|≤|rC(A)|
則有隨機(jī)事件A對(duì)C的相依程度大于隨機(jī)事件A對(duì)B的相依程度。通過相依程度的比較和上面對(duì)相依程度的分級(jí),我們建立相依事件的度量指標(biāo)可用于公共社會(huì)學(xué)管理,決策科學(xué)、醫(yī)學(xué)統(tǒng)計(jì)推斷、刑事犯罪偵探學(xué)等學(xué)科領(lǐng)域的應(yīng)用。
[1]周概容.概率論與數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社,1985.
[2]Roger B.Nelsen Antroduction to Copulas[M].New York:Springer,2006.
[3]張堯庭.連接函數(shù)(copula)技術(shù)與金融風(fēng)險(xiǎn)分析[J].統(tǒng)計(jì)研究,2002,(4).
[4]張堯庭.定性資料的的統(tǒng)計(jì)分析[M].南寧:廣西大學(xué)出版社,1991.
[5]何蘊(yùn)理.隨機(jī)事件的相依性[J].西安統(tǒng)計(jì)學(xué)院學(xué)報(bào),1994,(2).