劉虹曼,李樹有
(1.遼寧理工學(xué)院基礎(chǔ)教學(xué)部,遼寧 錦州 121000;2.遼寧工業(yè)大學(xué)理學(xué)院,遼寧 錦州 121001)
強正態(tài)分布是偏態(tài)分布[1-2]的一種.1985年,Azzalini首次提出偏態(tài)分布理論.2007年,Gupta[3]在利用偏態(tài)分布分析偏態(tài)單峰密度的數(shù)據(jù)時通過大量的模擬研究,提出了一種可行性較強的傾斜模型,將正態(tài)分布作為其中的一個特例,命名為強正態(tài)分布,并做出如下定義:
如果隨機變量X具有累積分布函數(shù)[4]
FX(x;α)=P(X≤x)=(Φ(x))α,-∞
則稱其服從強正態(tài)分布,其中Φ(·)表示標(biāo)準(zhǔn)正態(tài)分布的分布函數(shù)[5].
1998年,Nelsen提出了Copula函數(shù)[6],并給出了定義及基本性質(zhì).Copula函數(shù)描述的是變量間的相關(guān)性,實際上是一類將聯(lián)合分布函數(shù)與它們各自的邊緣分布函數(shù)連接在一起的函數(shù),因此也被叫作連接函數(shù).
令u=(u1,u2,…,un),?u1,u2,…,un∈[0,1],Copula函數(shù)表示為C:[0,1]n→[0,1],對于(x1,x2,…,xn)∈(-∞,∞)×(-∞,∞)×…×(-∞,∞),稱
FX1,X2,…,Xn(x1,x2,…,xn)=C{FX1(x1),F(xiàn)X2(x2),…,F(xiàn)Xn(xn)}
為連接函數(shù).
由Clayton連接函數(shù)的定義,有n元Clayton連接函數(shù)
即對α>0,(U1,…,Un)有聯(lián)合分布函數(shù)[7]
Gupta于2013年得到如下結(jié)論[8]:
(1)對0 (2)對m (3)對0 (4)已知U1=u1,…,Um=um,(Um+1,…,Un)的條件概率密度函數(shù)為 分布函數(shù)為 FX1,X2,…,Xn(x1,x2,…,xn)= P{X1≤Φβ1(x1),X2≤Φβ2(x2),…,Xn≤Φβn(xn)}= Cα,n(Φβ1(x1),Φβ2(x2),…,Φβn(xn))= (Φ(x1)-β2/α+Φ(x2)-β2/α+…+Φ(xn)-βn/α-(n-1))-α, 隨機變量(X1,…,Xn)的聯(lián)合概率密度函數(shù)為 如果對于參數(shù)β1>0,β2>0,…,βn>0,隨機變量(X1,…,Xn)有上述聯(lián)合分布函數(shù)FX1,…,Xn(x1,…,xn),則隨機變量(X1,…,Xn)服從n元強正態(tài)分布,并有以上概率密度函數(shù)fX1,…,Xn,記作(X1,…,Xn)~MPN(α,β1,β2,…,βn). 根據(jù)以上定義,得到如下性質(zhì): 性質(zhì)如果隨機變量(X1,…,Xn)服從n元強正態(tài)分布,那么: (1)X1~PN(β1),X2~PN(β2),…,Xn~PN(βn); (2)隨機變量(X1,…,Xn)的聯(lián)合概率密度函數(shù)為 (3)隨機變量(X1,…,Xn)的聯(lián)合分布函數(shù)為 FX1,X2,…,Xn(x1,x2,…,xn)= (Φ(x1)-β1/α+Φ(x2)-β2/α+…+Φ(xn)-βn/α-(n-1))-α; (4)隨機變量(X1,…,Xn)的聯(lián)合生存函數(shù)為 (5)已知X1=x1,X2=x2,…,Xm=xm,則(Xm+1,…,Xn)的條件概率密度函數(shù)為 條件分布函數(shù)為 證明對于上述性質(zhì)(1),當(dāng)n元隨機變量(X1,…,Xn)服從n元強正態(tài)分布時,根據(jù)Clayton連接函數(shù)的性質(zhì)可知結(jié)論顯然成立.性質(zhì)(2)可以通過對n元聯(lián)合分布函數(shù)進行求導(dǎo)計算得到.對于性質(zhì)(3)和性質(zhì)(4),可以分別根據(jù)n元聯(lián)合分布函數(shù)和n元聯(lián)合生存函數(shù)定義求得,即: FX1,…,Xn(x1,…,xn)=P{X1≤Φβ1(x1),X2≤Φβ2(x2),…,Xn≤Φβn(xn)}= Cα,n(Φβ1(x1),Φβ2(x2),…,Φβn(xn))= (Φ(x1)-β1/α+Φ(x2)-β2/α+…+Φ(xn)-βn/α-(n-1))-α; 對于性質(zhì)(5),根據(jù)條件概率分布函數(shù)的定義,當(dāng)X1=x1,X2=x2,…,Xm=xm時,有 即可求得條件分布函數(shù) 對其求導(dǎo),即可得條件概率密度函數(shù) 為了估計n元強正態(tài)分布的未知參數(shù)α,α1,…,αn,設(shè)β1=αα1,β2=αα2,…,βn=ααn. 根據(jù)其已知概率密度函數(shù)推導(dǎo)出似然函數(shù)為 對其求對數(shù)得到對數(shù)似然函數(shù)為 分別對α,α1,α2,…,αn進行極大似然估計,即分別對α,α1,α2,…,αn求偏導(dǎo),并使其等于零聯(lián)立得到: 因為以上聯(lián)立方程不能直接求出未知參數(shù)α,α1,…,αn的極大似然估計值,所以接下來利用牛頓迭代法對參數(shù)α,α1,…,αn的極大似然估計值進行進一步計算.令: 將函數(shù)f1,f2,f3,…,fn+1分別對參數(shù)α,α1,α2,…,αn-1,αn求偏導(dǎo),則有: ? ? 依此進行下去,可得 由牛頓迭代法得到以下公式: 即 將中國各個主要城市的月降水量分為12組數(shù)據(jù)進行去差異化整理,整理結(jié)果如表1所示.將其作為樣本數(shù)據(jù)[10](表1中對數(shù)據(jù)保留三位小數(shù)),對未知參數(shù)進行參數(shù)估計. 表1 中國各主要城市月降水量 對于以上12組數(shù)據(jù),即n=12,利用Matlab對α1,α2,…,α12這12個未知參數(shù)進行估計,得到參數(shù)估計值(精度為第n次估計值與第n+1次估計值差的絕對值小于10-3): α=4.223,α1=0.704,α2=0.632,α3=0.656,α4=0.611,α5=0.706,α6=0.697, α7=0.802,α8=0.755,α9=0.674,α10=0.771,α11=0.734,α12=0.645. 根據(jù)所設(shè)參數(shù)β1=αα1,β2=αα2,…,βn=ααn,可計算出: β1=2.973,β2=2.669,β3=2.770,β4=2.580,β5=2.981,β6=2.943, β7=3.387,β8=3.188,β9=2.846,β10=3.256,β11=3.099,β12=2.724. 本文主要研究了n元強正態(tài)分布的各項性質(zhì),以及對未知參數(shù)的極大似然估計.主要得出以下結(jié)論: (1)推導(dǎo)得到了n元強正態(tài)分布具有聯(lián)合概率密度函數(shù)、聯(lián)合分布函數(shù)、聯(lián)合生存函數(shù)、條件概率密度函數(shù)、條件分布函數(shù)的性質(zhì). (2)根據(jù)所取的樣本數(shù)據(jù),即180個中國部分主要城市的月降水量數(shù)據(jù),對α1,α2,…,α12這12個未知參數(shù)進行估計,得到參數(shù)估計值(精度為第n次估計值與第n+1次估計值差的絕對值小于10-3)α1,α2,…,α12.根據(jù)所設(shè)參數(shù)β1=αα1,β2=αα2,…,βn=ααn,可計算出β1,β2,…,β12.2.2 n元強正態(tài)分布的極大似然估計
2.3 應(yīng)用實例
3 總結(jié)