江忠偉
(蘭州財(cái)經(jīng)大學(xué),甘肅 蘭州 730020)
用似然比法則導(dǎo)出威爾克斯分布
江忠偉
(蘭州財(cái)經(jīng)大學(xué),甘肅蘭州730020)
在多元統(tǒng)計(jì)分析中需要一些性質(zhì)優(yōu)良的抽樣分布來(lái)進(jìn)行統(tǒng)計(jì)推斷.本文首先從不同角度研究多元正態(tài)分布,在多元統(tǒng)計(jì)分析中,我們以多元方差分析為背景,通過(guò)對(duì)一元方差分析所構(gòu)建的F統(tǒng)計(jì)量進(jìn)行推廣,引出我們想要研究的統(tǒng)計(jì)量.
多元正態(tài)分布;似然比統(tǒng)計(jì)量;多元方差分析;威爾克斯分布
多維隨機(jī)現(xiàn)象是十分復(fù)雜的,必須使用科學(xué)的方法進(jìn)行研究.一個(gè)很自然的想法是以多元正態(tài)分布為基礎(chǔ)衍生出類似一元統(tǒng)計(jì)分析中的似的三大分布,我們以三大分布為基石進(jìn)行更加細(xì)致的研究,解決現(xiàn)實(shí)問(wèn)題.很多經(jīng)典多元統(tǒng)計(jì)分析的教材中都介紹由多元正態(tài)分布衍生出的三大分布,但是介紹得不夠詳細(xì),沒(méi)有給出具體的背景,僅僅給出一個(gè)定義,這對(duì)我們理解它們以及進(jìn)行更深入的研究是不利的.本文首先從不同角度定義多元正態(tài)分布,接著介紹矩陣正態(tài)分布,最后由一元方差分析推廣到多元方差分析為背景,引出了威爾克斯分布.
2.1橫向推廣法
一元正態(tài)分布中,若Y~N(0,1),則X=μ+δY~N*μ,δ2).利用這種思想我們可以定義多元正態(tài)分布.
設(shè)y=(y1,…yq),y1,…yq獨(dú)立同分布N(0,1),μ為p維常數(shù)向量,A為p行q列的常數(shù)矩陣,則稱x=μ+A'y的分布為多元正太分布.
2.2特征函數(shù)法
上面的定義僅僅描述了多元正態(tài)分布,我們需要研究多元正太分布的相關(guān)性質(zhì).需要像一元正態(tài)分布那樣給出具體的密度函數(shù).由獨(dú)立同分布的性質(zhì)及2.1得:
由y=(A')-1(x-μ)、(1)式、雅可比變換可得:
其中∑=A'A,這里我們要求∑>0.為了把多元正態(tài)分布推廣到更一般的情形,即推廣到協(xié)方差矩陣∑是非負(fù)定的情形∑≥0,可以用特征函數(shù)代替分布函數(shù).
設(shè)Y~N(0,1),Y的特征函數(shù)g(t)為:
若X=μ+δY~N(μ,δ2),則相應(yīng)的特征函數(shù)為:
同理,多元正態(tài)分布的特征函數(shù)也可以做類似的推廣. 設(shè)y=(y1,…,yq),y1,…yq獨(dú)立并且服從標(biāo)準(zhǔn)正態(tài)分布.對(duì)任意的向量t=(t1,…,tq),由獨(dú)立同分布的性質(zhì)知:
平行推廣,若x=μ+A'y,μ為p維常數(shù)向量,A為p行q列的常數(shù)矩陣.則:
綜上,得出了多元正態(tài)分布的特征函數(shù),顯然(2)式只與μ、A'A有關(guān),可以令A(yù)'A=∑,用x~Np(μ,∑)表示滿足(2)的x服從多元正態(tài)分布.
2.3線性組合法
設(shè)x是p維隨機(jī)向量,若x的任一線性組合a'x(a∈Rp)都是一元正態(tài)分布,則我們可以說(shuō)x服從多元正太分布.下面證明這一結(jié)論.
證明a'x(a∈Rp)服從一元正態(tài)分布,則它的各階矩都存在.令μ=ε(x),∑=D(x),于是:E(a'x)=a'μ,V AR(a'x)=a'∑a,
又因?yàn)閍'x~N(a'μ,a'∑a),a'x的特征函數(shù)為:
取θ=1,則
(3)式的右邊恰好與上面2.2的(2)的右邊一樣,所以2.2與2.3可以看成是等價(jià)的.即x~Np(μ,∑).
3.1矩陣正態(tài)分布
若矩陣的各個(gè)元素均服從標(biāo)準(zhǔn)正態(tài)分布,稱該矩陣為矩陣正態(tài)分布.類似的,我們可以采取上面多元正態(tài)分布定義2.1將矩陣正態(tài)分布推廣到一般的情形.
若BB'>0,AA'>0,W=BB',V=AA'則有密度函數(shù):
3.2多元正態(tài)分布似然函數(shù)的極值問(wèn)題
若我們從Np(μ,∑)抽取n個(gè)獨(dú)立樣本.這n個(gè)樣本可以組成矩陣X,X服從矩陣正態(tài)分布.我們求多元正態(tài)分布似然函數(shù)的極值問(wèn)題,轉(zhuǎn)換成求矩陣正態(tài)分布密度函數(shù)的極大值).由上面的(4)知X的密度函數(shù)為,
于是,
當(dāng)且僅當(dāng)μ=x,等式成立.所以,
當(dāng)n>P時(shí),P(A>0)=1,此時(shí)有非退化隨機(jī)陣C,使A=CC'.
最終得出極大值為:
若正態(tài)總體是多元正態(tài)總體,設(shè)有k個(gè)總體G1,…,Gk,從這k個(gè)總體獨(dú)立抽取樣本為:
xjα,α=1,…,k;j=1,…,nα相互對(duì)立,要檢驗(yàn):
H0:μ1=…=μk,H1:存在i≠j,使μi≠μj.
多元方差分析需要構(gòu)建什么樣的檢驗(yàn)統(tǒng)計(jì)量,一個(gè)很自然的想法是將一元方差分析中的檢驗(yàn)統(tǒng)計(jì)量F統(tǒng)計(jì)量進(jìn)行推廣.F統(tǒng)計(jì)量的組間方差、組內(nèi)方差推廣后成為組間離差陣、組內(nèi)離差陣.我們需要解決兩個(gè)問(wèn)題,第一,怎樣導(dǎo)出檢驗(yàn)統(tǒng)計(jì)量;第二,推廣后的統(tǒng)計(jì)量服從什么分布.
首先,解決第一個(gè)問(wèn)題.這里采取似然比法則導(dǎo)出統(tǒng)計(jì)量.組間離差矩陣、組內(nèi)離差矩陣、組內(nèi)離差矩陣分別為:
易見(jiàn)T=B+E.似然比統(tǒng)計(jì)量為:
前面介紹過(guò)多元正態(tài)分布似然函數(shù)的極值問(wèn)題,
類似上式(5),可以求得極大值:
因此似然比統(tǒng)計(jì)量:
接下來(lái),回答第二個(gè)問(wèn)題.我們稱形如(6)統(tǒng)計(jì)量成為威爾克斯統(tǒng)計(jì)量.下面給出更一般的定義:設(shè)A~Wp(n,∑)和B~Wp(m,∑)相互獨(dú)立,n>p,m>p則稱:服從威爾克斯分布,記作:Λ~Λp,n,m.
5.1進(jìn)行多元方差分析時(shí),需要導(dǎo)出檢驗(yàn)統(tǒng)計(jì)量,由一元方差分析的檢驗(yàn)統(tǒng)計(jì)量推廣到多元,研究推廣后的統(tǒng)計(jì)量,得出該統(tǒng)計(jì)量服從威爾克斯分布.
5.2威爾克斯分布同F(xiàn)分布一樣要求分子分母是獨(dú)立的,證明方法很多.我們可以構(gòu)建投影陣,利用推廣后的科克朗定理很容易證明E和T是獨(dú)立的.
5.3從多元正態(tài)分布中抽取樣本時(shí),要求樣本容量n大于p,如果n小于p,我們?nèi)绾慰朔@個(gè)問(wèn)題?
〔1〕傅德印,張旭東.EXCFL與多元統(tǒng)計(jì)分析[M].北京:中國(guó)統(tǒng)計(jì)出版社,2007.
〔2〕方開(kāi)泰.實(shí)用多元統(tǒng)計(jì)分析[M].上海:華東師范大學(xué)出版社,1989.
〔3〕茆詩(shī)松,王靜龍,濮曉龍.高等數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社,2006.
O212.1
A
1673-260X(2016)08-0009-02
2016-04-11
赤峰學(xué)院學(xué)報(bào)·自然科學(xué)版2016年15期