賈俊霞,劉 淼
(伊犁師范大學(xué) 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,新疆 伊寧 835000)
在解決一個(gè)具體問題時(shí),往往需要對樣本進(jìn)行“加工”和“提煉”,針對不同的問題構(gòu)造出樣本的某種函數(shù),為此,引進(jìn)統(tǒng)計(jì)量的概念[1].由于樣本中所包含的關(guān)于總體分布的信息可分為兩部分:一部分是關(guān)于總體的結(jié)構(gòu)信息;另一部分是關(guān)于總體的未知參數(shù)信息.在用統(tǒng)計(jì)量代替樣本作統(tǒng)計(jì)推斷時(shí),樣本中所含的信息可能有所損失,為了便于推斷總體的未知參數(shù)信息且保證能將樣本中的未知參數(shù)信息全部提煉出來,需要一個(gè)“不損失信息”的統(tǒng)計(jì)量,充分統(tǒng)計(jì)量由此誕生,它是英國著名統(tǒng)計(jì)學(xué)家費(fèi)希爾(R.A.Fisher)在1922年提出,并在后續(xù)MIMO雷達(dá)檢測性能[2]、假設(shè)檢驗(yàn)、最小方差無偏估計(jì)、最大似然估計(jì)、區(qū)間估計(jì)[3]等方面研究中起到了重要的作用.此外,把愈“精”愈“好”的充分統(tǒng)計(jì)量稱之為最小充分統(tǒng)計(jì)量[4].
基于此,本文將運(yùn)用因子分解定理和條件分布的理論知識,通過推理得到證明充分統(tǒng)計(jì)量更加便捷的方法[5],并對最小充分統(tǒng)計(jì)量的相關(guān)結(jié)果加以補(bǔ)充.
定義1設(shè)(X1,X2,X3,…,Xn)為總體X的一個(gè)樣本,若f(X1,X2,X3,…,Xn)為一個(gè)函數(shù),且在f中不含任何有關(guān)總體分布的未知參數(shù),則稱f(X1,X2,X3,…,Xn)為一個(gè)統(tǒng)計(jì)量[1].
定義2[1]設(shè)(X1,X2,X3,…,Xn)是來自總體X具有分布函數(shù)F(x,θ)的一個(gè)樣本,T=T(X1,X2,X3,…,Xn)為一個(gè)(一維或多維)統(tǒng)計(jì)量,當(dāng)給定T=t時(shí),若樣本(X1,X2,X3,…,Xn)的條件分布(離散總體為條件概率,連續(xù)總體為條件密度)與參數(shù)θ無關(guān),則稱T是θ的充分統(tǒng)計(jì)量.
引理1(因子分解定理)[1]設(shè)連續(xù)型隨機(jī)變量X,總體的分布密度為f(x,θ),(X1,X2,X3,…,Xn)是樣本,T(X1,X2,X3,…,Xn)是一個(gè)統(tǒng)計(jì)量,則T為θ的充分統(tǒng)計(jì)量的充要條件是:樣本函數(shù)的聯(lián)合分布密度函數(shù)可以分解為
h(x1,x2,…,xn)g(T(x1,x2,…,xn),θ),
其中:h是(x1,x2,x3,…,xn)的非負(fù)函數(shù)且與θ無關(guān);g僅通過T依賴于(x1,x2,x3,…,xn).
離散型隨機(jī)變量的因子分解法情況類似[7].
引理2(最小充分統(tǒng)計(jì)量的存在定理)假定分解定理中的條件成立,且樣本空間為歐氏的,則最小充分統(tǒng)計(jì)量必存在[6].
定理1對于離散型隨機(jī)變量X,若X的分布律為
P{X=x(i)}=p(xi,θ)(i=1,2,…),
(X1,X2,X3,…,Xn)是一樣本,T(X1,X2,X3,…,Xn)是一個(gè)統(tǒng)計(jì)量,對于任意的未知參數(shù)θ和任意的一組樣本觀測值,當(dāng)
(x1,x2,…,xn)∈T′(t)=
{(x1,x2,…,xn)|T(x1,x2,…,xn)=t}
時(shí),有
P{X1=x1,X2=x2,…,Xn=xn,T=t,θ}=
P{X1=x1,X2=x2,…,Xn=xn,θ}.
證明若
T′(t)=
{(x1,x2,…,xn)|T(x1,x2,…,xn)=t},
有一組觀測值(x1,x2,…,xn)∈T′(t),則有
T′(t)=
{T=t}?{X1=x1,X2=x2,…,Xn=xn}.
于是
{X1=x1,X2=x2,…,Xn=xn,T=t}=
{X1=x1,X2=x2,…,Xn=xn}∩{T=t}=
{X1=x1,X2=x2,…,Xn=xn},
所以
P{X1=x1,X2=x2,…,Xn=xn,T=t,θ}=
P{X1=x1,X2=x2,…,Xn=xn,θ}.
定理2對于連續(xù)型隨機(jī)變量X,設(shè)總體X分布密度為f(x,θ),(X1,X2,X3,…,Xn)是樣本,T(X1,X2,X3,…,Xn)是一個(gè)統(tǒng)計(jì)量,對于任意的未知參數(shù)θ和任意的一組樣本觀測值,當(dāng)
(x1,x2,…,xn)∈T′(t)=
{(x1,x2,…,xn)|T(x1,x2,…,xn)=t}
時(shí),有
f(x1,x2,…,xn,θ|T=t)=
證明若
T′(t)=
{(x1,x2,…,xn)|T(x1,x2,…,xn)=t},
有一組觀測值(x1,x2,…,xn)∈T′(t),則有
T′(t)={T=t}?{x1,x2,…,xn}.
于是
{x1,x2,…,xn,T=t}=
{x1,x2,…,xn}∩{T=t}={x1,x2,…,xn},
所以
f(x1,x2,…,xn,θ|T=t)=
證明由于X的概率密度函數(shù)為
則(X1,X2,X3,…,Xn)的聯(lián)合分布密度為
L(x1,x2,x3,…,xn,θ)=
h(x1,x2,…,xn)g(T(x1,x2,…,xn),θ),
證明(X1,X2,X3,…,Xn)的條件概率為
P{X1=x1,X2=x2,…,Xn=xn,
T=t,p|T=t}=
例3設(shè)(X1,X2,X3,…,Xn)是來自正態(tài)總體N(θ,1)的一個(gè)樣本,則
是未知參數(shù)θ的充分統(tǒng)計(jì)量.
證明(X1,X2,X3,…,Xn)的條件密度為
f(x1,x2,…,xn,θ|T=t)=
定理3設(shè)T=T(X1,X2,X3,…,Xn)是θ的一個(gè)充分統(tǒng)計(jì)量,s(t)是單值可逆函數(shù),則s(T)也是θ的充分統(tǒng)計(jì)量.
證明下面以連續(xù)型隨機(jī)變量為例進(jìn)行證明,對于離散型隨機(jī)變量的結(jié)果用類似方法可得.
h(x1,x2,…,xn)g(T(x1,x2,…,xn),θ)=
h(x1,x2,…,xn)g(s-1(s(T(x1,x2,…,xn))),θ)=
h(x1,x2,…,xn)q(s(x1,x2,…,xn),θ).
由因子分解定理可知,s(x1,x2,…,xn)是θ的充分統(tǒng)計(jì)量.由此可知一個(gè)總體的參數(shù)θ的充分統(tǒng)計(jì)量不唯一.
定理4設(shè)X為總體分布為f(x,θ)的隨機(jī)變量,(X1,X2,X3,…,Xn)為一樣本,T(X1,X2,X3,…,Xn)為一個(gè)統(tǒng)計(jì)量,若
(1)L(x1,x2,…,xn,θ)=
g(T(x1,x2,…,xn),θ);
(2)對一切θ∈Θ,T(x)=T(y),當(dāng)且僅當(dāng)fx(θ)=fy(θ),且T(x)往往直接表示為x的函數(shù),則T(x)是最小充分統(tǒng)計(jì)量.
證明(X1,X2,X3,…,Xn)的聯(lián)合分布密度為
L(x1,x2,…,xn,θ)=
g(T(x1,x2,…,xn),θ).
(Y1,Y2,Y3,…,Yn)的聯(lián)合分布密度為
h(y1,y2,…,yn)g(T(y1,y2,…,yn),θ).
由于g僅通過T分別依賴于(x1,x2,…,xn)與(y1,y2,…,yn),對一切θ∈Θ,若T(x)=T(y),可得g(T(x1,x2,…,xn),θ)=g(T(y1,y2,…,yn),θ),h是非負(fù)函數(shù)且與θ無關(guān),由此可知fx(θ)=fy(θ);若fx(θ)=fy(θ),則T(x)=T(y)顯然成立,故T(x)是最小充分統(tǒng)計(jì)量.
例4設(shè)(X1,X2,X3,…,Xn)是來自正態(tài)總體N(μ,σ2)的一個(gè)樣本,參數(shù)為θ=(μ,σ2),對βn上的L測度μ,T(x)是一個(gè)最小充分統(tǒng)計(jì)量.
證明由于X的概率密度函數(shù)為
則(X1,X2,X3,…,Xn)的聯(lián)合分布密度為
易見,對一切θ∈Θ,若fx(θ)=fy(θ),當(dāng)且僅當(dāng)T(x)=T(y),故T(x)是一個(gè)最小充分統(tǒng)計(jì)量.