指數(shù)分布族的一致最優(yōu)檢驗及樣本容量的確定

2014-10-10 08:35:50趙麗棉黃基廷

河池學(xué)院學(xué)報 2014年2期

趙麗棉，黃基廷

(河池學(xué)院數(shù)學(xué)與統(tǒng)計學(xué)院，廣西宜州 546300)

0 引言

設(shè)X=(X1，…，Xn)是從總體{Fθ(x)，θ∈Θ}中抽取的簡單樣本，其中Θ為參數(shù)空間，檢驗問題為H0∶θ∈Θ0?H1∶θ∈Θ1=Θ－Θ0.我們通過一個統(tǒng)計量在一個子樣中的觀察值來檢驗H0，則當(dāng)觀察到點X屬于拒絕域 W 時，拒絕假設(shè)H0，否則接受H0，稱稱為非隨機化檢驗。在實際問題中，有些檢驗函數(shù)φ(x)除了0，1外還能取(0，1)內(nèi)的值，如設(shè)X=(X1，…，Xn)是從一大批產(chǎn)品中抽得的樣本，記G(X)為其中的次品數(shù)，當(dāng)G(X)＜c時認為這批產(chǎn)品合格;當(dāng)G(X)＞c時認為不合格;而當(dāng)G(X)=c時可以定下(0，1)內(nèi)的一個數(shù)r，作一次成功概率為r的隨機試驗，根據(jù)試驗結(jié)果來決定這批產(chǎn)品是否合格，這種檢驗稱為隨機化檢驗。由于子樣觀察值的出現(xiàn)帶有隨機性，因此判斷會發(fā)生兩種錯誤:第一，假設(shè)H0本來是對的，但由于觀察值落入拒絕域W，錯誤地將H0否定了，這時犯的錯誤稱為第一類錯誤;第二，假設(shè)H0本來是不對的，但由于觀察值落入接受域，錯誤地將H0接受了，這時犯的錯誤稱為第二類錯誤。一個好的檢驗當(dāng)然是使犯兩種錯誤的概率盡可能小，最好全為零，但實際上這是不可能的，通常只能通過限制第一類錯誤的概率使第二類錯誤的概率達到最小。用βφ(θ)=Pθ{用檢驗φ否定了H0}=Eθ[φ(X)](θ∈Θ)表示 φ(x)的功效函數(shù)，則當(dāng) θ∈Θ0時，βφ(θ)是犯第一類錯誤的概率;θ∈Θ1時，1 － βφ(θ)是犯第二類錯誤的概率。我們要做的是在 Eθ[φ(X)]≤α，θ∈Θ0的條件下，使 βφ(θ)，θ∈Θ1達到最大值。這種檢驗稱為水平為α的一致最優(yōu)檢驗(簡稱UMP檢驗)。UMP檢驗不一定存在，但對相當(dāng)廣泛的指數(shù)分布族卻能找出這種檢驗來。為檢驗函數(shù)，這里φ(x)只取0，1兩個值，這種檢驗

1 指數(shù)分布族的UMP檢驗的存在性

定義:設(shè){f(x，θ)∶θ∈Θ}是定義在樣本空間R上的分布族，其中Θ為參數(shù)空間。若其概率密度函數(shù)f(x，θ)可表示成如下形式:

其中，k為自然數(shù)，C(θ)＞0和 Qi(θ)(i=1，2，…，k)都是定義在 Θ 上的函數(shù)，h(x)＞0和 Ti(x)(i=1，2，…，k)都是定義在R上的函數(shù)，則稱此分布族為指數(shù)分布族。

NP基本引理:設(shè)樣本X有概率函數(shù)f(x，θ)，參數(shù)θ只有兩個可能的值θ0和θ1，檢驗問題為:

則存在非負常數(shù)c和0≤r≤1，使得檢驗問題(1)的水平為α的一致最優(yōu)檢驗函數(shù)為:

證明參見文獻[1]。

定理:設(shè)樣本X=(X1，…，Xn)的分布為指數(shù)分布族:

其中c(θ)，Q(θ)為θ的函數(shù)且c(θ)＞0，T(x)和h(x)是樣本x的函數(shù)。參數(shù)空間Θ為R1的子集，θ0為Θ的一個內(nèi)點且Q(θ)為θ的嚴(yán)格增函數(shù)，則檢驗問題:

的水平為α的一致最優(yōu)檢驗存在，且具有形式:

其中 c和 r(0≤r≤1)滿足條件 Eθ0[φ(X)]=α.

證:①先考慮檢驗問題:

易知λ(x)是T(x)的嚴(yán)格增函數(shù)，由引理知檢驗問題(5)的一致最優(yōu)檢驗函數(shù)為(4)式，其中c和r滿足:

由于c和r與θ1無關(guān)，所以(4)式確定的φ(x)也是檢驗問題:

的水平為α的一致最優(yōu)檢驗。

②證由(4)式確定的φ(x)也是檢驗問題(3)的水平為α的檢驗，即證

當(dāng) θ≤θ0時，

對任意的 θ≤θ0，顯然

似然比

是T(x)的嚴(yán)格減函數(shù)。由

其中R為樣本空間知，存在t0使

由(4)式知φ(x)只與T(x)有關(guān)，且是T(x)的非降函數(shù)，故有

2 確定指數(shù)分布族的UMP檢驗的方法步驟

由定理可知UMP檢驗函數(shù)φ(x)主要由r和c確定，所以確定指數(shù)分布族的UMP檢驗的步驟可分為以下幾步:

(1)寫出樣本 X=(X1，…，Xn)的密度:f(x，θ)=c(θ)exp{Q(θ)T(x)}h(x)，并確定統(tǒng)計量 T(X)的分布;

(2)由 Eθ0[φ(X)]=α 即 Pθ0(T(X)＞c)+rPθ0(T(X)=c)=α 確定 r;

(3)由0≤r≤1及T(X)的分布確定c.

注:當(dāng)總體為連續(xù)分布時，由于 Pθ0(T(X)=c)=0，所以直接由 Eθ0[φ(X)]=Pθ0(T(X)＞ c)= α 及統(tǒng)計量T(x)的分布即可確定c.此時

3 常見分布的UMP檢驗

不難看出，統(tǒng)計上常用的正態(tài)分布族、二項分布族、Poisson分布族等都是指數(shù)分布族，它們的一致最優(yōu)檢驗都是存在的。

例1:設(shè)X1，…，Xn是從分布為Fθ的總體中抽取的簡單樣本，其中θ為未知參數(shù)。求檢驗問題H0∶θ≤θ0?H1∶θ＞θ0)的水平為α的UMP檢驗函數(shù)φ(x)，其中θ0，α給定。下面幾種常見分布均滿足定理條件，故它們的UMP檢驗函數(shù)φ(x)為(4)或(6)式。

1° 當(dāng) Fθ～N(θ，σ2)，σ2已知時

其中

從而

得

其中Φ(u1－α)=1－α，Φ為標(biāo)準(zhǔn)正態(tài)分布函數(shù)。UMP檢驗函數(shù)φ(x)為(6)式。

2° 當(dāng) Fθ～N(a，θ2)，a已知，θ＞0 時

得 c= θ20χ2n(α)，一致最優(yōu)檢驗函數(shù) φ(x)為 (6)式。3° 當(dāng) Fθ為指數(shù)分布 θ－1e－x/θ，θ＞0 時

因此f(y)是自由度為2的χ2密度，即分布。再利用分布的可加性知，

UMP檢驗函數(shù)φ(x)為 (6)式。

所以c由下列不等式確定:

UMP檢驗函數(shù)φ(x)為 (4)式。

所以c由下列不等式確定:

UMP檢驗函數(shù)φ(x)為 (4)式。

4 樣本容量的確定

前面討論的問題，都是根據(jù)樣本容量及第一類錯誤的概率(即顯著水平)，確定一致最優(yōu)檢驗使其犯第二類錯誤的概率到最小。在實際應(yīng)用中，有時會提出檢驗問題(1)，且給出第一、第二類錯誤的概率α、β，要確定樣本容量并找出UMP檢驗。要解決這類問題，可先按前面方法確定最優(yōu)檢驗函數(shù)φ(x)，再由第一、第二類錯誤的概率的定義，聯(lián)立關(guān)于α、β方程組，從中求出樣本容量及c。下面只舉一例說明解決這類問題的具體方法。

例2:設(shè)總體服從正態(tài)分布N(θ，σ2)，其中θ為未知參數(shù)，σ2為已知。要在第一、第二類錯誤的概率分別為 α、β 條件下用 UMP 檢驗問題 H0∶θ=θ0?H1∶θ=θ1(θ1＞θ0)，樣本容量 n必須多大?

解:由例1知此問題的UMP檢驗函數(shù)為:

其中當(dāng)H0為真時);當(dāng) H1為真時

依題意得:

[1]韋來生.數(shù)理統(tǒng)計[M].北京:科學(xué)出版社，2008.

[2](波蘭)M.費史.概率論及數(shù)理統(tǒng)計[M].上海:上海科學(xué)技術(shù)出版社，1978.

[3]復(fù)旦大學(xué).概率論(第二冊)數(shù)理統(tǒng)計(第二分冊)[M].北京:人民教育出版社，1983.

[4]陳希孺.高等數(shù)理統(tǒng)計學(xué)[M].合肥:中國科學(xué)技術(shù)大學(xué)出版社，2009.