董陽(yáng)武,葛永慧
(1.山西煤炭職業(yè)技術(shù)學(xué)院地測(cè)系,山西太原030031;2.太原理工大學(xué)礦業(yè)工程學(xué)院,山西太原030024)
在廣義高斯分布(GGD)總體參數(shù)估計(jì)中,首要問題是選取多大規(guī)模的樣本。樣本容量太小,會(huì)使估計(jì)不夠精確;樣本容量太大,又會(huì)造成估算效率低下及人力物力的浪費(fèi)。文獻(xiàn)[1-3]對(duì)參數(shù)估計(jì)時(shí)分別選取樣本容量 N=2000、N=4096和 N=65 536,這些樣本容量的選取是否科學(xué)合理,廣義高斯分布參數(shù)估計(jì)精度與樣本容量的關(guān)系如何,目前尚未見對(duì)此問題的論述。
本文從廣義高斯分布參數(shù)估計(jì)精度要求出發(fā),采用矩估計(jì)法估算其參數(shù),通過仿真試驗(yàn)得到了廣義高斯分布形狀參數(shù)和尺度參數(shù)估計(jì)精度與樣本容量的定量關(guān)系,并給出了參數(shù)估計(jì)中樣本容量的確定方法,其在實(shí)際參數(shù)估算時(shí)極具實(shí)用性。
廣義高斯分布概率密度函數(shù)(probability density function,PDF)可表示為[4-5]
形狀參數(shù)估計(jì)方法有多種[6],但最常用的方法是極大似然法和矩估計(jì)法。極大似然法估計(jì)計(jì)算復(fù)雜,計(jì)算量大[7];而矩估計(jì)法被認(rèn)為是實(shí)踐中最高效快速實(shí)用的方法。因此,本文選用矩估計(jì)法對(duì)形狀參數(shù)估計(jì)問題討論。
由矩估計(jì)法可得[1]
理論上,式(2)通過迭代計(jì)算可解出參數(shù)p,且m1、m2取值與被估參數(shù)p大約相等時(shí)矩估計(jì)結(jié)果收斂于極大似然估計(jì)結(jié)果,估計(jì)精度高、效果好[1]。本文基于此理論估算參數(shù)p,使結(jié)果具有最優(yōu)收斂性,但其參數(shù)估計(jì)精度與樣本容量關(guān)系如何,在實(shí)際估算中,應(yīng)如何選取樣本容量方可達(dá)到所需要的估算精度和估計(jì)效果,本文將通過仿真試驗(yàn)對(duì)這些問題討論。
要得到樣本概率密度函數(shù),除了要確定形狀參數(shù)外,還需要計(jì)算尺度參數(shù)(標(biāo)準(zhǔn)差)。樣本標(biāo)準(zhǔn)差計(jì)算公式為
式中,{x1,x2,…,xN}為來(lái)自均值 μ=0的 GGD 總體X樣本。
仿真試驗(yàn)要得到形狀參數(shù)估計(jì)精度與樣本容量之間的關(guān)系,首先使樣本容量N取不同值(N≤60 000),對(duì)于每一個(gè)樣本容量N、形狀參數(shù)p和標(biāo)準(zhǔn)差σ,樣本發(fā)生器產(chǎn)生GGD樣本,用式(2)對(duì)參數(shù)p估算M=1000次,計(jì)算這M=1000個(gè)估算值的標(biāo)準(zhǔn)差和相對(duì)誤差。標(biāo)準(zhǔn)差和相對(duì)誤差計(jì)算公式分別為
這樣在仿真試驗(yàn)中就可得到每一個(gè)樣本容量N能達(dá)到的形狀參數(shù)估計(jì)精度rp。在仿真試驗(yàn)中形狀參數(shù) p 取0.5、1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0 等不同數(shù)值,當(dāng)估計(jì)精度rp達(dá)到10%、5%、2.5%以下時(shí)可得到表1中形狀參數(shù)估計(jì)精度與樣本容量的定量關(guān)系,關(guān)系圖如圖1~圖3所示。
表1 形狀參數(shù)估值與樣本容量關(guān)系
圖1 形狀參數(shù)估值與樣本容量關(guān)系(rp=10%)
圖2 形狀參數(shù)估值與樣本容量關(guān)系(rp=5%)
圖3 形狀參數(shù)估值與樣本容量關(guān)系(rp=2.5%)
仿真試驗(yàn)要得到尺度參數(shù)估計(jì)精度與樣本容量之間的關(guān)系,首先使樣本容量N取不同值(N≤60 000)。對(duì)于每一個(gè)樣本容量N,樣本發(fā)生器產(chǎn)生GGD樣本,用式(3)對(duì)標(biāo)準(zhǔn)差σ估算M1=1000次,得到這M1=1000個(gè)估算值的平均值、標(biāo)準(zhǔn)差和相對(duì)誤差,這樣的估算過程重復(fù)M2=10次,則可得到每次算得的相對(duì)誤差平均值。樣本標(biāo)準(zhǔn)差平均值、標(biāo)準(zhǔn)差、相對(duì)誤差和相對(duì)誤差平均值計(jì)算公式分別為
這樣在仿真試驗(yàn)中就可得到每一個(gè)樣本容量N能達(dá)到的尺度參數(shù)估計(jì)精度rσ。仿真試驗(yàn)中形狀參數(shù) p 取0.5、1.0、1.5、2.0、2.5、3.0、3.5、4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0 等不同數(shù)值,尺度參數(shù) σ 取 1.0,當(dāng)估計(jì)精度 rσ達(dá)到10%、5%、2.5%以下時(shí)可得到表2中尺度參數(shù)估計(jì)精度與樣本容量的定量關(guān)系,關(guān)系圖如圖4~圖6所示。
表2 尺度參數(shù)估值與樣本容量關(guān)系表
從圖1~圖3可得到10%、5%、2.5%精度約束下每個(gè)形狀參數(shù)估計(jì)精度與樣本容量的定量關(guān)系。矩估計(jì)法對(duì)形狀參數(shù)的估計(jì)最具代表性和典型性,因此對(duì)形狀參數(shù)估算所有方法的定量關(guān)系具有普遍參考價(jià)值,這樣在形狀參數(shù)估計(jì)選取樣本容量時(shí)就建立了一個(gè)參考標(biāo)準(zhǔn),應(yīng)參考圖1~圖3中的定量關(guān)系選擇合理的樣本容量,否則樣本容量太大會(huì)造成估算效率低下、資源浪費(fèi)等缺點(diǎn),樣本容量太小會(huì)使估算精度過低。
從圖4~圖6得到形狀參數(shù)取不同值時(shí)尺度參數(shù)估計(jì)精度與樣本容量間的定量關(guān)系。這樣在尺度參數(shù)估計(jì)選取樣本容量時(shí)也建立了一個(gè)參考標(biāo)準(zhǔn),從圖4~圖6知,當(dāng)p取不同值時(shí)σ估計(jì)收斂性不同,p越大,收斂性越好,因此σ估計(jì)收斂性與p有關(guān),建議用式(3)估算σ時(shí)首先確定p,根據(jù)p值參考圖4~圖6判斷估計(jì)收斂性,選擇合理的樣本容量估算σ,否則盲目選取樣本容量會(huì)造成計(jì)算效率低、精度差、資源浪費(fèi)。
圖4 尺度參數(shù)估值與樣本容量關(guān)系(rσ=10%)
圖5 尺度參數(shù)估值與樣本容量關(guān)系(rσ=5%)
圖6 尺度參數(shù)估值與樣本容量關(guān)系(rσ=2.5%)
[1]KRUPIN'SKI R,PURCZYN'SKI J.Approximated Fast Estimator for the Shape Parameter of Generalized Gaussian Distribution[J].Signal Processing,2006,86(2):205-211.
[2]KRUPIN'SKI R,PURCZYN'SKI J.Modeling the Distribution of DCT Coefficients for JPEG Reconstruction[J].Signal Processing:Image Communication,2007,22(5):439-447.
[3]PI M.Improve Maximum Likelihood Estimation for Subband GGD Parameters[J].Pattern Recognition Letters,2006(27):1710-1713.
[4]DERRODE S,MERCIER G.Unsupervised Multiscale Oil Slick Segmentation from SAR Images Using a Vector HMC Model[J].Pattern Recognition,2007(40):1135-1147.
[5]CAI J,CHEN CW.Joint Source-channel Coding of GGD Sources with Allpass Filtering Source Reshaping[J].Journal of Visual Communication and Image Representation,2005,16(1):19-37.
[6]KOKKINAKISK,NANDI A K.Exponent Parameter Estimation for Generalized Gaussian Probability Density Functions with Application to Speech Modeling[J].Signal Processing,2005,85(9):1852-1858.
[7]AIAZZI B,BARONTI S,SANTURRI L,et al.Information-theoretic Assessment of Multi-dimensional Signals[J].Signal Processing,2005,85(5):903-916.