劉小寧
(溫州大學數(shù)學與信息科學學院,浙江溫州 325035)
基于ECM算法的混合改進威布爾分布的參數(shù)估計
劉小寧
(溫州大學數(shù)學與信息科學學院,浙江溫州 325035)
混合改進威布爾分布是壽命數(shù)據(jù)分析中重要的統(tǒng)計模型,但是利用矩估計、極大似然估計等傳統(tǒng)的統(tǒng)計方法來估計模型的參數(shù)比較困難.應用結合牛頓迭代法的 ECM 算法研究了混合改進威布爾分布在正常工作條件下的完全數(shù)據(jù)場合、截尾數(shù)據(jù)場合的參數(shù)估計問題,并得出了相應數(shù)據(jù)場合下各參數(shù)的極大似然估計.
混合改進威布爾分布;ECM算法;牛頓迭代法;完全數(shù)據(jù);截尾數(shù)據(jù)
壽命數(shù)據(jù)分析已經(jīng)成為工業(yè)、生命科學等多個領域研究的熱點問題.在壽命可靠性分析中,經(jīng)常會用到威布爾分布,一般形式為二參數(shù)威布爾分布,因其簡單易解且具有優(yōu)良的統(tǒng)計性質(zhì)而被廣泛使用.然而對于具有以損耗失效為特征的某些機械零部件,與二參數(shù)威布爾分布相比,采用三參數(shù)威布爾分布進行擬合和參數(shù)估計,可以得到更高的精度,更能反映產(chǎn)品可靠性的實際情況,也更具合理性.改進威布爾分布[1](the New Modified Weibull Distribution)是一項有浴缸形故障率函數(shù)的新的壽命分布,被認為是另一有用的三參數(shù)威布爾分布的一般形式.對于單個總體壽命數(shù)據(jù)的分析,其統(tǒng)計方法已經(jīng)非常成熟,但是在實際應用時經(jīng)常會遇到混合分布的情況.大量事實表明,混合改進威布爾分布作為具有一個以上失效模式的單元的壽命分布模型是合適的,但是由于缺少混合改進威布爾分布的統(tǒng)計分析方法,這種模型沒有得到廣泛應用.目前國內(nèi)外研究多是對三參數(shù)威布爾分布進行參數(shù)估計,往往是單個總體,如嚴曉東等[2]選擇常用的5種三參數(shù)威布爾分布參數(shù)估計法進行比較研究,湯銀才等[3]給出了三參數(shù)威布爾分布參數(shù)的貝葉斯估計.對于混合威布爾分布的參數(shù)估計研究,多數(shù)討論的是混合二參數(shù)威布爾分布,如蔣卉等[4]利用ECM(Expectation Constraint Maximization)算法對混合二參數(shù)威布爾分布進行參數(shù)估計,取得了較好的成果.對于混合三參數(shù)威布爾分布的參數(shù)估計研究較少,張錫清[5]采用混合三參數(shù)威布爾分布來描述齒輪的可靠性,用極大似然法估計分布參數(shù),并通過最優(yōu)化方法求極大似然值,取得了正確結果.
基于ECM算法在多參數(shù)估計方面的優(yōu)越性和混合改進威布爾分布的實用性,本文構造混合改進威布爾分布,利用ECM算法,在完全數(shù)據(jù)場合和截尾數(shù)據(jù)場合下,對參數(shù)進行估計.為了研究方便,本文僅考慮兩個改進威布爾分布混合的情形.下面記NMWD(the New Modified Weibull Distribution)為新改進的威布爾分布.
1.1 ECM算法
EM(Expectation Maximization)算法是近幾年發(fā)展很快且應用很廣的一種估計參數(shù)的方法,它是一種迭代方法,由Dempster等[6]提出,這種方法簡化了極大似然估計的計算.當極大化無顯式表示時,給出了廣義EM算法,即GEM(General Expectation Maximization)算法.Meng等[7]提出了一種特殊的GEM算法,稱之為ECM算法,該算法保留了EM算法的簡單性和穩(wěn)定性.
EM算法主要用來解決不完全數(shù)據(jù)情況下對未知參數(shù)進行極大似然估計的問題.假設Y是觀測數(shù)據(jù),Z是潛在數(shù)據(jù),θ是未知參數(shù),以表示θ的基于觀測數(shù)據(jù)Y的后驗分布密度函數(shù).表示添加數(shù)據(jù)Z后得到的關于θ的后驗分布密度函數(shù),表示在給定θ和觀測數(shù)據(jù)Y下潛在數(shù)據(jù)Z的條件分布密度函數(shù).我們計算的目的是觀測后驗分布的眾數(shù).于是,EM算法可以如下進行,記θ(m)為第m+1次迭代開始時后驗眾數(shù)的估計值,則第m+1次迭代的兩步為:
1.2 牛頓迭代法
牛頓迭代法又稱為牛頓-拉夫遜方法,它是牛頓在17世紀提出的一種在實數(shù)域和復數(shù)域上近似求解方程的算法.我們知道大量非線性方程不存在顯示解,求精確根非常困難,甚至不可能,而牛頓迭代法是解非線性方程最著名和最有效的方法之一.所謂牛頓迭代法,其基本思想是將非線性方程轉(zhuǎn)化為線性方程來求解.
設f(x)為一個連續(xù)可微的分布函數(shù),f(x)在點x0的某領域內(nèi)展開成泰勒級數(shù).的情況下,取其線性部分,并令其等于0,即,以此作為非線性方程的近似方程.若,則其解為,這樣,得到牛頓迭代法的一個迭代關系式
混合分布的參數(shù)估計用常規(guī)方法很難得到其極大似然估計,而用ECM算法可以很好地解決這一難題.下面我們用ECM算法來求混合改進威布爾分布在完全數(shù)據(jù)場合的參數(shù)估計.
由于我們不知道Xi是來自 f1i還是來自 f2i的改進威布爾總體,因而Ii是不能被觀測到的隨機變量.Xi和Ii的聯(lián)合分布為
從而在Xi給定下,Ii的條件分布為:
文中k=7,每一步條件極大化可按下面的方法求得.
3.1 定數(shù)截尾情形
如果觀測到有r個產(chǎn)品失效則停止試驗,觀測時間為xr,則有(n-r)個產(chǎn)品未失效.記:
其中Sj ,j=1,2表示(n-r)個未失效產(chǎn)品的生存函數(shù).對于沒有截尾的樣品, Xi和的聯(lián)合分布為.在給定條件下,Ii的條件分布:
1)E步:求期望(m=1,2,...).
3.2 定時截尾情形
如果壽命試驗進行到時刻τ為止,有r個產(chǎn)品失效,則有(n-r)個產(chǎn)品未失效.記:
給定初始值(0)θ 的ECM算法的步驟為:
混合改進威布爾分布是壽命數(shù)據(jù)分析中一個重要的統(tǒng)計模型,但是利用傳統(tǒng)的統(tǒng)計方法如矩估計、極大似然估計等來估計模型參數(shù)是比較困難的.在混合 NMWD分布中,待估參數(shù)為,本文在利用ECM算法對混合NMWD分布進行參數(shù)估計時,只能得到p,a1,a2的顯示解,而無顯示解,文中用牛頓迭代法得到的近似解.本文為混合NMWD分布的參數(shù)估計提供了一種有效方法,不過還存在一些地方需要探討,比如文中為了讓算法介紹的清晰性和簡潔性,只討論了兩個分布的混合,而兩個總體的樣本區(qū)分度在小樣本場合或數(shù)據(jù)缺失較多的情況下,該方法參數(shù)估計的效率較低.牛頓迭代法具有二階收斂速度,且方法簡單,不過其初始值的選取比較苛刻,由此可嘗試用其他迭代方法(如Chebyshev迭代算法[11])對混合NMWD分布進行參數(shù)估計.
參考文獻
[1] Lai C D,Xie M,Murthy D N P. A modified weibull distribution [J]. Ieee Transactions on Reliability,2003,52(1): 33-37.
[2] 嚴曉東,馬翔,鄭榮躍,等.三參數(shù)威布爾分布參數(shù)估計方法的比較[J].寧波大學學報(理工版),2005,18(3):301-305.
[3] 湯銀才,侯道燕.三參數(shù)Weibull分布參數(shù)的Bayes估計[J].系統(tǒng)科學與數(shù)學,2009,29(1):109-115.
[4] 蔣卉,湯銀才.混合Weibull分布參數(shù)估計的ECM算法[J].系統(tǒng)科學與數(shù)學,2010,30(1):79-88.
[5] 張錫清.混合三參數(shù)威布爾分布的參數(shù)估計[J].哈爾濱電工學院學報,1996,19(1):1-7.
[6] Dempster A P,Laird N,Rubin D B. Maximan likelihood estimation from incomplete data via the EM algorithm (with discussion) [J]. J Roy Statist Soc B,1977,39: 1-38.
[7] Meng X L,Rubin D B. Maximum likelihood estimation via the ECM algorithm [J]. A General Framework Biometrika,1993,80(2): 267-278.
[8] 茆詩松,王靜龍,濮曉龍.高等數(shù)理統(tǒng)計[M].2版.北京:高等教育出版社,2006:427-439.
[9] 康兆敏,方秀男.數(shù)值計算方法[M].2版.北京:清華大學出版社,2013:32-42.
[10] 茆詩松,湯銀才,王玲玲.可靠性統(tǒng)計[M].北京:高等教育出版社,2008:97-108.
[11] 李光輝,張洪,葉緒國.混合Weibull分布參數(shù)估計的MCEM算法[J].重慶師范大學學報(自然科學版),2015,32(2):123-132.
Parameter Estimation of the Mixture Newly-Modified Weibull Distribution Based on ECM Algorithm
LIU Xiaoning
(College of Mathematics and Information Science,Wenzhou University,Wenzhou,China 325035)
The paper probes into the mixture newly modified Weibull distribution which is an important statistical model in life data analysis. However,it is quite different to estimate the parameters of the model by means of traditional statistical methods such as the moment estimation,the maximum likelihood estimation (MLE). The application of the ECM algorithm combined with Newton iterative method to study the complete sample data occasion with the mixture newly modified Weibull model under the normal operating conditions,the parameter estimation problem of censored data occasion. The maximum likelihood estimation (MLE) of all parameters under the relevant data occasion is thereby obtained.
The Mixture Newly-modified Weibull Distribution; ECM Algorithm; Newton Iterative Method; Complete Sample Data; Censored Sample Data
O213.2
:A
:1674-3563(2017)01-0001-11
10.3875/j.issn.1674-3563.2017.01.001 本文的PDF文件可以從xuebao.wzu.edu.cn獲得
(編輯:封毅)
2015-09-30
國家自然科學基金項目(11201345);溫州大學研究生創(chuàng)新基金(3162015028)
劉小寧(1991- ),女,河北邯鄲人,碩士研究生,研究方向:應用統(tǒng)計與數(shù)理金融