謝小義 曹虹 李堅(jiān) 樊小琳
【摘 要】本文討論了基于Linex損失函數(shù)的正態(tài)分布模型位置參數(shù)的多層貝葉斯估計(jì)以及其先驗(yàn)分布的比較問題。在位置參數(shù)取共軛先驗(yàn)分布以及超參數(shù)選用無信息先驗(yàn)分布的情形下,推導(dǎo)出正態(tài)模型位置參數(shù)的多層貝葉斯估計(jì)表達(dá)式;對于單層貝葉斯估計(jì)而言,通過比較發(fā)現(xiàn)正態(tài)模型的位置參數(shù)的無信息先驗(yàn)分布要優(yōu)于共軛先驗(yàn)分布。
【關(guān)鍵詞】Linex損失函數(shù);正態(tài)模型;多層貝葉斯估計(jì);后驗(yàn)期望損失決策
貝葉斯(Bayes)學(xué)派是統(tǒng)計(jì)學(xué)的兩大學(xué)派之一,其和經(jīng)典統(tǒng)計(jì)學(xué)派的差異主要在于它們認(rèn)為在統(tǒng)計(jì)推斷中不應(yīng)將總體參數(shù)看作一個(gè)常數(shù),而應(yīng)看作一個(gè)隨機(jī)變量。對于總體分布參數(shù)的統(tǒng)計(jì)推斷,除了要使用樣本所提供的信息外,還必須規(guī)定一個(gè)先驗(yàn)分布,即應(yīng)用貝葉斯方法進(jìn)行統(tǒng)計(jì)推斷時(shí)要先給出參數(shù)的先驗(yàn)分布,基于貝葉斯定理推導(dǎo)出后驗(yàn)分布,再利用獲得的后驗(yàn)分布進(jìn)行統(tǒng)計(jì)推斷?;凇敖y(tǒng)計(jì)推斷需考慮先驗(yàn)信息”這一思想的貝葉斯估計(jì)問題也變成為了貝葉斯學(xué)中的熱點(diǎn)研究問題。正態(tài)分布是概率統(tǒng)計(jì)里面最重要的分布之一,在生活中就存在許多服從正態(tài)分布的數(shù)據(jù)。根據(jù)大數(shù)定理和中心極限定理,當(dāng)研究對象的數(shù)據(jù)足夠多時(shí),其分布服從正態(tài)分布,可見正態(tài)分布的應(yīng)用領(lǐng)域十分廣泛。但以往對正態(tài)模型的研究多數(shù)集中在平方損失函數(shù)下,而在平方損失函數(shù)下往往不能有效地分辨過高估計(jì)結(jié)果和過低估計(jì)結(jié)果。相反,Linex損失函數(shù)是一種非對稱損失函數(shù),在估計(jì)過程中可以避免這一缺陷的出現(xiàn),這一性質(zhì)致使Linex損失函數(shù)常被用于壽險(xiǎn)檢驗(yàn)和可靠性分析的問題研究中,也是它常被用來預(yù)測股票價(jià)格的原因之一。
Linex損失函數(shù)的基本形式如下:
L(θ,δ)=b[ea (δ-θ)-a(δ-θ)-1] a≠0,b>0
這里的a、b分別是Linex損失函數(shù)的尺度參數(shù)和形狀參數(shù)。相比于對稱損失函數(shù)(如平方損失函數(shù)),Linex損失函數(shù)有如下優(yōu)點(diǎn):
(1)當(dāng)a>0時(shí),若δ-θ>0,則函數(shù)值呈指數(shù)增長;若δ-θ<0,則函數(shù)值呈線性增長。a<0時(shí)函數(shù)增長形式正好相反。
(2)當(dāng)絕對值δ-θ很小時(shí),該函數(shù)幾乎是對稱的,且接近平方損失函數(shù)。
本文僅討論尺度參數(shù)a>0的情形,對于a<0的情形可做類似的討論。為研究方便,設(shè)定隨機(jī)變量X服從均值為θ,方差為1的正態(tài)分布,即X~N(θ,1)。則隨機(jī)變量X的概率密度函數(shù)為P(X)=exp((x-θ)2/2)/。另外,記x1,x2,…,xn為隨機(jī)變量X的n個(gè)獨(dú)立的樣本觀測值,表示樣本均值。
引理1:在Linex損失函數(shù)下,對于任何先驗(yàn)分布,參數(shù)θ的貝葉斯估計(jì)的表達(dá)式為:
θB=-ln E(e-aθX)
對于貝葉斯估計(jì)問題,由上述可知應(yīng)用貝葉斯方法進(jìn)行統(tǒng)計(jì)推斷的關(guān)鍵和核心在于選擇合適的先驗(yàn)分布。只有確定了先驗(yàn)分布,才能對模型進(jìn)行討論。對于模型參數(shù)的先驗(yàn)分布的選取存在很多研究,概括起來有應(yīng)用無信息先驗(yàn)分布、共軛先驗(yàn)分布、Jeffreys準(zhǔn)則、不變測度、最大熵方法、專家經(jīng)驗(yàn)法、自助法和多層先驗(yàn)分步法等方法,其中最常用和方便的是共軛先驗(yàn)分布和無信息先驗(yàn)分布。對于多層先驗(yàn)分布法,也是采用以上幾種方法對每層先驗(yàn)分布進(jìn)行選擇??紤]到當(dāng)正態(tài)模型的方差固定時(shí),總體的均值的共軛先驗(yàn)分布仍為正態(tài)分布。結(jié)合多層貝葉斯估計(jì)理論,本文對于正態(tài)總體的位置參數(shù)θ的先驗(yàn)分布(第一層先驗(yàn)分布)采用其共軛先驗(yàn)分布的形式,記作θ~N(μ1,σ2 1),其中μ1和σ2 1未知。由于μ1和σ2 1未知,即使得到位置參數(shù)θ的后驗(yàn)分布也無法對位置參數(shù)θ進(jìn)行統(tǒng)計(jì)推斷。若此時(shí)再將μ1和σ2 1看作隨機(jī)變量,則它們稱為超參數(shù)。根據(jù)多層貝葉斯估計(jì)理論可知,對于超參數(shù)μ1和σ2 1,把它們視作相互獨(dú)立的隨機(jī)變量,也對它們設(shè)定先驗(yàn)分布(第二層先驗(yàn)分布),即為估計(jì)位置參數(shù)θ而再次設(shè)定先驗(yàn)分布。根據(jù)已有的研究可知,對于第二層先驗(yàn)分布而言,即使它們的先驗(yàn)分布決定錯(cuò)了,最終導(dǎo)致錯(cuò)誤結(jié)果的危險(xiǎn)性也不會(huì)太大,故選用μ1和σ2 1的無信息先驗(yàn)分布作為整個(gè)估計(jì)過程中的第二層先驗(yàn)分布是可行的。
另外,在實(shí)際生活和工作當(dāng)中,人們經(jīng)常需要做決策。做決策需要信息,信息越充分和準(zhǔn)確,決策的效果就會(huì)越好。決策的目的往往是收益最大化或損失最小化,基于Linex損失函數(shù)的貝葉斯決策問題,普遍是以后驗(yàn)期望損失最小化為最終目的。根據(jù)貝葉斯公式,不同形式的先驗(yàn)分布會(huì)產(chǎn)生不同形式的后驗(yàn)分布,從而會(huì)出現(xiàn)不同的后驗(yàn)期望損失值,故此時(shí)做決策的關(guān)鍵也在于選取合適的先驗(yàn)分布,這便是后驗(yàn)期望損失決策準(zhǔn)則的原理,即當(dāng)后驗(yàn)貝葉斯行為A的后驗(yàn)期望損失要比另一個(gè)后驗(yàn)貝葉斯行為B的后驗(yàn)期望損失小時(shí),則行為A要優(yōu)于行為B。根據(jù)這一決策準(zhǔn)則,在具體的損失函數(shù)下,便能對正態(tài)分布的位置參數(shù)θ的后驗(yàn)期望損失進(jìn)行計(jì)算和比較,從而選出損失最小相對應(yīng)的先驗(yàn)分布作為最優(yōu)的先驗(yàn)分布。
定理2:對于單層貝葉斯估計(jì)問題,若a>0,則基于Linex損失函數(shù)的正態(tài)分布N(θ,1)的位置參數(shù)θ的無信息先驗(yàn)分布要優(yōu)于共軛先驗(yàn)分布。
證明:根據(jù)貝葉斯學(xué)中無信息先驗(yàn)分布的設(shè)定可知,無信息先驗(yàn)分布最基本的設(shè)定形式是無信息Jeffreys先驗(yàn),即P(θ)=c,-∞ θ (1) B =-ln E(e-a θX)=-lne=-。 若取參數(shù)θ的共軛先驗(yàn)分布N(μ1,σ2 1),則根據(jù)峁詩松關(guān)于貝葉斯估計(jì)的理論可知,參數(shù)θ的后驗(yàn)分布為N(μ3,σ2 3),其中μ3=,σ2 3=。根據(jù)引理1,有: θ (2) B =-ln E(e-a θX)=-lne=-+。 因?yàn)閚為樣本數(shù),有n>0。當(dāng)a>0時(shí),易知θ (2) B >θ (1) B 。根據(jù)后驗(yàn)貝葉斯損失決策準(zhǔn)則,θ (1) B 選用的先驗(yàn)分布要優(yōu)于θ (2) B 選用的先驗(yàn)分布。故基于Linex損失函數(shù)的正態(tài)分布N(θ,1)的位置參數(shù)θ的無信息先驗(yàn)分布要優(yōu)于共軛先驗(yàn)分布。 【參考文獻(xiàn)】 [1]尤游,周玲.LINEX損失下雙指數(shù)分布位置參數(shù)的經(jīng)驗(yàn)Bayes估計(jì)[J].應(yīng)用概率統(tǒng)計(jì),2015(3). [2]嚴(yán)惠云,師義民.Linex損失下股票投資的貝葉斯預(yù)測[J].西南民族大學(xué)學(xué)報(bào):自然科學(xué)版,2006(9). [3]史建紅,關(guān)麗娜.非對稱損失函數(shù)下Burr XII型分布可靠性指標(biāo)的Bayes估計(jì)[J].數(shù)學(xué)雜志,2012(1). [4]韓明.多層先驗(yàn)分布的構(gòu)造及其應(yīng)用[J].運(yùn)籌與管理,1997(34). [5]李勇,易文德.貝葉斯分析中先驗(yàn)分布優(yōu)選的方法[J].渝西學(xué)院學(xué)報(bào):自然科學(xué)版,2005(12). [6]峁詩松.貝葉斯統(tǒng)計(jì)[M].北京:中國統(tǒng)計(jì)出版社,1999. [7]韓明.多層先驗(yàn)分布的構(gòu)造及其應(yīng)用[J].運(yùn)籌與管理,1997(3). [責(zé)任編輯:王楠]