郭剛正
(中南財(cái)經(jīng)政法大學(xué)統(tǒng)計(jì)與數(shù)學(xué)學(xué)院,武漢 430073)
基本定義:假如已知有一個(gè)可觀察的隨機(jī)變量X,它的密度函數(shù)(或概率函數(shù))p(x|θ)依賴于未知參數(shù)θ,θ∈Θ,此處θ稱為參數(shù),Θ稱為參數(shù)空間。定義一個(gè)行動(dòng)集λ={a}:在對(duì)θ做點(diǎn)估計(jì)時(shí),取λ=θ;在對(duì)θ做空間估計(jì)時(shí),行動(dòng)a就是一個(gè)區(qū)間,Θ上的一切可能的區(qū)間構(gòu)成行動(dòng)集λ;在對(duì)θ做假設(shè)檢驗(yàn)時(shí),只含兩個(gè)行動(dòng),接受和拒絕。
損失函數(shù):在Θ×λ上定義了一個(gè)損失函數(shù)L(θ,a),它表示參數(shù)為θ時(shí),決策者采取行動(dòng)a采用行動(dòng)所引起的損失。
決策函數(shù):在給定的貝葉斯決策問題中,從樣本空間x={x=(x1,…,xn)}到行動(dòng)集λ上的一個(gè)映射δ(x)稱為該問題的一個(gè)決策函數(shù),所有從x到λ上的決策函數(shù)組成的類稱為決策函數(shù)類,用D={δ(x)}表示。
若存在某一決策函數(shù),使得此決策函數(shù)在全部決策函數(shù)類中具有最小的后驗(yàn)風(fēng)險(xiǎn),則這個(gè)決策函數(shù)為后驗(yàn)風(fēng)險(xiǎn)準(zhǔn)則下的最優(yōu)決策函數(shù),也就是貝葉斯決策函數(shù)。依據(jù)后驗(yàn)風(fēng)險(xiǎn)準(zhǔn)則作出的貝葉斯決策可以按照以下步驟。
第一步:后驗(yàn)風(fēng)險(xiǎn)的刻畫
對(duì)可觀察的隨機(jī)變量X做n次觀察,獲得一個(gè)樣本x=(x1,…,xn),若 X=x的密度函數(shù)為 p(x|θ),用貝葉斯公式可得在樣本給定下,θ的后驗(yàn)密度函數(shù)為
π(θ|x)=p(x|θ)π(θ)/m(x),
其中 m(x)為邊緣密度函數(shù) m(x)= ∫Θp(x|θ)π(θ)/dθ 。
然后把損失函數(shù)L(θ,a)對(duì)后驗(yàn)分布π(θ|x)求得期望,記為 R(a|x),有
R(a|x)=Eθ|xL(θ,a)∫ΘL(θ,a)π(θ|x)dθ
R(a|x)即為后驗(yàn)風(fēng)險(xiǎn)。
第二步:最優(yōu)決策函數(shù)的求解
在所有的決策函數(shù)類中,我們需要選取某一特定的決策函數(shù),使得后驗(yàn)風(fēng)險(xiǎn)達(dá)到最小值。因此,后驗(yàn)風(fēng)險(xiǎn)準(zhǔn)則在決策函數(shù)上的δ(x)描述即為:給定樣本聯(lián)合密度函數(shù)p(x|θ)、參數(shù)空間 Θ 上的先驗(yàn)分布 π(θ)、定義在 Θ × λ上的損失函數(shù) L(θ,a)這三個(gè)前提的貝葉斯決策問題中,D={δ(x)}是其決策函數(shù)類,R(δ|x)=Eθ|xL(θ,δ(x)),x∈x,θ∈Θ是決策函數(shù)δ(x)的后驗(yàn)風(fēng)險(xiǎn),若在決策函數(shù)類中存在決策函數(shù)δ0(x),使得它在D中具有最小的后驗(yàn)風(fēng)險(xiǎn),則稱δ0(x)為后驗(yàn)風(fēng)險(xiǎn)準(zhǔn)則下的最優(yōu)決策函數(shù)。
在做決策的過程中,除了總體信息和先驗(yàn)信息之外,需要獲取一定的樣本信息,而樣本信息獲取所帶來的效益與相應(yīng)的費(fèi)用大小關(guān)系決定了獲取該樣本信息的必要性。抽樣信息期望值就是來描述這個(gè)兩者之間的關(guān)系。
1.3.1 完全信息期望值EVPI
完全信息是指決策者所獲得的信息完全確定一個(gè)狀態(tài)的發(fā)生,即在已知完全信息的條件下,事件發(fā)生的概率為1。有了完全信息,就能進(jìn)行最優(yōu)行動(dòng),獲取最大效益。一個(gè)決策問題有多個(gè)狀態(tài),第j個(gè)狀態(tài)的先驗(yàn)概率為θj,j=1,…,n。且各狀態(tài)都有一個(gè)完全信息,第ai,i=1,…,m個(gè)行動(dòng)第j個(gè)狀態(tài)的收益為qij。在每一狀態(tài)中,依據(jù)完全信息選取出某一行動(dòng),使得該狀態(tài)下的收益值達(dá)到最大,即因此可求得有完全信息時(shí)的收益期望值而沒有完全信息時(shí),只能按照先驗(yàn)期望準(zhǔn)則決策,其收益期望值為兩者之差稱為完全信息期望值EVPI,是這個(gè)完全信息給決策者在收益上帶來的增加或者損失的減少。EVPI的計(jì)算公式為
而進(jìn)一步來看,EVPI也可以用損失函數(shù)來表示:
其中,Qji為出現(xiàn)θj狀態(tài)時(shí)采取行動(dòng)ai的收益,ak表示使E0[Q(θ,ai)]取最大時(shí)的行動(dòng),Qjk表示ak行動(dòng)下對(duì)應(yīng)的收益矩陣。由收益矩陣可以確定損失矩陣,而完全信息期望值就可由最優(yōu)行動(dòng)的先驗(yàn)期望損失來確定和計(jì)算了。
1.3.2 抽樣信息期望值EVSI
完全信息期望值EVPI表示決策者在能掌握完全信息時(shí)的期望損失或期望收益,它是以先驗(yàn)分布為基礎(chǔ)的。而在獲得樣本信息后,在以后驗(yàn)分布為基礎(chǔ)的討論中,我們類似的可以得出完全信息后驗(yàn)期望值。設(shè)π(θ|x)為樣本x=(x1,…,xn)給定下θ的后驗(yàn)分布,δ(x)為據(jù)此后驗(yàn)分布所確定的貝葉斯決策函數(shù),而在δ(x)下?lián)p失函數(shù)L(θ,δ(x))的后驗(yàn)期望 Eθ|xL(θ,δ(x))稱為完全信息后驗(yàn)期望值,記為
后驗(yàn) EVPI=Eθ|xL(θ,δ(x))
而后驗(yàn)EVPI仍是依賴于樣本x的隨機(jī)變量,用樣本x的邊緣分布m(x)對(duì)Eθ|xL(θ,δ(x))再求一次期望以消除隨機(jī)性,得到后驗(yàn)EVPI期望值,記為
后驗(yàn) EVPI期望值 =ExEθ|xL(θ,δ(x))
一般來說,樣本信息的獲得會(huì)增加決策者對(duì)狀態(tài)的了解,決策過程中期望損失會(huì)降低,這個(gè)減少量就稱為抽樣信息期望值EVSI。EVSI的計(jì)算公式為
其中,ak是先驗(yàn)期望準(zhǔn)則下的最優(yōu)行動(dòng),δ0(x)是后驗(yàn)風(fēng)險(xiǎn)準(zhǔn)則下的最優(yōu)決策函數(shù),EVSI即為先驗(yàn)EVPI與后驗(yàn)EVPI期望值的差,即獲得樣本信息后給決策者帶來的收益。
某公司希望增加一個(gè)小額高頻資金投資項(xiàng)目。市場經(jīng)驗(yàn)表明,一年中每千次投資里失敗次數(shù)θ的概率分布如下表1所示:
表1 一年中每千次投資里失敗次數(shù)的概率分布
假定每次投資失敗,公司平均要付出賠償款200元。為進(jìn)行該項(xiàng)目,每年固定成本為10萬元。該公司估計(jì),每次投資會(huì)產(chǎn)生利潤10元,每年可投資10萬次,試求完全信息期望值EVPI。與此同時(shí),決策者想從每千次投資中抽取三次進(jìn)行調(diào)查,根據(jù)投資失敗的次數(shù)(用x表示)來決定是否增加該投資項(xiàng)目,求出最優(yōu)決策函數(shù),并計(jì)算抽樣信息期望值EVSI。
首先求解完全信息期望值。由題可知,該公司面臨兩個(gè)行動(dòng)的選擇:
a0:不增加該投資項(xiàng)目
a1:增加該投資項(xiàng)目
若選擇a0行動(dòng),公司利潤為0元/年;
若選擇a1行動(dòng),公司利潤為900000~20000θ元/年。
由此可得出利潤矩陣和損失矩陣
可計(jì)算出a0行動(dòng)和a1行動(dòng)的先驗(yàn)期望損失:
在先驗(yàn)期望準(zhǔn)則下,a1是最優(yōu)行動(dòng),故完全信息期望值EVPI=54000元/年。
在決策者抽取三次投資行動(dòng)進(jìn)行調(diào)查時(shí),失敗的人數(shù)x只可能從0,1,2,3這四個(gè)值中取得,所以由{0,1,2,3}到{a0,a1}上的任一映射δ(x)都是一個(gè)決策函數(shù)。我們通過下面幾步計(jì)算來確定最優(yōu)決策函數(shù)和抽樣信息期望值。
第一步,計(jì)算θ的后驗(yàn)分布。因?yàn)槌闃咏Y(jié)果x服從二項(xiàng)分布b(3,θ),即
而根據(jù)表1的先驗(yàn)分布π(θ)可以算出x的邊緣分布,結(jié)果見下表2:
表2 x的邊緣分布
由上表2的邊緣分布可以算出x值下的后驗(yàn)分布π(θ|x),結(jié)果見下表3:
表3 各x值下的后驗(yàn)分布π(θ|x)
第二步,計(jì)算各行動(dòng)的后驗(yàn)期望損失Eθ|xL(θ,a)∑L(θ,a)π(θ|x),結(jié)果見下表4:
表4 各x值下各行動(dòng)的后驗(yàn)期望損失
第三步,定出最優(yōu)決策函數(shù)。根據(jù)風(fēng)險(xiǎn)最小化準(zhǔn)則,對(duì)抽樣結(jié)果x的每個(gè)可能制定最優(yōu)結(jié)果,這樣就得到最優(yōu)決策函數(shù)
第四步,計(jì)算后驗(yàn)EVPI和后驗(yàn)EVPI期望值。根據(jù)上表4的后驗(yàn)期望損失結(jié)果可計(jì)算出后驗(yàn)EVPI,即為表4中每個(gè)x值下的最小后驗(yàn)期望損失,結(jié)果為
在x=0時(shí),后驗(yàn)EVPI=52170
在x=1時(shí),后驗(yàn)EVPI=66096
在x=2時(shí),后驗(yàn)EVPI=54140
在x=3時(shí),后驗(yàn)EVPI=42110
而后驗(yàn)EVPI期望值是用樣本的邊緣分布m(x)對(duì)后驗(yàn)EVPI求期望而得。根據(jù)表2中x的邊緣分布結(jié)果,可求得后驗(yàn)EVPI期望值為
ExEθ|xL(θ,δ0(x))=52170×0.8747+66096×0.11956+54140×0.00563+42110×0.0000915=53844.19803≈53844.2
第五步,計(jì)算抽樣信息期望值。
EVSI=先驗(yàn)后EVPI的期望值=54000-53844.2=155.8(元)
這表明,在每千次投資中隨機(jī)抽取3次進(jìn)行調(diào)查,根據(jù)檢驗(yàn)結(jié)果x定出的最優(yōu)決策函數(shù)δ0(x)要比抽樣前的最優(yōu)行動(dòng)減少損失155.8元,也就是抽樣給決策者帶來的增益。
決策者總是希望自己的決策能夠更有依據(jù),期望收益更高,期望損失更低,而貝葉斯方法充分利用總體信息、樣本信息、先驗(yàn)信息、損失函數(shù),計(jì)算最優(yōu)決策函數(shù)與最小后驗(yàn)期望損失,并利用相關(guān)指標(biāo)刻畫抽樣的經(jīng)濟(jì)效益,使得整個(gè)決策過程更有說服力。從全文的分析和研究中,我們能夠體會(huì)到貝葉斯方法在決策中應(yīng)用時(shí),具有一些很優(yōu)良的特性:
第一,貝葉斯方法的決策過程是一套完整的體系。從先驗(yàn)分布到后驗(yàn)分布,再借助損失函數(shù),得出最優(yōu)決策函數(shù),同時(shí)可計(jì)算抽樣的經(jīng)濟(jì)效益。這個(gè)逐漸融入更多信息的過程形成了決策的完整體系,使決策者能夠作出成熟、迅速的判斷。
第二,貝葉斯方法使決策具有更小的后驗(yàn)期望風(fēng)險(xiǎn)。用利潤函數(shù)描述就是后驗(yàn)期望最大化,用損失函數(shù)描述就是后驗(yàn)損失最小化。
第三,貝葉斯方法能充分利用各種信息,它尤其重視先驗(yàn)信息利用,收集、挖掘、加工先驗(yàn)信息,使它數(shù)量化,形成先驗(yàn)分布,和樣本信息結(jié)合起來,大大提高了統(tǒng)計(jì)推斷的質(zhì)量。
第四,貝葉斯決策能用抽樣信息期望值這一指標(biāo)量化抽樣給決策者帶來的效益,減少?zèng)Q策中的期望損失,同時(shí),將抽樣信息期望值與抽樣所需費(fèi)用相比較就能告訴決策者進(jìn)行該抽樣是否合理。
[1]茆詩松.貝葉斯統(tǒng)計(jì)[M].北京:中國統(tǒng)計(jì)出版社,1999.
[2]吳喜之.統(tǒng)計(jì)決策論及貝葉斯分析[M].北京:中國統(tǒng)計(jì)出版社,1998.
[3]James O.Berger.Statistical Decision Theory and Bayesian Analysis[M].New York:Springer-Verlag,2004.
[4]吳海村.管理統(tǒng)計(jì)決策分析[M].西南財(cái)經(jīng)大學(xué)出版社,1991.
[5]朱金玲.貝葉斯決策分析及改進(jìn)[J].江蘇統(tǒng)計(jì),2000,(6).
[6]劉昊.貝葉斯決策方法在審計(jì)中的運(yùn)用[J].財(cái)貿(mào)研究,2002,(3).
[7]朱震峰.貝葉斯決策法的應(yīng)用[J].大原大學(xué)學(xué)報(bào),2007,8(3).
[8]盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計(jì)[M].北京:高等教育出版社,2008.
[9]徐國祥.統(tǒng)計(jì)預(yù)測與決策[M].上海:上海財(cái)經(jīng)大學(xué)出版社,2008.