錢(qián)昆
南京財(cái)經(jīng)大學(xué) 210046
正規(guī)得分規(guī)則及其在預(yù)測(cè)問(wèn)題中的應(yīng)用
錢(qián)昆
南京財(cái)經(jīng)大學(xué) 210046
得分規(guī)則(scoring rules)可以很好地對(duì)預(yù)測(cè)結(jié)果的“質(zhì)量”進(jìn)行評(píng)價(jià),它是一種可以用來(lái)衡量和測(cè)評(píng)預(yù)測(cè)結(jié)果好壞程度的方法。它可以通過(guò)給定一種“規(guī)則”,對(duì)各種預(yù)測(cè)方案進(jìn)行賦值打分,選擇其中得分最少的來(lái)確定最佳預(yù)測(cè)方案,這一方法在諸如天氣、比賽結(jié)果等方面的預(yù)測(cè)有著很好的應(yīng)用。
預(yù)測(cè);得分規(guī)則;正規(guī)得分規(guī)則;應(yīng)用
“得分規(guī)則”一詞的首次出現(xiàn)是Good在1952年發(fā)表的一篇關(guān)于“合理決策”問(wèn)題的文章中,而后Winkler于1969年討論了得分規(guī)則在被用來(lái)評(píng)估概率預(yù)測(cè)和被用來(lái)推導(dǎo)方面的區(qū)別,而正式的關(guān)于得分規(guī)則被用來(lái)做推導(dǎo)的研究可以在Savage和Lindley的文章中看到,Bernardo和Smith于1994年做了相關(guān)的補(bǔ)充[2]。此外,正規(guī)得分規(guī)則還可以用來(lái)引導(dǎo)出個(gè)人的主觀概率,Savage運(yùn)用數(shù)學(xué)的方法推導(dǎo)出了可以用來(lái)推導(dǎo)出個(gè)人主觀概率的正規(guī)得分規(guī)則的一般表達(dá)式,也就是所謂的球形得分規(guī)則。
Giovanni Parmigiani等[1]在《決策理論與方法》中提到針對(duì)一件未知事件θ設(shè)定一個(gè)賭局,在保證賭局設(shè)定方一定獲利的前提下給出一個(gè)賠付比q:(1-q),雙方按照按設(shè)定的賠付比各自支付賭金,賭金之和作為一次賭局的獎(jiǎng)金總額S,最終由賭贏的一方獲得獎(jiǎng)金。顯然,從賭局制定者的角度考慮,如果θ最終發(fā)生了,即θ=1,那么賣(mài)方將有收益-(1-q) S,如果θ最終沒(méi)有發(fā)生,收益為qS。而作為賭局的賠付比制定者,他自己也有著對(duì)于事件θ是否發(fā)生的一個(gè)主觀概率π,那么在這種情況下賭局制定者的期望收益為顯然,當(dāng)取q=π時(shí),賭局制定者的期望收益為0,此時(shí)的q=π是期望收益的一個(gè)臨界值,而根據(jù)預(yù)期效用最優(yōu)化原則,此時(shí)賭局制定者的預(yù)期效用最大。在這種得分規(guī)則下的賭局制定者的期望得分也達(dá)到最小。因此,正規(guī)得分規(guī)則的定義為當(dāng)且僅當(dāng)存在一個(gè)正數(shù)π,使得成立時(shí),我們稱(chēng)之為正規(guī)得分規(guī)則,且當(dāng)π為唯一值時(shí),此時(shí)的得分規(guī)則被稱(chēng)為嚴(yán)格正規(guī)得分規(guī)則。
自Good于1952年首次提出了正規(guī)得分規(guī)則這一概念并給出了第一個(gè)正規(guī)得分規(guī)則的數(shù)學(xué)形式以來(lái),諸多學(xué)者根據(jù)不同的統(tǒng)計(jì)分析需要不斷提出了一系列的其他的正規(guī)得分規(guī)則,如二次得分規(guī)則、球形得分規(guī)則等。
①對(duì)數(shù)得分規(guī)則(logarithmic rule),最早由古德于1952年提出來(lái)的,也是最早的一種正規(guī)得分規(guī)則,其數(shù)學(xué)形式為:該得分規(guī)則最初是被用來(lái)計(jì)算負(fù)熵值對(duì)得應(yīng)的一種得分規(guī)則。這種得分規(guī)則的計(jì)分方法只與眾多狀態(tài)中最終發(fā)生的狀態(tài)θj ,有關(guān),而與其他未發(fā)生的狀態(tài)無(wú)關(guān)。實(shí)際上,這種得分規(guī)則也是一種較為嚴(yán)格的得分規(guī)則—局部得分規(guī)則的典型代表。
②二次得分規(guī)則(Quadratic scoring rule ),是正規(guī)得分規(guī)則中最著名的一種得分規(guī)則。它最初是由Brier在研究天氣預(yù)測(cè)問(wèn)題中的證明時(shí)所提出來(lái)的,而它的數(shù)學(xué)形式則是由Savage(1971)推導(dǎo)出來(lái)的,具體形式為:。這種得分規(guī)則的最大優(yōu)點(diǎn)是可以通過(guò)修改系數(shù)A,B的值來(lái)實(shí)現(xiàn)其靈活應(yīng)用。Selten于1998年對(duì)它進(jìn)行了公理化的論證[4]。
③球形得分規(guī)則(Spherical rule),它是由Savage于1971年首次提出的,它是球面得分規(guī)則下的一種特殊情況,其具體數(shù)學(xué)公式為:
正規(guī)得分規(guī)則在預(yù)測(cè)問(wèn)題上的應(yīng)用非常廣泛。本文選取了NBA2013-2014季后賽總冠軍的歸屬作為預(yù)測(cè)事件θ,某博彩公司將為兩支球隊(duì)的奪冠可能性設(shè)定賭局,使得博彩公司的盈利最大??倹Q賽的對(duì)陣雙方為邁阿密熱隊(duì)和圣安東尼奧馬刺隊(duì),這一事件只存在兩種狀態(tài)θ1和θ2(θ1表示熱隊(duì)奪冠,θ2表示馬刺隊(duì)奪冠)。博彩公司要根據(jù)兩隊(duì)的球員實(shí)力和狀態(tài)、教練的經(jīng)驗(yàn)、主場(chǎng)優(yōu)勢(shì)、以及個(gè)人的偏好等因素給出兩隊(duì)的勝率。此處,將每個(gè)預(yù)測(cè)人員給出的兩隊(duì)的勝率預(yù)測(cè)表示為q1和q2,而每個(gè)預(yù)測(cè)者的個(gè)人主觀勝率表示為π1和π2,那么博彩公司到底應(yīng)該根據(jù)哪個(gè)預(yù)測(cè)者的預(yù)測(cè)結(jié)果去設(shè)定一個(gè)賠付比,才能使期望受益最大呢?而預(yù)測(cè)者應(yīng)該怎樣給出自己的預(yù)測(cè)概率才能使自己的預(yù)測(cè)結(jié)果最為精確呢?我們可以為每個(gè)預(yù)測(cè)者設(shè)定一個(gè)得分(q-θ)2以表示預(yù)測(cè)結(jié)果與實(shí)際情況的偏差,那么按照這種得分規(guī)則下的每個(gè)預(yù)測(cè)者的期望得分為:
顯然,取q1=π1時(shí),預(yù)測(cè)者的期望得分最少,那么博彩公司到底應(yīng)怎樣從中選取最合理的預(yù)測(cè)結(jié)果呢?為此,本文選擇了具有代表性的ESPN部分專(zhuān)家的預(yù)測(cè)結(jié)果代替并選擇最具代表性的二次得分規(guī)則作為計(jì)算每個(gè)預(yù)測(cè)者的期望得分的方法。因?yàn)槭录扔袃煞N狀態(tài),因此那么此處的得分規(guī)則為
我們不難算出在此得分規(guī)則下的每個(gè)預(yù)測(cè)專(zhuān)家的期望得分,得分結(jié)果如表1所示:
表1 在二次得分規(guī)則下每個(gè)專(zhuān)家預(yù)測(cè)的兩隊(duì)勝率及期望得分
顯然,前后分別有四位專(zhuān)家是預(yù)測(cè)熱隊(duì)和馬刺隊(duì)將會(huì)奪得總冠軍,前四位專(zhuān)家中Thorpe得分最低,后四位專(zhuān)家中Torres的得分最低,按照得分最少預(yù)測(cè)效果最好的原則,應(yīng)分別取這兩位專(zhuān)家的預(yù)測(cè)概率作為設(shè)定兩支球隊(duì)是否奪冠的賠付比,而根據(jù)正規(guī)得分規(guī)則的定義,我們認(rèn)為每個(gè)專(zhuān)家所給出的預(yù)測(cè)概率均為個(gè)人的主觀概率,那么博彩公司最終為熱隊(duì)和馬刺隊(duì)設(shè)定的賠付比應(yīng)為2.45:1和3.17:1。按照這樣的賠付比來(lái)設(shè)定賭局能保證博彩公司能夠始終盈利。
得分規(guī)則作為決策理論中的一個(gè)重要方法在對(duì)未知事件的預(yù)測(cè)方面有著廣泛的應(yīng)用。本文將正規(guī)得分規(guī)則的原理運(yùn)用到NBA等體育賽事結(jié)果的預(yù)測(cè)上。在研究過(guò)程中,部分假設(shè)合理化了一些因素,且未能考慮到不同預(yù)測(cè)者之間的綜合影響,所以可能與實(shí)際情況有所偏差,這
()()些也正是今后還需改進(jìn)的地方。
[1]G. Parmigiani., Y. T. Inoue. Decision Theory: Principles and Approaches, pp.191-198
[2]T Gneiting and A. Raftery. Strictly Proper Scoring Rules, Prediction,and Estimation
[3]ESPN中文網(wǎng). http://www.espnstar.com.cn
[4]Stein. Estimation of the mean of a multivariate normal distribution,Annals of Statistic 9: 1135~1151.
錢(qián)昆 單位:南京財(cái)經(jīng)大學(xué) 省市 :江蘇南京。