李瑋
英國統(tǒng)計學家哈羅德曾經(jīng)說過,概率論實際上就像是個理想人步入茫然無知世界時的整套思維方式,人們總是根據(jù)概率論作出他對那個世界的全部推斷,就像純數(shù)學是個理想人的思維方式樣,因為他總能從純數(shù)學中得到準確的計算結(jié)果。普通人也完全有理由盡其全力來獲取問題的全部答案。
當今國際數(shù)理統(tǒng)計由貝葉斯學派和頻率學派這兩大派別組成??v觀這兩大學派,其各自理論存在很大的不同,且均有爭議,直至今日尚無定論。但目前,在概率論與數(shù)理統(tǒng)計的大學教材中,有關于統(tǒng)計推斷的理論幾乎清色的由頻率學派主導,幾乎看不到貝葉斯統(tǒng)計的相關主張,這使得我們度錯誤的認為統(tǒng)計推斷思想方法早有定論,對貝葉斯統(tǒng)計理論也早已了解。其實不然,主流教材中一般傾向于選擇主觀性較小,客觀性、可操作性較強的頻率學派基本理論觀點作為教授對象,但這并不意味著貝葉斯統(tǒng)計學不重要。隨著今日各項技術的發(fā)展和新領域的開拓,貝葉斯統(tǒng)計愈加得到人們的重視,并被廣泛應用。
一、頻率統(tǒng)計學派與貝葉斯統(tǒng)計學派基本思想的差異
頻率學派的基本思想是:首先建立總體所服從的分布,且將此處總體分布中的參數(shù)視為
未知常數(shù),然后依據(jù)樣本信息去估計推斷該參數(shù)。貝葉斯統(tǒng)計學派的基本思想是:將總體分布中的參數(shù)視為
隨機變量,并依據(jù)人們在實驗前的認識確定此參數(shù)的先驗分布,然后借助樣本信息進一步修正先前的認識,得到關于此參數(shù)的后驗分布。此外關于概率的定義,頻率學派將頻率的極限作為概率,而貝葉斯學派則側(cè)重于人的主觀認識,提出先驗概率,然后再根據(jù)貝葉斯公式不斷對其作出修正,得到后驗概率,且此概率具有無記憶性,可獨立于先驗概率。
這里我們可以借助例子去感受
下:現(xiàn)有兩完全相同的兩個盒子,盒1中有6個白球,2個紅球,盒2中有3個白球,5個紅球,任選個盒子取球,問是從盒1中取到白球的概率。這里令“取到白球”為事件A,“從盒1中取球”為事件B,“從盒2中取球”為事件c,由上述貝葉斯公式可以看到后驗概率P(B/A)與先驗概率P(B)及其似然P(A/B)成比例。由于無論從哪個盒子里取球公式中分母均為P(A)保持不變,故唯變化的就是似然P(A/B)的大小,這時可以很容易看出P(A/B)P(A/a,即從盒1中取到白球的可能性更大,于是P(B/A)>P(C/A),而事實也證實了這判斷。據(jù)此我認為貝葉斯公式更符合人們的認知規(guī)律,我們初始的判斷也因此變得有跡可循。
二、貝葉斯統(tǒng)計推斷的核心思想
1.先驗分布
貝葉斯統(tǒng)計學派主張利用先驗分布和樣本信息確定后驗分布,并依此進行統(tǒng)計推斷。該理論的關鍵步是如何確立先驗分布π(θ)。關于先驗分布的確立貝葉斯統(tǒng)計學實已取得豐碩成果,具體方法可見。
2.后驗分布
3.點估計
貝葉斯統(tǒng)計學立足于后驗分布,其中心思想是只考慮已出現(xiàn)的樣本觀察數(shù)據(jù),而未出現(xiàn)的數(shù)據(jù)則被認為與統(tǒng)計推斷無關,因此該方法側(cè)重于分析由次試驗得到的樣本,而忽略其他所有可能出現(xiàn)的樣本,因此頻率學派中對估計評價的無偏性在貝葉斯統(tǒng)計中將不再適用。為估計參數(shù)丹,與頻率學派采用樣本均值,樣本方差估計不同,貝葉斯統(tǒng)計推斷中常根據(jù)實際選取后驗分布的眾數(shù)、中位數(shù)或期望值對丹進行估計。
4.區(qū)間估計
對于區(qū)問估計問題,不同于頻率學派的構(gòu)造樞軸量的方法,貝葉斯統(tǒng)計學派主張在給定樣本和可信水平后,直接根據(jù)后驗分布確定可信區(qū)間(與置信區(qū)間相對),二者相比,后者方法要簡單得多,畢竟構(gòu)造樞軸量并不是件輕松的事情。此外二者對所得概率和區(qū)問的解釋也有很大不同,頻率學派對置信水平的解釋是,置信區(qū)間能蓋住θ的可能性,而貝葉斯統(tǒng)計學派將此概率解釋為,θ落入可信區(qū)間的可能性,相比較而言,后者的解釋更能被人們理解和接受。
5.假設檢驗
對于該問題,頻率學派首先是建立原假設H與備擇假設H1,然后選取適當?shù)慕y(tǒng)計量,在給定顯著性水平α下確定拒絕域C,然后代入樣本觀測值觀察數(shù)據(jù)是否落入拒絕域內(nèi),并依此作出是否接受原假設的判斷;與此不同的是,在貝葉斯統(tǒng)計推斷中,可直接依據(jù)后驗分布計算出原假設與備擇假設的后驗概率α,α然后計較兩概率值的大小,當后驗概率比αo/α1>1時接受Ho,當αo/α1<1時拒絕Ho,當αo=l時,無法做出判斷,需要更進步的抽樣或進步搜集先驗信息由此可見,貝葉斯假設檢驗方法無需構(gòu)造統(tǒng)計量和給定顯著性水平,及確定拒絕域,較為簡明。
縱觀貝葉斯統(tǒng)計學,他是建立在總體信息,樣本信息和先驗信息之上的統(tǒng)計推斷方法,他主張的先驗與后驗方式相比于頻率學派似乎更符合人們對事物的認知規(guī)律,但該理論仍存在較多爭議,比如將未知參數(shù)視為隨機變量是否妥當,以及先驗分布是否存在等問題,仍然需要做進步的研究。但不可否認的是,貝葉斯統(tǒng)計學在當今時代的應用愈加廣泛,其重要性不容忽視。