劉玉清
摘 要:貝葉斯統(tǒng)計(jì)理論是現(xiàn)代數(shù)理統(tǒng)計(jì)學(xué)中較具影響力的理論,其在長期發(fā)展中逐漸成為了一種學(xué)派,對(duì)現(xiàn)代數(shù)理統(tǒng)計(jì)有著巨大的影響。本文為了了解該理論的形成與嬗變將展開研究,對(duì)該理論的起源、發(fā)展歷史進(jìn)行論述。通過分析了解到,貝葉斯統(tǒng)計(jì)理論來源于概率論的思想背景與機(jī)會(huì)學(xué)理論,在后續(xù)發(fā)展中該理論被廣泛應(yīng)用,且逐漸與經(jīng)典學(xué)派分離,形成了一種獨(dú)立的學(xué)派。
關(guān)鍵詞:貝葉斯統(tǒng)計(jì)理論;形成;嬗變
數(shù)理統(tǒng)計(jì)學(xué)本身就是一種通用性的學(xué)術(shù)領(lǐng)域,在現(xiàn)代各大領(lǐng)域中都需要通過數(shù)理統(tǒng)計(jì)學(xué)手段來開展工作,而貝葉斯統(tǒng)計(jì)理論作為樹立統(tǒng)計(jì)學(xué)的理論手段,自然受到了人們的廣泛關(guān)注與采納。但現(xiàn)代多數(shù)人對(duì)貝葉斯統(tǒng)計(jì)理論的形成與嬗變并不了解,使得使用相關(guān)手段時(shí)不知變通,限制了理論的作用發(fā)揮,因此對(duì)其形成與嬗變進(jìn)行研究具有一定現(xiàn)實(shí)意義。
一、貝葉斯統(tǒng)計(jì)理論的形成
(一)概率論的思想背景
概率論最早出現(xiàn)在“賭博”活動(dòng)中,活動(dòng)參與者會(huì)通過各種非數(shù)學(xué)的方法對(duì)自身行為的獲勝概率進(jìn)行統(tǒng)計(jì),這種統(tǒng)計(jì)結(jié)果比較主觀,且不科學(xué),因此當(dāng)時(shí)概率并不屬于數(shù)學(xué)范疇,是一個(gè)非數(shù)學(xué)觀念。但這種非數(shù)學(xué)范疇的概率統(tǒng)計(jì)方法引起了當(dāng)時(shí)數(shù)學(xué)界的關(guān)注,多數(shù)數(shù)學(xué)家都發(fā)現(xiàn)了概率中隱含的數(shù)學(xué)規(guī)律,而這種規(guī)律在當(dāng)時(shí)還模糊不清,這也引起了數(shù)學(xué)家們的研究,隨后出現(xiàn)了很多有關(guān)于概率論的研究。例如1657年,荷蘭科學(xué)家克里斯蒂安·惠更斯(Christiaan Huygens)發(fā)表了《論賭博中的計(jì)算》文章,此舉成功將概率論帶入到了數(shù)學(xué)范疇,奠定了概率數(shù)學(xué)邏輯。而這些關(guān)于概率論的研究中,不少研究并不能清晰展示概率論的邏輯,因此在貝葉斯統(tǒng)計(jì)理論出現(xiàn)之前,概率論中依舊存在很多模糊的地方,計(jì)算方法也不完全可靠。這種模糊不清的現(xiàn)象一直持續(xù)到托馬斯·貝葉斯的出現(xiàn),他受前人影響對(duì)以往模糊不清的概率論進(jìn)行研究,撰寫了對(duì)概率進(jìn)行深入探討的著作《機(jī)會(huì)學(xué)說中一個(gè)問題的解》,該文章由貝葉斯好友普萊斯在貝葉斯逝世后發(fā)表,這篇文章中貝葉斯針對(duì)概率論基礎(chǔ)理論使用了歸納推理法,這種方法成功讓概率論有據(jù)可依,至少可以解決當(dāng)時(shí)大部分無法用以往方法無法進(jìn)行概率計(jì)算的問題,而這也是貝葉斯統(tǒng)計(jì)理論的起源。
(二)機(jī)會(huì)學(xué)理論
在貝葉斯統(tǒng)計(jì)理論當(dāng)中,機(jī)會(huì)學(xué)理論是該理論體系的核心概念,即《機(jī)會(huì)學(xué)說中一個(gè)問題的解》就是以機(jī)會(huì)學(xué)為核心來撰寫的。在《機(jī)會(huì)學(xué)說中一個(gè)問題的解》中,貝葉斯希望找到一種可以在給定、假定情況下對(duì)事件的發(fā)生概率進(jìn)行判斷的方法,這種方法的重點(diǎn)在于“假定”,即假定是指我們對(duì)事件情況完全不了解的情況下,根據(jù)事件曾經(jīng)發(fā)生的次數(shù)、失敗的次數(shù)進(jìn)行計(jì)算,計(jì)算結(jié)果代表了該事件在假定情況下其發(fā)生概率在任意二值之間的機(jī)會(huì),在貝葉斯的描述中該方法所計(jì)算的問題被稱為“逆概率問題”,這一問題也是《機(jī)會(huì)學(xué)說中一個(gè)問題的解》文章所論述的核心。
在研究當(dāng)中,貝葉斯首先提出了他要研究的問題“給定一個(gè)未知事件發(fā)生和失敗的次數(shù),求其在一次試驗(yàn)中發(fā)生的概率在任意指定的概率度之間的機(jī)遇”,其次針對(duì)這一問題貝葉斯展開了n重伯努利試驗(yàn),試驗(yàn)步驟見下文。
1.步驟一,問題假設(shè)
在n重伯努利試驗(yàn)中,貝葉斯將事件發(fā)生的次數(shù)設(shè)為X、每次試驗(yàn)的事件發(fā)生概率為θ,隨后給出了問題假設(shè)表達(dá)式,見公式(1)。
2.步驟二,問題定義
單純圍繞問題假設(shè)公式,其中θ就會(huì)成為一個(gè)隨機(jī)變量,而這種變量顯然會(huì)造成結(jié)果上的爭(zhēng)議,說明計(jì)算結(jié)果不可靠,這時(shí)貝葉斯也發(fā)現(xiàn)了這一問題,隨后在文章中進(jìn)行了問題定義:在多個(gè)相互獨(dú)立事件同時(shí)存在的條件下,其中任意事件發(fā)生后,其他事件都不可發(fā)生;兩個(gè)對(duì)立的事件中,任意事件一旦發(fā)生,則另外事件不能同時(shí)發(fā)生;若事件1未發(fā)生或?qū)α⒌氖录?發(fā)生,則代表事件1發(fā)生失敗;當(dāng)事件發(fā)生或失敗,則事件被確認(rèn);事件的發(fā)生概率代表了它發(fā)生的期望價(jià)值除以它發(fā)生時(shí)得到的價(jià)值;機(jī)會(huì)即概率;任意事件如果不會(huì)對(duì)其他事件的發(fā)生概率造成影響,則說明該與其他事件相互獨(dú)立。這種定義代表貝葉斯通過公理化的演繹式推理使問題變得清晰。
3.步驟三,問題計(jì)算
在問題假設(shè)與問題定義基礎(chǔ)上,貝葉斯開始對(duì)問題進(jìn)行計(jì)算,目的在于解決逆概率問題。他提到,當(dāng)未知事件M的發(fā)生概率為θ,且θ未知時(shí),M在n次試驗(yàn)中的成功次數(shù)為r,失敗次數(shù)為n-r,因此通過公式(3)能夠?qū)Ζ仍诔?shù)a、b之間的概率進(jìn)行計(jì)算。
通過貝葉斯定理公式,我們可以在不知道事件發(fā)生概率,但知道在相同情況下事件發(fā)生次數(shù)、失敗次數(shù)的條件下,通過積分對(duì)事件發(fā)生概率進(jìn)行判斷,同時(shí)這種規(guī)則適用于任何事件,說明貝葉斯統(tǒng)計(jì)理論使用范圍廣泛。
二、貝葉斯統(tǒng)計(jì)理論的嬗變
(一)嬗變的起源
貝葉斯統(tǒng)計(jì)理論的形成時(shí)間很早,可追溯到18世紀(jì)至19世紀(jì)期間,但在當(dāng)時(shí)該理論并沒有得到大家的重視,多數(shù)人依舊非常依賴傳統(tǒng)方法所代表的經(jīng)典學(xué)派。這種現(xiàn)象一直延續(xù)到20世紀(jì),當(dāng)時(shí)大量數(shù)理統(tǒng)計(jì)領(lǐng)域?qū)W者發(fā)現(xiàn)傳統(tǒng)方法難以得出令人滿意的結(jié)果,而嘗試性地使用了貝葉斯統(tǒng)計(jì)理論方法,結(jié)果出人意料,因此在20世紀(jì)很多人對(duì)貝葉斯統(tǒng)計(jì)理論進(jìn)行了研究,如英國學(xué)者哈羅德·杰弗里斯、倫納德·吉米·薩維奇等,對(duì)弗蘭克·拉姆齊在1931年提出的主觀概率概念進(jìn)行了研究,研究中就采用了貝葉斯理論對(duì)主觀概率的結(jié)構(gòu)進(jìn)行了描述與分析;1955年赫伯特·羅賓斯在基礎(chǔ)貝葉斯統(tǒng)計(jì)理論上提出了經(jīng)驗(yàn)貝葉斯方法,該方法至今仍受學(xué)術(shù)界關(guān)注;1958年貝葉斯《機(jī)會(huì)學(xué)說中一個(gè)問題的解》被英國某統(tǒng)計(jì)雜志刊登發(fā)表。這既為貝葉斯統(tǒng)計(jì)理論嬗變起源。
(二)嬗變歷程
貝葉斯統(tǒng)計(jì)理論作為一個(gè)發(fā)源于18世紀(jì)的理論,距今已經(jīng)300余年,在冗長的歷史時(shí)間當(dāng)中,它的嬗變歷程大體可以分為三個(gè)階段,即主觀概率、“后驗(yàn)概率∝先驗(yàn)概率*似然”概率論釋義、經(jīng)驗(yàn)貝葉斯方法,各階段具體內(nèi)容見下文。
1.主觀概率
主觀概率由弗蘭克·拉姆齊提出,這種概率論與貝葉斯概率觀點(diǎn)相符,因此被認(rèn)為是貝葉斯概率觀點(diǎn)之一。根據(jù)弗蘭克·拉姆齊描述可知,主觀概率與經(jīng)典概率論學(xué)派最大的不同在于前者反對(duì)后者提出的頻率理論,即不能以頻率的結(jié)構(gòu)與分析概率,但主觀概率非常強(qiáng)調(diào)“信任”,如在弗蘭克·拉姆齊的著作《真理與概率》當(dāng)中,他提出了一種基于信任的“打賭”概念:在生活中我們時(shí)常會(huì)進(jìn)行打賭,而打賭就是對(duì)概率的賭博,但賭博必須建立在信任基礎(chǔ)上,如我與某人打賭今日某個(gè)商店是否開門,若我認(rèn)為商店不開門,就代表我對(duì)商店開門的不信任,否則反之,或者我對(duì)商店開門與否都不信任,則我會(huì)拒絕打賭,脫離對(duì)商店開門概率的追究。這種理論就來源于人主觀意識(shí)上的信任,與貝葉斯理論所表述的觀點(diǎn)一致。
2.“后驗(yàn)概率∝先驗(yàn)概率*似然”概率論釋義
“后驗(yàn)概率∝先驗(yàn)概率*似然”概率論釋義來源于哈羅德·杰弗里斯,他將概率論視作理解科學(xué)方法的必要條件,并根據(jù)貝葉斯統(tǒng)計(jì)理論提出了“后驗(yàn)概率∝先驗(yàn)概率*似然”概率論釋義,認(rèn)為貝葉斯對(duì)概率論的意義重大,值得推廣。
3.經(jīng)驗(yàn)貝葉斯方法
經(jīng)驗(yàn)貝葉斯方法來源于赫伯特·羅賓斯,他在1955年提出了這種方法。經(jīng)驗(yàn)貝葉斯方法中,采取了貝葉斯統(tǒng)計(jì)理論的統(tǒng)計(jì)推斷過程,且具有歸納性,符合貝葉斯的歸納推理法,過程中需要先采集先驗(yàn)樣本,再通過客觀方法將樣本代入到主觀的貝葉斯理論中,通過這種方法所得出的結(jié)果與原始貝葉斯統(tǒng)計(jì)方法高度一致。該方法的出現(xiàn)基本奠定了貝葉斯統(tǒng)計(jì)理論在數(shù)理統(tǒng)計(jì)理論中的地位,即原始貝葉斯統(tǒng)計(jì)方法被認(rèn)為過于主觀,在樣本分布上太過隨意,因此結(jié)果不可靠,這一點(diǎn)常被經(jīng)典學(xué)派人員詬病,而經(jīng)驗(yàn)貝葉斯方法則消除了這一缺陷,該方法以客觀為主導(dǎo)再轉(zhuǎn)向主觀,使得原始貝葉斯統(tǒng)計(jì)方法具有客觀屬性,結(jié)果自然更加可靠,因此經(jīng)驗(yàn)貝葉斯方法一直流傳至今,現(xiàn)行統(tǒng)計(jì)學(xué)方法一般具有該方法的影子。
三、結(jié)語
綜上,本文對(duì)貝葉斯統(tǒng)計(jì)理論的形成與嬗變進(jìn)行了分析,通過分析闡述了貝葉斯統(tǒng)計(jì)理論形成背景與起源,描述了該理論在數(shù)理統(tǒng)計(jì)中的觀點(diǎn)與操作方法,該理論中的方法成功突破了傳統(tǒng)概率論模糊不清的現(xiàn)象,因此意義重大,而在后期發(fā)展中,人們還是發(fā)現(xiàn)了原始貝葉斯統(tǒng)計(jì)理論的不足,使得大量研究人員對(duì)貝葉斯統(tǒng)計(jì)理論進(jìn)行了研究,促使該理論發(fā)生嬗變,最終形成了經(jīng)驗(yàn)貝葉斯方法,該方法對(duì)現(xiàn)代數(shù)理統(tǒng)計(jì)研究影響重大,可消除以往缺陷、確保統(tǒng)計(jì)結(jié)果質(zhì)量。
參考文獻(xiàn):
[1]蘇巖.貝葉斯統(tǒng)計(jì)的發(fā)展及其爭(zhēng)鳴[J].保定師范專科學(xué)校學(xué)報(bào),2003(2):1-3.
[2]謝宏斌.貝葉斯公式的應(yīng)用和推廣[J].數(shù)學(xué)學(xué)習(xí)與研究,2017(10):8.
[3]王彩琴.貝葉斯公式的推廣[J].數(shù)學(xué)學(xué)習(xí)與研究,2017(11):9.
[4]朱慧明.現(xiàn)代貝葉斯統(tǒng)計(jì)理論的基本觀點(diǎn)與研究現(xiàn)狀[J].江蘇統(tǒng)計(jì),2003(1):12-13.