0,P(Bi)>0(i=1,2,…,n),則:稱其為貝葉斯"/>
易強
【摘要】貝葉斯公式被用于已知信息對原有判斷進行修正提供完美的方法。憑借以往的經驗,經濟主體對先前的假設有預先的估計,對于先驗概率的評估,一般可根據(jù)事物本身的經驗加以判斷;貝葉斯公式的應用十分廣泛。
【關鍵詞】貝葉斯公式全概率公式條件概率
【中圖分類號】G64 【文獻標識碼】A 【文章編號】2095-3089(2020)25-0094-02
1.定理
已知試驗E的樣本空間記為S,A是E的事件,B1,B2,…,Bn是S的一個劃分,且滿足P(A)>0,P(Bi)>0(i=1,2,…,n),則:
稱其為貝葉斯公式。
證明:根據(jù)條件概率的定義,以及全概率公式可得:
注:若n=2時,將B1改成B,并將B2改成B,則有如下兩個式子成立:
2.貝葉斯公式的實際應用
(1)根據(jù)以前的臨床記載,某種檢驗癌癥的試驗存在以下的效果,現(xiàn)記A代表事件“試驗反應呈陽性”,記C代表事件“被診斷成癌癥”,并有P(A|C)=0.95,P(A|C)=0.95。經過對自然人群進行普查,假設被檢測的人存在癌癥的概率是0.005,故P(C)=0.005,則P(C|A)等于多少?
由此結果可得,雖然有P(A|C)=0.95,P(A|C)=0.95,此兩概率均比較大。但是將此試驗拿來普查,卻得P(C|A)=0.087,它的正確率只有8.7%(即每1000個存在陽性反應的人中,大概具有87人具有癌癥)。如果沒有注意到此點,則會得出錯誤的結論;當將P(A|C)與P(C|A)混淆后必定造成可怕的結果。
(2)某個工廠存在四個車間生產相同的一種零件,已知四個車間的產量依次占總產量的15%,20%,30%和35%,這四個車間生產的次品率,分別為0.04、0.03、0.02和0.01。工廠規(guī)定,如果發(fā)現(xiàn)了次品就會追究相關車間的經濟責任。現(xiàn)在從該廠生產的產品中任取一件,結果是次品,但該件次品是哪個車間生產的代碼已經脫落,則廠方該怎樣處理這件次品比較合理?
再通過貝葉斯公式計算得:
根據(jù)上面的規(guī)定,4個車間依次應該承擔27.91%,27.91%,27.91%和16.28%的經濟賠償,這樣處理結果是比較合理的,由此還可以發(fā)現(xiàn),盡管第四個車間的產量占到總產量的35%,但是它的次品率卻是最低的,如果單憑經驗按照生產的產量多少來處罰,就不好。
(3)通過資料介紹,存在某一項艾滋病的血液測試的敏感度(也就是確實有艾滋病的患者的檢測結果會呈陽性)是95%,但是如果沒有得艾滋病的檢測者測得的精確度(即健康的人檢測為陰性)是99%。眾所周知,美國是一個艾滋病發(fā)病較為平凡的國家,約有1/1000的人員患有艾滋病。如果希望能有效的控制這種疾病,并且希望有效的控制艾滋病的快速傳播,最近幾年,有醫(yī)藥專家提議對新結婚的年輕夫婦要用這種方法進行檢測,但是該方案提出后,卻遭到了另外一些醫(yī)藥專家的反對,使得此項計劃未能通過。
如何來解釋醫(yī)藥專家沒有通過這項決議,現(xiàn)用貝葉斯公式來對其進行解釋:
記:A={測試的結果呈現(xiàn)陽性反應},B={某人被確診成了艾滋病患者},由以上分析可得:
通過以上計算結果可得,被檢測的患者確確實實是艾滋病患者的概率僅有0.087,這個結果概率很小,和我們實際的感受很不符合,依據(jù)我們提供的資料表明,這種檢測結果表面上看來似乎精確度很高,這樣就會使得一般人會這樣認為,假定一個人檢測出陽性,他就可能會認為,他患艾滋病的概率大約是90%,然而計算的結果實際上卻是很小的,為8.7%,因此,假定要是通過了這項決議,就會導致更多的新婚夫婦產生不必要的恐慌,因為這其中其實大約有接近91.3%的患者并沒有得上艾滋病,產生這個結果的原因是什么呢?這是由于得上艾滋病的人員的概率其實是相當?shù)偷?,僅有1/1000的小概率事件,從而,在被檢測出為陽性的所有患者里面,有很大一部分人員是沒有得艾滋病的,舉例說明如下:隨機的在當?shù)爻槿?000名實驗者,則存在1名得了艾滋病的人員,而另外的999名人員未患艾滋病,由全概率公式:1×0.95+999×0.01=10.94,即呈陽性的人約11人,但只有1人真正的患了艾滋病,這需要重新進行檢測。
(4)一般進行普通檢測的40歲左右的婦女患乳腺癌的幾率大概為1%,假定某位婦女患有乳腺癌,那么她將有80%的概率進行早期的胸部腫瘤的X射線的檢測。即使某位婦女沒有患乳腺癌,她也有大約9.6%的幾率進行早期的胸部腫瘤的X射線的檢測,如果在這個群體中做常規(guī)檢測的婦女,又做了早期的胸部腫瘤的X射線檢測,試問該名婦女患乳腺癌的可能性是多少?
此問題中,對于心理專家來說,他們最關心的問題是,那
些不懂貝葉斯原理的人是如何分析概率的,現(xiàn)將他們的主觀判定結果和利用貝葉斯公式算出來的答案作對比,進行推理其規(guī)律,結果是什么呢?有95%的內科醫(yī)生的判斷處于70%~80%這個范圍,和正確答案相差較大。
記:B={患上乳腺癌的人},A={進行早期的胸部腫瘤的X射線的檢查},則有:
P(B)=0.01,P(B)=0.99,P(A|B)=0.8,P(A|B)=0.096;由全概率公式可得:
再利用貝葉斯公式可得:
從而可得,從這個年齡段的婦女在做常規(guī)檢測的同時做了早期的胸部腫瘤的X射線的檢測,但其實她患得乳腺癌的可能性是0.0776。
(5)測謊儀是一種測試是否說謊的儀器,常常用于刑事案件的偵破,或審問犯人時使用。
記:T={測試出某人在說謊話},L={某人真正在說謊話},參考以往的經驗:
P(T|L)=0.88,P(T|L)=0.86,據(jù)此表面上看,測謊儀有一定效果,現(xiàn)假定在一次實驗中,被檢測者在說謊話,依據(jù)前面提到的數(shù)據(jù),可能很多人都或多或少的認為,此人說謊的概率是很高的,不妨就設為0.87,實際上,在公安部門審問過程中,大部分人員說話還比較誠實,不妨記:P(L)=0.01,從而由全概率公式可得:
再利用貝葉斯公式可得:
依據(jù)所檢測的結果來看,大約有94%的檢測均是錯誤的。要是測謊儀導致了被測者被逮捕,那后果比較嚴重。
(6)如果某人患有精神分裂癥,則當進行CAT掃描時,存在30%的案例是腦萎縮,如果對正常人進行CAT掃描,只有2%的腦萎縮,在美國大約有2%的人患有精神分裂癥,試分析CAT掃描成腦萎縮的人,患精神分裂癥的概率是多少?
記:A={某人CAT掃描腦萎縮},B={某人做掃描就患有精神疾病},P(B)=0.015,
由全概率公式得:
3.小結
小結.貝葉斯率最先提出了基于先驗概率的條件概率的計算方法。自從提出后一直有廣泛的應用,例如在統(tǒng)計學、概率論、風險管理、人工智能領域等方面均有廣泛的運用。本文主要借助貝葉斯公式在修正先驗概率中的應用。對于貝葉斯公式的介紹,很多書都講得比較少,而所舉的例子也是簡單的,本文主要是對教材的講解加以擴充和加深,貝葉斯公式還有一個很好的用處就是對那些看似正確的結論可以加以檢驗。
參考文獻:
[1]曹小玲.淺談概率論中“數(shù)學期望”概念的講解[J].教育教學論壇,2014(45):199-200.
[2]謝永欽.概率論與數(shù)理統(tǒng)計[M].第2版.北京:北京郵電大學出版社,2013:89-98.
[3]段麗凌.淺析數(shù)學期望在經濟生活中的應用[J].商場現(xiàn)代化,2008(11):71-72.
[4]謝國瑞.概率論與數(shù)理統(tǒng)計[M].北京:高等教育出版社,2002.
[5]王梓坤.概率論基礎及其應用[M].北京:北京師范大學出版社,2007.