吳欣娟
據(jù)美國《科技新聞》報道,在一樁犯罪案件的審判中,陪審員提醒法官,在證據(jù)不完全或不確切時,為避免誤判,應參照概率論原理。所謂的概率論只不過是把常識用數(shù)學公式表達出來,使用貝葉斯概率統(tǒng)計法能避免諸多誤判。
貝葉斯概率統(tǒng)計法
貝葉斯方法被證明是非??陀^且強大的推理框架。托馬斯·貝葉斯曾是備受尊敬的牧師。遺憾的是,他非律師,也不是法官,后來成為業(yè)余數(shù)學家。他若是律師,那么今天的同行或許不會這么不情愿地使用其統(tǒng)計方式來洞察審判是否公正。
實際上,貝葉斯當時的論文只是對統(tǒng)計問題的直接求解嘗試,并不清楚他當時是不是已意識到這里面包含著深刻的思想。然而后來,貝葉斯方法改變了概率論,并將應用延伸到各個領(lǐng)域,所有需要作出概率預測的地方都可以見到貝葉斯方法的影子。特別地,貝葉斯是機器學習的核心方法之一。
這背后的深刻原因在于,現(xiàn)實世界本身就是不確定的,人類的觀察能力是有局限性的(否則有很大一部分科學就沒有必要做了——設(shè)想我們能夠直接觀察到電子的運行,還需要對原子模型爭吵不休嗎?),我們?nèi)粘K^察到的只是事物表面上的結(jié)果。這個時候,我們就需要提供一個“猜測”,所謂猜測,當然就是不確定的(很可能有好多種乃至無數(shù)種猜測都能滿足目前的觀測),但也絕對不是兩眼一抹黑瞎蒙。
具體來說,我們需要做兩件事情:1. 算出各種不同猜測的可能性大小;2. 算出最靠譜的猜測。第一個就是計算特定猜測的后驗概率。
在各類案件中,從滑石粉是否導致卵巢癌到被告是否殺人,來自證據(jù)的統(tǒng)計數(shù)據(jù)應該說在案件評估中扮演著重要角色。統(tǒng)計證據(jù)本身就猶如使用DNA匹配或用科學發(fā)現(xiàn)某種可能性一樣。更多時候,也要看證據(jù)是否應納入評估。
在諸多情況下,貝葉斯設(shè)計的統(tǒng)計法往往是得出正確結(jié)論的唯一方法。
然而,今天的法院似乎并不完全相信任何形式的統(tǒng)計數(shù)據(jù)。這并不難理解,因為存在缺陷的統(tǒng)計推理曾導致幾樁著名案件被誤判,將無辜者送入監(jiān)獄。盡管如此,法庭應參照統(tǒng)計數(shù)據(jù),正如科學家常用測試假設(shè)是否正確一樣。這是飽受爭議的方法,但卻使許多科學結(jié)果不可復制。
貝葉斯去世后,1763年人們將其論文整理成《貝葉斯統(tǒng)計學》,這為法醫(yī)統(tǒng)計學提供了更好的選擇。
英國著名的數(shù)學家諾曼·馮頓與同事最近在《統(tǒng)計及其應用年度評論》的一篇論文中寫道,“貝葉斯方法特別適合廣泛的司法推理”,但貝葉斯概率統(tǒng)計法的內(nèi)容大部分被司法界忽視了。倫敦瑪麗皇后大學權(quán)威人士認為,除親子鑒定案例外,貝葉斯理論對法律實踐的影響相形見絀。更不幸的是,他們誤以為,貝葉斯統(tǒng)計法在法律環(huán)境中的應用有著嚴重的缺陷,也找不到很典型的成功案例。
因此,貝葉斯理論應用的標準方法不時被執(zhí)法者稱為謬誤,從而使貝葉斯概率統(tǒng)計法遭到誤解。
是謬誤?抑或確有神奇作用?
英國藥理學家大衛(wèi)·科爾霍恩在最近的一篇博客中解釋稱,在形式邏輯上,檢察官的謬誤被稱為“條件性的轉(zhuǎn)置錯誤”。假設(shè)在人口為1000人的島上殺人。警方在犯罪現(xiàn)場找到了嫌疑人的DNA血樣,而該島擁有這個血樣的男性僅有杰克。不容分說,警察逮捕了杰克,讓他接受DNA復測。杰克的DNA與犯罪現(xiàn)場DNA相匹配,因此他被控告并被送交法院審判。檢察官宣稱,由于該島只有0.4%無辜的人才有這個DNA血樣,所以杰克是殺手,正確概率為99.6%,這被稱為“超越合理的疑證”。
但這一推理導致了致命的缺陷。除非有很好的理由懷疑杰克,即人贓俱獲,否則他也只有千分之一的后驗概率。在這1000位島民中,4人(0.4%)擁有犯罪現(xiàn)場一樣的DNA。因此,作為兇手,杰克只是4個可能性之一,因此他的殺人概率也僅僅是25%,而不是99.6%。
貝葉斯推理法是通過在證據(jù)出現(xiàn)后,而這個證據(jù)又不足的情況下計算出犯罪的概率,它包括犯罪的“先驗概率”(依據(jù)以往經(jīng)驗和分析得出的一種可能性,不是根據(jù)有關(guān)自然狀態(tài)的全部資料測定,而只是利用現(xiàn)有的材料,主要是歷史資料計算得出),從而證明前者是誤判。貝葉斯數(shù)學計算法在許多現(xiàn)實生活中,可預防因疏忽而導致的誤判。
不幸的是,未經(jīng)統(tǒng)計培訓,包括最受尊敬的法律專業(yè)人士都發(fā)現(xiàn)貝葉斯定理很難理解并易違反直覺。關(guān)鍵問題是,真正的刑事案件很少像偷竊紙杯蛋糕那么簡單。馮頓認為,法律證據(jù)通常涉及多種假設(shè)和具有復雜因果依賴性的證據(jù)。適應貝葉斯公式復雜的情況并不簡單。結(jié)合證詞和各種其他證據(jù),需要繪制相互關(guān)聯(lián)的概率網(wǎng)絡(luò)。例如,拿數(shù)學與鉛筆和紙張相比,似乎過于復雜,甚至利用電腦計算也不例外。
直到20世紀80年代末,人們也很難用計算機算法對其進行有效的計算。但如今,先進的電腦可擁有更好的算法,即可用于計算法律案件復雜性的軟件越來越多,這使貝葉斯計算成功的概率越來越高。這為現(xiàn)在提供了一種理想方法以衡量證據(jù)的準確度,以達到合理的法律判斷。然而,世界法律界似乎并不為之所動。
這是為什么呢?原來,盡管貝葉斯是案件推理的完美形式,但很難找到任何有效的貝葉斯理論與實際案例相結(jié)合的各種證據(jù)。法律界依據(jù)邏輯態(tài)度,概率論因此在法庭使用上形同虛設(shè)。
英國有個案例,其上訴法院事實上對使用貝葉斯計算法進行了譴責,他們聲稱陪審團成員應使用依靠“個人常識和世界通用知識”所推測出的證據(jù)。但是,這也正是他們的誤解之處。除了用常識解決復雜問題之外,法院要求將“世界通用知識”應用于證據(jù)的呼吁正是貝葉斯數(shù)學所做。
貝葉斯推理在為評估證據(jù)(或新知識)時能產(chǎn)生神奇的作用,讓法官做出正確的判斷,并且也為他們適當運用現(xiàn)有知識提供了指導。司法系統(tǒng)原本應做得到,因為貝葉斯統(tǒng)計提供了避免錯誤推理的技術(shù)工具。律師應學會使用它,科學家也應如此。
人們確信,終有一天正義會降臨,科學和法律能天衣無縫地協(xié)同產(chǎn)生效用。但正如馮頓及其同事所指出的,科學與法律領(lǐng)域之間存在“巨大的文化障礙”,只有越來越多的相關(guān)專家和利益相關(guān)者贊成并支持它,貝葉斯統(tǒng)計方法才能產(chǎn)生神奇的效用,實現(xiàn)統(tǒng)一的目標。
編輯:成韻 chengyunpipi@126.com