郭文靜
(中南財經(jīng)政法大學(xué) 法學(xué)院,湖北 武漢 430073)
“案多人少”的現(xiàn)實沖突,迫使民事訴訟法不斷尋求新的方式來提高訴訟糾紛解決的效率[1]。然而,制度的內(nèi)生性改革對于緩解法官的審判壓力具有局限性,無法同時兼顧訴訟經(jīng)濟(jì)和程序保障兩個目標(biāo)。近年來,人工智能技術(shù)發(fā)展不斷沖擊著社會生活,國家也積極保障人工智能技術(shù)在司法中的適用,以期實現(xiàn)法律服務(wù)的現(xiàn)代化、科技化轉(zhuǎn)型。2016年,周強(qiáng)院長在第十二屆全國人大五次會議中提出司法改革與司法信息化并駕齊驅(qū)、雙管齊下的戰(zhàn)略,以減輕我國法院的審判壓力、保障訴訟法律服務(wù)的完善。2017年,最高人民法院印發(fā)《最高人民法院關(guān)于加快建設(shè)智慧法院的意見》,指引法院管理信息系統(tǒng)的智能平臺建設(shè)工作。2020年,最高人民法院頒布《關(guān)于深化司法責(zé)任制綜合配套改革的實施意見》,指示各高級人民法院依托智慧法院建設(shè),大力推進(jìn)轄區(qū)法院區(qū)塊鏈技術(shù)應(yīng)用,積極探索法律人工智能的深度應(yīng)用。此外,最高人民法院在其他諸多文件中也多次提到要加強(qiáng)大數(shù)據(jù)、區(qū)塊鏈、云計算、人工智能等技術(shù)在審判領(lǐng)域中的應(yīng)用,為當(dāng)事人提供訴訟便利。人工智能與司法裁判的融合是大勢所趨,依托人工智能替代法官的簡單勞動和重復(fù)勞動,可以緩解法官在審判中的壓力,也可以幫助當(dāng)事人更好地觸達(dá)司法,獲得依據(jù)法律的實質(zhì)正義[2]。
就事實認(rèn)定領(lǐng)域而言,需要解決人工智能與民事事實認(rèn)定融合的法律需求問題。具體而言,解決該項法律需求至少需要思考以下三個問題:第一,“自動售貨機(jī)式的AI法官”[3]是否可以成為現(xiàn)實,法律人工智能是否真的能夠替代法官進(jìn)行事實認(rèn)定。通過探究人工智能技術(shù)的原理“深度學(xué)習(xí)”,則可發(fā)現(xiàn)這一想象在目前的技術(shù)條件下基本不可能實現(xiàn)。第二,人工智能介入事實認(rèn)定將會面臨何種困境,對于當(dāng)事人提出的訴訟資料和證據(jù)資料,人工智能是否可以通過技術(shù)實現(xiàn)完全的理解和綜合地判定。從裁判資料和事實認(rèn)定過程兩個方面,對比分析人工智能事實認(rèn)定和法官事實認(rèn)定過程,可發(fā)現(xiàn)人工智能介入事實認(rèn)定領(lǐng)域的雙重困境。第三,人工智能的學(xué)習(xí)能力是否可以替代法官認(rèn)定某些類型案件的事實。通過對案件事實的類型化分析,將人工智能適用于事實認(rèn)定相對簡單的案件,從而實現(xiàn)人工智能替代法官進(jìn)行事實認(rèn)定。因此,本文立足于上述問題,通過解構(gòu)事實認(rèn)定的裁判資料來源和事實認(rèn)定的方法,審慎地分析人工智能在民事事實認(rèn)定中的適用,以尋求人工智能法律產(chǎn)品的功能指向,期待達(dá)成可以解決民事事實認(rèn)定問題的司法智能系統(tǒng)。
人工智能輔助事實認(rèn)定面臨困境的根源在于全球人工智能技術(shù)發(fā)展條件仍處于“弱人工智能”(1)強(qiáng)人工智能可以高度模仿人腦的神經(jīng)認(rèn)知規(guī)則,不需要人工標(biāo)注的信息,可以自動對數(shù)據(jù)進(jìn)行提煉、分析和分類,輸出數(shù)據(jù)分析的結(jié)果。弱人工智能的輸出結(jié)果取決于輸入信息的計算機(jī)指令,不僅無法超越人類智能,而且只是人類思維的復(fù)制。參見莫宏偉:《強(qiáng)人工智能與弱人工智能的倫理問題思考》,載《科學(xué)與社會》2018年第1期,第14-24頁。階段。因此,人工智能依然遵循深度學(xué)習(xí)的技術(shù)原理,在司法適用中有其固有的結(jié)構(gòu)缺陷;同時,受深度學(xué)習(xí)原理的制約,人工智能在輸入語料、模型建構(gòu)、信息輸出三個維度也都體現(xiàn)出了其適用的單調(diào)性、機(jī)械性。
探究事實認(rèn)定領(lǐng)域人工智能的司法適用,最重要的是厘定人工智能算法學(xué)習(xí)的理論本質(zhì)。實際上,人工智能的算法學(xué)習(xí)包括傳統(tǒng)的算法學(xué)習(xí)、遷移學(xué)習(xí)、深度學(xué)習(xí)等不同算法,但深度學(xué)習(xí)是機(jī)器學(xué)習(xí)方法中最高效的算法。這是因為深度學(xué)習(xí)的算法模式主要是對數(shù)據(jù)的特征進(jìn)行提取和處理,與人腦學(xué)習(xí)模式類同而又超出人腦的計算能力,可以替代人類進(jìn)行大量的數(shù)據(jù)運(yùn)算和信息處理??傮w上,深度學(xué)習(xí)算法模式的具體內(nèi)涵可概括為:機(jī)器模擬人腦的學(xué)習(xí)模式,從輸入端獲取輸入信息,在此基礎(chǔ)上構(gòu)建不同類型的神經(jīng)網(wǎng)絡(luò)模型,最后通過模型的建構(gòu)和數(shù)據(jù)的運(yùn)算完成輸出端的目標(biāo)信息。
具體來說,深度學(xué)習(xí)的技術(shù)原理可以在三個維度上進(jìn)行解讀:一是人工進(jìn)行特征提取和標(biāo)注,并輸入海量數(shù)據(jù)。在這一維度上,輸入數(shù)據(jù)的特征提取和標(biāo)注須源自法學(xué)界的理論共識,并需要轉(zhuǎn)化成機(jī)器可理解的“0-1”知識圖譜[4]。二是神經(jīng)網(wǎng)絡(luò)模型的建構(gòu)和參數(shù)調(diào)試。在這一維度上,循環(huán)神經(jīng)網(wǎng)絡(luò)模型的建構(gòu)依賴編程技術(shù)以及計算機(jī)GPU處理器配置高、算力強(qiáng)的技術(shù)設(shè)備[5]。三是通過超級計算輸出運(yùn)算的數(shù)據(jù)。在這一維度上,數(shù)據(jù)輸出的結(jié)果是否為真,需要通過顯著性檢驗方法,測試深度學(xué)習(xí)模型建構(gòu)的合理程度[6]。當(dāng)然,此項調(diào)參任務(wù)尚需法官、律師等的后驗判斷。由上觀之,輸入數(shù)據(jù)、神經(jīng)網(wǎng)絡(luò)模型的建構(gòu)、輸出數(shù)據(jù)三個層次上都需要人工參與。所謂人工智能,毋寧說有多大程度的智能表現(xiàn)就有多大程度的人工參與。
近來生成式人工智能引起學(xué)界的廣泛關(guān)注,但生成式人工智能與真正意義上的通用人工智能或強(qiáng)人工智能還有較大差距。與初代人工智能相較,生成式人工智能的優(yōu)越性體現(xiàn)在以下三個方面:一是采取了上下文相關(guān)技術(shù),實現(xiàn)了一詞多義的語義區(qū)分,人工智能在自然語言技術(shù)領(lǐng)域?qū)崿F(xiàn)了語義理解能力的提升[7];二是采取Transformer模型,人工智能的長文本生成能力得到大幅提升[8];三是機(jī)器學(xué)習(xí)內(nèi)容的來源開放。它的學(xué)習(xí)數(shù)據(jù)不只局限于計算機(jī)程序的直接指令,還可以從與使用者的互動和交流中學(xué)習(xí)新的知識。
不過,從生成式人工智能產(chǎn)品在我國的現(xiàn)實發(fā)展來看,其具體適用面臨三個問題:第一,ChatGPT是源自美國人工智能研究公司推出的生成式人工智能,其程序指令不是中立的意識形態(tài)和知識系統(tǒng)。實現(xiàn)我國生成式人工智能的應(yīng)用和發(fā)展,還需要完成對上述Transformer模型的突破和發(fā)展。第二,生成式人工智能的技術(shù)原理仍然是深度學(xué)習(xí),其互動式能力的提升源于計算機(jī)長文本生成能力的提高,但其對抽象知識的學(xué)習(xí)仍然局限于數(shù)理等自然科學(xué)領(lǐng)域,對于哲學(xué)、倫理等人文學(xué)科中抽象知識的學(xué)習(xí)能力尚有不足。第三,不能保證生成式人工智能在與使用者的互動中獲得的新知識是正確的,其可能在上下文相關(guān)的理解中獲取錯誤的知識。
深度學(xué)習(xí)的技術(shù)原理可以從輸入語料、神經(jīng)網(wǎng)絡(luò)模型建構(gòu)、輸出結(jié)果三個維度進(jìn)行理解。相應(yīng)地,人工智能適用的機(jī)械性也可從此三個維度進(jìn)行進(jìn)一步闡述。
從輸入語料的角度看,機(jī)器學(xué)習(xí)無法理解復(fù)雜的語言、語義,其學(xué)習(xí)模式與人類差距較大。首先,自然語言的表達(dá)常具有多種含義甚至歧義。人類可以通過復(fù)雜的推理和直覺對模糊的表達(dá)和碎片化的知識進(jìn)行綜合地整理和判斷。但機(jī)器學(xué)習(xí)需要基于嚴(yán)格的形式邏輯,輸入邏輯單調(diào)的語詞。法律語言的適用尚常存在混亂,霍菲爾德對司法推理中所運(yùn)用基本法律概念的歧義進(jìn)行了批判,并對其具體內(nèi)容進(jìn)行了嚴(yán)格的界定[9]。在人工智能的司法適用中,機(jī)器學(xué)習(xí)還需要厘清生活語言中適用基本概念的含混問題和歧義問題。然而,生活語言的語義分析較之法律語言的語義分析更為靈活,現(xiàn)階段自然語言技術(shù)尚無法很好地解決某些特定生活語言的語義分析問題。其次,當(dāng)事人辯論內(nèi)容中自然語言的邏輯可能會出現(xiàn)前后矛盾的問題。法官可以基于審判經(jīng)驗和法理邏輯進(jìn)行綜合判斷,但人工智能卻只能對單一的目標(biāo)函數(shù)尋求最優(yōu)值,無法對多元的目標(biāo)函數(shù)進(jìn)行綜合地判斷。再次,語料輸入的前提應(yīng)當(dāng)是理論界不容爭議的普遍共識。理論界及實務(wù)界尚有爭議的情形及問題,人工智能無法替代人類作出更加明智的決策。這是因為深度學(xué)習(xí)原理的本質(zhì)是復(fù)制人類的經(jīng)驗和知識,而非對人類心智的超越。
從神經(jīng)網(wǎng)絡(luò)模型建構(gòu)的角度看,循環(huán)神經(jīng)網(wǎng)絡(luò)模型是一個處理信息的中間處理器,它由無數(shù)的數(shù)據(jù)節(jié)點組成,不斷地進(jìn)行運(yùn)算。機(jī)器學(xué)習(xí)是對海量的數(shù)據(jù)進(jìn)行分析輸出數(shù)據(jù)分析的結(jié)果,是一種歸納性的學(xué)習(xí),需要人工提取“知識表達(dá)”的具體邏輯[10]。從事實認(rèn)定的結(jié)構(gòu)要素反向觀之,事實認(rèn)定知識表達(dá)的邏輯與機(jī)器學(xué)習(xí)形式邏輯的特性不同。具體來說,事實認(rèn)定的整個過程包括三個步驟:一是獲取當(dāng)事人提出的訴訟資料和證據(jù)資料;二是法官通過自由心證,獲得對整個案件事實的內(nèi)心確信;三是法官無法達(dá)成內(nèi)心確信時適用證明責(zé)任這一事實認(rèn)定的輔助方法。上述三個步驟中均體現(xiàn)了事實認(rèn)定中知識表達(dá)的非單調(diào)性。首先,訴訟資料和證據(jù)資料的整理,并非簡單的線性邏輯,而是綜合的、整體的判斷。其次,法官自由心證需要利用法律推理、經(jīng)驗法則等多元知識要素。再次,證明責(zé)任之適用則更是需要借助實定法規(guī)范(規(guī)范說)和利益衡量理論(反規(guī)范說)[11]。概而言之,人工智能在事實認(rèn)定領(lǐng)域的司法適用面臨多重困境,神經(jīng)網(wǎng)絡(luò)模型的建構(gòu)是重點所在。
從人工智能輸出結(jié)果的角度看,神經(jīng)網(wǎng)絡(luò)模型只能對于輸入語料按照具體指令輸出內(nèi)容。換言之,人工智能只能基于海量數(shù)據(jù)作為學(xué)習(xí)基礎(chǔ),在沒有海量數(shù)據(jù)的情形下,機(jī)器無法完成處理信息和預(yù)測信息的任務(wù)。例如,在小數(shù)據(jù)集合的特征提取和預(yù)測問題上,由于機(jī)器學(xué)習(xí)缺乏對抽象知識的學(xué)習(xí)能力,因而無法完成對小數(shù)據(jù)集合的信息預(yù)測。對此,有算法專家提出運(yùn)用遷移學(xué)習(xí)法,旨在以較少的學(xué)習(xí)數(shù)據(jù)完成特征提取和信息預(yù)測,從而解決深度學(xué)習(xí)這一算法模式數(shù)據(jù)量需求高的弊端,但該算法模式尚在研究中[12]。因此,機(jī)器無法有效面對法律變更后事實構(gòu)成要素的變化,由于缺乏抽象知識表示的算法[13],在法官裁判案件數(shù)量亦較少的情形下,深度學(xué)習(xí)無法完成對新類型案件的事實認(rèn)定工作。換言之,對于法律條文變化導(dǎo)致的事實判斷因素的改變,機(jī)器需要在法官判定相當(dāng)數(shù)量的案件以及人工對事實判斷因素進(jìn)行提取和標(biāo)注后,再高效地完成輸出預(yù)測信息的任務(wù)。
理論上,民事事實認(rèn)定主要通過事實認(rèn)定的資料來源和事實認(rèn)定的方法兩方面來獲得最終的事實認(rèn)定結(jié)果。通過解構(gòu)裁判資料和事實認(rèn)定方法這兩個要素,可知機(jī)器學(xué)習(xí)的機(jī)械性導(dǎo)致了人工智能在事實認(rèn)定領(lǐng)域的司法適用面臨雙重困境。
全部的民事裁判資料,即法官心證形成事實認(rèn)定的原因或資料,包括辯論全趣旨獲得的訴訟資料以及通過證人的證言內(nèi)容、文書的記載內(nèi)容等證據(jù)方法獲得的證據(jù)資料[14]。從裁判資料形成的角度來講,法官心證形成的結(jié)果可能會因弱人工智能的技術(shù)制約而產(chǎn)生預(yù)測結(jié)果的偏差。
1.受自然語言技術(shù)制約訴訟資料獲取不足。在民事裁判中,訴訟資料的獲取很大程度上來自當(dāng)事人之間的辯論。除此之外,證據(jù)資料的獲取僅對要證事實問題的解決發(fā)揮功效。在辯論過程中,原告一方首先對案件事實進(jìn)行權(quán)利主張,使用自然語言對提起訴訟的本案生活事實進(jìn)行陳述;接著,當(dāng)事人通過對事實爭點和法律爭點的辯論,依據(jù)請求原因、訴訟時效、事實抗辯等方法進(jìn)行攻擊防御。這些程序展開的過程均是依靠當(dāng)事人雙方自然語言的適用。
但人工智能針對自然語言的技術(shù)尚不成熟。其具體的工作機(jī)理可以大致理解為“自然語言——法律語言——計算機(jī)語言”三種語言之間的轉(zhuǎn)化[15]。三種語言之間的轉(zhuǎn)化需要高超的算法和程序,形成計算機(jī)的一種自動推理模型。法律人工智能工作涉及自然語言、法律語言和計算機(jī)語言三種語言之間的遞進(jìn)和轉(zhuǎn)化。人工智能機(jī)器學(xué)習(xí)的語言技術(shù)相當(dāng)復(fù)雜,因為語言不止承載了文字表面表達(dá)的含義,還包括了語詞、語義、語法[16]。為了促使數(shù)據(jù)信息的準(zhǔn)確,需要人工提煉機(jī)器所能理解的關(guān)鍵信息,將書面語、口頭語進(jìn)行信息提取整合進(jìn)入機(jī)器學(xué)習(xí)的語料庫,并將該關(guān)鍵信息進(jìn)行向量、矩陣、復(fù)合函數(shù)等的結(jié)構(gòu)化表達(dá),使得人工智能理解輸入的語料并進(jìn)行信息的輸出。
若機(jī)器學(xué)習(xí)對于當(dāng)事人辯論全趣旨的資料無法有效識別,就喪失了掌握事實認(rèn)定方法的前提。人工智能應(yīng)用于事實認(rèn)定存在的主要問題可以具體闡述為三個方面。第一,從技術(shù)角度講,人工智能自然語言技術(shù)尚不成熟。因為人工智能語言技術(shù)仍不能做到對生活語言以及語言含括的邏輯思維進(jìn)行迅速反應(yīng),更不能對當(dāng)事人的權(quán)利主張作出合乎法律思維的語言回饋。換言之,人工智能對于證據(jù)信息繁雜的綜合判定,主張—抗辯—再抗辯—再再抗辯的辯論過程中及時反饋能力是不足的。第二,從語言精確度講,因缺乏律師強(qiáng)制代理制度而導(dǎo)致生活事實的陳述缺乏法律語言的精確性。由于我國法律職業(yè)發(fā)展的歷史特點,目前律師數(shù)量不能滿足法律服務(wù)市場的需求,民事案件中有很大部分案件無律師代理。因此,當(dāng)事人在法庭中主張事實的語言不可避免地具有自然語言的屬性。自然語言的模糊性、靈活性與人工智能識別的機(jī)器語言具有鮮明的差異性。概括而言,律師強(qiáng)制代理制度的缺乏,一定程度上導(dǎo)致了人工智能法律產(chǎn)品無法有效地識別當(dāng)事人提出的訴訟資料。第三,就人工智能的發(fā)展階段而言,人工智能對于法律知識的理解和轉(zhuǎn)化存在困境。目前,我國的人工智能技術(shù)尚不足以達(dá)到掌握邏輯思維和進(jìn)行主觀性判斷的強(qiáng)人工智能階段,僅處于能夠深度學(xué)習(xí)、復(fù)制人類思維的弱人工智能階段。而且,復(fù)制人類思維也需要大量的關(guān)鍵信息提取和人工標(biāo)注工作。因此,對于法律知識內(nèi)含的法律邏輯和法律論證思維,弱人工智能尚無法完成高質(zhì)量的認(rèn)知和判斷。具體而言,在事實認(rèn)定過程中,事實的層次是多維度的,法官應(yīng)當(dāng)根據(jù)當(dāng)事人的實體請求權(quán),分析當(dāng)事人權(quán)利主張中涉及的要件事實、主要事實、間接事實、輔助事實。這需要機(jī)器對法律知識能夠熟練掌握并準(zhǔn)確運(yùn)用,但人工智能機(jī)器如何用函數(shù)表達(dá)上述抽象的法律概念,是深度學(xué)習(xí)亟需打破的算法困境。
綜上所述,受自然語言技術(shù)制約,人工智能對辯論全趣旨獲得的訴訟資料有所欠缺。一方面,由于自然語言欠缺精確性,人工智能在事實認(rèn)定技術(shù)環(huán)節(jié)存在重要不足;另一方面,則是由于人工智能對法律知識的理解能力存在欠缺,人工智能對事實的認(rèn)定尚不能完成法律意義上的解讀。
2.受自然語言技術(shù)、圖像識別技術(shù)制約證據(jù)資料獲取不足。依照當(dāng)事人是否爭執(zhí),完整的本案事實可分為非爭執(zhí)事實和爭執(zhí)事實。非爭執(zhí)事實和爭執(zhí)事實在人工智能司法適用中事實認(rèn)定的地位不同。非爭執(zhí)事實通過辯論主義可以消解,即與上文自然語言技術(shù)的分析類似,下文不再進(jìn)行重復(fù)論證。爭執(zhí)事實(要證事實)則需要當(dāng)事人主張不同的證據(jù)資料進(jìn)行證明,需要法官通過證據(jù)資料進(jìn)行綜合的判斷和考量,從而對待證事實形成內(nèi)心確信。關(guān)于證據(jù)資料的獲取限度則涉及自然語言技術(shù)和圖像識別技術(shù)兩類。
為分析人工智能法律產(chǎn)品下證據(jù)資料可獲得限度的方便,采納按照證據(jù)共通點和差異性進(jìn)行證據(jù)類型分類,即將證據(jù)類型分為實物證據(jù)、言辭證據(jù)和過程性證據(jù)三類(2)實物證據(jù)分為書證、物證、視聽資料、電子數(shù)據(jù)四種;過程性證據(jù)分為鑒定意見、勘驗筆錄兩種;言辭證據(jù)分為當(dāng)事人陳述、證人證言兩種。參見王亞新、陳杭平、劉君博:《中國民事訴訟法重點講義》,高等教育出版社,2021年,第100頁。。由于采取線上虛擬法律空間,證據(jù)資料的信息載量必然因人工智能技術(shù)的發(fā)展現(xiàn)狀受到制約,其信息減損程度由高到低依次為:言詞證據(jù)、實物證據(jù)、過程性證據(jù)。
第一,證人證言、當(dāng)事人陳述等言詞證據(jù)的信息可獲得性,如同上述辯論全趣旨提供的訴訟資料分析相同,均因為自然語言技術(shù)無法精確識別生活語言的內(nèi)涵和邏輯而無法發(fā)揮應(yīng)有的功能。
第二,實物證據(jù)由于其記載信息、形狀外觀等物理特性,同樣在人工智能法律產(chǎn)品服務(wù)中獲得的信息受到減損。因為在人工智能適用事實認(rèn)定領(lǐng)域時,實際上是采虛擬空間中的識別,由于必須采取攝像、傳輸?shù)染W(wǎng)絡(luò)信息技術(shù)提交人工智能法律產(chǎn)品。盡管不存在自然語言技術(shù)領(lǐng)域的識別問題,但卻存在著攝像聚焦角度、清晰度分辨率等專業(yè)的技術(shù)問題,對于實物證據(jù)內(nèi)含的信息識別和提取存在較大問題??傮w來說,實物證據(jù)中涉及的實體識別技術(shù):圖像識別技術(shù),采用相似度算法,較之自然語言中的語義理解發(fā)展更為成熟[17]。
第三,過程性證據(jù)中的鑒定意見和勘驗筆錄也受到減損。因為鑒定意見和勘驗筆錄是交由專業(yè)的技術(shù)人員或法官進(jìn)行證據(jù)證明事實的分析和論證,其證據(jù)信息可以表述為邏輯性強(qiáng)的算法學(xué)習(xí)可獲知的知識圖譜。較之言辭證據(jù)和實物證據(jù),過程性證據(jù)因其專業(yè)性的表達(dá)、清晰的是非判斷,而較易被機(jī)器數(shù)據(jù)化表達(dá)和識別。因此,鑒定意見和勘驗筆錄的證據(jù)信息可獲得性最高。
一般而言,法官通過證據(jù)資料或經(jīng)驗法則形成心證,完成對待證事實的內(nèi)心確信,并在無法形成確定心證時采取證明責(zé)任的風(fēng)險分配法則。因此,法律人工智能必須完成上述兩項事實認(rèn)定的判斷任務(wù):自由心證的形成以及證明責(zé)任的適用。
1.機(jī)器學(xué)習(xí)機(jī)械性與法官心證自由的沖突。從人工智能技術(shù)應(yīng)用的現(xiàn)實角度看,要實現(xiàn)人工智能對事實認(rèn)定的目標(biāo),至少需要通過四個步驟。第一,整理相關(guān)裁判文書,對陳舊紙質(zhì)裁判文書進(jìn)行電子化掃描以及網(wǎng)絡(luò)化傳輸。第二,提取事實認(rèn)定材料中的關(guān)鍵信息,人工進(jìn)行識別和標(biāo)注。第三,剔除錯誤的判定結(jié)果、保留正確的判定結(jié)果。這是因為人工智能學(xué)習(xí)信息的能力很強(qiáng),但重要的問題在于它既可以學(xué)習(xí)正確的知識,也可以學(xué)習(xí)錯誤的知識。因此,在人工智能判定事實的過程中應(yīng)當(dāng)重點關(guān)注不正確裁決的剔除。否則,基于學(xué)習(xí)樣本數(shù)量的有限性以及作為學(xué)習(xí)樣本的輸入信息之間沖突,可能會導(dǎo)致輸出的結(jié)果運(yùn)算不正確。
概而言之,人工智能對事實認(rèn)定的結(jié)果與法官心證之間既有聯(lián)系,也有沖突。二者聯(lián)系的基礎(chǔ)在于人工智能對事實的認(rèn)定是基于法官對事實認(rèn)定的經(jīng)驗。因為深度學(xué)習(xí)原理下,人工智能的學(xué)習(xí)數(shù)據(jù)是源自法官依照自由心證制作的裁判文書;人工智能的運(yùn)行模式是模擬和分解法官事實認(rèn)定的思維結(jié)構(gòu);人工智能算法的調(diào)參和優(yōu)化也需要法官作為法律專家進(jìn)行專業(yè)地評斷。二者沖突的地方在于:從事實認(rèn)定方法與人工智能認(rèn)知邏輯比較而言,法官適用的事實認(rèn)定方法與人工智能認(rèn)知邏輯存在著結(jié)構(gòu)性的矛盾。該矛盾在于人工智能在事實認(rèn)定中的司法適用是對待證事實證明結(jié)果的認(rèn)定,而無法完全復(fù)制法官進(jìn)行事實認(rèn)定過程中的思維結(jié)構(gòu)。具體來說,其可從以下兩個角度進(jìn)行闡述。
第一,由法官對事實認(rèn)定的結(jié)構(gòu)觀之,法官需要在當(dāng)事人主張的生活事實中依據(jù)法律條文的解釋厘清主要事實,通過書證、物證、人證等不同證據(jù)方法獲得重要的證據(jù)資料,與案件裁判有重大影響的重要間接事實,與判斷證據(jù)是否真實相關(guān)的輔助事實。但人工智能對不同層次的事實認(rèn)定存在困難。從法官認(rèn)定事實的方法而言,是依據(jù)法官的自由心證。自由心證是基于對法定證據(jù)制度僵化適用的修正,外在上體現(xiàn)為法官的論證自由,但其內(nèi)在也受法律準(zhǔn)則、經(jīng)驗法則、一般社會習(xí)慣等的制約[18],法官應(yīng)當(dāng)根據(jù)內(nèi)心的良知對案件事實進(jìn)行認(rèn)定。但人工智能對于這種內(nèi)在制約的算法表達(dá)存在困難,算法無法表達(dá)這種高度抽象的知識和要素。
第二,由人工智能對事實認(rèn)定的模型觀之,其對辯論材料的理解、證據(jù)證明的結(jié)果,均體現(xiàn)為神經(jīng)網(wǎng)絡(luò)模型對數(shù)據(jù)的處理,而不是對法律準(zhǔn)則、經(jīng)驗法則、一般社會習(xí)慣等的學(xué)習(xí)。從人工智能事實認(rèn)定的方法而言,人工智能對事實的認(rèn)定重在輸出結(jié)果,而不是論證過程。因為人工智能只能對數(shù)據(jù)本身進(jìn)行復(fù)制學(xué)習(xí),而無法依據(jù)抽象的知識進(jìn)行超出數(shù)據(jù)外的創(chuàng)造性認(rèn)知。從事實認(rèn)定的分層式論證而言,人工智能需要進(jìn)一步改善事實認(rèn)定的模型和算法。毋寧說這種對事實認(rèn)定結(jié)果的判斷完全依賴于數(shù)據(jù)和模型,又重新落入了“人工智能法定證據(jù)”的窠臼,是一種新形式的法定證據(jù)主義。
2.機(jī)器學(xué)習(xí)機(jī)械性與證明責(zé)任適用的難題。除法官運(yùn)用自由心證認(rèn)定事實外,實際上,證明責(zé)任在結(jié)果意義上可以理解為法官在心證無法得到確信時判斷本案事實的一種輔助方法[19]。對于證據(jù)信息復(fù)雜的案件,法官需要通過訴訟指揮增進(jìn)當(dāng)事人對證據(jù)的提出和事實的主張,以明確案件的要件事實,確定要件事實的法律效果。一個案件的證據(jù)信息,包括間接證據(jù)和輔助證據(jù)等,證據(jù)與證據(jù)之間互相連接、互相印證,形成明確的法律事實。不過,當(dāng)事人雙方竭盡全力提出所有的證據(jù),法官依照經(jīng)驗法則和典型事實仍對要件事實的認(rèn)定陷入難以抉擇的困境時,則需要借助證明責(zé)任的適用進(jìn)行不利法律后果的風(fēng)險分配從而間接實現(xiàn)事實認(rèn)定。
在一定程度上,可以說法官心證對基于證據(jù)證明和辯論全趣旨獲得確定心證的個體差異不大,尚能為機(jī)器學(xué)習(xí)提供標(biāo)準(zhǔn)統(tǒng)一的海量數(shù)據(jù)。但作為輔助事實認(rèn)定方法的證明責(zé)任理論,由于其理論移植與本土的差異以及理論適用的復(fù)雜性,在裁判文書中法官應(yīng)用較少,且較為混亂[20]。第一,適用證明責(zé)任理論裁判的文書數(shù)量較少,則機(jī)器可學(xué)習(xí)的樣本數(shù)量較少。如同上文所述,少量的樣本數(shù)據(jù)導(dǎo)致機(jī)器學(xué)習(xí)存在困境,無法進(jìn)行數(shù)據(jù)的優(yōu)化和精準(zhǔn)地輸出。第二,適用證明責(zé)任理論的裁判文書存在認(rèn)定結(jié)果相反的情形。在類案但非同案中,法官面對相同的要件事實無法獲知真?zhèn)螘r,可能由于對實體法所表達(dá)的證明責(zé)任規(guī)范理解差異而導(dǎo)致不同的結(jié)果責(zé)任分配,從而導(dǎo)致法官對相同事實認(rèn)定的結(jié)果完全不同。如此,事實認(rèn)定的矛盾和沖突會導(dǎo)致學(xué)習(xí)樣本的不同一。即使裁判文書數(shù)量增加的前提下,由于司法實踐中證明責(zé)任理論適用不一,機(jī)器學(xué)習(xí)樣本的信息存在沖突,輸入數(shù)據(jù)信息的標(biāo)準(zhǔn)不一,那么,機(jī)器學(xué)習(xí)生成的判決文本也會存有爭議。此種情形下,首要的問題不是人工智能如何精準(zhǔn)地復(fù)制法官的裁判思維,而是裁判文書中法官的判定是否達(dá)到了統(tǒng)一。否則,由于訓(xùn)練集樣本的輸出信息存在矛盾可能導(dǎo)致人工智能學(xué)習(xí)輸出內(nèi)容的沖突。
由于證明責(zé)任理論在法律移植進(jìn)程中未能完全吸收其理論本質(zhì)以及我國追求法律真實的訴訟價值觀,該理論的適用在我國學(xué)理與實踐之間產(chǎn)生較大分離[21]。除此之外,我國計算機(jī)法學(xué)發(fā)展并不具有優(yōu)勢地位。因此,理論與實踐的分離在橫跨了法官個體經(jīng)驗差異的同時又增加了算法學(xué)習(xí)技術(shù)的優(yōu)劣,兩個梯度的分離可能會導(dǎo)致理論與實踐產(chǎn)生難以逾越的鴻溝。
目前,人工智能在事實認(rèn)定領(lǐng)域存在裁判資料獲取不充分和事實認(rèn)定證明方法之雙重困境。就人工智能在事實認(rèn)定方面的具體適用而言,首先,可以從司法實踐中簡易程序適用的要素式審判法開始,探索要素式審判對人工智能模型建構(gòu)的功能;其次,可以通過對事實進(jìn)行類型劃分,通過分解“三段論”論證結(jié)構(gòu)形成新的“準(zhǔn)三段論”論證模式,完成人工智能在事實認(rèn)定領(lǐng)域的進(jìn)階發(fā)展。
所謂要素式審判法,就是圍繞案件的基本要素進(jìn)行庭審并制作裁判文書的一種略式審判方法[21]。具體而言,就是在審理民事案件的過程中,對一些能夠概括出固定案情要素的案件,進(jìn)行要素提煉,并對雙方當(dāng)事人就案件中各種要素是否存在爭議進(jìn)行歸納。這種要素式審判在司法實踐中簡便易行,可以明顯提高法官審理案件的效率,促進(jìn)糾紛的迅速解決。
實際上,要素式審判法是司法實踐中面對“案多人少”情形下提煉的法官智慧,通過對案件事實的要素式提取,從而簡化案件的事實認(rèn)定過程。這種審理方式對事實進(jìn)行了精確的細(xì)分,從而為人工智能認(rèn)定事實提供了簡單的知識圖譜。人工智能的事實認(rèn)定借鑒要素式審判法的前提是肯認(rèn)人工智能發(fā)展的技術(shù)階段,并將人工智能事實認(rèn)定的范圍限縮為“事實爭議不大、權(quán)利義務(wù)關(guān)系明確”的簡易案件。這是因為此類簡易案件的事實認(rèn)定符合人工智能技術(shù)發(fā)展的現(xiàn)狀。
綜上,要素式審判法提煉了審理案件過程中法官需要識別的關(guān)鍵特征和信息提取,為人工智能司法裁判的知識圖譜提供了建構(gòu)的基礎(chǔ)。在一般情況下,大多數(shù)簡易案件的庭審,都非常適合運(yùn)用要素式審判法。根據(jù)《中華人民共和國民事訴訟法》第40條,簡易案件審理的形式化標(biāo)準(zhǔn)為“權(quán)利義務(wù)關(guān)系明確、案件事實爭議不大”,而且實踐中簡易案件占比高達(dá)80%[22]??梢姡瑢嵺`中簡易案件要素式審判方法適用范圍較大,人工智能在民事案件中的適用范圍廣闊。借鑒要素式審判法,人工智能可以較好地完成民事事實認(rèn)定的工作。
簡易案件的事實認(rèn)定模式較為簡單,人工智能借鑒要素式審判法可以較好地建構(gòu)事實認(rèn)定的模型。不過對于事實認(rèn)定復(fù)雜的案件,事實認(rèn)定的模型建構(gòu)較為復(fù)雜,人工智能學(xué)習(xí)需要面對多元的目標(biāo)和任務(wù),這恰是人工智能無法克服的弱點。
從案件事實的復(fù)雜性程度來講,案件事實的層次可分為主要事實、間接事實、輔助事實等多個層次。有學(xué)者提出可以將事實的層級進(jìn)行分類,采取選定特征事實的方法,相應(yīng)地對法律權(quán)利義務(wù)產(chǎn)生、消滅、抗辯效力的規(guī)范層級進(jìn)行分類,再將二者進(jìn)行層級對應(yīng)[23]。這種微觀的層級論證模式,拆分主要事實和法律適用的具體要素,形成了“T1→R1”的“準(zhǔn)三段論”法律論證模型。該模型突破了簡單三段論中“大前提-小前提-結(jié)論”的論證結(jié)構(gòu),一定程度上實現(xiàn)了事實認(rèn)定模型的多層級構(gòu)筑。在此基礎(chǔ)上,“準(zhǔn)三段論”法律模型利用形式邏輯模擬證據(jù)、事實的推理以及其他類型的推理,對智能輔助決策的模型建構(gòu)具有突破性、啟發(fā)性的意義[24]。盡管該層級式事實模型的建構(gòu)需要更為復(fù)雜的算法和模型,但該層級式模型無疑拓展了人工智能在事實認(rèn)定領(lǐng)域的適用空間,為人工智能在事實認(rèn)定領(lǐng)域中的司法適用指引了理論方向。
綜上而言,要素式審判法中的事實認(rèn)定模型只能解決簡易案件的智能化認(rèn)定,多層級的“準(zhǔn)三段論”論證模型則為人工智能判定相對復(fù)雜的案件提供了可行的路徑。
適用人工智能產(chǎn)品輔助事實認(rèn)定工作可以為法官節(jié)省簡單勞動的時間,譬如書寫格式化的法庭記錄、法律文書。由于人工智能的科技屬性,很多文書錯誤可能會得到及時的糾正或者直接全部避免,文書的寫作格式也更加規(guī)范統(tǒng)一。在事實認(rèn)定過程中,區(qū)分客觀化、標(biāo)準(zhǔn)化、流程化的案件審理類型與主觀性、靈活性、彈性空間較強(qiáng)的案件審理類型。將確定性的案件類型適當(dāng)賦予人工智能負(fù)擔(dān),減輕法官的審判壓力,將不確定性因素較強(qiáng)的案件類型仍然賦予法官進(jìn)行判斷裁決,形成法官獨立審判與人工智能輔助參與審判的兩重審判格局。兩重審判格局的形成有助于促進(jìn)社會糾紛解決的制度效率,保障司法的觸達(dá)和正義的分配,解決法院案多人少的矛盾。