當(dāng)前,大規(guī)模的判例自發(fā)性運用已是法律實踐中十分顯著的現(xiàn)象?!芭欣园l(fā)性運用現(xiàn)象生成的外部因素在于裁判文書上網(wǎng)所形成的‘互聯(lián)網(wǎng)+’效應(yīng),而內(nèi)在因素主要包括我國司法中規(guī)范資源的不足與缺失、司法自我認(rèn)同與社會認(rèn)同的廣泛形成、訴訟特征的重要現(xiàn)實變化等”。(1)顧培東:《判例自發(fā)性運用現(xiàn)象的生成與效應(yīng)》,《法學(xué)研究》2018年第2期,第76頁。判例的大規(guī)模上網(wǎng)公開確實很大程度上推動了判例在我國的推廣和運用,但同時每年千萬級的判例更新也導(dǎo)致判例爆炸時代猝不及防地到來了。原有的判例收集、整理、篩選和歸類方法難以應(yīng)對海量判例的處理工作,實際上,對于判例的處理和在具體問題上的運用而言,已經(jīng)出現(xiàn)了判例過載的問題,判例數(shù)量高速、大幅度的增長可能會對判例的運用產(chǎn)生消極的影響。人們希冀通過建設(shè)信息化系統(tǒng)的方式來解決判例過載的問題,并實現(xiàn)對于判例更加準(zhǔn)確、高效的尋找和匹配,這也是建設(shè)判例檢索系統(tǒng)最樸素的初衷。
本文將以司法機(jī)關(guān)已生效的判例文本或信息作為檢索對象的檢索系統(tǒng)界定為判例檢索系統(tǒng),對此類系統(tǒng)的命名還有案例檢索系統(tǒng)、類案檢索系統(tǒng)等,但本文認(rèn)為此類檢索系統(tǒng)最為核心的功能是對于司法機(jī)關(guān)已生效裁判文書的檢索,其他命名方式中存在檢索對象范圍過于泛化或過于狹隘的問題,且可能指向不明,界定為判例檢索系統(tǒng)最為合理、明確。
對于判例檢索系統(tǒng)的關(guān)注,應(yīng)聚焦于兩個層面的問題:一個是判例檢索系統(tǒng)自身的發(fā)展情況,包含近些年我國多種多樣的判例檢索系統(tǒng)的建設(shè)模式、收錄的判例情況、采取的技術(shù)方案等內(nèi)容;另一個是透過判例檢索系統(tǒng)的建設(shè)和發(fā)展,考察判例運用的主要方向之一——判例的信息化、智能化運用情況。關(guān)于判例檢索系統(tǒng),還應(yīng)關(guān)注到判例運用和判例的信息化發(fā)展是相輔相成、相互作用的,即判例信息化是判例運用的一種現(xiàn)代化方式,判例檢索系統(tǒng)是判例運用重要的工具和手段之一。同時,判例信息化和判例檢索系統(tǒng)的建設(shè)也會反過來影響判例的體系化發(fā)展,促進(jìn)判例在我國成文法的體制下,迅速走過自發(fā)性運用階段,走向系統(tǒng)性、規(guī)范性和科學(xué)性運用時代。
學(xué)術(shù)研究方面,如果說判例自發(fā)性運用是我國法治領(lǐng)域的一個值得關(guān)注的現(xiàn)象級問題,那么判例檢索系統(tǒng)的建設(shè)和使用至少是判例運用中的一個顯性問題,實踐情況精彩紛呈,但法學(xué)學(xué)術(shù)研究中幾乎無人關(guān)注?!拔覈▽W(xué)理論界的判例研究可分為判例制度與判例內(nèi)容研究兩大類型,研究方法呈現(xiàn)出多樣性。對判例制度的研究聚焦于案例指導(dǎo)制度的功能定位、指導(dǎo)性案例的生成、效力與運用等問題”。(2)李振賢:《我國司法判例研究狀況的實證分析——以211篇學(xué)術(shù)論文為樣本》,《甘肅政法學(xué)院學(xué)報》2018年第4期,第110頁。對于判例檢索系統(tǒng)的研究應(yīng)該是判例運用研究的一部分,但在已有的判例研究文獻(xiàn)中,判例運用的研究主要集中于對指導(dǎo)性案例運用的研究,對于作為判例運用的技術(shù)載體的判例檢索系統(tǒng)的研究則非常少見。尤其是將判例檢索系統(tǒng)的建設(shè)作為判例運用過程中一個重要的環(huán)節(jié)、問題和趨勢進(jìn)行思考的研究成果就更少了。
將對于判例檢索系統(tǒng)建設(shè)與使用情況的研究作為一個典型問題進(jìn)行探索,有著較為重要的意義:首先,判例運用的方式是隨著判例在法律體系中的地位、判例體量的增加而變化的,也是隨著判例運用者思維方式和行為模式的轉(zhuǎn)變而變遷的。判例檢索系統(tǒng)正是這種判例運用方式變遷和發(fā)展過程中的產(chǎn)物,具有較強的代表性。其次,判例運用的過程實際上是可以進(jìn)一步分為判例的發(fā)現(xiàn)、尋找、確認(rèn)、加工和運用等多個環(huán)節(jié)的,對于判例運用的基本規(guī)律和邏輯的研究應(yīng)該深入到判例運用的具體環(huán)節(jié)和過程之中去,才可能更為深入地挖掘判例運用的內(nèi)在邏輯機(jī)理、判例使用者的訴求及其實現(xiàn)以及判例運用可能產(chǎn)生的影響等。再次,已有的關(guān)于判例運用的研究成果基本上都基于文獻(xiàn)或者少數(shù)判例,缺乏對于判例運用工具的關(guān)注和研究,沒有充分評估工具的使用和方法的變革對于判例運用帶來的革命性影響。最后,判例檢索系統(tǒng)的大規(guī)模應(yīng)用對于判例的學(xué)術(shù)研究的方法產(chǎn)生了一定影響,判例檢索系統(tǒng)將大數(shù)據(jù)、人工智能等技術(shù)和方法帶入了判例研究領(lǐng)域,這種方法論意義上的變化和進(jìn)步本身也值得關(guān)注。
判例運用的實踐中,有一個從運用意識產(chǎn)生到社會化運用需求形成,再到找到判例運用的媒介或者載體的過程。首先是判例運用意識的產(chǎn)生,即充分認(rèn)識到在我國成文法體制下,在不改變已有立法模式的情況下,判例的地位以及作用的發(fā)揮自會有一套依賴于法律實施體系內(nèi)生動力的運用機(jī)制,這套動力機(jī)制形成后,判例運用的社會化進(jìn)程才得以啟動,而且“只有當(dāng)判例的創(chuàng)制與適用成為一種自覺過程時,判例的價值才會社會化”。(3)武樹臣:《尋找中國的判例法》,北京:人民出版社,2018年,第309頁。判例的社會化必然會有一個實現(xiàn)的載體,這個載體在判例運用剛剛興起、判例總量較小的情況下,就是利用傳統(tǒng)出版物或者媒介,但當(dāng)判例的總量達(dá)到一定規(guī)模、多樣性到了一定程度后,判例意識中會有一個潛意識的判斷或者慣性存在,就是在尋找判例過程中,工具的普遍性選擇就不再是判例匯編或者傳統(tǒng)的判例展示媒介了,而是轉(zhuǎn)而選擇能夠?qū)ε欣龑ふ姨峁└嘀С值墓ぞ?,判例檢索系統(tǒng)不僅可以發(fā)揮判例尋找過程中的輔助作用,其本身也具備了一定的信息傳播功能,并會助推判例運用的社會化。
具體而言,判例檢索系統(tǒng)的實際開發(fā)和運用中有以下疑難問題亟待研究和解決:其一,目前已有數(shù)量眾多的判例檢索系統(tǒng),(4)我國目前已有的判例檢索系統(tǒng)主要包括但不限于:中國裁判文書網(wǎng)、北大法寶案例與裁判文書數(shù)據(jù)庫、北大法意、Alpha案例數(shù)據(jù)庫、威科先行、法信、元典智庫、無訟、理脈、把手案例、聚法案例、Openlaw、法律家、匯法網(wǎng)、律商網(wǎng)、法律圖書館、見微搜索、世界法律指南、萬律中國等。且在功能定位和產(chǎn)品設(shè)計上略顯重復(fù),導(dǎo)致這種情況出現(xiàn)的原因是判例檢索系統(tǒng)的建設(shè)目標(biāo)并不清晰,諸如統(tǒng)一法律適用等實際上都是判例運用的目的,而不是判例檢索系統(tǒng)自身的、獨有的存在價值和目的。其二,使用者對于通過檢索系統(tǒng)尋找判例的需求是多元的,從司法文件中看可能會是尋找類案、關(guān)聯(lián)案件,(5)參見《最高人民法院關(guān)于落實司法責(zé)任制完善審判監(jiān)督管理機(jī)制的意見(試行)》(法發(fā)〔2017〕11號)。也可能會是為新類型案件(6)參見《最高人民法院關(guān)于深化人民法院司法體制綜合配套改革的意見——人民法院第五個五年改革綱要(2019—2023)》(法發(fā)〔2019〕8號)。找到法律適用的方案或方法,但司法機(jī)關(guān)對于“類似”“關(guān)聯(lián)”“新類型”等缺乏明確的標(biāo)準(zhǔn),在檢索判例時也就沒有明確的規(guī)范可以轉(zhuǎn)化為系統(tǒng)的檢索規(guī)則和呈現(xiàn)規(guī)則。其三,判例檢索系統(tǒng)為了提高檢索結(jié)果的易用性和準(zhǔn)確度,可能會按照一定格式和標(biāo)準(zhǔn)對判例進(jìn)行預(yù)處理,但各個判例檢索系統(tǒng)預(yù)處理采用的標(biāo)準(zhǔn)、程序、方法都存在著差異,且大多并未向使用者公開,導(dǎo)致預(yù)處理過程可能已經(jīng)對于判例真實信息造成了減損或扭曲,這種由于判例檢索系統(tǒng)預(yù)設(shè)的判例預(yù)處理程序造成的對判例的影響幾乎無人關(guān)注。本文擬在梳理判例檢索系統(tǒng)當(dāng)前建設(shè)情況的基礎(chǔ)上,嘗試回答以上問題并探討判例檢索系統(tǒng)的發(fā)展方向。
1.司法機(jī)關(guān)主導(dǎo)建設(shè)型:查詢、普法與公開并重
司法機(jī)關(guān)主導(dǎo)建設(shè)的判例檢索系統(tǒng)中最具代表性的是最高人民法院主導(dǎo)建設(shè)的中國裁判文書網(wǎng)、(7)中國裁判文書網(wǎng)始建于2013年,目前已經(jīng)是全球體量最大、最具影響力的裁判文書公開網(wǎng)站。參見人民法院報評論員:《近125億次的訪問量說明什么》,《人民法院報》2018年1月3日,第1版。中華人民共和國司法部主導(dǎo)建設(shè)的中國法律服務(wù)網(wǎng)的司法行政(法律服務(wù))案例庫(8)中國法律服務(wù)網(wǎng)的司法行政(法律服務(wù))案例庫收錄的案例類型十分豐富,其中既有公共服務(wù)方面的案例,也有經(jīng)法院審理后的判例。等。司法機(jī)關(guān)主導(dǎo)建設(shè)型的判例檢索系統(tǒng)大多是非營利性的,其功能主要定位于三個方面:其一,查詢,主要實現(xiàn)的是基于判例的結(jié)構(gòu)化信息的基礎(chǔ)查詢功能;其二,普法,通過判例普及法律知識,展示我國司法機(jī)關(guān)運作的基本情況等,將判例的宣傳作為司法機(jī)關(guān)普法宣傳的抓手和著力點;其三,司法公開,通過判例檢索系統(tǒng)的方式大規(guī)模進(jìn)行司法公開是目前為止司法公開最有效、最普遍的方式。判例檢索系統(tǒng)的司法公開功能還會有一些溢出效應(yīng),例如幫助社會公眾、新聞媒體等完成對于國家公務(wù)人員的監(jiān)督和新聞線索的發(fā)現(xiàn)等,澎湃新聞就“善用中國裁判文書網(wǎng),完成了一篇又一篇材料翔實的反腐調(diào)查報道”。(9)陳良飛、常國水:《中國裁判文書網(wǎng)如何助力反腐調(diào)查報道?》,《新聞戰(zhàn)線》2018年第21期,第105頁。
司法機(jī)關(guān)主導(dǎo)建設(shè)型的判例檢索系統(tǒng)的優(yōu)勢在于數(shù)據(jù)來源權(quán)威、全面、更新較為及時等,但側(cè)重于司法公開的判例檢索系統(tǒng),只提供簡單的查詢功能,對于判例的文本本身沒有進(jìn)行加工或者標(biāo)注,系統(tǒng)也不再提供基于判例的相關(guān)知識或者其他衍生服務(wù)。由于系統(tǒng)功能定位側(cè)重于司法公開,所以會基于判例提供庭審視頻、執(zhí)行信息查詢等司法公開方面的延伸功能。司法機(jī)關(guān)主導(dǎo)建設(shè)型的判例檢索系統(tǒng)也在謀求發(fā)展和改變,嘗試回應(yīng)法院業(yè)務(wù)中判例檢索的現(xiàn)實需求,例如中國應(yīng)用法學(xué)數(shù)字化服務(wù)系統(tǒng)(10)中國應(yīng)用法學(xué)數(shù)字化服務(wù)系統(tǒng)由中國應(yīng)用法學(xué)研究所主導(dǎo)建設(shè),還未正式上線,但相關(guān)出版物已經(jīng)先行出版,參見曹士兵主編《中國法院類案檢索與裁判規(guī)則專項研究》叢書,法律出版社2019年已出版第一批7冊。以及各地法院自主組織研發(fā)的判例檢索系統(tǒng),就基于員額法官、法官助理等人員在法律實踐中的需求對于判例進(jìn)行了篩選和加工,功能定位在于為司法業(yè)務(wù)提供輔助。
2.商業(yè)機(jī)構(gòu)主導(dǎo)建設(shè)型:檢索、引流與服務(wù)兼顧
商業(yè)機(jī)構(gòu)主導(dǎo)建設(shè)型的判例檢索系統(tǒng)一般是由文獻(xiàn)出版商或者法律科技公司主導(dǎo)建設(shè)的判例檢索系統(tǒng)。不同的建設(shè)主體,也代表著商業(yè)機(jī)構(gòu)主導(dǎo)建設(shè)型判例檢索系統(tǒng)的兩種不同類型。由文獻(xiàn)出版商主導(dǎo)進(jìn)行判例檢索系統(tǒng)的建設(shè)算是判例檢索系統(tǒng)發(fā)展歷史上的傳統(tǒng)之一。歷史悠久的律商聯(lián)訊、威科先行、萬律都是由文獻(xiàn)出版商主導(dǎo)建設(shè)的判例數(shù)據(jù)庫,都采用兼營判例檢索系統(tǒng)和紙質(zhì)出版物的商業(yè)模式。從產(chǎn)業(yè)發(fā)展的角度看,文獻(xiàn)出版商建設(shè)判例檢索系統(tǒng)是最為原始的知識變現(xiàn)的商業(yè)模式,對于他們而言判例檢索系統(tǒng)就是他們選擇的知識傳播的載體。(11)有關(guān)知識變現(xiàn)和知識傳播載體的研究,參見江中原:《知識變現(xiàn)解決方案》,北京:金城出版社,2019年,第67-90頁。而判例檢索系統(tǒng)只是他們出版物的數(shù)字化呈現(xiàn)或者擴(kuò)張, 而且使用者的需求往往并不是全部出版物,通過判例檢索系統(tǒng)可以較為精準(zhǔn)和經(jīng)濟(jì)地滿足使用者的現(xiàn)實需求。中國審判案例數(shù)據(jù)庫(12)中國審判案例數(shù)據(jù)庫由中國人民大學(xué)出版社、北京人大數(shù)字科技有限公司、國家法官學(xué)院和中國人民大學(xué)法學(xué)院聯(lián)合建設(shè),主要數(shù)據(jù)來源是國家法官學(xué)院與中國人民大學(xué)法學(xué)院編纂的歷年的《中國審判案例要覽》。等也屬此類判例檢索系統(tǒng)。
由法律科技公司主導(dǎo)建設(shè)的判例檢索系統(tǒng)的最大特點在于科技性,已經(jīng)或者號稱實現(xiàn)了大數(shù)據(jù)、人工智能技術(shù)在判例檢索系統(tǒng)中的應(yīng)用。絕大部分法律科技公司研發(fā)的判例檢索系統(tǒng),與文獻(xiàn)出版商研發(fā)判例檢索系統(tǒng)相比,在法律知識的整理和積累方面還略顯欠缺,對于司法實務(wù)業(yè)務(wù)邏輯的理解和表達(dá)還有待加強。因此,絕大多數(shù)法律科技公司主導(dǎo)的判例檢索系統(tǒng)并不能獨立地實現(xiàn)依靠知識變現(xiàn)來盈利,還必須尋找其他變現(xiàn)的方式,大致有以下三種:第一種是走向傳統(tǒng)模式,將判例檢索系統(tǒng)整理和加工過的判例結(jié)集出版,法信的智慧辦案助手系列(13)參見人民法院出版社法信編輯部:《勞動合同糾紛司法觀點與辦案規(guī)范》,北京:人民法院出版社,2017年。和無訟的天同碼(14)天同碼系列書籍最大的特點在于設(shè)定了天同碼這樣一套判例的標(biāo)簽體系,借助這套標(biāo)簽體系可以便捷地完成判例查找。參見陳枝輝、蔣勇主編:《天同碼:中國商事訴訟裁判規(guī)則》,北京:法律出版社,2015年。就是這種模式比較成功的例子;第二種是通過判例檢索系統(tǒng),實現(xiàn)對于法律服務(wù)需求者的引流,將判例檢索系統(tǒng)作為法律服務(wù)的流量入口和中介,以收取介紹費的方式實現(xiàn)盈利;第三種是基于判例檢索系統(tǒng)來推廣其他增值服務(wù)的模式,如在線糾紛調(diào)解、法律咨詢、代擬文書等服務(wù)。
1.通用搜索引擎中的判例檢索系統(tǒng)
社會公眾的檢索習(xí)慣實際上是通用的搜索引擎培養(yǎng)起來的,但像百度、搜狗這樣的通用檢索引擎的底層技術(shù)、產(chǎn)品的設(shè)計思路并不能直接用在判例檢索系統(tǒng)上,所以通用搜索引擎在法律領(lǐng)域關(guān)注更多的是較容易利用通用搜索技術(shù)且更容易商業(yè)變現(xiàn)的智能化法律服務(wù)(如百度旗下產(chǎn)品“度小法”提供的知識產(chǎn)權(quán)服務(wù)、合同起草、糾紛調(diào)解等服務(wù))、律師推薦(如搜狗旗下產(chǎn)品搜狗律師提供的優(yōu)選律師服務(wù))等。由于判例是法律人工智能應(yīng)用的最主要信息來源之一,因此,通用搜索引擎的廠商想在空間巨大的法律人工智能領(lǐng)域有所發(fā)展就都不得不重視判例庫的建設(shè),但是否將其作為核心產(chǎn)品就要另當(dāng)別論了,從百度旗下“度小法”的案例檢索、谷歌旗下“谷歌判例”來看,通用搜索引擎并不會投入大量的資源用在判例檢索系統(tǒng)的法律知識整理和產(chǎn)品化發(fā)展上,而更多的是將通用搜索引擎的自然語言處理、知識圖譜等技術(shù)嘗試在判例檢索系統(tǒng)中應(yīng)用、改良和優(yōu)化。
2.綜合性法律數(shù)據(jù)庫中的判例檢索系統(tǒng)
綜合性法律數(shù)據(jù)庫是包含法律法規(guī)、判例、法學(xué)學(xué)術(shù)文獻(xiàn)、合同范本、實務(wù)指引等多種類型法律信息資源的檢索系統(tǒng),北大法寶、北大法意、法信(中國法律應(yīng)用數(shù)字網(wǎng)絡(luò)服務(wù)平臺)(15)法信由中國司法大數(shù)據(jù)研究院、北京國雙科技有限公司和人民法院出版社共同建設(shè),其中中國司法大數(shù)據(jù)研究院主要負(fù)責(zé)數(shù)據(jù)和設(shè)計;北京國雙科技有限公司負(fù)責(zé)技術(shù);人民法院出版社提供已經(jīng)出版的眾多法律實務(wù)書籍的版權(quán),實現(xiàn)知識支撐,是一種比較全面和均衡的合作開發(fā)模式。就屬于此類系統(tǒng)。綜合性法律數(shù)據(jù)庫的建設(shè)一般都需要較長時間的積累,對于收錄的法律信息都進(jìn)行了較為細(xì)致的分類,以便實現(xiàn)及時準(zhǔn)確的歸類和更新,并提供更為準(zhǔn)確的檢索服務(wù)。以北大法寶為例,它分為十幾個相對獨立但又可以實現(xiàn)互聯(lián)互通的法律數(shù)據(jù)庫,每個子庫還會再進(jìn)一步細(xì)分,目前已有一千余個小類。(16)參見何靈巧等:《法律信息資源研究與實務(wù)》,杭州:浙江大學(xué)出版社,2008年,第75頁。綜合性法律數(shù)據(jù)庫中的判例檢索系統(tǒng)的優(yōu)勢在于可以基于判例的案由、適用法條等信息關(guān)聯(lián)到相關(guān)法律釋義、權(quán)威案例、學(xué)術(shù)文獻(xiàn)等資料,此類產(chǎn)品希望通過這種模式為使用者提供更全面的法律信息參考和支撐。法律知識是豐富多元卻又龐雜混亂的,而且總是不斷更新的,為了更好地實現(xiàn)對于法律知識的整理,綜合性法律數(shù)據(jù)庫就需要不斷對法律知識進(jìn)行更加細(xì)分的類型化。但不同類型的法律知識之間又需要基于使用者的某種特定的需求進(jìn)行匯集,因此,目前綜合性法律數(shù)據(jù)庫中存在的一個很大的發(fā)展瓶頸就是不同類型的法律知識難以真正實現(xiàn)知識融合。用更廣泛的視角看待法律知識時,會發(fā)現(xiàn)不同類型、不同來源、不同結(jié)構(gòu)的知識的融合是普遍性的趨勢。“知識融合的趨勢也提醒我們遵循體系化的觀念,形成知識的互補,并促進(jìn)不同學(xué)科知識的發(fā)展和知識體系的重構(gòu)”。(17)王利明:《法學(xué)應(yīng)當(dāng)步入知識融合時代》,《北京日報》2019年9月2日,第15版。現(xiàn)在一些綜合性法律數(shù)據(jù)庫中判例中關(guān)聯(lián)引用法條、法學(xué)文獻(xiàn)、權(quán)威案例、立法背景資料等信息,就是一種以判例為中心的法學(xué)知識的體系重構(gòu)的嘗試和探索。
3.獨立型判例檢索系統(tǒng)
獨立型判例檢索系統(tǒng)是指僅收錄判例的檢索系統(tǒng)。獨立型判例檢索系統(tǒng)按照用戶群體的設(shè)定不同可以分為兩大類:一類面向不特定用戶,在互聯(lián)網(wǎng)上公開,例如,“把手案例”“聚法案例”等。另一類則面向特定組織或者人群,主要是法院和檢察院?!霸诘胤綄用?,各省法院先后分別開發(fā)各自的類案類判系統(tǒng)”。(18)左衛(wèi)民:《如何通過人工智能實現(xiàn)類案類判》,《中國法律評論》2018年第2期,第27頁。從公開信息可知,四川、重慶、貴州等地的高級人民法院,河北、江蘇等地的檢察院都聯(lián)合科技公司開發(fā)了面向本地司法系統(tǒng)的判例檢索系統(tǒng)。還有定位于特定功能和用途的判例檢索系統(tǒng),例如,“法律家”(中國法學(xué)多用途教學(xué)案例系統(tǒng))就是主要面向法學(xué)教育教學(xué)的判例檢索系統(tǒng)。
1.基于案情事實的判例檢索
案情事實是指法院查明的包括案件基本事實、爭議及理由的內(nèi)容,是得出裁判結(jié)論的基礎(chǔ)?;诎盖槭聦嵉呐欣龣z索以通過案情知識圖譜規(guī)范化地展示案情為前提,而案情知識圖譜構(gòu)建可以采取三元組標(biāo)注、標(biāo)簽標(biāo)注兩種實現(xiàn)方式。三元組標(biāo)注是指通過實體識別、實體鏈接、關(guān)系抽取,實現(xiàn)三元組構(gòu)建,進(jìn)而完成案情知識圖譜構(gòu)建的方式。通過三元組標(biāo)注構(gòu)建知識圖譜,依賴法律專家知識預(yù)先定義相應(yīng)類別案件的三元組體系,包括實體類別、關(guān)系類型。標(biāo)簽標(biāo)注通過標(biāo)簽識別、實體識別、實體鏈接,完成案情知識圖譜構(gòu)建。標(biāo)簽標(biāo)注依賴專家知識預(yù)先定義相應(yīng)類別案件的標(biāo)簽體系和實體類型?;诎盖槭聦嵉呐欣龣z索,需要綜合考量知識圖譜中實體、關(guān)系、標(biāo)簽的權(quán)重大小,不斷優(yōu)化案情知識圖譜檢索和對比的方案。
2.基于爭議焦點的判例檢索
爭議焦點是各方當(dāng)事人在訴訟中形成的有關(guān)程序、案情事實、法律適用等各類問題的核心分歧點,爭議焦點的結(jié)論與裁判結(jié)論密切相關(guān)?;跔幾h焦點的判例檢索,在實務(wù)中存在較大的需求,疑難案件通常表現(xiàn)為案件中某一個或幾個疑難問題存在分歧,快速、準(zhǔn)確地查找到包含相同疑難問題的判例,是實現(xiàn)判例檢索的重要路徑。為實現(xiàn)基于爭議焦點的判例檢索進(jìn)行的工作主要包括爭議焦點提取、爭議焦點清洗、爭議焦點聚類、爭議焦點歸類等。通過以上工作建立爭議焦點組,并在此基礎(chǔ)上基于規(guī)則和歸類算法進(jìn)行爭議焦點歸類,實現(xiàn)爭議焦點組數(shù)據(jù)的動態(tài)維護(hù)。
3.基于法律適用的判例檢索
法律適用是案件審理的規(guī)范性法律文件依據(jù),是精準(zhǔn)、完整體現(xiàn)判例法律關(guān)系、部分案件情節(jié)的內(nèi)容。法律適用的相同、相似,表明案件之間法律關(guān)系、案情事實的相同或相似。基于法律適用的判例檢索,以法律條文的相同、相似為判斷基礎(chǔ)。法律條文間關(guān)系的判斷,僅限于法律條文調(diào)整對象的判斷,不包括對法律后果的判斷,兩個條文調(diào)整的內(nèi)容相同但法律后果不同的,仍然屬于法律適用相同。法律條文關(guān)系的判斷,主要是對在相同時間點調(diào)整對象有交集的多個條文間關(guān)系的判斷、對具有繼承關(guān)系的多個條文間關(guān)系的判斷。通過法律條文間關(guān)系的判斷,識別引用形式意義上不同但具有內(nèi)在聯(lián)系條文的判例之間的實質(zhì)相似性,進(jìn)而實現(xiàn)判例的查詢。
1.判例文本質(zhì)量問題
作為判例檢索系統(tǒng)數(shù)據(jù)來源的裁判文書的數(shù)量和質(zhì)量實際上存在較大的差異,這種差異對于后續(xù)批量的判例處理來說,會形成巨大的障礙。具體來說,判例檢索系統(tǒng)中文本質(zhì)量方面的問題主要有以下五個方面:第一,由于判例文本來源較多,文書收集和上傳中可能存在多頭上傳、重復(fù)上傳的問題,導(dǎo)致了數(shù)據(jù)冗余問題出現(xiàn)。第二,在《最高人民法院關(guān)于人民法院案件案號的若干規(guī)定》(2016年1月實施)出臺前,案號管理規(guī)則不明確,導(dǎo)致不同地區(qū)之間出現(xiàn)部分案件案號重復(fù)的情況,在按照案號進(jìn)行判例文本篩選時,會錯誤地剔除一些數(shù)據(jù),導(dǎo)致數(shù)據(jù)缺失。第三,雖然《最高人民法院關(guān)于人民法院在互聯(lián)網(wǎng)公布裁判文書的規(guī)定》(法釋〔2016〕19號)已經(jīng)對裁判文書上網(wǎng)的標(biāo)準(zhǔn)進(jìn)行了明確,但各法院的執(zhí)行情況還不盡相同,仍存在該上傳文書未上傳(如行政訴訟案件文書)、不該上傳文書已上傳(如調(diào)解書)的問題。第四,判例文本中與個人隱私有關(guān)的信息的脫敏處理效果不佳。中國裁判文書網(wǎng)的“文書信息過度隱匿和敏感信息未加隱匿的現(xiàn)象同時存在,大量未公開文書沒有按規(guī)定上傳文書基本信息”。(19)楊金晶、覃慧、何海波:《裁判文書上網(wǎng)公開的中國實踐——進(jìn)展、問題與完善》,《中國法律評論》2019年第6期,第125頁。例如,很多文書中首部信息進(jìn)行了脫敏處理,但對正文中信息卻沒有處理,后續(xù)可能造成判例檢索系統(tǒng)對當(dāng)事人隱私的不當(dāng)侵害。第五,判例涉及的文書質(zhì)量參差不齊。主要問題有:文書撰寫水平不一,文書撰寫過于簡單,文書結(jié)構(gòu)存在缺失,存在筆誤的裁判文書沒有及時通過裁定書進(jìn)行更正等。此外,判例檢索系統(tǒng)的數(shù)據(jù)絕大部分都來自對司法公開網(wǎng)站公布的裁判文書的爬取,批量地爬取司法公開類網(wǎng)上的數(shù)據(jù)用于商業(yè)目的的行為本身處于灰色地帶,這也造成一些判例檢索系統(tǒng)的數(shù)據(jù)來源并不穩(wěn)定和安全。
2.判例中信息的識別、提取和關(guān)聯(lián)中的問題
第一,判例文書結(jié)構(gòu)化中的問題?;谂欣臅诤洗髷?shù)據(jù)、人工智能等技術(shù),進(jìn)行智能化應(yīng)用開發(fā)的前提是判例中蘊含的信息已經(jīng)是機(jī)器能夠識別的,而為了提高機(jī)器對于判例文書中信息識別的準(zhǔn)確率,則應(yīng)先對文書進(jìn)行結(jié)構(gòu)化解析,明確文書中各部分的基本屬性。目前對于判例文書和判例相關(guān)文本(如公報案例的文本)的結(jié)構(gòu)化仍存在兩方面的問題:一方面,判例文書的撰寫并不規(guī)范,機(jī)器對于裁判文書或判例相關(guān)文本的識別依賴于一些語詞,如依靠“本案爭議焦點如下”識別爭議焦點總結(jié)段落,依靠“本院認(rèn)為”識別法院認(rèn)定事實段落,但很多文書的撰寫用語并不規(guī)范,如果寄希望于通過機(jī)器學(xué)習(xí)進(jìn)行準(zhǔn)確的裁判文書分段,就必須進(jìn)行大量的不同層級、不同地區(qū)文書的標(biāo)注工作。另一方面,最高人民法院規(guī)定的文書模板是通過類型化的方式給出的,(20)參見沈德詠主編:《民事訴訟文書樣式》,北京:人民法院出版社,2016年;最高人民法院行政審判庭編:《行政訴訟文書樣式(試行)》,北京:人民法院出版社,2015年。模板本身與實踐中文書的撰寫方式是有差別的,最高人民法院希望通過給出模板的方式促進(jìn)裁判文書質(zhì)量的提升,但模板對于不同案由、罪名裁判文書特點的適配并不理想,因此這些模板對于判例文書的結(jié)構(gòu)化的幫助是有限的,必須在這些模板的基礎(chǔ)上,結(jié)合實際,重新總結(jié)大量類型化文書的結(jié)構(gòu)化模板。
第二,判例中信息的抽取、關(guān)聯(lián)中的問題?;诤A颗欣臅M(jìn)行判例文書或判例相關(guān)文本多模態(tài)數(shù)據(jù)的分類識別、智能信息提取、信息關(guān)聯(lián)等處理的技術(shù)尚不成熟。無論是基于案件“實體-關(guān)系”的半監(jiān)督學(xué)習(xí)智能信息抽取和關(guān)聯(lián),還是基于深度學(xué)習(xí)的端到端的信息抽取,都缺乏信息量足夠大的標(biāo)準(zhǔn)數(shù)據(jù)集的支撐。目前判例信息的檢索和抽取主要依靠關(guān)鍵詞,即使部分檢索系統(tǒng)加入了自然語言處理和語義分析技術(shù),對于判例中信息的抽取和關(guān)聯(lián)、判例與判例之間的信息關(guān)聯(lián)的效果都還不是十分理想。
3.判例的可視化呈現(xiàn)方式中的問題
判例的可視化呈現(xiàn)方式主要分為兩種:檢索和推薦?!皺z索指從文獻(xiàn)資料、網(wǎng)絡(luò)信息等信息集合中查找所需資料或信息的過程。推薦則是指將經(jīng)過整理的信息資源發(fā)送給用戶,滿足用戶的多層次需求,使用戶能夠自己設(shè)定所需要的信息類別,并直接在用戶端接收定制信息的實現(xiàn)方式”。(21)陳琨:《類案推送嵌入“智慧法院”辦案場景的原理和路徑》,《中國應(yīng)用法學(xué)》2018年第4期,第91頁。目前具備一定影響力的判例檢索系統(tǒng)采取的可視化呈現(xiàn)方式都是檢索,需要使用者進(jìn)行一定的輸入后,才能夠查詢結(jié)果并呈現(xiàn)出來,這其中的問題主要有兩個方面:一方面是不同檢索系統(tǒng)根據(jù)輸入信息給出的結(jié)果中包含的判例數(shù)是有較大差異的,輸出結(jié)果中包含判例數(shù)較少的系統(tǒng),可能限制了返回結(jié)果的數(shù)量,可能導(dǎo)致有價值的判例沒有被呈現(xiàn)出來。另一方面是檢索結(jié)果中包含多個判例時,對判例進(jìn)行排序的問題。對判例進(jìn)行排序時主要考慮兩個因素:一是相關(guān)性,與輸入信息越相關(guān)的判例可能越具有參考價值,但對于相關(guān)性的判斷是存在爭議的,判例在案情事實、適用法律和爭議焦點等一個或幾個方面相關(guān)能夠被判斷為是具備相關(guān)性的,并沒有一個科學(xué)的標(biāo)準(zhǔn)。二是效力性,對于使用檢索系統(tǒng)的人而言,不同判例對其行為的約束力是不同的,例如,法官必須關(guān)注指導(dǎo)性案例,因為指導(dǎo)性案例是必須參照的;法官也必須關(guān)注相似判例的上級法院判決,因為法官要承受案件二審改判的壓力。判例檢索系統(tǒng)的檢索結(jié)果排序應(yīng)該是對相關(guān)性和效力性綜合考慮的結(jié)果,但如何制定科學(xué)的排序標(biāo)準(zhǔn)并能夠用可視化的方式呈現(xiàn)依然是一個未決的難題。
4.判例檢索結(jié)果的公平性問題
大數(shù)據(jù)和人工智能都是基于海量數(shù)據(jù)中蘊含的邏輯和規(guī)律給出結(jié)果預(yù)測的,但司法過程不僅是要關(guān)注大量同類型案件的趨勢性特征,還需要關(guān)注個案的特殊性?,F(xiàn)階段司法人員參考判例檢索系統(tǒng)提供的相關(guān)信息而做出的決策,可能會有利用大數(shù)據(jù)給出的趨勢性、普遍性的判斷,而忽視個案特征的情況。譬如,審判工作中不可避免會遇到一些與當(dāng)前判例檢索系統(tǒng)收集的文書情況不同的新案件。此時,在與相似判例進(jìn)行比對的過程中,案件之間的區(qū)別往往比案件的相似點更為重要。新的案件可能形成的裁判文書應(yīng)當(dāng)成為文書數(shù)量正態(tài)分布曲線的長尾中的一部分??梢姡绻麅H僅依靠已有的信息或數(shù)據(jù),在處理新類型案件時,法官很難得到有效信息或者極易在參考相關(guān)判例過程中出現(xiàn)偏差而導(dǎo)致對于個案特殊性、甚至個案正義的忽視。
算法是為了解決問題而產(chǎn)生的滿足若干指令的有窮序列,算法由具體的人編寫、基于不同的標(biāo)準(zhǔn)編寫并適用于具體的領(lǐng)域。諸多事實與研究結(jié)果表明:即使數(shù)據(jù)同時滿足了質(zhì)量與數(shù)量的要求,算法的不當(dāng)應(yīng)用仍然可能對公平性帶來不可忽視的影響。判例檢索系統(tǒng)的算法應(yīng)當(dāng)由誰確定、如何確定標(biāo)準(zhǔn)與需求以及如何保證檢索過程的公正與透明,都是智能化判例檢索系統(tǒng)中不可回避的問題。判例檢索系統(tǒng)的搭建中,基礎(chǔ)數(shù)據(jù)中文書的質(zhì)量、數(shù)量都會影響算法的選擇和設(shè)計。需探索如何通過算法的設(shè)計來規(guī)避原始數(shù)據(jù)以及使用者已經(jīng)存在的偏見。在無法對系統(tǒng)的算法進(jìn)行全面的法律、倫理方面審查的情況下,如果算法在處理案件某些要素時存在偏好或歧視,則有可能通過系統(tǒng)將這種歧視傳遞給司法人員,并進(jìn)而影響到司法的公正性。
判例檢索系統(tǒng)最初的功能設(shè)定是將判例進(jìn)行信息化呈現(xiàn)。在普通法國家,判例的信息化呈現(xiàn)有一個重要的前提,即被信息化的判例已經(jīng)屬于一個完善、穩(wěn)定的判例體系。“以傳統(tǒng)的普通法即判例法為前提和基礎(chǔ),英美國家發(fā)展起了自己一套獨特的法律檢索方法”。(22)胡曉凡、李紅勃:《淺析英美判例法的檢索方法——以“哥斯布賴瓦公寓大廈”案為例》,《法律文獻(xiàn)信息與研究》2014年第Z1期,第66頁。也就是說在判例檢索系統(tǒng)發(fā)展的初期,是先有判例體系,后有判例檢索系統(tǒng)的,判例檢索系統(tǒng)的功能就是將判例法體系中涉及的判例進(jìn)行信息化呈現(xiàn)。但在成文法國家中,由于沒有判例法體系作為依據(jù),對判例的早期匯編就只能以判例的基本信息,如時間、法院、案由等作為分類標(biāo)準(zhǔn)。
同為成文法國家的日本,近些年來也出現(xiàn)了大規(guī)模的判例的自發(fā)性運用。但成文法國家似乎都更關(guān)注從判例中整合和總結(jié)而來的裁判規(guī)則,并致力于厘清這些裁判規(guī)則與已有的成文法的關(guān)系。在檢索中,使用者依然是按照尋找法律條文的方式實現(xiàn)判例發(fā)現(xiàn)的過程,這種思維方式上形成的刻板印象主要體現(xiàn)在兩個方面。一方面是尋找判例的線索或基礎(chǔ)是法律條文,并未形成由官方頒布或者被廣泛認(rèn)可的判例標(biāo)簽或者索引體系。“日本大多數(shù)的判例檢索資料是基于法條或一定的學(xué)說和理論而對判例進(jìn)行整理而成的資料”。(23)冷羅生:《日本法律類文獻(xiàn)的檢索與收集方法》,《法律文獻(xiàn)信息與研究》第2009年第4期,第21頁。另一方面,判例檢索系統(tǒng)的建設(shè)者和使用者總希望用成文法效力等級體系為不同級別司法機(jī)關(guān)形成的判例去設(shè)定一個效力等級的位階?!霸谌毡镜乃痉▽嵺`中,對司法判例的檢索順序基本與制定法相同。判例檢索之所以能夠依照上述的順位進(jìn)行,主要歸功于法律教義學(xué)所創(chuàng)造的條件”。(24)孫躍:《日本司法判例援引技術(shù)初探及啟示——基于民事判例的考察》,《海峽法學(xué)》2018年第2期,第94頁。在大多數(shù)成文法國家,似乎判例檢索系統(tǒng)最初的建設(shè)都受到成文法體制和法律教義學(xué)的限制和約束。我國判例檢索系統(tǒng)建設(shè)的初期,希望將判例或從判例中總結(jié)出的裁判規(guī)則歸于已有的成文法體系,既符合成文法國家的立法體制和司法慣例,也契合法律職業(yè)人士的知識結(jié)構(gòu)。因此,可以說判例在檢索系統(tǒng)中為了信息化而做的聚類是以成文法體系的分類分層標(biāo)準(zhǔn)作為基本依據(jù)的,這既是成文法國家判例體系的特色,也可能是制約成文法國家判例發(fā)展的核心因素。
判例檢索系統(tǒng)發(fā)展的前期都是以數(shù)據(jù)庫作為底層技術(shù)的。眾所周知,數(shù)據(jù)庫的作用就是將原本零散的、獨享的文件組織成為一個能夠?qū)崿F(xiàn)文件存儲、管理和共享的文件夾或者文件柜,其核心的功能是實現(xiàn)文件的匯集。具體到判例檢索系統(tǒng)上來,其發(fā)展初期(尤其是在中國裁判文書網(wǎng)上線之前)最重要的功能就是實現(xiàn)判例匯集,并在此基礎(chǔ)上進(jìn)行判例文本的信息化,這個過程的核心意義在于為判例的大規(guī)模運用提供重要的信息基礎(chǔ),并以信息化的方式實現(xiàn)判例呈現(xiàn)方式的變革。
在信息化呈現(xiàn)的基礎(chǔ)上,判例檢索系統(tǒng)逐步發(fā)展出一個基礎(chǔ)功能體系:第一,判例匯集,對于判例運用者而言,我國的判例來源十分多元和復(fù)雜,判例運用者需要一個運行穩(wěn)定、信息準(zhǔn)確、成本低廉、使用便捷、更新及時的判例信息來源,在司法機(jī)關(guān)并無統(tǒng)一、覆蓋面足夠廣的判例匯集的手段之前,判例檢索系統(tǒng)是實現(xiàn)判例匯集最優(yōu)的選擇。第二,判例查詢,在大量判例匯集后,依靠判例檢索系統(tǒng)中數(shù)據(jù)庫相關(guān)的底層技術(shù),對判例文本的基本信息進(jìn)行對齊后,實現(xiàn)了依靠判例基本信息的判例查詢。判例檢索系統(tǒng)的發(fā)展歷程中,最初將判例查詢處理得較好的是北大法意?!捌錂z索模式是多條件方式的(最多10個并列條件),檢索途徑可選全文關(guān)鍵詞、案號、案由、學(xué)理詞、當(dāng)事人、專題、權(quán)威出處、審理法院、法院級別、文書類型、審理法官、判決時間、審級、法律點、代理律所、代理律師”。(25)林燕萍主編:《信息素養(yǎng)與法律文獻(xiàn)檢索》,北京:法律出版社,2018年,第129頁??梢姡瑢τ谂欣龣z索系統(tǒng)中判例這類大規(guī)模文檔集索引的構(gòu)建,決定性因素在于兩個方面:一方面是判例的基礎(chǔ)信息標(biāo)簽體系的多寡;另一方面是判例文本基本信息的識別、抽取效果的好壞。第三,判例展示,在發(fā)展初期,不同判例檢索系統(tǒng)的判例呈現(xiàn)并無太多差異,基本是在對判例文本進(jìn)行簡單預(yù)處理的基礎(chǔ)上,直接將判例的原始文本進(jìn)行展示。
總體來看,判例檢索系統(tǒng)實現(xiàn)的判例信息化呈現(xiàn)的意義在于促進(jìn)判例信息的社會化。具體來說,判例檢索系統(tǒng)所實現(xiàn)的判例信息化的目的和價值主要體現(xiàn)在以下幾個方面:首先,信息化激活了判例資源,使得判例資源的價值被社會公眾所發(fā)現(xiàn)和關(guān)注。其次,信息化改變了判例傳播的方式,實現(xiàn)了判例的網(wǎng)絡(luò)化傳播,實現(xiàn)了判例的推廣。再次,信息化過程中對判例文本進(jìn)行初級的標(biāo)準(zhǔn)化,使判例有了成為商品甚至產(chǎn)品的可能。最后,判例信息化推進(jìn)了判例在被更多利用后的增值,正如波斯納所言:“判決的范圍和意識不是由判決的作者而是由后來判決的作者決定的?!?26)理查德·A·波斯納:《聯(lián)邦法院:挑戰(zhàn)與改革》,鄧海平譯,北京:中國政法大學(xué)出版社,2002年,第400頁。即判例的價值最終體現(xiàn)于判例的傳播和被引用的過程之中。此外,信息化過程所形成的判例數(shù)據(jù)庫還為判例的智能化應(yīng)用打下了基礎(chǔ)。
隨著判例運用的不斷推進(jìn),大家已經(jīng)認(rèn)識到判例是司法人員智慧的凝練和體現(xiàn),對于判例中蘊含的巨大實務(wù)和學(xué)術(shù)價值也已形成一定共識,但判例這種實務(wù)中產(chǎn)生的智慧和經(jīng)驗因其碎片化、時效性的特征,是極易被淹沒和模糊的。如果說判例檢索系統(tǒng)建設(shè)的初期,使用者僅僅是希望通過檢索找到某個判例的話,那伴隨著判例在法律實施中地位的提升和判例應(yīng)用場景的豐富化,判例使用者開始期待找到的不僅僅是某個判例,而是判例中蘊含的解決具體法律問題的對策和依據(jù)。
現(xiàn)如今法律人所面臨的信息資源情況已經(jīng)與判例檢索系統(tǒng)建設(shè)初期有了很大區(qū)別,信息資源不再稀缺,法律人只需要輸入簡單的檢索條件,就會有海量的信息涌來,因此,法律人開始期待判例檢索系統(tǒng)能夠有一定的信息管理功能,以便能夠幫助他們在海量的判例中快速找到與檢索輸入有一定相關(guān)性的信息。這就要求判例檢索系統(tǒng)不僅能夠?qū)嫶蟆?fù)雜的判例庫理出條理,還要能夠通過使用者可能并不完整和準(zhǔn)確的輸入信息猜到使用者的真實檢索意圖?!皺z索者的目的是擁有對于能夠回答他們問題的法律的透徹理解并且為思考中的各法律問題提供背景和細(xì)微差別等方面的知識”。(27)王昶編著:《美國法律文獻(xiàn)與信息檢索》,北京:中國政法大學(xué),2014年,郭富雷導(dǎo)言,第1頁。從使用者角度而言,對于判例檢索系統(tǒng)功能的預(yù)期就從判例的匯集和信息化呈現(xiàn)轉(zhuǎn)變?yōu)榕欣龣z索系統(tǒng)能夠?qū)⑴欣团c判例相關(guān)的評論、標(biāo)注等信息進(jìn)行整理和總結(jié),并將具有相關(guān)性的判例關(guān)聯(lián)起來,使判例能夠提供的信息更具確定性。簡言之,使用者對于判例檢索期待所能提供的信息由判例本身轉(zhuǎn)化為判例中蘊含的知識,更為重要的是希望判例產(chǎn)生的知識是體系化的,因為這樣才能夠被較為便捷地辨識和獲得。
知識的生產(chǎn)和體系化要經(jīng)歷一個復(fù)雜的過程,從問題發(fā)現(xiàn)到充分的探討,再到初步的知識的形成,此外還有反復(fù)的驗證過程等??赡苣壳白畲蟮膯栴}是個別判例中的知識提取是可能的,但轉(zhuǎn)化為知識后判例和知識的體系化都較為困難。無論是通過司法機(jī)關(guān)對于部分判例效力的宣示和確認(rèn),還是學(xué)術(shù)界或者出版商對于判例的匯編和評論,都沒有能夠有效地實現(xiàn)判例的整合和判例基本體系的構(gòu)建。判例檢索系統(tǒng)因為兼具判例信息的查詢和判例信息管理的功能,因此在判例的體系化上被寄予厚望。
判例檢索系統(tǒng)功能定位轉(zhuǎn)型的一個重要契機(jī)是大數(shù)據(jù)、文本解析、信息檢索等技術(shù)在近些年都有了突破性的進(jìn)展。首先是大數(shù)據(jù)分析技術(shù)的應(yīng)用,為判例檢索系統(tǒng)增加了對判例進(jìn)行批量分析的功能?!霸谡{(diào)研時有法官表示,大多數(shù)簡單案件不需要檢索,而少量疑難案件在檢索后得到的結(jié)論卻五花八門,令人更加不知所措”。(28)高尚:《司法類案的判斷標(biāo)準(zhǔn)及其運用》,《法律科學(xué)》2020年第1期,第33頁。實際上,簡單問題涉及的大量普通判例占了判例中絕大部分,這些判例的價值在于統(tǒng)計學(xué)上的意義,大量、重復(fù)的判例存在的價值可能不在于具體問題的處理,而在于其展示出的某些問題和現(xiàn)象發(fā)展的趨勢和導(dǎo)向。大數(shù)據(jù)技術(shù)在判例檢索系統(tǒng)中的應(yīng)用使得每個個體判例的價值有了疊加和放大的渠道。其次是文本結(jié)構(gòu)化、信息抽取和機(jī)器學(xué)習(xí)等人工智能技術(shù)的應(yīng)用,使得判例檢索有了進(jìn)行自動分析和推理的功能。如前所述,判例檢索系統(tǒng)的使用者大多數(shù)情況是在檢索疑難問題,疑難問題對應(yīng)的疑難判例是“針對事實復(fù)雜,法律存在空白點的社會疑難問題,適用現(xiàn)行法可能會得出有爭議的結(jié)論,這類問題相關(guān)的判例較少且彼此間可能不一致。對這種案件的研究適合作個案剖析,通過深度解析判例中的各種事實情節(jié),理解法律爭議點之所在并試圖找到解決方案”。(29)劉鴻霞:《法律文獻(xiàn)信息檢索理論與實例研究》,北京:中國政法大學(xué)出版社,2018年,第107頁。但問題在于傳統(tǒng)的交流和溝通方式中存在兩方面的問題,會導(dǎo)致對疑難問題的解決略顯乏力:一是在司法愈加復(fù)雜的情況下,司法領(lǐng)域中信息不對稱導(dǎo)致的法律適用不統(tǒng)一的問題長期存在,不同地區(qū)、層級、法院所形成的判例很難全面地找到相似問題的判例;二是相似的疑難問題經(jīng)常被掩蓋在結(jié)構(gòu)差異化較大、撰寫水平各異的判例之中,很難被識別出來。文本結(jié)構(gòu)化、信息抽取和機(jī)器學(xué)習(xí)等技術(shù)都是致力于將判例文本中的自然語言轉(zhuǎn)化為機(jī)器語言,再基于機(jī)器語言進(jìn)行比較,這就部分實現(xiàn)了本質(zhì)化地找到相似疑難問題的目標(biāo)。最后是信息檢索技術(shù)的應(yīng)用,使得判例檢索系統(tǒng)內(nèi)的判例能夠自成體系?!靶畔z索是從大規(guī)模非結(jié)構(gòu)化數(shù)據(jù)(通常是文本)的集合(通常保存在計算機(jī)上)中找出滿足用戶信息需求的資料(通常是文檔)的過程”。(30)曼寧、拉哈萬、舒策:《信息檢索導(dǎo)論》,王斌譯,北京:人民郵電出版社,2010年,第1頁。從收錄數(shù)據(jù)的結(jié)構(gòu)和體量來看,判例檢索系統(tǒng)應(yīng)該屬于面向中等規(guī)模數(shù)據(jù)的信息檢索,在底層技術(shù)層面,判例檢索系統(tǒng)從數(shù)據(jù)庫搜索轉(zhuǎn)型為信息檢索的重要意義在于兩個方面:一方面是改變了數(shù)據(jù)庫式搜索中單向度輸出的方式,一定程度上實現(xiàn)了人機(jī)交互,使用者對判例檢索系統(tǒng)呈現(xiàn)出的文檔的瀏覽、過濾、批注以及進(jìn)一步檢索的行為都會成為判例檢索系統(tǒng)處理的范圍;另一方面是通過機(jī)器學(xué)習(xí)算法實現(xiàn)判例聚類分類的過程,其中聚類是按照判例內(nèi)容進(jìn)行的自動聚團(tuán),而分類則是按照給定的體系(例如成文法體系、案由體系等)、臨時的信息需求和其他多種多樣的類別體系將判例分配到一個或多個類別的體系之中。特別需要強調(diào)的是,判例檢索系統(tǒng)中的聚類和分類任務(wù)是動態(tài)進(jìn)行的,這也保證了通過聚類分類形成的判例體系是動態(tài)更新的。
通過系列技術(shù)在判例檢索系統(tǒng)中的應(yīng)用,會構(gòu)建出一個判例進(jìn)入檢索系統(tǒng)后的判例再生產(chǎn)體系,其中主要實現(xiàn)了以下的功能:其一,判例的識別機(jī)制,主要是指對判例進(jìn)行身份認(rèn)定、結(jié)構(gòu)化解析和信息抽取;其二,判例的關(guān)聯(lián)機(jī)制,目的在于在所有判例之間形成網(wǎng)狀關(guān)系,進(jìn)而生成一個可以基于機(jī)器學(xué)習(xí)或者給定標(biāo)準(zhǔn)改變而動態(tài)更新的判例體系。體系化的目的在于在簡單問題上形成共識,在疑難問題上找到解決方法溝通機(jī)制。這樣做的最主要原因是在我國成文法的體制下,判例的體系化是無法依照判例的效力等級實現(xiàn)的,必須從判例運用的視角重構(gòu)判例之間的關(guān)系。其三,判例的分析機(jī)制,為了向使用者提供可供解決疑難法律問題的知識,也為了保證知識是準(zhǔn)確、無誤、無爭議和分歧的,必須將從個別判例中凝練出的知識放入判例體系內(nèi)進(jìn)行比較和分析?!爱?dāng)一個問題因其涉及錯綜復(fù)雜的相互關(guān)聯(lián)或互動而變得困難時,這就是復(fù)雜——換言之,這就是一個有關(guān)系統(tǒng)的而不是某個單子的問題”。(31)理查德·波斯納:《波斯納法官司法反思錄》,蘇力譯,北京:北京大學(xué)出版社,2014年,第67-68頁。疑難問題必須經(jīng)過大量判例的系統(tǒng)探討才有得出正確答案的可能,此功能也是最需要人工參與的部分,判例檢索系統(tǒng)可以將分歧和爭議識別并展現(xiàn)出來,專業(yè)人士在給出答案后積累到一定數(shù)量后,機(jī)器就可以對分歧解決的過程和結(jié)果進(jìn)行學(xué)習(xí),并實現(xiàn)對系統(tǒng)本身分析機(jī)制的不斷完善。其四,判例的更新機(jī)制,成文法的體制還會對判例檢索系統(tǒng)的發(fā)展帶來一個問題:“在成文法國家,法院對案件的裁決主要是根據(jù)成文法的規(guī)定做出,因此,一旦成文法的規(guī)定發(fā)生變化,例如修訂和廢除時,根據(jù)該成文法做出裁決的案件也就失去相應(yīng)的法律效力。”(32)趙彥:《司法裁判文書的網(wǎng)絡(luò)檢索路徑》,《學(xué)術(shù)交流》2015年第5期,第130頁。為了保證在判例適用的法律修訂或廢止后判例的價值依然能夠維持,就必須將判例歸于判例體系之中,并設(shè)定一套新舊規(guī)范之間的關(guān)系,以便實現(xiàn)在適用法律被更新或廢止時判例生命力的維系?!白鳛榉傻囊环N形式,普通法之遵照先例原則之所以取得成功,主要在于它將確定性與發(fā)展權(quán)融合在一起,而沒有其他原理能夠做到這一點”。(33)羅斯科·龐德:《普通法的精神》,唐前宏、廖湘文、高雪原譯,北京:法律出版社,2018年,第126頁。在我國的立法體制下,不能以判例法的形式維系判例體系的更新,但可以嘗試通過判例的運用,尤其是判例檢索系統(tǒng)中判例的更新來維持判例體系的活力。一個合理的、健康的判例體系是能夠隨著社會的進(jìn)步、法律體系的發(fā)展而不斷更新的,這其中存在一個不斷依照社會現(xiàn)實和成文規(guī)范對判例進(jìn)行檢驗的過程?!霸谶@個無窮無盡的檢驗和再檢驗過程中,有對渣滓的不斷揚棄,也有對任何純粹、合理和精致的東西的不斷保留”。(34)本杰明·卡多佐:《司法過程的性質(zhì)》,蘇力譯,北京:商務(wù)印書館,1998年,第113頁。
各類社會主體、各種法律職業(yè)均意識到無論是在保障自身權(quán)利,還是在具體執(zhí)業(yè)行為中,均應(yīng)該重視判例、學(xué)習(xí)判例和運用判例,同時獲取判例的途徑和媒介也逐漸增多,利用判例的方法也日益豐富,但在缺乏引導(dǎo)的情況下,各類主體普遍采取自利主義的方式進(jìn)行著判例運用,利益的分化則導(dǎo)致判例運用中判例選擇、運用時機(jī)、運用方式各異,在法律實務(wù)的業(yè)務(wù)場景中很難形成穩(wěn)定、良好的判例運用秩序。目前看,判例檢索系統(tǒng)具備成為最具普遍性、最為便捷、成本最低的判例運用工具的基礎(chǔ),可著重考慮用工具引導(dǎo)使用者按照一定的邏輯或者基于一定的規(guī)范進(jìn)行判例運用,這就為判例檢索系統(tǒng)新一階段的發(fā)展指明了目標(biāo),即推動判例運用秩序的形成。判例運用秩序形成具體可解釋為各類主體在判例選擇、判例運用、判例效力位階等問題上形成了一定共識后,判例運用行為和邏輯的趨同性現(xiàn)象。
“司法實踐中事實認(rèn)知的有限性、法律解釋的多義性、司法決策結(jié)果的不確定性,使得司法運行過程關(guān)涉了大量無言之知,需要恰切的轉(zhuǎn)化機(jī)制,將之轉(zhuǎn)化為能夠比較便利地交流、分享的編碼化知識,并能夠進(jìn)行一般化的推廣,進(jìn)而成為司法決策過程中的操作性指南”。(35)吳元元:《司法無言之知的轉(zhuǎn)化機(jī)制及其優(yōu)化——案例研究的知識社會學(xué)反思》,《法學(xué)》2019年第9期,第82頁。判例是目前體量最大、也是潛力最大的司法無言之知。判例是一種法律文獻(xiàn)資源,是記載法律行為和法律知識的載體,但文獻(xiàn)信息檢索更多的是一種相關(guān)性檢索而非確定檢索,在很多情況下不能直接回答使用者的問題本身,而是只能提供解決相關(guān)問題的文獻(xiàn)以及文獻(xiàn)的線索、來源等信息供使用者參考。當(dāng)判例本身和判例檢索系統(tǒng)通過初步的比較和推理后都很難給出解決具體問題的答案時,需要法律法規(guī)、司法文件、法學(xué)學(xué)術(shù)資料等其他文獻(xiàn)資源的支撐和輔助,現(xiàn)有的通用搜索引擎中的判例檢索系統(tǒng)和獨立型判例檢索系統(tǒng)都很難實現(xiàn)這樣的法律知識匯集,因此以判例為核心的綜合性知識庫才是最可行的發(fā)展模式。
從判例檢索系統(tǒng)演變?yōu)橐粋€匯集各類法律信息的判例知識庫,是以判例作為知識連接和匯集的節(jié)點的。知識庫建設(shè)是在對判例進(jìn)行全面、系統(tǒng)加工的基礎(chǔ)上進(jìn)行的,是以人工與人工智能結(jié)合的模式完成的,包含了對判例的結(jié)構(gòu)化解析、信息抽取、關(guān)鍵要素標(biāo)注、評注、與其他法律知識關(guān)聯(lián)等過程,以此實現(xiàn)判例從文本到信息和數(shù)據(jù),再到知識的轉(zhuǎn)換。具有傳統(tǒng)知識儲備的判例檢索系統(tǒng)的開發(fā)者也許本來就具備一定的優(yōu)勢,但也僅僅是初步優(yōu)勢?!昂A康闹R數(shù)據(jù)只有經(jīng)過內(nèi)容方面的專業(yè)編輯提煉和技術(shù)方面的深度聚類分析,經(jīng)過底層知識圖譜的系統(tǒng)化組織和串聯(lián),才具備為用戶不同的業(yè)務(wù)平臺、業(yè)務(wù)場景提供嵌入式、融合性的知識數(shù)據(jù)服務(wù)的可能性”。(36)張承兵:《專業(yè)出版社知識服務(wù)平臺的建設(shè)運營探索》,《科技與出版》2018年第12期,第103頁。但在作為傳統(tǒng)知識載體的紙質(zhì)書籍的撰寫和編輯過程中,不同書籍的撰寫者因為專業(yè)水平、工作經(jīng)歷和教育背景等方面存在的差異,會導(dǎo)致判例匯編、注釋和研究的書籍的水準(zhǔn)存在一定差異,甚至對同一問題或同一判例的認(rèn)知也存在差異,在書籍編纂過程中,這種差異是沒有一個科學(xué)的查找和比對機(jī)制存在的。因此,判例檢索系統(tǒng)中必須有一個知識信息的核驗和轉(zhuǎn)化機(jī)制。從技術(shù)角度看,就是知識的圖譜化,知識本身不具備被自動比較的基礎(chǔ),必須轉(zhuǎn)化為知識圖譜后才能被系統(tǒng)自動核驗、比較和調(diào)用。綜上,判例檢索系統(tǒng)是在向綜合性判例知識庫的方向轉(zhuǎn)型的,并通過將知識轉(zhuǎn)化為知識圖譜的方式實現(xiàn)以判例為中心的多源異構(gòu)法律知識的關(guān)聯(lián)、展示和利用。
從判例被重視和推廣開始,就注定判例的運用與司法業(yè)務(wù)緊密相連,判例檢索系統(tǒng)也應(yīng)該如此。但目前判例檢索系統(tǒng)作為應(yīng)用系統(tǒng)的存在形式,很難實現(xiàn)與業(yè)務(wù)系統(tǒng)的有效融合。另外,無法融入業(yè)務(wù)的具體流程和場景,也會因為檢索輸入信息的有限性導(dǎo)致檢索效果欠佳的問題,因此,判例檢索系統(tǒng)中的很多知識和能力應(yīng)該從簡單的應(yīng)用系統(tǒng)呈現(xiàn)轉(zhuǎn)向為整個法律人工智能的底層技術(shù),以便實現(xiàn)對更多司法業(yè)務(wù)的有效支撐和輔助。
無論是在司法人員的公訴和審判中,還是在律師提供的代理或辯護(hù)的法律服務(wù)中,都越來越多地將判例檢索作為一個必要的業(yè)務(wù)流程環(huán)節(jié)來看待。(37)參見李巖:《判例檢索之“術(shù)”》,《中國律師》2018年第1期,第66-67頁。波斯納法官就曾指出,他對于其法官助理的工作安排中很重要的一項就是在草擬文書時進(jìn)行深入的判例檢索。(38)參見理查德·波斯納:《各行其是:法學(xué)與司法》,蘇力、邱遙堃譯,北京:中國政法大學(xué)出版社,2017年,第170頁。這些還都是判例檢索直接切入業(yè)務(wù)流程的情況,還有許多場景中,判例檢索系統(tǒng)的作用是隱形的,只是將對于判例信息的圖譜化等技術(shù)作為一種能力提供出來。從法律推理的過程來看,判例檢索的過程類似于法律發(fā)現(xiàn)的過程,主要是為了找到處理法律問題的依據(jù)和處理法律問題的方法。因此,在信息化的實現(xiàn)上,越來越多的判例檢索系統(tǒng)從一個獨立的系統(tǒng),向嵌入到業(yè)務(wù)系統(tǒng)中的一個功能模塊轉(zhuǎn)型,這種處理方式在明確了判例檢索應(yīng)用的業(yè)務(wù)場景后,很大程度上提升了判例檢索的應(yīng)用效果,實現(xiàn)不同業(yè)務(wù)節(jié)點、不同應(yīng)用場景判例檢索系統(tǒng)對不同類型人員的精準(zhǔn)輔助和支撐。
將判例檢索系統(tǒng)作為一種底層的能力或者支撐,探索將判例檢索系統(tǒng)中的技術(shù)以及判例數(shù)據(jù)用于法律智能問題、智能審判輔助、刑事量刑輔助等系統(tǒng)之中較為典型。例如,成都數(shù)之聯(lián)科技有限公司開發(fā)的“智能要素式審判系統(tǒng)”、北京華宇元典信息服務(wù)有限公司開發(fā)的“法官怎么判”應(yīng)用等,都實現(xiàn)了對于判例檢索系統(tǒng)的吸收與融合。判例檢索系統(tǒng)中包含著法律人工智能領(lǐng)域在很多場景可以通用的技術(shù)能力,例如文本的結(jié)構(gòu)化解析、文本相似性比對、文本信息抽取等等,這些技術(shù)目前針對的文本還主要限于裁判文書,在司法機(jī)關(guān)電子卷宗應(yīng)用系統(tǒng)鋪開后,則會有更多想象空間,判例檢索系統(tǒng)中蘊含的科技能力的應(yīng)用領(lǐng)域和場景也會有更大的拓展空間。
我國判例檢索系統(tǒng)存在重復(fù)建設(shè)較為嚴(yán)重的問題,主要原因有兩方面:一方面,判例檢索系統(tǒng)中包含的許多技術(shù)確實是法律人工智能領(lǐng)域的基礎(chǔ)和關(guān)鍵技術(shù),是技術(shù)研發(fā)和商業(yè)拓展繞不開的,因此許多法律科技公司在判例檢索產(chǎn)品盈利能力較弱的情況下,還是選擇將其產(chǎn)品化,作為一種科技能力的宣示。另一方面當(dāng)下部分司法機(jī)關(guān)自建判例檢索系統(tǒng)的行為可能是不得已而為之的,市場上確實很難找到可以妥善融入其業(yè)務(wù)流程、符合其業(yè)務(wù)需求的判例檢索系統(tǒng)。遺憾的是,很多地方有了地方性判例檢索系統(tǒng),檢索系統(tǒng)本身卻無地方特色,并且判例系統(tǒng)的運行和維護(hù)成本都較高,導(dǎo)致許多司法機(jī)關(guān)自建系統(tǒng)爛尾或維護(hù)欠佳。較為典型的是上海市第二中級人民法院的法官辦案智能輔助系統(tǒng),其中的判例檢索系統(tǒng)已經(jīng)屬于性能較為良好的應(yīng)用,但依然存在收錄判例不全面的問題。(39)參見萬發(fā)文、蔣靜芬:《類案檢索機(jī)制的構(gòu)建技術(shù)及應(yīng)用分析——基于法官需求角度的實證分析》,《山東法官培訓(xùn)學(xué)院學(xué)報》2019年第4期,第147-148頁。因此,為了避免重復(fù)建設(shè)導(dǎo)致的諸多問題,也為了能有一套統(tǒng)一的判例體系,判例檢索系統(tǒng)還是應(yīng)該從分化建設(shè)模式轉(zhuǎn)向統(tǒng)一建設(shè)模式。
轉(zhuǎn)向統(tǒng)一的模式應(yīng)該是分步驟推進(jìn)的:首先是在同一司法機(jī)關(guān)內(nèi)部的統(tǒng)一。最高人民法院就主導(dǎo)或參與建設(shè)了中國裁判文書網(wǎng)、法信、中國司法案例網(wǎng)等多個判例檢索系統(tǒng),雖然各個系統(tǒng)在功能上各有側(cè)重,但判例篩選、加工和呈現(xiàn)的方式各異,再加上最高人民法院本身已有的包含指導(dǎo)性案例、公報案例、典型案例和各類案例匯編在內(nèi)的復(fù)雜的判例體系的話,無論是在判例運用的方式方法上,還是在判例對于具體法律問題的解決中,都存在著一些沖突。應(yīng)著力協(xié)調(diào)各庭室基于各自業(yè)務(wù)產(chǎn)生的不同需求,建設(shè)院內(nèi)的統(tǒng)一的判例檢索系統(tǒng),也應(yīng)通過最高人民法院的判例檢索系統(tǒng)推動我國判例體系的生成和推廣。其次是在同一類型司法機(jī)關(guān)內(nèi)部的統(tǒng)一,其中主要是法院、檢察院體系內(nèi)部縱向的統(tǒng)一。以法院系統(tǒng)為例,目前已有多省的高級人民法院自主研發(fā)了判例檢索類的應(yīng)用,還有許多基層和中級法院通過聯(lián)合開發(fā)或者采購以產(chǎn)品二次開發(fā)的方式擁有了針對性解決自身需求的判例檢索類應(yīng)用。但實際上各級法院分別進(jìn)行建設(shè)的模式對于我國不同審級法院之間的關(guān)系關(guān)切是不足的,判例運用過程不僅要關(guān)注本院裁判尺度的統(tǒng)一問題,還需注意不同級別、不同地域司法機(jī)關(guān)法律適用的統(tǒng)一問題,因此在法院系統(tǒng)內(nèi)進(jìn)行判例檢索系統(tǒng)的統(tǒng)一就十分必要。對于不同層級、地域法院的個性化需求,可以通過在系統(tǒng)中個性化配置某些系統(tǒng)參數(shù),實現(xiàn)對于地域、審級等使用者差異化因素的考量。再次是在不同司法機(jī)關(guān)之間的統(tǒng)一。從實踐角度看,不同司法機(jī)關(guān)在業(yè)務(wù)層面的聯(lián)系是通過案件實現(xiàn)的,應(yīng)以判例為中心,匯集相關(guān)的文書、數(shù)據(jù)和信息,這不僅可以在不同司法機(jī)關(guān)實現(xiàn)判例檢索系統(tǒng)的統(tǒng)一,對于更全面、系統(tǒng)地獲取判例信息也有極大幫助。最后是在全國范圍內(nèi)的統(tǒng)一,這個統(tǒng)一是在基礎(chǔ)數(shù)據(jù)和底層技術(shù)上的統(tǒng)一,是在知識和方法上的統(tǒng)一,并最終實現(xiàn)在判例體系層面的統(tǒng)一。
判例檢索系統(tǒng)轉(zhuǎn)向統(tǒng)一后,運營模式也要做相應(yīng)的改革,最終通過良好的運營模式保障判例檢索系統(tǒng)能夠持續(xù)、穩(wěn)定的發(fā)展。目前判例檢索系統(tǒng)運營方式的問題主要是組織、機(jī)構(gòu)、部門之間利益分化導(dǎo)致的。建議我國轉(zhuǎn)向統(tǒng)一后的判例檢索系統(tǒng)借鑒德國的運營模式:“德國建立有Juris法律信息數(shù)據(jù)庫(德國政府占51%的公司股份),法院將判決書傳遞給數(shù)據(jù)庫,法官可以享受一定的折扣來使用該數(shù)據(jù)庫?!?40)陳興良主編:《中國案例指導(dǎo)制度研究》,北京:北京大學(xué)出版社,2014年,第393頁。即統(tǒng)一建設(shè),使用者付費,商業(yè)使用和公益類使用分開定價的運營方式。另外,如果組織或集體使用者在統(tǒng)一判例檢索系統(tǒng)的基礎(chǔ)上有定制化開發(fā)的需求,如從網(wǎng)頁端轉(zhuǎn)向移動端,增加數(shù)據(jù)分析功能等,則需按照用途和使用范圍等額外付費。
(本文寫作得到張恒、谷松原在資料收集方面的協(xié)助,特此致謝。)