• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      面向法律文書的自然語言理解

      2022-09-28 10:24:34安震威來雨軒馮巖松
      中文信息學報 2022年8期
      關(guān)鍵詞:法律文書罪名檢索

      安震威,來雨軒,馮巖松

      (1. 北京大學 王選計算機研究所,北京 100871) (2. 國家開放大學 計算機學院,北京 100039)

      0 引言

      隨著我國依法治國方略的實施,社會法治進程穩(wěn)步前進,通過法律手段維護社會公平正義、維護個體權(quán)益已成為社會日常生活的重要組成。隨之而來的,則是法律領(lǐng)域從業(yè)人員需要處理的案件量顯著提升。據(jù)統(tǒng)計,我國各級人民法院一年受理訴訟案件總數(shù)已超過3 000萬件[1],這對司法系統(tǒng)的穩(wěn)定運行提出了巨大挑戰(zhàn)。法律人工智能將人工智能技術(shù)應(yīng)用于法律領(lǐng)域,可以在案件處理過程中為法律從業(yè)者提供智能化服務(wù),提升其工作實效。因此,近年來法律人工智能技術(shù)受到學術(shù)界與產(chǎn)業(yè)界的廣泛關(guān)注。

      法律案件審理過程的各個環(huán)節(jié)記錄都會用文字歸檔,相關(guān)法條法規(guī)及司法解釋等官方文件也通常以文本形式呈現(xiàn)。這些以文本形式呈現(xiàn)的法律相關(guān)文檔統(tǒng)稱為法律文書。法律文書是實施法律的重要手段,忠實地記錄著各類法律活動。在法律人工智能中,面向法律文書的自然語言理解技術(shù)有著較高的研究價值與廣泛的應(yīng)用前景。

      自然語言理解技術(shù)在法律文書上有豐富的應(yīng)用場景,如類案檢索、智能輔助司法裁判以及司法問答系統(tǒng)等。

      類案檢索系統(tǒng)通過提供智能化的關(guān)鍵信息抽取服務(wù)和文書檢索服務(wù),減輕了法律從業(yè)者在處理法律文書方面的工作量,提升了整個司法環(huán)節(jié)的效率。不同于基于淺層文本匹配的文書檢索系統(tǒng),智能文書檢索系統(tǒng)利用深度學習模型,引入法律要素、爭議焦點等法律知識,理解法律文書的深層語義信息,能夠提供更為準確和個性化的檢索結(jié)果。

      在司法裁判過程中,智能輔助系統(tǒng)可以提供包含推理過程、可解釋的判決預(yù)測結(jié)果,并附上相關(guān)統(tǒng)計分析數(shù)據(jù),為法官提供有價值的參考信息,提高其工作效率,維護司法公正。

      司法問答系統(tǒng)可以為更廣泛的人群提供法律咨詢服務(wù),讓普通群眾無須掌握專業(yè)的法律知識,也無須支付高昂的法律咨詢服務(wù)費用,依然能夠便捷地了解和學習法律知識,同時也降低了普通群眾運用法律維護自身權(quán)益的門檻。

      自然語言理解技術(shù)在法律文書上的應(yīng)用場景主要涉及法律文書信息抽取、類案檢索、司法問答、法律文書摘要和判決預(yù)測五個任務(wù)。本文在第1節(jié)系統(tǒng)地介紹了這些任務(wù)的形式,研究現(xiàn)狀及難點。在第2節(jié)中,本文針對處理法律文書面臨的主要技術(shù)挑戰(zhàn)展開了深入分析和討論,指出目前主要的挑戰(zhàn)包括: ①處理法律文書中的語言與日常生活語言間的表述差異性; ②建模法律文書中特有的推理與論辯內(nèi)容; ③將法條、推理模式等法律知識融入自然語言理解模型的學習和預(yù)測過程。

      法律文書一般指具有普遍約束力的規(guī)范性法律文件(法律法規(guī)等)以及由國家司法機關(guān)、律師等依法制作的具有法律效力的文件。表1展示的刑事案件判決書就是一種常見的法律文書。不同于日常生活中常見的文本,法律文書通常為半格式化文本,具有一定的結(jié)構(gòu)。例如表1的案件判決書包含案情描述、法庭判決、相關(guān)法條等章節(jié)。在內(nèi)容上,法律文書以敘議為內(nèi)容主體,具有層次分明的論辯結(jié)構(gòu),并含有大量法律概念。這些特點要求面向法律文書的自然語言理解模型能夠處理法律文書的常見結(jié)構(gòu),理解法律概念,甚至應(yīng)對一些推理任務(wù)。

      表1 刑事案件判決書示例

      1 自然語言理解在法律文書中的應(yīng)用

      學術(shù)界針對自然語言理解在法律文書領(lǐng)域的應(yīng)用已經(jīng)開展了一系列的研究,主要集中于法律文書的信息抽取、類案檢索、司法問答、法律文書摘要和判決預(yù)測五個方面,并取得了一系列研究成果。

      1.1 面向法律文書的信息抽取

      面向法律文書的信息抽取任務(wù)需要從非結(jié)構(gòu)化的法律文書中提取結(jié)構(gòu)化信息。該任務(wù)可以提取關(guān)鍵角色、抽取法律要素、還原事實經(jīng)過,從而直接幫助相關(guān)人員快速查閱、厘清案件信息。法律文書中抽取的結(jié)構(gòu)化信息對自然語言理解在法律文書上的其他應(yīng)用任務(wù)也有所幫助,如利用法律要素輔助判決預(yù)測(Hu等[2],Zhong等[3])。相比于通用文本上的信息抽取,面向法律文書的信息抽取除了關(guān)注命名實體識別、實體鏈接、關(guān)系抽取、事件抽取等基礎(chǔ)信息抽取任務(wù)外,更需要關(guān)注法律要素抽取。

      1.1.1 基礎(chǔ)信息抽取

      目前,針對法律文書的基礎(chǔ)信息抽取研究表明通用語料上的信息抽取技術(shù)可以在法律文書上取得較好的效果。在法律本體抽取任務(wù)中,Bruckschen等[4]和Zhang等[5]通過命名實體識別方法實現(xiàn)法律本體庫構(gòu)建和擴展。Cardellino等[6]指出直接在通用語料(如維基百科)上訓練的命名識別模型用于法律文本中,會有過擬合導(dǎo)致的性能下降,而通過課程學習方式可以緩解這一問題。Wang等[7]基于預(yù)訓練語言模型,在包含上萬篇巴西法律文書的數(shù)據(jù)集LeNER-Br上取得了0.93的F1值。對事件抽取而言,針對法律文書的事件抽取研究沿用ACE[8]的任務(wù)形式,抽取法律文書中的事件和事件相關(guān)論元。Shen等[9]定義了拘留、逮捕、偷竊、搶劫、故意殺人等11種訴訟法和刑法相關(guān)的事件類型和26個事件相關(guān)論元(故意殺人-受害者,故意殺人-原因等),基于注意力機制進行事件抽取,在論元識別任務(wù)上取得了0.90的F1值。

      1.1.2 合同要素抽取

      合同是一類重要的法律文書。由于商業(yè)公司、政府機構(gòu)對合同分析的巨大需求,合同要素抽取受到了廣泛的關(guān)注。

      Chalkids等[10]分析了商業(yè)合同的固定結(jié)構(gòu)(包括標題,合同當事人,主要內(nèi)容等),抽取了起止日期、合同期限、引用法條等11種合同要素。Chalkids等[10]指出合同要素與合同結(jié)構(gòu)有緊密聯(lián)系,并利用手工制定的規(guī)則特征抽取要素,取得了0.80的F1值。在隨后的工作中,Chalkids等[11]發(fā)現(xiàn)深度學習模型可以進一步提升合同要素抽取的效果,Wang等[12]將單領(lǐng)域合同要素抽取擴展到包括私人合同和商業(yè)合同在內(nèi)的多個領(lǐng)域。

      1.1.3 法律要素抽取

      法律要素主要指裁判文書中可能影響裁判結(jié)果的關(guān)鍵信息,如勞務(wù)合同報酬糾紛案例中是否存在勞務(wù)關(guān)系、交通肇事案例中被告是否為酒后駕駛。在刑事案件中,法律要素通常指犯罪構(gòu)成要件[13],構(gòu)成要件是刑法規(guī)定的對行為的社會危害性及其程度具有決定意義的并且為該行為成立犯罪所必須的事實特征。在罪名預(yù)測任務(wù)中,法律要素不僅能提供具有判別性的弱監(jiān)督信息(Hu等[2]),還能為模型提供良好的可解釋性(Li等[14])。民法中沒有對法律要素的明確定義,其法律要素一般指法律文書中事實描述部分的關(guān)鍵信息,如Li等[15]將婚姻法案例中的法律要素定義為婚姻狀態(tài)、子女個數(shù)等關(guān)鍵信息。

      Shu等[16]提出了涉及婚姻家庭、勞動爭議和借款糾紛三個領(lǐng)域的法律要素抽取數(shù)據(jù)集CAIL2019-fe(示例見表2),該數(shù)據(jù)集要求模型識別出給定事實描述中的法律要素。Zhong等[17]在該數(shù)據(jù)集上嘗試了多種深度學習模型(CNN[18]、DPCNN[19]、BiDAF[20]等),均取得了超過0.70的F1值。

      表2 CAIL2019-fe示例

      現(xiàn)有的法律要素抽取任務(wù)只針對單一段落抽取要素,如CAIL2019-fe。事實上,很多法律要素的確定可能需要綜合多段落信息。如在“海商法”領(lǐng)域,海上貨物運輸無單放貨糾紛案例中的“原告主體資格認定”,不僅需要原告提交證據(jù)證明存在被告無單放貨事實以及其遭受的損失,還需要證明原告是否是合法的提單持有人,前者通常出現(xiàn)在質(zhì)證段落,而后者通常隱含在事實陳述段落。這類法律要素抽取任務(wù)還需后續(xù)工作的進一步探索。

      1.2 類案檢索

      類案檢索的任務(wù)目標為對于給定的待檢索案例,從案例庫中找出與其最相關(guān)或相似的案例并返回給用戶。在判例法國家,法院在審理案件時,依照“遵循先例”的原則,將先前的相似判例作為審理和裁決的依據(jù)。因此,了解相似案例是律師在開庭前需要做的一項重要準備。在成文法國家,相似案例也是司法從業(yè)人員了解裁判依據(jù)和尺度、或準備辯護策略的重要參考信息。

      類案檢索與常見的網(wǎng)頁檢索有很大區(qū)別。首先它的用戶是掌握專業(yè)法律知識的法律工作者,其次它的檢索結(jié)果通常為半結(jié)構(gòu)化的法律文書[21]。更重要的是,法律文書相關(guān)性定義與通常意義上的文本相似性定義有很大區(qū)別,Opijnen等[22]認為法律信息檢索中的相關(guān)性應(yīng)該涉及主題、法系以及用戶需求等多個維度;在中國的法律體系下,Ma等[23]認為類案檢索應(yīng)該考慮相關(guān)法條、爭議焦點以及基本事實三個方面,這一觀點也體現(xiàn)在《最高人民法院關(guān)于統(tǒng)一法律適用加強類案檢索的指導(dǎo)意見(試行)》(1)http://lawdb.cncourt.org/show.php?fid=152311中。Shao等[24]探究了類案檢索系統(tǒng)的用戶行為,認為相比于網(wǎng)頁檢索,類案檢索系統(tǒng)用戶傾向于花費更長的時間以滿足其需求,并且任務(wù)難度會顯著影響用戶的行為。

      現(xiàn)有的類案檢索數(shù)據(jù)集可分為判例法數(shù)據(jù)集(Case Law Collection[25],COLIEE 2020[26])和成文法數(shù)據(jù)集(LeCaRD[23])。這些數(shù)據(jù)集包含若干待查詢案例,并在案例庫中標注出了與每個查詢相關(guān)的案例。LeCaRD增加了爭議案例(二審對一審結(jié)果改判),作為復(fù)雜查詢以更好地模擬真實場景。

      基于文本相似度的檢索方式仍然是現(xiàn)階段法律案例檢索的主要方法。BM25[27]、TF-IDF[28]等基于詞語匹配的方法常常被用作基線模型[23]。Tran等[29]借助法律文書摘要技術(shù),首先獲取法律案例的摘要,然后計算查詢案例與候選案例文本(含摘要)之間的詞匯重疊度,以此衡量案例文本之間的相關(guān)性。近年來,利用法律文書的特點和法律知識的法律案例檢索吸引了很多研究者的注意。Sugathadasa等[30]利用法律案例中對其他案例的引用信息和案例文本自身信息將案例文本向量化,進而利用向量相似度構(gòu)建法律案例檢索系統(tǒng)。Shao等[24]提出計算法律案例文本相似度時應(yīng)該考慮法律文書的結(jié)構(gòu),利用查詢案例與候選案例各個段落間的交互信息計算法律案例之間的相關(guān)性。

      法律案例檢索任務(wù)中相關(guān)性定義與法律文書本身的特點密不可分,這也是其與傳統(tǒng)文本檢索任務(wù)的主要區(qū)別。對于檢索范式的思考和探究也是法律案例檢索發(fā)展的新方向。Liu等[31]探究了對話式檢索的應(yīng)用前景,這一方式允許用戶在檢索過程中與檢索系統(tǒng)進行多輪交互。Liu等[31]得出與傳統(tǒng)的檢索范式相比,對話式檢索的用戶滿意度較高、檢索時間成本更低。但如何實現(xiàn)一個自然、高效的智能對話系統(tǒng)接口,仍然是一個巨大的挑戰(zhàn)。

      1.3 司法問答

      司法問答需要以法條、裁判文書等各類法律文書資源為依據(jù),回答用戶以自然語言形式提出的問題。司法問答系統(tǒng)可以為客戶在法律事務(wù)上提供解釋、建議或者解決方案。與開放域問答相比,司法問答需要結(jié)合法律知識,得到答案的推理過程需要遵循法律推理邏輯。

      現(xiàn)有的司法問答任務(wù)可以分為面向普通群眾的問答和面向司法從業(yè)者的問答。關(guān)于隱私條款的問答是面向普通群眾的問答任務(wù)之一,隱私條款用于說明產(chǎn)品收集、使用、分享和管理用戶數(shù)據(jù)的方式,但其篇幅較長且結(jié)構(gòu)復(fù)雜,給用戶閱讀帶來很大困難。Ravichander等[32]提出了關(guān)于隱私條款問答的數(shù)據(jù)集PrivacyQA,收集了“該產(chǎn)品是否會收集我的健康數(shù)據(jù)”等用戶關(guān)注的問題,其答案為隱私條款中與問題相關(guān)的原文。Ravichander等認為對于PrivacyQA中的問題,模型首先需要預(yù)測問題的可回答性;對于可回答的問題,模型采用機器閱讀理解的任務(wù)形式,從隱私條款中找出能夠回答問題的語句。

      近年來,有更多研究者關(guān)注面向司法從業(yè)者的問答任務(wù),其中以面向法律資格考試的問答為主,如COLIEE比賽[33]使用日本法律資格考試中的選擇題作為賽道數(shù)據(jù),數(shù)據(jù)集JEC-QA[34]收集了中國國家司法考試的試題。表3為中國國家司法考試問題與答題思路示例。

      表3 面向司法從業(yè)者的問答示例(引用自文獻[29])

      在COLIEE比賽中,司法問答被分為相關(guān)法條檢索和法條蘊含判斷兩個任務(wù)。相關(guān)法條檢索任務(wù)要求模型從法條庫中檢索出與給定問題相關(guān)的法條。Carvallo等[35]利用法條與問題的詞根特征進行檢索;為了解決法條文本的多段落問題,Do等[36]將含有多個段落的法條拆分為多個法條,使用TF-IDF、歐式距離等特征檢索法條。Kien等[37]使用CNN和注意力機制計算法條和問題之間的相似度。

      法條蘊含判斷任務(wù)要求判斷是否可以根據(jù)相關(guān)法條中的內(nèi)容回答給定問題,早期的工作使用基于規(guī)則的方法(Kim等[38])判斷蘊含關(guān)系,Carvallo等[35]抽取淺層語義特征,基于機器學習文本分類方法作出預(yù)測。Do等[36]和Kim等[40]在檢索相關(guān)法條的基礎(chǔ)上,采用深度學習文本分類模型。此外,有研究者也引入了法律知識,如Fawei等[41]提出一套能夠自動抽取法律本體的方法論,以此支持蘊含判斷。

      1.4 法律文書摘要

      法律文書摘要是文本摘要在裁判文書上的應(yīng)用,旨在用精煉的話語總結(jié)裁判文書中的主要內(nèi)容和關(guān)鍵信息。司法從業(yè)者常常需要閱讀數(shù)以百計的裁判文書,并且大部分裁判文書長達數(shù)十頁。法律文書摘要能夠幫助司法從業(yè)者快速了解法律文書的關(guān)鍵信息,使其免于繁重的文書工作。

      作為法律文書摘要的主要研究對象,裁判文書具有很多不同于其他領(lǐng)域文本的特點: 首先,裁判文書通常情況下顯著長于其他常見領(lǐng)域的文本(如新聞等)。其次,裁判文書具有固定且鮮明的層次結(jié)構(gòu),并且包含豐富的法律概念和詞匯。此外,法律領(lǐng)域的專業(yè)性要求法律文書摘要必須包含法律依據(jù)等法定措辭。為了更完整地保留原文中的法定辭令,現(xiàn)有的研究多基于裁判文書的篇章結(jié)構(gòu)進行抽取式摘要。

      裁判文書通常按照特定的結(jié)構(gòu)組織內(nèi)容。例如表1所示的刑事案件判決書包括當事人信息、案情描述、法庭判決、相關(guān)法條等內(nèi)容。將裁判文書按照一定的篇章結(jié)構(gòu)劃分為若干組不同的句子(篇章結(jié)構(gòu)標記),然后從每組句子中選出最具有代表性的一句話(摘要句選取)組成摘要,是當前法律文書摘要的主要研究思路。

      早期研究者們多使用語言學特征標記篇章結(jié)構(gòu)和選取摘要句。Groover等[42]和Farzindar等[43]選用關(guān)鍵字、時態(tài)、詞性等特征,Wagh等[44]加入了文本位置特征。

      近年來,有學者認為法律知識對于法律文書摘要有重要的指導(dǎo)意義,Bhattacharya等[45]依據(jù)法律專家對法律文書的分析,為單詞、句子等設(shè)計不同的權(quán)重,使用整數(shù)線性規(guī)劃標記篇章結(jié)構(gòu)和選取摘要句。作為一種無監(jiān)督文本摘要方法,Bhattacharya等[45]的實驗效果超過了基于BERT的有監(jiān)督文本摘要方法。Duan等[46]在針對法庭辯論記錄文本的摘要中,引入爭議焦點信息,將法庭辯論記錄劃分為若干組圍繞爭議焦點展開的句子,然后再標記爭議焦點和選取摘要句。Duan等[46]認為在庭審過程中,爭議焦點是辯論雙方爭論的主要問題,整場法庭辯論通常是圍繞若干個爭議焦點展開的。如在借貸糾紛案例中,常見的爭議焦點包括原告和被告之間是否存在借貸關(guān)系、放款人是否履行了放款義務(wù)。實驗效果上,Duan等[46]的方法顯著好于其他抽取式文本摘要方法。

      Bhattacharya等[45]和Duan等[46]的研究表明法律知識的引入能夠有效提升法律文書摘要的效果,這也說明以恰當?shù)姆绞揭敕梢?、爭議焦點等法律知識是法律文書摘要研究的重要發(fā)展方向。

      1.5 判決預(yù)測

      判決預(yù)測任務(wù)旨在根據(jù)案情描述,尋找適當?shù)姆梢罁?jù),做出合理的裁判結(jié)果。判決預(yù)測的任務(wù)形式和任務(wù)內(nèi)容因為民事糾紛和刑事案件的差異各不相同,在刑事案件方面,常見的法庭判決內(nèi)容包括罪名、刑期、罰款數(shù)額等;在民事領(lǐng)域,判決預(yù)測關(guān)注訴訟雙方的訴訟請求是否被支持以及所依據(jù)的法律條文等。由于判例法和成文法的區(qū)別,一些國外研究者不對民事案件和刑事案件做直接區(qū)分,只關(guān)注于法官在法庭中的行為。

      1.5.1 刑事案件的判決預(yù)測

      在刑事案件方面,判決預(yù)測系統(tǒng)的輸入為案件的事實描述,輸出包括該案件所適用的罪名、刑期以及判決依據(jù)的法條。因此,對刑事案件的判決預(yù)測常常被定義為一個文本分類任務(wù)。

      早期研究基于語言學特征和規(guī)則進行文本分類。Liu等人[47]選取了臺灣地區(qū)法律中常見的12個罪名,利用基于關(guān)鍵詞的規(guī)則獲取案例中的句法和語義特征,使用KNN作為分類器預(yù)測罪名。

      隨著深度學習在自然語言理解領(lǐng)域的廣泛應(yīng)用,以及互聯(lián)網(wǎng)上大規(guī)模裁判文書數(shù)據(jù)的進一步公開,研究者開始使用深度學習模型進行判決預(yù)測。如Luo等[48]使用Bi-GRU編碼事實描述和法律文書,結(jié)合注意力機制預(yù)測罪名。

      除了罪名預(yù)測外,研究者也關(guān)注對刑期、罰款金額、相關(guān)法條等判決內(nèi)容的預(yù)測。Chen等[49]在神經(jīng)網(wǎng)絡(luò)模型中加入門控機制,過濾與判決無關(guān)的特征,從而預(yù)測刑期。值得注意的是,刑事案件判決的各個內(nèi)容之間并非相互獨立,例如,刑期通常會與罪名有著較強的關(guān)聯(lián),因此很多研究者使用多任務(wù)學習的模式同時對多個判決內(nèi)容進行聯(lián)合預(yù)測。Zhong等[50]使用有向無環(huán)圖(Directed Acyclic Graph, DAG)建模法條預(yù)測、刑期預(yù)測、罪名預(yù)測之間的拓撲關(guān)系,使用多任務(wù)學習的模式同時預(yù)測多個判決內(nèi)容。在Zhong等[50]基礎(chǔ)上,Yang等[51]設(shè)計了更精細的拓撲結(jié)構(gòu)捕捉子任務(wù)之間的依賴關(guān)系。在多任務(wù)學習的基礎(chǔ)上,Yue等[52]認為在判決過程中,定罪與量刑分別依據(jù)事實描述中的不同內(nèi)容,應(yīng)將其區(qū)分對待。

      1.5.2 民事領(lǐng)域的判決預(yù)測

      民事領(lǐng)域的案件描述通常包括事實描述、原告訴訟請求、被告抗辯,以及證據(jù)提交情況等多種內(nèi)容。在文本長度上,民事案件文本顯著長于刑事案件文本。民事領(lǐng)域的法庭判決常常與訴訟請求相關(guān),體現(xiàn)為是否支持原告的訴訟請求或在多大程度上支持訴訟請求。

      目前在民事領(lǐng)域判決預(yù)測的研究一般關(guān)注于特定的法律領(lǐng)域,如婚姻法、合同法等。Li和Zhang等[15]使用正則表達式,結(jié)合人工規(guī)則抽取婚姻糾紛案件中的法律要素,隨后使用馬爾可夫邏輯網(wǎng)絡(luò)預(yù)測婚姻法中常見的判決內(nèi)容,如是否同意離婚、子女監(jiān)護權(quán)歸屬等。在Li和Zhang等[15]的工作中,法律要素和人工規(guī)則的設(shè)計都需要相關(guān)領(lǐng)域法律專家的深度參與,這使得模型具有較好的可解釋性,但同時喪失了對其他民事案由的泛化能力。Long等[53]將民事領(lǐng)域判決預(yù)測任務(wù)定義為問答任務(wù),以原告訴求為問題,以事實描述和相關(guān)法條為參考文本,使用機器閱讀理解模型進行判決預(yù)測,即判定原告的每一條訴訟請求是否應(yīng)該得到支持。相比于Li和Zhang等[15],Long等[53]提出的方法不深度依賴于領(lǐng)域?qū)<抑贫毩6鹊囊?guī)則或模板,因而具有更好的泛化能力。

      1.5.3 國外判決預(yù)測研究

      目前判例法國家的研究者主要關(guān)注于預(yù)測法官對于案件的意見以及法庭判決,這些工作的研究對象一般限定于特定法庭的法律案例。Aletras等[54]以歐洲人權(quán)法庭(European Court of Human Rights)中的案例作為研究對象,使用案件文本的N-gram特征和主題特征,預(yù)測某個案件是否違反相關(guān)法條。Katz等[55]使用法官對案件標記的下級法院意見、初審法庭、案件來源等以類別標簽為主的特征,預(yù)測美國最高法院法官對下級法院判決的意見。

      1.5.4 判決預(yù)測中的難點

      現(xiàn)有判決預(yù)測研究已經(jīng)取得了較好的進展,然而判決預(yù)測距離實際應(yīng)用還面臨著很多困難,其中對于判決的可解釋性和案件類別分布不均衡是最突出的兩方面。

      可解釋性可解釋的判決預(yù)測研究旨在提供司法從業(yè)者可理解的預(yù)測解釋,以支撐模型預(yù)測結(jié)果的實際應(yīng)用?,F(xiàn)有研究致力于將模型的預(yù)測過程可視化,為模型的輸出提供解釋根據(jù),從而避免預(yù)測結(jié)果不可解釋的黑箱現(xiàn)象。Liu等[56]將罪名預(yù)測視為一系列的決策過程,將事實描述以句子為單位依次輸入模型,模型在每一步輸入進行決策,當模型認為收集到足夠多的信息時,就會輸出罪名預(yù)測的結(jié)果,而模型在預(yù)測過程中充分重點關(guān)注的句子則被視為其決策依據(jù)。Jiang等[57]使用短語級的決策依據(jù),將案情文本劃分為長度為6個字的短語序列,然后將可以支持罪名預(yù)測結(jié)果的短語作為決策依據(jù)。除了直接從原文中抽取決策依據(jù),Zhong等[3]使用法律專家設(shè)計的法律要素作為決策依據(jù),如案件中是否與交通相關(guān)、是否出現(xiàn)飲酒情節(jié)等。模型首先從事實描述中抽取相關(guān)法律要素,然后綜合利用法律要素和案情描述進行罪名預(yù)測。

      案件類別分布不均衡在現(xiàn)實生活中,不同案由的案件數(shù)分布并不平衡。以Hu等[2]針對中國刑事案件的統(tǒng)計數(shù)據(jù)為例,最常見的10個罪名(如盜竊罪,故意傷害罪和交通違規(guī)罪等)覆蓋了78.1%的案例,然而最不常見的50個罪名(如倒賣文物罪、擾亂法庭秩序罪和偷稅罪等)只覆蓋了不到0.5%的案例數(shù)。對于少樣本標簽,常見的機器學習模型很難從有限的訓練樣本中學習到對預(yù)測這些標簽有用的特征。任務(wù)少樣本標簽因此成為判決預(yù)測中亟待解決的問題。

      目前針對少樣本標簽的研究仍然有限。Hu等[2]通過多任務(wù)學習的模式同時預(yù)測法律要素和罪名,提高了模型在少樣本罪名上的預(yù)測效果。He等[58]發(fā)現(xiàn)使用膠囊網(wǎng)絡(luò)編碼案情描述文本對罪名預(yù)測中的少樣本標簽有所幫助。

      2 主要挑戰(zhàn)

      綜上所述,面向法律文書的自然語言理解研究已經(jīng)在多種任務(wù)上取得了顯著進展,部分技術(shù)已被應(yīng)用于法律文書檢索、法律智能問答等應(yīng)用場景中。在提高司法效率、維護司法公正方面,面向法律文書的自然語言理解還有更大的研究和應(yīng)用潛力,同時也面臨著困難和挑戰(zhàn)。例如,法律案例檢索需要模型理解案件中的爭議焦點,結(jié)合法律知識和語義信息計算案例間的相似性;判決預(yù)測模型需要給出符合邏輯、有說服力的判決依據(jù)。目前基于法律文書的自然語言理解研究面對的主要挑戰(zhàn)可以歸納為三點: ①如何處理法律文書中的語言表述與日常生活中語言表述的差異性; ②如何理解法律文書中的論辯說理內(nèi)容; ③如何將法律條文、推理模式等法律知識融入自然語言理解模型中。

      2.1 如何處理語言差異

      法律文書中的語言表述與日常生活中的語言是具有顯著差異的,這是應(yīng)用已有自然語言理解技術(shù)處理法律文書所面對的首要困難。這種差異主要表現(xiàn)為詞匯表述差異和篇章結(jié)構(gòu)差異。

      就詞匯而言,作為規(guī)范性法律文件,法律文書包含大量專業(yè)詞匯。如表4所示,司法判決書的法院判決部分包含“船舶優(yōu)先權(quán)”“工資債權(quán)”“勞務(wù)合同糾紛”等多個法律概念,理解這些概念對理解法律文書至關(guān)重要。此外,判決書中的事實描述部分以及法律咨詢中的問題多采用口語化的表達方式。將法律概念的專業(yè)化表述與口語化的表達關(guān)聯(lián)起來就顯得至關(guān)重要,如表3中,“150萬元假鈔從國外運回中國”與“走私假幣”和“運輸假幣”兩個罪名是密切相關(guān)的。

      表4 民事案件判決書(法院判決部分)示例

      法律文書的行文組織與其他開放域文本存在較大區(qū)別。如第1節(jié)所述,法律文書通常為半格式化文本,遵循一定的行文組織結(jié)構(gòu)。如民事判決書一般包含原告訴求、原告訴稱、被告辯稱、法院查明、法院判決等多部分內(nèi)容,這些內(nèi)容按照特定的法律邏輯組織后呈現(xiàn)在判決書中。因此,法律文書中的篇章結(jié)構(gòu)通常比新聞、影評等常見文本中的篇章結(jié)構(gòu)更為復(fù)雜。

      預(yù)訓練語言模型為解決語言差異提供了一種可能的解決方案。Chalkidis等[59]探究了BERT[60]遷移到法律領(lǐng)域的多種方式,得出通過法律語料進一步微調(diào)BERT或者在法律語料上重新訓練BERT均能在自動判決預(yù)測、合同命名實體識別等法律文本理解任務(wù)上發(fā)揮更好的效果。Xiao等[61]提出了面向中文法律文書的預(yù)訓練語言模型Lawformer。Lawfomer將在通用文本上預(yù)訓練好的語言模型,在大量法律文書上進一步訓練,這使得Lawformer能夠更好地理解法律專有詞語。基于Longformer的滑動窗口注意力機制[62],使得Lawformer能夠處理長度超過512詞的文本,從而具有一定理解復(fù)雜篇章結(jié)構(gòu)的能力。實驗表明,Lawformer在判決預(yù)測、法律案例檢索等任務(wù)上的表現(xiàn)均優(yōu)于BERT[60]、RoBERTa[62]等通用預(yù)訓練語言模型。

      2.2 如何做到“以理服人”

      在司法裁判文書中,法官會記錄完整的審理過程和結(jié)果,包含法官做出判斷的推理過程、所使用的法律依據(jù)、以及最后的裁判結(jié)果。刑事案件的裁判文書中包含從案情描述到犯罪要件的推理過程,民事案件的裁判文書中則包含從事實描述和相關(guān)證據(jù)到對訴訟雙方訴訟請求的判決結(jié)果的解釋??梢钥吹?,法官希望在裁判文書中明確地“說理”從而達到“以理服人”的效果。基于深度學習模型的決策過程往往與人類的思維邏輯有所不同。有學者認為法律人工智能模型在給出各種判決或者預(yù)測的同時,應(yīng)當給出符合人類邏輯的解釋[64],這就要求研究者引導(dǎo)模型依據(jù)法律知識進行推理,做到“以理服人”。

      在法律問答任務(wù)中,問題和答案之間的關(guān)聯(lián)可能包含多步推理,這需要模型運用法律知識給出從問題到答案的推理過程,提高模型輸出的可解釋性和可信程度。如在表3所示案例中,系統(tǒng)需要先從事實描述中分析嫌疑人觸犯了走私假幣罪和運輸假幣罪,然后對比兩種罪名的刑期區(qū)間,最后才能依據(jù)“想象競合原則”從重定罪。

      部分研究者使用一階邏輯來實現(xiàn)基于法律知識的邏輯推理,如Li等[15]在抽取婚姻法案例的關(guān)鍵要素后,使用馬爾可夫邏輯網(wǎng)絡(luò)完成從法律要素到訴求判決之間的推理。Li等[14]在獲取刑事案件中的主觀要件和客觀要件后,使用一階謂詞演算完成犯罪要件到罪名之間的推理。一階邏輯作為最直接的顯式推理形式,能夠為判決預(yù)測系統(tǒng)提供良好的可解釋性,但需要法律專家設(shè)計基于相關(guān)法律知識的推理規(guī)則,這一過程復(fù)雜并且代價高昂。

      因此,更多的研究者使用深度學習模型進行隱式推理。Liu等[56]和Jiang等[57]在罪名預(yù)測的過程中,找出能夠支持判決預(yù)測結(jié)果的句子或短語,將其作為最終判決預(yù)測的決策依據(jù);根據(jù)決策依據(jù)預(yù)測罪名,也可將其視為一種基于文本內(nèi)容的推理模式。近年來,還有學者嘗試依據(jù)犯罪構(gòu)成理論來指導(dǎo)模型進行推理。犯罪構(gòu)成理論是中國刑法學界的基礎(chǔ)理論,它規(guī)定任何一種犯罪的成立都必須構(gòu)成四個方面的要件,即犯罪主體、犯罪主觀方面、犯罪客體和犯罪客觀方面。Li等[14]依據(jù)雙層犯罪構(gòu)成理論,將罪名預(yù)測任務(wù)分解成主觀要件預(yù)測與客觀要件預(yù)測兩個子任務(wù),最后根據(jù)子任務(wù)的輸出結(jié)果預(yù)測罪名。Hu等[2]基于犯罪構(gòu)成理論為每個罪名設(shè)計了相關(guān)的法律要素。

      法律文書的說理部分通常都包含復(fù)雜的論辯結(jié)構(gòu),如何準確解析或生成論辯結(jié)構(gòu)也是我們需要面對的重要挑戰(zhàn)。例如,在民事案件裁判文書中,通常都會列出案情經(jīng)過、原告方與被告方的訴求或抗辯內(nèi)容以及對提交證據(jù)的質(zhì)證過程,其中蘊含著雙方爭議的焦點,以及法庭是如何認定基本事實、基于何種法律依據(jù)、做出怎樣的裁決等重要信息。理解裁判文書中的推理邏輯能夠幫助深度學習模型更好地完成下游任務(wù)。Duan等[46]在法律文書摘要中,使用角色特征(法官、原告、被告、證人)編碼文本,并將論辯過程按照爭議焦點聚類。Long等[53]通過將罪名預(yù)測任務(wù)定義為機器閱讀理解任務(wù),直接抽取〈事實描述,訴訟請求〉和〈事實描述,相關(guān)法條〉之間的交互關(guān)系。Ma等[65]在判定民事案件的訴訟請求是否應(yīng)該滿足時,對原告訴稱、事實描述和被告辯稱之間的交互關(guān)系建模,進而提升判決預(yù)測效果。

      加強對法律文書的推理和論辯結(jié)構(gòu)的研究能夠為法律人工智能模型提供良好的可解釋性,因而是法律人工智能走向?qū)嶋H應(yīng)用所必須要面對的挑戰(zhàn)。

      2.3 如何引入法律知識

      法律知識對于單純數(shù)據(jù)驅(qū)動的自然語言理解模型有著至關(guān)重要的作用,不但可以提高模型性能,還可以指導(dǎo)模型避免數(shù)據(jù)自身帶來的偏差。這里所指的法律知識包括但不限于法律理論、法律條文、指導(dǎo)案例等。

      法律知識的多樣性也決定了在深度學習模型中融入知識是極具挑戰(zhàn)性的。此前,Luo等[48]利用法條信息作為法律依據(jù)提高罪名預(yù)測任務(wù)的性能。Li等[14]利用雙層犯罪構(gòu)成理論預(yù)測判決結(jié)果。法律條文和法律理論是明確的法律知識,同時,領(lǐng)域?qū)<铱偨Y(jié)的法律要素和法律本體也可以作為法律知識,Hu等[2]在罪名預(yù)測時,設(shè)計與罪名相對應(yīng)的法律要素作為法律知識,提高模型的預(yù)測效果。

      我們注意到法律知識的表達形式多樣,具體應(yīng)用時,首要困難是如何利用計算機可讀的方式來表示法律知識。法條一般以非結(jié)構(gòu)化文本的形式呈現(xiàn),Luo等[48]將法條作為普通文本字符串; Zhong等[66]從法條中提取出預(yù)測罪名所需要的關(guān)鍵要素,如犯罪動機、犯罪行為等,并進一步利用這些要素輔助法條預(yù)測任務(wù);除了直接利用法條文本外,Wang等[67]在罪名預(yù)測過程中利用了法條之間的層次關(guān)系,Li和Zhang等[15]將法條拆解成一階謂詞邏輯的形式。在多種法律知識的表達形式中,無論是法律要素還是一階謂詞邏輯都離不開領(lǐng)域?qū)<业脑O(shè)計和標注,其中使用一階謂詞邏輯來表示法條內(nèi)容是最為精確的,但是成本高昂。此外,語言表述上的差異可能會導(dǎo)致規(guī)則的匹配困難、可擴展性差, 如 “一年級小孩”與“未成年人”之間的關(guān)聯(lián);而且一旦有法條更改,就要重新手工修訂相關(guān)規(guī)則。而如Luo等[48]直接使用法條文本,雖然不需要專家設(shè)計規(guī)則,但無法保證模型能夠正確使用法條文本中的法律知識。

      如何使自然語言理解模型運用法律知識是現(xiàn)階段法律知識引入研究的第二個困難。在罪名預(yù)測任務(wù)中,聯(lián)合優(yōu)化多個相關(guān)子任務(wù)可以提升罪名預(yù)測效果。Zhong等[50]使用多任務(wù)學習的方式將法條預(yù)測、刑期預(yù)測、案由預(yù)測等關(guān)聯(lián)內(nèi)容聯(lián)合優(yōu)化,以建模罪名、法條之間的隱含關(guān)聯(lián)知識,從而提升判決預(yù)測的性能。使用犯罪構(gòu)成理論將端到端的罪名預(yù)測任務(wù)拆解成多個子任務(wù)能夠有效引導(dǎo)模型關(guān)注裁判文書中與法律知識相關(guān)的內(nèi)容,Li等[14]利用雙層犯罪構(gòu)成理論設(shè)計模型,將模型分為客觀要件抽取模塊、主觀要件預(yù)測模塊以及推理模塊三部分,進而提升模型對法律知識的關(guān)注度。另一方面,引導(dǎo)模型重點關(guān)注如何區(qū)分相似罪名等復(fù)雜案例的判決有利于模型學習關(guān)鍵法律知識,如區(qū)分搶劫罪和搶奪罪的一條關(guān)鍵知識為“是否攜帶兇器”,Xu等[68]在利用法條信息預(yù)測罪名的過程中,通過區(qū)分相似法條使模型積累了更準確的法律知識。研究者需要有針對性地設(shè)計融合模式才能更好地向現(xiàn)有自然語言理解模型中引入法律知識,進而提升各項任務(wù)的效果。同時,需要注意到,盡管現(xiàn)有方法能夠引入一些法律知識,但仍無法擺脫對精細化專家標注的依賴,并且,對于實現(xiàn)可擴展的法律推理過程也無能為力。

      3 總結(jié)

      本文簡要總結(jié)了近年來自然語言理解技術(shù)在法律領(lǐng)域的應(yīng)用情況。梳理和歸納了法律信息抽取、類案檢索、司法問答、法律文書摘要和判決預(yù)測五個主要任務(wù)的研究現(xiàn)狀,并總結(jié)了其所面臨的主要技術(shù)挑戰(zhàn)。

      在司法智能化的未來,法律人工智能在普通用戶法律咨詢以及法院、檢察院及律師事務(wù)所等專業(yè)場景下有著巨大的應(yīng)用潛力。目前基于法律文書的自然語言理解方興未艾,但邁向大規(guī)模實際應(yīng)用還面臨著許多困難,如細粒度地解析論辯文本、合理有效地運用法律知識、提供可解釋可信賴的預(yù)測結(jié)果等。解決這些問題仍需要更多研究者的參與。

      猜你喜歡
      法律文書罪名檢索
      2019年第4-6期便捷檢索目錄
      法律文書教學的多維透視
      刑法罪名群論綱*
      法律文書寫作問題芻議
      重新認識濫用職權(quán)和玩忽職守的關(guān)系*——兼論《刑法》第397條的結(jié)構(gòu)與罪名
      刑法論叢(2016年2期)2016-06-01 12:14:25
      專利檢索中“語義”的表現(xiàn)
      專利代理(2016年1期)2016-05-17 06:14:36
      論法律文書說理——以司法體制改革為背景的考察
      法學與實踐(2015年1期)2015-12-01 03:41:07
      減少死刑的立法路線圖
      減少死刑的立法路線圖
      對法律文書格式的法理學思考
      胶州市| 兰西县| 高淳县| 阿拉善盟| 秀山| 伊金霍洛旗| 罗源县| 连江县| 莎车县| 西贡区| 通海县| 策勒县| 康乐县| 怀化市| 金平| 大名县| 宜阳县| 鲜城| 涟水县| 美姑县| 西昌市| 合水县| 绥棱县| 通山县| 巍山| 屏南县| 察隅县| 汾西县| 明水县| 达拉特旗| 普格县| 略阳县| 阜城县| 乐平市| 洪江市| 府谷县| 攀枝花市| 灵山县| 靖安县| 措美县| 大庆市|