• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于法律裁判文書的法律判決預測

      2021-09-22 02:02:30張虎潘邦澤譚紅葉李茹
      大數(shù)據(jù) 2021年5期
      關鍵詞:法條罪名要素

      張虎,潘邦澤,譚紅葉,李茹,2

      1. 山西大學計算機與信息技術學院,山西 太原 030006;

      2. 山西大學計算智能與中文信息處理教育部重點實驗室,山西 太原 030006

      1 引言

      在人工智能與大數(shù)據(jù)技術的推動下,從2013年起,我國各級司法機構就進入了以提供智能司法服務為目的的“智慧司法”建設時期。在2014年與2016年,最高人民法院相繼推出了人民法院數(shù)據(jù)集中管理平臺與國家司法審判系統(tǒng),并開通了中國裁判文書網與中國法律應用數(shù)字網絡服務平臺。2017年7月,國家人工智能戰(zhàn)略《新一代人工智能發(fā)展規(guī)劃》對人工智能理論、技術和應用做出前瞻布局,呼吁加強人工智能相關法律、倫理和社會問題研究。同時,該規(guī)劃力挺智慧法庭建設,提出促進人工智能在證據(jù)收集、案例分析、法律文件閱讀與分析中的應用。

      在同一時期,大數(shù)據(jù)與人工智能技術在各行各業(yè)都引起了高度的重視,并得到了廣泛的應用,人工智能在司法領域的應用已經成為未來法律工作中必不可少的一部分。無論是法官、律師還是普通大眾,都會享受到智慧司法服務帶來的便捷。智慧司法的主要思想是將人工智能技術,特別是自然語言處理(natural language processing,NLP)技術應用于法律領域的任務。一方面,智慧司法可以為不熟悉法律術語和復雜判決程序的群眾提供低成本、高質量的法律咨詢服務;另一方面,它可以為專業(yè)人士(如律師和法官)提供參考,將法律專業(yè)人士從錯綜復雜的文書工作中解放出來,提高他們的工作效率。同時,利用人工智能技術提升法律服務水平的思想也將被進一步普及,人們對正義與法律的理解將會被重新塑造,國家利用人工智能技術提升法律服務水平的目標也將被實現(xiàn)。

      法律判決預測是“智慧司法”服務體系下的一項重要研究任務,在學術界和企業(yè)界受到廣泛關注。其任務的核心目標是通過分析案件的相關信息,自動預測出案件最終的判決結果。然而,對于如何完成法律判決預測任務這一問題,面臨著如下幾個關鍵的挑戰(zhàn)。

      ● 法律判決預測任務的研究要求使用真實的法律案件數(shù)據(jù)集,而真實法律案件信息的獲取渠道較為廣泛,且數(shù)據(jù)形式與包含內容各不相同。因此,統(tǒng)一各類數(shù)據(jù)的數(shù)據(jù)格式、構建高質量的數(shù)據(jù)集是法律判決預測任務的首要任務。

      ● 以往的判決預測大多將整篇法律文書作為輸入。但在人類法官審理案件的過程中,判決結果往往僅由案件的核心描述決定,法律文書中的大多數(shù)內容對案件的判決結果影響較小,且大量無關內容還會直接影響最終的判決預測結果。因此,探索判決要素抽取方法對提升法律判決預測結果具有重要的意義。

      ● 法律判決預測任務要求提出的方法可以高質量地預測出案件的判決結果。然而,案件的判決結果同時包含了案件的法律條文(以下簡稱法條)、罪名、刑期等多種內容,大多數(shù)傳統(tǒng)模型無法同時預測出多種信息。因此,如何使預測模型高質量地預測出完整的案件判決結果是法律判決預測任務的重要難點。

      本文針對這些關鍵性問題,使用從中國裁判文書網獲取的海量真實案件數(shù)據(jù)和2018“中國法研杯”司法人工智能挑戰(zhàn)賽的評測數(shù)據(jù)構建實驗數(shù)據(jù)集,結合人類法官的判決思路,探究基于法律裁判文書大數(shù)據(jù)的法律判決預測流程與方法。首先從事實描述中抽取判決要素句,然后針對法律判決預測中的法條預測、罪名預測和刑期預測任務分別訓練獨立的預測模型,最后結合所有子任務的結果形成案件的判決預測結果,具體案例如圖1所示。

      2 相關工作

      在20世紀中葉,如何自動獲得司法判決結果引起了法學界研究者的關注。這一時期的研究主要是在具體的場景下,運用數(shù)學和統(tǒng)計算法對現(xiàn)有法律案例進行分析。Kort F[1]運用經典統(tǒng)計算法對司法數(shù)據(jù)進行分析,使用經典數(shù)學模型預測了最高法院的判決結果,并對“律師維權”案件進行了定量分析。Nagel S[2]在分析大量法律文件后提出了“法律變量”的概念,從而達到為法官服務、幫助公眾更方便地獲得法律援助的目的。Ulmer S S[3]使用規(guī)則的方法分析了大量的法律案件,協(xié)助法官對案件證據(jù)的梳理工作。Ringquist E J[4]針對環(huán)境類的民事訴訟案,對司法判決做了深入的研究。Lauderdale B E等人[5]最早使用各類法律案件數(shù)據(jù)的相似信息來研究不同種類法律案件的相似性。上述研究都需要從法律文書與法律案件概要中人工提取出關鍵特征。這一階段開展的研究不僅需要大量的法律專業(yè)型人力參與完成,并且對不同種類法律案件的泛化能力也相對較差。

      近年來,受到神經網絡可以有效應用于NLP任務的啟發(fā),諸多學者針對法律判決預測任務展開了相關研究。Luo B F等人[6]提出了基于注意力的神經網絡,并在統(tǒng)一的框架中對罪名預測任務與案件相關法條進行聯(lián)合訓練,有效提升了罪名預測任務的效果。Jiang X等人[7]提出了基于基本原理的增廣分類模型,有效提升了罪名預測的精度。Chen H J等人[8]針對被告往往被控多項罪行的問題,提出了一種基于罪名特定特征選擇和聚集的深度門控網絡,有效提升了刑期預測的精度,為刑期預測提供了可解釋性。Hu Z K等人[9]總結出10種法律判別屬性,有助于提高針對易混淆法律案件的預測任務的準確率。Zhang H等人[10]提出了數(shù)據(jù)離散化的方法,針對性地解決了普通模型對金額、年齡等數(shù)字類信息關注度較低的問題,進一步提升了法條預測模型的性能。Long S B等人[11]分析了事實、請求與法律之間的語義交互關系,對事實描述、原告請求與法律條款之間的語義關系進行建模,進一步提升了判決預測的準確性。Yang W M等人[12]發(fā)現(xiàn)判決預測的子任務間往往會忽略詞語的搭配信息,并就此問題設計了具有詞語搭配的注意力機制,提出了一種基于子任務間拓撲結構的多視角雙反饋網絡。Yang Z等人[13]提出了一種新的遞歸注意網絡,通過設計一個遞歸過程來建模事實描述和文章之間的迭代交互,更有效地完成了法律判決預測任務。

      同時,為了進一步促進判決預測研究的深入應用,一些研究人員開始關注判決預測的實施過程,并探索了未來的方向。Zhong H X等人[14]提出了一種基于強化學習的預測過程可視化模型,有效推進了法律判決預測的可解釋性。Zhong H X等人[15]深入研究了法律判決預測的子任務,利用子任務的依賴關系構建了有向無環(huán)圖,提出了拓撲多任務的學習框架。Li J J等人[16]提出了一種基于馬爾可夫邏輯網絡的求解方法,對法律因素的語義進行形式化描述和提取,然后建立、訓練馬爾可夫邏輯網絡并進行預測,最后在司法離婚數(shù)據(jù)集上證明了該方法對預測結果具有可解釋性。Liu Y H等人[17]提出了一種基于文本挖掘的方法,通過分析普通大眾的問題描述,為他們找到相似度較高的相關法律文書。Zhong H X等人[18]總結了法律人工智能的研究歷史、研究現(xiàn)狀與未來的研究方向,并展示了一些在法律人工智能中有代表性的應用,深入分析現(xiàn)有工作的優(yōu)缺點,探索未來可能的發(fā)展方向。

      顯然,現(xiàn)有研究大多針對法律判決預測的某一子任務開展,對完整的判決預測方法體系的研究相對較少。同時,現(xiàn)有方法大多以整篇的事實描述作為模型輸入,而事實描述中通常包含較多對案件的判決結果影響較小的語句,這些語句會大大影響模型的特征學習,從而直接影響模型的判決預測效果。

      3 判決預測流程

      本文提出的基于法律裁判文書大數(shù)據(jù)的 法律判決預測流程主要由數(shù)據(jù)采集、數(shù)據(jù)預處理與判決結果預測三部分組成,具體流程如圖2所示。

      圖2 法律判決預測流程

      (1)數(shù)據(jù)采集

      基 于法律裁判文書大數(shù)據(jù)的法律判決預測研究的實驗數(shù)據(jù)分別由裁判文書網、百科知識庫和相關司法類評測數(shù)據(jù)集三部分共同構成。本文在中國裁判文書網中爬取了海量不同種類案件的法律裁判文書,在百科知識庫中獲取了法條和司法解釋等信息,在 2018“中國法研杯”司法人工智能挑戰(zhàn)賽中獲得了相應的評測數(shù)據(jù)集,同時,還基于相關的司法評測任務定義了實驗數(shù)據(jù)的統(tǒng)一格式。本文使用的實驗數(shù)據(jù)集共包含150 000篇刑法類法律文書和24 060篇離婚類法律文書。其中,刑法類法律文書涉及相關法條202條,相關罪名183種,案件刑期236類,離婚類法律文書涉及相關法條48條,判決結果2類。由于不同類型的文書有明顯的差異,因此,實驗過程中對刑法類案例分別進行了法條、罪名和刑期預測,對離婚類案例只采用判決預測模型進行了判決結果(“離”或“不離”)預測。

      (2)數(shù)據(jù)預處理

      將法律裁判文書等不同種類的數(shù)據(jù)規(guī)范化為司法評測的數(shù)據(jù)格式,抽取出數(shù)據(jù)中每個案件對應的事實描述、相關法條、涉及罪名和案件刑期等信息。再依照相關法條提取出不同種類案件事實描述中涉及的要素信息,如離婚類案件中的“婚后有子女”、勞動類案件中的“存在勞動關系”、借貸類案件中的“有書面還款承諾”等,這些要素信息是影響判決結果的關鍵信息,也是法律判決預測模型的輸入信息。本文基于判決要素抽取模型對案件事實描述中的要素句進行抽取,并將每個案件的要素信息分別與該案件的相關法條、涉及罪名和案件刑期組合,得到法律判決預測3個子任務的數(shù)據(jù)集。

      (3)判決結果預測

      本文利用預處理后的大規(guī)模數(shù)據(jù)集,基于深度學習方法分別構建了法條預測模型、罪名預測模型和刑期預測模型,并用3類模型分別對案件進行法條預測、罪名預測和刑期預測,最終得到案例的判決預測結果。

      4 判決預測方法

      首先,本文針對判決要素句長度差異明顯會對判決要素抽取結果影響較大這一問題,采用基于Mask方法的判決要素抽取方法,提高了案例的判決要素句自動抽取效果。然后通過分析法條、罪名和刑期3個預測任務的特點,分別對3個任務設計了獨立的預測模型,針對法條預測任務中存在大量易混淆法條的問題,提出了基于模型融合與分層學習的法條預測模型;針對罪名預測任務中不同罪名的詞語語義差異性問題,結合相關法條后提出了基于法條與語義差異性的罪名預測模型;針對事實描述中的重要因素對刑期預測任務的影響,總結了相關的量刑屬性,提出了基于刑期屬性與多模型投票的刑期預測模型。最后對3種模型進行聯(lián)合訓練,實現(xiàn)了案件的判決預測。

      4.1 基于事實描述的判決要素抽取

      法律裁判文書主要由案件類型、事實描述和判決結果等部分組成。其中,事實描述是一個司法案件的核心,包含邏輯清晰的原被告關系、事情的起因經過、案件涉及的傷亡程度和損失金額等相對關鍵的信息,這些信息是判決預測的重要依據(jù),一般被認為是案件的判決要素。以往傳統(tǒng)的法律判決預測模型大多將整篇事實描述作為輸入,這一做法存在嚴重的缺陷。一方面,案件的判決結果往往主要側重于一些重要的信息,事實描述中大多數(shù)語句對案件判決結果的影響十分微小,模型中輸入過多的次要信息往往會直接影響模型的預測結果;另一方面,法律判決中最重要的問題之一是公平,但在現(xiàn)實世界中,由于審判過程中存在性別或種族歧視,判決不公的案件時有發(fā)生。而深度學習方法可能從事實描述中學習到這種偏見,并給法律體系帶來不公平。因此,本文根據(jù)不同案件各自的特點,為每種類型的案件設計了要素標簽,并按照要素標簽從事實描述中抽取要素句,將要素句作為法律判決預測模型的輸入部分,具體流程如圖3所示。利用判決要素句進行判決預測不僅可以有效保留事實描述中影響判決結果的關鍵信息,一定程度上為模型消除了法官偏見,保證了判決公平性,同時也為模型給出的判決結果提供了可解釋性。

      圖3 判決要素句抽取流程

      在判決要素抽取的模型設計過程中,本文采用文本分類的思想,提出了基于BERT(bidirectional encoder representations from transformers)模型的判決要素句抽取方法。然而,由于事實描述中的要素句長度差別較大,導致一些較短的要素句的句向量會出現(xiàn)很多0填充,這會明顯影響最終的要素抽取結果?;诖?,進一步在抽取模型中加入基于Mask方法的自注意力機制,以弱化輸入向量的填充部分。

      4.2 基于 判決要素句的判決預測

      案件的判決結果主要由案件的相關法條、涉及罪名與案件刑期三部分組成。人類法官給出的判決結果都是在綜合了事實描述中的所有關鍵信息后得出的。因此,本文依照人類法官的判案思路,將法律判決預測任務分成法條預測、罪名預測與刑期預測3個子任務。以事實描述中抽取出的判決要素句為輸入,基于深度學習的方法與文本分類的思想為法條預測、罪名預測和刑期預測任務分別構建獨立的分類模型,具體過程如圖4所示。

      圖4 法律判決預測模型

      (1)法條預測

      法條是國家對人民規(guī)定的行為準則,它闡明了公民的權利和義務,設置了相應行為的法律后果,在一個法律案件的判決過程中,相關法條是判決的根本依據(jù)。本文分析大量真實案件與法條后發(fā)現(xiàn),在案件的相關法條中存在一些較難區(qū)分的法條,如走私、販賣、運輸、制造毒品的法條內容與非法持有毒品的法條內容會出現(xiàn)較多相似的詞匯,這些法條通常被稱為易混淆法條,它們的語義相似度極高,區(qū)分難度較大,傳統(tǒng)模型對易混淆法條的預測效果普遍較差。針對該問題,本文依據(jù)法條的相關司法解釋,深入挖掘了判決要素句與相關法條之間的關系,提出了基于模型融合與分層學習的法條預測方法。該方法的具體流程如下。

      ① 根據(jù)已有法條預測的結果,針對刑法中涉及的183個法條,將其中的136個分為易區(qū)分法條,47個分為易混淆法條。

      ② 使用基于模型融合的法條分類器對案件的判決要素進行分類,預測出案件的法條編號。模型融合采用不同參數(shù)的卷積神經網絡(convolutional neural network,CNN)和循環(huán)神經網絡(recurrent neural network,RNN),結果輸出使用Softmax分類器。

      ③ 結合①中劃分的法條類別,判定輸出的法條標簽屬于易區(qū)分法條還是易混淆法條。

      ④ 若法條屬于易區(qū)分法條,則直接輸出法條分類器的預測結果。

      ⑤ 若法條屬于易混淆法條,則進一步將案件的判決要素輸入相應的基于模型融合的易混淆法條分類器進行二次分類,并輸出對應的分類結果。

      具體的模型結構如圖5所示。該方法融合了多種模型的特點,在一定程度上提升了易混淆法條的分類效果,有效提高了法條預測的準確性。

      圖5 基于模型融合與分層學習的法條預測模型

      (2)罪名預測

      罪名預測指通過分析案件的犯罪事實自動預測出被告的最終罪名。犯罪事實句中的各詞語在區(qū)分不同罪名時,其語義重要性各不相同。例如對于盜竊罪與故意傷害罪,從犯罪目的來看,盜竊罪的犯罪目的為非法占有 他人財物,故意傷害罪的犯罪目的為故意傷害他人人身安全。此時,犯罪目的的語義是區(qū)分罪名的重點詞。當兩種罪名的犯罪目的都為非法占有他人財物時,從犯罪手段來看,兩種罪名的犯罪手段分別為秘密竊取與使用暴力、脅迫的方式,此時的犯罪手段詞成為區(qū)分罪名的關鍵詞。而現(xiàn)有的方法大多忽略了這種語義性差異,從而對罪名預測的效果產生影響。同時,法條、司法解釋等法律知識是人類法官定罪量刑的關鍵依據(jù),引入外部法律知識對于罪名預測具有重要意義。針對這些問題,本文提出了基于法條與語義差異性的罪名預測方法,具體流程如下。

      ① 將判決要素句和相關法條分別輸入BERT模型的編碼器中,得到相應的句子級事實表示s和法條表示a。

      ② 使用法條注意力交互機制計算每一個判決要素句s與每一個法條a之間的法條相容性值a’。

      ③ 使用語義自注意力交互機制計算每一個判決要素句s的語義重要性值a’’。

      ④ 利用得到的法條相容性值a’和語義重要性值a’’更新判決要素句s的向量表示。

      ⑤ 通過Sigmoid分類器實現(xiàn)每個罪名的0/1二元分類。

      具體實現(xiàn)過程如圖6所示。實驗證明,將該方法應用于罪名預測任務后,罪名預測的模型性能得到了有效提升。

      圖6 基于法條與語義差異性的罪名預測模型

      (3)刑期預測

      刑期預測通常要求對判決要素句、相關法條與涉及罪名3個部分的信息進行綜合考慮。本文分析了大量刑法類數(shù)據(jù),將0~25年的刑期劃分為20個刑期區(qū)間,根據(jù)數(shù)據(jù)中各種刑期的數(shù)據(jù)量分布,為不同刑期定義各自的預測偏差,在一定程度上縮小了預測結果與真實結果的偏差。同時,本文深入地分析了刑期預測任務,發(fā)現(xiàn)在事實描述中存在一些影響判決結果的重要因素,這些因素在法官的判決過程中具有十分重要的作用。針對該問題,本文通過分析海量案件的事實描述與量刑結果,提出了基于刑期屬性與多模型投票的刑期預測方法,具體流程如下。

      ① 以每種案件的判決要素句標簽為基礎,結合具體法條、法律法規(guī)的內容為刑期預測設計量刑屬性(大體可分為犯罪方式、受害者受傷程度、涉及財物規(guī)模、犯罪地點與其他屬性5個類別),再根據(jù)不同的案件類型具體劃分為多個案件專屬小類別。

      ② 使用BERT模型分別對判決要素句與量刑屬性進行編碼,將判決要素句輸入最大池化層得到其普通特征,通過注意力機制的方式將量刑屬性融入判決要素句的向量表示中,并得到其屬性特征。

      ③ 使用線性拼接的方式將普通特征與屬性特征融合。

      ④ 將融合后的結果分別輸入CNN、長短期記憶(long short-term memory,LSTM)網絡和門控循環(huán)單元(gated recurrent unit,GRU)3種模型進行特征提取,再將3種模型的輸出概率累加,最終取3種模型結果的平均值對應的類別作為預測的刑期類別,具體實現(xiàn)過程如圖7所示。

      圖7 基于刑期屬性與多模型投票的刑期預測模型

      4.3 實驗結果與分析

      本文采用精確率P、召回率R和F1值這3個指標來評價針對要素抽取與判決預測任務提出的方法,精確率P、召回率R和F1值的計算式如式(1)、式(2)和式(3)所示,其中TP表示屬于該類也被分為該類的樣本數(shù)量;TN表示沒有被分為該類且不屬于該類的樣本數(shù)量;FN表示沒有被分到該類但屬于該類的樣本數(shù)量;FP表示被分到該類但不屬于該類的樣本數(shù)量。具體得出的實驗結果見表1和表2。

      (1)要素抽取

      在要素抽取任務上,本文按照8:1:1的比例劃分出訓練集、驗證集與測試集,并在5種基線模型上分別進行判決要素抽取實驗,結果見表1。實驗結果顯示,CNN模型的結果優(yōu)于LSTM模型,同樣,在將BERT作為詞嵌入方法的實驗中,BERTCNN模型的結果明顯優(yōu)于所有基線模型。而本文基于Mask方法的判決要素抽取模型取得了最好的結果,與BERT-CNN模型相比,其在F1值上得到了0.01%的提升。

      表1 要素抽取任務實驗結果

      (2)判決預測

      對于判決預測任務,本文將整理出的數(shù)據(jù)集按照8:1:1的比例劃分出訓練集、驗證集與測試集,并選擇CNN與LSTM模型作為基線模型,具體實驗結果見表2。實驗結果顯示,CNN模型在3個判決預測任務中的結果都優(yōu)于LSTM模型,本文提出的方法在3個任務中都得到了最好的結果,與兩種基線模型相比都有明顯的提升。

      表2 判決預測任務實驗結果

      顯然,本文提出的判決要素抽取方法和法條、罪名、刑期預測方法都有效地提升了判決預測的最終效果。

      5 結束語

      本文結合中國裁判文書網、百科知識庫與相關司法類評測數(shù)據(jù)集構建了高質量的法律判決預測數(shù)據(jù)集,深入研究了基于法律裁判文書大數(shù)據(jù)的法律判決預測方法。首先基于BERT模型的判決要素句抽取模型對判決預測數(shù)據(jù)進行了預處理,然后分別提出了基于模型融合與分層學習的法條預測方法、基于法條與語義差異性的罪名預測方法和基于量刑屬性與多模型投票的刑期預測方法,并對每種模型進行了實驗驗證。本文開展的研究為法律判決預測任務進行了有益的探索,為人工智能在智慧司法領域的應用提供了重要的參考價值。

      猜你喜歡
      法條罪名要素
      掌握這6點要素,讓肥水更高效
      當代水產(2020年4期)2020-06-16 03:23:30
      觀賞植物的色彩要素在家居設計中的應用
      從法條的公司法到實踐的公司法
      論美術中“七大要素”的辯證關系
      論民法對人身權的保護
      刑法罪名群論綱*
      從法條的公司法到實踐的公司法
      商(2016年20期)2016-07-04 01:04:28
      重新認識濫用職權和玩忽職守的關系*——兼論《刑法》第397條的結構與罪名
      刑法論叢(2016年2期)2016-06-01 12:14:25
      刑法“從業(yè)禁止”法條的法律性質及改革方向
      也談做人的要素
      山東青年(2016年2期)2016-02-28 14:25:36
      安仁县| 灵丘县| 盐亭县| 沧州市| 洱源县| 平度市| 吐鲁番市| 云阳县| 宣化县| 仪陇县| 福州市| 甘孜县| 鄂托克旗| 花垣县| 华亭县| 特克斯县| 鹤岗市| 电白县| 平利县| 阿坝| 东港市| 赣州市| 朔州市| 金阳县| 平顶山市| 精河县| 手游| 定兴县| 车致| 西贡区| 南投市| 昌平区| 陵川县| 和平县| 古丈县| 高唐县| 松原市| 永登县| 宜章县| 若羌县| 孝感市|