程金華
上海交通大學(xué)凱原法學(xué)院特聘教授、法社會(huì)學(xué)研究中心執(zhí)行主任
“忽如一夜春風(fēng)來,千樹萬樹梨花開?!庇锰拼娙酸瘏⒌倪@個(gè)詩句來形容“法律大數(shù)據(jù)”“法律人工智能”以及類似話題近期在中國法律界的涌現(xiàn),一點(diǎn)不為過。僅就機(jī)構(gòu)建設(shè)而言,最近兩年,借法院裁判文書上網(wǎng)工程的東風(fēng),一批關(guān)于法律大數(shù)據(jù)和人工智能的公司和學(xué)術(shù)機(jī)構(gòu)紛紛成立。1僅就法學(xué)院而言,中國最好的法學(xué)院都已經(jīng)成立了專門從事法律大數(shù)據(jù)研究的機(jī)構(gòu),比如,同在2017年,中國人民大學(xué)法學(xué)院于9月成立了未來法治研究院;清華大學(xué)法學(xué)院于12月23日成立了法律與大數(shù)據(jù)研究中心;北京大學(xué)法學(xué)院于12月29日成立了法律人工智能實(shí)驗(yàn)室和北京大學(xué)法律人工智能研究中心。其他政法院校成立類似機(jī)構(gòu)的也不在少數(shù)。理論界和實(shí)務(wù)界對(duì)于法律大數(shù)據(jù)和人工智能的潛在價(jià)值也有較好的闡述。2參見白建軍:《大數(shù)據(jù)對(duì)法學(xué)研究的些許影響》,載《中外法學(xué)》2015年第1期;白建軍:《法律大數(shù)據(jù)時(shí)代裁判預(yù)測(cè)的可能與限度》,載《探索與爭(zhēng)鳴》2017年第10期;天同訴訟技術(shù)研發(fā)中心:《小律所,大數(shù)據(jù):訴訟的數(shù)據(jù)化時(shí)代》,載《中國律師》2014年第5期;胡凌:《大數(shù)據(jù)影響下的法律實(shí)踐與法學(xué)研究》,載《光明日?qǐng)?bào)》2014年12月3日;周蔚:《大數(shù)據(jù)在事實(shí)認(rèn)定中作用機(jī)制分析》,載《中國政法大學(xué)學(xué)報(bào)》2015年第6期;張浩:《大數(shù)據(jù)與法律思維的轉(zhuǎn)變——基于相關(guān)性分析的視角》,載《北方法學(xué)》2015年第5期;劉佳奇:《論大數(shù)據(jù)時(shí)代法律實(shí)效研究范式之變革》,載《湖北社會(huì)科學(xué)》2015年第7期;於興中:《當(dāng)法律遇上人工智能》,載《法制日?qǐng)?bào)》2016年3月28日;蔣勇:《以法律大數(shù)據(jù)建構(gòu)法律職業(yè)的新型關(guān)系》,載《中國應(yīng)用法學(xué)》2017年第2期;葉慧娟:《法律大數(shù)據(jù):實(shí)現(xiàn)法治戰(zhàn)略的有效戰(zhàn)術(shù)》,載《文匯報(bào)》2017年10月31日;鄭戈:《人工智能與法律的未來》,載《探索與爭(zhēng)鳴》2017年第10期。目前,法學(xué)界開會(huì)流行一種新的模式,要么法律數(shù)據(jù)公司參加研討會(huì)做主題發(fā)言,要么與會(huì)學(xué)者自帶數(shù)據(jù)公司參會(huì)。這種現(xiàn)象具有全球普遍性,呈現(xiàn)了大數(shù)據(jù)時(shí)代法學(xué)研究和法律實(shí)踐的“結(jié)構(gòu)性轉(zhuǎn)型”,而中國的同行則非常積極熱心地?fù)肀н@個(gè)轉(zhuǎn)型,并誓言要在法律研究和實(shí)踐中實(shí)現(xiàn)“彎道超車”或者“換道超車”,以更好地講述法治建設(shè)的中國故事,掌握中國法治建設(shè)在國際舞臺(tái)上的話語權(quán)。其志可嘉。
然而,根據(jù)筆者從事法律量化實(shí)證研究十多年的淺薄經(jīng)驗(yàn),認(rèn)為有必要對(duì)這股熱流潑些冷水,降降溫,以便大家對(duì)中國法律大數(shù)據(jù)事業(yè)形成更健康的認(rèn)識(shí)。3參見李鑫:《中國法律大數(shù)據(jù)產(chǎn)業(yè)發(fā)展研究》,載《經(jīng)濟(jì)與社會(huì)發(fā)展》2017年第2期。筆者的核心看法是,官員、學(xué)者和商人意識(shí)到法律大數(shù)據(jù)的重要性僅是“科學(xué)啟蒙”,而法律大數(shù)據(jù)的基礎(chǔ)性建設(shè)才算邁向“工業(yè)革命”的第一步。當(dāng)前,中國的法律大數(shù)據(jù)事業(yè)充其量還只剛剛形成了科學(xué)啟蒙的共識(shí),實(shí)施了“科學(xué)實(shí)驗(yàn)”,但是由于法律基礎(chǔ)數(shù)據(jù)存在的諸多問題,還沒有形成法律大數(shù)據(jù)的真正產(chǎn)業(yè)革命。因此,對(duì)于中國法律大數(shù)據(jù)的產(chǎn)業(yè)發(fā)展而言,目前的重心是夯實(shí)基礎(chǔ)數(shù)據(jù)建設(shè)的技術(shù)、機(jī)制和制度保障,為將來鋪墊基業(yè)。尤其是,掌握各類法律數(shù)據(jù)“采礦權(quán)”的公共權(quán)力機(jī)構(gòu),負(fù)有不可推卸的責(zé)任。
本文將從如下幾個(gè)方面展開。首先,結(jié)合在上海的調(diào)研,筆者談?wù)務(wù)麄€(gè)法律大數(shù)據(jù)產(chǎn)業(yè)目前所形成的小氣候,稱為產(chǎn)業(yè)“小陽春”。其次,文章用兩個(gè)部分,分別從法律數(shù)據(jù)的收集和使用兩個(gè)方面,著重說明整個(gè)產(chǎn)業(yè)所面臨的根本性問題。這是文章的重點(diǎn)。最后,提幾點(diǎn)淺薄的建設(shè)性意見。值得說明的是,本文所講的法律大數(shù)據(jù)的范圍遠(yuǎn)遠(yuǎn)超越了以判決書為中心的司法數(shù)據(jù),包括立法、執(zhí)法、司法和法律服務(wù)領(lǐng)域的相關(guān)行為和結(jié)果數(shù)據(jù)信息。
中國的法律大數(shù)據(jù)產(chǎn)業(yè),在新時(shí)代進(jìn)入了“小陽春”,迎來了一個(gè)非常好的小氣候。各級(jí)政府的規(guī)劃與推動(dòng),是形成這個(gè)小氣候的主要推手,而市場(chǎng)和學(xué)術(shù)界又非常敏感地捕捉到這個(gè)潮流,往火堆里猛添柴火,多方聯(lián)手,實(shí)實(shí)在在地在全國范圍內(nèi)進(jìn)行了一場(chǎng)關(guān)于大數(shù)據(jù)和法律大數(shù)據(jù)的科學(xué)啟蒙。這些動(dòng)作主要體現(xiàn)在如下幾個(gè)方面。
首先,國家和地方政府通過產(chǎn)業(yè)規(guī)劃與政策引導(dǎo)來推動(dòng)(法律)大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展。在國家層面,對(duì)于大數(shù)據(jù)產(chǎn)業(yè),已經(jīng)是本屆政府的重點(diǎn)工作領(lǐng)域,出臺(tái)了相當(dāng)多的政策來推動(dòng)大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展。在此不予贅述。在法律領(lǐng)域,亦是如此。有識(shí)之士認(rèn)為,通過法律大數(shù)據(jù)來改善政府治理能力、倒逼治理機(jī)制的改革,以技術(shù)發(fā)展帶動(dòng)司法的機(jī)制和體制改革,也將是一條非常有特色、走在時(shí)代前沿的“中國道路”。正因如此,2016年10月,中央政法委邀請(qǐng)阿里巴巴集團(tuán)董事局主席馬云給百萬政法干警以“科技創(chuàng)新在未來社會(huì)治理中的作用”為題做講座。中央政法委書記孟建柱在主持講座中也指出“各級(jí)政法機(jī)關(guān)要以合作姿態(tài)利用好企業(yè)、社會(huì)的數(shù)據(jù)資源,通過共同研發(fā)、購買服務(wù)、項(xiàng)目外包等多種方式,發(fā)揮好大互聯(lián)網(wǎng)企業(yè)在社會(huì)治理中的重要作用。要以更加開放心態(tài)推進(jìn)政法數(shù)據(jù)資源共享共用,更加注重設(shè)施互聯(lián)、數(shù)據(jù)開放、資源共享,更加注重地區(qū)部門聯(lián)動(dòng),不斷增強(qiáng)政法綜治工作系統(tǒng)性、整體性、協(xié)同性。要牢固樹立提高服務(wù)民眾水平的理念,通過大數(shù)據(jù)應(yīng)用,為群眾提供多樣性、個(gè)性化公共服務(wù),在周到、精細(xì)的服務(wù)中提升社會(huì)治理水平。4《樹立戰(zhàn)略眼光,增強(qiáng)機(jī)遇意識(shí),創(chuàng)造性運(yùn)用大數(shù)據(jù)提高政法工作智能化水平》,載《法制日?qǐng)?bào)》2016年10月22日。當(dāng)然,眾所周知,法院系統(tǒng)的裁判文書上網(wǎng)工程,是法律大數(shù)據(jù)產(chǎn)業(yè)的最大亮點(diǎn)。正如有學(xué)者評(píng)論的,黨的十八大以來的法治中國建設(shè)(尤其是司法改革)與信息化、大數(shù)據(jù)技術(shù)相結(jié)合,促成了法律改革的“無心插柳柳成蔭”的良好局面。
在這里,以上海為例,筆者著重描述一下地方政府對(duì)法律大數(shù)據(jù)產(chǎn)業(yè)的推進(jìn)。為落實(shí)國務(wù)院的文件精神,上海市政府于2016年2月1日發(fā)布了《上海市推進(jìn)“互聯(lián)網(wǎng)+”行動(dòng)實(shí)施意見》,提出了“互聯(lián)網(wǎng)+電子政務(wù)”的概念,指出“完善上海市政府?dāng)?shù)據(jù)服務(wù)網(wǎng),形成政務(wù)數(shù)據(jù)資源對(duì)外開放的統(tǒng)一門戶,促進(jìn)社會(huì)各方對(duì)政務(wù)數(shù)據(jù)資源的開發(fā)利用;建設(shè)面向政府公共服務(wù)的大數(shù)據(jù)平臺(tái),提供基于電子政務(wù)公共云平臺(tái)匯聚的數(shù)據(jù)資源,為輔助決策、統(tǒng)計(jì)分析、業(yè)務(wù)管理等方面提供大數(shù)據(jù)支撐”。之后,市政府又在2016年2月29日發(fā)布了《上海市政務(wù)數(shù)據(jù)資源共享管理辦法》,將上述國務(wù)院和市政府的文件精神進(jìn)一步規(guī)范化、操作化。與之相關(guān)的是,上海市政府在2015年年底先后發(fā)布了《上海市行政處罰案件信息主動(dòng)公開辦法》和《上海市公共信用信息歸集和使用管理辦法》。在這些政策與規(guī)范性文件中,《上海市政務(wù)數(shù)據(jù)資源共享管理辦法》顯得尤為重要,其對(duì)“政務(wù)數(shù)據(jù)資源”進(jìn)行了界定,對(duì)推動(dòng)這項(xiàng)工作的機(jī)構(gòu)進(jìn)行了設(shè)置,對(duì)各項(xiàng)潛在的工作進(jìn)行了前瞻性規(guī)范,成為今后推動(dòng)這項(xiàng)工作的重要規(guī)范性文件。根據(jù)《上海市政務(wù)數(shù)據(jù)資源共享管理辦法》的定義,“政務(wù)數(shù)據(jù)”是指市級(jí)行政機(jī)關(guān)和依法經(jīng)授權(quán)行使行政職能的組織在依法履行職能的過程中采集和獲取的各類數(shù)據(jù)。因此,雖然政務(wù)數(shù)據(jù)并不等同于法律數(shù)據(jù),但是兩者顯然高度重疊。上述政策文件也為今后有效利用法律大數(shù)據(jù)提供了很好的政策與制度鋪墊。
其次,建設(shè)相關(guān)機(jī)構(gòu)與數(shù)據(jù)平臺(tái),切實(shí)推動(dòng)法律大數(shù)據(jù)的采集與利用。由于絕大部分的黨政單位都或多或少涉及法律數(shù)據(jù)的利用,因此這些單位也都或多或少在自己的管轄范圍內(nèi)搭建了自己的數(shù)據(jù)平臺(tái)。應(yīng)該說,目前只要有門戶網(wǎng)站的政府單位,都有一定意義上的數(shù)據(jù)采集與利用;但凡涉及立法、執(zhí)法、司法與法律服務(wù)的單位,也都不同程度上進(jìn)行法律數(shù)據(jù)采集與利用。很顯然,法律數(shù)據(jù)的平臺(tái)建設(shè),最出色的還是法院和檢察院系統(tǒng)——早在“法律大數(shù)據(jù)”概念提出之前,對(duì)案件信息的記錄與保存、司法文書的制作與公開、案件流程的信息化管理等已經(jīng)是法院和檢察院的常規(guī)工作,也因此順其自然地與法律大數(shù)據(jù)進(jìn)行了對(duì)接。
當(dāng)然,正如前述,法律數(shù)據(jù)遠(yuǎn)遠(yuǎn)超越了司法數(shù)據(jù)的范疇。建設(shè)立法和執(zhí)法等領(lǐng)域法律數(shù)據(jù)收集的機(jī)構(gòu)、機(jī)制與平臺(tái),是與“智慧法院(檢察院)”同等重要的任務(wù)。上海市政府在近年來有如下一些探索:(1)在政府行政系統(tǒng)內(nèi)部,組建了領(lǐng)導(dǎo)全市政務(wù)數(shù)據(jù)資源共享管理工作的“網(wǎng)上政務(wù)大廳建設(shè)與推進(jìn)工作領(lǐng)導(dǎo)小組”,負(fù)責(zé)協(xié)調(diào)推進(jìn)政務(wù)數(shù)據(jù)資源共享有關(guān)的重大事項(xiàng),在市政府辦公廳內(nèi)設(shè)立領(lǐng)導(dǎo)小組辦公室,負(fù)責(zé)推進(jìn)政府行政系統(tǒng)內(nèi)部的數(shù)據(jù)共享,并通過“網(wǎng)上政務(wù)大廳”來推進(jìn)部分政務(wù)數(shù)據(jù)的外部分享——“中國上海門戶網(wǎng)站”的微信平臺(tái)也提供了類似功能;(2)在上海市信息中心下面搭建了事業(yè)單位性質(zhì)的上海市公共信用信息服務(wù)平臺(tái),對(duì)相關(guān)單位所產(chǎn)生的與社會(huì)組織或者個(gè)人相關(guān)的信用信息(如行政處罰書與法院執(zhí)行判決書)等進(jìn)行科學(xué)分類、歸集,形成了查詢社會(huì)組織與個(gè)人信用信息的統(tǒng)一平臺(tái);5上海市公共信用信息服務(wù)平臺(tái)整合了大量的政務(wù)(法律)數(shù)據(jù)。在2016年我們調(diào)研時(shí)發(fā)現(xiàn),這個(gè)平臺(tái)涉及44家市級(jí)行政機(jī)關(guān)的2063個(gè)事項(xiàng)、16個(gè)區(qū)縣政府的2982個(gè)事項(xiàng)、11家中央在滬單位的87個(gè)事項(xiàng)、2家人民團(tuán)體的5個(gè)事項(xiàng)、市高級(jí)人民法院的6個(gè)事項(xiàng)、10家公用事業(yè)單位的34個(gè)事項(xiàng)和13家社會(huì)組織的21個(gè)事項(xiàng)——總共97家單位的5198個(gè)事項(xiàng)。其中有大量的事項(xiàng)是法律數(shù)據(jù)。(3)委托中國電信公司搭建并管理“12345”上海市民服務(wù)熱線,接收市民的詢問、投訴與建議電話,解答市民的問題,并把相關(guān)信息轉(zhuǎn)交有關(guān)部門辦理;(4)建設(shè)搭建“上海市政府?dāng)?shù)據(jù)服務(wù)網(wǎng)”,向全社會(huì)免費(fèi)公開部分政府公共數(shù)據(jù),其中部分涉及法律數(shù)據(jù)(如上海市公安局提供的公安執(zhí)法數(shù)據(jù)和上海市司法局提供的法律服務(wù)業(yè)數(shù)據(jù))。當(dāng)然,上海只是例證,其他地方政府也在做類似的工作,有些還做得更好。
最后,以對(duì)法律數(shù)據(jù)產(chǎn)品的實(shí)際應(yīng)用來推動(dòng)對(duì)法律數(shù)據(jù)的產(chǎn)品研發(fā)。應(yīng)該說,把立法、執(zhí)法、司法與法律服務(wù)數(shù)據(jù)用于政府治理的舉措一直存在。對(duì)于法院和檢察院而言,對(duì)自身辦理的案件數(shù)據(jù)進(jìn)行保存、整理、統(tǒng)計(jì)與分析,是其工作的分內(nèi)之事。在全國范圍內(nèi),法院依然走在前頭,法律大數(shù)據(jù)產(chǎn)品的應(yīng)用已經(jīng)延伸到利用人工智能實(shí)驗(yàn)法律推理的前沿領(lǐng)域。
除了司法機(jī)關(guān)對(duì)自身數(shù)據(jù)的應(yīng)用和產(chǎn)品研發(fā)以外,“法律+大數(shù)據(jù)”背景之下的創(chuàng)新應(yīng)用還延伸到立法、執(zhí)法和法律服務(wù)領(lǐng)域。近期在法律服務(wù)行業(yè)內(nèi)出現(xiàn)了基于大數(shù)據(jù)的智能法律服務(wù)。2016年5月,美國律師事務(wù)所Baker & Hostetler雇用了一名機(jī)器人律師Ross。Ross律師是由IBM公司開發(fā)的,專門提供破產(chǎn)方面的法律服務(wù),并且擁有自己專門的服務(wù)網(wǎng)頁。6參見http://www.rossintelligence.com/。在中國,于2016年10月的“云棲法律之光——DT時(shí)代的云數(shù)據(jù)丈量”主題活動(dòng)上,法律服務(wù)商“無訟”宣布國內(nèi)首款法律機(jī)器人“法小淘”正式誕生?!胺ㄐ√浴笔菬o訟新推出的一款人工智能產(chǎn)品,能基于法律大數(shù)據(jù)實(shí)現(xiàn)智能案情分析和律師遴選。這些最新的技術(shù)革命盡管對(duì)法律服務(wù)業(yè)還沒有產(chǎn)生實(shí)質(zhì)性影響,但假以時(shí)日應(yīng)該會(huì)在局部領(lǐng)域產(chǎn)生革命性的影響。
除此之外,在上海,我們還發(fā)現(xiàn)了政府如下幾個(gè)方面對(duì)法律大數(shù)據(jù)的實(shí)踐應(yīng)用:(1)市依法治市領(lǐng)導(dǎo)小組辦公室利用各項(xiàng)法律數(shù)據(jù)編制“上海市法治城區(qū)創(chuàng)建評(píng)估指標(biāo)體系”,對(duì)區(qū)縣政府的“法治指數(shù)”進(jìn)行評(píng)估排名;(2)市司法局搭建“法律服務(wù)信用信息平臺(tái)”,對(duì)其管轄的律師、公證、法律服務(wù)、鑒定方面的正面獎(jiǎng)勵(lì)與負(fù)面懲罰予以公示,方便市民了解相關(guān)法律服務(wù)機(jī)構(gòu)與個(gè)人的信用狀況;(3)市民服務(wù)熱線管理辦公室對(duì)市民通過“12345”熱線提交的大量問題信息進(jìn)行統(tǒng)計(jì)分析,對(duì)市民所關(guān)心的政府治理問題進(jìn)行分門別類,對(duì)有關(guān)部門的解決效率進(jìn)行統(tǒng)計(jì)排名,并提交市政府做決策參考,其中相當(dāng)一部分也涉及規(guī)范性文件的制定和法律規(guī)范的執(zhí)行問題。
可見,在政府的產(chǎn)業(yè)政策、組織建設(shè)、數(shù)據(jù)平臺(tái)和實(shí)踐應(yīng)用(部分還是購買服務(wù))等的組合拳之下,法律大數(shù)據(jù)產(chǎn)業(yè)在近兩年來成為“香餑餑”,在諸方參與之下,迎來了一個(gè)產(chǎn)業(yè)“小陽春”。但是,小陽春之后是進(jìn)入寒冬,還是迎來艷陽天,還取決于中國法律大數(shù)據(jù)產(chǎn)業(yè)的根基是否扎實(shí):法律數(shù)據(jù)的收集是否科學(xué)、系統(tǒng)、全面,使用者是否方便獲得?依筆者之見,情況不容樂觀。
自從有法律以來,便有了法律運(yùn)作的行為和結(jié)果信息,也已經(jīng)有了海量的法律數(shù)據(jù)。但是,如果這些行為和結(jié)果信息只是零星地被記錄、保存,甚至完全沒有被記錄,那么也就無法被科學(xué)地量化分析,因此法律大數(shù)據(jù)只存在于應(yīng)然世界。反過來,只有當(dāng)法律運(yùn)作的數(shù)據(jù)被系統(tǒng)地記錄下來,并被有意識(shí)地用于量化分析,法律大數(shù)據(jù)才是有現(xiàn)實(shí)意義的實(shí)然存在。在這個(gè)意義上講,法律大數(shù)據(jù)在最近幾年突然流行起來,不只是因?yàn)榇蠹沂艿搅丝茖W(xué)啟蒙,還因?yàn)閹浊暌詠硪恢贝嬖诹⒎?、?zhí)法、司法和法律服務(wù)等法律行為及其結(jié)果信息數(shù)據(jù)被系統(tǒng)記錄下來,可以被數(shù)字化,便于傳輸,可以應(yīng)用電腦分析,并且分析結(jié)果有理論和——一定程度的——現(xiàn)實(shí)意義。
而對(duì)于中國的法律大數(shù)據(jù)產(chǎn)業(yè)而言,其面臨最大的問題恰恰是法律基礎(chǔ)數(shù)據(jù)殘缺不齊,即便是裁判文書網(wǎng)上海量的文書數(shù)據(jù),也是充滿了大量的“bug”(殘缺)。7參見馬超、于曉紅、何海波:《大數(shù)據(jù)分析:中國司法裁判文書上網(wǎng)公開報(bào)告》,載《中國法律評(píng)論》2016年第4期;王竹:《法律大數(shù)據(jù)要注重質(zhì)與量的提升》,載《社會(huì)科學(xué)報(bào)》2016年6月2日。法院的裁判文書,尤其是判決書,包含有大量標(biāo)準(zhǔn)化的案件程序和實(shí)體信息,無疑是進(jìn)行法律大數(shù)據(jù)分析的豐富礦藏。但是,即便是法院的判決書,從法律數(shù)據(jù)收集和存儲(chǔ)的角度看,依然存在如下一些普遍性的問題。其一,裁判文書中記載的當(dāng)事人、審級(jí)、裁判法院、審判程序、案件事實(shí)、證據(jù)類型、裁判結(jié)果、結(jié)案時(shí)間等信息雖然相對(duì)標(biāo)準(zhǔn)化,但是這些標(biāo)準(zhǔn)化信息實(shí)際上是案件的整個(gè)司法過程中行為和結(jié)果信息的一部分(甚至是少部分),許多可以也應(yīng)當(dāng)標(biāo)準(zhǔn)化的信息并沒有被文字記載或者記載在沒有公開的案卷資料里,因此被“非標(biāo)準(zhǔn)化”。舉個(gè)大家都熟悉的例子:在相當(dāng)一部分案件中,合議庭、審判庭、審委會(huì)都可能就本案進(jìn)行過討論,但是這些討論信息并不會(huì)出現(xiàn)在最后的裁判文書中,而是記錄在其他地方,或者不記錄。討論不記錄肯定意味著信息的損毀。即便是記錄過,討論的記錄事項(xiàng)也是因地而異、因案而異、因人而異。同時(shí),對(duì)討論信息的保存方式也不一樣,有些是插放在卷宗里的手寫稿,有些是打印稿但電子版沒有存檔??梢钥闯觯菢?biāo)準(zhǔn)化司法數(shù)據(jù)信息是千差萬別的。對(duì)于大量的非標(biāo)準(zhǔn)化數(shù)據(jù)信息,看起來令人興奮,但是真正進(jìn)行數(shù)據(jù)的量化科學(xué)分析時(shí),到處都是“斷頭路”。做過數(shù)據(jù)分析的人都知道這種痛苦,正所謂“誰用誰知道”!其二,即便是標(biāo)準(zhǔn)化的司法信息,也存在各種數(shù)據(jù)錯(cuò)誤,包括標(biāo)準(zhǔn)化操作過程中的問題。根據(jù)何海波等人的大數(shù)據(jù)分析,已經(jīng)在中國裁判文書網(wǎng)發(fā)布的裁判文書中,仍然有一部分文書存在標(biāo)識(shí)性信息錯(cuò)誤,以及文書內(nèi)容的表達(dá)多樣化問題。8參見馬超、于曉紅、何海波:《大數(shù)據(jù)分析:中國司法裁判文書上網(wǎng)公開報(bào)告》,載《中國法律評(píng)論》2016年第4期。
舉輕可以明重。如果法院的司法數(shù)據(jù)存在這樣或者那樣的問題,那么其他類型的法律數(shù)據(jù)更是千奇百怪、形態(tài)各異,充斥著各種問題。比照法院的司法數(shù)據(jù),檢察院的數(shù)據(jù)種類比較類似和接近,但是數(shù)據(jù)質(zhì)量在全方位存在差距。在立法領(lǐng)域,最大的問題在于立法過程信息數(shù)據(jù)的滅失。忽視對(duì)過程數(shù)據(jù)的保存是中國立法領(lǐng)域非常普遍的現(xiàn)象——甚至在有些時(shí)候,因?yàn)檫^程信息非常重要而且敏感,反而刻意沒有被保留。這里的“立法”是廣義意義上的立法,不僅包括《立法法》中規(guī)定的立法活動(dòng),還包括海量的規(guī)范性文件的制定。在法律或者規(guī)范性文件制定過程中,有座談、電話、郵件、公開征求意見等立法意見征求與交換的形式,所得到的信息有些沒有被采納,有些會(huì)被采納直接納入新的草案中——但是由于草案的版本很多,前后意見的疊加就像橡皮檫多次擦過一樣,只能看到背景很模糊,但是不知道之前寫過什么。有時(shí)候與立法事項(xiàng)相關(guān)的部門會(huì)提供交流意見,并以打印稿的方式傳遞。但是這些打印稿信息很少被存檔,有些存檔之后因?yàn)橹鞴芴庨L或者副處長的調(diào)動(dòng),便遺失了。不僅僅過程信息,事實(shí)上相當(dāng)數(shù)量的法律法規(guī)和規(guī)范性文件的舊版數(shù)據(jù),也不齊整。像法寶或者法意公司目前還提供了舊版法律法規(guī)和規(guī)范性文件的檢索,但也只是全國各級(jí)人大和政府所制定的法律法規(guī)和規(guī)范性文件的“冰山一角”,有些沒有上網(wǎng)的文本或許還安靜地躺在某個(gè)檔案柜里,有些則已經(jīng)永遠(yuǎn)消失了。
在行政執(zhí)法過程中,也會(huì)產(chǎn)生大量的數(shù)據(jù)信息。比如,證監(jiān)會(huì)官方網(wǎng)站發(fā)布的很多行政執(zhí)法的文書和其他數(shù)據(jù)信息。這些行政執(zhí)法的法律數(shù)據(jù)信息也是非常有價(jià)值的。不過,與立法機(jī)關(guān)相比,絕大多數(shù)行政執(zhí)法機(jī)關(guān)既沒有嚴(yán)格的要求,也缺乏類似的能力,去記錄和保存行政執(zhí)法的過程與結(jié)果信息。盡管行政執(zhí)法時(shí)時(shí)發(fā)生,但是所保留的數(shù)據(jù)信息只是九牛一毛。
律師和公司法務(wù)等法律專業(yè)人士在提供法律服務(wù)中也會(huì)產(chǎn)生大量的法律服務(wù)數(shù)據(jù)信息。由于涉及對(duì)客戶信息的保密,目前對(duì)外界而言,法律服務(wù)數(shù)據(jù)的質(zhì)量和保存情況,整體上是一個(gè)迷。筆者的猜測(cè)是,對(duì)于像“紅圈所”這樣的一流律所而言,他們?cè)谔峁┓煞?wù)過程中的資料信息應(yīng)該是齊整的、高質(zhì)量的。而對(duì)于大部分中小型律所——尤其是主要從事訴訟的中小型律所,法律服務(wù)重在結(jié)果而非過程,因此法律服務(wù)數(shù)據(jù)信息應(yīng)該是一筆糊涂賬。
當(dāng)然,除了立法、執(zhí)法、司法和法律服務(wù)各個(gè)領(lǐng)域的機(jī)構(gòu)和組織各自在數(shù)據(jù)收集中存在諸多問題以外,他們相互之間在數(shù)據(jù)的收集上更是甚少協(xié)調(diào),有時(shí)甚至故意唱反調(diào),導(dǎo)致同一數(shù)據(jù)信息在不同部門那里呈現(xiàn)出不同的信號(hào)。舉一個(gè)小例子來說明:在涉及外國當(dāng)事人時(shí),檢察院和法院對(duì)當(dāng)事人的名字記載要求不一樣,一個(gè)要求中文翻譯,另一個(gè)則要求外文名稱。這樣一個(gè)小小的技術(shù)差異,實(shí)際上在大數(shù)據(jù)分析中很可能就是一道天塹。
上文之所以對(duì)立法、執(zhí)法、司法和法律服務(wù)的數(shù)據(jù)記載和保存的問題進(jìn)行一一剖析,是想強(qiáng)調(diào)一個(gè)觀念:法律大數(shù)據(jù)不只是司法大數(shù)據(jù),前者是比中國裁判文書網(wǎng)所公布的法院數(shù)據(jù)信息更加寬泛的概念。所以,如果我們只用4000多萬份法院的裁判文書說事,那么還只能說是法律領(lǐng)域的“大量數(shù)據(jù)”,而不是法律領(lǐng)域的“大數(shù)據(jù)”。法律大數(shù)據(jù)之所以“大”者,是因?yàn)楫?dāng)前法律數(shù)據(jù)類型和性質(zhì)發(fā)生了明顯變化,從傳統(tǒng)上類型比較單一、靜態(tài)的、數(shù)量相對(duì)可計(jì)算的法律文本信息、結(jié)果統(tǒng)計(jì)數(shù)據(jù),轉(zhuǎn)向類型繁多、動(dòng)態(tài)的、數(shù)量浩瀚的法律行為信息、過程痕跡數(shù)據(jù),也在于它為我們提供了對(duì)法律體系運(yùn)作的所有環(huán)節(jié)進(jìn)行全方位關(guān)聯(lián)(甚至因果)分析的可能。很顯然,至今在法律領(lǐng)域的基礎(chǔ)數(shù)據(jù)收集方面,無論是立法、執(zhí)法、司法還是法律服務(wù),其數(shù)據(jù)的記錄與保存,到處充滿“bug”。到目前為止,我們口中的“法律大數(shù)據(jù)”,還只是一個(gè)虛構(gòu)的大餅。對(duì)于有志于從事法律大數(shù)據(jù)分析的人而言,現(xiàn)階段還只能畫餅充饑。
基礎(chǔ)數(shù)據(jù)不扎實(shí),即便用大數(shù)據(jù)的分析工具也是事倍功半,甚至得出錯(cuò)誤導(dǎo)向的結(jié)論。然而,即便法律數(shù)據(jù)收集和保存良好,但如果數(shù)據(jù)被壟斷、割裂,不能實(shí)現(xiàn)合法前提下的有效分享與共享,那么大數(shù)據(jù)的分析工具也是“英雄無用武之地”。而現(xiàn)狀是,除了相當(dāng)數(shù)量的裁判文書上網(wǎng)以外,絕大多數(shù)類型的中國法律數(shù)據(jù)基本上處于采集者的壟斷占有之下,并形成了一座座大小不一的“數(shù)據(jù)孤島”。法律數(shù)據(jù)采集者根據(jù)自己的采集規(guī)則和操作方法,采集自己想要的數(shù)據(jù),在本部門的范圍之內(nèi)使用,回避分享和共享——如果實(shí)在有必要,只能進(jìn)行數(shù)據(jù)交換使用?!皵?shù)據(jù)孤島”是中國政府?dāng)?shù)據(jù)使用普遍存在的現(xiàn)象。在法律領(lǐng)域,“數(shù)據(jù)孤島”現(xiàn)象體現(xiàn)如下。
首先,立法、執(zhí)法、司法和法律服務(wù)數(shù)據(jù)的采集者根據(jù)不同的規(guī)則和標(biāo)準(zhǔn)采集和保存數(shù)據(jù),相互之間沒有技術(shù)接口,在客觀上為數(shù)據(jù)分享設(shè)置了技術(shù)障礙。盡管工作上存在交叉,但是政府機(jī)關(guān)、法院、檢察院、黨務(wù)部門等在數(shù)據(jù)采集、保存和使用基本上是各自為政。不僅如此,甚至在一個(gè)機(jī)構(gòu)的不同內(nèi)設(shè)部門,各自都根據(jù)自己的標(biāo)準(zhǔn)采集數(shù)據(jù),利用不同的數(shù)據(jù)系統(tǒng),相互之間“老死不相往來”,甚至有意設(shè)置防火墻。這些在客觀上都妨礙了法律數(shù)據(jù)的分享。
其次,數(shù)據(jù)采集機(jī)構(gòu)對(duì)數(shù)據(jù)的保密是常態(tài),進(jìn)行數(shù)據(jù)分享是極其例外的。盡管前文提到,國家和地方政府的政策與文件要求實(shí)現(xiàn)數(shù)據(jù)的合理分享,但是在實(shí)踐中,數(shù)據(jù)被壟斷占有是常態(tài)。應(yīng)該說,中國法院系統(tǒng)的判決書上網(wǎng)工程是個(gè)極其罕見且有魄力的壯舉——其中固然也有司法公開給法院的壓力。相比之下,其他類型的法律數(shù)據(jù)公開或者合理的分享,舉步維艱。
再次,在不得已情況下,如果需要分享,則也是“缺斤少兩”地分享。在法律數(shù)據(jù)公布及與社會(huì)分享方面,數(shù)據(jù)信息披露通常是嚴(yán)重滯后、人為選擇、錯(cuò)誤頻繁。在調(diào)研中,我們發(fā)現(xiàn),這方面的問題主要體現(xiàn)在如下幾個(gè)方面:(1)大部分政府部門的網(wǎng)站信息更新滯后,相關(guān)的法律數(shù)據(jù)公布也明顯滯后,官網(wǎng)上的法律信息更新不及時(shí),部分新法律文件并沒有及時(shí)更新替代舊文件;(2)一些地方性規(guī)章或者規(guī)范性文件信息在官網(wǎng)上與其他渠道不一致,無從判斷哪個(gè)為正式版本;(3)即便是專門的政務(wù)數(shù)據(jù)公開渠道也存在嚴(yán)重的數(shù)據(jù)延遲,用戶體驗(yàn)不佳。
最后,數(shù)據(jù)采集部門并非完全不可以分享數(shù)據(jù),而是通過“數(shù)據(jù)交換”的方式來分享數(shù)據(jù),公器私用。調(diào)研發(fā)現(xiàn),法律數(shù)據(jù)(尤其是執(zhí)法數(shù)據(jù))并非不可以分享,但很多時(shí)候以資源交換的方式來分享。對(duì)于公共法律數(shù)據(jù)擁有者而言,他們把自己掌握的法律數(shù)據(jù)變成了為部門甚至為個(gè)人謀私利的工具。大數(shù)據(jù)熱以來,越來越多的人認(rèn)為,未來掌握在那些擁有數(shù)據(jù)的人或者組織手上。9參見鄭戈:《在鼓勵(lì)創(chuàng)新與保護(hù)人權(quán)之間——法律如何回應(yīng)大數(shù)據(jù)技術(shù)革新的挑戰(zhàn)》,載《探索與爭(zhēng)鳴》2016年第7期。這種認(rèn)識(shí)助長了法律數(shù)據(jù)資源的壟斷,而不是促成了開放與共享。
關(guān)于數(shù)據(jù)分享,我們?cè)僖圆门形臅暇W(wǎng)工程為例,舉輕以明重。在最高人民法院幾輪司法解釋的催促之下,各地法院至今已經(jīng)大體上實(shí)現(xiàn)了文書上傳的制度化,中國裁判文書網(wǎng)所公開的文書數(shù)量已經(jīng)達(dá)到4300多萬件。10截至2018年3月14日,中國裁判文書網(wǎng)所公布的文書數(shù)量為4314萬件左右。然而即便如此,依然存在如下諸多數(shù)據(jù)分享的問題:(1)盡管最高院的規(guī)則要求非常清晰,但是上網(wǎng)實(shí)際公開的裁判文書遠(yuǎn)遠(yuǎn)少于應(yīng)該公開的文書;(2)最高人民法院雖然提出明確要求,但是否上傳、如何上傳、何時(shí)上傳是由做出裁判的法院來操作的,而后者的實(shí)踐邏輯并不透明、千差萬別;(3)在已經(jīng)上網(wǎng)公開的數(shù)據(jù)信息中,不同法院、不同法官之間對(duì)裁判文書的隱名類項(xiàng)和隱名程度還存在把握不一致的情況,很多不應(yīng)該被隱名或者被刪除的信息,被不恰當(dāng)隱名或者刪除了;此外,還存在其他一些問題。11參見馬超、于曉紅、何海波:《大數(shù)據(jù)分析:中國司法裁判文書上網(wǎng)公開報(bào)告》,載《中國法律評(píng)論》2016年第4期。
當(dāng)然,對(duì)于法律數(shù)據(jù)孤島的存在,也不必一味指責(zé)數(shù)據(jù)采集機(jī)構(gòu),除了利益考量以外,還存在一些客觀因素。首先,現(xiàn)有的法律法規(guī)對(duì)信息公開和分享的邊界規(guī)定并不十分清晰,在這種情況下,保護(hù)公共信息安全和維護(hù)公民個(gè)人隱私,也可能是數(shù)據(jù)保密的真實(shí)理由。其次,法律數(shù)據(jù)的采集、保存、傳播等有嚴(yán)重的“路徑依賴”,各個(gè)機(jī)構(gòu)慢慢地使用自己的技術(shù)和操作標(biāo)準(zhǔn),建立起自己的數(shù)據(jù)庫,并依賴已經(jīng)形成的數(shù)據(jù)采集和存儲(chǔ)路徑,在沒有十足的動(dòng)力和壓力之下,不太會(huì)改變已有的路徑。事實(shí)上,為了保護(hù)自己的數(shù)據(jù)安全,絕大部分?jǐn)?shù)據(jù)采集機(jī)構(gòu)都花了不少資源去建設(shè)數(shù)據(jù)防火墻——相當(dāng)于給數(shù)據(jù)孤島建圍墻,這是巨大的沉默成本。拆除已有的“圍墻”,打通數(shù)據(jù)孤島之間的“橋梁”,意味著大量的資金和其他資源投入。這其實(shí)也是第三個(gè)原因,也就是數(shù)據(jù)的分享與共享,需要技術(shù)、資金、人力、物力等的支持。沒有這些支持,即便孤島之間的人希望架上橋梁,也只能望洋興嘆。有時(shí)候,一個(gè)小小的技術(shù)問題,可能就是一道屏障。比如,現(xiàn)存的大部分紙質(zhì)法律數(shù)據(jù)資料都蓋有公章,如何把這種印章資料轉(zhuǎn)化成權(quán)威的電子文檔就存在理念與技術(shù)上的障礙。最后,更為關(guān)鍵的原因是體制和機(jī)制上的障礙。目前,盡管我們的黨政機(jī)關(guān)應(yīng)當(dāng)齊心協(xié)力“為人民服務(wù)”,但在實(shí)踐中,條條塊塊的政府部門也存在自己的利益,并在立法、執(zhí)法與司法中出現(xiàn)了權(quán)力使用的“碎片化”。調(diào)研中,有位被訪談人做了一個(gè)形象的比喻:“幾百個(gè)部門就有幾百個(gè)工作機(jī)制,就形成了幾百個(gè)工作平臺(tái),它們都是相互獨(dú)立、自己流轉(zhuǎn)的垂直‘煙囪’”。在沒有硬性法律規(guī)定或者嚴(yán)格政策要求下,法律數(shù)據(jù)的科學(xué)采集、有效共享、合理分享就難以實(shí)現(xiàn)。
很顯然,如同數(shù)據(jù)“bug”一樣,數(shù)據(jù)孤島的存在給法律大數(shù)據(jù)產(chǎn)業(yè)的發(fā)展設(shè)置了很大的障礙。很多有識(shí)之士都想到,應(yīng)該把裁判文書網(wǎng)的文書數(shù)據(jù)信息和其他類型的法律數(shù)據(jù),乃至與更大范圍的社會(huì)人口經(jīng)濟(jì)數(shù)據(jù)對(duì)接,以更全面地對(duì)真實(shí)的世界做大數(shù)據(jù)分析。很可惜,由于數(shù)據(jù)整合的高成本、高難度,至今難以實(shí)現(xiàn)。暢想一下,有朝一日,如果我們能夠把一部法律(或者一個(gè)條文)的所有立法過程和結(jié)果信息,所有相關(guān)的行政執(zhí)法信息,所有相關(guān)的訴訟信息,所有相關(guān)的法律服務(wù)信息,與社會(huì)人口經(jīng)濟(jì)數(shù)據(jù)結(jié)合在一起,進(jìn)行真正意義上的大數(shù)據(jù)分析,那么我們對(duì)這部法律(或者這個(gè)條文)的廢除、修改或者存續(xù)的認(rèn)知將是何等的透徹!然而,數(shù)據(jù)的貧窮限制了我們的想象力。
最近,熱衷于法律大數(shù)據(jù)、法律人工智能的人最喜歡用的一句口號(hào)是“未來已來”?;谏衔奶岬降臄?shù)據(jù)問題,筆者看未必,未來還未來。有了良好的數(shù)據(jù)基礎(chǔ),未必促成輝煌的中國法律大數(shù)據(jù)事業(yè);但是,沒有良好的數(shù)據(jù)基礎(chǔ),免談未來。前面講到,在政府、學(xué)界和市場(chǎng)等的多重作用之下,國人在最近兩年很好地接受了一場(chǎng)關(guān)于法律大數(shù)據(jù)的科學(xué)啟蒙。為了讓這場(chǎng)科學(xué)啟蒙盡快成為一場(chǎng)真正的科學(xué)革命,必須回到根本性的問題來:如何為“未來”提供非常扎實(shí)的法律基礎(chǔ)數(shù)據(jù)?很顯然,對(duì)于法律數(shù)據(jù)而言,主要的“采礦者”是進(jìn)行立法、執(zhí)法和司法的公權(quán)力機(jī)構(gòu)與部門。
不妨可以考慮如下幾項(xiàng)舉措。首先,倡導(dǎo)“中國統(tǒng)一法律大數(shù)據(jù)庫”的理念,研究并落實(shí)建設(shè)這個(gè)法律大數(shù)據(jù)庫的領(lǐng)導(dǎo)協(xié)調(diào)機(jī)構(gòu)與機(jī)制。統(tǒng)一法律大數(shù)據(jù)庫中的“統(tǒng)一”有兩層含義。第一層含義是法律數(shù)據(jù)類型需要齊整,除了司法的大數(shù)據(jù),還要把立法、執(zhí)法、法律服務(wù)等與法律體系運(yùn)作相關(guān)的數(shù)據(jù)信息都納入進(jìn)來。第二層含義是不同類型的法律數(shù)據(jù)之間的術(shù)語要標(biāo)準(zhǔn)化、技術(shù)接口要通、數(shù)據(jù)門類要對(duì)稱。由于這樣的法律大數(shù)據(jù)庫超越了單一系統(tǒng)的數(shù)據(jù),因此不妨由籌備中的“中央全面依法治國委員會(huì)”來領(lǐng)導(dǎo)協(xié)調(diào)。其次,在法律數(shù)據(jù)采集方面,由某個(gè)中央權(quán)威部門(如新組建的司法部)牽頭編制統(tǒng)一的法律數(shù)據(jù)采集、收入、存儲(chǔ)等的技術(shù)標(biāo)準(zhǔn)和操作指南,推進(jìn)立法、執(zhí)法和司法機(jī)關(guān)在法律數(shù)據(jù)建設(shè)過程中的技術(shù)標(biāo)準(zhǔn)統(tǒng)一化,并由此為市場(chǎng)機(jī)構(gòu)建設(shè)法律數(shù)據(jù)庫提供示范模板。最后,在法律數(shù)據(jù)分享方面,盡快制定全國性法律,盡可能界定清楚法律數(shù)據(jù)是否分享、如何分享、何時(shí)分享的法律邊界,明晰法律數(shù)據(jù)采集的政府機(jī)構(gòu)的權(quán)責(zé)邊界,既為保護(hù)國家信息安全和公民個(gè)人隱私提供制度保障,也為數(shù)據(jù)分享和共享解除后顧之憂。12參見邵俊武:《法律視野下的大數(shù)據(jù)問題研究》,載《法治社會(huì)》2016年第2期;齊愛民:《論大數(shù)據(jù)時(shí)代數(shù)據(jù)安全法律綜合保護(hù)的完善——以《網(wǎng)絡(luò)安全法》為視角》,載《東北師大學(xué)報(bào)》(哲學(xué)社會(huì)科學(xué)版)2017年第4期。在條件適當(dāng)時(shí),可以推廣最高人民法院關(guān)于司法公開的一系列舉措的經(jīng)驗(yàn),為立法、執(zhí)法和檢察院司法數(shù)據(jù)的公開與分享提供好的示范路徑。
國務(wù)院辦公廳在《關(guān)于運(yùn)用大數(shù)據(jù)加強(qiáng)對(duì)市場(chǎng)主體服務(wù)和監(jiān)管的若干意見》(國辦發(fā)〔2015〕51號(hào))中提到:“進(jìn)一步加大政府信息公開和數(shù)據(jù)開放力度。除法律法規(guī)另有規(guī)定外,應(yīng)將行政許可、行政處罰等信息自作出行政決定之日起7個(gè)工作日內(nèi)上網(wǎng)公開,提高行政管理透明度和政府公信力。提高政府?dāng)?shù)據(jù)開放意識(shí),有序開放政府?dāng)?shù)據(jù),方便全社會(huì)開發(fā)利用。……打破信息的地區(qū)封鎖和部門分割,著力推動(dòng)信息共享和整合。各地區(qū)、各部門已建、在建信息系統(tǒng)要實(shí)現(xiàn)互聯(lián)互通和信息交換共享。除法律法規(guī)明確規(guī)定外,對(duì)申請(qǐng)立項(xiàng)新建的部門信息系統(tǒng),凡未明確部門間信息共享需求的,一概不予審批;對(duì)在建的部門信息系統(tǒng),凡不能與其他部門互聯(lián)共享信息的,一概不得通過驗(yàn)收;凡不支持地方信息共享平臺(tái)建設(shè)、不向地方信息共享平臺(tái)提供信息的部門信息系統(tǒng),一概不予審批或驗(yàn)收。”由此可見,對(duì)于法律基礎(chǔ)數(shù)據(jù)的建設(shè)和分享,中央是英明的,問題是,要落實(shí)。筆者期待中國的法律大數(shù)據(jù)產(chǎn)業(yè)有個(gè)更美好的明天,并且盡快到來。