嚴若冰
(四川大學法學院,四川 成都 610207)
隨著信息技術的快速發(fā)展,用大數(shù)據(jù)技術預測案件發(fā)生、證明案件事實已經(jīng)成為我國司法實踐中的現(xiàn)實情況。然而,不論在理論還是實踐上,大數(shù)據(jù)證據(jù)都是一個遠未成熟的領域,其基礎理論尚未形成通說,實踐運用也缺少規(guī)范。研究大數(shù)據(jù)材料作為證據(jù)的基礎理論,不僅是法律實踐和學術研究的需求,也是以全球視野應對科技發(fā)展的需要。
大數(shù)據(jù)證據(jù)登上司法舞臺,首先取決于大數(shù)據(jù)技術在社會范圍的廣泛應用。我國政府高度重視大數(shù)據(jù)技術的發(fā)展,2014年“大數(shù)據(jù)”首次被寫入政府工作報告,隨后國務院印發(fā)《促進大數(shù)據(jù)發(fā)展的行動綱要》《十三五規(guī)劃綱要》提出要“實施國家大數(shù)據(jù)戰(zhàn)略”,工信部發(fā)布了《大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃(2016—2020年)》。隨著國家大數(shù)據(jù)戰(zhàn)略的深化,黨的十九大報告中提出“推動大數(shù)據(jù)與實體經(jīng)濟深度融合”,我國正在從“數(shù)據(jù)大國”邁向“數(shù)據(jù)強國”。政策支持下,大數(shù)據(jù)產(chǎn)業(yè)的水平持續(xù)提升,涌現(xiàn)了華為、百度、阿里等一批大數(shù)據(jù)企業(yè);大數(shù)據(jù)應用不斷深化,從互聯(lián)網(wǎng)、廣告營銷等領域,向工業(yè)、政務、電信、交通、醫(yī)療、金融、教育等實體領域廣泛滲透,呈現(xiàn)出“脫虛向實”的趨勢,正與社會生活的各方面產(chǎn)生深度結合。[1]
隨著越來越龐大的數(shù)據(jù)存貯和分析能力,實踐中案件的“專業(yè)化和巨型化”[2]對大數(shù)據(jù)技術進入司法領域提出了需求。如涉眾型金融犯罪案件中動輒涉及百億元、千億元金額的流轉,十萬人、百萬人涉案人員的行為,對傳統(tǒng)辦案方式提出了極大挑戰(zhàn)。用大數(shù)據(jù)技術偵破案件成為許多情況下必然的選擇,有關材料作為證據(jù)進入庭審流程是實事求是的需要。雖然大數(shù)據(jù)技術強調關聯(lián)關系而非因果關系,與傳統(tǒng)的司法證明要求不完全相符,但是由于證據(jù)的稀缺性,大數(shù)據(jù)技術的司法應用有助于我們更好地發(fā)現(xiàn)案件事實,即“符合降低司法證明難度的導向”[3]。
目前,司法實踐中大數(shù)據(jù)技術的應用在世界范圍已經(jīng)形成一定積淀,其身影出現(xiàn)在立案前的線索搜集、案件偵破過程、法庭證明等一系列司法活動中,受到實務界越來越多的關注,同時成為學術研究的熱點。國際上,美國刑事偵查中采用了“大數(shù)據(jù)預測警務”技術。[4]司法實務中,出現(xiàn)了將汽車事件數(shù)據(jù)記錄系統(tǒng)數(shù)據(jù)、谷歌地球衛(wèi)星圖像和坐標數(shù)據(jù)、“查找我的iPhone”數(shù)據(jù)等用作證據(jù)的案例。[5]在國家大數(shù)據(jù)戰(zhàn)略推動下,我國司法領域的大數(shù)據(jù)技術應用也正在飛速發(fā)展。涉及海量數(shù)據(jù)的案件中,大數(shù)據(jù)證據(jù)的應用已經(jīng)成為案件偵破的重要突破方法,典型的有涉眾型金融犯罪案件。有學者以一起資金大數(shù)據(jù)偵查案件為例,說明大數(shù)據(jù)技術在發(fā)現(xiàn)案件情況中的作用。該案涉及到上億條資金流水數(shù)據(jù),上萬個賬戶,人工梳理難度極大。對此,偵查人員建立了資金特征分析模型,利用統(tǒng)計概率、挖掘分類算法等技術,對交易行為特征、賬戶特征、主體特征等資金特征進行分析,在短時間內刻畫了可疑資金網(wǎng)絡,并利用可視化技術展現(xiàn)了可疑資金的來源和去向,且自動標注賬號和主體的類別標簽,為偵查人員提供了偵查的方向,提高了工作效率。[6]大數(shù)據(jù)技術在深入我們生活的同時,也在與司法實踐深度結合。在法庭上面對一項作為證據(jù)的大數(shù)據(jù)材料,或許是越來越多法律工作者將會遇到的情形。
從大數(shù)據(jù)技術到大數(shù)據(jù)證據(jù),經(jīng)歷了兩個過程。第一,抽象的大數(shù)據(jù)技術被運用于社會生活形成具體的材料,其中一部分與法律活動存在關聯(lián)的,成為可能被作為案件證據(jù)或者參考的大數(shù)據(jù)材料。第二,大數(shù)據(jù)材料中,具備客觀性、關聯(lián)性、合法性等證據(jù)屬性的,是大數(shù)據(jù)證據(jù)。也就是說,大數(shù)據(jù)證據(jù)在形式上主要由大數(shù)據(jù)技術本身決定,不僅指通過大數(shù)據(jù)技術形成的預測、分析結果,還包括作為分析基礎的海量基礎數(shù)據(jù),以及作為分析技術的算法;同時,大數(shù)據(jù)證據(jù)要在實質上符合證據(jù)屬性的要求,否則只能成為大數(shù)據(jù)材料。
1.大數(shù)據(jù)證據(jù)的案例分析
有學者在實證研究中,以刑事案件為范圍,將檢索關鍵詞確定為“大數(shù)據(jù)”“數(shù)據(jù)平臺”“數(shù)據(jù)分析”,通過案例分析指出:審判機關多將大數(shù)據(jù)證據(jù)作為電子數(shù)據(jù),僅將極少數(shù)納入鑒定意見或者書證。[7]為更加全面地梳理大數(shù)據(jù)證據(jù)的實務狀況,本文在這項實證研究的基礎上,對主流論者較為關注的有關大數(shù)據(jù)材料的案件進行了梳理,[8]得到應用大數(shù)據(jù)材料的案件共15例,嘗試通過分析這些案例,從另一個側面窺見實務中對大數(shù)據(jù)證據(jù)的理解,輔助本文的立論。
在這些案例中,“公安大數(shù)據(jù)平臺資料”“百度指數(shù)”“淘寶指數(shù)”“醫(yī)保大數(shù)據(jù)分析”“大數(shù)據(jù)比對”“輿情專報”等大數(shù)據(jù)材料已經(jīng)在我國的司法實踐中被用于證明或輔助證明。從樣本來看,并不能得出“法律實務中傾向于將大數(shù)據(jù)證據(jù)認定為電子數(shù)據(jù)”的結論,與上文提到的實證研究結論之間存在一定差異。這可能有以下原因:第一,前述研究的關鍵詞選取偏向基礎數(shù)據(jù),而非大數(shù)據(jù)產(chǎn)品和大數(shù)據(jù)技術,可能導致研究結果存在偏向性,如司法實踐中運用的“淘寶指數(shù)”(1)參見周樂倫與新百倫貿易(中國)有限公司、廣州市盛世長運商貿連鎖有限公司侵害商標權糾紛案,廣東省高級人民法院民事判決書(2015)粵高法民三終字第444號?!鞍俣戎笖?shù)”(2)參見北京趣拿信息技術有限公司與廣州市去哪信息技術有限公司不正當競爭糾紛案,廣東省高級人民法院民事判決書(2013)粵高法民三終字第565號?!拜浨榉治觥?3)參見程幼澤、劉欣等與程會林、劉軍等聚眾擾亂社會秩序案,山西省晉城市中級人民法院刑事判決書(2017)晉05刑終271號。也符合我們對大數(shù)據(jù)證據(jù)的期待,但無法通過以上關鍵詞檢索得到;第二,該學者的實證研究梳理了大數(shù)據(jù)材料作為證據(jù)的情形,較難反映出大數(shù)據(jù)材料作為非證據(jù)材料的技巧性運用,如用大數(shù)據(jù)分析意見說明某項證據(jù)的證明價值,而非將大數(shù)據(jù)材料單列為證據(jù);(4)參見普春花走私、販賣、運輸、制造毒品案,新疆維吾爾自治區(qū)烏魯木齊市中級人民法院刑事判決書(2017)新01刑初200號。本案中,控方為證明被告人的行程軌跡,用公安大數(shù)據(jù)平臺分析意見,說明書證“登機牌”的證明價值,但并未將大數(shù)據(jù)平臺分析意見列為書證。第三,在刑事案件范圍內選取案例,其結論的普遍性或有缺失,因為大數(shù)據(jù)證據(jù)在民事案件、行政案件中也得到了運用,而且呈現(xiàn)出與刑事案件不同的特征。
2.大數(shù)據(jù)證據(jù)實踐的特點及困境
縱觀表2案例中大數(shù)據(jù)證據(jù)的表現(xiàn)形式可以發(fā)現(xiàn),大數(shù)據(jù)證據(jù)在實踐中的表現(xiàn)形式非常多樣,尚未形成普遍的做法。以與其他證據(jù)的關系為標準,可以大致將其分為四種類型:(1)作為法定證據(jù)種類,如電子數(shù)據(jù)、鑒定意見、書證;(5)參見表1中第1—6案例。(2)作為獨立的證據(jù),但是不說明證據(jù)種類,如“輿情報告”“情況說明”“偵破經(jīng)過”“車輛大數(shù)據(jù)”;(6)參見表1中第7—11案例。(3)作為其他證據(jù)的部分,如吸收到書證、證人證言之中;(7)參見表1中第12—14號案例。(4)用于佐證其他證據(jù),加強其他證據(jù)的優(yōu)勢。(8)參見表1中第15號案例。
表1 涉及大數(shù)據(jù)材料的部分案件
表2 大數(shù)據(jù)證據(jù)在案件中的使用情況和表現(xiàn)形式
從案件類型上看,15個樣本里,有11個刑事案件,3個民事案件,1個行政案件,說明大數(shù)據(jù)證據(jù)已經(jīng)被運用在行政、刑事、民事等類型的案件中。同時,大數(shù)據(jù)證據(jù)在不同類型案件中也呈現(xiàn)出不同的特征。在證據(jù)形式上,民事案件大數(shù)據(jù)證據(jù)的形式更加規(guī)范。民事案件的大數(shù)據(jù)證據(jù)多以鑒定意見和書證的法定證據(jù)形式呈現(xiàn),而刑事案件的大數(shù)據(jù)證據(jù)形式五花八門,從鑒定意見,到“情況說明”“偵破經(jīng)過”,甚至是將其吸收到證人證言中。這或許是因為不同類型案件里大數(shù)據(jù)證據(jù)的制作主體不同,對它們的可靠性造成了天然的影響。比如在刑事案件中,大數(shù)據(jù)證據(jù)多基于公安大數(shù)據(jù)平臺、醫(yī)保大數(shù)據(jù)平臺,由公安機關、社會保險管理部門等制作,由于具備公權力機關的背書天然具有較高的真實性。而民事案件中的大數(shù)據(jù)證據(jù),基于企業(yè)等私主體數(shù)據(jù)庫,由具有技術能力的企業(yè)或鑒定機構制作。這就意味著,民事大數(shù)據(jù)證據(jù)的可靠性相對較低,便更加注重形式上的規(guī)范性,需要強化法定證據(jù)的形式要件,才能更易被法庭采信,因此在結果上導致了民事案件中大數(shù)據(jù)證據(jù)的形式規(guī)范性更高。
這些案例反映出司法實踐中大數(shù)據(jù)證據(jù)的一些共性。第一,大數(shù)據(jù)證據(jù)的定義沒有明確標準,但大都包含三個要素,即基礎數(shù)據(jù)、分析技術和分析結果。以表1第9號案例張建春走私、販賣、運輸、制造毒品案為例,其基礎數(shù)據(jù)為公安大數(shù)據(jù)平臺的數(shù)據(jù)庫,分析技術為大數(shù)據(jù)查詢,分析結果呈現(xiàn)為情況說明。第二,司法機關對大數(shù)據(jù)證據(jù)的側重不同,如表2第9號案例僅將情況說明作為證據(jù),體現(xiàn)了對分析結果的側重,而表2第1號案例中大數(shù)據(jù)證據(jù)以電子數(shù)據(jù)呈現(xiàn),體現(xiàn)了對海量基礎數(shù)據(jù)和分析技術的側重。第三,從證據(jù)能力上看,大數(shù)據(jù)材料在法律實務中不僅是輔助,而是已經(jīng)通過“鑒定意見”“公證書”“情況說明”“電子數(shù)據(jù)”等形式,作為獨立證據(jù)登上法庭。大數(shù)據(jù)證據(jù)得到了司法機構較廣泛的認可,通過司法鑒定使大數(shù)據(jù)材料轉化為鑒定意見用以證明案件事實,成為一項有效的策略,多得到法院的支持。(9)參見許有發(fā)與淘寶(中國)軟件有限公司、杭州阿里科技有限公司網(wǎng)絡服務合同糾紛案,杭州市余杭區(qū)人民法院民事判決書(2014)杭余民初字第3號;王榮美等組織、領導傳銷活動案,山東省濟南市中級人民法院刑事裁定書(2017)魯01刑終88號;李奕、王舟等非法吸收公眾存款案,湖南省長沙市中級人民法院刑事判決書(2018)湘01刑終18號。這些案例中的大數(shù)據(jù)證據(jù)均以鑒定意見的形式呈現(xiàn),為法院接受。
作為一種新型證據(jù),大數(shù)據(jù)證據(jù)的實踐也面臨著困境。一方面,大數(shù)據(jù)證據(jù)缺乏法律依據(jù),難以被歸于法定證據(jù)種類,在提取、審查和認定上都缺乏明確的規(guī)范指導;另一方面,大數(shù)據(jù)證據(jù)的呈現(xiàn)形式多樣,審查認定方法不一,存在一定混亂。除了表現(xiàn)為鑒定意見、電子數(shù)據(jù)等法定證據(jù)種類,大數(shù)據(jù)證據(jù)還有“偵破經(jīng)過”“情況說明”等多種表現(xiàn)形式,實質上反映的都是相似的證據(jù)內容。實踐中甚至有將大數(shù)據(jù)材料吸收到證人證言、書證中的做法,繞開了庭審對大數(shù)據(jù)證據(jù)的規(guī)范質證,造成一定程序瑕疵。如表2第14號案例中,控方用證人證言吸收了大數(shù)據(jù)證據(jù),以“大數(shù)據(jù)查找”結果質疑被告人的辯解。(10)參見趙銳芳組織、領導傳銷活動案,吉林省松原市寧江區(qū)人民法院刑事判決書(2017)吉 0702刑初 460號。本案中,控方提供的證人證言里包含了“我們通過大數(shù)據(jù)查找你的下線人數(shù)為291人,你怎么解釋”,以及“我們通過大數(shù)據(jù)查找,你屬于功德主會員,你怎么解釋”。由于大數(shù)據(jù)技術的專業(yè)性較強,直接讓被告人就“大數(shù)據(jù)查找”的結論進行辯解,這是否盡到了控方的舉證責任,是非??梢傻摹?/p>
大數(shù)據(jù)證據(jù)基礎理論的研究早見于有關電子證據(jù)的研究中,有學者在2016年的文章里就對大數(shù)據(jù)證據(jù)展開了討論,并敏銳地指出了大數(shù)據(jù)證據(jù)關聯(lián)性的特殊之處。[9]時至今日,大數(shù)據(jù)證據(jù)的基礎理論仍然存在諸多爭議,需要進一步研究回應。
證據(jù)資格,即“什么樣的證據(jù)可以被采納”,是大陸法系證據(jù)體系的慣用提法,在英美證據(jù)法律制度中被概括為證據(jù)的“可采性”,又常被我國學者翻譯為“證據(jù)能力”“證據(jù)的采納標準”。證據(jù)資格的內容,包括了客觀性標準、關聯(lián)性標準和合法性標準。[10]
目前,對于大數(shù)據(jù)的證據(jù)資格已經(jīng)形成一定共識,從學術界到實務界,多數(shù)法律工作者認同大數(shù)據(jù)證據(jù)具有證據(jù)資格。有學者從實踐和理論兩個維度,對大數(shù)據(jù)材料的證據(jù)屬性進行了論證,一方面從實證角度,指出大數(shù)據(jù)材料“在近三年的司法刑事過程中應用逐年增多”;另一方面從理論角度,以關聯(lián)性和真實性著手論證了大數(shù)據(jù)證據(jù)具有證據(jù)屬性,提出了大數(shù)據(jù)證據(jù)與案件事實之間是弱關聯(lián)甚至“模糊性”關聯(lián)關系,其真實性則可以被劃分為大數(shù)據(jù)真實(海量基礎數(shù)據(jù)的原始性)、大數(shù)據(jù)載體和介質真實、大數(shù)據(jù)方法真實(運用大數(shù)據(jù)進行分析和預測的方法可靠性)和大數(shù)據(jù)內容真實(大數(shù)據(jù)證據(jù)蘊含的信息與案件事實具有關聯(lián)性)四個方面。[11]還有學者指出,在理論上,修改后的《刑事訴訟法》采用證據(jù)概念材料說,放寬了對證據(jù)資格的限制;在實踐中,交通事故責任認定書、未成年人犯罪社會調查報告等,都不是法定證據(jù)種類,但是可以作為定罪量刑的證據(jù),因此大數(shù)據(jù)分析報告的證據(jù)資格應當?shù)玫娇隙?。[12]
大數(shù)據(jù)證據(jù)在實務中嶄露頭角,是一種正在越來越被廣泛應用的案件偵辦方法和證明材料,在民事、行政、刑事案件中已經(jīng)作為證據(jù)材料出現(xiàn)。然而,大數(shù)據(jù)證據(jù)的定義仍較為模糊。從基礎的大數(shù)據(jù)技術定義來看,人們常用大數(shù)據(jù)的四個特點(4V)來回答“什么是大數(shù)據(jù)”的問題,包括數(shù)據(jù)量大、數(shù)據(jù)類型繁多、處理速度快和價值密度低。[13]有法學學者從語義學、邏輯學角度對大數(shù)據(jù)進行了界定,認為“大數(shù)據(jù)是一種以數(shù)據(jù)技術為引領的創(chuàng)造應用價值的方式、方法,其本質仍是一種方法論概念”[14]。但是從大數(shù)據(jù)技術到大數(shù)據(jù)證據(jù),需要經(jīng)過數(shù)據(jù)匯總和清洗、構建分析模型、形成分析報告等步驟,兩者不能等同。
明確大數(shù)據(jù)證據(jù)的含義,是分析其形式、論證其類型的基礎。作為一項新型證據(jù),學界和實務界對大數(shù)據(jù)證據(jù)的定義尚未達成共識,易造成研究的不便與誤解。一種較普遍的觀點是將大數(shù)據(jù)證據(jù)限定為“基于海量電子數(shù)據(jù)形成的分析結果或報告”,[15]也就是以大數(shù)據(jù)分析報告為核心的定義方法。劉品新在這一定義中指出,海量基礎數(shù)據(jù)是“源”,分析結果或報告是“果”,“果”往往起到直接證明作用;[16]又如張建偉主張將大數(shù)據(jù)分析報告“單列出來作為單獨的證據(jù)種類”,而將海量基礎數(shù)據(jù)納入電子數(shù)據(jù);[17]再如劉廣三提出,可以把大數(shù)據(jù)分析報告納入司法鑒定范疇,將其視作檢驗報告。[18](11)此處劉廣三教授觀點的法律依據(jù)為《最高人民法院關于適用<中華人民共和國刑事訴訟法>的解釋》第87條,對案件中的專門性問題需要鑒定,但沒有法定司法鑒定機構,或者法律、司法解釋規(guī)定可以進行檢驗的,可以指派、聘請有專門知識的人進行檢驗,檢驗報告可以作為定罪量刑的依據(jù)。然而,這種定義方法的缺陷也是顯見的,即弱化了海量基礎數(shù)據(jù)和算法的重要性,盡管有利于司法效率的提升,卻容易使裁判落入“算法黑箱”的困境和危險。與學術界截然不同的是,司法實踐中有許多將大數(shù)據(jù)證據(jù)作為電子數(shù)據(jù)的做法,[19]同樣是片面強調了大數(shù)據(jù)材料的“部分”。
另一些學者對大數(shù)據(jù)證據(jù)的外延提出更具整體性的理解方式。徐慧認為,大數(shù)據(jù)證據(jù)是“將大數(shù)據(jù)技術、方法、思維等方式、方法用來證明案件事實或者預測案件所得出的一切材料”,其外延包括了案件的全數(shù)據(jù),處理非結構化數(shù)據(jù)的大數(shù)據(jù)技術說明材料,大數(shù)據(jù)分析技術運用合理性說明材料,有關案件真實性、關聯(lián)性、合法性的分析說明,以及對案件預測結果等內容的說明材料等。[20]
爭論過后,不妨將視線歸于最初的大數(shù)據(jù)技術本身。王燃指出,大數(shù)據(jù)包括海量數(shù)據(jù)集、數(shù)據(jù)分析技術以及大數(shù)據(jù)分析結果這三層含義。這一觀點一針見血地指出了大數(shù)據(jù)證據(jù)在形式上的鮮明特征,即由海量數(shù)據(jù)集、數(shù)據(jù)分析技術和大數(shù)據(jù)分析結果這三部分構成。本文贊成這一觀點,以大數(shù)據(jù)證據(jù)外延的整體性理解為基礎,將大數(shù)據(jù)證據(jù)定義為以大數(shù)據(jù)方法證明案件事實或者預測案件得出的材料,它在形式上主要包括海量基礎數(shù)據(jù)、大數(shù)據(jù)分析技術和大數(shù)據(jù)分析結果三個部分,形成“三位一體”的構造邏輯。
大數(shù)據(jù)證據(jù)的證據(jù)種類眾說紛紜,在學術界尚未形成統(tǒng)一意見。對于大數(shù)據(jù)證據(jù)的證據(jù)種類,有電子數(shù)據(jù)說、視聽資料說、書證說、獨立證據(jù)說等觀點。
1.大數(shù)據(jù)證據(jù)定義影響對其種類的判斷
討論大數(shù)據(jù)證據(jù)的種類時,必須首先明確如何定義大數(shù)據(jù)證據(jù)。因此大數(shù)據(jù)證據(jù)定義成為了大數(shù)據(jù)證據(jù)種類的前置問題。
一些學者主張,將大數(shù)據(jù)證據(jù)視為一種獨立的證據(jù)種類較為妥當。如徐慧認為,大數(shù)據(jù)證據(jù)不屬于電子數(shù)據(jù),也不符合司法鑒定范疇,是一種新的復合型證據(jù),應當被視為獨立的證據(jù)種類。[21]也有學者認為,大數(shù)據(jù)分析報告或者海量基礎數(shù)據(jù),已經(jīng)足以反映大數(shù)據(jù)證據(jù)的本質特征,它們本身就是一項單獨的“大數(shù)據(jù)證據(jù)”。如張建偉提出,在未來的證據(jù)法中,大數(shù)據(jù)分析報告有必要成為一種獨立的證據(jù)種類,而與案件有關的基礎數(shù)據(jù)可以被納入“電子數(shù)據(jù)”這一法定證據(jù)種類。又如劉廣三主張,可以將大數(shù)據(jù)分析納入司法鑒定范疇。[22]
通過文獻梳理發(fā)現(xiàn),學界對大數(shù)據(jù)證據(jù)的理解偏向于以大數(shù)據(jù)技術分析報告為核心,主張將其歸于鑒定意見或者書證。然而,這種側重與刑事司法實踐存在一定出入。徐慧對145個應用到了大數(shù)據(jù)材料的刑事案件進行分析,發(fā)現(xiàn)其中大數(shù)據(jù)證據(jù)以電子數(shù)據(jù)的形式出現(xiàn)的案件占比高達66%,而將大數(shù)據(jù)證據(jù)作為案件線索、偵查方法的案件占比21%,作為書證應用的案件占比11%,僅有2%的案件將大數(shù)據(jù)證據(jù)作為鑒定意見應用。[23]該組數(shù)據(jù)說明,刑事司法實踐中對大數(shù)據(jù)證據(jù)的理解,更傾向于將海量數(shù)據(jù)作為核心,而不是將其理解為以分析報告為核心的書證或者鑒定意見。
2.大數(shù)據(jù)證據(jù)的電子數(shù)據(jù)說
大數(shù)據(jù)證據(jù)和電子數(shù)據(jù)之間存在著天然的聯(lián)系,尤其是電子數(shù)據(jù)與大數(shù)據(jù)證據(jù)的海量基礎數(shù)據(jù)部分。根據(jù)《最高人民法院關于適用<中華人民共和國民事訴訟法>的解釋》,電子數(shù)據(jù)是指通過電子郵件、電子數(shù)據(jù)交換、網(wǎng)上聊天記錄、博客、微博客、手機短信、電子簽名、域名等形成或者存儲在電子介質中的信息。最高人民法院、最高人民檢察院和公安部《關于辦理刑事案件收集提取和審查判斷電子數(shù)據(jù)若干問題的規(guī)定》則指出,電子數(shù)據(jù)是案件發(fā)生過程中形成的,以數(shù)字化形式存儲、處理、傳輸?shù)?,能夠證明案件事實的數(shù)據(jù)。而《互聯(lián)網(wǎng)信息內容管理行政執(zhí)法程序規(guī)定》中指出,電子數(shù)據(jù)是指案件發(fā)生過程中形成的,以數(shù)字化形式存儲、處理、傳輸?shù)?,能夠證明案件事實的數(shù)據(jù),包括但不限于網(wǎng)頁、博客、微博客、即時通信工具、論壇、貼吧、網(wǎng)盤、電子郵件、網(wǎng)絡后臺等方式承載的電子信息或文件。不論是民事、刑事還是行政立法,在定義上都強調了電子數(shù)據(jù)的數(shù)字化形式和承載方式,而且從規(guī)范列舉的表現(xiàn)形式看,一般人能夠直接從電子數(shù)據(jù)中獲取與案件有關的信息。
單從定義上,電子數(shù)據(jù)和大數(shù)據(jù)證據(jù)的基礎數(shù)據(jù)似乎具有高度相似性,它們都是基于計算機應用等電子化技術手段形成的客觀資料,包括文字、圖形符號、數(shù)字、字母等多種形式。有學者就提出在未來的證據(jù)法里,“可以將大數(shù)據(jù)中與案件相關的數(shù)據(jù)信息”納入電子數(shù)據(jù)范疇。[24]但是大數(shù)據(jù)證據(jù)的海量基礎數(shù)據(jù)具有明顯區(qū)別于電子數(shù)據(jù)的特征,主要在三個方面:一是海量基礎數(shù)據(jù)的數(shù)據(jù)總量遠大于傳統(tǒng)的電子數(shù)據(jù);二是海量基礎數(shù)據(jù)具有非結構化特征,其數(shù)據(jù)格式是紛雜、無法被直接分析利用的,需要經(jīng)過數(shù)據(jù)清洗;三是海量基礎數(shù)據(jù)的價值密度低,無法像一般電子數(shù)據(jù)那樣直接證明案件事實,而是需要通過大數(shù)據(jù)分析技術得出結論,從而與案件事實產(chǎn)生聯(lián)系。
除了將大數(shù)據(jù)基礎數(shù)據(jù)作為電子數(shù)據(jù)的學術意見,法律實踐中還有將大數(shù)據(jù)證據(jù)整體直接認定為電子數(shù)據(jù)的做法,[25]反映了實務界以海量基礎數(shù)據(jù)為核心的大數(shù)據(jù)證據(jù)觀。但是這種視角忽視了大數(shù)據(jù)分析技術、大數(shù)據(jù)鑒定程序的重要性,存在一定缺陷。
3.大數(shù)據(jù)證據(jù)的鑒定意見說
鑒定意見是指鑒定機構的鑒定人對案件中的專門性問題所出具的專門性意見。有學者在討論資金大數(shù)據(jù)分析時指出,將大數(shù)據(jù)證據(jù)納入司法鑒定范疇,“有利于司法實踐的展開,在法律上也可以找到依據(jù)”[26]。根據(jù)《人民檢察院電子證據(jù)鑒定程序規(guī)則(試行)》,電子證據(jù)是指由電子信息技術應用而出現(xiàn)的各種能夠證明案件真實情況的材料及其派生物,其鑒定范圍包括對各類存儲數(shù)據(jù)內容的認定。大數(shù)據(jù)技術是電子信息技術發(fā)展的產(chǎn)物,如果將大數(shù)據(jù)證據(jù)的海量基礎數(shù)據(jù)看作“存儲數(shù)據(jù)”,大數(shù)據(jù)分析技術和分析結果看作是對海量基礎數(shù)據(jù)的鑒定,大數(shù)據(jù)證據(jù)在形式上便符合鑒定意見的要件。
反對者則指出,將大數(shù)據(jù)證據(jù)納入司法鑒定范疇并不妥當,理由集中在三個方面:其一,該做法沒有明確的法律依據(jù),公安部《公安機關鑒定規(guī)則》、司法部《司法鑒定執(zhí)業(yè)分類規(guī)定(試行)》、最高人民檢察院《人民檢察院鑒定規(guī)則(試行)》等均未將大數(shù)據(jù)證據(jù)納入司法鑒定的業(yè)務范圍。其二,該做法在鑒定方法上存有障礙,大數(shù)據(jù)證據(jù)的鑒定方法與現(xiàn)有規(guī)范不符。目前的大數(shù)據(jù)證據(jù)鑒定意見書常顯示根據(jù)《電子物證數(shù)據(jù)搜索檢驗技術規(guī)范》《數(shù)字化設備證據(jù)數(shù)據(jù)發(fā)現(xiàn)提取固定方法》進行鑒定,但事實上大數(shù)據(jù)證據(jù)檢驗過程涉及的技術范圍卻遠比這兩種方法要廣。其三,兩者的鑒定主體存在差異,傳統(tǒng)的鑒定主體是鑒定人,大數(shù)據(jù)證據(jù)卻很大程度上由機器進行判斷。[27]
研究大數(shù)據(jù)證據(jù)的種類問題,首先要明確其定義。大數(shù)據(jù)證據(jù)的定義在學術和實務中都充滿爭議,在順應法律實踐的基礎上,還需要考慮技術需求。本文從技術出發(fā),在梳理案例和學術研究的基礎上,提出了“三位一體”的大數(shù)據(jù)證據(jù)定義方法,以期符合實踐中的普遍情況,也適應大數(shù)據(jù)技術的特征。此外,以對不同部分的側重為標準,可以將大數(shù)據(jù)證據(jù)分為三種具體類型。
實踐中,法官常將海量基礎數(shù)據(jù)作為電子數(shù)據(jù),將符合形式要件的大數(shù)據(jù)分析報告作為鑒定意見或者書證;研究中,一些學者主張將大數(shù)據(jù)證據(jù)歸于鑒定意見。這些做法都是在將大數(shù)據(jù)證據(jù)的“部分”作為大數(shù)據(jù)證據(jù),或許是不太恰當?shù)?。海量基礎數(shù)據(jù)、大數(shù)據(jù)分析技術和大數(shù)據(jù)分析報告分別具有相對完整的、獨立的外在表現(xiàn)形式。海量基礎數(shù)據(jù)通過分布式存儲技術得以保存,以數(shù)據(jù)的形式存在,大數(shù)據(jù)分析技術常表現(xiàn)為算法,大數(shù)據(jù)分析報告表現(xiàn)為公證書、鑒定意見或者情況說明,都是相對獨立、完整的。但是,三者又緊密聯(lián)系,互為補充,形成“三位一體”的構造。大數(shù)據(jù)證據(jù)是指由海量基礎數(shù)據(jù)、大數(shù)據(jù)分析技術、大數(shù)據(jù)分析結果三個部分組成,它們相互聯(lián)系、互相依賴,共同在案件中作為一個證據(jù)呈現(xiàn)。
從另一個角度看,大數(shù)據(jù)證據(jù)以三個部分的不同側重,可以分為三種具體類型:第一種是以海量基礎數(shù)據(jù)為核心的大數(shù)據(jù)證據(jù),在實踐中常表現(xiàn)為電子數(shù)據(jù);第二種是以大數(shù)據(jù)分析技術為核心的大數(shù)據(jù)證據(jù),如表2第2號案例中被告出具的鑒定意見,被用來證明淘寶客反作弊系統(tǒng)異常檢測方法的科學性、合理性;第三種是以大數(shù)據(jù)分析結果為核心的大數(shù)據(jù)證據(jù),如實踐中較為常見的警務大數(shù)據(jù)平臺查詢結果。
1.海量基礎數(shù)據(jù)
海量基礎數(shù)據(jù)是大數(shù)據(jù)分析的基礎,同時具有數(shù)據(jù)量極其龐大、價值密度低、全樣本的顯著特點,以至于它無法單獨被理解,直接呈現(xiàn)在法庭上,而是需要經(jīng)過專業(yè)的數(shù)據(jù)清洗、分析處理才能被加以利用。但是如果將它排除在大數(shù)據(jù)證據(jù)的定義之外,就意味著一份大數(shù)據(jù)證據(jù)可以不包括分析對象,這將對大數(shù)據(jù)證據(jù)的真實性、關聯(lián)性造成減損。大數(shù)據(jù)證據(jù)本就具有“弱相關性”的特征,其解讀方法在很大程度上影響著分析結果,因此明確基礎數(shù)據(jù)屬于大數(shù)據(jù)證據(jù),為質證中運用多種大數(shù)據(jù)分析技術驗證分析結論提供了必要條件。同時,海量基礎數(shù)據(jù)的真實性是大數(shù)據(jù)證據(jù)真實性的前提,雖然海量基礎數(shù)據(jù)的證明能力弱,卻是大數(shù)據(jù)證據(jù)中不可或缺的一部分。
需要注意的是,海量基礎數(shù)據(jù)不僅數(shù)據(jù)量巨大,還具有非結構化的特點。這意味著大數(shù)據(jù)證據(jù)的基礎數(shù)據(jù)沒有高度組織和整齊格式化特征,可能體現(xiàn)為圖片、音頻、視頻等,如社交媒體數(shù)據(jù),通訊數(shù)據(jù)等,它們不方便管理、分析和利用,需要經(jīng)過數(shù)據(jù)清洗才能被有效分析。當然,大數(shù)據(jù)證據(jù)的海量基礎數(shù)據(jù)也包括結構化數(shù)據(jù),但非結構化數(shù)據(jù)構成了網(wǎng)絡上絕大多數(shù)可用數(shù)據(jù),在社交媒體、短視頻平臺興起的背景下更是如此,非結構化數(shù)據(jù)中蘊含的巨大價值在大數(shù)據(jù)證據(jù)研究里不可忽視。因此,筆者主張對大數(shù)據(jù)證據(jù)的格式不宜作過高要求,否則或將違背引入大數(shù)據(jù)證據(jù)的初衷。
如果將海量基礎數(shù)據(jù)作為大數(shù)據(jù)證據(jù)中的一個部分,隨之而來的難題就是其舉示的方法。大數(shù)據(jù)以分布式存儲為關鍵技術之一,分析超越人類理解范圍的龐大數(shù)據(jù)量。作為折中的處理方法,或許可以要求舉示大數(shù)據(jù)證據(jù)的一方,同時開放案件有關的數(shù)據(jù)庫的訪問權限,以便法院和訴訟相對方進行質證。
2.大數(shù)據(jù)分析技術
大數(shù)據(jù)分析技術是指分析海量數(shù)據(jù)從而提取有效信息的技術。從宏觀上看,包括數(shù)據(jù)搜索、數(shù)據(jù)碰撞、數(shù)據(jù)挖掘、數(shù)據(jù)畫像、犯罪網(wǎng)絡分析等方法;[28]從微觀上看,指具體用于分析數(shù)據(jù)的邏輯指令,即算法。算法的定義尚缺乏共識,可指一系列解決問題的邏輯指令,是處理數(shù)據(jù)的方式,同時它本身也以數(shù)據(jù)的形式呈現(xiàn)。如果說基礎數(shù)據(jù)是思考的材料,那么數(shù)據(jù)分析技術就是思考的方法。在大數(shù)據(jù)證據(jù)的語境下,數(shù)據(jù)分析技術是具體的、具有針對性的,因此也可以理解為算法。算法作為證據(jù),具有高度的專業(yè)壁壘,和數(shù)據(jù)不同,它的邏輯性較強,理解起來需要更高的專業(yè)知識。
將算法作為一個必要的部分納入大數(shù)據(jù)證據(jù),用意在于強調算法的重要性,也是基于正當程序的要求。[29]比如目前各個城市有不同的個人信用評分系統(tǒng),如杭州的“錢江分”,蘇州的“桂花分”,廈門的“白鷺分”等,它們的算法設計,卻多不公開。以福州市為例,《福州市個人信用積分(茉莉分)管理暫行辦法》第12條規(guī)定:“個人信用積分和信用等級由市公共信用信息平臺根據(jù)歸集的個人公共信用信息自動計算生成,每月15日更新?!盵30]也就是說,在“自動化行政”中,算法成為了一個決策的“黑箱”,政府沒有對形成個人信用評分的算法進行說明,違反了說明理由制度。而后續(xù)如果出現(xiàn)針對這種“自動化行政”的訴訟,需要對政府形成個人信用評分的行政行為進行審查,算法將作為一種證據(jù)呈現(xiàn)在法庭上。算法如何定性,如何審查,本身就是一個值得思考的問題。
這個問題是大數(shù)據(jù)證據(jù)的關鍵問題之一。一些學者提出海量基礎數(shù)據(jù)屬于“電子數(shù)據(jù)”這一類型,一些學者提出分析報告屬于鑒定意見,卻沒有出現(xiàn)“計算模型屬于法定證據(jù)類型”的主張。一方面,算法作為海量基礎數(shù)據(jù)的分析技術,通過分析基礎數(shù)據(jù)體現(xiàn)自身作用,似乎確實沒有成為核心的必要;但是另一方面,算法在大數(shù)據(jù)技術中具有重要的作用,以不同的方法對數(shù)據(jù)進行處理,甚至會得出具有差異性的結論。在司法實踐中,已經(jīng)出現(xiàn)了以鑒定意見來證明大數(shù)據(jù)分析技術科學合理性的做法,且得到法院支持(12)參見許有發(fā)與淘寶(中國)軟件有限公司、杭州阿里科技有限公司網(wǎng)絡服務合同糾紛案,杭州市余杭區(qū)人民法院民事判決書(2014)杭余民初字第3號。本案中,被告舉示上海東方計算機司法鑒定所出具的司法鑒定意見書1份,鑒定結論指出:“系統(tǒng)所使用的異常檢測方法是建立在大規(guī)模數(shù)據(jù)分布式計算基礎之上的,有成熟的概率學理論作為支撐,通過該方法檢測異常淘寶客并判定其推廣行為為不正當推廣行為,是科學合理的?!狈ㄔ涸谑聦嵳J定部分引用了以上鑒定結論,并在判決中對被告訴求予以支持。。
3.大數(shù)據(jù)分析結果
大數(shù)據(jù)分析結果,常呈現(xiàn)為分析、說明報告,或是鑒定結論。它不僅指最后的大數(shù)據(jù)分析報告,還包括了過程中的技術說明,如對于非結構化數(shù)據(jù)處理采用大數(shù)據(jù)技術的說明材料,對于大數(shù)據(jù)分析技術合理性的說明材料,以及大數(shù)據(jù)證據(jù)和案件之間關聯(lián)性、合理性、真實性的說明材料,對案件預測結果的說明材料等。實務中,大數(shù)據(jù)證據(jù)常被定義為電子數(shù)據(jù),這樣的做法雖然使大數(shù)據(jù)證據(jù)的運用有法可依,但是忽略了算法的重要性,而且難以適應大數(shù)據(jù)證據(jù)弱關聯(lián)性的特征。將分析和說明報告作為大數(shù)據(jù)證據(jù)的形式要件,一方面對舉證方提出了說明算法合理性的要求,另一方面有利于訴訟參與人理解大數(shù)據(jù)證據(jù),對于避開“算法黑箱”,降低大數(shù)據(jù)證據(jù)運用的專業(yè)壁壘,具有積極意義。
以“三位一體”的大數(shù)據(jù)證據(jù)定義方法審視表1中的案件,除了第14號案例以外,其余案例中的大數(shù)據(jù)證據(jù)均可以找到對應的基礎數(shù)據(jù)、分析技術和分析結果,說明該定義方法能夠較好地回應實踐需求。反過來說,14號案例中的大數(shù)據(jù)證據(jù)在形式上只包含了分析結果,材料的證明能力存在較大風險。
大數(shù)據(jù)證據(jù)的獨立種類在理論上是成立的,因為大數(shù)據(jù)證據(jù)區(qū)別于目前的法定證據(jù)種類,同時具有區(qū)別于傳統(tǒng)證據(jù)的明顯特征。但是科技發(fā)展如流水奔騰浩浩蕩蕩,大數(shù)據(jù)證據(jù)只是新技術證據(jù)的一個部分,將來或許還會出現(xiàn)人工智能證據(jù)等新技術證據(jù)。由于技術發(fā)展的急速性,是否需要從法律上將大數(shù)據(jù)證據(jù)單列出來作為獨立證據(jù)種類,是一個值得商榷的問題?;蛟S可以考慮從更高層面進行規(guī)范建構,將新技術證據(jù)作為法定證據(jù)種類。
綜觀學術觀點和實踐做法,將大數(shù)據(jù)證據(jù)歸于鑒定意見或者電子數(shù)據(jù)是較為主流的兩種觀點。將大數(shù)據(jù)證據(jù)歸于鑒定意見,只能部分反映大數(shù)據(jù)證據(jù)的形式特征,其法律依據(jù)較為牽強。如果根據(jù)《人民檢察院電子證據(jù)鑒定程序規(guī)則(試行)》,將大數(shù)據(jù)證據(jù)視作電子證據(jù)的鑒定意見,就等于是將海量基礎數(shù)據(jù)視作電子數(shù)據(jù)。(13)參見《人民檢察院電子證據(jù)鑒定程序規(guī)則(試行)》第2條、第4條。但大數(shù)據(jù)技術中的海量基礎數(shù)據(jù)具有數(shù)據(jù)量巨大、價值密度低的特點,與電子數(shù)據(jù)一般能直接證明案件事實的情況存在較大差異。而且,電子數(shù)據(jù)鑒定限于對基礎數(shù)據(jù)本身的鑒定,但大數(shù)據(jù)證據(jù)的意思表達高度依賴算法,不同的算法直接影響著大數(shù)據(jù)證據(jù)表達的意思。
將大數(shù)據(jù)證據(jù)納入司法鑒定,也未必能回應實踐需求。實踐中的大數(shù)據(jù)證據(jù)形式多樣,一些大數(shù)據(jù)平臺本身就具有較高的公信力,一味要求對大數(shù)據(jù)證據(jù)進行鑒定,或將浪費司法資源。如公安大數(shù)據(jù)平臺,社保大數(shù)據(jù)平臺等平臺形成的大數(shù)據(jù)材料,以及“淘寶指數(shù)”“百度指數(shù)”等大數(shù)據(jù)企業(yè)產(chǎn)品,由于有政府公信力或者較好的企業(yè)商譽進行背書,即便不進行司法鑒定,也具有很強的證明力。因此,將大數(shù)據(jù)證據(jù)歸于鑒定意見,將對其審查程序提出更高的要求,提高了訴訟參與人的成本,也提高了司法機構的成本。
大數(shù)據(jù)證據(jù)與電子數(shù)據(jù)同樣有明顯的區(qū)別。其一,從技術角度看,電子數(shù)據(jù)和大數(shù)據(jù)證據(jù)的分析對象和方法不同。電子數(shù)據(jù)注重簡單、結構數(shù)據(jù)的分析,而大數(shù)據(jù)證據(jù)更注重對非結構數(shù)據(jù)的分析,更關注算法的運用。其二,從證據(jù)屬性看,電子數(shù)據(jù)與大數(shù)據(jù)證據(jù)在關聯(lián)性上存在顯著差異。電子數(shù)據(jù)與案件事實之間的聯(lián)系較為直接,側重數(shù)據(jù)與案件之間的因果關系;而大數(shù)據(jù)證據(jù)由于大數(shù)據(jù)技術注重相關關系的特點,側重數(shù)據(jù)與案件之間的“弱關聯(lián)性”[31]。其三,電子數(shù)據(jù)和大數(shù)據(jù)證據(jù)的物理形態(tài)有顯著區(qū)別。電子數(shù)據(jù)完全存在于虛擬空間,大數(shù)據(jù)證據(jù)則具有虛實結合的特征。大數(shù)據(jù)證據(jù)被利用,需要通過分析報告的形式,分析報告是存在于現(xiàn)實空間的。另外,電子數(shù)據(jù)是一種靜態(tài)的證據(jù)類型,大數(shù)據(jù)則是動態(tài)變化的。其四,電子數(shù)據(jù)一般反映已經(jīng)發(fā)生的案件,而大數(shù)據(jù)證據(jù)還被用于預測即將可能發(fā)生的案件。[32]
大數(shù)據(jù)證據(jù)在內容和載體上都區(qū)別于傳統(tǒng)證據(jù),是其構成獨立證據(jù)類型的根本邏輯。徐慧等學者在嚴密論證大數(shù)據(jù)證據(jù)預防性、相關性、真實性價值的基礎上,基于行為規(guī)律理論、證明標準的差異化理論、概率和博弈理論論證了大數(shù)據(jù)證據(jù)的科學合理性,指出大數(shù)據(jù)證據(jù)以“整體性”和“重方法”為特征,作為獨立證據(jù)種類具有可行性。[33]在此基礎上,可以進一步將大數(shù)據(jù)證據(jù)的特征明確為“三位一體”“算法黑箱”“專業(yè)壁壘”“弱關聯(lián)性”的內容結構特征,和“虛實結合”的空間模式特征。
在內容上,大數(shù)據(jù)證據(jù)區(qū)別于其他證據(jù)種類的特征有四:一是“三位一體”,即海量數(shù)據(jù)、分析技術和分析報告是相互區(qū)別和聯(lián)系的統(tǒng)一整體。一方面,海量數(shù)據(jù)、分析技術和分析報告相互獨立,有不同的載體和表現(xiàn)形式;另一方面,它們又相互依賴,海量數(shù)據(jù)是真實性的保障,分析技術是提取證據(jù)的基礎,分析報告是對數(shù)據(jù)語言的解讀和翻譯,三者聯(lián)系成為統(tǒng)一的整體。二是“算法黑箱”,即算法具有相對獨立性和高度重要性,同樣的一份基礎數(shù)據(jù)可能因為不同的分析技術得出不同的結果。三是“專業(yè)壁壘”,即大數(shù)據(jù)證據(jù)的解讀高度依賴分析報告,一般人無法通過觀察海量數(shù)據(jù)和算法理解大數(shù)據(jù)證據(jù)。四是“弱關聯(lián)性”,即大數(shù)據(jù)證據(jù)與案件事實的關聯(lián)性較弱,常表現(xiàn)為相關關系而非因果關系。
在載體上,大數(shù)據(jù)證據(jù)具有虛實結合的特征。第一,基于大數(shù)據(jù)的分布式存儲技術,海量基礎數(shù)據(jù)的載體一般是云存儲裝置,由于其高度分散,在物理上難以呈現(xiàn)于法庭,從而具有最高的虛擬性。第二,大數(shù)據(jù)證據(jù)的分析技術部分與電子數(shù)據(jù)相似,能夠以靜態(tài)數(shù)據(jù)的形式呈現(xiàn),其存儲也具有物理空間上的虛擬性,但是不具有分布式存儲的特征,因此分析技術部分的虛擬特征較海量數(shù)據(jù)部分弱。第三,分析報告部分通過文字形式表達意思,它的實在性較前兩者強,虛擬空間性最弱。從海量基礎數(shù)據(jù),到分析技術,再到分析報告,它們載體的虛擬性依次遞減,實在性依次遞增。因此從整體上看,大數(shù)據(jù)證據(jù)的載體呈現(xiàn)出虛實結合的特點。
司法實務中大數(shù)據(jù)證據(jù)的豐富形式、不一的認定方法,說明實踐對大數(shù)據(jù)證據(jù)有關立法的需求正在顯現(xiàn)。在對大數(shù)據(jù)證據(jù)作出定義、認定種類之后,還有一系列相關的問題,如大數(shù)據(jù)證據(jù)的取證、舉證、質證和認證等,需要作出回應。這是否意味著未來的證據(jù)法學需要將大數(shù)據(jù)證據(jù)作為一項獨立證據(jù)種類?或許不然。一方面,從實證研究結果來看,雖然大數(shù)據(jù)證據(jù)有擴張使用的趨勢,但目前司法實踐對大數(shù)據(jù)證據(jù)的使用范圍并不大,且大數(shù)據(jù)證據(jù)囿于本身“相關而非因果”的弱關聯(lián)性特征,作為定案證據(jù)具有較大風險,因此其證據(jù)價值要打一些折扣。另一方面,大數(shù)據(jù)證據(jù)是大數(shù)據(jù)技術發(fā)展產(chǎn)生的一種新型證據(jù),在新技術快速發(fā)展應用的背景下,每種新技術形成的證據(jù)都可以有其區(qū)別于傳統(tǒng)證據(jù)和既有證據(jù)種類的特殊之處,越來越多新型證據(jù)的出現(xiàn)是必然的,如區(qū)塊鏈證據(jù)、人工智能證據(jù)等。如果為每種新型證據(jù)立法,或將使實踐失于疲乏。因此,可以考慮以“三位一體”的形式要件、重分析技術和重整體性的內容要件等為標準,構建新信息技術證據(jù)種類,以更長遠、開放的視角應對新技術發(fā)展背景下的證據(jù)法問題。
為了應對目前實踐中應用大數(shù)據(jù)證據(jù)時出現(xiàn)的混亂,可以通過司法解釋等規(guī)范形式,在明確“三位一體”整體定義的基礎之上,將大數(shù)據(jù)證據(jù)的海量基礎數(shù)據(jù)和分析技術部分參照電子數(shù)據(jù),將大數(shù)據(jù)分析結果部分參照鑒定意見或書證,進行規(guī)范的提取、審查和認定,以充分發(fā)揮大數(shù)據(jù)證據(jù)的作用。
大數(shù)據(jù)證據(jù)作為信息化浪潮的產(chǎn)物之一,已經(jīng)悄然在司法舞臺上登場,顯示出了在案件偵破、犯罪預測等方面的重要作用。大數(shù)據(jù)證據(jù)的“三位一體”定義是解決其獨立種類問題的前置研究,也是大數(shù)據(jù)證據(jù)的基礎問題之一。同時,“三位一體”定義也可能帶來一些弊端,比如給大數(shù)據(jù)證據(jù)審查增加復雜性,加劇庭審中兩造力量的不對等。使用大數(shù)據(jù)證據(jù)進行庭審攻防,本就對法律和計算機領域的專業(yè)性都有較高要求,如果再按照本文的“三位一體”定義標準,在法庭上使用大數(shù)據(jù)證據(jù),或將需要分別對海量基礎數(shù)據(jù)、分析技術和分析報告進行舉證質證。這除了對法律專業(yè)知識的要求,還需要訴訟參與人具備一定的計算機知識,對于大多數(shù)人來說,進一步提高了參與訴訟的難度。為了兼顧司法的公平和效率,或許可以簡化一些較為可靠的基礎數(shù)據(jù)、算法模型的審查和認定,如政府的大數(shù)據(jù)平臺、具有較好商譽的互聯(lián)網(wǎng)大數(shù)據(jù)平臺。