摘? ? ? 要:司法活動正邁向數(shù)據(jù)化,傳統(tǒng)的證據(jù)和證明活動已難以滿足現(xiàn)實需要,利用大數(shù)據(jù)技術(shù)得到的大數(shù)據(jù)證據(jù)成為破解困境的關(guān)鍵。從犯罪的新變化、證明難度以及印證證明上看,大數(shù)據(jù)證據(jù)有著獨特價值,其所具有的雙重相關(guān)性有利于實現(xiàn)從“因果關(guān)系”到“相關(guān)關(guān)系”的跨越。鑒于我國要求證據(jù)形式法定,在審查判斷規(guī)則的適用中將大數(shù)據(jù)證據(jù)歸入鑒定意見為宜。大數(shù)據(jù)證據(jù)可信性規(guī)則的建構(gòu),應(yīng)從兩方面展開,即基礎(chǔ)數(shù)據(jù)的宏觀整體真實規(guī)則和技術(shù)方法的有效質(zhì)證規(guī)則以及最佳技術(shù)方法。
關(guān)? 鍵? 詞:價值增值;相關(guān)關(guān)系;有效質(zhì)證;證據(jù)形式
中圖分類號:D925.2? ? ? ? 文獻標志碼:A? ? ? ? 文章編號:1007-8207(2022)03-0081-10
收稿日期:2021-05-20
作者簡介:洪濤,遼寧大學(xué)法學(xué)院訴訟法學(xué)專業(yè)碩士研究生,研究方向為刑事訴訟法學(xué)。
一、問題的提出
大數(shù)據(jù)開啟了一次重大的時代轉(zhuǎn)型,改變著人們的生活以及理解世界的方式,其已成為新發(fā)明和新服務(wù)的源泉,更多的改變正蓄勢待發(fā)。[1]在司法領(lǐng)域,智慧法庭、電子數(shù)據(jù)、智能機器人犯罪等高新科技也促使著法律和法學(xué)家們不斷做出改變。微觀到證據(jù)法方面,如今電子數(shù)據(jù)已成為我國的法定證據(jù)種類之一,是證據(jù)法學(xué)者們討論和爭議的熱點。然而,針對基于海量電子數(shù)據(jù)的大數(shù)據(jù)證據(jù),學(xué)界的討論明顯不足?,F(xiàn)實生活中,很多案件都需要運用大數(shù)據(jù)技術(shù),如甘肅蘭州特大“套路貸”一案,涉嫌非法放貸APP和網(wǎng)站1317個、貸款合同336萬余份(主要是電子合同)、涉案金額達到89.6億元、受害者多達39萬余人、更有89人因逼債催收自殺身亡。如此龐大的數(shù)據(jù),如果不借助大數(shù)據(jù)技術(shù)進行分析,不僅難以認定犯罪嫌疑人之間的層級關(guān)系,準確識別出案件的主犯和從犯,亦有可能對部分資金重復(fù)評價,違背罪責(zé)刑相一致原則,損害犯罪嫌疑人、被告人的合法權(quán)益。司法實踐中,運用大數(shù)據(jù)分析技術(shù)得到的信息能否視為證據(jù)、屬于什么類型的證據(jù)尚不明晰。以傳銷犯罪為例,山東某法院引用了運用大數(shù)據(jù)分析技術(shù)得到的會員信息,卻沒有明確其屬性①;吉林省某法院將利用大數(shù)據(jù)得到的下線人數(shù)、下限層數(shù)等信息列入到書證之中②;湖南省某法院則將運用大數(shù)據(jù)技術(shù)提取到的信息列為鑒定意見③。
實際上,大數(shù)據(jù)證據(jù)對司法證明活動有自身的獨特價值。一方面,大數(shù)據(jù)證據(jù)符合降低證明難度的趨勢。證據(jù)是司法活動的根基,但復(fù)雜的現(xiàn)實情況和人類認知能力決定了證據(jù)資源短缺是司法活動的永恒規(guī)律。大數(shù)據(jù)證據(jù)著眼于相關(guān)關(guān)系,通過對海量數(shù)據(jù)的分析,找到潛在的有用信息,為證明案件事實提供了幫助,超越了以往的因果關(guān)系視閾;另一方面,大數(shù)據(jù)證據(jù)能更好地發(fā)揮印證證明的作用。傳統(tǒng)證據(jù)主要具體反映案件的人、物、事、時等,而大數(shù)據(jù)證據(jù)不同,通過數(shù)據(jù)挖掘、數(shù)據(jù)對比等大數(shù)據(jù)技術(shù),電子數(shù)據(jù)的系統(tǒng)特征被發(fā)揮到極致,從而能夠從整體反映案件事實。大數(shù)據(jù)證據(jù)和印證證明天然具有親和性,是印證的完美適用。從這一意義上講,明確大數(shù)據(jù)證據(jù)屬性和種類有其現(xiàn)實緊迫性和必要性。
二、大數(shù)據(jù)證據(jù)內(nèi)涵之厘定
目前,我國學(xué)界對于大數(shù)據(jù)證據(jù)的定義有爭論而無定論。如有學(xué)者將大數(shù)據(jù)證據(jù)界定為基于海量電子數(shù)據(jù)形成的分析結(jié)果或報告,[2]此觀點難以充分體現(xiàn)大數(shù)據(jù)證據(jù)的獨有特點;也有學(xué)者將利用大數(shù)據(jù)技術(shù)得到的材料皆稱為大數(shù)據(jù)證據(jù),[3]此觀點太過寬泛,使得人們對于大數(shù)據(jù)證據(jù)的認識更為混亂;還有學(xué)者從方法論角度出發(fā),提出大數(shù)據(jù)證據(jù)能產(chǎn)生某種實用意義上的增值價值,[4]屬于一種可以產(chǎn)生增值的方法,此觀點其實指的是大數(shù)據(jù)證明而非大數(shù)據(jù)證據(jù)。
筆者認為,對大數(shù)據(jù)證據(jù)的界定應(yīng)從大數(shù)據(jù)證據(jù)的獨有特點出發(fā)。其一,大數(shù)據(jù)證據(jù)的基礎(chǔ)是海量電子數(shù)據(jù),規(guī)模大且類型多,相較于早期一條一套的電子數(shù)據(jù),大數(shù)據(jù)證據(jù)以信息量大為新特色。[5]其二,大數(shù)據(jù)證據(jù)不是對海量數(shù)據(jù)的簡單羅列而是進一步加工。目前,將大數(shù)據(jù)證據(jù)視為電子數(shù)據(jù)二次加工的觀點已為眾多學(xué)者所認可和采納,成為大數(shù)據(jù)證據(jù)的公認特點。[6]其三,大數(shù)據(jù)證據(jù)的再加工利用了高新技術(shù),如數(shù)據(jù)挖掘、數(shù)據(jù)統(tǒng)計、數(shù)字模型、數(shù)據(jù)碰撞等,而這些技術(shù)的適用使得大數(shù)據(jù)證據(jù)不同于電子數(shù)據(jù),因產(chǎn)生了新的價值增量而有了獨立的意義。其四,大數(shù)據(jù)證據(jù)的關(guān)聯(lián)性有雙重表現(xiàn),即基礎(chǔ)數(shù)據(jù)的弱關(guān)聯(lián)和分析結(jié)論的強關(guān)聯(lián),而傳統(tǒng)證據(jù)的關(guān)聯(lián)性只有一重,或強關(guān)聯(lián)或弱關(guān)聯(lián)。其五,大數(shù)據(jù)證據(jù)的可信性除受到來源的影響外更受到技術(shù)方法合適與否的影響,與傳統(tǒng)證據(jù)側(cè)重來源真實有明顯的不同。
由此,筆者將大數(shù)據(jù)證據(jù)定義為“建立在大量弱關(guān)聯(lián)的電子數(shù)據(jù)之上,通過數(shù)據(jù)挖掘、數(shù)據(jù)碰撞、模型建構(gòu)等技術(shù)增值得到的具有強關(guān)聯(lián)性的、能夠用來證明案件事實的分析報告”。如此界定,一是可以明確大數(shù)據(jù)證據(jù)的基礎(chǔ)是電子數(shù)據(jù),進而對二者的關(guān)系有一個正確的認識;二是可以明確大數(shù)據(jù)證據(jù)因使用了技術(shù)方法而產(chǎn)生價值,故與電子數(shù)據(jù)存在差別、與鑒定意見存在交叉,突出了大數(shù)據(jù)證據(jù)種類不明晰的問題,這也點明了相關(guān)研究未來的主攻方向;三是從大數(shù)據(jù)證據(jù)的特點出發(fā),既可以厘清大數(shù)據(jù)證據(jù)相關(guān)性的特殊表現(xiàn),也有助于為大數(shù)據(jù)證據(jù)設(shè)計專門的可信性審查判斷規(guī)則,還能夠為以后放棄以證據(jù)種類作為證據(jù)門檻的做法進行鋪墊。
三、大數(shù)據(jù)證據(jù)證據(jù)種類之辨析
在我國,依照《中華人民共和國刑事訴訟法》(以下簡稱《刑事訴訟法》)第五十條第二款之規(guī)定,證據(jù)包括物證,書證,證人證言,被害人陳述,犯罪嫌疑人、被告人供述和辯解,鑒定意見,勘驗、檢查、辨認、偵查實驗等筆錄,視聽資料、電子數(shù)據(jù)。只有這八種證據(jù)才是法律意義上的“證據(jù)”,在此范圍之外的事物、筆錄、陳述等皆非法定“證據(jù)”。[7]有學(xué)者就此認為:“關(guān)于證據(jù)種類的規(guī)定實際上構(gòu)成了我國證據(jù)審查與適用的第一道門檻,即只有符合法定證據(jù)種類要求的信息才有可能成為證據(jù)?!盵8]目前,國內(nèi)關(guān)于大數(shù)據(jù)證據(jù)證據(jù)種類的討論有三種主流說法。一是“電子數(shù)據(jù)說”。該觀點認為,大數(shù)據(jù)證據(jù)本質(zhì)上屬于電子數(shù)據(jù),分析報告是對電子數(shù)據(jù)的反映,依附于電子數(shù)據(jù),不具有獨立性,屬于衍生品。將大數(shù)據(jù)證據(jù)作為電子數(shù)據(jù)對待,也是大多數(shù)法院的做法。有學(xué)者通過實證研究發(fā)現(xiàn),判決中將大數(shù)據(jù)證據(jù)看作電子數(shù)據(jù)的比例達到66%,[9]而偵查機關(guān)提交的犯罪嫌疑人、被告人的活動軌跡多以“情況說明”的形式列入裁判書中。二是“鑒定意見說”。有學(xué)者認為應(yīng)將資金大數(shù)據(jù)分析納入司法鑒定范疇,這有利于司法實踐的展開,且在法律上也可以找到依據(jù)。[10]該觀點得到了部分法院的認可,其在裁判文書中將相應(yīng)的資金分析報告列為鑒定意見①。2016年修訂的《司法鑒定程序通則》第二條亦規(guī)定:“司法鑒定是指在訴訟活動中鑒定人運用科學(xué)技術(shù)或者專門知識對訴訟涉及的專門性問題進行鑒別和判斷并提供鑒定意見的活動。”從表述上看,大數(shù)據(jù)證據(jù)和鑒定意見的確存在相似之處,都需要利用科學(xué)技術(shù),針對的也都是專業(yè)問題,都是對基礎(chǔ)材料的再加工,最終形成一份有獨立價值的報告。正因如此,“鑒定意見說”在學(xué)界占據(jù)著優(yōu)勢地位。三是“獨立證據(jù)說”。該觀點認為,大數(shù)據(jù)證據(jù)不同于現(xiàn)有的法定證據(jù),在未來的證據(jù)法當中有必要單列出來作為獨立的證據(jù)種類。[11]
在域外,關(guān)于大數(shù)據(jù)證據(jù)的證據(jù)種類有兩種主流觀點。一是“機器證言說”。美國學(xué)者洛斯認為,機器在確定事實上發(fā)揮著越來越重要的作用,所傳達的一些信息已成為法庭上的證據(jù),如照相機的圖像、溫度計的測量、專家系統(tǒng)的意見等。[12]因此,可將數(shù)據(jù)以及數(shù)據(jù)分析都歸入到機器證言之中,作為值得依賴的、可用于法庭裁判的證據(jù)。為使機器證言符合美國的可采性要求,洛斯將機器證言視為“人證”,并設(shè)計出一個類似傳聞證據(jù)的規(guī)則,目的是通過為陪審團提供關(guān)鍵的基本事實或背景更好地評估機器傳輸?shù)臏蚀_性。二是“數(shù)字證據(jù)說”。在域外相關(guān)研究中,大數(shù)據(jù)一詞經(jīng)常和數(shù)字取證一同出現(xiàn)。因此,美國國家標準與技術(shù)研究所將“數(shù)字取證”定義為:“一門應(yīng)用科學(xué),有助于對證據(jù)數(shù)據(jù)進行識別、分類、評估和審查?!盵13]實際上,該觀點擴大了數(shù)字證據(jù)的范圍,將對相關(guān)數(shù)據(jù)的分析也歸入其中。如有學(xué)者將數(shù)字取證程序分為“識別、收集、分析、保存和陳述”,[14]其中的“分析”即是利用有效的數(shù)據(jù)挖掘工具來分析證據(jù)數(shù)據(jù),這與大數(shù)據(jù)證據(jù)極為相似。還有不少學(xué)者認為大數(shù)據(jù)證據(jù)是數(shù)字取證之中的一項,由此將大數(shù)據(jù)取證定義為“數(shù)字取證的一個特殊分支,用來識別、收集、分析和陳述非常大規(guī)模的證據(jù)數(shù)據(jù)集,以建立犯罪事實。”[15]
法定的八種證據(jù)在載體、表現(xiàn)形式等方面各有特點,如何區(qū)分不同證據(jù)種類的關(guān)鍵在于審查判斷規(guī)則。如證人證言在審查判斷時主要關(guān)注證人是否直接感知案件事實、與案件事實是否有利害關(guān)系,而鑒定意見在審查判斷時主要關(guān)注鑒定人是否具有資質(zhì)、鑒定方法是否科學(xué),由此可推斷出二者屬于不同種類的證據(jù)。判斷大數(shù)據(jù)證據(jù)屬于何種類型的證據(jù),亦應(yīng)從其適用什么樣的審查判斷規(guī)則著手。從大數(shù)據(jù)證據(jù)構(gòu)成上看,既需要審查判斷基礎(chǔ)數(shù)據(jù),又需要審查判斷技術(shù)方法?;诖?,筆者對國內(nèi)外關(guān)于大數(shù)據(jù)證據(jù)證據(jù)種類的幾種主流說法進行考量:其一,“電子數(shù)據(jù)說”和“數(shù)字證據(jù)說”?!半娮訑?shù)據(jù)說”盡管看到了大數(shù)據(jù)證據(jù)在審查判斷基礎(chǔ)數(shù)據(jù)時的確適用電子數(shù)據(jù)的相關(guān)規(guī)則,但卻忽視了一個至關(guān)重要的問題——“同步性”。最高人民法院、最高人民檢察院、公安部于2016年9月9日印發(fā)的《關(guān)于辦理刑事案件收集提取和審查判斷電子數(shù)據(jù)若干問題的規(guī)定》(以下簡稱《電子數(shù)據(jù)規(guī)定》)第一條規(guī)定:“電子數(shù)據(jù)是案件發(fā)生過程中形成的,以數(shù)字化形式存儲、處理、傳輸?shù)?,能夠證明案件事實的數(shù)據(jù)。”從中可以推導(dǎo)出電子數(shù)據(jù)與案件事實具有同步性,因此電子數(shù)據(jù)亦被稱為“沉默的現(xiàn)場見證人”。而大數(shù)據(jù)證據(jù)建立在對電子數(shù)據(jù)的分析之上,是事后加工得到的,顯然不具有同步性。故此,在電子數(shù)據(jù)的概念沒有更改之前不宜將大數(shù)據(jù)證據(jù)與電子數(shù)據(jù)等同。“數(shù)字證據(jù)說”亦是如此,其也忽略了電子數(shù)據(jù)的同步性。其二,“機器證言說”。機器證言是將“人證”進行了擴大理解,如此就需要將證人證言的審查判斷規(guī)則適用于大數(shù)據(jù)證據(jù),但司法實踐中有關(guān)證人證言的審查判斷規(guī)則并不適用于機器證言。一方面,證人證言的可信性要通過證人的感知、表達、記憶、誠實性等方面綜合分析判斷,而機器證言是由嚴密的編程程序得出的分析結(jié)果,顯然不會受到上述情況的影響;另一方面,證人有出庭作證的義務(wù),其證言要接受控辯雙方和法官的質(zhì)疑,而機器證言即便出庭也無法回應(yīng)質(zhì)疑。其三,“獨立證據(jù)說”。將大數(shù)據(jù)證據(jù)獨立為一種新的證據(jù)形式,就必須為其設(shè)計獨特的審查判斷規(guī)則。然而,對大數(shù)據(jù)證據(jù)基礎(chǔ)數(shù)據(jù)的審查完全可以適用電子數(shù)據(jù)的相關(guān)規(guī)則,對大數(shù)據(jù)證據(jù)技術(shù)方法的審查判斷亦可參考鑒定意見的相關(guān)規(guī)則。可見,將大數(shù)據(jù)證據(jù)獨立為一種新的證據(jù)形式顯然是一種逃避問題的做法,這種將難以歸類的證據(jù)材料獨立處理的“打補丁”方式長久來看不利于形成穩(wěn)定的證據(jù)制度,甚至?xí)o司法裁判活動造成阻礙。其四,“鑒定意見說”。有學(xué)者認為,不同于以往專家借助儀器設(shè)備作出判斷,大數(shù)據(jù)分析鑒定意見書很大程度上是由機器算法給出的實質(zhì)判斷,這對于專家作出判斷的司法鑒定體制是一個過于超前的突破。[16]實際上,這種差異并不妨礙將大數(shù)據(jù)證據(jù)歸入鑒定意見。盡管鑒定意見通常是以“人”為主、以“機器”為輔,但在某些情況下也是以“機器”為主、以“人”為輔的,如DNA鑒定、血液酒精含量鑒定等。而且,鑒定意見通過辯護進行證據(jù)審查判斷的規(guī)則同樣也適用于對大數(shù)據(jù)證據(jù)技術(shù)方法的審查判斷。加之,鑒定人在進行鑒定時遵循的是國家標準、行業(yè)標準,將大數(shù)據(jù)證據(jù)歸入鑒定意見即可以適用相應(yīng)標準對大數(shù)據(jù)證據(jù)技術(shù)方法進行審查。因此,將大數(shù)據(jù)證據(jù)歸入到鑒定意見是可行的,不會發(fā)生嚴重的沖突。需要說明的是,將大數(shù)據(jù)證據(jù)歸類的目的只是考察其適用何種證據(jù)審查判斷規(guī)則,對大數(shù)據(jù)證據(jù)的研討還應(yīng)更進一步,即重新審視大數(shù)據(jù)證據(jù)的相關(guān)性并建構(gòu)符合大數(shù)據(jù)證據(jù)可信性審查判斷的規(guī)則。
四、大數(shù)據(jù)證據(jù)相關(guān)性之再解
“相關(guān)性”一詞譯自于英美法系國家,是指作為證據(jù)內(nèi)容的事實與案件事實之間存在某種聯(lián)系。英美法系國家對相關(guān)性極為重視,將其作為最基本的證據(jù)屬性,如《美國聯(lián)邦證據(jù)規(guī)則》在規(guī)則401、402、403中分別規(guī)定了相關(guān)證據(jù)的標準、相關(guān)證據(jù)的可采性和相關(guān)證據(jù)的自由裁量性。大陸法系國家將“相關(guān)性”亦稱為“關(guān)聯(lián)性”,其側(cè)重的是證據(jù)與證明對象之間的形式性關(guān)系,即證據(jù)相對于證明對象是否具有實質(zhì)性和證明性。大數(shù)據(jù)分析報告一旦作為證據(jù),必須具備相關(guān)性。
在學(xué)界,部分學(xué)者對大數(shù)據(jù)證據(jù)的海量基礎(chǔ)數(shù)據(jù)進行評估后發(fā)現(xiàn),其與案件事實不具有通常意義上的關(guān)聯(lián),或者說相較于其他證據(jù)的關(guān)聯(lián),這些海量基礎(chǔ)數(shù)據(jù)的關(guān)聯(lián)極其微弱。故此認為,通過分析加工不具備相關(guān)性的數(shù)據(jù)而得到的大數(shù)據(jù)證據(jù)理所當然地不具有相關(guān)性,其證據(jù)資格存在重大瑕疵,不能作為證據(jù)來使用。在筆者看來,此觀點對于關(guān)聯(lián)性認識較為模糊且未能充分理解大數(shù)據(jù)證據(jù)的特殊性。一方面,關(guān)聯(lián)性包括了弱關(guān)聯(lián)和強關(guān)聯(lián),弱關(guān)聯(lián)也是關(guān)聯(lián)的一種,對案件事實的證明亦能起到作用;另一方面,大數(shù)據(jù)證據(jù)雖是建立在弱關(guān)聯(lián)的海量電子數(shù)據(jù)之上的,但其本身與案件事實是強關(guān)聯(lián)的,這正是“大數(shù)據(jù)價值增值論”的根源所在。具言之,其一,大數(shù)據(jù)證據(jù)著眼于“相關(guān)關(guān)系”。與傳統(tǒng)證據(jù)著眼于“因果關(guān)系”不同,大數(shù)據(jù)證據(jù)著眼于“相關(guān)關(guān)系”,通過那些看似不具有關(guān)聯(lián)的關(guān)系發(fā)掘背后的常態(tài)聯(lián)系,用以證明案件事實,這也符合大數(shù)據(jù)的技術(shù)特點。大數(shù)據(jù)技術(shù)就是利用海量信息來挖掘潛在的相關(guān)關(guān)系,從而超越了通常的因果認知。有學(xué)者提出:“傳統(tǒng)證據(jù)的因果關(guān)系是一種強關(guān)聯(lián)關(guān)系,而大數(shù)據(jù)的相關(guān)關(guān)系是一種弱關(guān)聯(lián)關(guān)系。實際上,大數(shù)據(jù)的相關(guān)性是基于機器邏輯的相關(guān)關(guān)系。”[17]大數(shù)據(jù)之父舍恩伯格同樣認為:“大數(shù)據(jù)最重要的思維特征就是‘追求相關(guān)、放棄因果’”。[18]在哈爾濱市公安局交警支隊原處長侯某某嚴重違紀案中,正是通過大數(shù)據(jù)發(fā)現(xiàn)侯某某任職前后的消費水平發(fā)生了變化,如航班由經(jīng)濟艙改為了頭等艙。[19]其二,大數(shù)據(jù)證據(jù)與案件事實是強關(guān)聯(lián)的。大數(shù)據(jù)證據(jù)的基礎(chǔ)數(shù)據(jù)雖是弱關(guān)聯(lián)的,但最終的大數(shù)據(jù)分析報告卻是強關(guān)聯(lián)的。引入相關(guān)關(guān)系,是為論證基礎(chǔ)數(shù)據(jù)的正當性而并非大數(shù)據(jù)證據(jù)本身和案件事實也是弱關(guān)聯(lián)關(guān)系。實際上,所謂的“大數(shù)據(jù)的相關(guān)關(guān)系是一種弱關(guān)聯(lián)關(guān)系”指的只是基礎(chǔ)數(shù)據(jù)而非大數(shù)據(jù)證據(jù)本身。大數(shù)據(jù)證據(jù)并不是海量數(shù)據(jù)的簡單堆積,其是對海量數(shù)據(jù)的再加工,通過數(shù)據(jù)挖掘、數(shù)據(jù)對比等技術(shù)方法,大數(shù)據(jù)分析報告已然產(chǎn)生新的獨立價值,具有了強關(guān)聯(lián)性。如涉眾犯罪中通過技術(shù)方法得到的人員關(guān)系層級表,立體而又生動地描繪了案件中人員的地位和受益金額,與案件事實具有強關(guān)聯(lián)。美國司法中的“鑲嵌論”認為,分散的信息碎片一旦被整合為整體,就能產(chǎn)生1+1>2的效果。在筆者看來,“鑲嵌論”和“大數(shù)據(jù)價值增值論”是相互契合的,其都認為碎片整合加工之后能產(chǎn)生更大價值,從而具有一定的獨立性。其三,大數(shù)據(jù)證據(jù)的相關(guān)性基于特殊經(jīng)驗。電子時代帶來了新變化,新型犯罪通常涉及人數(shù)較廣,案情較為復(fù)雜,相關(guān)案情信息極為龐大,已經(jīng)超越了日常生活的經(jīng)驗范疇,單靠人力去調(diào)查研究是難以完成的。從認識論意義上講,大數(shù)據(jù)分析運用的相關(guān)性理論是超脫于人類經(jīng)驗判斷的“數(shù)據(jù)經(jīng)驗”,[20]通過大數(shù)據(jù)技術(shù)可以將那些隱藏規(guī)律外化,從而形成新的不同于人類日常經(jīng)驗的數(shù)據(jù)經(jīng)驗或特殊經(jīng)驗。之所以稱為特殊經(jīng)驗,是因為該經(jīng)驗的得出是基于大數(shù)據(jù)技術(shù)對海量數(shù)據(jù)的分析,如果以生活常識判斷并不能看到二者具有的關(guān)聯(lián)。例如:沃爾瑪通過大數(shù)據(jù)分析發(fā)現(xiàn),啤酒和尿布放在一起售賣時,二者的銷量都會增加;有學(xué)者通過實證研究發(fā)現(xiàn),在上海市虹口區(qū)人民法院管轄范圍內(nèi),自然人之間、自然人與金融機構(gòu)之間的借款活動相較于其他參與主體借款行為更易失敗。[21]
綜上,筆者認為,在理解大數(shù)據(jù)證據(jù)的相關(guān)性時,既要看到大數(shù)據(jù)證據(jù)基礎(chǔ)數(shù)據(jù)的弱關(guān)聯(lián),還要看到數(shù)據(jù)分析報告的強關(guān)聯(lián),更要看到建立在因果關(guān)系之上的相關(guān)關(guān)系。而且,要深刻理解“經(jīng)驗”不僅僅是人們在日常生活中所形成的經(jīng)驗,要擴大視野向時代看齊,承認和接納數(shù)據(jù)經(jīng)驗或特殊經(jīng)驗。
五、大數(shù)據(jù)證據(jù)可信性規(guī)則之塑造
依據(jù)《刑事訴訟法》第五十條之規(guī)定,證據(jù)必須經(jīng)過查證屬實才能作為定案的根據(jù)。可信性是證據(jù)成為定案根據(jù)必不可少的條件,包括證據(jù)本身可信和證據(jù)來源可信。[22]大數(shù)據(jù)證據(jù)的可信性有其特殊性,一方面,大數(shù)據(jù)證據(jù)建立在電子數(shù)據(jù)之上,而電子數(shù)據(jù)又處于虛擬空間,與高新技術(shù)緊密相連,法官們在審查和判斷時受限于專業(yè)性常常陷入窘境;另一方面,算法作為大數(shù)據(jù)技術(shù)的內(nèi)核因涉及到商業(yè)秘密,通常是不公開、黑箱化運行的,故在法庭舉證時控辯雙方對于大數(shù)據(jù)證據(jù)的質(zhì)證往往流于形式,這使得大數(shù)據(jù)證據(jù)的可信性受到質(zhì)疑。故此,應(yīng)科學(xué)構(gòu)建大數(shù)據(jù)證據(jù)可信性的審查判斷規(guī)則。
對大數(shù)據(jù)證據(jù)可信性的審查判斷應(yīng)該關(guān)注作為來源的海量基礎(chǔ)數(shù)據(jù)是否可信,是否存在偽造的或者具有誤導(dǎo)性的數(shù)據(jù)。如在“新百倫和New Balance商標侵權(quán)案”[(2015)粵高法民三終字第444號]中,原告提交的公證書提出二者的“淘寶指數(shù)”和“百度指數(shù)”曲線基本一致,以此證明二者已構(gòu)成了商標混淆。然而,原告提交的指數(shù)不一定是真實可信的,亦有惡意搜索或人為趨使指數(shù)保持一致的可能?!峨娮訑?shù)據(jù)規(guī)定》第二十二條規(guī)定:“對電子數(shù)據(jù)是否真實,應(yīng)當著重審查以下內(nèi)容:(一)是否移送原始存儲介質(zhì);在原始存儲介質(zhì)無法封存、不便移動時,有無說明原因,并注明收集、提取過程及原始存儲介質(zhì)的存放地點或者電子數(shù)據(jù)的來源等情況;(二)電子數(shù)據(jù)是否具有數(shù)字簽名、數(shù)字證書等特殊標識;(三)電子數(shù)據(jù)的收集、提取過程是否可以重現(xiàn);(四)電子數(shù)據(jù)如有增加、刪除、修改等情形的,是否附有說明;(五)電子數(shù)據(jù)的完整性是否可以保證?!钡诙龡l規(guī)定:“對電子數(shù)據(jù)是否完整,應(yīng)當根據(jù)保護電子數(shù)據(jù)完整性的相應(yīng)方法進行驗證:(一)審查原始存儲介質(zhì)的扣押、封存狀態(tài);(二)審查電子數(shù)據(jù)的收集、提取過程,查看錄像;(三)比對電子數(shù)據(jù)完整性校驗值;(四)與備份的電子數(shù)據(jù)進行比較;(五)審查凍結(jié)后的訪問操作日志;(六)其他方法?!睋?jù)此,有學(xué)者提出,原始電子數(shù)據(jù)作為大數(shù)據(jù)證據(jù)的基礎(chǔ),只有每項原始電子數(shù)據(jù)都能符合電子數(shù)據(jù)審查規(guī)范時,這些電子數(shù)據(jù)分析得出的大數(shù)據(jù)證據(jù)才是可靠的。[23]還有學(xué)者認為,雖然原始電子數(shù)據(jù)數(shù)量是龐大的,但是通過“區(qū)塊鏈技術(shù)”能夠保證原始數(shù)據(jù)內(nèi)容的可信性。[24]但在筆者看來,要求大數(shù)據(jù)證據(jù)的基礎(chǔ)數(shù)據(jù)全部真實不現(xiàn)實。大數(shù)據(jù)證據(jù)的一大特點就是數(shù)據(jù)規(guī)模大、數(shù)據(jù)類型多、數(shù)據(jù)信息海量,因此在審查判斷海量電子數(shù)據(jù)的可信性時應(yīng)以宏觀的整體真實為選擇。其實,從整體真實角度考察證據(jù)的可信性也是與司法實踐中的等約計量法相契合的,在面對極為復(fù)雜的案件時,對于案件事實的探求不以精準計量為導(dǎo)向,關(guān)注的是整體樣態(tài)。正如舍恩伯格所言,大數(shù)據(jù)通常用概率說話,而不是板著“確鑿無疑”的面孔;當我們試圖擴大規(guī)模的時候,要學(xué)會擁抱“混亂”。[25]當然,關(guān)注宏觀的整體真實并不意味著要徹底拋棄微觀的具體真實。具體真實具有自身的價值,有存在的必要性,它可以用來印證整體認識的正確與否。如在“張某安、劉某伍組織、領(lǐng)導(dǎo)傳銷活動案”中,偵查人員先是通過對核心技術(shù)人員的訊問,確保涉案數(shù)據(jù)集整體的可信性,再通過對該組織的一個分支機構(gòu)資金流水的具體查證,部分印證了數(shù)據(jù)集整體中的層次關(guān)系。
大數(shù)據(jù)證據(jù)是對電子數(shù)據(jù)的再加工,除了要審查判斷作為來源基礎(chǔ)數(shù)據(jù)的可信性之外,還要審查判斷技術(shù)方法的可信性。從某種程度上說,技術(shù)方法可信性的影響力甚至大于基礎(chǔ)數(shù)據(jù)可信性的影響力?;诖髷?shù)據(jù)技術(shù)以不公開為原則,表現(xiàn)為黑箱化運行,有學(xué)者主張技術(shù)方法可信性的審查判斷應(yīng)以技術(shù)方法公開為前提,以確保技術(shù)方法透明,從而提高司法審判的透明度。筆者認為,此觀點欠妥。一方面,部分技術(shù)方法無法公開,如北斗衛(wèi)星的圖像分析等,但不公開并不意味著不可信;另一方面,大數(shù)據(jù)技術(shù)專業(yè)性很強,即便將相應(yīng)的技術(shù)算法公開,其可信性仍需進一步審查判斷。如在“王某博、鄭某濱侵犯著作權(quán)案”[(2020)蘇刑終19號]中,就對“天天街機捕魚”和“千炮捕魚”的源代碼的重復(fù)比產(chǎn)生了爭執(zhí),為此控方提交多份司法鑒定意見,被告人則主張這些司法鑒定并不可信??梢?,對技術(shù)方法的可信性審查,公開只是第一步,更為關(guān)鍵的是要建構(gòu)具體的審查判斷規(guī)則,即有效質(zhì)證規(guī)則和最佳技術(shù)方法規(guī)則。
就有效質(zhì)證規(guī)則而言,《刑事訴訟法》第一百九十二條第三款規(guī)定:“公訴人、當事人或者辯護人、訴訟代理人對鑒定意見有異議,人民法院認為鑒定人有必要出庭的,鑒定人應(yīng)當出庭作證。經(jīng)人民法院通知,鑒定人拒不出庭作證的,鑒定意見不得作為定案的根據(jù)?!贝髷?shù)據(jù)技術(shù)方法的可信性審查亦可通過有效質(zhì)證來實現(xiàn):在大數(shù)據(jù)研究領(lǐng)域中有一項“可視化分析”,通過人機交互技術(shù)輔助人們更為直觀和高效地洞悉大數(shù)據(jù)信息。[26]“可視化分析”可以用來解釋大數(shù)據(jù)技術(shù)的原理和分析報告的形成過程,從而實現(xiàn)大數(shù)據(jù)證據(jù)的有效展示,這比僅僅公開技術(shù)方法更為有效。筆者建議,提交大數(shù)據(jù)證據(jù)的一方應(yīng)附帶“可視化分析”,對其采用的大數(shù)據(jù)技術(shù)進行解釋說明,以便法院及控辯雙方理解和審查判斷。此外,《刑事訴訟法》第一百九十七條第二款明確規(guī)定:“公訴人、當事人和辯護人、訴訟代理人可以申請法庭通知有專門知識的人出庭,就鑒定人作出的鑒定意見提出意見?!彼?,專家輔助人同樣可以適用于大數(shù)據(jù)證據(jù)技術(shù)方法的質(zhì)證。需要注意的是,申請專家輔助人的質(zhì)疑既可以針對大數(shù)據(jù)分析報告本身,也可以針對附帶的“可視化分析”,法官在決定是否允許專家輔助人介入時應(yīng)側(cè)重保護質(zhì)證方而非舉證方,如此才能平衡雙方的力量。
就最佳技術(shù)方法而言,目前因大數(shù)據(jù)證據(jù)的技術(shù)方法沒有相應(yīng)的技術(shù)標準導(dǎo)致產(chǎn)生兩個疑問:一是使用的技術(shù)方法是否正確,能否得出可信的結(jié)論;二是使用的技術(shù)方法是否最合適。相較之下,鑒定意見雖然也存在疑問,但其有相應(yīng)的標準,《司法鑒定程序通則》第二十三條明確規(guī)定:“司法鑒定人進行鑒定,應(yīng)當依下列順序遵守和采用該專業(yè)領(lǐng)域的技術(shù)標準、技術(shù)規(guī)范和技術(shù)方法:(一)國家標準;(二)行業(yè)標準和技術(shù)規(guī)范;(三)該專業(yè)領(lǐng)域多數(shù)專家認可的技術(shù)方法?!笨梢姡⑾鄳?yīng)的技術(shù)標準是破解大數(shù)據(jù)證據(jù)技術(shù)方法可信性困境的關(guān)鍵。但標準的確立需要經(jīng)驗的積累和總結(jié),短時間內(nèi)完成不太現(xiàn)實。對此,筆者建議可參考美國在多波特案中提出的評價標準①,即通過算法比較和事后驗證來確立個案中的最佳技術(shù)方法。所謂算法比較,是指對同樣的基礎(chǔ)數(shù)據(jù)采用不同的算法進行數(shù)據(jù)分析。面對同樣的數(shù)據(jù)集,采用不同的算法可能得出不同的結(jié)論甚至是截然相反的結(jié)論。大數(shù)據(jù)分析的核心同樣在于對算法模型的分析和選擇,算法模型的有效性和適用性很大程度上決定著分析結(jié)果的準確性和可采性。[27]故而,應(yīng)多嘗試算法建構(gòu),通過對比分析尋找最合適的技術(shù)方法。在進行大數(shù)據(jù)分析時,或結(jié)合現(xiàn)實情況選擇最為適合的算法,或交叉利用多種算法。所謂事后驗證法,是指通過對某一算法得出的結(jié)論進行個別驗證。該方法在專業(yè)領(lǐng)域亦被稱為黑箱測試,即在已知產(chǎn)品所應(yīng)具有功能的前提下通過測試來檢測每個功能能否正常的一種測試方法。[28]事后驗證實際上屬于抽樣取證,通過具有代表性的一定物品作為樣本證據(jù),并據(jù)此證明全體物品屬性。[29]鑒于抽樣取證難以找到代表性的物品,無法正確反映情況,只能在極特別的情況下使用,因而應(yīng)通過多次測試以提高正確率,同時結(jié)合整體真實性綜合考慮。對于測試過程中可能出現(xiàn)的不相符情形,不要貿(mào)然認定結(jié)論不真實,應(yīng)將其認作概率問題從整體上進行考量。
總之,大數(shù)據(jù)證據(jù)在訴訟活動中運用的主要問題在于其屬于哪一類法定證據(jù)、如何展開有效的審查判斷。筆者認為,相較于相關(guān)性和可信性,證據(jù)形式對證據(jù)審查運用的影響并沒有那么大。而且,要求證據(jù)必須具備合法形式的規(guī)定不合理,且實務(wù)中這一規(guī)定也沒有被嚴格地執(zhí)行。如交警出具的交通事故認定書、會計事務(wù)所出具的審計報告雖然不屬于法定證據(jù),但是幾乎沒人會否認其證明價值進而將其排除在訴訟之外?!蹲罡呷嗣穹ㄔ宏P(guān)于適用〈中華人民共和國刑事訴訟法〉的解釋(2021)》新增的第一百零一條規(guī)定:“有關(guān)部門對事故進行調(diào)查形成的報告,在刑事訴訟中可以作為證據(jù)使用;報告中涉及專門性問題的意見,經(jīng)法庭查證屬實,且調(diào)查程序符合法律、有關(guān)規(guī)定的,可以作為定案的根據(jù)?!贝艘?guī)定已經(jīng)有了弱化法定證據(jù)形式的傾向,因此筆者建議,應(yīng)將《刑事訴訟法》第五十條第二款中“證據(jù)包括”修改為“證據(jù)包括但不限于”。
【參考文獻】
[1][18][25](英)維克托·邁爾·舍恩伯格.大數(shù)據(jù)時代:生活、工作與思維的大變革[M].周濤譯.杭州:浙江人民出版社,2012:1,68-94,46.
[2][5][16][28]劉品新.論大數(shù)據(jù)證據(jù)[J].環(huán)球法律評論,2019,(1):22-31.
[3][10][11]何家弘等.大數(shù)據(jù)偵查給證據(jù)法帶來的挑戰(zhàn)[J].人民檢察,2018,(1):56.
[4]謝君澤.論大數(shù)據(jù)證明[J].中國刑事法雜志,2020,(2):125.
[6]謝君澤.論大數(shù)據(jù)證明[J].中國刑事法雜志,2020,(2):125;王祿生.論法律大數(shù)據(jù)“領(lǐng)域理論”的構(gòu)建[J].中國法學(xué),2020,(2):261.
[7]陳瑞華.刑事證據(jù)法(第三版)[M].北京:北京大學(xué)出版社,2018:246.
[8]鄭飛,馬國洋.大數(shù)據(jù)證據(jù)適用的三重困境及出路[J/OL].重慶大學(xué)學(xué)報(社會科學(xué)版),Doi:10.11835/j.issn.1008-5831.fx.2020.12.001.
[9]徐惠,李曉東.大數(shù)據(jù)證據(jù)之證據(jù)證成研究[J].中國人民公安大學(xué)學(xué)報(社會科學(xué)版),2020,(1):49.
[12]Andrea Roth,Machine Testimony,126Yale L.J.1972(2017).
[13]B.Marr,Why only one of the 5 vs of big data really matters, http://goo.gl/azsnse,2015.
[14]Dr.Tariq Sheikh,Big data and digital forensic,https://www.researchgate.net/publication/323254112.
[15]Shams Zawoad、Ragib Hasan,Digital Forensics in the Age of Big Data:Challenges,Approaches,and Opportunities, IEEE Big Data Security,August2015.
[17]劉品新.電子證據(jù)的關(guān)聯(lián)性[J].法學(xué)研究,2016,(6):189.
[19]龐嵐.官員有11套房自以為安全,不料這舉動被大數(shù)據(jù)揪出[EB/OL].新浪網(wǎng),https://finance.sina.com.cn/china/gncj/2018-05-30/doc-ihcffhsv2868843.shtml.
[20][21]周蔚.大數(shù)據(jù)在事實認定中作用機制分析[J].中國政法大學(xué)學(xué)報,2015,(6):70-75.
[22](美)特倫斯·安德森等.證據(jù)分析(第2版)[M].張保生等譯.北京:中國人民大學(xué)出版社,2012:84.
[23]張吉喜,孔德倫.論刑事訴訟中的大數(shù)據(jù)證據(jù)[J].貴州大學(xué)學(xué)報(社會科學(xué)版),2020,(4):87.
[24]吳春妹等.大數(shù)據(jù)證據(jù)的定位與運用——以互聯(lián)網(wǎng)金融犯罪案件為切入點[J].人民檢察,2020,(3):57.
[26]任磊等.大數(shù)據(jù)可視分析綜述[J].軟件學(xué)報,2014,(9):1910.
[27]劉緒崇,蘇欣,唐德權(quán).智慧警務(wù)——大數(shù)據(jù)環(huán)境下新時代公安信息化建設(shè)模式探索[M].北京:清華大學(xué)出版社,2018:69.
[29]萬毅,縱博.論刑事訴訟中的抽樣取證[J].江蘇行政學(xué)院學(xué)報,2014,(4):122.
(責(zé)任編輯:劉亞峰? 實習(xí)編輯:王正橋)
Research and Analysis of Big Data Evidence
Hong Tao
Abstract:Judicial activities are moving towards digitization,and the traditional evidence and proof activities have been difficult to meet the practical needs.The big data evidence obtained by using big data technology has become the key to solve the dilemma.From the perspective of new changes in crime,difficulty of proof and confirmation,big data evidence has unique value,and its dual relevance is conducive to the leap from “causality” to “correlation”.In view of the statutory form of evidence required in China,it is appropriate to classify big data evidence into expert opinions in the application of review and judgment rules.The construction of big data evidence credibility rules should be carried out from two aspects,namely,the macro overall truth rules of basic data,the effective cross examination rules of technical methods and the best technical methods.
Key words:value increment;correlation;effective cross examination;form of evidence