崔淑潔
(西安交通大學(xué) 法學(xué)院,陜西 西安 710049)
依托大數(shù)據(jù)技術(shù)、云計算、物聯(lián)網(wǎng)的迅猛發(fā)展,人類社會步入大數(shù)據(jù)時代。數(shù)據(jù)作為新型資源備受關(guān)注,數(shù)據(jù)應(yīng)用日漸深入。我國作為數(shù)據(jù)大國,數(shù)據(jù)產(chǎn)業(yè)增長態(tài)勢迅猛,數(shù)字經(jīng)濟規(guī)模巨大。2015年,《促進大數(shù)據(jù)發(fā)展行動綱要》首次將大數(shù)據(jù)提升到戰(zhàn)略發(fā)展高度,數(shù)據(jù)治理成為新型治理模式,在國家治理中意義重大。隨后,《“十三五”國家信息化規(guī)劃》提出了建設(shè)“數(shù)字中國”,將充分釋放數(shù)據(jù)紅利及構(gòu)建統(tǒng)一開放的數(shù)字市場體系作為重要的發(fā)展目標(biāo)。2020年4月,《中共中央國務(wù)院關(guān)于構(gòu)建更加完善的要素市場化配置體制機制的意見》將數(shù)據(jù)認(rèn)定為生產(chǎn)要素,要求加快培育數(shù)據(jù)要素市場。當(dāng)前,《數(shù)據(jù)安全法》已正式出臺,其順應(yīng)國家發(fā)展戰(zhàn)略和時代發(fā)展需求,提出了數(shù)據(jù)安全與數(shù)據(jù)利用并重的目標(biāo)。
數(shù)據(jù)挖掘是數(shù)據(jù)利用和數(shù)據(jù)價值開發(fā)的關(guān)鍵環(huán)節(jié),具有技術(shù)中立性和工具中立性。然而,隨著數(shù)據(jù)量的激增和技術(shù)應(yīng)用的推進,數(shù)據(jù)挖掘不再僅作為技術(shù)術(shù)語出現(xiàn),其所帶來的社會法律問題不容忽視,技術(shù)與法律能否實現(xiàn)良好的對接備受質(zhì)疑。在此情形下,論證數(shù)據(jù)挖掘這一技術(shù)手段的正當(dāng)性是技術(shù)能否合理應(yīng)用的關(guān)鍵,也是對技術(shù)進行法律規(guī)制的前提?,F(xiàn)有法律機制缺乏對數(shù)據(jù)挖掘技術(shù)的全面回應(yīng),本文試圖分析數(shù)據(jù)挖掘技術(shù)的正當(dāng)性,進而提出這一技術(shù)難題的法律規(guī)制路徑,旨在實現(xiàn)技術(shù)與法律制度的良性互動,推進我國大數(shù)據(jù)發(fā)展戰(zhàn)略的實施。
現(xiàn)階段,數(shù)據(jù)挖掘作為數(shù)據(jù)價值發(fā)現(xiàn)的重要技術(shù)存在法律規(guī)制的空白。明確數(shù)據(jù)挖掘的概念及內(nèi)涵、關(guān)注數(shù)據(jù)挖掘的現(xiàn)實應(yīng)用、實現(xiàn)數(shù)據(jù)挖掘技術(shù)術(shù)語與法律語意的統(tǒng)一是數(shù)據(jù)挖掘正當(dāng)性論述的邏輯起點,也是探討數(shù)據(jù)挖掘法律問題的前提[1]309。
數(shù)據(jù)挖掘(data mining)是指從大量、不完全、模糊的數(shù)據(jù)中提取隱含、未知及潛在有用信息和知識的數(shù)據(jù)處理技術(shù)[2]。2005年,美國政府問責(zé)局(U.S. Government Accountability Office)將其定義為應(yīng)用數(shù)據(jù)庫技術(shù)和統(tǒng)計分析、建模等算法技術(shù)發(fā)現(xiàn)數(shù)據(jù)中的隱藏關(guān)系,并能夠預(yù)測未來結(jié)果的數(shù)據(jù)開發(fā)應(yīng)用模式[3]。其綜合運用數(shù)據(jù)庫技術(shù)、統(tǒng)計學(xué)、人工智能、可視化等學(xué)科的技術(shù)和方法,通過挖掘算法對數(shù)據(jù)進行深層挖掘分析,實現(xiàn)了數(shù)據(jù)到知識的轉(zhuǎn)換。具體而言,數(shù)據(jù)挖掘可分為基于數(shù)據(jù)主題(subjective)的描述分析和基于數(shù)據(jù)模式(mode)的預(yù)測分析。基于主題的描述分析又被稱為連接分析,包括概念描述、關(guān)聯(lián)分析、分類、聚類等,用于描述對象內(nèi)涵和特征,發(fā)現(xiàn)數(shù)據(jù)聯(lián)系和規(guī)律;基于模式的分析則是從數(shù)據(jù)統(tǒng)計和歸納中發(fā)現(xiàn)未知的可能,用于預(yù)測未來[4]。
數(shù)據(jù)挖掘源自實踐的直接需求。依托強大的分析和預(yù)測能力,數(shù)據(jù)挖掘在數(shù)據(jù)分類、系統(tǒng)優(yōu)化、智能識別和趨勢預(yù)測等方面發(fā)揮著巨大功效,被廣泛應(yīng)用于商業(yè)、公共事務(wù)管理以及個人生活[5]。數(shù)據(jù)挖掘最早源于商業(yè)發(fā)展的需求,商業(yè)實體是數(shù)據(jù)挖掘的主力軍,也是數(shù)據(jù)挖掘的重要應(yīng)用主體。數(shù)據(jù)挖掘在商業(yè)領(lǐng)域的應(yīng)用包括但不限于金融、零售、廣告等領(lǐng)域,如銀行機構(gòu)應(yīng)用數(shù)據(jù)挖掘進行客戶信用的識別,電商通過數(shù)據(jù)挖掘分析顧客的購買行為、購買喜好進行精準(zhǔn)營銷,廣告部門利用數(shù)據(jù)挖掘定向投放廣告等。數(shù)據(jù)挖掘有助于商家在服務(wù)端控制物品及服務(wù)狀況,在銷售端精準(zhǔn)把握消費者的購買需求、購買行為、信用情況和經(jīng)濟能力等,進而提高服務(wù)質(zhì)量并進行商業(yè)趨勢的預(yù)測,創(chuàng)造商業(yè)價值,推動經(jīng)濟發(fā)展。近年來,除商業(yè)應(yīng)用之外,政府等公共事務(wù)部門對數(shù)據(jù)挖掘的應(yīng)用不斷深入,既包括政府部門通過數(shù)據(jù)挖掘致力于智能政府、智能城市的打造,也包括數(shù)據(jù)挖掘在科教文衛(wèi)等社會公共事務(wù)中的應(yīng)用,如醫(yī)療機構(gòu)借助數(shù)據(jù)挖掘推進精準(zhǔn)醫(yī)療、疾病防治以及新藥研發(fā),教育機構(gòu)實現(xiàn)應(yīng)用數(shù)據(jù)挖掘智能教育,科研機構(gòu)通過數(shù)據(jù)挖掘進行深度調(diào)研等。當(dāng)然,數(shù)據(jù)挖掘在反恐防控、刑事偵查及社會安全治理領(lǐng)域的應(yīng)用也是其公共事務(wù)應(yīng)用價值的重要體現(xiàn)。此外,數(shù)據(jù)挖掘在私人應(yīng)用中作用顯著,移動互聯(lián)網(wǎng)的普及使人們的思想行為日漸數(shù)字化,智能交通記錄日常出行,社交軟件識別交際網(wǎng)絡(luò),電商平臺采集購買所需,電子媒體引導(dǎo)思想動態(tài)。數(shù)據(jù)挖掘與私人應(yīng)用之間相互影響和塑造,一方面,個人基本信息及行為數(shù)據(jù)是數(shù)據(jù)挖掘的基礎(chǔ);另一方面,數(shù)據(jù)挖掘能夠分析和預(yù)測個人行為,影響私人決策,個體已然成為數(shù)據(jù)的創(chuàng)造者、數(shù)據(jù)挖掘的參與者和數(shù)據(jù)紅利的享受者。
如上所述,數(shù)據(jù)挖掘廣泛影響社會生活的各領(lǐng)域。探討技術(shù)的正當(dāng)性是技術(shù)合法化的前提,也是法律對技術(shù)進行規(guī)制的基礎(chǔ)。
1.信息增值的必要條件
信息增值理論是信息經(jīng)濟學(xué)中的重要理論,主張信息在運動過程中出現(xiàn)了質(zhì)上、量上和價值上的遞增[6]。這種遞增是一種具有目的性、非線性關(guān)聯(lián)的,按照一定的方向和速度,高效更新的信息流通方式[7]。信息量的增值是指信息量度的增加,信息質(zhì)的增值則是信息使用效益的增大,而信息價值的增值對應(yīng)信息滿足受眾需求度的增強。信息增值源于信息在交流、加工以及交合等過程中的擴散和傳播。其中,先進的信息化技術(shù)平臺和暢通的信息挖掘系統(tǒng)是信息增值的重要保障。
數(shù)據(jù)作為重要的信息源泉,具有深度加工增值特性,海量數(shù)據(jù)集合形成大數(shù)據(jù),實現(xiàn)了數(shù)據(jù)量上的增值。未經(jīng)加工的數(shù)據(jù)又稱原始數(shù)據(jù),其本身的使用價值有限,但經(jīng)數(shù)據(jù)挖掘后生成衍生數(shù)據(jù)和衍生數(shù)據(jù)關(guān)系,可用于現(xiàn)狀描述和未來預(yù)測,如商業(yè)趨勢推斷、社會危險因素排查等,具有極大的經(jīng)濟價值和社會效益,形成數(shù)據(jù)質(zhì)上與價值上的增值。數(shù)據(jù)挖掘技術(shù)實現(xiàn)了數(shù)據(jù)的深度開發(fā),使其從普通的電子代碼變成可識別、可分析、可深度利用的大數(shù)據(jù),催生了數(shù)據(jù)收集、存儲、加工、交易等系列數(shù)據(jù)產(chǎn)業(yè),促進新型業(yè)態(tài)的發(fā)展并推動數(shù)據(jù)治理,成為信息增值的必要條件。
2.數(shù)字經(jīng)濟發(fā)展的技術(shù)引擎
以使用數(shù)字化的知識、信息、數(shù)據(jù)作為關(guān)鍵生產(chǎn)要素,以信息網(wǎng)絡(luò)作為主要載體,以數(shù)據(jù)信息技術(shù)作為經(jīng)濟結(jié)構(gòu)優(yōu)化推動力的數(shù)字經(jīng)濟是大數(shù)據(jù)時代的新型經(jīng)濟業(yè)態(tài)[8],在促進經(jīng)濟發(fā)展、實現(xiàn)經(jīng)濟轉(zhuǎn)型、提高經(jīng)濟效率、發(fā)掘新型經(jīng)濟增長點等方面發(fā)揮著重要作用。《中國數(shù)字經(jīng)濟發(fā)展白皮書(2020年)》顯示,2019年,我國數(shù)字經(jīng)濟增加值規(guī)模達35.8萬億元,占GDP比重近四成,數(shù)字經(jīng)濟已成為國民經(jīng)濟核心增長極之一[9]。2017年,上海社科院應(yīng)用經(jīng)濟研究所發(fā)布的《中國數(shù)字經(jīng)濟宏觀影響力評估及中長期稅收政策走向設(shè)計》報告預(yù)測,到2030年,中國數(shù)字經(jīng)濟規(guī)模有望超過150萬億元人民幣,將占GDP比重80%左右[10]。
區(qū)別于傳統(tǒng)工業(yè)經(jīng)濟,數(shù)字經(jīng)濟以數(shù)據(jù)作為驅(qū)動經(jīng)濟發(fā)展的關(guān)鍵生產(chǎn)要素,以數(shù)據(jù)技術(shù)進步作為發(fā)展動力。數(shù)據(jù)挖掘技術(shù)作為重要的數(shù)據(jù)信息技術(shù)之一,成為數(shù)字經(jīng)濟發(fā)展的重要技術(shù)引擎。以數(shù)字經(jīng)濟中電商平臺經(jīng)濟為例,電商平臺為消費者與賣家提供交互平臺,實現(xiàn)便捷的網(wǎng)上購物服務(wù),在此過程中,電商平臺收集消費者的瀏覽痕跡、購買記錄等個人行為數(shù)據(jù)并進行深度挖掘,發(fā)現(xiàn)用戶喜好和潛在需求,向客戶進行精準(zhǔn)營銷和定向廣告投送,引導(dǎo)消費趨向,并不斷推陳出新迎合市場需求,實現(xiàn)消費者、賣家和電商平臺的多贏局面,推動數(shù)字經(jīng)濟的發(fā)展。數(shù)字經(jīng)濟的發(fā)展離不開數(shù)據(jù)挖掘技術(shù)的保障,其對數(shù)據(jù)挖掘的需求將隨數(shù)據(jù)這一生產(chǎn)要素的應(yīng)用不斷深化。
3.政府?dāng)?shù)據(jù)開放的內(nèi)在要求
政府?dāng)?shù)據(jù)作為重要的數(shù)據(jù)源,其開放使用可以更好地滿足經(jīng)濟和社會發(fā)展需求,為世界各國所重視。2009年,美國總統(tǒng)奧巴馬簽署了《開放透明政府備忘錄》,對政府?dāng)?shù)據(jù)進行公開,隨后,美國數(shù)據(jù)門戶data.gov上線,拉開了全球政府?dāng)?shù)據(jù)開放運動(Government Open Data)的序幕。作為數(shù)據(jù)大國,我國亦高度重視政府?dāng)?shù)據(jù)開放,2020年4月發(fā)布的《中共中央國務(wù)院關(guān)于構(gòu)建更加完善的要素市場化配置體制機制的意見》將推進政府?dāng)?shù)據(jù)開放作為加快培育數(shù)據(jù)要素市場的重要舉措,而《數(shù)據(jù)安全法》更是專章規(guī)定了政務(wù)數(shù)據(jù)的安全與開放,強調(diào)大力推進電子政務(wù)建設(shè)。
政府?dāng)?shù)據(jù)具有公共屬性,在不違反國家安全、不侵害商業(yè)秘密和個人信息安全的前提下,最大限度地對社會開放,不僅有助于增加政府工作的透明度,提高政務(wù)工作效率、服務(wù)水平和社會治理能力,而且更能夠為數(shù)字經(jīng)濟發(fā)展提供資源,激發(fā)數(shù)據(jù)創(chuàng)新。政府?dāng)?shù)據(jù)開放并不是最終目的,數(shù)據(jù)開放是為了促進數(shù)據(jù)資源的有效獲取,實現(xiàn)數(shù)據(jù)資源的挖掘和利用,發(fā)掘數(shù)字價值進而推進數(shù)字經(jīng)濟發(fā)展和社會治理。因而,數(shù)據(jù)挖掘技術(shù)的推進是政府?dāng)?shù)據(jù)開放得以實現(xiàn)和發(fā)揮效能的保障,符合政府?dāng)?shù)據(jù)開放的內(nèi)在要求。數(shù)據(jù)挖掘與政府?dāng)?shù)據(jù)開放相輔相成,成為推動數(shù)據(jù)產(chǎn)業(yè)發(fā)展、構(gòu)建數(shù)字政府以及推進數(shù)據(jù)社會治理的重要手段。
技術(shù)如同一把雙刃劍,其在帶來技術(shù)紅利的同時,不可避免地會產(chǎn)生社會法律問題。數(shù)據(jù)挖掘亦不能幸免。通過上文分析可知,數(shù)據(jù)挖掘的正當(dāng)性不容置疑,但正當(dāng)性審視的背后,不能忽視數(shù)據(jù)挖掘產(chǎn)生的系列社會法律隱憂。
收集存儲的個人數(shù)據(jù)進入挖掘階段,經(jīng)數(shù)據(jù)預(yù)處理形成去個人身份信息的匿名數(shù)據(jù),經(jīng)統(tǒng)計分析、挖掘算法執(zhí)行等深度加工處理,隱藏的數(shù)據(jù)關(guān)系和數(shù)據(jù)模式被發(fā)掘。挖掘算法不受個人控制,數(shù)據(jù)挖掘過程極有可能超出處理者的初始預(yù)測,更有甚者,反向識別技術(shù)可以對匿名化的數(shù)據(jù)進行再識別。美國在線(AOL)曾對用戶搜索數(shù)據(jù)進行匿名處理,刪除用戶姓名、地址等個人標(biāo)識,并采用隨機ID的方式公布,但部分用戶仍被記者識別出來[11]1765。而數(shù)據(jù)挖掘產(chǎn)生的隱藏數(shù)據(jù)結(jié)果很多時候被再次利用,由數(shù)據(jù)挖掘主體出售或分享給其他方,數(shù)據(jù)多次交易和使用過程中隱私暴露的風(fēng)險不可忽視。
除個人隱私侵害之外,數(shù)據(jù)挖掘還在一定程度上對個人自治造成困擾。個人數(shù)據(jù)使用程度、使用目的和使用場所很難由個人所控制,數(shù)據(jù)挖掘通過對個人數(shù)據(jù)的挖掘分析,洞察個人行為動向、興趣偏好,向個人推送個性化和定制化資料,干擾個人選擇和決策,一定程度上影響了個人自治的能動性。如電商平臺通過挖掘用戶的搜索和購買記錄,分析預(yù)測用戶購買喜好和潛在需求,并進行定制化推動,增加用戶黏性。數(shù)據(jù)挖掘的分析和預(yù)測功能提高了商業(yè)效率和個人生活的便捷度,但也在很大程度上影響和左右個人自我治理的動機和途徑,使人們成為被動性數(shù)字驅(qū)動人。
除私人困擾外,數(shù)據(jù)挖掘亦帶來了系列社會治理難題。其一是數(shù)據(jù)歧視,數(shù)據(jù)挖掘掌握個人數(shù)據(jù),通過對個人數(shù)據(jù)的分析能夠發(fā)現(xiàn)隱藏的信息資料,進而對群體進行劃分并區(qū)別對待。最為明顯的是購買歧視,商家依托數(shù)據(jù)挖掘掌握消費者的購買喜好、消費能力、消費需求緊迫度等相關(guān)信息,并據(jù)此設(shè)計不同的定價機制,導(dǎo)致不同用戶在同平臺同時段以不同價位購買相同產(chǎn)品的現(xiàn)象發(fā)生。此外,同一商家會針對不同購買力的群體提供不同等級的服務(wù),如為具有強購買力的消費者提供優(yōu)先服務(wù)而忽視低購買力群體。除價格歧視外,數(shù)據(jù)挖掘帶來的另一典型歧視存在于求職過程中,用人單位利用數(shù)據(jù)挖掘分析個人數(shù)據(jù),獲得個人健康、個人性格、個人社會資源等資料信息影響招聘結(jié)果,產(chǎn)生職場歧視。這些由數(shù)據(jù)挖掘帶來的社會歧視會破壞有序的市場秩序,影響社會治理的公平和正義,產(chǎn)生和激化社會矛盾。
除社會歧視外,數(shù)據(jù)挖掘還可能引發(fā)個人自治以及社會治理的沖突。數(shù)據(jù)挖掘很大程度上實現(xiàn)了私人定制化,是滿足個人自我需求的有力推手[1]366-368。然而,個人過分追求自我會導(dǎo)致個人化和小團體化,從而割裂社會整體,激化獨立個體與社會的矛盾。
數(shù)據(jù)挖掘是數(shù)據(jù)價值開發(fā)的重要技術(shù)手段。原始數(shù)據(jù)雖然量大,但不能交易,不具有直接經(jīng)濟價值。原始數(shù)據(jù)經(jīng)數(shù)據(jù)挖掘處理形成衍生數(shù)據(jù)及數(shù)據(jù)關(guān)系,可用于描述及預(yù)測未來需求及趨勢,被廣泛應(yīng)用于經(jīng)濟發(fā)展和社會治理,具有極高的經(jīng)濟和社會價值。數(shù)據(jù)是多元利益集合體,挖掘后的數(shù)據(jù)更具有多重價值屬性,涉及眾多利益主體,包括原始數(shù)據(jù)擁有者、數(shù)據(jù)挖掘主體等,涵蓋個人、政府等公共部門、商業(yè)主體等。挖掘產(chǎn)生的數(shù)據(jù)利益分割困難,引發(fā)社會分配難題。
以電商平臺為例,消費者注冊電商平臺,提供自己的個人數(shù)據(jù)以獲得平臺提供的服務(wù)。電商平臺作為數(shù)據(jù)挖掘主體收集并深度挖掘消費者的個人數(shù)據(jù),預(yù)測消費需求和消費趨勢,推出適應(yīng)市場需求的產(chǎn)品而獲得收益。此例中,對于因數(shù)據(jù)挖掘獲得的數(shù)據(jù)利益該如何分配?是由商家全部獲得還是應(yīng)分割利益于提供原始數(shù)據(jù)的消費者?商家和消費者的利益為何?是否都為經(jīng)濟利益還是應(yīng)有所區(qū)別?數(shù)據(jù)利益交易或提供給他方后的獲益如何劃分?類似問題不勝枚舉,并會隨數(shù)據(jù)挖掘技術(shù)的進步和應(yīng)用的擴展而不斷產(chǎn)生。如何平衡數(shù)據(jù)利益、合理分配社會財富和社會責(zé)任成為數(shù)據(jù)挖掘正當(dāng)性背后不可忽視的社會法律問題。
現(xiàn)代社會,法律成為社會控制和治理的主要手段,法律規(guī)制有助于實現(xiàn)社會公正,維護社會秩序[12]。對數(shù)據(jù)挖掘進行法律規(guī)制是數(shù)據(jù)挖掘正當(dāng)性的歸屬,也是解決數(shù)據(jù)挖掘社會法律問題,實現(xiàn)技術(shù)與法律統(tǒng)一的有效手段?;谝陨蠈?shù)據(jù)挖掘正當(dāng)性及其困境的分析,本部分聚焦數(shù)據(jù)挖掘法律規(guī)制路徑的構(gòu)建,包括規(guī)制目標(biāo)的確立、規(guī)制依據(jù)的完善、規(guī)制方式的選擇以及具體規(guī)制措施的實施。
規(guī)制目標(biāo)旨在解決規(guī)制什么,是規(guī)制架構(gòu)中的基礎(chǔ)性命題。數(shù)據(jù)挖掘的規(guī)制目標(biāo)復(fù)雜而多元,針對數(shù)據(jù)挖掘發(fā)展的需求和其所帶來的社會法律問題,應(yīng)確立鼓勵數(shù)據(jù)挖掘、確保個人數(shù)據(jù)安全、平衡協(xié)調(diào)數(shù)據(jù)利益的多元規(guī)制目標(biāo)。
首先,鼓勵數(shù)據(jù)挖掘是規(guī)制的根本目標(biāo)。小數(shù)據(jù)時代的數(shù)據(jù)資源有限且集中,數(shù)據(jù)享有者傾向于將數(shù)據(jù)私有,數(shù)據(jù)由享有者集中私密使用。大數(shù)據(jù)時代,人們對數(shù)據(jù)的關(guān)注從靜態(tài)的儲存轉(zhuǎn)向動態(tài)的使用,數(shù)據(jù)價值發(fā)現(xiàn)成為重點,數(shù)據(jù)成為新型戰(zhàn)略資源和生產(chǎn)要素。數(shù)據(jù)挖掘能力將在很大程度上決定大數(shù)據(jù)時代經(jīng)濟社會的發(fā)展速度,成為國家競爭力的重要組成部分和數(shù)字經(jīng)濟發(fā)展的直接驅(qū)動力[13]。數(shù)據(jù)挖掘作為改變世界的大數(shù)據(jù)技術(shù),是數(shù)據(jù)價值開發(fā)的技術(shù)支撐和數(shù)字經(jīng)濟的基礎(chǔ)推手,對其采取鼓勵和促進的態(tài)度是數(shù)據(jù)挖掘法律規(guī)制必須堅持的根本性目標(biāo)。信息安全領(lǐng)域的著名學(xué)者Kim Taipale認(rèn)為,給予新技術(shù)發(fā)展機會之前便將其扼殺在搖籃中是極不公平的,鼓勵數(shù)據(jù)挖掘技術(shù)的應(yīng)用并采取適當(dāng)?shù)囊?guī)制措施可以較好地解決其帶來的困擾[14]。無論是世界范圍內(nèi)的數(shù)據(jù)發(fā)展風(fēng)潮還是我國數(shù)據(jù)發(fā)展的實踐需求,否認(rèn)數(shù)據(jù)挖掘的重要性無異于畫地為牢,唯有持續(xù)鼓勵數(shù)據(jù)挖掘,促進技術(shù)創(chuàng)新,才能夠真正迎合我國數(shù)據(jù)發(fā)展戰(zhàn)略。
同時,針對技術(shù)發(fā)展的爭議性,我們在鼓勵技術(shù)創(chuàng)新的同時需正視數(shù)據(jù)挖掘暗含的風(fēng)險。數(shù)據(jù)挖掘帶來的困擾以個人隱私侵害等個人數(shù)據(jù)安全保護問題最為突出。個人數(shù)據(jù)是數(shù)據(jù)挖掘的基本單元,確保個人數(shù)據(jù)安全是數(shù)據(jù)挖掘的前提,也是數(shù)據(jù)挖掘的防火線。小數(shù)據(jù)時代,數(shù)據(jù)量有限且聯(lián)系并不緊密,數(shù)據(jù)安全問題易發(fā)現(xiàn)和解決,個人隱私相對隱秘不易侵犯。大數(shù)據(jù)時代,伴隨著個人數(shù)據(jù)的持續(xù)獲取和使用,確保海量多樣的個人數(shù)據(jù)被合法地挖掘,防止惡意泄漏和隱私侵害,保障公民個人數(shù)據(jù)安全是數(shù)據(jù)挖掘規(guī)制的重要目標(biāo)。
此外,數(shù)據(jù)挖掘的過程中所體現(xiàn)的多重利益沖突不容忽視,公共利益、個人利益和第三方利益是數(shù)據(jù)挖掘過程中最為突出的利益表現(xiàn)。數(shù)據(jù)挖掘所涉及的公共利益包括數(shù)據(jù)挖掘在推進社會治理、增加社會福利等方面的體現(xiàn),應(yīng)受到優(yōu)先保護。數(shù)據(jù)挖掘的基礎(chǔ)資料是個人數(shù)據(jù),個人數(shù)據(jù)之上個人的人格尊嚴(yán)與自由、個人隱私私密及信息自決等人格利益具有天然的利己性和內(nèi)向性[15]42,是公共利益的基礎(chǔ)和最終落腳點[16],不可只強調(diào)公共利益而忽視個人數(shù)據(jù)中的個人利益。此外,以數(shù)據(jù)挖掘企業(yè)為代表的第三方利益亦是數(shù)據(jù)利益中的重要體現(xiàn),對第三方利益的保護是數(shù)據(jù)市場有序運轉(zhuǎn)的核心,也是數(shù)據(jù)創(chuàng)新和數(shù)據(jù)產(chǎn)業(yè)發(fā)展的動力。公共利益、個人利益、第三方利益的平衡成為數(shù)據(jù)挖掘規(guī)制目標(biāo)中極為重要的一環(huán),通過法律之器進行利益識別和劃分,平衡利益沖突并解決社會矛盾成為必須。
個人數(shù)據(jù)保護以及數(shù)據(jù)權(quán)屬分配是數(shù)據(jù)挖掘法律規(guī)制的核心命題,在“鼓勵挖掘-安全保護-平衡協(xié)調(diào)”規(guī)制目標(biāo)的指引下,通過完善立法明確規(guī)制規(guī)則,為數(shù)據(jù)挖掘法律規(guī)制提供依據(jù)。
其一,對個人數(shù)據(jù)進行分類立法保護。從內(nèi)容上看,可將個人數(shù)據(jù)分為關(guān)聯(lián)性個人數(shù)據(jù)和非關(guān)聯(lián)性個人數(shù)據(jù),關(guān)聯(lián)性個人數(shù)據(jù)又可分為直接關(guān)聯(lián)性和非直接關(guān)聯(lián)性個人數(shù)據(jù)。直接關(guān)聯(lián)性個人數(shù)據(jù)指可以直接識別個人身份的數(shù)據(jù),如個人姓名、電話、證件號碼、家庭住址等外在性身份標(biāo)識數(shù)據(jù),是個體最基本、表層的外向標(biāo)志。非直接關(guān)聯(lián)性個人數(shù)據(jù)是指無法直接關(guān)聯(lián)到個人,但可通過與其他數(shù)據(jù)結(jié)合發(fā)現(xiàn)個人身份,包括個人的性別、郵編、醫(yī)療信息、性別取向、網(wǎng)購習(xí)慣、消費喜好等潛在表達。直接關(guān)聯(lián)性個人數(shù)據(jù)帶有直接標(biāo)識符,無需通過與其他數(shù)據(jù)關(guān)聯(lián)可直接定位識別個人[17],具有極強的私密性,這類數(shù)據(jù)的挖掘使用必須獲得個人的同意,并給予嚴(yán)格的保護,這在世界范圍內(nèi)已經(jīng)達成共識。非直接關(guān)聯(lián)性個人數(shù)據(jù)無法單獨用于識別,但可通過與其他數(shù)據(jù)的結(jié)合識別到個體,且伴隨大數(shù)據(jù)技術(shù)的應(yīng)用,此類數(shù)據(jù)數(shù)量驟增,是數(shù)據(jù)價值開發(fā)的重要元素?;诖耍瑢υ擃悢?shù)據(jù)的使用無需做到嚴(yán)苛的個人知情和同意,法律保護力度可相應(yīng)降低,應(yīng)根據(jù)使用主體、目的、途徑等綜合估量。非關(guān)聯(lián)性個人數(shù)據(jù)是指數(shù)據(jù)處理后的衍生數(shù)據(jù),該類數(shù)據(jù)為去個人身份化的匿名數(shù)據(jù),由數(shù)據(jù)挖掘主體控制,嚴(yán)格意義上不屬于個人數(shù)據(jù)范疇。但由于該類數(shù)據(jù)在使用過程中仍存在去識別化的可能,個人隱私再發(fā)現(xiàn)和侵害的風(fēng)險仍然存在,需要給予一定程度的保護。
個人數(shù)據(jù)在數(shù)字化時代極易被收集和記錄,很多時候已處于公開狀態(tài)。因而依據(jù)個人數(shù)據(jù)是否已公開,可從形式上將其分為個人已公開數(shù)據(jù)和未公開數(shù)據(jù)。前者是已經(jīng)通過合法渠道為公眾所知的個人數(shù)據(jù)或個人已公開的數(shù)據(jù),后者則仍處于未被獲知狀態(tài)。對于前者,再收集和利用無需個人同意,但應(yīng)通知相關(guān)主體;對于后者,仍需按照個人數(shù)據(jù)的內(nèi)容進行分類識別獲取和應(yīng)用[15]44。
其二,識別數(shù)據(jù)之上的利益并進行數(shù)據(jù)確權(quán)。如上所述,數(shù)據(jù)挖掘過程中涉及多種數(shù)據(jù)表現(xiàn)形態(tài)和數(shù)據(jù)主體,不同數(shù)據(jù)之上體現(xiàn)了不同的數(shù)據(jù)利益,區(qū)分?jǐn)?shù)據(jù)利益并進行相應(yīng)的賦權(quán)是解決現(xiàn)有數(shù)據(jù)利益分配難題的根本之策,也是數(shù)字經(jīng)濟持續(xù)發(fā)展的保障。學(xué)術(shù)界對此形成了數(shù)據(jù)權(quán)利說、數(shù)據(jù)利益說、數(shù)據(jù)非權(quán)益客體說等觀點,但在《民法典》《數(shù)據(jù)安全法》等立法文件中均未見此類規(guī)定。2020年7月,深圳市發(fā)布《深圳經(jīng)濟特區(qū)數(shù)據(jù)條例(征求意見稿)》,開創(chuàng)性地提出了數(shù)據(jù)權(quán)這一概念,并區(qū)分主體設(shè)置了個人數(shù)據(jù)權(quán)、公共數(shù)據(jù)權(quán)和數(shù)據(jù)要素市場主體的數(shù)據(jù)權(quán),但因?qū)Σ煌瑪?shù)據(jù)缺乏屬性界定,不同權(quán)利重合交織,相關(guān)規(guī)定與既有法律規(guī)定矛盾等問題而備受爭議[18]。日前,《深圳經(jīng)濟特區(qū)數(shù)據(jù)條例》通過,刪除原稿中第4條“數(shù)據(jù)權(quán)”的提法,代之“數(shù)據(jù)權(quán)益”的稱謂。
在數(shù)據(jù)挖掘過程中,根據(jù)數(shù)據(jù)主體的不同,可區(qū)分為個人數(shù)據(jù)主體、數(shù)據(jù)挖掘主體和公共數(shù)據(jù)主體,不同數(shù)據(jù)主體對應(yīng)不同數(shù)據(jù),分別享有數(shù)據(jù)人格權(quán)益、數(shù)據(jù)財產(chǎn)權(quán)益以及公共利益。在數(shù)據(jù)挖掘之前的數(shù)據(jù)收集、存儲過程中,數(shù)據(jù)主要以可識別的個人數(shù)據(jù)和政府等公共事務(wù)組織持有的公共數(shù)據(jù)為主,收集存儲的數(shù)據(jù)進入挖掘階段,數(shù)據(jù)挖掘主體通過清洗、脫敏、算法等數(shù)據(jù)技術(shù)對數(shù)據(jù)進行深度挖掘,產(chǎn)生具有財產(chǎn)價值的衍生數(shù)據(jù)。個人數(shù)據(jù)又可稱為個人信息,因具有可識別性特征被視作個人數(shù)據(jù)主體的組成部分,是自然人參與社會交往互動的載體,也是個體人格表現(xiàn)和發(fā)展的工具[19]。個人數(shù)據(jù)主體享有個人數(shù)據(jù)之上的人格權(quán)益,其以個人信息自決為核心,包括個人數(shù)據(jù)復(fù)制權(quán)、異議權(quán)、刪除權(quán)等積極權(quán)益以及被侵害后的救濟權(quán)益,這在我國《民法典》的個人信息保護相關(guān)章節(jié)進行了規(guī)定。數(shù)據(jù)挖掘主體對其付出時間、技術(shù)等成本挖掘形成的衍生數(shù)據(jù)享有財產(chǎn)權(quán)益,既可以占有、使用、交易(1)此處的交易為廣義的交易,包括轉(zhuǎn)讓、商事交易、共享等交換性數(shù)據(jù)獲取行為。并享有相關(guān)收益,又可以阻止其他數(shù)據(jù)處理機構(gòu)未經(jīng)其允許擅自獲取衍生數(shù)據(jù)。除個人數(shù)據(jù)主體和數(shù)據(jù)挖掘主體外,政府等公共事務(wù)組織所掌握的公共數(shù)據(jù)具有公共價值,公共數(shù)據(jù)及挖掘后產(chǎn)生的數(shù)據(jù)之上的利益應(yīng)歸屬全體社會成員所有,公共數(shù)據(jù)的使用權(quán)益則應(yīng)由政府等公共事務(wù)組織及其所授權(quán)的機構(gòu)代表社會成員行使。
合作規(guī)制是指通過多主體圍繞多中心進行多層次的合作治理從而實現(xiàn)規(guī)制目標(biāo)的治理方式,是世界法律規(guī)制的重要方式和趨勢[20]。數(shù)據(jù)挖掘的規(guī)制是一項系統(tǒng)性工程,并非依靠單個個體可完成,需依賴于數(shù)據(jù)挖掘生態(tài)系統(tǒng)中的各主體進行合作[21]。數(shù)據(jù)挖掘規(guī)制涉及的主體主要包括個人數(shù)據(jù)主體、數(shù)據(jù)挖掘主體和政府。
1.賦予個人數(shù)據(jù)主體事后選擇權(quán)
數(shù)據(jù)挖掘主體基于其所具有的信息優(yōu)勢、技術(shù)優(yōu)勢形成一定的數(shù)據(jù)權(quán)力,極易對個人數(shù)據(jù)主體的數(shù)據(jù)權(quán)利產(chǎn)生影響。對此,《民法典》《網(wǎng)絡(luò)安全法》等法律在知情同意原則基礎(chǔ)上賦予了個人數(shù)據(jù)主體復(fù)制查閱、異議更正、刪除等數(shù)據(jù)權(quán)益,并對個人隱私數(shù)據(jù)給予隱私權(quán)保護,這些規(guī)定有利于保證個人對其數(shù)據(jù)的自主控制權(quán)能,保護個人數(shù)據(jù)安全和個人隱私不受侵害。
除此之外,應(yīng)賦予個人是否接受數(shù)據(jù)挖掘及數(shù)據(jù)挖掘結(jié)果的選擇權(quán),這是知情同意原則在數(shù)據(jù)挖掘中的拓展。數(shù)據(jù)挖掘作為數(shù)據(jù)加工的重要環(huán)節(jié),使用自動化決策及其他算法技術(shù)對個人數(shù)據(jù)深度挖掘,對個體及個體行為進行深入觀察和刻畫,形成有針對性的挖掘結(jié)果影響個人選擇、決策等個人自治能力,基于數(shù)據(jù)挖掘的個性化推薦是典型體現(xiàn)。同時,因數(shù)據(jù)挖掘具有強技術(shù)依賴性,受其影響的個體很難參與到數(shù)據(jù)挖掘的過程中,個人成為數(shù)據(jù)挖掘結(jié)果的被動承擔(dān)者,甚至為錯誤的挖掘結(jié)果買單,個人被動自治、個人受到數(shù)據(jù)歧視均可歸為此類。挖掘前的知情同意固然能夠在一定程度上保護個體權(quán)利,但因無法影響挖掘過程和挖掘結(jié)果而效果不甚理想。對此,應(yīng)賦予個人事后選擇權(quán),即當(dāng)數(shù)據(jù)挖掘結(jié)果可能對個體產(chǎn)生重大影響時,權(quán)利人可自主決定是否接受數(shù)據(jù)挖掘結(jié)果,并有權(quán)對錯誤的、片面的數(shù)據(jù)挖掘結(jié)果提出質(zhì)疑、要求更正。歐盟第29 條工作組將重大影響限定為能夠?qū)€人的選擇、行為或處境產(chǎn)生重大影響或具有重大影響的強潛在可能性,極端的情況下甚至?xí):€人權(quán)利,如個人權(quán)利排除或歧視[22]184。我國《電子商務(wù)法》中數(shù)據(jù)平臺向用戶提供個性化推薦服務(wù)時應(yīng)同時提供無個性化推薦選項的相關(guān)規(guī)定從側(cè)面肯定了事后選擇權(quán)。事后選擇權(quán)是個人數(shù)據(jù)主體參與影響數(shù)據(jù)挖掘結(jié)果的體現(xiàn),其實現(xiàn)有賴于數(shù)據(jù)挖掘主體所提供的保障,將在下文中詳細(xì)闡述。
2.明確數(shù)據(jù)挖掘主體的保護義務(wù)
其一,采用數(shù)據(jù)脫敏及匿名化技術(shù)保護個人數(shù)據(jù)安全和隱私。數(shù)據(jù)脫敏是大數(shù)據(jù)安全及隱私保護的關(guān)鍵技術(shù),其通過數(shù)據(jù)變形處理敏感數(shù)據(jù),降低數(shù)據(jù)敏感程度,減少敏感數(shù)據(jù)暴露的可能和泄露的風(fēng)險,以實現(xiàn)敏感數(shù)據(jù)的保護。數(shù)據(jù)脫敏針對不同場景、不同數(shù)據(jù)處理目的以及不同數(shù)據(jù)敏感程度,采取有差異的脫敏規(guī)則和算法,對數(shù)據(jù)給予不同程度的脫敏處理,實現(xiàn)數(shù)據(jù)安全、私密與數(shù)據(jù)可用性的統(tǒng)一。常用的脫敏算法包括數(shù)據(jù)加密、數(shù)據(jù)掩碼、數(shù)據(jù)替換以及數(shù)據(jù)模糊[23]。此外,為實現(xiàn)更高程度的脫敏保護,滿足高敏感度數(shù)據(jù)保護的需求,匿名化應(yīng)運而生,成為保障個人數(shù)據(jù)安全和隱私保護的重要方式之一。個人數(shù)據(jù)匿名化又稱為個人數(shù)據(jù)去身份化,該技術(shù)已為世界主要數(shù)據(jù)體所普遍應(yīng)用。歐盟GDPR將匿名化界定為通過某種方式對個人數(shù)據(jù)處理后,沒有額外數(shù)據(jù)則不能識別數(shù)據(jù)主體的數(shù)據(jù)處理方式[24]。我國《網(wǎng)絡(luò)安全法》第42條采取“經(jīng)過處理無法識別特定個人且不能復(fù)原”的規(guī)定側(cè)面體現(xiàn)了匿名化這一理念(2)我國多項個人信息規(guī)范性文件中存在匿名化的相關(guān)規(guī)定:2014年發(fā)布的《中國互聯(lián)網(wǎng)定向廣告用戶信息保護去身份化指引》將匿名化界定為“通過對某項信息或信息的集合(例如數(shù)據(jù)集)進行變更,以達到去除或模糊個人身份關(guān)聯(lián)信息目的的過程,從而實現(xiàn)信息轉(zhuǎn)移或公開時的保密和隱私目的”。2020年3月發(fā)布、2020年10月生效的GB/T 35273-2020《信息安全技術(shù) 個人信息安全規(guī)范》將匿名化規(guī)定為“通過對個人信息的技術(shù)處理,使得個人信息主體無法被識別或者關(guān)聯(lián),且處理后的信息不能被復(fù)原的過程”,并認(rèn)為經(jīng)匿名化處理后所得的信息不屬于個人信息。日前發(fā)布的《網(wǎng)絡(luò)安全標(biāo)準(zhǔn)實踐指南——移動互聯(lián)網(wǎng)應(yīng)用程序(App)收集使用個人信息自評估指南》評估點五中規(guī)定向他人提供個人信息前須征得用戶同意,經(jīng)匿名化處理的除外。。匿名化的目的是通過技術(shù)手段將個人數(shù)據(jù)中的人格要素剝離,降低數(shù)據(jù)流通中的隱私風(fēng)險,發(fā)揮數(shù)據(jù)的使用價值。
在數(shù)據(jù)挖掘的過程中,個人數(shù)據(jù)匿名化屬于數(shù)據(jù)預(yù)處理階段,是數(shù)據(jù)挖掘主體應(yīng)采取的重要技術(shù)。個人數(shù)據(jù)匿名化的重點包括:第一,結(jié)合個人數(shù)據(jù)分類確立匿名化的標(biāo)準(zhǔn)。根據(jù)上文對個人數(shù)據(jù)的劃分,關(guān)聯(lián)性個人數(shù)據(jù)是匿名化的重點,直接關(guān)聯(lián)性個人數(shù)據(jù)含有識別個體的直接標(biāo)識符,如姓名、身份證號碼、家庭住址等,屬于個人隱私數(shù)據(jù)或與個人密切相關(guān)的數(shù)據(jù),需將直接標(biāo)識符去除或改變方可實現(xiàn)此類數(shù)據(jù)的匿名化。非直接關(guān)聯(lián)性個人數(shù)據(jù)中包含的間接標(biāo)識符可識別性相對較弱,無法直接關(guān)聯(lián)到個體,但具有潛在識別性和關(guān)聯(lián)識別性。伴隨網(wǎng)絡(luò)服務(wù)范圍的不斷擴展,網(wǎng)絡(luò)行為驟增,購物潛能、出行喜好等新型間接標(biāo)識符層出不窮,是數(shù)據(jù)價值開發(fā)的重要元素?;诖?,針對非直接關(guān)聯(lián)性個人數(shù)據(jù)中的間接標(biāo)識符的處理不可一概而論,應(yīng)結(jié)合具體的使用場景和隱私風(fēng)險評估決定[25]。第二,個人數(shù)據(jù)匿名化必須高度重視再識別技術(shù)的規(guī)制。匿名化的個人數(shù)據(jù)在實踐中屢次被再識別,引發(fā)專家學(xué)者的質(zhì)疑,美國學(xué)者Paul Ohm 認(rèn)為,匿名化這一技術(shù)手段在個人隱私保護中的作用甚微,其無法阻止惡意入侵和再識別,并指出匿名化這一理念已走向滅亡[11]1732。然而,匿名化追求的是風(fēng)險最小化,而非絕對無風(fēng)險。匿名化和再識別兩項技術(shù)在發(fā)展中相互博弈,我們不能因此直接否認(rèn)匿名化的作用,而是應(yīng)對再識別進行限制。需從法律層面要求數(shù)據(jù)挖掘主體承諾不再重新進行個人數(shù)據(jù)的識別,且在向第三方提供數(shù)據(jù)時以協(xié)議等形式要求第三方不得再識別匿名化的個人數(shù)據(jù)。這在《中國互聯(lián)網(wǎng)定向廣告用戶信息保護行業(yè)框架標(biāo)準(zhǔn)》中有所體現(xiàn),但因標(biāo)準(zhǔn)效力不足,禁止再識別并未引起業(yè)界的重視。美國法對此做了詳細(xì)規(guī)定,將數(shù)據(jù)處理機構(gòu)承諾不進行數(shù)據(jù)再識別并通過協(xié)議禁止其下游接收方再識別作為匿名化的標(biāo)準(zhǔn)之一。我國相關(guān)立法應(yīng)對此進行吸納,并設(shè)置相應(yīng)的處罰措施[26]。同時,從技術(shù)層面對數(shù)據(jù)挖掘過程中的安全和隱私風(fēng)險進行持續(xù)監(jiān)測,將安全和隱私風(fēng)險監(jiān)測鑲嵌到數(shù)據(jù)挖掘過程中,做到實時持續(xù)監(jiān)控識別風(fēng)險。
其二,防止數(shù)據(jù)挖掘行為影響其他個人權(quán)益和社會公共秩序。通過對數(shù)據(jù)挖掘正當(dāng)性困境的分析發(fā)現(xiàn),除個人數(shù)據(jù)安全和隱私侵害外,數(shù)據(jù)挖掘易產(chǎn)生數(shù)據(jù)歧視、個人自治難題等,對個人權(quán)益及社會治理造成不利影響,究其根源是數(shù)據(jù)挖掘所依賴的算法的黑箱性所致。外部個體很難獲知算法運行的過程,從而成為數(shù)據(jù)挖掘結(jié)果的被動承擔(dān)者。對此,應(yīng)明確數(shù)據(jù)挖掘主體對挖掘算法的評估義務(wù)以及對挖掘結(jié)果的解釋義務(wù),并為個人數(shù)據(jù)主體提供應(yīng)對數(shù)據(jù)挖掘結(jié)果的選擇、異議及更正的渠道。
首先,數(shù)據(jù)挖掘主體應(yīng)在挖掘開始前對挖掘所依托的算法進行審查和評估,對其中可能存在危害個人權(quán)益及公共秩序的設(shè)計進行整改,即數(shù)據(jù)挖掘所依托的算法必須符合社會倫理準(zhǔn)則[22]186。其既包括對算法所使用的數(shù)據(jù)準(zhǔn)確性的審查,防止因基礎(chǔ)數(shù)據(jù)錯誤而導(dǎo)致的算法偏差,又包括排除數(shù)據(jù)挖掘主體主觀因素干預(yù)算法設(shè)計運轉(zhuǎn)。此外,數(shù)據(jù)挖掘主體還應(yīng)進行算法影響評估,通過落實審查和評估義務(wù),數(shù)據(jù)挖掘主體能夠在事前對挖掘所依賴的算法進行全面掌握和排查,降低算法設(shè)計層面的侵害可能。其次,數(shù)據(jù)挖掘?qū)?shù)據(jù)的加工是一個持續(xù)且未知的過程,這加劇了數(shù)據(jù)挖掘主體和受影響的個體之間的信息不對稱以及力量失衡的狀況,對數(shù)據(jù)行業(yè)長期健康發(fā)展極為不利。解決這一問題的關(guān)鍵便是使受挖掘結(jié)果影響的個體能夠參與到數(shù)據(jù)挖掘中并有權(quán)反向影響挖掘結(jié)果,除上文提到的賦予個人數(shù)據(jù)主體事后選擇權(quán)外,為數(shù)據(jù)挖掘主體配置相應(yīng)的義務(wù)必不可少。選擇權(quán)的前提是知情,這要求數(shù)據(jù)挖掘主體對影響個體權(quán)利和公共利益的結(jié)果作出解釋并通知相應(yīng)主體,解釋內(nèi)容并非挖掘使用的源代碼、依托的算法模型及體現(xiàn)的運算邏輯,而應(yīng)指影響挖掘結(jié)果的輸入變量及變量影響權(quán)重。此外,數(shù)據(jù)挖掘主體還需明示對數(shù)據(jù)挖掘結(jié)果進行異議及更正的方式和渠道。如征信機構(gòu)需解釋影響個人信用的因素(信用歷史、當(dāng)前負(fù)債等),并提供異議和修復(fù)信用的方式和渠道。
3.落實政府的數(shù)據(jù)推進和監(jiān)管職責(zé)
政府在數(shù)據(jù)挖掘規(guī)制中具有雙重身份,其既是政府?dāng)?shù)據(jù)的管理者,肩負(fù)推進政府?dāng)?shù)據(jù)挖掘利用的職責(zé),同時,作為監(jiān)管方又需要承擔(dān)數(shù)據(jù)挖掘監(jiān)管責(zé)任。
政府部門掌握的政府?dāng)?shù)據(jù)是政府部門在履行行政職能、進行社會事務(wù)管理的過程中收集并積累的數(shù)據(jù),其屬于公共物品和社會公共資源。近年來,我國政府高度重視政府?dāng)?shù)據(jù)開放共享,出臺相關(guān)法律和政策文件鼓勵支持政府?dāng)?shù)據(jù)的利用,不斷推出數(shù)據(jù)開放平臺,并取得了較大成效。但現(xiàn)階段我國政府?dāng)?shù)據(jù)的開放利用水平仍處于初級階段,存在不同政府部門間數(shù)據(jù)割裂,部門關(guān)于數(shù)據(jù)利用的職能交叉、模糊,數(shù)據(jù)利用率低等問題。政府應(yīng)著力解決現(xiàn)有數(shù)據(jù)開放中存在的問題,制定相應(yīng)的法律法規(guī)及指導(dǎo)性文件,在保證國家秘密、商業(yè)秘密和個人隱私不受侵害的前提下,設(shè)置政府?dāng)?shù)據(jù)挖掘使用的脫敏規(guī)則、風(fēng)險防控體系及數(shù)據(jù)溯源體系等,并可與數(shù)據(jù)挖掘主體合作,推進政府?dāng)?shù)據(jù)挖掘進程,促進政府?dāng)?shù)據(jù)價值發(fā)掘[27]。
此外,政府應(yīng)承擔(dān)數(shù)據(jù)挖掘監(jiān)管職責(zé)。對于數(shù)據(jù)挖掘行為,一方面,政府應(yīng)發(fā)揮引導(dǎo)規(guī)范作用,通過行政規(guī)章、辦法、指南等規(guī)范數(shù)據(jù)挖掘行為,其既包括標(biāo)準(zhǔn)性規(guī)范引導(dǎo)數(shù)據(jù)挖掘行為,如GB/T 35273-2020《信息安全技術(shù) 個人信息安全規(guī)范》對匿名化的要求,又包括針對不法或不合理的數(shù)據(jù)挖掘行為的限制性規(guī)定,表現(xiàn)為不得、不能、不準(zhǔn)等類型的規(guī)定。未來,有必要在現(xiàn)有標(biāo)準(zhǔn)基礎(chǔ)上出臺涵蓋數(shù)據(jù)挖掘全周期的標(biāo)準(zhǔn)規(guī)范,并上升到立法層面。具體包括挖掘前的數(shù)據(jù)收集、分類標(biāo)準(zhǔn),挖掘過程中的數(shù)據(jù)脫敏標(biāo)準(zhǔn),挖掘結(jié)果的輸出轉(zhuǎn)化及交易等應(yīng)用標(biāo)準(zhǔn),以及整個挖掘過程中隱私保護和數(shù)據(jù)安全標(biāo)準(zhǔn)等。此外,政府應(yīng)承擔(dān)數(shù)據(jù)挖掘市場監(jiān)管責(zé)任,對非法挖掘、數(shù)據(jù)寡頭等危害市場秩序的行為進行干預(yù),既可采用行政約談、行政處罰等方式懲罰非法挖掘等行為,又可以通過技術(shù)支持和稅收引導(dǎo)適當(dāng)傾斜新技術(shù)企業(yè)或中小企業(yè),防止數(shù)據(jù)壟斷。此外,對于惡意損害個人權(quán)益、危害社會公共利益的數(shù)據(jù)挖掘主體,政府可給予吊銷營業(yè)執(zhí)照、取消市場準(zhǔn)入資格等嚴(yán)厲的處罰。
數(shù)據(jù)挖掘作為數(shù)據(jù)價值實現(xiàn)的基本技術(shù)手段本身是中立的,但技術(shù)發(fā)展所帶來的利益和問題使其具有了正當(dāng)性探討的必要和法律規(guī)制的需求。新技術(shù)的法律規(guī)制必須處理好技術(shù)發(fā)展和法律規(guī)則的關(guān)系,技術(shù)的進步和法律的規(guī)制不是零和博弈,拋開法律一味地發(fā)展技術(shù)必將引發(fā)社會危機,完全依靠法律解決技術(shù)問題亦不可行。應(yīng)立足我國數(shù)據(jù)發(fā)展實踐,實現(xiàn)技術(shù)信仰和法律信仰的平衡,鼓勵數(shù)據(jù)挖掘技術(shù)應(yīng)用,推進數(shù)據(jù)挖掘與個人數(shù)據(jù)保護的統(tǒng)一,做到數(shù)據(jù)價值開發(fā)與數(shù)據(jù)利益分配的協(xié)調(diào),創(chuàng)新技術(shù)手段和法律規(guī)則的設(shè)計來實現(xiàn)二者的互動,通過個人數(shù)據(jù)主體、數(shù)據(jù)挖掘主體及政府的合作規(guī)制實現(xiàn)我國數(shù)據(jù)治理戰(zhàn)略目標(biāo)。數(shù)據(jù)挖掘所產(chǎn)生的規(guī)制需求歸根結(jié)底是技術(shù)性問題向社會問題、法律問題的拓展,技術(shù)的進步先于法律,但又需與法律相統(tǒng)一,方可實現(xiàn)二者的良性互動。