• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      無(wú)需打開(kāi)“黑箱”的反事實(shí)解釋:自動(dòng)化決策和《通用數(shù)據(jù)保護(hù)條例》*

      2022-07-11 15:00:34桑德拉沃切特布倫特米特爾斯塔德克里斯拉塞爾陳宇超
      關(guān)鍵詞:決策主體算法

      桑德拉·沃切特 布倫特·米特爾斯塔德 克里斯·拉塞爾/文 陳宇超/譯

      一、引言

      關(guān)于歐盟《通用數(shù)據(jù)保護(hù)條例》(以下簡(jiǎn)稱GDPR)中是否存在“解釋權(quán)”及其優(yōu)缺點(diǎn),已經(jīng)有了很多討論。通過(guò)打開(kāi)“黑箱”以深入了解算法內(nèi)部的決策過(guò)程來(lái)行使解釋權(quán)的辦法,面臨四個(gè)主要的法律和技術(shù)障礙。第一,GDPR中不存在具有法律約束力的解釋權(quán)。第二,即使解釋權(quán)具有法律約束力,該權(quán)利也僅適用于有限的情況(例如當(dāng)一個(gè)消極決策是完全自動(dòng)化作出的,且其具有法律效力或其他類似的重大影響)。第三,解釋復(fù)雜算法決策系統(tǒng)的功能和其在特定情況下的基本原理是一個(gè)技術(shù)上具有挑戰(zhàn)性的問(wèn)題。解釋同樣可能無(wú)法為數(shù)據(jù)主體提供有意義的信息,從而引發(fā)對(duì)其價(jià)值的質(zhì)疑。第四,數(shù)據(jù)控制者傾向于不共享其算法的詳細(xì)信息,以避免泄露商業(yè)秘密、侵犯他人的權(quán)利和自由(例如隱私)或使得數(shù)據(jù)主體(數(shù)據(jù)正在被收集和評(píng)估的自然人)刻意操縱決策系統(tǒng)。

      雖然存在這些困難,但向受影響的數(shù)據(jù)主體提供解釋的社會(huì)價(jià)值和道德義務(wù)(或許還有法律責(zé)任)始終存在。這項(xiàng)討論忽略了一個(gè)重點(diǎn),對(duì)自動(dòng)化決策的解釋,無(wú)論是GDPR所設(shè)想的還是一般意義上的,都不必然取決于公眾如何理解算法系統(tǒng)的運(yùn)作。雖然這種可解釋性非常重要并且應(yīng)該被跟進(jìn)落實(shí),但原則上可以在不打開(kāi)“黑箱”的情況下提供解釋。將解釋視為幫助數(shù)據(jù)主體采取行動(dòng),而不僅僅是幫助理解的一種手段,則數(shù)據(jù)控制者可以根據(jù)他們預(yù)定支持的特定目標(biāo)或行動(dòng)來(lái)衡量解釋的范圍和內(nèi)容。

      解釋可以用于許多目標(biāo)。為了明確解釋的潛在范圍,從數(shù)據(jù)主體的角度出發(fā)似乎是合理的。我們提出了三個(gè)幫助數(shù)據(jù)主體的解釋目標(biāo):(1)告知并幫助數(shù)據(jù)主體理解為什么作出特定決策;(2)為質(zhì)疑不利的決策提供理由;(3)基于當(dāng)前的決策模型,了解改變什么可以在未來(lái)獲得預(yù)期的結(jié)果。正如我們所展示的,GDPR幾乎沒(méi)有為實(shí)現(xiàn)任一上述目標(biāo)提供支持。同時(shí),上述目標(biāo)無(wú)一取決于自動(dòng)化決策系統(tǒng)內(nèi)部邏輯的解釋。

      建立信任對(duì)于提高社會(huì)對(duì)算法決策的接受度至關(guān)重要。為了彌補(bǔ)目前破壞數(shù)據(jù)控制者和數(shù)據(jù)主體之間信任的透明度和問(wèn)責(zé)制缺口,我們建議超越GDPR的限制。我們認(rèn)為,反事實(shí)應(yīng)該作為對(duì)自動(dòng)化決策提供解釋的重要手段。

      應(yīng)該對(duì)積極和消極的自動(dòng)化決策給出“無(wú)條件的反事實(shí)解釋”,無(wú)論這些決策是完全(與“主要地”相對(duì))自動(dòng)化作出的,還是產(chǎn)生了法律或其他重大影響。這種方法為數(shù)據(jù)主體提供了有意義的解釋,用以理解特定的決策、知曉質(zhì)疑決策的理由,以及建議數(shù)據(jù)主體如何改變其行為或情況以便在未來(lái)可能獲得所需決策(例如貸款批準(zhǔn)),而這些無(wú)需面對(duì)GDPR關(guān)于自動(dòng)化決策定義所強(qiáng)加的嚴(yán)重性適用限制。

      在本文中,我們將“無(wú)條件反事實(shí)解釋”的概念作為一種新型的自動(dòng)化決策解釋機(jī)制,其克服了有關(guān)算法可解釋性和問(wèn)責(zé)制的許多問(wèn)題。通過(guò)將反事實(shí)理論置于分析哲學(xué)史中,以及長(zhǎng)久以來(lái)對(duì)機(jī)器學(xué)習(xí)領(lǐng)域可解釋性和公平性的研究中,基于反事實(shí)解釋為數(shù)據(jù)主體提供的潛在優(yōu)勢(shì),我們將評(píng)估它們與GDPR中關(guān)于自動(dòng)化決策眾多規(guī)定的一致性。具體而言,我們核查GDPR是否支持旨在幫助數(shù)據(jù)主體了解自動(dòng)化決策范圍、特定決策基本原理的解釋,質(zhì)疑決策的解釋以及指導(dǎo)數(shù)據(jù)主體改變行為以獲得預(yù)期結(jié)果的解釋。我們得出的結(jié)論是,無(wú)條件的反事實(shí)解釋可以彌合數(shù)據(jù)主體和數(shù)據(jù)控制者之間的利益差距,否則這種利益差距就會(huì)成為行使具有法律約束力解釋權(quán)的障礙。

      二、反事實(shí)

      反事實(shí)解釋采用與陳述句類似的形式:

      你被拒絕貸款,因?yàn)槟愕哪晔杖霝?0000英鎊。如果你的收入是40000英鎊,你就能獲得貸款。

      上述決策之后是一個(gè)反事實(shí)陳述,或者說(shuō)情景必須如何改變才能發(fā)生理想結(jié)果的陳述。反事實(shí)可能有多個(gè),因?yàn)榭梢源嬖诙鄠€(gè)理想結(jié)果,并且可能有多種方法來(lái)實(shí)現(xiàn)其中的任何一個(gè)。“最接近可能情景”的概念或?yàn)楂@得理想結(jié)果而對(duì)情景做出的最小改變,是整個(gè)反事實(shí)理論討論的關(guān)鍵。在很多情況下,提供涵蓋對(duì)應(yīng)息息相關(guān)或信息豐富的“相近可能情景”的一系列反事實(shí)解釋,比起提供對(duì)應(yīng)“最接近可能情景”的反事實(shí)解釋可能更有幫助。同時(shí),了解一個(gè)變量或一組變量的最小可能變化以達(dá)到不同的結(jié)果可能并不總是最有用的反事實(shí)類型。相反,相關(guān)性還取決于其他的特定情況因素,例如變量的可變性或現(xiàn)實(shí)情景的變化概率。

      在現(xiàn)有文獻(xiàn)中,“解釋”通常是指試圖傳達(dá)導(dǎo)致決策結(jié)果算法的內(nèi)部狀態(tài)或邏輯。相反,反事實(shí)依賴于導(dǎo)致決策的外部事實(shí),這是一個(gè)關(guān)鍵的區(qū)別。在現(xiàn)代機(jī)器學(xué)習(xí)中,算法的內(nèi)部狀態(tài)可以由數(shù)百萬(wàn)個(gè)變量組成,這些變量交織成了一個(gè)關(guān)于決定性行為的龐大網(wǎng)絡(luò)。如果允許數(shù)據(jù)主體推理算法的行為,以這種方式將(算法內(nèi)部)狀態(tài)傳達(dá)給非專業(yè)人士是極具挑戰(zhàn)性的。

      什么是解釋?機(jī)器學(xué)習(xí)領(lǐng)域和法律領(lǐng)域?qū)Υ说挠^點(diǎn)都相對(duì)有限。機(jī)器學(xué)習(xí)領(lǐng)域主要關(guān)注調(diào)適和傳達(dá)算法的近似值,程序員或研究人員可以使用這些結(jié)果來(lái)理解哪些特征是重要的。而法律和倫理學(xué)者更關(guān)心了解決策的內(nèi)在邏輯,以此作為評(píng)估決策合法性(例如防止歧視性結(jié)果)、質(zhì)疑決策、普遍增加問(wèn)責(zé)制和澄清責(zé)任的一種手段。

      因此,這里提出的將反事實(shí)作為解釋的提議不屬于先前在機(jī)器學(xué)習(xí)、法律和倫理領(lǐng)域的文獻(xiàn)中提出的解釋分類法。相比之下,正如我們?cè)谙乱还?jié)中討論的那樣,分析哲學(xué)對(duì)知識(shí)以及如何將反事實(shí)用于信念的理由采取了更廣泛的觀點(diǎn)。

      (一)歷史背景與知識(shí)問(wèn)題

      分析哲學(xué)在分析命題知識(shí)的必要條件方面有著悠久的歷史。這種類型的表達(dá)式“S了解P”構(gòu)成了知識(shí),S指了解主體,P指已知的命題。傳統(tǒng)方法將知識(shí)視為“有正當(dāng)理由的真實(shí)信念”,認(rèn)為構(gòu)成知識(shí)有三個(gè)必要條件:事實(shí)、信念和理由。根據(jù)這種三要素方法,為知道某件事,僅僅相信某事是真的是不夠的,相反,你還必須有充分的理由相信這件事。這種方法的相關(guān)性來(lái)自這樣一種觀點(diǎn):即這種對(duì)信念進(jìn)行辯護(hù)的形式可以作為一種解釋,因?yàn)樗浅钟行拍畹母驹?,因此可以作為?wèn)題的答案,“你為什么相信X?”理解這些理由可以采取不同形式,為比以前在可解釋性研究中遇到的更廣泛的解釋類別打開(kāi)了大門(mén)。

      盡管具有廣泛的影響力,但“有正當(dāng)理由的真實(shí)信念”已經(jīng)面臨很多批評(píng),并且激發(fā)了對(duì)修改這種三要素方法的實(shí)質(zhì)性分析,以及對(duì)構(gòu)成知識(shí)命題的額外必要條件的建議。模態(tài)條件,包括安全性和敏感性,已經(jīng)被提議作為建立在反事實(shí)關(guān)系中三要素的必要補(bǔ)充。

      歐內(nèi)斯特·索薩(Ernest Sosa)、喬納森·市川(Jonathan Ichikawa)1Ernest Sosa,How to Defeat Opposition to Moore,Philosophical Perspectives,vol.13,Epistemology,1999.和馬蒂亞斯·斯托普(Matthias Steup)2Jonathan Ichikawa and Matthias Steup,The Analysis of Knowledge,in Stanford Encyclopedia of Philosophy Archives,https://plato.stanford.edu/archives/fa/entries/knowledge-analysis.將敏感性定義為:

      如果P是假的,S將不相信P。

      其中,“如果P是假的”的陳述是一個(gè)反事實(shí),其定義了一個(gè)接近“P是真的”的情景的“可能情況”。敏感性條件表明:“在非P的最接近的可能情景中,主體(S)不相信P?!蔽覀兊姆词聦?shí)解釋概念取決于相關(guān)概念:

      如果Q是假的,S將不相信P。

      我們認(rèn)為在這種情形中,Q作為S對(duì)于P信念的一個(gè)解釋,因?yàn)镾只在Q為真時(shí)才相信P,且改變了Q也將會(huì)引起S對(duì)P的信念變化。關(guān)鍵是這樣的陳述只描述了S的信念,而不需要反映現(xiàn)實(shí)。如此,可以在不知道任何Q和P之間因果關(guān)系的情況下做出這些陳述。

      我們將反事實(shí)解釋定義為采用以下形式的陳述:

      返回得分為P,因?yàn)樽兞縑(v1,v2……)具有與其相關(guān)聯(lián)的值。如果V的值改變?yōu)椋╲1’,v2’……),并且所有其他變量都保持不變,返回得分為P’。

      雖然可能有許多這樣的解釋,但理想的反事實(shí)解釋將盡可能少地改變數(shù)值,并代表一個(gè)最接近的情景,在該情景下返回值為P’而不是P。因此,“最接近可能情景”的概念隱含在我們的定義中。

      通過(guò)識(shí)別變量的變化,我們的反事實(shí)版本可能最類似于執(zhí)行中的結(jié)構(gòu)方程方法。無(wú)論如何,我們的方法不依賴于對(duì)情景因果結(jié)構(gòu)的了解,或者認(rèn)為使用上下文相關(guān)的情景間的距離度量來(lái)建立因果關(guān)系更可取。在許多情況下,多樣化的反事實(shí)解釋將提供更大的信息量,對(duì)應(yīng)于附近可能情景的不同選擇,這些情景提供了反事實(shí)成立或首選結(jié)果,而不是理論上根據(jù)首選距離度量來(lái)描述“最接近的可能情景”的理想反事實(shí)。具體案例的考慮因素將與距離度量的選擇以及一組“充分”和“相關(guān)”的反事實(shí)解釋有關(guān)。此類考慮因素可能包括有關(guān)個(gè)人的能力、敏感性、決策中涉及的變量的可變性以及披露的道德或法律要求。

      類似地,可以提供描述模型內(nèi)多個(gè)變量變化的反事實(shí)。這些反事實(shí)將代表因個(gè)人情況的變化而可能帶來(lái)的未來(lái)。例如,收入變化的影響可以與職業(yè)變化結(jié)合計(jì)算,從而確保反事實(shí)代表一個(gè)現(xiàn)實(shí)的可能情景。

      (二)在人工智能和機(jī)器學(xué)習(xí)領(lǐng)域的解釋

      人工智能領(lǐng)域中,大部分對(duì)由專家作出或是基于規(guī)則系統(tǒng)作出的決策進(jìn)行解釋的早期機(jī)制,重點(diǎn)在于與反事實(shí)密切相關(guān)的解釋類別。例如,雪莉·格雷戈?duì)枺⊿hirley Gregor)和伊扎克·本巴薩特(Izak Benbasat)1Shirley Gregor and Izak Benbasat,Explanations from Intelligent Systems:Theoretical Foundations and Implications for Practice,MIS Quarterly,vol.23,no.4,Dec.1999.提供了被他們稱為“1型”的解釋例子:

      Q:為什么減稅是合適的?

      A:因?yàn)闇p稅的先決條件是高通脹和貿(mào)易逆差,而當(dāng)前的情況表明了這些因素。

      布魯斯·布坎南(Bruce Buchannan)和愛(ài)德華·肖特里菲(Edward Shortliffe)2Bruce G.Buchanan and Edward D.Shortliffe,Rule-based Expert Systems:The Mycin Experiments of the Stanford Heuristic Programming Project 344,1984.提供了一個(gè)類似的例子:

      規(guī)則009,如果:

      1)生物體的革蘭氏染色為革蘭氏陰性,并且

      2)生物體形態(tài)為球菌。

      那么,有明顯的指向性證據(jù)表明該生物為奈瑟菌。

      正如早期人工智能中的典型情況,也是我們現(xiàn)在認(rèn)為很難解決的問(wèn)題,“我們?nèi)绾未_定通貨膨脹是否嚴(yán)重?”或“為什么這些是減稅的先決條件?”過(guò)去解決的辦法是假設(shè)這些問(wèn)題假定已被人類解決,并且不作為解釋的一部分進(jìn)行討論。因此,這些解釋并不能洞察機(jī)器學(xué)習(xí)中黑箱分類器的內(nèi)部邏輯。相反,第一個(gè)例子可以改寫(xiě)為兩種不同的反事實(shí)陳述:

      如果通脹低,減稅政策將不會(huì)受到推崇。

      如果沒(méi)有貿(mào)易逆差,減稅政策將不會(huì)受到推崇。

      以及第二個(gè)例子與反事實(shí)密切相關(guān):

      如果生物體的革蘭氏染色為陰性或形態(tài)不是球菌,則該算法不會(huì)確信其是奈瑟菌。

      這些早期方法與反事實(shí)方法之間最重要的區(qū)別在于,反事實(shí)方法以端到端的集成方法持續(xù)發(fā)揮作用。如果上述示例中的革蘭氏染色和形態(tài)學(xué)也由算法確定,反事實(shí)將自動(dòng)返回具有不同分類的近似樣本,而這些早期方法無(wú)法應(yīng)用于此類涉及的場(chǎng)景。

      隨著焦點(diǎn)已從人工智能和基于邏輯的系統(tǒng)轉(zhuǎn)向機(jī)器學(xué)習(xí),例如圖像識(shí)別,解釋的概念開(kāi)始指深入了解算法內(nèi)部狀態(tài),或是指人類可理解的算法近似值。因此,與我們最相關(guān)的機(jī)器學(xué)習(xí)機(jī)制是由大衛(wèi)·馬頓斯(David Martens)和福斯特·普羅沃斯(Foster Provost)完成的。3David Martens and Foster Provost,Explaining Data-Driven Document Classifications,MIS Quarterly,vol.38,2014.在機(jī)器學(xué)習(xí)的其他工作中,他們的工作與我們一樣,對(duì)進(jìn)行干預(yù)以改變分類器響應(yīng)的結(jié)果有著共同的興趣。

      機(jī)器學(xué)習(xí)中關(guān)于解釋和解釋模型的大部分機(jī)制都與生成簡(jiǎn)單模型作為決策的局部近似值有關(guān)。通常,這個(gè)想法是創(chuàng)建一個(gè)普通人可理解的決策算法近似值,該算法可以對(duì)當(dāng)前輸入的給定決策進(jìn)行準(zhǔn)確建模,但如果改變輸入的決策,可能會(huì)出現(xiàn)武斷的糟糕結(jié)果。然而,將這些方法作為面向適合數(shù)據(jù)主體的解釋方法存在許多困難。

      一般而言,尚不清楚這些模型是否可由非專業(yè)人員解釋。他們?cè)诮浦档馁|(zhì)量、函數(shù)的易理解性和近似值有效的域的大小之間進(jìn)行了三方權(quán)衡。即使在單變量的簡(jiǎn)單場(chǎng)景中,這些局部模型也可能對(duì)變量的重要性產(chǎn)生大相徑庭的估量,這使得推斷函數(shù)如何隨著輸入的變量而變化變得極其困難。此外,這些方法在專業(yè)程序員調(diào)試的模型之外的效用尚不清楚。關(guān)于如何讓非專業(yè)受眾理解這些方法的各種局限性和不可靠性,以便他們能夠使用這些解釋機(jī)制,尚待進(jìn)行研究。

      相比之下,反事實(shí)解釋是刻意被限制的。它們創(chuàng)設(shè)了一種方式,即提供能夠改變決策的最少量信息,并且數(shù)據(jù)主體不需要了解模型的任何內(nèi)部邏輯就可使用它。這樣做的缺點(diǎn)是個(gè)別反事實(shí)可能過(guò)于嚴(yán)格。一個(gè)反事實(shí)可能表明決策是如何基于某些數(shù)據(jù)作出的,這些數(shù)據(jù)雖然正確但無(wú)法在未來(lái)決策之前被數(shù)據(jù)主體更改,即使存在可以被修改以獲得有利結(jié)果的可能。這個(gè)問(wèn)題可以通過(guò)向數(shù)據(jù)主體提供多種不同的反事實(shí)解釋來(lái)解決。

      (三)對(duì)抗性擾動(dòng)和反事實(shí)解釋

      用于在深度網(wǎng)絡(luò)(例如殘差網(wǎng)絡(luò)ResNet)上生成反事實(shí)解釋的機(jī)制已經(jīng)在機(jī)器學(xué)習(xí)的文獻(xiàn)中以“對(duì)抗性擾動(dòng)”為名進(jìn)行了廣泛研究。在這些機(jī)制中,能夠計(jì)算反事實(shí)的算法用于混淆現(xiàn)有分類器,通過(guò)生成與現(xiàn)有分類器接近的合成數(shù)據(jù)點(diǎn),從而使新合成的數(shù)據(jù)點(diǎn)與原先的數(shù)據(jù)點(diǎn)歸入不同的分類。

      反事實(shí)的一個(gè)優(yōu)勢(shì)在于,它們可以通過(guò)標(biāo)準(zhǔn)機(jī)制甚至前沿架構(gòu)進(jìn)行高效和有效的計(jì)算。一些最大和最深的神經(jīng)網(wǎng)絡(luò)被用于計(jì)算機(jī)視覺(jué)領(lǐng)域,特別是在ImageNet等圖像標(biāo)記任務(wù)中。這些類型的分類器已被證明特別容易受到對(duì)抗性擾動(dòng)的攻擊,對(duì)給定圖像的微小改動(dòng)可能導(dǎo)致圖像被分配到完全不同的類別。例如,DeepFool將給定分類器的圖像X的不利擾動(dòng)定義為X的最小變化,從而使其分類發(fā)生改變。從本質(zhì)上講,這是一個(gè)不同名稱的反事實(shí)。在距離函數(shù)的正確選擇下,找到一個(gè)最接近X的可能情景,使得分類變化與找到X的最小變化相同。

      重要的是,對(duì)抗性擾動(dòng)的標(biāo)準(zhǔn)機(jī)制都沒(méi)有使用適當(dāng)?shù)木嚯x函數(shù),并且大多數(shù)此類方法傾向于對(duì)許多變量進(jìn)行微小的更改,而不是提供僅修改少數(shù)變量的人工可解釋解決方案。盡管如此,由于最先進(jìn)的算法是可微分的,因此可以有效計(jì)算反事實(shí)和對(duì)抗性擾動(dòng)。對(duì)抗性擾動(dòng)的文獻(xiàn)中提出的許多優(yōu)化機(jī)制可以直接適用于這個(gè)問(wèn)題,使得反事實(shí)生成有效。

      對(duì)抗性擾動(dòng)中更具挑戰(zhàn)性的方面是,針對(duì)圖像的這些微小變化幾乎是人類無(wú)法察覺(jué)的,但會(huì)導(dǎo)致截然不同的分類器響應(yīng)結(jié)果。非正式地說(shuō),這似乎是因?yàn)樾律傻膱D像并不位于“真實(shí)圖像空間”中,而是稍微超出了它的范圍。這種現(xiàn)象是一個(gè)重要提醒,當(dāng)通過(guò)搜索接近的可能情景計(jì)算反事實(shí)時(shí),找到的解決方案來(lái)自“可能的情景”至少與它接近起始示例一樣重要。在反事實(shí)可以可靠地成為高維度和高度結(jié)構(gòu)化空間(例如自然圖像)的解釋之前,需要進(jìn)一步研究如何表征來(lái)自這些空間的數(shù)據(jù)。

      (四)因果關(guān)系與公平

      一些研究已經(jīng)通過(guò)使用因果推理和反事實(shí)解決了保證算法公平的問(wèn)題,即它們不表現(xiàn)出對(duì)特定種族、性別或其他受保護(hù)群體的偏見(jiàn)。馬特·庫(kù)斯納(Matt J.Kusner)等人在考慮主體屬于不同種族或性別的反事實(shí),并要求在這種反事實(shí)下作出的決策保持不變,以使其被認(rèn)為是公平的。相反,我們考慮決策與當(dāng)前狀態(tài)不同的反事實(shí)。

      許多研究表明,透明度可能是強(qiáng)制執(zhí)行公平的一個(gè)有用工具。雖然尚不清楚如何將反事實(shí)用于此目的,但同樣也不清楚任何形式的解釋對(duì)個(gè)人決策是否實(shí)際上有幫助。尼卡·格爾吉奇-赫拉卡(Nica Grgic-Hlaca)等人展示了可理解的模型很容易誤導(dǎo)我們的直覺(jué),并且主要使用人們認(rèn)為公平的特征會(huì)略微增加算法表現(xiàn)出的種族主義傾向,并且降低準(zhǔn)確性。1Nina Grgic-Hlaca et al.,The Case for Process Fairness in Learning:Feature Selection for Fair Decision Making,in NIPS Symposium on Machine Learning and the Law,2016.一般而言,揭示系統(tǒng)性偏見(jiàn)的最佳工具可能是基于大規(guī)模統(tǒng)計(jì)分析,而不是基于對(duì)個(gè)人決策的解釋。

      話雖如此,反事實(shí)可以提供證據(jù),證明算法決策受到受保護(hù)變量(例如種族)的影響,因此可能被認(rèn)為具有歧視性。對(duì)于下一節(jié)中提及的距離函數(shù)類型,如果得出的反事實(shí)改變了某人的種族,則證明對(duì)該人的處理取決于其種族。然而,相反的說(shuō)法是不正確的,不修改受保護(hù)屬性的反事實(shí)不能用作該屬性與決策無(wú)關(guān)的證據(jù)。這是因?yàn)榉词聦?shí)僅描述了特定決策與特定外部事實(shí)之間的一些依賴關(guān)系,這將在下文中詳細(xì)闡述,即為特定分類器提出的反事實(shí)包含“黑人”改變他們的種族,而不是“白人”的種族應(yīng)該多樣化。

      三、生成反事實(shí)

      在這部分中,我們將舉例說(shuō)明如何輕松計(jì)算得出有意義的反事實(shí)。許多機(jī)器學(xué)習(xí)的標(biāo)準(zhǔn)分類器(包括神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和回歸器)都是通過(guò)找到最優(yōu)權(quán)重ω來(lái)訓(xùn)練的,這些權(quán)重最小化了一組訓(xùn)練數(shù)據(jù)上的目標(biāo):

      Yi是數(shù)據(jù)點(diǎn)Xi的標(biāo)簽,ρ(·)是權(quán)重的正則化器。我們希望找到一個(gè)反事實(shí)X’,其盡可能地接近原始點(diǎn)Xi,使得fw(X’)等于新的目標(biāo)Y’。我們可以通過(guò)保持ω固定并最小化相關(guān)目標(biāo)來(lái)找到x′

      其中 d(.,.)是一個(gè)距離函數(shù),用于測(cè)量反事實(shí) x' 和原始數(shù)據(jù)點(diǎn) x 之間的距離。在實(shí)踐中,X 上的最大化是通過(guò)迭代求解 x',并增加 X 直到找到足夠接近的解來(lái)完成的。

      這些問(wèn)題的優(yōu)化器選擇相對(duì)不重要。在實(shí)踐中,任何能夠在等式1下訓(xùn)練分類器的優(yōu)化器似乎同樣有效,我們?cè)谒袑?shí)驗(yàn)中都使用ADAM。由于局部最小值是一個(gè)問(wèn)題,我們用不同的隨機(jī)值初始化每個(gè)運(yùn)行的x'并選擇等式2的最佳最小值作為我們的反事實(shí)。這些不同的最小值可以用作多種反事實(shí)的集合。

      特別重要的是選擇距離函數(shù),用于確定哪個(gè)合成數(shù)據(jù)點(diǎn) x' 最接近原始數(shù)據(jù)點(diǎn) xi。

      作為明智的第一選擇,應(yīng)該根據(jù)主題和任務(wù)的特定要求進(jìn)行改進(jìn),我們建議使用L1范數(shù)或曼哈頓距離:由逆中位數(shù)絕對(duì)偏差加權(quán)。這被寫(xiě)成 MADk 表示特征 k 在點(diǎn)集 P 上的中位數(shù)絕對(duì)偏差:

      我們選擇D(·,·)作為:

      這個(gè)距離度量有幾個(gè)理想的特性。首先,它捕獲了空間的一些內(nèi)在波動(dòng)性,這意味著如果特征K在整個(gè)數(shù)據(jù)集中變化很大,合成點(diǎn)X’也可能會(huì)改變?cè)撎卣?,同時(shí)在距離度量方面保持接近Xi。使用中位數(shù)絕對(duì)偏差,而不是更常見(jiàn)的標(biāo)準(zhǔn)差也使該距離度量面對(duì)異常值更穩(wěn)健。同樣重要的是L1范數(shù)的稀疏誘導(dǎo)特性。L1范數(shù)在數(shù)學(xué)和機(jī)器學(xué)習(xí)領(lǐng)域中得到廣泛認(rèn)可,因?yàn)樗鼉A向于在與適當(dāng)?shù)某杀竞瘮?shù)配對(duì)時(shí)產(chǎn)生大多數(shù)條目為零的稀疏解。

      在計(jì)算人類可理解的反事實(shí)時(shí),此屬性非??扇?,因?yàn)樗鼘?duì)應(yīng)于只有少量變量發(fā)生變化,且大部分變量保持不變的反事實(shí),從而使反事實(shí)更易于交流和理解。該距離度量在我們展示的示例中同樣適用。

      為了證明距離函數(shù)選擇的重要性,我們?cè)谙旅嬲f(shuō)明了變化D(·,·)對(duì)LSAT數(shù)據(jù)集的影響。另一個(gè)挑戰(zhàn)在于確保合成反事實(shí)X’對(duì)應(yīng)于有效數(shù)據(jù)點(diǎn)。我們說(shuō)明了一些在計(jì)算反事實(shí)時(shí)處理離散特征的陷阱和補(bǔ)救措施。1限于篇幅,略過(guò)反事實(shí)生成的論證過(guò)程。——譯者注

      四、反事實(shí)解釋的優(yōu)勢(shì)

      反事實(shí)解釋與機(jī)器學(xué)習(xí)領(lǐng)域和法律領(lǐng)域中的現(xiàn)有提議明顯不同(特別是關(guān)于GDPR的“解釋權(quán)”),同時(shí)其具有幾項(xiàng)優(yōu)點(diǎn)。原則上,反事實(shí)繞過(guò)了解釋機(jī)器學(xué)習(xí)系統(tǒng)內(nèi)部復(fù)雜工作的重大挑戰(zhàn),這種解釋即使技術(shù)上可行,對(duì)數(shù)據(jù)主體也可能沒(méi)有什么實(shí)際價(jià)值。相比之下,反事實(shí)解釋為數(shù)據(jù)主體提供的信息既易于理解,又可實(shí)際用于理解決策原因、質(zhì)疑決策和改變未來(lái)行為以獲得更好的結(jié)果。

      反事實(shí)解釋對(duì)于減輕監(jiān)管負(fù)擔(dān)也具有重大意義。當(dāng)前最先進(jìn)的機(jī)器學(xué)習(xí)方法是基于深度網(wǎng)絡(luò)做出決策,這些網(wǎng)絡(luò)將程序進(jìn)行1000多次的組合,并有超過(guò)1000萬(wàn)個(gè)參數(shù)控制它們的行為。由于人類的記憶機(jī)制只能包含大約7個(gè)不同的項(xiàng)目,因此關(guān)于特定決策所涉邏輯的“人類可理解的有意義信息”是否存在尚不清楚,更不用說(shuō)這些信息是否可以有意義地傳達(dá)給非專業(yè)人士。因此,需要向非專業(yè)受眾傳達(dá)有關(guān)內(nèi)部邏輯的有意義信息的法規(guī)可能會(huì)禁止使用許多標(biāo)準(zhǔn)方法。相比之下,反事實(shí)解釋并不試圖傳達(dá)所涉及的邏輯,并且如上文所述,其計(jì)算和傳達(dá)都很簡(jiǎn)單。

      這種提供有關(guān)算法決策系統(tǒng)內(nèi)部邏輯信息的期望最近已經(jīng)初見(jiàn)端倪,與GDPR相關(guān),尤其是“解釋權(quán)”。GDPR包含許多規(guī)定,要求將有關(guān)自動(dòng)化決策的信息傳達(dá)給個(gè)人。法律和機(jī)器學(xué)習(xí)領(lǐng)域就GDPR在這方面的具體要求和限制進(jìn)行了大量討論,特別是如何提供有關(guān)高度復(fù)雜的自動(dòng)化系統(tǒng)做出的決策的信息。由于反事實(shí)提供了一種方法來(lái)解釋自動(dòng)化決策的一些基本原理,同時(shí)避免可解釋性的陷阱或打開(kāi)“黑箱”的難度,因此它們可能被證明是一種非常有用的機(jī)制,可以滿足GDPR的明確要求和背景目標(biāo)。

      五、反事實(shí)解釋和GDPR

      盡管GDPR的“解釋權(quán)”不具有法律約束力,但它仍然將數(shù)據(jù)保護(hù)法的討論與如何向?qū)<液褪軟Q策影響的普通人士提供解釋算法決策的長(zhǎng)期問(wèn)題聯(lián)系起來(lái)?;卮疬@個(gè)問(wèn)題很大程度上取決于解釋的預(yù)期目標(biāo):所提供的信息必須在結(jié)構(gòu)、復(fù)雜性和內(nèi)容方面進(jìn)行調(diào)整,并考慮到特定的目標(biāo)。不幸的是,GDPR 沒(méi)有明確定義自動(dòng)化決策的解釋要求,并且?guī)缀鯖](méi)有提示關(guān)于自動(dòng)化決策解釋的預(yù)期目的。GDPR的Recital(背景陳述)第71條是一項(xiàng)不具有法律約束力的條款,其指出應(yīng)實(shí)施針對(duì)自動(dòng)化決策的適當(dāng)保障措施,并且“應(yīng)包括向數(shù)據(jù)主體提供的特定信息以及獲得人工干預(yù)的權(quán)利、表達(dá)個(gè)人觀點(diǎn)的權(quán)利、獲得根據(jù)此類評(píng)估達(dá)成決策的解釋的權(quán)利以及質(zhì)疑該決策的權(quán)利”。

      這是GDPR唯一一次提到解釋,這讓讀者幾乎不能了解其打算進(jìn)行何種類型的解釋或解釋是為了什么目的。根據(jù)條約文本,唯一明確的跡象是立法者鼓勵(lì):在決策作出后可以自愿提供某種類型的解釋。這可以看作是Recital第71條將應(yīng)在決策作出前提供的“特定信息”與決策作出后適用的保障措施(“對(duì)此類評(píng)估后達(dá)成的決策解釋”)分開(kāi)。條文未對(duì)此類事后解釋的預(yù)期內(nèi)容進(jìn)一步說(shuō)明。

      解釋的內(nèi)容必須反映其預(yù)期目標(biāo)。鑒于GDPR中缺乏指導(dǎo)性文本,許多解釋的目的是可行的。為了體現(xiàn)GDPR對(duì)個(gè)人權(quán)利保護(hù)的強(qiáng)調(diào),我們從數(shù)據(jù)主體的角度審查解釋的潛在目的。我們提出了自動(dòng)化決策解釋的三個(gè)可能目的:加強(qiáng)對(duì)自動(dòng)化決策范圍和特定決策原因的理解,幫助質(zhì)疑決策以及提供改變未來(lái)行為以期獲得理想結(jié)果的方案。這不是解釋的潛在目標(biāo)的詳盡列表,而是反映了自動(dòng)化決策(與任何類型的決策一樣)的受眾,可能希望了解決策的范圍、影響和基本原理,以及他們應(yīng)當(dāng)如何采取行動(dòng)來(lái)應(yīng)對(duì)的愿望。下文中,我們將評(píng)估這三個(gè)目的如何在GDPR中體現(xiàn),以及論證反事實(shí)解釋符合并超過(guò)了GDPR要求的程度。

      (一)幫助理解決策的解釋

      解釋的一個(gè)潛在目的是讓數(shù)據(jù)主體了解自動(dòng)化決策的范圍,以及導(dǎo)致特定決策的原因。GDPR中的一些條款可以支持?jǐn)?shù)據(jù)主體對(duì)自動(dòng)化決策的理解,盡管必須共享的信息類型往往會(huì)加強(qiáng)對(duì)自動(dòng)化決策系統(tǒng)的擴(kuò)大化理解,而不是特定決策的基本原理。因此,GDPR似乎不需要打開(kāi)“黑箱”向數(shù)據(jù)主體解釋決策系統(tǒng)的內(nèi)部邏輯。考慮到這一點(diǎn),反事實(shí)可以提供符合GDPR各種要求的信息,同時(shí)還可以深入了解導(dǎo)致特定決策的原因。因此,反事實(shí)可以符合并超過(guò)GDPR的要求。

      Recital第71條中對(duì)于解釋的描述不包括打開(kāi)“黑箱”的要求,了解算法決策系統(tǒng)內(nèi)部邏輯未被明確要求。在其他部分,GDPR涵蓋了透明度機(jī)制、通知義務(wù)和訪問(wèn)權(quán),所有上述內(nèi)容都創(chuàng)設(shè)了有關(guān)自動(dòng)化決策的信息要求。第13至15條描述了在收集數(shù)據(jù)時(shí)需要提供哪些類型的信息,包括在向數(shù)據(jù)主體收集時(shí)立即提供;在從第三方收集后的一個(gè)月內(nèi)提供;或者在數(shù)據(jù)主體要求時(shí)隨時(shí)提供。除其他事項(xiàng)外,第12條解釋了應(yīng)當(dāng)如何傳達(dá)此信息(由第13至14條所定義)。第12至14條表明必須向數(shù)據(jù)主體提供“對(duì)預(yù)期處理有意義的概述”,包括“自動(dòng)化決策的存在和第22(1)和(4)條提到的分析。以及至少在這些情況下需要包含所涉邏輯的有意義信息,以及這種處理對(duì)數(shù)據(jù)主體的重要性和設(shè)想的后果”,而不是在決策作出后提供一個(gè)關(guān)于系統(tǒng)內(nèi)部邏輯的詳細(xì)解釋。相反,它們旨在提供預(yù)期處理活動(dòng)的籠統(tǒng)概述,從而加強(qiáng)數(shù)據(jù)主體對(duì)自動(dòng)化決策范圍和目的的理解。

      第12(7)條闡明了第13至14條的目的是提供“以一種易見(jiàn)、可理解和清晰易讀的方式,針對(duì)預(yù)期處理的有意義概述”。有兩點(diǎn)要求值得注意:(1)提供的信息必須對(duì)其接收者有意義且范圍廣泛(即“meaningful overview”);(2)通知要在處理之前發(fā)出(即“intended processing”)。

      若要了解意義的概述由什么構(gòu)成,設(shè)想的披露媒介是有益處的。需要的似乎是廣泛適用的信息,而不是個(gè)性化的披露。法律學(xué)者建議可以通過(guò)更新現(xiàn)有的隱私聲明或通知來(lái)滿足通知義務(wù)(例如,在網(wǎng)站上顯示或使用二維碼)。該要求不因數(shù)據(jù)收集的形式而改變。當(dāng)從第三方收集數(shù)據(jù)時(shí),發(fā)送給數(shù)據(jù)主體的電子郵件能夠鏈接到數(shù)據(jù)控制者的隱私聲明就足夠了。這同樣適用于涉及隱私聲明的個(gè)性化鏈接??梢韵胂?,類似于目前使用的符合第14條要求的工具,這些工具使得用戶能夠了解cookie的使用情況或者購(gòu)物行為的監(jiān)控,從而數(shù)據(jù)主體可以立刻知曉數(shù)據(jù)正在被收集。詳細(xì)信息似乎不是必需的,因?yàn)榈?2(7)條規(guī)定所需信息可以與標(biāo)準(zhǔn)化圖標(biāo)一起提供。在歐盟的三方會(huì)談中,歐洲議會(huì)提出了幾個(gè)標(biāo)準(zhǔn)化圖標(biāo)(最終未被采用)。盡管如此,所提議的圖標(biāo)體現(xiàn)了監(jiān)管機(jī)構(gòu)傾向簡(jiǎn)單、易于理解的信息的初衷。

      這些示例表明第13至14條旨在向所有涉及的數(shù)據(jù)主體(例如Twitter的所有用戶)提供有意義數(shù)據(jù)處理的籠統(tǒng)概述。受制群體更有可能是普通大眾或用戶群,而不是個(gè)人用戶。這種披露形式表明,通知應(yīng)該對(duì)具有簡(jiǎn)單專業(yè)知識(shí)和背景知識(shí)的一般受眾是容易理解。一個(gè)“未受過(guò)教育的外行”,可能是披露的預(yù)期受眾。這與第12(1)條的一般概念一致,即與數(shù)據(jù)主體交流的所有信息和通信都必須采用“簡(jiǎn)潔、透明、易懂且易于訪問(wèn)的形式”,這表明深度技術(shù)信息和“法律術(shù)語(yǔ)”(legalese)是不合適的。至少,每條規(guī)定都表明信息披露需要針對(duì)其受眾進(jìn)行定制,預(yù)期受眾包括兒童和未受過(guò)教育的外行。

      縱觀“有意義的概述”,有關(guān)自動(dòng)化決策制定的通知面臨特定限制。根據(jù)第29條工作組(The article 29 Data Protection Working Party),英國(guó)信息專員辦公室要求,以一種非常簡(jiǎn)單的方式告知數(shù)據(jù)主體“自動(dòng)化決策的重要性和預(yù)期結(jié)果”,包括“分析可能會(huì)如何影響數(shù)據(jù)主體,而不是關(guān)于特定決策的信息”就已經(jīng)足夠。例如,解釋信用評(píng)級(jí)低如何影響支付選擇,解釋怎樣的預(yù)期數(shù)據(jù)處理會(huì)導(dǎo)致信用申請(qǐng)或工作申請(qǐng)被拒絕,以及解釋駕駛行為怎樣影響保險(xiǎn)費(fèi),這樣就足夠了。類似地,“涉及邏輯的有意義信息”據(jù)說(shuō)只需要“澄清:用于創(chuàng)建配置文件的數(shù)據(jù)類別、數(shù)據(jù)來(lái)源,以及為什么這些數(shù)據(jù)會(huì)被認(rèn)為是相關(guān)的”,而不是澄清“關(guān)于算法或機(jī)器學(xué)習(xí)如何工作的詳細(xì)技術(shù)描述”。

      這一觀點(diǎn)在第29條工作組關(guān)于自動(dòng)化決策的指導(dǎo)方針中得到了回應(yīng)。首先,“解釋權(quán)”在指南中僅提及一次,而且沒(méi)有任何關(guān)于范圍或目的的進(jìn)一步細(xì)節(jié)。這一“權(quán)利”與第 22(3)條中具有法律約束力的保障措施明顯分開(kāi),這意味著第29條工作組認(rèn)為Recital和具有法律約束力的條款的法律地位存在差異。事實(shí)上,指南甚至沒(méi)有在他們“良好實(shí)踐建議”的部分列入解釋權(quán)。數(shù)據(jù)控制者“參與此類活動(dòng)”,即自動(dòng)化決策,這一事實(shí)的透明度至關(guān)重要,同時(shí)也是第13和14條的主要目標(biāo)。因此,這些條款的主要目的是提供事前信息。這一點(diǎn)也很明顯,因?yàn)樵撝改现赋?,“重要性”和“設(shè)想的后果”兩詞意味著“必須提供有關(guān)未來(lái)或未來(lái)的處理情況,以及自動(dòng)化決策可能會(huì)如何影響數(shù)據(jù)主體”。此外,“(數(shù)據(jù))控制者應(yīng)該找到簡(jiǎn)單的方法來(lái)告訴數(shù)據(jù)主體背后的原理,或者達(dá)成決策所依賴的標(biāo)準(zhǔn)。GDPR要求(數(shù)據(jù))控制者提供有關(guān)所涉邏輯的有意義信息,而不一定是對(duì)所用算法的復(fù)雜解釋或是對(duì)完整算法的披露?!比欢?,必須指出的是,這一要求盡管是依據(jù)決策作出的原理提出的,但其似乎是指一般系統(tǒng)功能,而不是對(duì)個(gè)別決策的解釋。指南指出,第15(1)(h)條[似乎提供了和第13(2)(f)條和第14(2)(g)條相同的信息]要求數(shù)據(jù)控制者“向數(shù)據(jù)主體提供關(guān)于處理的設(shè)想結(jié)果的信息,而不是關(guān)于特定決策的解釋。”

      總之,根據(jù)第29條工作組,第13至15條的目的是展示自動(dòng)化流程如何幫助數(shù)據(jù)控制者做出更準(zhǔn)確、無(wú)偏見(jiàn)和負(fù)責(zé)任的決策,并說(shuō)明所使用的數(shù)據(jù)、特征和方法如何適合實(shí)現(xiàn)這一目的。如果在處理或決策之前沒(méi)有通知,數(shù)據(jù)主體只能在事后對(duì)決策提出異議。這可能會(huì)耗費(fèi)大量的時(shí)間和成本,并可能導(dǎo)致無(wú)法挽回的經(jīng)濟(jì)或聲譽(yù)損失。因此,第13至14條的目的之一是讓數(shù)據(jù)主體了解未來(lái)的處理,并允許他們決定是否同意處理他們的數(shù)據(jù)、基于成員國(guó)法律或協(xié)議評(píng)估合法性以及行使GDPR中規(guī)定的其他權(quán)利。

      1.訪問(wèn)權(quán)的更廣泛可能性

      處理前通知的要求僅適用于通知義務(wù)。相比之下,數(shù)據(jù)主體可以隨時(shí)援引訪問(wèn)權(quán),從而打開(kāi)了在作出決策后提供可用信息的可能性(即特定決策的原因)。然而,有學(xué)者認(rèn)為,通過(guò)通知義務(wù)提供的信息與訪問(wèn)權(quán)在很大程度上是相同的,意味著訪問(wèn)權(quán)同樣受限于“關(guān)于所涉邏輯,重要性和預(yù)期結(jié)果的有意義信息”。因此,通過(guò)用來(lái)通知以及回應(yīng)訪問(wèn)請(qǐng)求的工具(例如,通用圖表、隱私聲明)或通用模板,可以很大程度上提供信息。

      狹義的解釋似乎是正確的。第29條工作組支持這種觀點(diǎn),其認(rèn)為第12(2)(f)條、第14(2)(g)條和第15(1)(h)的信息要求是相同的,盡管第15(1)(h)條要求“(數(shù)據(jù))控制者應(yīng)當(dāng)向數(shù)據(jù)主體提供關(guān)于處理的預(yù)期結(jié)果的信息,而不是特定決策的解釋”。英國(guó)信息專員辦公室(ICO,Information Commissioner’s Office)提出了一種類似的觀點(diǎn),第13至15條的目的是“提供關(guān)于分析大體上將如何影響數(shù)據(jù)主體的解釋,而不是關(guān)于一個(gè)特定決策的解釋”。此外,與第13至14條相比,GDPR表明了訪問(wèn)權(quán)的限制范圍,即不得披露其他數(shù)據(jù)主體的個(gè)人數(shù)據(jù),因?yàn)檫@可能會(huì)侵犯他們的隱私。訪問(wèn)請(qǐng)求也有可能違反關(guān)于商業(yè)秘密和知識(shí)產(chǎn)權(quán)的條款(第15(4)條和Recital第63條),這意味著必須在數(shù)據(jù)主體和(數(shù)據(jù))控制者的利益之間取得適當(dāng)?shù)钠胶狻?/p>

      2.通過(guò)反事實(shí)理解決策

      反事實(shí)解釋符合且超過(guò)GDPR透明度機(jī)制、通知義務(wù)、訪問(wèn)權(quán)的目標(biāo)和要求,其向數(shù)據(jù)主體提供信息以便理解自動(dòng)化決策的范圍。正如上述論證,Recital第71條沒(méi)有明確說(shuō)明其目的或解釋內(nèi)容,包括是否必須解釋算法的內(nèi)部邏輯。通過(guò)提供簡(jiǎn)單的“if-then(如果…那么…)”陳述,反事實(shí)符合以“簡(jiǎn)潔、透明、易懂且易于獲得的形式”向數(shù)據(jù)主體傳達(dá)信息的要求。它們同時(shí)更深入地洞察了數(shù)據(jù)主體的個(gè)人情況和相關(guān)自動(dòng)化決策背后的原因,而不是為一般受眾定制的概述。反事實(shí)也不太可能侵犯商業(yè)秘密或個(gè)人隱私,因?yàn)楦鶕?jù)訪問(wèn)權(quán)的限制,不需要披露其他數(shù)據(jù)主體的數(shù)據(jù)或關(guān)于算法的詳細(xì)信息。

      也許最重要的是,反事實(shí)提供了對(duì)特定自動(dòng)化決策的一些基本原理的解釋,而無(wú)需解釋如何作出決策的內(nèi)部邏輯。此類信息符合第29條工作組和英國(guó)ICO的指南。雖然法律不要求打開(kāi)黑箱,但必須提供一些有關(guān)“自動(dòng)化決策中涉及邏輯”的信息。數(shù)據(jù)保護(hù)指令中規(guī)定的訪問(wèn)權(quán),通常不需要公開(kāi)算法源代碼、公式、權(quán)重、全套變量和有關(guān)參考組的信息。GDPR中規(guī)定的訪問(wèn)權(quán)很可能會(huì)提出類似的要求。反事實(shí)在很大程度上遵循這一先例,僅披露選定的外部事實(shí)和變量對(duì)特定決策的影響。盡管第13(2)(f)條、第14(2)(g)條和第15(1)(h)條不要求提供特定決策的信息,反事實(shí)代表了一種最小形式的披露,即告知數(shù)據(jù)主體特定決策中的“所涉邏輯”。通過(guò)這種形式的披露,數(shù)據(jù)控制者的監(jiān)管負(fù)擔(dān)被最小化,因?yàn)榻鉀Q可解釋性的技術(shù)困難或向非專業(yè)人士解釋復(fù)雜系統(tǒng)的內(nèi)部邏輯并不需要計(jì)算和傳達(dá)反事實(shí)解釋。因此,我們推薦反事實(shí)作為一種負(fù)擔(dān)和破壞性都最小的技術(shù),幫助數(shù)據(jù)主體理解特定決策的基本原理,而這也超出了第13(2)(f)條、第14(2)(g)條和第15(1)(h)條規(guī)定的明確法律要求。

      (二)有助質(zhì)疑決策

      解釋的另一個(gè)可能目的是,當(dāng)收到不利或其他不合意的決策時(shí),提供質(zhì)疑自動(dòng)化決策的信息。根據(jù)第22(3)條的規(guī)定,質(zhì)疑決策的權(quán)利是對(duì)抗自動(dòng)化決策的保障措施。

      質(zhì)疑決策旨在撤銷決策或使決策無(wú)效并返回到未作出決策的狀態(tài),或者改變結(jié)果并獲得另一個(gè)決策。如果產(chǎn)生決策的原因需要解釋,受影響的當(dāng)事人可以評(píng)估這些原因是否合法,并根據(jù)要求對(duì)評(píng)估提出異議。

      如何質(zhì)疑決策取決于第22(3)條中的保障措施(即獲得人工干預(yù)、表達(dá)意見(jiàn)和質(zhì)疑決策的權(quán)利)是被解釋為必須同時(shí)援引的單元,還是被解釋為可以單獨(dú)援引或在任何可能的組合中援引的個(gè)人權(quán)利。根據(jù)解釋的目的來(lái)衡量解釋的范圍,需要評(píng)估用于質(zhì)疑自動(dòng)化決策的各種可能模型。

      有四種模型是可能的。如果保障措施是一個(gè)單元并且必須一起援引,則作出新決策可能需要一些人工參與。這可能是人類在沒(méi)有任何算法幫助的情況下作出的決策,因此新結(jié)果是人工決策,而不是自動(dòng)化決策。或者,可以要求個(gè)人在考慮算法評(píng)估和/或數(shù)據(jù)主體的反對(duì)意見(jiàn)的情況下作出決策,這將是具有算法元素的人工評(píng)估。在這兩種情況下,數(shù)據(jù)主體都將失去對(duì)后續(xù)決策的保障措施,因?yàn)檫@兩種類型的決策都不是“僅基于自動(dòng)處理”,因此不符合第22(1)條中自動(dòng)化個(gè)人決策的定義。另一種可能性是,一個(gè)人可能需要監(jiān)視數(shù)據(jù)輸入和處理過(guò)程(例如,基于數(shù)據(jù)主體的反對(duì)意見(jiàn)),而新的決策完全由算法系統(tǒng)作出。在這種情況下,第22(3)條規(guī)定的保障措施仍然適用于新決策。最后,如果保障措施可以單獨(dú)適用,并且數(shù)據(jù)主體可以在不援引其獲得人為干預(yù)或表達(dá)意見(jiàn)權(quán)利的情況下,援引其質(zhì)疑決策權(quán)利,則可以在沒(méi)有人為參與的情況下作出新的決策。根據(jù)第22(3)條,這一決策可能會(huì)再次受到質(zhì)疑。目前尚不清楚在GDPR實(shí)施后,這些模型中的哪一個(gè)將會(huì)是首選。

      問(wèn)題仍然是哪些解釋將有助于質(zhì)疑決策,這取決于質(zhì)疑模型。第一個(gè)模型,人類作出新的決策并完全無(wú)視算法的建議,對(duì)原始決策基本原理的解釋則具有信息價(jià)值,但實(shí)際上這種解釋不會(huì)影響完全由人類決策者作出的新決策。對(duì)于每個(gè)預(yù)設(shè)算法參與的其他模型,對(duì)決策原理的解釋可能有助于確定潛在的質(zhì)疑理由,例如輸入數(shù)據(jù)不準(zhǔn)確、有問(wèn)題的推論或算法推理的其他缺陷。

      即使對(duì)決策理由的解釋可能有助于質(zhì)疑決策,但這并不意味著解釋是GDPR所要求的,或者是無(wú)法律約束力的解釋權(quán)的預(yù)期目標(biāo)。Recital第71條沒(méi)有具體說(shuō)明權(quán)利的目的或應(yīng)該披露什么信息,也沒(méi)有明確要求解釋算法的內(nèi)部邏輯。GDPR中沒(méi)有明確說(shuō)明解釋權(quán)和質(zhì)疑權(quán)之間的聯(lián)系,其中前者將提供援引后者所必需的信息。此外,沒(méi)有理由可以假設(shè):第22(3)條中的保障措施必須同時(shí)實(shí)施,而不是彼此獨(dú)立實(shí)施。因此,Recital第71條規(guī)定的解釋并不是質(zhì)疑不利決策的必要先決條件,即使其可能會(huì)有所幫助。

      同樣地,也未明確說(shuō)明質(zhì)疑權(quán)、透明度機(jī)制、通知義務(wù)、訪問(wèn)權(quán)之間的聯(lián)系,這意味著無(wú)需明確制定通過(guò)這些權(quán)利和義務(wù)提供的信息,來(lái)幫助數(shù)據(jù)主體成功地質(zhì)疑決策。

      盡管如此,第12至15條提供的信息可能對(duì)質(zhì)疑決策結(jié)果有所幫助。通知義務(wù)旨在促進(jìn)GDPR中其他權(quán)利的行使,以增加個(gè)人對(duì)數(shù)據(jù)處理的控制,這一事實(shí)得到了明顯的支持。為了達(dá)到這一目的,第13(2)(b)條、第14(2)(c)條和第15(1)(e)條規(guī)定,數(shù)據(jù)控制者在收集數(shù)據(jù)時(shí),從第三方獲得的一個(gè)月內(nèi)或在數(shù)據(jù)主體要求的任何時(shí)間內(nèi),有義務(wù)向數(shù)據(jù)主體通知他們第15至21條項(xiàng)下的權(quán)利。然而,第22條似乎并沒(méi)有列入上述規(guī)定,因?yàn)榈?2條第(1)款和第(4)款所提到的告知“存在包括分析的自動(dòng)化決策”義務(wù)的措辭很奇怪,并且至少在這些情況下,應(yīng)當(dāng)告知關(guān)于邏輯的有意義的資料以及這種處理對(duì)數(shù)據(jù)主體的意義和預(yù)期后果。

      正如上述論證,第13至15條將向普通受眾提供關(guān)于自動(dòng)化決策的有意義概述。從表面上看,這樣的概述對(duì)于質(zhì)疑決策并不能立即產(chǎn)生幫助,因?yàn)闆](méi)有提供關(guān)于個(gè)人決策基本原理的信息。在描述有關(guān)自動(dòng)化決策的信息時(shí),僅在第22(1)和(4)條中明確提及。因此,數(shù)據(jù)主體不需要被告知針對(duì)自動(dòng)化決策的保護(hù)措施,例如競(jìng)爭(zhēng)權(quán)。這種限制是有說(shuō)服力的。如果第13至15條的目的是通過(guò)提供有用的、個(gè)人級(jí)別的信息來(lái)促進(jìn)質(zhì)疑決策,那么人們會(huì)希望明確探討質(zhì)疑權(quán)或第22(3)條。同樣,第13至15條似乎并不要求告知數(shù)據(jù)主體他們有權(quán)不受自動(dòng)化決策的約束,從中可以推斷出質(zhì)疑決策的權(quán)利。事實(shí)上,在GDPR的早期草案中,有人建議信息權(quán)應(yīng)當(dāng)整體規(guī)定在第20條中。最終,這種方法未被采用,這表明對(duì)質(zhì)疑決策有用信息的缺位是有意為之。

      在許多方面,缺乏對(duì)于自動(dòng)化決策保障措施的明確聯(lián)系并不令人意外。第12至15條旨在通知數(shù)據(jù)主體行使他們?cè)贕DPR中享有的權(quán)利,以及促進(jìn)他們行使這些權(quán)利。然而,這并不意味著要求(數(shù)據(jù))控制者提供幫助數(shù)據(jù)主體行使其權(quán)利的其他信息。相反,只需要告知數(shù)據(jù)主體其權(quán)利的存在,并提供行使(權(quán)利)必要的基礎(chǔ)設(shè)施(例如,投訴門(mén)戶網(wǎng)站),包括消除不必要的繁文縟節(jié),保證第12(3)條規(guī)定的回復(fù)查詢、申請(qǐng)的合理時(shí)間以及與有權(quán)改變決策并進(jìn)行交流的機(jī)會(huì)。但是,數(shù)據(jù)主體仍然有責(zé)任獨(dú)立行使其權(quán)利。不幸的是,Recital第60條含糊地指出,“考慮到處理個(gè)人數(shù)據(jù)的具體情況和背景,確保公平和透明處理所需的任何進(jìn)一步信息”應(yīng)當(dāng)提供給數(shù)據(jù)主體,而這并沒(méi)有向數(shù)據(jù)主體提供額外的幫助。在歐盟的三方會(huì)談期間,這一規(guī)定被有意移至不具法律約束力的Recital中。因此,數(shù)據(jù)控制者沒(méi)有法律義務(wù)向數(shù)據(jù)主體提供對(duì)行使其他權(quán)利特別有用的信息。

      最后一項(xiàng)值得注意的類似限制是關(guān)于第16條,數(shù)據(jù)主體糾正不準(zhǔn)確個(gè)人數(shù)據(jù)的權(quán)利。數(shù)據(jù)控制者無(wú)需指出哪些記錄對(duì)特定自動(dòng)化決策的影響最大,這對(duì)于試圖找出不準(zhǔn)確之處以作為質(zhì)疑決策理由的數(shù)據(jù)主體非常有幫助。如果數(shù)據(jù)主體要擁有大量個(gè)人數(shù)據(jù),則其可能必須檢查數(shù)以萬(wàn)計(jì)的項(xiàng)目是否準(zhǔn)確。

      1.通過(guò)反事實(shí)質(zhì)疑決策

      因此,第13至15條很少?gòu)?qiáng)化數(shù)據(jù)主體質(zhì)疑自動(dòng)化決策的能力。第22(3)條不提供關(guān)于保障措施的信息(例如質(zhì)疑權(quán))。似乎無(wú)需通知數(shù)據(jù)主體不受自動(dòng)化決策約束的權(quán)利,這本身可能意味著有權(quán)質(zhì)疑令人反感的自動(dòng)化決策。類似地,Recital第71條沒(méi)有規(guī)定質(zhì)疑決策與理解黑箱之間的明確聯(lián)系。盡管解釋可能會(huì)有所幫助,但它們似乎并不是質(zhì)疑決策的先決條件。如果解釋是質(zhì)疑決策的先決條件,它們將出現(xiàn)在具有法律約束力的文本中。為了向數(shù)據(jù)主體提供更大的保護(hù),應(yīng)消除這些信息缺口,這意味著數(shù)據(jù)控制者應(yīng)告知不受自動(dòng)化決策約束的權(quán)利及享有保障措施的權(quán)利。

      反事實(shí)可能有助于質(zhì)疑決策,從而為數(shù)據(jù)主體提供比GDPR更好的保護(hù)。無(wú)論解釋權(quán)的法律地位如何,質(zhì)疑權(quán)都是具有法律約束力的保障。通過(guò)提供關(guān)于促成特定決策的外部因素和關(guān)鍵變量的信息,反事實(shí)可以為數(shù)據(jù)主體行使其質(zhì)疑權(quán)提供有價(jià)值的信息。這也符合第29條工作組的指南,該準(zhǔn)則敦促理解決策和了解其法律基礎(chǔ)對(duì)質(zhì)疑決策至關(guān)重要,而不一定與打開(kāi)黑箱有關(guān)。例如,低收入導(dǎo)致貸款申請(qǐng)被拒絕的解釋可以幫助數(shù)據(jù)主體以其財(cái)務(wù)狀況不準(zhǔn)確或數(shù)據(jù)不完整為由對(duì)結(jié)果進(jìn)行質(zhì)疑。理解使得收入在決策中作為相關(guān)變量的系統(tǒng)的內(nèi)部邏輯,這需要技術(shù)性解釋而不是反事實(shí)解釋,雖然就其本身而言可能是可取的,但質(zhì)疑基于該變量的決策并非絕對(duì)有必要。反事實(shí)通過(guò)向數(shù)據(jù)主體提供有關(guān)決策原因的信息,而無(wú)需打開(kāi)黑箱,為質(zhì)疑決策提供了解決方案和支持。盡管GDPR第16條給予數(shù)據(jù)主體改正用于作出決策的不準(zhǔn)確數(shù)據(jù)的權(quán)利,但無(wú)需告知數(shù)據(jù)主體決策是基于哪項(xiàng)數(shù)據(jù)作出的。在收集了大量數(shù)據(jù)的情況下,不知道哪些數(shù)據(jù)與特定決策相關(guān)或?qū)μ囟Q策最有影響的人被迫審查所有數(shù)據(jù)。這種信息的缺位增加了尋求另一種結(jié)果的數(shù)據(jù)主體的負(fù)擔(dān)。反事實(shí)提供了一種緊湊且簡(jiǎn)單的方式來(lái)傳達(dá)這些依賴關(guān)系(例如,哪項(xiàng)數(shù)據(jù)是有影響力的),并且有助于提出有效主張——決策是基于不正確的數(shù)據(jù)作出的,并對(duì)該決策提出異議。

      (三)改變未來(lái)決策的解釋

      從數(shù)據(jù)主體的角度來(lái)看,除了理解和質(zhì)疑決策外,解釋也可以用于指明未來(lái)可以更改哪些內(nèi)容以獲得預(yù)期結(jié)果。此目的不一定與質(zhì)疑權(quán)有關(guān)。準(zhǔn)確的決策可能會(huì)對(duì)數(shù)據(jù)主體產(chǎn)生不利的結(jié)果。在某些情況下,成功質(zhì)疑決策的概率也很低,或者所需的成本太高。在這些情況下,數(shù)據(jù)主體可能更愿意通過(guò)調(diào)整自己的行為來(lái)改變其處境的各個(gè)方面,并在具備更有利的條件時(shí)要求作出新決策。

      GDPR沒(méi)有直接闡明使用解釋作為改變行為以獲得所需自動(dòng)化決策結(jié)果的指南。然而,這不會(huì)消滅數(shù)據(jù)主體從自動(dòng)化決策系統(tǒng)獲得預(yù)期結(jié)果的興趣。例如,如果受試者因收入不足而被拒絕貸款,反事實(shí)解釋將表明在立即加薪的情況下重新申請(qǐng)是否合理。然而,試圖提供關(guān)于自動(dòng)化決策的“所涉邏輯的有意義信息,以及重要性和預(yù)期后果”的技術(shù)解釋不能保證在這種情況下有用。

      因此,反事實(shí)可用于對(duì)未來(lái)決策進(jìn)行有利于數(shù)據(jù)主體改變。通過(guò)提供可以導(dǎo)致不同決策的關(guān)鍵變量和“接近的可能情景”的信息,數(shù)據(jù)主體可以了解更改哪些因素可以獲得所需結(jié)果。對(duì)于決策模型和隨時(shí)間變化較小的環(huán)境,或?yàn)閭€(gè)人“人工停滯”時(shí)間的模型(即未來(lái)的決策將采用與個(gè)人原始決策相同的模型),這些信息可以幫助數(shù)據(jù)主體改變他的行為或情況,以在未來(lái)獲得他想要的結(jié)果。同樣,如果在特定時(shí)間段內(nèi)滿足給定的反事實(shí)條款,數(shù)據(jù)控制者可以根據(jù)合同向數(shù)據(jù)主體提供首選結(jié)果。

      話雖如此,有意改變的屬性與其他變量(例如職業(yè)變化導(dǎo)致的收入增加)之間未料及的互相依賴性可能會(huì)破壞反事實(shí)作為未來(lái)行為指南的效用。然而,反事實(shí)解釋可以同時(shí)解決針對(duì)一個(gè)模型輸出的多個(gè)變量變化的影響。更甚者,無(wú)論反事實(shí)作為未來(lái)行為指南的效用如何,仍然不影響他們幫助個(gè)人了解哪些數(shù)據(jù)和變量對(duì)特定先前決策產(chǎn)生了影響。

      猜你喜歡
      決策主體算法
      為可持續(xù)決策提供依據(jù)
      論自然人破產(chǎn)法的適用主體
      基于MapReduce的改進(jìn)Eclat算法
      Travellng thg World Full—time for Rree
      決策為什么失誤了
      進(jìn)位加法的兩種算法
      一種改進(jìn)的整周模糊度去相關(guān)算法
      關(guān)于遺產(chǎn)保護(hù)主體的思考
      論多元主體的生成
      翻譯“主體間性”的辯證理解
      常宁市| 西乡县| 东辽县| 长治市| 门头沟区| 彩票| 辽源市| 桑植县| 辽宁省| 榕江县| 裕民县| 叙永县| 永泰县| 青龙| 武平县| 新巴尔虎右旗| 怀安县| 武冈市| 吉林省| 巴马| 临西县| 冀州市| 海安县| 上林县| 潜山县| 康平县| 清镇市| 宁河县| 金湖县| 佛坪县| 义马市| 寻甸| 长乐市| 武威市| 宁德市| 南江县| 黄陵县| 延边| 桃园市| 东乡| 赤峰市|