“AI+檔案”應(yīng)用的算法風(fēng)險(xiǎn)與治理路徑探析

2021-11-04 21:24:25于英香李雨欣

北京檔案 2021年10期

于英香李雨欣

摘要：各國(guó)政策既鼓勵(lì)應(yīng)用人工智能技術(shù)輔助檔案工作，也強(qiáng)調(diào)對(duì)人工智能算法應(yīng)用引發(fā)的風(fēng)險(xiǎn)進(jìn)行治理。算法及算法權(quán)力介入檔案工作可能會(huì)帶來(lái)諸多風(fēng)險(xiǎn)，如算法攻擊導(dǎo)致檔案數(shù)據(jù)泄露、算法鴻溝引發(fā)檔案管理決策的信任危機(jī)、算法的技術(shù)理性牽制檔案價(jià)值理性的發(fā)揮、算法的偏好原則弱化檔案用戶(hù)的信息權(quán)利等。為了應(yīng)對(duì)風(fēng)險(xiǎn)，應(yīng)從算法應(yīng)用回歸價(jià)值理性、制定防范算法風(fēng)險(xiǎn)管控策略、依據(jù)法律法規(guī)來(lái)規(guī)范算法應(yīng)用行為等方面進(jìn)行算法治理。

關(guān)鍵詞：人工智能算法權(quán)力算法風(fēng)險(xiǎn) 算法治理檔案管理

Abstract：Policies of various countries not on？ ly encourage the application of Artificial Intelli？ gence technology to assist archival work， but also emphasize the management of risks caused by the application of Artificial Intelligence algorithms. The involvement of algorithm and algorithm power in archival work may bring many risks， such as the leakage of archival data caused by algorithm at？ tack， the trust crisis of archival management deci？ sion caused by algorithm gap， the technical ratio？ nality of algorithm restricts the good value of ar？ chives， the preference principle of algorithm weak？ ens the information control right of Archives Us？ ers， etc. In order to deal with those risks， we should be taken for algorithmic governance， such as returning value rationality in applying algorithm， formulating the control strategy to prevent the al？ gorithm risk， and adopting laws and policies to reg？ ulate the algorithm application behavior， etc.

Keywords：Artificial intelligence；Algorithmic power；Algorithm risk；Algorithmic governance；Ar？ chives management

“人工智能+”（Artificial Intelligence Plus，簡(jiǎn)稱(chēng)“AI+”）是指人工智能（Artificial Intelligence，簡(jiǎn)稱(chēng)“AI”）與各個(gè)行業(yè)的深度融合并創(chuàng)造新的行業(yè)發(fā)展生態(tài)?！癆I+檔案”即將人工智能技術(shù)應(yīng)用于檔案管理工作中，以創(chuàng)造檔案事業(yè)的新生態(tài)。算法是指應(yīng)用計(jì)算機(jī)程序解決問(wèn)題的方法，人工智能技術(shù)賦能檔案管理，如檔案的分類(lèi)、鑒定等工作均可轉(zhuǎn)化為計(jì)算機(jī)程序，即算法問(wèn)題。目前，有關(guān)“AI+檔案”的研究主要有三個(gè)方面：一是探討AI技術(shù)應(yīng)用于檔案工作的適用性，如AI技術(shù)嵌入檔案管理的邏輯和特征[1]、可行性[2]及必要性[3]；二是“AI+檔案”工作的變革，如探索采用人工智能技術(shù)構(gòu)建新型系統(tǒng)[4]、驅(qū)動(dòng)智慧檔案館建設(shè)[5]、優(yōu)化檔案網(wǎng)站[6]等以及探討人工智能在檔案管理理論創(chuàng)新、檔案管理模式優(yōu)化、檔案管理人員能力提升[7-9]等方面的推動(dòng)作用；三是檔案工作面臨的挑戰(zhàn)，包括技術(shù)安全可靠性[10]及檔案管理、檔案數(shù)據(jù)、機(jī)器信任、法律環(huán)境、專(zhuān)業(yè)能力[11]等方面的挑戰(zhàn)。目前大多研究著眼于采用人工智能技術(shù)創(chuàng)新檔案工作路徑，也有研究反思人工智能應(yīng)用可能帶來(lái)的負(fù)面影響及對(duì)策等，但鮮有從算法的視角探討“AI+檔案”應(yīng)用存在的管理風(fēng)險(xiǎn)，對(duì)“AI+檔案”應(yīng)用中的算法風(fēng)險(xiǎn)進(jìn)行治理成為檔案管理不可規(guī)避的議題。

一、算法風(fēng)險(xiǎn)呼喚對(duì)“AI+檔案”進(jìn)行算法治理

隨著人工智能技術(shù)的進(jìn)步，國(guó)際檔案組織倡導(dǎo)要協(xié)同人工智能技術(shù)發(fā)展檔案事業(yè)，如2017年英國(guó)國(guó)家檔案館頒布的《數(shù)字戰(zhàn)略》提出研究機(jī)器學(xué)習(xí)技術(shù)輔助數(shù)字敏感性審查及處理數(shù)字文件工作，以便更好地實(shí)現(xiàn)數(shù)據(jù)的價(jià)值[12]；美國(guó)信息自由法聯(lián)邦咨詢(xún)委員會(huì)提交的《2018—2020年報(bào)告草稿》中要求檔案管理員應(yīng)加強(qiáng)與其他部門(mén)合作，利用人工智能技術(shù)提高文件搜索響應(yīng)能力以及識(shí)別敏感材料[13]；澳大利亞國(guó)家檔案館出臺(tái)的《2019—2022年信息技術(shù)戰(zhàn)略方向》中提到要采用人工智能技術(shù)打造現(xiàn)代化技術(shù)平臺(tái)以提供服務(wù)[14]；加拿大圖書(shū)館和檔案館公布的《2020—2021年部門(mén)計(jì)劃》表示將探索AI在提供現(xiàn)代化參考咨詢(xún)服務(wù)的可能性[15]；國(guó)際檔案理事會(huì)發(fā)布的《2021年至2024年戰(zhàn)略規(guī)劃》提出將繼續(xù)探索與數(shù)據(jù)和計(jì)算機(jī)科學(xué)領(lǐng)域建立新的伙伴關(guān)系[16]；我國(guó)中辦國(guó)辦印發(fā)的《“十四五”全國(guó)檔案事業(yè)發(fā)展規(guī)劃》中倡導(dǎo)要積極探索人工智能技術(shù)在檔案信息深層加工和利用中的應(yīng)用等[17]。這些政策在宏觀層面鼓勵(lì)檔案部門(mén)采用人工智能技術(shù)輔助檔案工作，成為“AI+檔案”事業(yè)發(fā)展的動(dòng)力。然而，人工智能技術(shù)的應(yīng)用也帶來(lái)了潛在的風(fēng)險(xiǎn)。人工智能算法作為一種技術(shù)手段，本身不具有權(quán)力的屬性，但由于其具備對(duì)數(shù)據(jù)、人的行為和公權(quán)力資源的調(diào)動(dòng)能力就形成了技術(shù)權(quán)力[18]。算法的設(shè)計(jì)是有邏輯有目的的，算法權(quán)力既包含算法本身的權(quán)力和數(shù)據(jù)的權(quán)力[19]，還包括算法設(shè)計(jì)和研發(fā)過(guò)程主導(dǎo)者的權(quán)力[20]。具體而言，算法提供的運(yùn)算結(jié)果有可能會(huì)代替人類(lèi)進(jìn)行決策，甚至具備影響人思想觀念、意識(shí)形成和價(jià)值觀的能力。當(dāng)出現(xiàn)算法濫用、數(shù)據(jù)濫用、算法歧視等問(wèn)題時(shí)，則可能對(duì)國(guó)家安全、政府運(yùn)作、公共秩序、社會(huì)運(yùn)行等方面帶來(lái)消極影響，因此引起人們對(duì)算法應(yīng)用產(chǎn)生風(fēng)險(xiǎn)的擔(dān)憂(yōu)。人工智能與檔案領(lǐng)域的深度融合催生出以算法輔助決策為核心的算法治理新模式，檔案界也意識(shí)到了算法可能帶來(lái)的風(fēng)險(xiǎn)，并通過(guò)政策都傳遞出對(duì)“AI+檔案”應(yīng)用的隱憂(yōu)，如美國(guó)國(guó)家檔案與文件管理署（NARA）2020年7月出臺(tái)的數(shù)據(jù)管理委員會(huì)章程中規(guī)定，數(shù)據(jù)治理委員會(huì)要指導(dǎo)機(jī)構(gòu)對(duì)機(jī)器學(xué)習(xí)和人工智能的投資，并圍繞該技術(shù)的道德使用提出建議[21]，2020年10月公布的新白皮書(shū)《認(rèn)知技術(shù)：文件管理對(duì)物聯(lián)網(wǎng)、機(jī)器人過(guò)程自動(dòng)化、機(jī)器學(xué)習(xí)和人工智能的影響》中著重關(guān)注AI應(yīng)用時(shí)的信任問(wèn)題、偏見(jiàn)問(wèn)題和道德問(wèn)題[22]；澳大利亞國(guó)家檔案館發(fā)布的《信息和數(shù)據(jù)治理框架》中就將澳大利亞政府出臺(tái)的《AI倫理原則》納入?yún)⒖挤秶鶾23]。這表明，各國(guó)政策既關(guān)注人工智能的應(yīng)用，也關(guān)注如何防范應(yīng)用中算法可能帶來(lái)的風(fēng)險(xiǎn)。

二、“AI+檔案”應(yīng)用的算法風(fēng)險(xiǎn)

當(dāng)算法介入檔案整理、保管、編研、利用服務(wù)等工作時(shí)，算法“盜竊”數(shù)據(jù)、算法信任問(wèn)題、算法價(jià)值問(wèn)題、算法偏好問(wèn)題等帶來(lái)的消極影響也隨之而來(lái)。

（一）算法攻擊導(dǎo)致檔案數(shù)據(jù)泄露

算法可以是良器也可能是武器。在檔案工作中，當(dāng)算法是良器時(shí)，它可以參與檔案工作從而協(xié)助檔案工作者完成任務(wù)；當(dāng)算法變成武器時(shí)，會(huì)成為一些不法分子竊取檔案數(shù)據(jù)的工具。檔案數(shù)據(jù)面臨的外來(lái)風(fēng)險(xiǎn)可能來(lái)源于網(wǎng)絡(luò)的攻擊，這對(duì)檔案數(shù)據(jù)的安全帶來(lái)極大的威脅。自從計(jì)算機(jī)技術(shù)發(fā)展以來(lái)，網(wǎng)絡(luò)安全事件頻發(fā)，政府?dāng)?shù)據(jù)、企業(yè)數(shù)據(jù)、個(gè)人數(shù)據(jù)等數(shù)據(jù)資源因算法攻擊導(dǎo)致數(shù)據(jù)泄露或數(shù)據(jù)篡改的事件屢見(jiàn)不鮮，其中不乏涉密性和敏感性的檔案數(shù)據(jù)。如2018年12月，法國(guó)外交和歐洲事務(wù)部發(fā)生個(gè)人檔案信息失竊事件，隨后其發(fā)表聲明稱(chēng)黑客利用其計(jì)算機(jī)系統(tǒng)漏洞進(jìn)行算法攻擊，導(dǎo)致多人信息被泄露。[24]不難看出，算法作為治理工具的同時(shí)，還有可能成為損害利益的武器，檔案部門(mén)擔(dān)負(fù)著保管檔案數(shù)據(jù)的重任，保護(hù)檔案數(shù)據(jù)的行為已經(jīng)上升到維護(hù)國(guó)家主權(quán)及社會(huì)秩序的高度。

（二）算法鴻溝引發(fā)檔案管理決策的信任危機(jī)

算法參與檔案管理決策，意味著檔案業(yè)務(wù)處理規(guī)則從“透明”到“黑箱”，算法鴻溝引起信任問(wèn)題也隨之出現(xiàn)。傳統(tǒng)的檔案工作是顯性運(yùn)行的，檔案收集、整理、鑒定等業(yè)務(wù)的標(biāo)準(zhǔn)和規(guī)章有據(jù)可循，可明確追溯責(zé)任。人工智能算法介入下，檔案業(yè)務(wù)的處理規(guī)則由算法編制而成，人的決策由算法決策替代。算法規(guī)則對(duì)于大多非算法研發(fā)者透明度不高，“透明”的規(guī)章制度與“黑箱”的算法規(guī)則之間存在矛盾，檔案主體與算法決策間的信任危機(jī)應(yīng)運(yùn)而生。以檔案分類(lèi)問(wèn)題為例，2017年，澳大利亞新南威爾士洲檔案館數(shù)字檔案團(tuán)隊(duì)?wèi)?yīng)用機(jī)器學(xué)習(xí)算法得到的分類(lèi)結(jié)果準(zhǔn)確率最高84%[25]，實(shí)驗(yàn)結(jié)果意味著算法的出錯(cuò)率達(dá)16%。因此，當(dāng)利用算法處理檔案業(yè)務(wù)時(shí)對(duì)于提供的學(xué)習(xí)結(jié)果是否能完全信任難以下定論[26]。若檔案部門(mén)無(wú)條件地完全依賴(lài)于算法提供的決策，當(dāng)發(fā)生錯(cuò)誤時(shí)以算法規(guī)則透明低、算法程序不可解釋性和算法模型不確定性等為由推卸責(zé)任，將會(huì)削弱檔案工作者的地位，導(dǎo)致他們?cè)跈n案工作中趨向虛擬化或邊緣化。

（三）算法的技術(shù)理性牽制檔案價(jià)值理性的發(fā)揮

當(dāng)算法應(yīng)用于檔案編研工作中，算法的技術(shù)理性往往會(huì)忽略檔案用戶(hù)的情感需求，這是因?yàn)閮r(jià)值觀并非算法可計(jì)算的對(duì)象。檔案編研工作是對(duì)檔案內(nèi)容的重組加工，當(dāng)算法作為編研成果的“撰寫(xiě)人”時(shí)，實(shí)質(zhì)是利用智能算法對(duì)檔案數(shù)據(jù)內(nèi)容進(jìn)行深度分析和挖掘，對(duì)主題事件進(jìn)行深層、全面的分析。而傳統(tǒng)的編研工作，呈現(xiàn)的編研成果傾注了個(gè)人對(duì)編研主題和檔案素材的理解和情感，面對(duì)不同的編研主題敘述事件時(shí)會(huì)聚焦人文關(guān)懷。這時(shí)，算法的“全面”與人工的“側(cè)重”敘事原則之間形成沖突。盡管算法生產(chǎn)具有高質(zhì)量、高效率的特點(diǎn)，但若涉及情感問(wèn)題與價(jià)值問(wèn)題時(shí)，算法劣勢(shì)明顯。如弱勢(shì)邊緣群體的檔案文件中可能存在對(duì)記錄對(duì)象的不當(dāng)描述，又或針對(duì)創(chuàng)傷性事件檔案，算法在“創(chuàng)作”的過(guò)程中難以共情，從而造成對(duì)該類(lèi)群體的情感創(chuàng)傷，有悖于價(jià)值理性的發(fā)揮。因此，編研工作中考量讀者的情感體驗(yàn)，實(shí)現(xiàn)檔案工作價(jià)值理性的發(fā)揮也是檔案管理智能化探索過(guò)程中不可規(guī)避的問(wèn)題。

（四）算法的偏好原則弱化檔案用戶(hù)的信息權(quán)利

在檔案智能推薦系統(tǒng)中，算法能決定推薦給檔案用戶(hù)的信息，從這一層面看，用戶(hù)選擇信息時(shí)失去了主動(dòng)權(quán)。算法設(shè)計(jì)時(shí)會(huì)無(wú)形地將偏好原則納入研發(fā)規(guī)則，一是面向檔案用戶(hù)的偏好，二是面向算法編寫(xiě)者的偏好，兩者均可能對(duì)檔案用戶(hù)思想和行為產(chǎn)生影響。

一方面，當(dāng)算法面向檔案用戶(hù)的偏好時(shí)，算法旨在將采集到的個(gè)人數(shù)據(jù)進(jìn)行分析和關(guān)聯(lián)，并在以“用戶(hù)為中心”服務(wù)理念的指導(dǎo)下進(jìn)行定向推送。其原理是算法根據(jù)采集到的檔案用戶(hù)的個(gè)人信息及行為數(shù)據(jù)進(jìn)行分析，通過(guò)構(gòu)建用戶(hù)畫(huà)像，主動(dòng)將用戶(hù)感興趣的主題信息推送給該行為用戶(hù)?；谥悄芩惴ㄍ扑]的這一服務(wù)方式符合個(gè)性化、精準(zhǔn)化的檔案服務(wù)目標(biāo)，但也可能造成“信息繭房”。“信息繭房”實(shí)質(zhì)是將用戶(hù)束縛在一定的“信息牢籠”中，導(dǎo)致其所接觸到的外部信息主要是以個(gè)人興趣為主導(dǎo)，久而久之會(huì)給人的心智帶來(lái)負(fù)面的影響。

另一方面，當(dāng)編研規(guī)則過(guò)分融入算法編寫(xiě)者的偏好時(shí)，服務(wù)宗旨由“用戶(hù)為中心”轉(zhuǎn)向“算法開(kāi)發(fā)者為中心”，算法的服務(wù)理念將隨之變質(zhì)。對(duì)檔案用戶(hù)而言，在選擇信息時(shí)實(shí)際上處于被動(dòng)地位，其思維認(rèn)知與行為方式被算法開(kāi)發(fā)者間接操控。例如應(yīng)用算法對(duì)某一檔案用戶(hù)的學(xué)籍?dāng)?shù)據(jù)、醫(yī)療數(shù)據(jù)、土地登記數(shù)據(jù)等檔案數(shù)據(jù)進(jìn)行分析，根據(jù)分析結(jié)果對(duì)用戶(hù)進(jìn)行分類(lèi)，有目的性地將某類(lèi)信息傳遞給某類(lèi)特定用戶(hù)以達(dá)到支配用戶(hù)行為的目的。由此可見(jiàn)，檔案用戶(hù)可能會(huì)成為算法權(quán)力者的利用對(duì)象，即“被利用”的對(duì)象不僅是由檔案用戶(hù)所產(chǎn)生的數(shù)據(jù)，還有其本身?？梢?jiàn)，算法濫用不僅限制檔案用戶(hù)的主觀能動(dòng)性發(fā)揮，加大了對(duì)檔案用戶(hù)的控制，還削弱了檔案用戶(hù)的信息權(quán)利。

三、“AI+檔案”應(yīng)用算法治理路徑

（一）意識(shí)維：算法應(yīng)用回歸價(jià)值理性

在多元協(xié)同治理的理念下，檔案工作者、算法開(kāi)發(fā)者作為治理主體在開(kāi)發(fā)或應(yīng)用算法時(shí)應(yīng)該秉持價(jià)值理性。檔案部門(mén)的職責(zé)應(yīng)體現(xiàn)在以下幾個(gè)方面。

首先，檔案部門(mén)要避免以技術(shù)為工作導(dǎo)向，堅(jiān)守檔案職業(yè)要求。算法不能完全代替檔案工作者的角色，如算法缺乏人文關(guān)懷、道德判斷，算法能夠精準(zhǔn)服務(wù)但也會(huì)阻礙檔案用戶(hù)接受多元信息，這些缺陷與檔案工作原則不符。因此，檔案工作者在AI應(yīng)用背景下，應(yīng)強(qiáng)化自身責(zé)任意識(shí)，將公平、向善、真實(shí)、客觀等原則嵌入工作準(zhǔn)則中。其次，檔案部門(mén)應(yīng)全程監(jiān)控檔案算法設(shè)計(jì)、研發(fā)和應(yīng)用。為防范數(shù)據(jù)和算法濫用行為，檔案部門(mén)應(yīng)發(fā)揮起“他律”的監(jiān)督作用，結(jié)合算法開(kāi)發(fā)者的“自律”，雙管齊下將算法“價(jià)值理性”規(guī)范根植于算法設(shè)計(jì)和應(yīng)用中，研發(fā)秉承“安全、可靠、公平、權(quán)責(zé)可追溯、行為可追蹤、易管理”的原則，確保檔案數(shù)據(jù)利用過(guò)程的合理性及服務(wù)目的的正當(dāng)性。最后，檔案部門(mén)要促進(jìn)檔案用戶(hù)對(duì)信息安全和算法應(yīng)用的認(rèn)識(shí)。如通過(guò)移動(dòng)應(yīng)用程序、知識(shí)服務(wù)平臺(tái)、網(wǎng)站等軟件采集檔案用戶(hù)基本信息時(shí)，為其提供采集數(shù)據(jù)的目的、采集數(shù)據(jù)的范圍、數(shù)據(jù)應(yīng)用場(chǎng)景等信息，并強(qiáng)調(diào)這些數(shù)據(jù)對(duì)提供知識(shí)服務(wù)的重要性，深化對(duì)數(shù)據(jù)價(jià)值的認(rèn)識(shí)。同時(shí)，可以在利用服務(wù)過(guò)程中促進(jìn)用戶(hù)對(duì)算法應(yīng)用的認(rèn)識(shí)，如按主題內(nèi)容、作者等分類(lèi)方式整合檔案用戶(hù)某周期內(nèi)的瀏覽內(nèi)容，反饋其知識(shí)接收情況，有助于幫助陷入“信息繭房”的用戶(hù)戳破“過(guò)濾氣泡”，增強(qiáng)檔案用戶(hù)的信息甄別與選擇能力。

（二）管理維：防范算法風(fēng)險(xiǎn)管控策略

算法風(fēng)險(xiǎn)既有可能來(lái)源于外部環(huán)境，也可能是產(chǎn)生于內(nèi)部業(yè)務(wù)工作中。檔案部門(mén)需要制定算法治理的管控措施，營(yíng)造良好的信息生態(tài)環(huán)境。

首先，完善管理制度。一是完善風(fēng)險(xiǎn)管理制度，確保檔案數(shù)據(jù)的安全性、可用性與可靠性。充分識(shí)別檔案數(shù)據(jù)管理各個(gè)階段中潛在的算法風(fēng)險(xiǎn)，界定風(fēng)險(xiǎn)管控的范圍，制定風(fēng)險(xiǎn)管理的標(biāo)準(zhǔn)和目標(biāo)及風(fēng)險(xiǎn)應(yīng)對(duì)方案，將風(fēng)險(xiǎn)管理貫穿于整個(gè)業(yè)務(wù)流程。二是構(gòu)建審查機(jī)制，審查對(duì)象包括數(shù)據(jù)和算法。檔案部門(mén)應(yīng)審查如檔案數(shù)據(jù)利用服務(wù)目的、監(jiān)督檔案數(shù)據(jù)使用的合規(guī)性和合法性、設(shè)立算法評(píng)估的指標(biāo)、核查算法傳播內(nèi)容、定制監(jiān)督流程、完善評(píng)估報(bào)告機(jī)制等內(nèi)容。為提高審查效率和質(zhì)量，還可以引入第三方技術(shù)機(jī)構(gòu)對(duì)“AI+”檔案管理應(yīng)用系統(tǒng)的程序算法及時(shí)核查并糾錯(cuò)。

其次，凝聚監(jiān)管合力。為增強(qiáng)算法應(yīng)用監(jiān)管力量和明確監(jiān)管范圍，檔案局可牽頭成立檔案數(shù)據(jù)治理委員會(huì)，從宏觀層面上完善權(quán)責(zé)體系和健全信息保護(hù)機(jī)制，為應(yīng)用新技術(shù)提供專(zhuān)業(yè)咨詢(xún)和業(yè)務(wù)指導(dǎo)。檔案業(yè)務(wù)部門(mén)可聯(lián)合技術(shù)部門(mén)成立檔案數(shù)據(jù)監(jiān)管小組，尤其把涉及檔案數(shù)據(jù)利用的合法性和合理性作為重點(diǎn)監(jiān)管內(nèi)容，確保各項(xiàng)業(yè)務(wù)工作的權(quán)責(zé)可追溯。為聚焦檔案工作特色，檔案部門(mén)可吸納多學(xué)科領(lǐng)域人才組建“智囊團(tuán)”，例如NARA的AI團(tuán)隊(duì)成員包括檔案管理員、項(xiàng)目經(jīng)理、IT專(zhuān)家、外聯(lián)聯(lián)絡(luò)員、文件管理者和數(shù)字化專(zhuān)家[27]，有效地改善檔案部門(mén)技術(shù)缺位的現(xiàn)狀，增強(qiáng)抵御風(fēng)險(xiǎn)的力量。

最后，確保算法透明。算法在非開(kāi)發(fā)者面前是一個(gè)“黑箱”，檔案部門(mén)只有了解算法可解釋性?xún)?nèi)容，才能了解哪些檔案數(shù)據(jù)被使用，用來(lái)達(dá)到什么目的，進(jìn)而縮短與算法黑箱的距離，降低風(fēng)險(xiǎn)事件的發(fā)生概率。從目前的“AI+檔案”應(yīng)用看，算法設(shè)計(jì)多數(shù)采用外包形式，因此，檔案部門(mén)可以與外包單位簽署有關(guān)合同，分階段獲得全部代碼源，盡可能了解可解釋性部分的算法，以此維護(hù)檔案部門(mén)的話語(yǔ)權(quán)和保障公共利益。

（三）法規(guī)維：規(guī)范算法應(yīng)用行為

應(yīng)對(duì)算法帶來(lái)的挑戰(zhàn)，還需以法律和行業(yè)標(biāo)準(zhǔn)來(lái)引導(dǎo)和規(guī)范算法應(yīng)用行為。一是強(qiáng)調(diào)對(duì)檔案數(shù)據(jù)的保護(hù)，包括保障檔案數(shù)據(jù)內(nèi)容安全和監(jiān)管檔案數(shù)據(jù)利用；二是聚焦算法開(kāi)發(fā)和應(yīng)用的規(guī)范。

一方面，參照上位法律法規(guī)來(lái)規(guī)范算法應(yīng)用行為。檔案數(shù)據(jù)的利用規(guī)范可參照國(guó)家或國(guó)際頒布的信息保護(hù)條例，如參考我國(guó)頒布的《信息安全技術(shù)個(gè)人信息安全規(guī)范》（2020年版）關(guān)于個(gè)人信息安全影響評(píng)估、個(gè)人信息的使用的規(guī)定及歐盟發(fā)布的《統(tǒng)一數(shù)據(jù)保護(hù)條例》中對(duì)用戶(hù)畫(huà)像構(gòu)建活動(dòng)的規(guī)定，防控檔案用戶(hù)隱私權(quán)被侵犯、數(shù)據(jù)濫用等風(fēng)險(xiǎn)。檔案數(shù)據(jù)還可能面臨源自外來(lái)算法攻擊，當(dāng)管理和技術(shù)不能抵御風(fēng)險(xiǎn)時(shí)，應(yīng)考慮檔案數(shù)據(jù)涉及的利益主體、涉密等級(jí)，劃分風(fēng)險(xiǎn)等級(jí)，通過(guò)法律法規(guī)約束不正當(dāng)?shù)乃惴☉?yīng)用行為。具體可借鑒我國(guó)《數(shù)據(jù)安全法》中對(duì)開(kāi)展數(shù)據(jù)活動(dòng)的要求及《個(gè)人信息保護(hù)法》中對(duì)利用個(gè)人信息支持決策的條令，結(jié)合《民法典》《網(wǎng)絡(luò)安全法》等多部法律作為追溯檔案數(shù)據(jù)活動(dòng)中相關(guān)利益者責(zé)任的依據(jù)。

另一方面，構(gòu)建檔案數(shù)據(jù)利用和算法應(yīng)用的專(zhuān)門(mén)性規(guī)范。國(guó)家檔案局曾于2017年發(fā)布的《電子檔案利用規(guī)范》（以下簡(jiǎn)稱(chēng)《規(guī)范》）征求意見(jiàn)稿中對(duì)利用范圍、利用方式、利用手續(xù)、安全控制等方面提出了要求，主要強(qiáng)調(diào)以管理和技術(shù)手段保障電子檔案利用環(huán)節(jié)的內(nèi)容安全。在數(shù)據(jù)環(huán)境下，需增加檔案數(shù)據(jù)利用過(guò)程和利用目的相關(guān)規(guī)范。AI技術(shù)介入檔案工作拓寬了利用服務(wù)方式，檔案數(shù)據(jù)需經(jīng)過(guò)算法“加工”這道工序才被檔案用戶(hù)利用，由于檔案數(shù)據(jù)加工過(guò)程不透明，加工后利用價(jià)值呈現(xiàn)多元化，導(dǎo)致該《規(guī)范》對(duì)檔案數(shù)據(jù)利用工作的指導(dǎo)作用不明顯。為防范檔案工作中潛在的數(shù)據(jù)濫用、算法歧視、算法偏見(jiàn)、算法營(yíng)銷(xiāo)等風(fēng)險(xiǎn)，檔案部門(mén)可構(gòu)建適合于“AI+檔案”應(yīng)用的專(zhuān)門(mén)性規(guī)范，規(guī)范中可要求算法開(kāi)發(fā)者解釋算法開(kāi)發(fā)流程，如訓(xùn)練數(shù)據(jù)集選擇的依據(jù)、算法規(guī)則研發(fā)目的，一旦發(fā)現(xiàn)問(wèn)題，及時(shí)干預(yù)算法權(quán)力者的行為、評(píng)估涉事方相關(guān)的責(zé)任，進(jìn)而平衡檔案部門(mén)和檔案用戶(hù)的利益。還可以選擇將技術(shù)倫理原則納入《檔案法》以及其他檔案工作標(biāo)準(zhǔn)中，以法理來(lái)深化檔案工作者的責(zé)任意識(shí)。

四、結(jié)語(yǔ)

AI技術(shù)對(duì)檔案事業(yè)的發(fā)展產(chǎn)生了深遠(yuǎn)的影響，理性看待并采取手段控制AI技術(shù)可能帶來(lái)的隱患是維持檔案工作良性運(yùn)行、保持業(yè)務(wù)與技術(shù)之間發(fā)展協(xié)調(diào)與平衡的關(guān)鍵要素。本文以算法為基礎(chǔ)，審視AI算法應(yīng)用于檔案工作可能產(chǎn)生的負(fù)面影響，并從意識(shí)層面、管理層面、法規(guī)層面提出治理對(duì)策。未來(lái)，仍要具備憂(yōu)患意識(shí)，在智能技術(shù)賦能檔案事業(yè)的同時(shí)，推進(jìn)“AI+檔案”應(yīng)用算法治理的創(chuàng)新。

*本文系國(guó)家社科基金項(xiàng)目“大數(shù)據(jù)背景下檔案數(shù)據(jù)管理理論構(gòu)建、技術(shù)選優(yōu)與實(shí)踐創(chuàng)新研究”（項(xiàng)目編號(hào)：18BTQ092）階段性研究成果。

注釋及參考文獻(xiàn)：

[1]于英香，趙倩.人工智能嵌入檔案管理的邏輯與特征[J].檔案與建設(shè)，2020（1）：4-8.

[2]陳會(huì)明，史愛(ài)麗，王寧，等.人工智能技術(shù)在檔案工作中的應(yīng)用與發(fā)展芻議[J].中國(guó)檔案，2020（3）：72-74.

[3]周楓，呂東偉.基于“智能+”檔案管理初探[J].北京檔案，2019（9）：39-41.

[4]趙雪芹，李天娥.智能化環(huán)境中檔案信息服務(wù)研究現(xiàn)狀及未來(lái)研究展望[J].北京檔案，2020（1）：11-15.

[5]楊靖，朋禮青.人工智能對(duì)智慧檔案館的驅(qū)動(dòng)作用研究[J].北京檔案，2019（1）：9-13.

[6]周文泓，李新功.人工智能背景下檔案網(wǎng)站優(yōu)化策略研究[J].檔案管理，2019（3）：52-54.

[7]李子林，熊文景.人工智能對(duì)檔案管理的影響及發(fā)展建議[J].檔案與建設(shè)，2019（6）：10-13；9.

[8]丁晶晶.人工智能時(shí)代檔案管理革新路徑分析[J].檔案管理，2020（3）：67-68.

[9]韓潔，史江.人工智能賦能背景下中外檔案管理創(chuàng)新比較與啟示[J].檔案與建設(shè)，2020（2）：40-44.

[10]沙洲.人工智能在檔案工作中的應(yīng)用研究[J].檔案與建設(shè)，2018（2）：36-39.

[11][26]楊建梁，劉越男.機(jī)器學(xué)習(xí)在檔案管理中的應(yīng)用：進(jìn)展與挑戰(zhàn)[J].檔案學(xué)通訊，2019（6）：48-56.

[12]The National Archives UK.Digital Strategy[EB/OL].[2019- 12- 25].https：//www.nationalar？ chives.gov.uk/documents/the- national- archives- digi？ tal-strategy-2017-19.pdf.

[13]National Archives of the United States.DRAFT REPORT TO THE ARCHIVIST OF THE UNITED STATES[EB/OL].[2020- 05- 20].https：//www.ar？ chives.gov/files/ogis/fin-report-with-appendices.pdf.

[14]NationalArchivesofAustralia.Information Technology Strategic Direction 2019- 2022[EB/OL]. https：//www.naa.gov.au/sites/default/files/2019- 10/in？ formation-technology-strategic-direction-2019-2022. pdf.

[15]Library and Archives Canada.Library and Ar？ chives Canada Departmental Plan 2020-2021[EB/OL].[2020- 04- 27].https：//www.bac- lac.gc.ca/eng/aboutus/report- plans- priorities/departmental- plan- 2020-2021/Pages/departmental-plan-2020-2021.aspx.

[16]中國(guó)檔案資訊網(wǎng).國(guó)際檔案理事會(huì)發(fā)布2021年至2024年戰(zhàn)略規(guī)劃[EB/OL].[2020-12-04].http：// www. zgdazxw. com. cn / news / 2020 -12 / 04 /con？ tent_314891.htm.

[17]中華人民共和國(guó)國(guó)家檔案局.中辦國(guó)辦印發(fā)《“十四五”全國(guó)檔案事業(yè)發(fā)展規(guī)劃》[EB/OL].[2021-06-09]. https ： //www.saac.gov.cn/daj/toutiao/202106/ ecca2de5bce44a0eb55c890762868683.shtml.

[18]張凌寒.算法權(quán)力的興起、異化及法律規(guī)制[J].法商研究，2019，36（4）：63-75.

[19]陳鵬.算法的權(quán)力和權(quán)力的算法[J].探索，2019（4）：182-192.

[20]陳鵬.算法的權(quán)力：應(yīng)用與規(guī)制[J].浙江社會(huì)科學(xué)， 2019（4）： 52-58；157.

[21]National Archives of the United States.Nation？ al Archives and Records Administration Data Gover？ nance Board （DGB） Charter[EB/OL].[2020- 07- 17]. https ：// www. archives. gov / data / dgb ？ _ ga = 2.156275005.789216578.1610286192-1148343308.1601992695.

[22]National Archives of the United States.Cogni？ tive Technologies： Records Management Implications for Internet of Things， Robotic Process Automation， Machine Learning， and Artificial Intelligence[EB/OL].[2020- 10- 19].https：//www.archives.gov/files/recordsmgmt/policy/nara-cognitive-technologies-whitepaper. pdf.

[23]National Archives of the United States.Informa？ tion and data governance framework[EB/OL].[2021-02- 24].https：//www.naa.gov.au/about- us/our- organi？ sation/accountability- and- reporting/information- anddata-governance-framework#environment.

[24]搜狐網(wǎng).2018年數(shù)據(jù)泄露事件概要匯總[EB/ OL]. [ 2019 -03 -11 ]. https ： // www. sohu. com /a / 300519296_120056080

[25]ROLAN GREGORY， HUMPHRIESG， et al. More human than human？Artificial intelligence in the archive[J].Archives and Manuscripts，2019，47（2）：179-203.

[27]National Archives of the United States.Digital Transformation：Exploring AI[EB/OL].[2020- 02- 24]. https：//aotus.blogs.archives.gov/2020/02/24/digitaltransformation-exploring-ai/.

作者單位：上海大學(xué)圖書(shū)情報(bào)檔案系

“AI+檔案”應(yīng)用的算法風(fēng)險(xiǎn)與治理路徑探析

一、算法風(fēng)險(xiǎn)呼喚對(duì)“AI+檔案”進(jìn)行算法治理

二、“AI+檔案”應(yīng)用的算法風(fēng)險(xiǎn)

三、“AI+檔案”應(yīng)用算法治理路徑

四、結(jié)語(yǔ)

一、算法風(fēng)險(xiǎn)呼喚對(duì)“AI+檔案”進(jìn)行算法治理

二、“AI+檔案”應(yīng)用的算法風(fēng)險(xiǎn)

三、“AI+檔案”應(yīng)用算法治理路徑

四、結(jié)語(yǔ)