中圖分類號:G270.7DOI:10.16660/j.cnki.1674-098x.2205-5640-1709
作者簡介:袁月林(1963—),女,本科,研究館員,研究方向為檔案管理。
摘要:大數(shù)據(jù)背景下,數(shù)據(jù)治理成為了國家、企業(yè)不可忽視的重要課題,技術(shù)革命催生了開放共享乃至人機協(xié)同的發(fā)展場景,對于檔案管理而言也具有加大的影響。檔案作為傳統(tǒng)的記錄,實質(zhì)上也可以轉(zhuǎn)化為數(shù)字化的電子數(shù)據(jù),那么檔案管理與檔案數(shù)據(jù)管理的趨同性使得數(shù)據(jù)治理理念的融入成為了大勢所趨,但是檔案管理模式也具有其發(fā)展的背景、特點及挑戰(zhàn),本文以數(shù)據(jù)治理為視角,闡述數(shù)據(jù)治理與檔案管理的內(nèi)涵及發(fā)展,進一步探討在此層面上檔案管理事業(yè)所面臨的挑戰(zhàn)及應(yīng)對策略,以期推動我國檔案管理事業(yè)的更好、更快發(fā)展。
關(guān)鍵詞:大數(shù)據(jù) ?數(shù)據(jù)治理 ?檔案管理 ?挑戰(zhàn) ?策略
On the Development and Challenges of Archive Management Mode in the Context of Big Data
—— A Perspective of Data Governance
YUAN ?Yuelin
(Jilin Province People's Hospital, Changchun, Jilin Province, 130021 ?China)
Abstract: In the context of big data, data governance has become an important issue that cannot be ignored by the state and enterprises. The technological revolution gave birth to the development scene of open sharing and even human-computer collaboration, which also has an increasing impact on archives management. Archives, as a traditional record, can also be transformed into digital electronic data in essence. The convergence of archives management and archives data management makes the integration of the concept of data governance a general trend, but the archives management model also has its development background, characteristics and challenges. This paper expounds the connotation and development of data governance and archives management from the perspective of data governance, further explore the challenges and countermeasures faced by the cause of archives management at this level, in order to promote the better and faster development of the cause of archives management in China.
Key Words: Big data; Data governance; Archival management; Challenge; Strategy
1 “大數(shù)據(jù)”背景下的數(shù)據(jù)治理與檔案管理
“大數(shù)據(jù)”的概念是在新興技術(shù)發(fā)展升級帶來的科技革命背景下誕生,在經(jīng)歷概念的逐漸演化后,其更多指向了技術(shù)的演變和使用,這些技術(shù)可以在眾多冗雜、且呈指數(shù)增長的數(shù)據(jù)中,在正確的時間向正確的用戶提供正確的信息。大數(shù)據(jù)具有數(shù)量巨大(Volume);結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化的多樣性特征(Variety),以及傳輸速率快、實時性(Velocity)為代表的傳統(tǒng)的“3V”特征,也具有數(shù)據(jù)或數(shù)據(jù)源質(zhì)量、準確性及不確定性水平差異的特點,其質(zhì)量和準確性(Veracity)的保證是重要的,與此同時,數(shù)據(jù)所具有的潛在價值(Value)也是另一大關(guān)鍵特征,也即“5V”特征屬性。
由于數(shù)據(jù)產(chǎn)生、存儲、分析、計算力等技術(shù)的提升使得數(shù)據(jù)的存在不僅僅作為不斷累積的映射和記錄的體現(xiàn),數(shù)據(jù)作為重要的“資源”之一,其本身的價值以及其可帶動其他產(chǎn)業(yè)轉(zhuǎn)型的附加價值均得以進一步挖掘,例如政務(wù)數(shù)據(jù)的公共管理價值、科學(xué)數(shù)據(jù)的研究價值、商業(yè)數(shù)據(jù)的商業(yè)價值等,這些數(shù)據(jù)驅(qū)動的價值對于公共治理、科學(xué)研究范疇及經(jīng)濟領(lǐng)域等各領(lǐng)域具有不可小覷的重要意義,有學(xué)者發(fā)現(xiàn)數(shù)據(jù)要素已然成為實業(yè)、學(xué)界、管理界的重要研究對象,大數(shù)據(jù)范疇下的科技屬性為諸多領(lǐng)域的產(chǎn)業(yè)帶來資源重整、運行方式的變革[1],同時也推動了各領(lǐng)域向以數(shù)據(jù)依托的精細化管理發(fā)展[2],因此,數(shù)據(jù)在成為了其中新的價值元素,而圍繞數(shù)據(jù)價值下的數(shù)據(jù)治理成為新的挑戰(zhàn)。例如,我國學(xué)者從大數(shù)據(jù)價值發(fā)現(xiàn)的角度提出了4C(Collaboration)模型(數(shù)據(jù)協(xié)同、計算協(xié)同、分析協(xié)同、人機協(xié)同)進行數(shù)據(jù)價值發(fā)現(xiàn),同時也指出治理層面所需要解決的倫理問題、智能系統(tǒng)行為等多重挑戰(zhàn)[3]。
2 數(shù)據(jù)治理視角下檔案管理的內(nèi)涵發(fā)展與轉(zhuǎn)變
從傳統(tǒng)的紙質(zhì)檔案資源通過光學(xué)字符識別(OCR),到數(shù)字化的電子檔案資源,檔案早已演化為“大數(shù)據(jù)”資源中的重要組成部分,“檔案”與“檔案數(shù)據(jù)”概念趨向統(tǒng)一?;诖髷?shù)據(jù)背景下的數(shù)據(jù)治理視角,檔案管理在數(shù)據(jù)治理的映射下,其內(nèi)涵也可作為數(shù)據(jù)治理的一部分而得以豐富,同時,由于檔案也是國家公共治理、社會治理的重要組成部分,需要達到現(xiàn)代化、智能化的水平,檔案管理更是精細化管理的重要環(huán)節(jié),而“檔案治理”也因此應(yīng)運而生,在我國2016年《全國檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》中,檔案治理成為了檔案事業(yè)發(fā)展的重要關(guān)鍵詞之一[4]。在數(shù)據(jù)治理視角下的檔案管理實際上就是針對檔案數(shù)據(jù)治理,一方面脫胎于傳統(tǒng)的檔案管理,具有檔案管理的特征,另一方面也與數(shù)據(jù)治理本質(zhì)屬性共通,具有明顯的數(shù)據(jù)特征。從這兩個角度出發(fā),檔案管理的內(nèi)涵可從主體客體層面、技術(shù)理論與應(yīng)用層面及法律規(guī)制層面的發(fā)展進行理解。
2.1 主體及客體層面
傳統(tǒng)的檔案管理具有明顯的管理特征,是基于政府或企業(yè)本位,由相應(yīng)管理者從事的具有壟斷特征的管理事務(wù),而治理更傾向于具有基于現(xiàn)代化管理科學(xué)的涉及公共或私人的多元化管理的特征[5]。因此,傳統(tǒng)的檔案管理的主體是檔案部門,往往是單一主體,具有一定的壟斷性和獨立性,檔案管理負責(zé)的檔案信息往往以“孤島”的形式存在,處于隔絕、無法交互共享的狀態(tài)。而數(shù)據(jù)治理視角下的檔案管理的主體往往會因為檔案數(shù)據(jù)來源的分散性、檔案數(shù)據(jù)本身的復(fù)雜性和多元性而拓展為多元主體,在一定程度上應(yīng)當(dāng)與數(shù)據(jù)治理形成融合和共振,例如政府與公眾、不同的政府或企業(yè)部門之間等,對于單一的檔案管理部門而言,更應(yīng)當(dāng)從數(shù)據(jù)價值挖掘的角度出發(fā),探索管理的過程模式,而非僅著眼于所負責(zé)管理的檔案本身,在某種程度而言,數(shù)據(jù)技術(shù)就是一種精細化的治理術(shù),在這個意義上,檔案管理者無疑面臨更高的要求和挑戰(zhàn)。
傳統(tǒng)檔案管理的客體也即檔案信息,通常強調(diào)的是信息的穩(wěn)定、安全性,但是數(shù)據(jù)治理視角下的檔案數(shù)據(jù)需要具有開放共享的特征,強調(diào)的是數(shù)據(jù)背后蘊含的價值挖掘,運用數(shù)據(jù)技術(shù)進行安全、高效、智能化地收集、存儲、分析、利用數(shù)據(jù),可以發(fā)現(xiàn),自2007年我國通過立法的形式公布《中華人民共和國政府信息公開條例》以來,政務(wù)信息的公開成為我國探索數(shù)據(jù)治理的重要里程碑,隨著2012年上海構(gòu)建全國首個政府?dāng)?shù)據(jù)開放平臺的落地,我國的各級政府?dāng)?shù)據(jù)逐步開放,透明化的政府信息、讓陽光照進政務(wù)已成為現(xiàn)實,精細化管理逐步得以實踐。在這一趨勢之下,我國的檔案數(shù)據(jù)開放計劃也成為了“十三五”工作要點之一,電子檔案“單套制”管理的變革也是基于數(shù)據(jù)開放流動、數(shù)字化發(fā)展的需求而提出,逐步將實體運行方式轉(zhuǎn)化為數(shù)字化的虛擬運行模式[6],大數(shù)據(jù)所具有的虛擬替代屬性也在檔案管理范疇內(nèi)得以體現(xiàn),這種虛擬化的數(shù)字客體,可以充分利用互聯(lián)網(wǎng)的優(yōu)勢,實現(xiàn)動態(tài)精準地調(diào)配與利用,同時易于實現(xiàn)有序的組織與開放共享,從主客體范圍的拓展,進一步提升治理能力,豐富檔案管理內(nèi)涵屬性的邊界。
2.2 技術(shù)理論與應(yīng)用層面
大數(shù)據(jù)時代的核心關(guān)鍵詞之一就是計算分析,大數(shù)據(jù)的分析主要包含4種類型[7]。第一為描述性的分析,也即描述已經(jīng)發(fā)生的現(xiàn)象,是對過去現(xiàn)實狀態(tài)的一種收集和記錄,在一定程度上,描述性的分析手段可以紀念館一定的未來趨勢的推斷。第二為診斷性的分析,是針對某個問題的分析,找到某種問題的發(fā)生原因。第三為預(yù)測性的分析,它使用既往的數(shù)據(jù)預(yù)測未來可能發(fā)生的事件,其主要應(yīng)用的技術(shù)包括數(shù)據(jù)挖掘、人工智能技術(shù)等。第四為整合性的分析,也即依托于現(xiàn)有數(shù)據(jù)的呈現(xiàn)、預(yù)測,以及對問題的識別與判斷,加以整合分析出最佳的解決方式或發(fā)展路徑。按照以上4種分析類型,不難構(gòu)建出大數(shù)據(jù)背景下,從數(shù)據(jù)治理角度出發(fā),對檔案管理的技術(shù)的應(yīng)用。
在具體的應(yīng)用技術(shù)層面,由于區(qū)塊鏈本身的特征屬性,對于檔案管理的真實性、留痕可追溯性、多方維護、公開透明等要求具有較高的匹配度,因此區(qū)塊鏈技術(shù)是應(yīng)用于檔案管理的較為常見的技術(shù)。美國、英國等國家都逐步搭建了檔案管理引入?yún)^(qū)塊鏈技術(shù)研究的項目,同時國內(nèi)也形成了鼓勵發(fā)展的政策環(huán)境,我國學(xué)者也積極展開了相關(guān)的科研工作,涉及了技術(shù)研發(fā)、理論構(gòu)建等內(nèi)容,無論是對區(qū)塊鏈技術(shù)本身的概念拓展、還是對具體適用場景的探索,均形成了一定的科技成果[8]。圍繞區(qū)塊鏈技術(shù)在檔案管理中的應(yīng)用,調(diào)研發(fā)現(xiàn),中國石化[9]作為國有企業(yè)先行探索,從2017年開始就區(qū)塊鏈技術(shù)與業(yè)務(wù)結(jié)合可行性進行探索研究,2018年主要基于Fabric的聯(lián)盟鏈技術(shù),在企業(yè)內(nèi)部選取了多家節(jié)點完成私有鏈的搭建,在電子檔案的真實性保障層面體現(xiàn)了較高的優(yōu)勢,也由此衍生出了諸如具有身份認證及合同簽約、全流程上鏈、信息不可篡改、可公開驗證等特點的區(qū)塊鏈電子合同等應(yīng)用,使得檔案管理不僅實現(xiàn)了傳統(tǒng)功能,更通過技術(shù)的引進,在應(yīng)用的層面上形成了動態(tài)的治理優(yōu)化。除此之外,可以發(fā)現(xiàn),隨著人工智能技術(shù)的發(fā)展,智能化平臺的搭建,以及構(gòu)建“智能+檔案”成為了數(shù)字科學(xué)領(lǐng)域發(fā)展的關(guān)鍵,我國在檔案管理智能化的發(fā)展實際上也取得了一定的進展,例如2019年研制成功的檔案智能運維機器人、智能芯片、檔案庫房智能化管理等[9],均為高效、智能管理提供了技術(shù)保障,也充實了檔案管理的內(nèi)涵。
2.3 法律法規(guī)標準規(guī)制層面
正如前文提及數(shù)據(jù)治理概念面向的客體為數(shù)據(jù)資源,國際數(shù)據(jù)管理協(xié)會(DAMA)也指出這種行為屬于權(quán)力和控制的范疇[10]。但是對于檔案管理而言,在大數(shù)據(jù)背景下,其更在于權(quán)力的下放,而非形成“數(shù)據(jù)霸權(quán)”。首先,在數(shù)據(jù)治理視域下的檔案管理首先應(yīng)達到數(shù)據(jù)的標準化級別,以及構(gòu)建完善的體系。在我國的基層組織中,數(shù)據(jù)管理的“孤島”現(xiàn)象是較常見的[11],在一方面反映出了數(shù)據(jù)標準化級別尚需要提高,一方面也反映出基層工作者所面臨的巨大的挑戰(zhàn)。數(shù)據(jù)標準化的構(gòu)建需要通過國家檔案部門進一步規(guī)范國家標準。例如,我國國家檔案局在2019年發(fā)布的《電子檔案管理系統(tǒng)基本功能規(guī)定》以及相關(guān)標準文件,同時地方、機構(gòu)也可依據(jù)現(xiàn)有資源逐步完善體系的構(gòu)建。其次,從法律法規(guī)的角度,應(yīng)格外注意到檔案管理客體豐富的同時,其可能引入的敏感信息所帶來的隱私問題、數(shù)據(jù)安全問題及數(shù)據(jù)倫理問題??梢园l(fā)現(xiàn)在信息技術(shù)較為發(fā)達的現(xiàn)代社會,通過多種渠道提取個人信息已不再是難事,一張照片也可能包含海量的信息,這就提示了檔案管理者甄別重點數(shù)據(jù)對于保障數(shù)據(jù)安全和避免隱私風(fēng)險是較為重要的,如除了傳統(tǒng)檔案數(shù)據(jù)可能涉及的個人身份信息、行程信息等個人隱私信息之外,尤其需要注意生物識別信息的處理,聲音、面容等信息也可以通過技術(shù)手段實現(xiàn)個人信息穿透,進而泄露隱私。最后,就數(shù)據(jù)治理視域下的檔案管理,往往會涉及一定程度的公開共享、挖掘分析,那么就涉及數(shù)據(jù)開放共享的相關(guān)方與個人的權(quán)益,那么某些檔案數(shù)據(jù)的開放共享的范圍、對象及背后的合理性就需要得到具有一個合法合理的依據(jù),這種合理性分析在某種程度上也可保證數(shù)據(jù)開放的合倫理性,對于檔案管理而言是需要進行不斷完善的。
4 數(shù)據(jù)治理視角下的檔案管理模式挑戰(zhàn)及策略探索
4.1 檔案數(shù)據(jù)本身的特性
正如前文所述,檔案數(shù)據(jù)也是構(gòu)成“大數(shù)據(jù)”的重要組成成分,實際上,檔案數(shù)據(jù)的增長速率也不容小覷,目前,盡管已經(jīng)逐步形成了電子檔案數(shù)據(jù)的“單套制”,但是由于我國地區(qū)發(fā)展不均衡,仍存在大量依賴人工進行紙質(zhì)檔案向電子檔案轉(zhuǎn)化的情形,這種背景使得數(shù)字化檔案的轉(zhuǎn)化效率較低,同時也較易產(chǎn)生錯誤、遺漏等準確性方面的失誤[12],對于大數(shù)據(jù)背景下的檔案管理而言,準確性程度的降低,容易造成較嚴重的判斷、預(yù)測等分析偏差。同時,隨著技術(shù)的發(fā)展與普及,半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)量較大,且通常以多種組合方式與結(jié)構(gòu)化的數(shù)據(jù)進行融合,數(shù)據(jù)的標準難以統(tǒng)一。
面對這種挑戰(zhàn),構(gòu)建統(tǒng)一的標準是解決方式之一,但是在短期內(nèi)難以實現(xiàn)全國廣泛范圍內(nèi)的普及,較為折中的方式是跨區(qū)域內(nèi)、分段式達成標準規(guī)范協(xié)作共識,達成面向區(qū)域內(nèi)受眾的功能實現(xiàn)。其次,也應(yīng)當(dāng)逐步推動借助智能化的手段,提升電子數(shù)據(jù)轉(zhuǎn)化的質(zhì)量,引入自動機器人進行初步工作,人工后期介入檢驗復(fù)核是具有一定可及性的。與此同時,由于我國的檔案數(shù)字化發(fā)展并不成熟,許多基層地區(qū)仍存在顯著的“數(shù)據(jù)孤島”現(xiàn)狀,鼓勵基層對理論和實踐的不斷探索,提高工作者的數(shù)據(jù)素養(yǎng)也是較為重要的,如何從心態(tài)上轉(zhuǎn)變傳統(tǒng)的工作思路,再到實踐中積極學(xué)習(xí)先進技術(shù)知識并加以應(yīng)用,是提升我國整體檔案管理水平的關(guān)鍵。
4.2 技術(shù)的成熟度及被接納度尚待提高
盡管區(qū)塊鏈等高精尖技術(shù)的引入,為檔案管理模式的優(yōu)化帶來了新的契機,但是技術(shù)從誕生到完善往往需要較長時間的測試、融合階段,以區(qū)塊鏈技術(shù)[13]為例,其優(yōu)勢之一即為不可篡改,但是并不是絕對意義上的不可篡改,技術(shù)始終是存在漏洞的,例如公鏈平臺的雙花攻擊,這種攻擊方式可能會通過狀態(tài)機不一致執(zhí)行等方式完成,智能合約平臺也會因此在網(wǎng)絡(luò)中形成分叉,造成技術(shù)層面的損失和無法估計的不良后果。同時,隨著技術(shù)的不斷更迭,新技術(shù)的誕生可能會對舊技術(shù)帶來顛覆性的改變,人機交互與智能化的發(fā)展速度是較快的,未來技術(shù)的變革也需要在前期做好基礎(chǔ)準備,這無疑是對技術(shù)層面的必然要求。但是目前我國的檔案機構(gòu)對于第三方技術(shù)的合作維度仍需提高,跨界合作是迎接未來新技術(shù)的關(guān)鍵環(huán)節(jié),如何提高自身水平識別判斷第三方檔案科技企業(yè)的產(chǎn)品和促成合作,值得檔案管理者探索。
對于新興技術(shù)產(chǎn)業(yè)而言,從實踐中不斷積累,研發(fā)不同的策略應(yīng)對技術(shù)上存在的漏洞,并針對不同的風(fēng)險制定等級制度、備份計劃提供更完善的服務(wù)方式,有利于自身的成長和提高檔案管理部門或機構(gòu)的信賴和接納程度。而對于檔案管理部門或機構(gòu)而言,引入人才、重視交叉學(xué)科人才的培養(yǎng)及對檔案管理新模式的積極探索,才能夠滿足國家對于檔案事業(yè)發(fā)展的需求,實現(xiàn)內(nèi)部機構(gòu)與外部企業(yè)及智能化檔案管理受眾等的合作多贏。
4.3 檔案相關(guān)政策法規(guī)制度有待完善
實際上,我國對于數(shù)據(jù)安全、網(wǎng)絡(luò)安全個人信息保護等領(lǐng)域均已逐步完成了頂層設(shè)計的立法工作,基于相關(guān)法律和政策可以發(fā)現(xiàn)我國對于數(shù)據(jù)資源的重視程度是較高的,但是檔案相關(guān)的政策法規(guī)制度仍有待完善。盡管就檔案而言,從領(lǐng)域上仍可劃分為學(xué)生教育檔案、病人檔案(病案)、社會保障檔案等多種形式,且不同分類皆具有其特點,數(shù)據(jù)標準難以統(tǒng)一,制定政策具有一定難度,但是檔案數(shù)據(jù)的政策法規(guī)制度也應(yīng)在實踐中逐步完善與宣講,無論是按照領(lǐng)域還是按照年齡,抑或是按照個人全生命周期的管理,促進制度的完善對于基層的檔案管理模式的轉(zhuǎn)型與科學(xué)深化發(fā)展是尤為重要的,也將有利于實現(xiàn)我國檔案管理事業(yè)的更好、更快發(fā)展。
參考文獻
[1] 王謙,付曉東.數(shù)據(jù)要素賦能經(jīng)濟增長機制探究[J].上海經(jīng)濟研究,2021(4):55-66.
[2] 鎖利銘,馮小東.數(shù)據(jù)驅(qū)動的城市精細化治理:特征、要素與系統(tǒng)耦合[J].公共管理學(xué)報,2018,15(4):17-26.
[3] 劉業(yè)政,孫見山,姜元春,等.大數(shù)據(jù)的價值發(fā)現(xiàn):4C模型[J].管理世界,2020,36(2):129-138.
[4] 金波,楊鵬.大數(shù)據(jù)時代檔案數(shù)據(jù)治理研究[J].檔案學(xué)研究,2020(4):29-37.
[5] 俞可平.全球治理引論[J].馬克思主義與現(xiàn)實,2002(1):20-32.
[6] 陳艷.我國省級檔案數(shù)據(jù)治理體系框架構(gòu)建研究--基于浙江省實踐的研究[D].濟南:山東大學(xué),2020.
[7] RIAHI Y . Big Data and Big Data Analytics: Concepts, Types and Technologies[J].Marwah Infotech,2018(9):524-528.
[8] 劉越男,張一鋒,吳云鵬,等.區(qū)塊鏈技術(shù)與文件檔案管理:技術(shù)和管理的雙向思考[J].檔案學(xué)通訊,2020(1):4-12.
[9] 史江,羅紫菡.“智能+”時代檔案管理方法創(chuàng)新探討[J].檔案學(xué)研究,2021(2):54-59.
[10] 雷浩偉,廖秀健.數(shù)據(jù)治理視閾下數(shù)據(jù)權(quán)力與數(shù)據(jù)權(quán)利研究:存續(xù)邏輯、沖突悖論與完善進路[J].科技與法律,2021(5):22-33.
[11] 吳黎明.大連市民生檔案數(shù)據(jù)整合利用問題研究[D].大連:大連理工大學(xué),2020.
[12] 周林興,林凱.大數(shù)據(jù)時代檔案數(shù)據(jù)質(zhì)量控制:現(xiàn)狀、機制與優(yōu)化路徑[J].檔案與建設(shè),2022(2):4-8.
[13] 李春艷,喬超.區(qū)塊鏈技術(shù)在大型企業(yè)集團電子文件管理中的應(yīng)用——以中國石化為例[J]. 檔案學(xué)通訊,2020(1):13-20.