王寧 李晶偉
[摘要]大數(shù)據(jù)作為一種新的信息常態(tài)和技術(shù)環(huán)境,對(duì)檔案工作發(fā)展和檔案學(xué)理論研究帶來(lái)諸多新的機(jī)遇和挑戰(zhàn)。論文在對(duì)相關(guān)研究進(jìn)行總結(jié)和回顧的基礎(chǔ)上,從實(shí)踐需求環(huán)境的視角切入,探討大數(shù)據(jù)對(duì)檔案工作實(shí)踐、檔案學(xué)理論創(chuàng)新、人才選用的影響,提出大數(shù)據(jù)環(huán)境下我國(guó)檔案學(xué)研究發(fā)展思路:催生檔案數(shù)據(jù)學(xué)研究興起,培育檔案數(shù)據(jù)思維、數(shù)據(jù)素養(yǎng),全面拓展檔案數(shù)據(jù)管理能力。
[關(guān)鍵詞]檔案數(shù)據(jù)檔案數(shù)據(jù)學(xué)數(shù)據(jù)管理數(shù)據(jù)素養(yǎng)
[分類(lèi)號(hào)]G270.7
Research Progress of Archives Science in China under the Influence of Big Data
——Based on the Analysis of the Practice Requirements Environment
Wang Ning1Li Jingwei2(1. School of Information Resource Management of Renmin University of China, Beijing, 100872; 2. China Ship Research and Development Academy,Beijing,100101)
Abstract: As a new information normality and technical environment, big data brings many new opportunities and challenges to the development of archival work and the theoretical study of archival science. Based on the summary and review of relevant research and from the perspective of practical requirements environment,this paper discusses the impact of big data on archival work practice, archival theory innovation and talent selection, and proposes the research progress of archives science in China under the big data environment:promote the rise of archival data science research, cultivate archival data thinking and data literacy, comprehensively expand the capacity of archive data management.
Keywords: Archive Data; Archival Data Science; Data Management; Data Accomplishment
1引言
“大數(shù)據(jù)”是互聯(lián)網(wǎng)信息技術(shù)高速發(fā)展的產(chǎn)物,其概念的提出者麥肯錫給出的定義是“一種規(guī)模大到在獲取、存儲(chǔ)、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具能力范圍的數(shù)據(jù)集合”[1]。大數(shù)據(jù)具有規(guī)模海量、高速流轉(zhuǎn)、類(lèi)型多樣和價(jià)值密度低四大主要特征,其影響力已經(jīng)滲透到社會(huì)發(fā)展的各個(gè)領(lǐng)域,檔案學(xué)也不例外。具有復(fù)雜關(guān)聯(lián)關(guān)系的大數(shù)據(jù)集合以數(shù)據(jù)湖、數(shù)據(jù)球、數(shù)據(jù)大腦等形式呈現(xiàn),用于智慧城市建構(gòu)。智慧檔案館的大數(shù)據(jù)挖掘分析技術(shù)的日益發(fā)展,對(duì)當(dāng)前和未來(lái)“檔案”的管理提出不同以往的沖擊性甚至顛覆性需求。筆者在相關(guān)調(diào)研的過(guò)程中,驚嘆實(shí)踐環(huán)境下大數(shù)據(jù)發(fā)展對(duì)檔案學(xué)工作深刻影響的同時(shí),也深刻認(rèn)識(shí)到檔案大數(shù)據(jù)理論研究在一定程度上面臨著滯后于實(shí)踐發(fā)展需求的尷尬困境。本文擬從實(shí)踐需求環(huán)境的視角分析大數(shù)據(jù)對(duì)檔案學(xué)發(fā)展的影響和要求,提出探討性的發(fā)展思路。
2研究總結(jié)與回顧
大數(shù)據(jù)對(duì)檔案學(xué)的學(xué)術(shù)理論研究和社會(huì)實(shí)踐應(yīng)用都產(chǎn)生了廣泛而深刻的影響。2016年國(guó)家檔案局印發(fā)《全國(guó)檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》,在“加快檔案管理信息化進(jìn)程”模塊中明確指出,探索電子檔案與大數(shù)據(jù)行動(dòng)的融合,制定檔案數(shù)據(jù)開(kāi)放計(jì)劃。筆者于2018年5月10日在中國(guó)知網(wǎng)文獻(xiàn)數(shù)據(jù)庫(kù)以“檔案學(xué)”并含“大數(shù)據(jù)”進(jìn)行“主題”模糊檢索,經(jīng)二次篩選共獲得46篇有效文獻(xiàn)。
通過(guò)內(nèi)容分析后發(fā)現(xiàn),學(xué)者們逐漸關(guān)注到大數(shù)據(jù)對(duì)現(xiàn)有檔案理論的沖擊與挑戰(zhàn),激發(fā)檔案理論的變革,就“大數(shù)據(jù)是不是檔案”[2][3“]大數(shù)據(jù)觸發(fā)新的檔案管理理論”[4][5]等問(wèn)題進(jìn)行深入探討。此外,學(xué)者們更關(guān)注到大數(shù)據(jù)對(duì)檔案工作管理實(shí)踐帶來(lái)的深刻影響,認(rèn)識(shí)到大數(shù)據(jù)對(duì)檔案數(shù)據(jù)資源的收集、整合、管理、開(kāi)發(fā)利用帶來(lái)重大機(jī)遇與挑戰(zhàn)。大數(shù)據(jù)不僅影響檔案數(shù)據(jù)資源建設(shè)的結(jié)構(gòu)與內(nèi)容,擴(kuò)大檔案收集范圍,容納多樣性數(shù)據(jù)類(lèi)型[6],而且推動(dòng)檔案數(shù)據(jù)資源整合與服務(wù)面臨著新思維、新方式、新資源、新基礎(chǔ)設(shè)施、新能力和新權(quán)力[7]。以數(shù)據(jù)質(zhì)量管理、可視化分析、語(yǔ)義引擎、數(shù)據(jù)挖掘、趨勢(shì)預(yù)測(cè)為代表的大數(shù)據(jù)分析方法與技術(shù)工具,可以幫助企業(yè)從檔案數(shù)據(jù)中發(fā)現(xiàn)規(guī)律和問(wèn)題,推動(dòng)企業(yè)科學(xué)決策與技術(shù)創(chuàng)新[8]。同時(shí),數(shù)據(jù)分析和數(shù)據(jù)挖掘等技術(shù)的使用,能夠推動(dòng)智慧檔案館的建設(shè)與應(yīng)用,實(shí)現(xiàn)檔案數(shù)據(jù)資源的全面感知、綜合處置、業(yè)務(wù)協(xié)同、泛在服務(wù)[9]。此外,大數(shù)據(jù)極大地推動(dòng)檔案數(shù)據(jù)化,但如何保證檔案數(shù)據(jù)資源的真實(shí)、可靠、完整、可用成為檔案工作管理實(shí)踐面臨的重大挑戰(zhàn)[10],更對(duì)檔案工作者的素質(zhì)與技能提出更高的要求??傊?,大數(shù)據(jù)對(duì)于檔案數(shù)據(jù)資源管理的理論與實(shí)踐都形成巨大沖擊,有學(xué)者甚至展望,未來(lái)我國(guó)檔案大數(shù)據(jù)將朝著基于大數(shù)據(jù)觀的檔案管理理論形成、基于大數(shù)據(jù)技術(shù)的檔案管理技術(shù)拓展、基于大數(shù)據(jù)思維的檔案管理方法創(chuàng)新的方向發(fā)展[11]。本文認(rèn)為,學(xué)者們?cè)跈n案學(xué)與大數(shù)據(jù)領(lǐng)域交叉研究的成果已然構(gòu)成“檔案數(shù)據(jù)學(xué)”的研究表征,在檔案數(shù)據(jù)管理思維、數(shù)據(jù)素養(yǎng)和檔案數(shù)據(jù)管理能力方面的研究還需進(jìn)一步深化。
3實(shí)踐視角下大數(shù)據(jù)對(duì)檔案學(xué)發(fā)展的影響
3.1大數(shù)據(jù)影響檔案信息的組織和管理方式
受互聯(lián)網(wǎng)、云計(jì)算、人工智能等新技術(shù)的影響,“許多行業(yè)的業(yè)務(wù)形態(tài)開(kāi)始發(fā)生巨大變化,數(shù)據(jù)驅(qū)動(dòng)、模型驅(qū)動(dòng)的業(yè)務(wù)系統(tǒng)越來(lái)越多”[12],電子文件單軌制運(yùn)行趨勢(shì)日益加強(qiáng)。相比起將傳統(tǒng)紙質(zhì)檔案數(shù)字化的成果而言,業(yè)務(wù)系統(tǒng)中生成的原生數(shù)字態(tài)信息,規(guī)模更加龐大而且不可阻擋,由此對(duì)文件、檔案帶來(lái)的最大的變化是檔案信息的動(dòng)態(tài)性、多樣性空前增強(qiáng),而高價(jià)值、低密度化日益顯著。大量檔案信息以結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的形式存在于實(shí)時(shí)更新動(dòng)態(tài)的業(yè)務(wù)系統(tǒng)中,通過(guò)數(shù)據(jù)庫(kù)技術(shù)、云計(jì)算平臺(tái)等緊密聯(lián)結(jié)在一起,成為業(yè)務(wù)活動(dòng)正常運(yùn)行的“燃料庫(kù)”和大數(shù)據(jù)中心信息資源庫(kù)的數(shù)據(jù)來(lái)源。
檔案信息組織方式發(fā)生巨大變化的同時(shí),檔案信息的管理方式也正悄然發(fā)生著深刻變革。尤其是“國(guó)家大數(shù)據(jù)發(fā)展戰(zhàn)略和互聯(lián)網(wǎng)+行動(dòng)計(jì)劃的推進(jìn),深刻影響了檔案工作的理念、技術(shù)、方法及模式”[13]。傳統(tǒng)載體環(huán)境中的檔案管理通常以“收集、整理、鑒定、保管、編目與檢索、編輯與研究、統(tǒng)計(jì)和利用服務(wù)”八大環(huán)節(jié)為主要內(nèi)容,管理環(huán)節(jié)從文件辦理完畢歸檔后才正式開(kāi)始,管理的技術(shù)思路比較清晰。而數(shù)字環(huán)境中以單軌制運(yùn)行的電子文件則是在動(dòng)態(tài)的業(yè)務(wù)系統(tǒng)中生成,從系統(tǒng)設(shè)計(jì)開(kāi)始到文件運(yùn)轉(zhuǎn)的整個(gè)過(guò)程都要考慮到文件管理的需求,文檔管理需要盡可能地實(shí)現(xiàn)“前端控制”和“全程管理”。面對(duì)以數(shù)據(jù)為主要形式的電子文件的歸檔,要對(duì)分散于系統(tǒng)不同物理位置的數(shù)據(jù)信息以單項(xiàng)業(yè)務(wù)活動(dòng)為核心重新組織和捕獲,基于技術(shù)手段對(duì)文件的真實(shí)性、完整性、安全性和可用性進(jìn)行檢測(cè),并建設(shè)安全可靠的電子文件長(zhǎng)期保存系統(tǒng)對(duì)其進(jìn)行長(zhǎng)期保存和數(shù)據(jù)信息的分析開(kāi)發(fā)利用。例如,浙江省檔案局對(duì)浙江省統(tǒng)一政務(wù)云平臺(tái)上形成的網(wǎng)上行政審批數(shù)據(jù),采取電子化實(shí)時(shí)歸檔方案,以業(yè)務(wù)事項(xiàng)為核心,將相關(guān)的行政審批類(lèi)數(shù)據(jù)打包成存檔數(shù)據(jù)包進(jìn)行歸檔。2017年10月,杭州市還成立了大數(shù)據(jù)資源管理局,負(fù)責(zé)對(duì)分散在各個(gè)機(jī)構(gòu)不同業(yè)務(wù)系統(tǒng)中生成的數(shù)據(jù)進(jìn)行集中管理和挖掘[14]。青島市近年來(lái)發(fā)展“智慧檔案館”,對(duì)檔案數(shù)據(jù)采取智慧管理和應(yīng)用的方式[15],對(duì)檔案數(shù)據(jù)利用控制中心、魔方適配器、主動(dòng)捕獲引擎、嵌入式工具集和資源池的數(shù)據(jù)魔方式等技術(shù)進(jìn)行智慧收集,并采用OCR識(shí)別、知識(shí)管理等技術(shù)對(duì)檔案內(nèi)容進(jìn)行智慧管理,在檔案館的智慧服務(wù)方面取得了較大成效。
由此可見(jiàn),大數(shù)據(jù)影響下的檔案信息以數(shù)據(jù)形式存在更加普遍,而管理方式上雖然尚缺乏統(tǒng)一的標(biāo)準(zhǔn)和模式,但是各實(shí)踐部門(mén)也基于機(jī)構(gòu)實(shí)際情況紛紛進(jìn)行探索,在數(shù)據(jù)挖掘、知識(shí)管理、智能服務(wù)等方面取得顯著成果。
3.2大數(shù)據(jù)影響檔案事業(yè)發(fā)展的理論需求
大數(shù)據(jù)影響下的檔案信息存在形式和管理方式發(fā)生變化的同時(shí)也帶來(lái)新的理論需求,即對(duì)電子檔案數(shù)據(jù)管理、檔案數(shù)據(jù)信息助力政府治理以及檔案社會(huì)化服務(wù)等方面體現(xiàn)了更高的理論需求。2015年8月,國(guó)務(wù)院印發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,指出“大數(shù)據(jù)成為提升政府治理能力的新途徑”[16],大數(shù)據(jù)因其在揭示數(shù)據(jù)之間復(fù)雜的關(guān)聯(lián)關(guān)系、數(shù)據(jù)共用共享和數(shù)據(jù)資源整合以挖掘更深刻的數(shù)據(jù)價(jià)值等方面的特有優(yōu)勢(shì),對(duì)于解決復(fù)雜社會(huì)問(wèn)題具有較強(qiáng)應(yīng)用性,“用數(shù)據(jù)說(shuō)話、用數(shù)據(jù)決策、用數(shù)據(jù)管理、用數(shù)據(jù)創(chuàng)新”成為大數(shù)據(jù)時(shí)代政府治理的必然選擇。而檔案數(shù)據(jù)資源正是重要的政府?dāng)?shù)據(jù)信息的組成部分。國(guó)家檔案局在2016年印發(fā)的《全國(guó)檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》也明確指出,要“探索電子檔案與大數(shù)據(jù)行動(dòng)的融合”,“加快提升電子檔案管理水平”,“建立開(kāi)放檔案信息資源社會(huì)化共享服務(wù)平臺(tái),制定檔案數(shù)據(jù)開(kāi)放計(jì)劃,落實(shí)數(shù)據(jù)開(kāi)放與維護(hù)的責(zé)任”[17]。
大數(shù)據(jù)實(shí)踐發(fā)展和國(guó)家政策的指引對(duì)于檔案理論建設(shè)新變革的要求迫在眉睫,檔案學(xué)界也已引起高度重視,這也是近幾年“檔案與大數(shù)據(jù)”研究熱度不減的原因。近年來(lái),受到后保管主義和文件連續(xù)體理論的影響,我國(guó)的檔案學(xué)研究在電子文件管理層面已經(jīng)取得較大進(jìn)展,在電子文件管理系統(tǒng)ERMS建設(shè)、電子文件與電子檔案管理規(guī)范、數(shù)字檔案館建設(shè)方面取得豐碩成果,并推進(jìn)《電子文件管理系統(tǒng)通用功能要求》《電子文件管理系統(tǒng)建設(shè)指南》《數(shù)字檔案館建設(shè)指南》《電子文件歸檔與電子檔案管理規(guī)范》等國(guó)家標(biāo)準(zhǔn)的制定。但是,大數(shù)據(jù)、云計(jì)算和互聯(lián)網(wǎng)+的快速推進(jìn),又給檔案學(xué)的研究提出了新的難題:大規(guī)模數(shù)據(jù)態(tài)的檔案信息蜂擁而至,檔案學(xué)研究者面臨著如何收集和管理業(yè)務(wù)系統(tǒng)中高速運(yùn)轉(zhuǎn)的大量數(shù)據(jù)信息、如何長(zhǎng)期保存單軌制形勢(shì)下電子檔案信息、如何開(kāi)展檔案數(shù)據(jù)信息開(kāi)發(fā)、如何使檔案數(shù)據(jù)更有效地助力政府治理和社會(huì)服務(wù),這都是亟待進(jìn)一步研究和解決的理論問(wèn)題。
3.3大數(shù)據(jù)影響檔案人才選用和儲(chǔ)備
以數(shù)據(jù)為核心的檔案信息管理不同于傳統(tǒng)載體時(shí)代以載體為中心的管理方式,大數(shù)據(jù)、云計(jì)算等新技術(shù)環(huán)境下產(chǎn)生的數(shù)據(jù)態(tài)檔案對(duì)象,“各系統(tǒng)的運(yùn)轉(zhuǎn)、接收、輸入、中間辦理等都是以數(shù)據(jù)交互方式進(jìn)行,數(shù)據(jù)態(tài)管理空間的主要管理對(duì)象為數(shù)據(jù)、規(guī)則、模型與本體等類(lèi)型”[18],這對(duì)于檔案工作者的能力和素養(yǎng)就提出更高要求。新形勢(shì)下,檔案工作人員不僅僅要具備基本的檔案管理理論知識(shí)和相對(duì)嫻熟的計(jì)算機(jī)、網(wǎng)絡(luò)操作技能,還須具備一定的檔案數(shù)據(jù)思維和數(shù)據(jù)素養(yǎng)。只有系統(tǒng)掌握數(shù)據(jù)與檔案之間的共通關(guān)系,掌握數(shù)據(jù)獲取、分析、組織、保存和再利用的基本技能,理解大數(shù)據(jù)在當(dāng)前社會(huì)環(huán)境下所發(fā)揮的重要作用,才能更好地勝任以數(shù)據(jù)為核心的檔案工作。
與此同時(shí),大數(shù)據(jù)環(huán)境下的檔案學(xué)科研究人員,尤其是檔案信息化和電子文件檔案管理研究方向的研究人員,同樣需儲(chǔ)備一定的數(shù)據(jù)素養(yǎng)。如果對(duì)數(shù)據(jù)的形成過(guò)程、運(yùn)行形式、獲取方式、保存和利用方式、數(shù)據(jù)關(guān)聯(lián)后產(chǎn)生的效應(yīng)等缺乏深度的了解,便無(wú)法從數(shù)據(jù)生命周期管理角度去審視“檔案”管理,也難以從數(shù)據(jù)角度去衡量“檔案”價(jià)值,更難以提出可以指導(dǎo)實(shí)踐的檔案數(shù)據(jù)管理層面理論,也難以培養(yǎng)出具備數(shù)據(jù)素養(yǎng)的檔案專(zhuān)業(yè)人才。檔案越來(lái)越多地以“數(shù)據(jù)”形式?jīng)坝慷鴣?lái),實(shí)踐部門(mén)的步伐已經(jīng)緊緊跟進(jìn)大數(shù)據(jù)的發(fā)展速度,而檔案專(zhuān)業(yè)人員無(wú)論是在實(shí)踐還是研究層面,都受到一定的挑戰(zhàn),培養(yǎng)和儲(chǔ)備適應(yīng)大數(shù)據(jù)環(huán)境的檔案專(zhuān)業(yè)復(fù)合型人才成為檔案學(xué)發(fā)展的應(yīng)有之義。
4大數(shù)據(jù)影響下的檔案學(xué)發(fā)展趨勢(shì)
4.1檔案數(shù)據(jù)學(xué)應(yīng)運(yùn)而生
大數(shù)據(jù)以驚人的速度進(jìn)入我們的生活,也進(jìn)入到檔案事業(yè)的方方面面。正如前文所述,在實(shí)踐環(huán)境中檔案正以“數(shù)據(jù)”的形式越來(lái)越普遍存在,關(guān)注檔案的數(shù)據(jù)形式和管理思維的研究成果日益增多。學(xué)者們多立足于檔案工作實(shí)踐和檔案事業(yè)發(fā)展的視角研究大數(shù)據(jù),檔案數(shù)據(jù)學(xué)應(yīng)運(yùn)而生。本文認(rèn)為,“檔案數(shù)據(jù)學(xué)”是大數(shù)據(jù)環(huán)境下以檔案數(shù)據(jù)概念、數(shù)據(jù)形式、數(shù)據(jù)思維、數(shù)據(jù)管理、數(shù)據(jù)信息開(kāi)發(fā)等為主要研究?jī)?nèi)容的檔案學(xué)研究方向,一定程度上已建立雛形,在核心學(xué)者的引領(lǐng)下將繼續(xù)發(fā)展和推進(jìn)。已有的研究成果中,或從檔案與數(shù)據(jù)的關(guān)系,探討“檔案數(shù)據(jù)”的概念[19];或從技術(shù)變遷對(duì)檔案對(duì)象管理空間的角度,提出檔案對(duì)象從數(shù)字態(tài)到數(shù)據(jù)態(tài)的變化趨勢(shì),提出檔案“數(shù)據(jù)化”的理念[20];或從大數(shù)據(jù)政策背景下的電子文件歸檔角度引出“數(shù)據(jù)歸檔”的概念,探討檔案數(shù)據(jù)體認(rèn)知、鑒定方法論、體制回應(yīng)、系統(tǒng)和技術(shù)回應(yīng)的方案[21];或從數(shù)據(jù)素養(yǎng)的培養(yǎng)角度探討檔案學(xué)專(zhuān)業(yè)教育的內(nèi)容體系完善[22]。這些研究都體現(xiàn)了受到大數(shù)據(jù)實(shí)踐環(huán)境影響下的學(xué)者們對(duì)檔案學(xué)發(fā)展的認(rèn)識(shí)與反思,體現(xiàn)“檔案數(shù)據(jù)學(xué)”研究的多角度思維。
如今檔案事業(yè)發(fā)展對(duì)檔案理論的需求正在發(fā)生著日新月異的變化。對(duì)于大數(shù)據(jù)是否為“檔案”的命題,筆者同意何嘉蓀等學(xué)者的觀點(diǎn),認(rèn)為存儲(chǔ)于電腦網(wǎng)絡(luò)云端的“數(shù)據(jù)”,只要具備原始記錄性和不可逆的特征,能夠反映業(yè)務(wù)活動(dòng)的過(guò)程和痕跡,并且具有保存價(jià)值,就當(dāng)屬于“檔案”的范疇,并且理應(yīng)納入檔案數(shù)據(jù)學(xué)研究框架之內(nèi)。大數(shù)據(jù)時(shí)代的檔案學(xué)理論研究,需在傳統(tǒng)基礎(chǔ)理論研究框架之外,兼顧檔案事業(yè)發(fā)展的新理論需求,關(guān)注大數(shù)據(jù)相關(guān)學(xué)科的成果、動(dòng)向,加強(qiáng)研究者對(duì)實(shí)踐領(lǐng)域的及時(shí)追蹤,及時(shí)總結(jié)分析大數(shù)據(jù)對(duì)檔案、檔案工作、檔案事業(yè)的影響,發(fā)現(xiàn)技術(shù)變革給管理帶來(lái)的需求和問(wèn)題,以及隨之而生的各種社會(huì)現(xiàn)象。對(duì)“數(shù)據(jù)”本身的研究并不是目的,厘清“數(shù)據(jù)”與“檔案”的關(guān)系,界定“檔案數(shù)據(jù)”的邊界,明確檔案人員在“大數(shù)據(jù)信息管理”中的角色定位和工作能力要求,建設(shè)科學(xué)合理的檔案數(shù)據(jù)“收”“管”“存”“用”理論和檔案數(shù)據(jù)信息開(kāi)發(fā)開(kāi)放理論,探索依托檔案數(shù)據(jù)的政府治理策略等議題,逐漸成為研究者關(guān)注內(nèi)容,檔案數(shù)據(jù)學(xué)的產(chǎn)生和發(fā)展正是適應(yīng)這一形勢(shì)的客觀選擇,檔案數(shù)據(jù)學(xué)應(yīng)運(yùn)而生。
4.2建立培育檔案數(shù)據(jù)思維與數(shù)據(jù)素養(yǎng)
為適應(yīng)大數(shù)據(jù)對(duì)檔案事業(yè)發(fā)展的實(shí)踐影響,需盡快建立檔案數(shù)據(jù)思維和培育數(shù)據(jù)素養(yǎng)。檔案數(shù)據(jù)思維是從檔案學(xué)的角度審視數(shù)據(jù),建立對(duì)檔案數(shù)據(jù)的認(rèn)知和鑒別力;數(shù)據(jù)素養(yǎng)是涵蓋數(shù)據(jù)態(tài)度、數(shù)據(jù)意識(shí)、數(shù)據(jù)知識(shí)、數(shù)據(jù)技能、數(shù)據(jù)文化、數(shù)據(jù)倫理等在內(nèi)的綜合素養(yǎng)[23]。檔案數(shù)據(jù)思維和數(shù)據(jù)素養(yǎng)的建立和培育,應(yīng)通過(guò)理論培養(yǎng)和實(shí)踐操作相結(jié)合而實(shí)現(xiàn)。
一方面,需要通過(guò)相關(guān)數(shù)據(jù)科學(xué)的課程,培養(yǎng)檔案專(zhuān)業(yè)學(xué)生的數(shù)據(jù)思維和數(shù)據(jù)素養(yǎng),提高其對(duì)大數(shù)據(jù)技術(shù)和環(huán)境的認(rèn)知。iSchool聯(lián)盟的38所院校的圖書(shū)情報(bào)和檔案相關(guān)專(zhuān)業(yè)均開(kāi)設(shè)相關(guān)的數(shù)據(jù)科學(xué)課程,部分院校還建立“數(shù)據(jù)科學(xué)”專(zhuān)業(yè),課程內(nèi)容主要涉及數(shù)據(jù)意識(shí)、數(shù)據(jù)能力和數(shù)據(jù)倫理幾個(gè)層面。數(shù)據(jù)意識(shí)包括數(shù)據(jù)價(jià)值意識(shí)、數(shù)據(jù)安全意識(shí)、數(shù)據(jù)共享思維、數(shù)據(jù)批判思維;數(shù)據(jù)能力包括數(shù)據(jù)發(fā)現(xiàn)和獲取、數(shù)據(jù)管理、數(shù)據(jù)描述與元數(shù)據(jù)、數(shù)據(jù)評(píng)估、數(shù)據(jù)分析、數(shù)據(jù)挖掘和數(shù)據(jù)再利用等能力;數(shù)據(jù)倫理包括數(shù)據(jù)隱私、數(shù)據(jù)交流規(guī)則、數(shù)據(jù)信任、合法合理使用數(shù)據(jù)等內(nèi)容[24]。而從目前我國(guó)的檔案學(xué)專(zhuān)業(yè)的課程設(shè)置來(lái)看,基本上尚未將“數(shù)據(jù)素養(yǎng)”課程納入到教育體系中來(lái),但是在研究中已經(jīng)認(rèn)識(shí)到數(shù)據(jù)素養(yǎng)對(duì)檔案學(xué)教育的重要性。因此,在今后的檔案學(xué)教育內(nèi)容完善過(guò)程中,應(yīng)將“數(shù)據(jù)素養(yǎng)”培養(yǎng)納入教育內(nèi)容體系中,基于檔案和數(shù)據(jù)的關(guān)系開(kāi)設(shè)相關(guān)課程,培養(yǎng)具備“數(shù)據(jù)素養(yǎng)”的專(zhuān)業(yè)性技術(shù)人才。另一方面,檔案數(shù)據(jù)思維和數(shù)據(jù)素養(yǎng)的培育需要通過(guò)一定的實(shí)踐性學(xué)習(xí)和操作,熟悉檔案數(shù)據(jù)在實(shí)踐部門(mén)如何產(chǎn)生、運(yùn)轉(zhuǎn)、收集、管理和挖掘,并且實(shí)際嘗試參與檔案數(shù)據(jù)信息管理和內(nèi)容開(kāi)發(fā)的工作,在實(shí)踐中加強(qiáng)自身的數(shù)據(jù)素養(yǎng)和能力。
4.3全面拓展檔案數(shù)據(jù)管理能力
大數(shù)據(jù)影響下的檔案學(xué)研究?jī)?nèi)容重心從檔案形式管理向檔案內(nèi)容信息管理和開(kāi)發(fā)轉(zhuǎn)向,檔案數(shù)據(jù)的管理能力亟須不斷增強(qiáng)?,F(xiàn)階段檔案數(shù)據(jù)管理范疇主要是以檔案館的數(shù)字化成果作為檔案數(shù)據(jù)管理和開(kāi)發(fā)內(nèi)容,將來(lái)檔案數(shù)據(jù)管理范疇?wèi)?yīng)不斷拓展,譬如將更加關(guān)注對(duì)存儲(chǔ)于機(jī)構(gòu)內(nèi)部和業(yè)務(wù)系統(tǒng)階段中的“未來(lái)檔案數(shù)據(jù)”的管理。為適應(yīng)新形勢(shì),檔案人才培養(yǎng)也要由傳統(tǒng)的理論型和“檔案保管員”培養(yǎng)模式向“技術(shù)+管理”復(fù)合型人才培養(yǎng)模式轉(zhuǎn)向。
以數(shù)據(jù)驅(qū)動(dòng)為動(dòng)力的業(yè)務(wù)系統(tǒng)的大規(guī)模建設(shè),帶來(lái)的主要變化是信息以分散而復(fù)雜關(guān)聯(lián)數(shù)據(jù)集合的狀態(tài)在系統(tǒng)中大量存在。對(duì)與同一業(yè)務(wù)活動(dòng)相關(guān)的檔案信息,無(wú)法以傳統(tǒng)“載體”收集和整合的方式而聚集管理,大量數(shù)據(jù)庫(kù)的存在使得信息不再以傳統(tǒng)概念“文件”的形式存在,而是更加分散化、復(fù)雜化,對(duì)其進(jìn)行“檔案化”管理需要更新理論和實(shí)踐方案。在檔案價(jià)值實(shí)現(xiàn)方面,依托大量業(yè)務(wù)活動(dòng)“檔案數(shù)據(jù)”信息內(nèi)容,以“數(shù)據(jù)”為核心的檔案集合,可以直接為大數(shù)據(jù)中心提供資源,作用于政府治理和相關(guān)活動(dòng)中,杭州市數(shù)據(jù)資源局的大數(shù)據(jù)歸集行動(dòng)和數(shù)據(jù)大腦等對(duì)檔案部門(mén)的實(shí)踐工作具有新的啟發(fā)和思考。浙江省檔案局在將浙江省政務(wù)云平臺(tái)上的網(wǎng)上行政審批類(lèi)電子文件實(shí)時(shí)歸檔之后,通過(guò)數(shù)字檔案館系統(tǒng)直接向浙江省的大數(shù)據(jù)中心提供檔案信息資源的共享,并服務(wù)于“臺(tái)前”的行政審批服務(wù)工作。青島市檔案館對(duì)檔案內(nèi)容進(jìn)行智慧管理,采取數(shù)據(jù)模型分析、數(shù)據(jù)挖掘、數(shù)據(jù)檢索、語(yǔ)義分析、聚類(lèi)分類(lèi)等技術(shù),實(shí)現(xiàn)對(duì)檔案內(nèi)容的充分挖掘和整合利用。簡(jiǎn)而言之,大數(shù)據(jù)通過(guò)知識(shí)關(guān)聯(lián)和數(shù)據(jù)挖掘等技術(shù)所呈現(xiàn)出的巨大價(jià)值和滿足用戶(hù)高層次、個(gè)性化需求的便捷程度令人驚嘆,檔案工作的實(shí)踐也逐漸朝著數(shù)據(jù)化管理和信息開(kāi)發(fā)的方向轉(zhuǎn)化。與此同時(shí),檔案學(xué)人才培養(yǎng)在一定的程度上也需進(jìn)行積極的調(diào)適與側(cè)重,通過(guò)建立檔案數(shù)據(jù)思維和培育數(shù)據(jù)素養(yǎng),加強(qiáng)培養(yǎng)“懂技術(shù)”的管理型人才,以期更加專(zhuān)注檔案信息的內(nèi)容管理和開(kāi)發(fā)能力,全面加強(qiáng)檔案數(shù)據(jù)管理能力,適應(yīng)新形勢(shì)下檔案工作的需要。
參考文獻(xiàn)
[1]大數(shù)據(jù)時(shí)代要有大數(shù)據(jù)思維—熱點(diǎn)—@大數(shù)據(jù)資訊[EB/OL].[2018-05-11].http://www.thebigdata.cn/html/c3/14416. html.
[2][10][19]于英香.檔案大數(shù)據(jù)研究熱的冷思考[J].檔案學(xué)通訊,2015(2):4-8.
[3]何嘉蓀,張淑霞.大數(shù)據(jù)引發(fā)的思考——哲學(xué)界相關(guān)討論的啟示[J].浙江檔案,2017(6):8-11.
[4]張芳霖,唐霜.大數(shù)據(jù)影響下檔案學(xué)發(fā)展趨勢(shì)的思考[J].北京檔案,2014(9):9-13.
[5]于英香.大數(shù)據(jù)視域下檔案數(shù)據(jù)管理研究的興起:概念、緣由與發(fā)展[J].檔案學(xué)研究,2018(1):44-48.
[6]葉茹雨.多學(xué)科視角下的檔案學(xué)理論研究進(jìn)展(之六)——信息技術(shù)視角[J].山西檔案,2017(2):19-29.
[7]安小米,宋懿,等.大數(shù)據(jù)時(shí)代數(shù)字檔案資源整臺(tái)與服務(wù)的機(jī)遇與挑戰(zhàn)[J].檔案學(xué)通訊,2017(6):57-62.
[8]王毅,李晶偉.大數(shù)據(jù)分析方法在企業(yè)檔案管理中的應(yīng)用[J].檔案管理,2017(1):57-59.
[9][15]王金玲.檔案數(shù)據(jù)的智慧管理與應(yīng)用研究[J].中國(guó)檔案,2018(4):61-63.
[11]周耀林,常大偉.我國(guó)檔案大數(shù)據(jù)研究的現(xiàn)狀分析與趨勢(shì)探討[J].檔案學(xué)研究,2017(3):34-40.
[12][18][20]錢(qián)毅.技術(shù)變遷環(huán)境下檔案對(duì)象管理空間演化初探[J].檔案學(xué)通訊,2018(2):11-12.
[13][17]國(guó)家檔案局印發(fā)《全國(guó)檔案事業(yè)發(fā)展“十三五”規(guī)劃綱要》[EB/OL].[2018- 05- 12].http://www.saac.gov.cn/news/ 2016-04/07/content_136280.htm.
[14]中國(guó)杭州市數(shù)據(jù)資源局.基本信息[EB/OL].[2018-05-12].http://www.hangzhou.gov.cn/col/col1390103/index.html.
[16]國(guó)務(wù)院關(guān)于印發(fā)促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要的通知[EB/OL].[2018-05-12].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm.
[21]劉越男.大數(shù)據(jù)政策背景下政務(wù)文件歸檔面臨的挑戰(zhàn)[J].檔案學(xué)研究,2018(2):107.
[22][23]歸吉官.基于檔案學(xué)專(zhuān)業(yè)教育的數(shù)據(jù)素養(yǎng)教育內(nèi)容體系建設(shè)[J].檔案學(xué)通訊,2018(2):77,78.
[24]司莉,姚瑞妃.圖書(shū)情報(bào)專(zhuān)業(yè)研究生數(shù)據(jù)素養(yǎng)課程設(shè)置及特征分析——基于iSchool聯(lián)盟院校的調(diào)查[J].圖書(shū)與情報(bào), 2018(1):28-36.