劉艷
摘要:大數(shù)據(jù)時代來臨,高校檔案管理工作面臨嚴峻的挑戰(zhàn),同時也迎來了難得的發(fā)展機遇?;诖?,分析大數(shù)據(jù)的概念,以及高校檔案管理的基本內容,進而論述高校檔案大數(shù)據(jù)化后的優(yōu)點,最后給出高校檔案管理實現(xiàn)大數(shù)據(jù)化的途徑,以期促進高校檔案實現(xiàn)跨越式發(fā)展。
關鍵詞:大數(shù)據(jù);高校檔案;檔案管理;創(chuàng)新
中圖分類號:G278.6文獻標志碼:A文章編號:1001-7836(2017)10-0151-03
隨著社會數(shù)字化、信息化的進一步提升,科技水平與電子存儲技術的發(fā)展,“大數(shù)據(jù)”已經(jīng)成為現(xiàn)在生活不可或缺的組成部分。近年來,互聯(lián)網(wǎng)的日益普及、物聯(lián)網(wǎng)不斷開發(fā),以及云計算技術的廣泛使用,在人們日常生活中,海量的數(shù)據(jù)在包括智能終端、社交網(wǎng)絡、網(wǎng)絡行為中不斷產(chǎn)生,而且其增長方式為爆炸式的。全世界的數(shù)據(jù)量進入高速度增長模式,將從EB進入ZB時代,大數(shù)據(jù)的時代已經(jīng)到來。
一、高校檔案管理大數(shù)據(jù)化的研究狀況
目前我國大學檔案管理基本實現(xiàn)了檔案管理的信息化。其中清華大學、上海復旦大學、南京大學、四川大學等高校的檔案信息化、數(shù)字化建設程度高,服務管理較好。不過由于目前所有高校檔案管理,都是立足于本校的基礎上進行檔案數(shù)字化、信息化,具有一定的局限性,表現(xiàn)在數(shù)據(jù)的覆蓋面較小,資源共享程度不高,所使用的檔案管理系統(tǒng)智能化程度也不高。為了進一步地運用大數(shù)據(jù)思維理念,大數(shù)據(jù)的分析、挖掘服務,為更多需要的人提供個性化的服務,要求實現(xiàn)全國各大高校實現(xiàn)檔案管理資源信息的全網(wǎng)聯(lián)通,檔案信息的資源共享,檔案信息的集成化,是目前高校檔案管理面臨的最新發(fā)展機遇。
二、大數(shù)據(jù)的基本概念
什么是大數(shù)據(jù),大數(shù)據(jù)又稱之為巨量資料,就是根植于現(xiàn)代計算機技術,數(shù)據(jù)存儲技術的發(fā)展,將龐大的信息通過各種數(shù)據(jù)收集方法匯總在一起,其所收集的數(shù)據(jù)種類繁多,隱藏的有價值信息獲取難度增大,且數(shù)據(jù)呈現(xiàn)流動性、持續(xù)性。一般體現(xiàn)出4V的基本特性[1],即Volume(規(guī)模)、Velocity(快速)、Variety(多樣)、Value(價值),表現(xiàn)為種類多、流量大、容量大、價值高的數(shù)據(jù)稱為大數(shù)據(jù)?!按髷?shù)據(jù)”的大的概念,除了其“容量大”之外,更大的意義在于經(jīng)過對各種類型的巨量數(shù)據(jù)的收集、整理和深層的挖掘的過程,找到具有從未被發(fā)現(xiàn)的新的認識,從而能夠促進科技發(fā)展、知識創(chuàng)新、價值增值、經(jīng)濟發(fā)展。數(shù)據(jù)的分析,檢索難度將更加復雜,更加要求數(shù)據(jù)的速度與時效性。大數(shù)據(jù)的出現(xiàn)是信息時代發(fā)展的現(xiàn)象,是一種新的理念,包含新的數(shù)據(jù)處理技術。大數(shù)據(jù)的最核心的問題,就是在于通過各種方法從大量的無用的數(shù)據(jù)信息中挖取到有價值的部分,只有最真實的信息才具有價值。
三、高校檔案管理的基本內容
高校檔案[2]是指高等學校從事教學、科研、管理等活動中形成的具有保存價值的歷史記錄,具有原始性、憑證性和權威性,是最真實、最可靠、最具權威的信息資源。高校檔案的類型多樣,除傳統(tǒng)的紙張檔案外,還有照片的微縮檔案;以磁性材料為載體的錄音、錄像、幻燈片檔案;以計算機等設備存儲的電子文檔、光盤數(shù)據(jù)庫等;以服務器主機硬盤、光盤存儲的網(wǎng)絡信息、網(wǎng)站、網(wǎng)頁等檔案等。高校檔案管理也由之前的簡單的檔案數(shù)據(jù)收集、管理、檢索工作,向將檔案信息數(shù)字化、多樣化、智能化、服務化的方向發(fā)展。
四、高校檔案大數(shù)據(jù)化后的優(yōu)點
1.檔案信息的數(shù)字化,就是將檔案存儲的材料信息轉變?yōu)閿?shù)字信號,減輕了檔案數(shù)據(jù)儲存管理的工作強度,檔案所占用空間小,方便維護,而且在數(shù)據(jù)檢索提取方面更加快速。之前的檔案多以紙質材料存儲,不但存儲難度大,對資料的維護成本高,而且數(shù)據(jù)查找困難,增大數(shù)據(jù)檢索的時間成本。而將檔案目錄的數(shù)據(jù)化,以及進一步的檔案全文數(shù)字化以后,數(shù)據(jù)的存儲更加經(jīng)濟安全,且數(shù)據(jù)的應用也更加便捷。大數(shù)據(jù)的種類繁多,機構復雜,改變傳統(tǒng)的統(tǒng)一數(shù)據(jù)存儲方式,運用云存儲技術[3],采用網(wǎng)絡存儲設備、分布式的文件系統(tǒng),能夠適應多元異構的數(shù)據(jù)存儲,從而降低總體成本,提高資源利用率。
2.檔案管理手段的智能化,在檔案存儲方式的數(shù)字化基礎上,實現(xiàn)檔案管理的智能化,包括檔案信息的歸檔、管理、查找、檢索、使用等。依托目前計算機技術的快速成長,實現(xiàn)高校檔案信息管理的安全、快速、便捷、高效。
3.檔案服務的個性化,在大數(shù)據(jù)的背景下,根據(jù)每個個體的不同需求,提供完全個性化的服務,滿足單獨個人的特殊要求,實現(xiàn)檔案數(shù)據(jù)的定制化。目前檔案管理一般是以提供復印件、出示證明為主,屬于被動形式。重保管、輕利用、工作模式單一。因此,在大數(shù)據(jù)的基礎上不但可以實現(xiàn)簡單的檔案服務,還可以實現(xiàn)根據(jù)用戶自身的興趣、習慣以及各種需求、智能的信息推薦服務。實現(xiàn)找到你想要的,推薦給你需要的,發(fā)現(xiàn)你可能要的,補充你疏漏信息的個人服務模式,體現(xiàn)出時效性、智慧性、個性化的服務發(fā)展方向。
4.數(shù)據(jù)資源的網(wǎng)絡化,伴隨網(wǎng)絡的普及,智能終端的全民化,各種數(shù)據(jù)軟件的層出不窮,檔案數(shù)據(jù)資源實現(xiàn)資源的網(wǎng)絡化,達到只要能夠連接到網(wǎng)絡,運用相應的APP或專門的應用程序,經(jīng)過檔案數(shù)據(jù)庫的注冊認可,就可以使用檔案數(shù)據(jù)的信息。
5.大數(shù)據(jù)的資源共享,隨著各大高校的檔案管理實現(xiàn)數(shù)字化,將各個節(jié)點通過網(wǎng)絡連接匯總到統(tǒng)一的大集群中,高校之間檔案信息的流通和共享,打破了信息孤島的狹隘局面。使得校際間的檔案資源互補,發(fā)揮各高校的管理特色,達到檔案共享的無縫化對接。全國高校檔案數(shù)據(jù)的資源共享,突破傳統(tǒng)的狀態(tài)[4]、服務、存儲“邊界”,通過合理的統(tǒng)籌規(guī)劃,創(chuàng)立更加高效的資源整合系統(tǒng),使任何人,在任何地點,能夠得到其所需要的經(jīng)過授權的任何信息。構建大資源系統(tǒng),實現(xiàn)大檔案系統(tǒng)中數(shù)據(jù)的集成、整合和加工進程,形成完整全面的大數(shù)據(jù)資源庫。
6.多種信息的高度集中,在實現(xiàn)各種數(shù)據(jù)的互聯(lián)以后,將每個單獨檔案的信息集中到一起,實現(xiàn)信息的高度集中,能夠將單獨的信息更加詳盡地收集,避免數(shù)據(jù)的重復。將各種信息多源頭、多介質載體、多數(shù)據(jù)格式存在的各種圖像、視頻、音頻、網(wǎng)頁、文本等非結構化的碎塊樣信息數(shù)據(jù),分門別類地按照一定的數(shù)據(jù)結構模式,根據(jù)數(shù)據(jù)之間的有機聯(lián)系集中存儲在一個條件下。采用分布式存儲方式,由小集成匯合為更大的集中方式。endprint
7.在大數(shù)據(jù)的基礎上實現(xiàn)數(shù)據(jù)的深層挖掘,發(fā)現(xiàn)更有價值的信息。開發(fā)高校檔案挖掘服務,在線檔案信息互動和共享服務,提高高校檔案的最大利用率和發(fā)揮高校檔案的最大價值,為高校檔案用戶提供多樣化的服務方式,滿足不同檔案用戶的多樣化需求。
五、高校檔案管理實現(xiàn)大數(shù)據(jù)化的途徑
1.伴隨著科學技術的創(chuàng)新以及社會對檔案管理需求的不斷增加,檔案信息的全數(shù)字化是一個發(fā)展的必然趨勢,只有在檔案數(shù)字化的基礎上,才能夠實現(xiàn)大數(shù)據(jù)時代檔案管理的現(xiàn)代化。要求我們將存儲的數(shù)據(jù)數(shù)字化、增加的數(shù)據(jù)電子化、數(shù)據(jù)建設標準化。在數(shù)據(jù)資源的采集過程中實現(xiàn)前端控制,實現(xiàn)數(shù)據(jù)管理的“接受”“管理”“使用”全程監(jiān)控。建立大數(shù)據(jù)機構,制定大數(shù)據(jù)發(fā)展策略,進行數(shù)據(jù)收集工作、進行數(shù)據(jù)“清洗”工作,以及數(shù)據(jù)的聚合、數(shù)據(jù)的歸檔等一系列過程。
2.高校應納入檔案管理的數(shù)據(jù)范圍包括:高校內網(wǎng)發(fā)布的關于校園新聞、時事、日常工作、教育信息、科研動態(tài)、創(chuàng)新思想、學生活動等信息;辦公過程中產(chǎn)生的信息和材料;在網(wǎng)絡論壇、微博、個人相冊、微信、騰訊等上產(chǎn)生的數(shù)據(jù);教學精品課程產(chǎn)生的視頻、音頻、文字數(shù)據(jù)信息;社會上各種媒體、網(wǎng)絡上發(fā)布的關于本校的報道。
3.進一步增加數(shù)據(jù)采集的方式和方法,除了采用傳統(tǒng)的被動收集信息方式,如上交收集個人的檔案信息,還可以采用主動的收集方式,運用第三方的軟件、APP收集個人的網(wǎng)絡信息、微信、微博、電子郵件、社交網(wǎng)絡的操作記錄,單獨個人的各種注冊信息,網(wǎng)絡瀏覽信息實現(xiàn)個人完全數(shù)據(jù)的收集。為高校的每個成員開辟單獨的網(wǎng)絡空間,可以任由其存入各種數(shù)據(jù)。
4.甄別信息的科學性、客觀性、正確性和有用性,在復雜的浩如煙海的個人數(shù)據(jù)中采集到的多是凌亂的、冗余的、復雜的,甚至是錯誤的數(shù)據(jù)。因此,應對原始的采集信息運用技術手段的進行處理,去芫存菁、披沙揀金,保證數(shù)據(jù)的同一性、確切性、完好性、精簡性。然后根據(jù)數(shù)據(jù)之間的相互關系,采用聚類分析的方式建立具有密切聯(lián)系的有機數(shù)據(jù)整體。排除虛假的、重復的、無用的各種信息,找到有用的以及正確的信息。
5.進行檔案管理的現(xiàn)代化建設。伴隨檔案工作數(shù)據(jù)量的持續(xù)增加,對檔案管理提出更高的需求。要求檔案管理系統(tǒng)的數(shù)據(jù)收集、整理、存儲、檢索、分析、加工、數(shù)據(jù)展現(xiàn)能力的不斷改進。運用更先進的數(shù)據(jù)庫管理方式,更先進的檢索系統(tǒng),以及智能化的管理系統(tǒng)。建立健全檔案大數(shù)據(jù)管理的周期,最終達到數(shù)據(jù)的提純、整合,將有存儲價值的信息永久地儲存在檔案的數(shù)據(jù)中心。
6.檔案服務方式的多樣化。目前檔案管理多采取直接在檔案管理部門辦理相關的手續(xù),程序煩瑣,速度較慢。隨著社會對人才流動的需求不斷增加,全球信息化的發(fā)展,改變檔案管理的服務方式已經(jīng)是必須的。通過數(shù)據(jù)系統(tǒng)的互聯(lián)互通,通過網(wǎng)絡的信息化辦公,通過智能終端的檔案服務工作建立起信息時代的智能服務模式。
7.檔案管理的全程性。目前高校的檔案管理多為終末式管理手段,即在學生生活的最后階段進行檔案的收集和管理,平時的檔案信息多分散地存儲在人事、教育等不同的部門,信息收集的手段落后、被動,檔案信息相對單一,缺乏實時性以及多樣性,不能反映出檔案人在某一時間段的具體行為記錄。
(1)采用自學生由入學開始就建立單獨的人名制檔案系統(tǒng),運用高校檔案收集軟件,按照信息甄別條件和要求記錄單獨個體在每一個具有實際意義的檔案信息。例如開學典禮、班級介紹,校內活動的視頻、音頻、照片、文字信息。收集學生在校期間的每一個重要時刻,按照時間軌跡進行存儲。
(2)隨著檔案信息存儲數(shù)量的增加,要求檔案建設的物理硬件進行升級,增大存儲空間,加快檔案管理軟件系統(tǒng)的升級,使之能夠進一步適應檔案管理的新需求。
8.完善檔案信息的主動推薦功能,在學生畢業(yè)就職的過程中,檔案管理也可以起到主動的推薦作用,改變以往的被動證明的工作態(tài)勢。通過大數(shù)據(jù)收集整理的學生的各種信息,分析個人的基本素質與能力,對接社會上的企業(yè)招聘網(wǎng)絡信息,就推薦人員的信息主動和符合企業(yè)用人要求的單位進行溝通。同時,也可以將收集到的招聘信息進行統(tǒng)一的查找分析,找到符合本校學生工作要求的數(shù)據(jù),通過各種智能終端發(fā)布給有需要的學生,增加學生的工作機會,找到滿意的工作,滿足用工單位的人員需求。
同時用工單位也可以在檔案中看到學生的整個生涯軌跡,能夠真實有效地反映學生的整體信息,增加對個體素質的全面了解,為以后的工作奠定良好的基礎。
六、高校檔案管理數(shù)據(jù)化需要注意的事項
1.數(shù)據(jù)安全問題
信息數(shù)字化雖然帶來了各種的便利,但是也存在相當多的問題:
(1)信息存儲的問題。如何保證信息存儲的長效性,保證在相當長的時間內,所存儲的數(shù)據(jù)不會因為時間的變化而出現(xiàn)信息的缺失。要求我們在數(shù)據(jù)存儲的介質的研究更深入,以保證數(shù)據(jù)信息的長久保存。
(2)數(shù)據(jù)安全問題。如何保證原始信息不被未經(jīng)授權的讀取、修改。確保信息在傳遞過程中的安全,保護信息在使用過程中不被未經(jīng)允許的人員收集,這要求數(shù)據(jù)信息加密算法的可靠性,信息傳遞過程的抗干擾性,以及不斷改進的計算機技術。
2.隱私性問題
隨著信息收集方式方法的多樣性,高校生活的多彩以及人們生活的個性的不同,所收集的信息會包含一些個人的敏感隱私信息,如何識別不同的個人信息,保證信息使用過程中的隱私問題,已日漸成為現(xiàn)代大數(shù)據(jù)環(huán)境下的一個亟待解決的問題。要求在數(shù)據(jù)采集的信息甄別,數(shù)據(jù)信息存儲的分類管理,信息發(fā)布的授權管理,信息使用的個人告知。
六、結束語
大數(shù)據(jù)時代的到來,不斷地改變人們的生活習慣、工作模式、學習方法和社會管理進程。在大數(shù)據(jù)的背景下如何更好地發(fā)展高校檔案的管理工作,對我們檔案人提出了新的要求,新的問題,更是我們檔案學面臨的新的挑戰(zhàn)。所以我們必須要適應新的情況,繼續(xù)提升個人的科研能力,以更高的標準要求自己,促進高校檔案學的發(fā)展,提升檔案工作的重要性,推動高校檔案工作進一步的更好發(fā)展。
參考文獻:
[1]寧燕子.大數(shù)據(jù)對高校檔案工作的影響分析及對策研究[J].科技視界,2015(1):39—40.
[2]李穗寧.高校檔案管理工作現(xiàn)狀分析及其對策[J].黑龍江史治,2015(11):105.
[3]徐娟,劉大巧,趙學敏,李國紅.高校檔案云存儲模式探究[J].辦公室業(yè)務,2016(12):181—182.
[4]王濤.大數(shù)據(jù)時代背景下的高校檔案資源共享研究[J].蘭臺世界,2016(4):75—76.endprint