葉文玲
一、大數據的內涵
隨著云計算等新技術的更新發(fā)展,人類已經進入前所未有的信息爆炸時代,也稱為“大數據時代”。目前,學術界對于何謂“大數據”還沒形成統(tǒng)一的界定,但都普遍認同,大數據除了傳統(tǒng)的結構化數據,還包括了各種半結構化、非結構化數據,且數據體量以指數級速度增長。在大數據的開發(fā)與使用中,關鍵點不僅僅在于數據的收集,更在于對數據的進一步有效挖掘與整合,并對其進行二次開發(fā),提升其自身所包含的價值。在我國“十三五”規(guī)劃中,明確指出要實施“國家大數據戰(zhàn)略,推進數據資源開放共享。無疑,在信息化時代,如何呈現(xiàn)數據信息的價值將是未來社會發(fā)展的重要驅動力。
從特點上來說,大數據具有大容量(Volume)、多樣性(Variety)、速度(Velocity)、真實性(Veracity)四個基本特征,在實際運用中還存在著價值密度低、商業(yè)價值高的特點。從本質上來說,大數據其實就是信息管理者在當今信息技術條件下,通過對真實數據的挖掘與分析,形成各種有附加價值的元數據為相關使用者提供判斷及決策的依據。高校檔案管理工作就是對高校檔案信息的分析、整合、存儲和利用,是一種典型的信息管理活動,本文結合大數據運用的時代背景,分析大數據運用在當前高校檔案管理中所面臨的種種問題,有針對性的提出解決的建議,為高校檔案工作大數據化提供依據。
二、大數據時代背景下高校檔案資源管理數字化的需求分析
高校檔案是指“高等學校從事招生、教學、科研、管理等活動直接形成的對學生、學校和社會有保存價值的各種文字、圖表、聲像等不同形式、載體的歷史記錄。邁入信息化時代以來,隨著辦公自動化系統(tǒng)(OA系統(tǒng))、財務管理系統(tǒng)、學籍管理系統(tǒng)、一卡通系統(tǒng)等數字化校園項目的不斷普及,高校的各類檔案已經從過去的單一紙質材料為主要載體轉變?yōu)橐愿黝愋畔祿橹饕d體,高校日常所形成的各類檔案文件也已經呈現(xiàn)數字化、海量化的趨勢,這種趨勢對于檔案工作來說既是一種挑戰(zhàn),也是一種機遇。高校檔案管理工作要抓住大數據時代的發(fā)展的契機,著力于對檔案數據的分析、挖掘與整合,結合當今高校檔案資源全球化、云端化的趨勢,使得高校檔案管理工作更上一個臺階。與此同時,國務院也于2015年10月份印發(fā)了《統(tǒng)籌推進世界一流大學和一流學科建設總體方案》,提出加快建成一批世界一流大學和一流學科戰(zhàn)略,提升我國高等教育綜合實力和國際競爭力。在此背景之下,檔案工作如何在創(chuàng)“雙一流”的過程中結合大數據技術的運用,對教學實踐和科學研究起到推動作用,為相關決策者更好的提供支持與依據的相關研究更顯得尤為必要。
三、大數據時代背景下高校檔案資源管理的現(xiàn)狀和存在的問題
1、檔案信息資源分散及不足
由于高校內各部門的職能歸屬、管理標準沒有統(tǒng)一標準,造成高校在招生、教研、管理等方面產生的海量的信息數據絕大部分都是以各自為政的方式進行分散式收集,同時由于各信息化系統(tǒng)的數據庫標準筆譯,無法以一個統(tǒng)一的標準對信息進行匯總,更無法發(fā)揮大數據的挖掘與二次開發(fā)的技術優(yōu)勢。
此外,由于資源有限等原因,高校檔案目前的收集范圍往往僅針對于一些重要的、形成成果的教學科研檔案進行留存歸檔,而對于一些未有結果或者難以突破的檔案則通常未列入收集范圍;與此同時,由于高校的教學、科研項目存在檔案形成周期長,資料種類繁雜等原因,導致許多檔案資料在項目實施過程中出現(xiàn)遺失的情況。這種情況的出現(xiàn)嚴重破壞了檔案工作中關于完整性和連續(xù)性的基本要求。
2、檔案管理方式落后
邁入信息化時代以后,隨著數字化校園各子項目的不斷投入使用,高校目前的各類檔案資源都開始從“實體化”向“數字化”轉變。但本文通過對多家高校的檔案管理方式進行研究后發(fā)現(xiàn),目前許多高校的檔案管理方式及思維方式仍保留在“實體化”的階段,館藏資源基本還是以傳統(tǒng)介質的實體檔案為主,數字化的檔案資源仍然比較匱乏。除此以外,在許多僅有的數字化檔案資源中,主要也是以光盤資源等結構化的信息為主,未對類似圖片、XML,HTML、各類報表、圖像和音頻/視頻信息等的半結構或非結構化的數據進行收集和分析,沒有發(fā)揮大數據化所提倡的數據挖掘和二次開發(fā)作用。
3、高校檔案藏用并重意識不強,服務價值缺失
目前,高校檔案館處于資源管理的模式,仍然存在“重藏輕用”的問題,檔案管理者只注重對檔案資源進行有效歸檔,僅部分學校開展了館藏檔案的數字化,以方便檔案利用者的利用,但如何使館藏檔案轉化為信息資源的能力不夠,缺乏綜合數據挖掘和深度整合,使得最有價值的檔案資源處于休眠狀態(tài)。然而,在大數據時代,數字資源建設和數字資源服務是不可分割的,檔案資源建設是以收藏為主要任務,資源利用服務為根本目的,隨著國家、社會組織和個人對高校檔案信息的需求日益增大,檔案部門傳統(tǒng)的服務模式已經不能滿足大數據時代日益增長的檔案信息需求。所以,各高校檔案館應該樹立藏用并重意識,實現(xiàn)由“檔案管理者”向“信息專家”的角色轉變,尤其是在海量的檔案信息中,根據利用者的檔案價值需求,快速地挖掘出有用的檔案信息。
四、大數據時代背景下推進高校檔案資源管理建設的有效策略
1、轉變觀念,做好檔案資源收集“前端控制”,建立“大檔案”、“大服務”檔案觀
高校檔案工作想要得到一個質的飛躍,首先得樹立“大檔案”、“大服務”檔案觀,這兩個概念是高校檔案工作未來發(fā)展的重要取向。要樹立“大檔案”、“大服務”檔案觀也就是要樹立新的檔案資源觀,在思想認識層面,強調學校所有的教職員工要全部自覺參與檔案工作,并充分利用現(xiàn)代化裝備和數字化技術擴大數據總量。
要實現(xiàn)“大檔案”管理模式,首先需要在現(xiàn)有管理模式基礎上在完善原有的歸檔范圍和過程所存在的的“漏存、不存”問題,然后進一步擴大存儲對象的范圍,把以前沒重視或收集的類似圖片、數據、圖像和音頻/視頻信息等的半結構或非結構化的數據進行收集。通過豐富館藏內容,逐步實現(xiàn)資源結構的合理化建設,為實現(xiàn)檔案大數據挖掘和二次開發(fā)奠定基礎。endprint
要實現(xiàn)“大服務”檔案觀,則是要重點針對現(xiàn)有檔案工作所存在的“重藏輕用”的問題進行改善。在這個過程中,首先需要扭轉的是檔案工作者關于自身的定位,在大數據檔案工作時代,檔案管理者的身份應當從“文件保管員”逐步向知識信息提供者和創(chuàng)造者”轉變,高校檔案管理部門要學會充分利用現(xiàn)有的數字化校園系統(tǒng),尤其是辦公自動化系統(tǒng)做好檔案服務工作的二次研發(fā),實現(xiàn)高校檔案服務社會化、多元化、個性化和開放化。
2、加速數字化資源建設,轉變儲存方式,建立館藏“數字化”檔案資源
在信息化時代,實體形式的檔案材料已經無法適應時代發(fā)展的要求,實體檔案由于對存儲空間要求較高,無法從根本上改變造成檔案工作長期漏存、不存的局限,更無法將檔案信息用于大數據所要求的收集與分析。為此,檔案資源要實現(xiàn)數字化,應著重從以下幾點著手進行變革。
首先,做好對現(xiàn)有館藏傳統(tǒng)介質檔案的數字化轉換工作,通過掃描、錄入等方式將紙質檔案、照片、錄像帶等資源進行轉化。從而構建數字化檔案資源;其次,要對數字化校園各子系統(tǒng)的數字化信息進行統(tǒng)一化。高校檔案管理部門應當對現(xiàn)存數字化校園系統(tǒng)進行二次研發(fā),通過開發(fā)中間件等方式,對數據接口進行統(tǒng)一,將各類數字化檔案信息進行收集和整合,對學校內各部門管理系統(tǒng)及分散孤立的檔案信息資源統(tǒng)籌規(guī)劃。再次,通過統(tǒng)一鏈接共享的方式,檔案管理部門可以加強原本分散于各部門的電子文檔、郵件等信息的收集,并可對其進行數據挖掘工作,形成類似在線檔案瀏覽、專題檔案資源等各種形式的數字資源。
3、轉變觀念,增強高校檔案資源建設及檔案服務的意識
在確保檔案資源數字化轉換的同時,為了進一步推進數字化檔案的增量工作,各部門新增的檔案必須要以一個統(tǒng)一的標準進行歸檔,著在一定程度上增加了檔案管理人員的工作,需要整個學校自上而下進行統(tǒng)一部署。因此,高校領導干部必須轉變思想觀念,要引導各級部門充分認識到,高校檔案是作為學校人才培養(yǎng)、學科建設、黨政管理以及其它各項活動的原始記錄,是學校教科研及日常管理的重要組成部分,也是學校歷史沿革及發(fā)展中不可或缺的一環(huán),更是衡量學校教學辦公水準的重要指標。為此,高校各部門都應對檔案數字化工作有一個清晰而明確的認識,明確部門職責,加強對檔案數字化建設工作的重視,提升檔案管理人員數字化技術水平,加大對高校數字化檔案建設的資金投入,有力推進高校檔案數字化建設發(fā)展進程。
此外,在原有檔案管理制度的基礎上,還需要根據大數據信息的要求,建設一套科學化、規(guī)范化、可操作性強的數字化檔案管理制度,實現(xiàn)數字化檔案業(yè)務流程的規(guī)范。通過大數據技術,可將原本由于資源限制而漏存或不存的資源重新納入收集范圍,通過規(guī)范化的格式,將圖片、音視頻等半結構或非結構化的數據進行整合,方便檔案管理者對其進行加工、提煉、分析和整合。
另外,還需要做好將檔案數據進行著錄和索引構建工作,以方便對檔案數據進行提取和分析。事實上,在進行完著錄和索引建設工作之后,高校檔案的樣本數據便能夠實現(xiàn)隨機抽取,為大數據技術在信息挖掘和整合功能上的發(fā)揮奠定了數據基礎。無疑,以紙質方式來儲存的高校檔案信息是無法發(fā)揮大數據的價值的,只有在強化數字化資源建設的基礎上,大數據技術才獲得了用武之地。
大數據時代的到來,對高校檔案工作來說是一個重大的發(fā)展機遇,同時也對其帶來了更高的要求。高校檔案工作者必須清晰的認識到信息技術發(fā)展的現(xiàn)狀,更新管理思想與技術水平,結合大數據技術,將技術驅動力轉化為學校發(fā)展的生產力,進一步完善高校檔案的管理機制和管理模式,在創(chuàng)“雙一流”高校的過程中對教學實踐和科學研究起到推動作用,為相關決策者更好的提供支持與依據。
(作者單位:廣東工程職業(yè)技術學院)endprint