摘 要:本文首先簡要介紹大數據概念界定和特征,其次通過描述大數據背景下西部高校檔案工作發(fā)生的新變化,接著對當前西部高校檔案工作的尷尬現(xiàn)狀進行闡述,最后對此提出建議。
關鍵詞:大數據;西部高校檔案;發(fā)展淺析
現(xiàn)今IT業(yè)發(fā)展之快令人應接不暇,“大數據”技術橫空出世可謂炙手可熱,2013年甚至被稱為“世界大數據元年”,開辟時代新局面,賦予時代新內涵。我國政府為搶占新一輪科技競爭戰(zhàn)略制高點,將大數據上升為國家戰(zhàn)略層面,戰(zhàn)略部署輾轉西部,隨之大數據滲透至各行業(yè),并成為迅猛發(fā)展的新動能。步入“大數據”時代檔案行業(yè)應如何適應并借勢而上、立足潮頭?本文立足于“大數據”背景下,以國家大數據戰(zhàn)略為契機,呼吁西部高校全面推行檔案信息化工作,利用“大數據”的優(yōu)勢充分挖掘有價值的信息,提高檔案管理工作效率,從而提升檔案服務質量。
1 大數據概念界定與特征
(一)大數據概念界定
工信部在《2014年大數據白皮書》[1]中提出大數據,源于2011年5月麥肯錫從經濟和商業(yè)維度詮釋大數據發(fā)展?jié)摿Φ膶n}研究報告:大數據指的是大小超出常規(guī)的數據庫工具獲取、存儲、管理和分析能力的數據集。[2] 維基百科釋義“大數據”,指所涉及的數據量規(guī)模巨大到無法通過人工在合理時間內達到截取、管理、處理并整理成為人類所能解讀的信息。[3] 大數據是一個總稱性概念,它還可以細分為大數據科學、大數據技術、大數據工程、以及大數據應用等不同領域。[4] 如IBM、Teradata和oracle等研究集中于大數據技術研發(fā),MIT(Massachusetts Institute of Technology,即麻省理工學院)Cal(University of California,Berkeley,即加州大學伯克利分校)這些高校大多聚焦于大數據科學研究,政府企業(yè)更倚重大數據應用方面。雖然目前對大數據沒有很統(tǒng)一的認識,但多數比較認同大數據是指對數量巨大、類型繁多的數據進行采集、預處理、存儲、分析,發(fā)現(xiàn)新的知識,挖掘新的價值并應用到實踐中,從而提高效率。
(二)大數據特征
2001年,高德納咨詢公司分析員Doug Laney在其研究演講中將數據增長特性歸納為有三個,分別是:量(Volume)即數據多少;速(Velocity)即資料輸入、輸出的速度;類(Variety),即多樣性。在此理論基礎上,IBM提出大數據的4V特征,得到了業(yè)界的廣泛認可。(1)Volume(數據量大),
每年數據量劇增,從PB到ZB數量級甚至更大,IDC的報告指出早在2013全球數據量4.4ZB;(2)Variety(數據類型多),包括傳統(tǒng)的格式化數據,以及來自互聯(lián)網的日志、視頻、音頻、圖片、地理位置信息等數據類型;(3)Velocity)(處理速度快);(4)Veracity(真實性),即追求高質量的數據。
大數據技術與傳統(tǒng)的數據挖掘技術有著本質的不同,它開發(fā)數據網絡挖掘、特異群組挖掘、圖挖掘等新型數據挖掘技術,從各種類型的數據中快速獲得有價值信息,時間越長大數據分析價值就越低,甚至失去意義。
2 大數據背景下高校檔案工作新變化
大數據滲透各個行業(yè)使得人們進一步認識關注信息資源,并且不斷從深度上挖掘,從寬度上拓展,實現(xiàn)利用最大化,高校檔案作為信息資源的重要組成部分,必然受到影響并已悄然發(fā)生新變化。
(一)高校檔案信息量急劇增長
檔案是社會組織或個人在以往的社會實踐活動中直接形成的清晰、確定的原始記錄作用的固化信息。在大數據背景下,高校學生的學籍、選課、成績、借書、上網、論壇、微博、教師的基本信息、上課課件和視頻、遠程教育課程等都會產生大量數據,同時還有設備、機房和圖書信息等也會產生大量數據。[5] 除人才培養(yǎng)方面意外,高校管理活動、科研學術、社會服務等同樣也會產生大量數據,這些數據量大,類型多樣,來源分布廣,變化速度快,明顯具備了大數據特征。以貴州醫(yī)科大學(簡稱貴醫(yī))為例,
數據來源的主要渠道:(1)各類網站。貴醫(yī)現(xiàn)有1個學校主頁網站,下設多個院系、黨群行政和直屬單位等二級網站;(2)各級管理系統(tǒng)。部分業(yè)務部門有自己的管理系統(tǒng),如辦公自動化(OA)、教務、學生、財務、人事等系統(tǒng),每天都會產生大量的數據;(3)科研數據。貴醫(yī)每年在科研中也會產生海量的實驗數據;(4)各類媒體報道。在各個新聞媒體時有關于貴醫(yī)的報道。從上述幾個渠道產生的信息量大且種類多,都具有一定價值,屬于歸檔范疇,可見高校檔案信息量與日俱增。
(二)高校檔案信息需求劇增
當下高校檔案用戶信息需求呈現(xiàn)多元化的發(fā)展,包括教學、科研、校園文化等各個方面。隨著踐行“陽光政府”信息公開,人們對國家的法律政策和學校的相關規(guī)定等需求不斷增加;隨著學校發(fā)展壯大,如今高校更加重視文化底蘊的建設,紛紛開展諸如歷史、名人、校園文化等特色檔案,如貴醫(yī)2014年更名(貴陽醫(yī)學院更名為貴州醫(yī)科大學)期間,利用歷史檔案、名人檔案、特色檔案等總計600余次;時代在進步用戶對高校檔案利用也提出了更高的要求,如近幾年的出國深造、移民等人數逐年增多,有學生要求檔案館出具中英文成績單及學籍證明,如貴醫(yī)2013-2015年期間,有此要求的次數分別是2次、8次、19次,逐年呈上升趨勢??梢?,大數據促使高校檔案數量增長,同時刺激用戶對檔案信息的需求類型隨之提高。
(三)高校檔案信息價值提高
大數據進行數據挖掘,首先需在從海量信息中,提取真實可靠有價值的信息。高校檔案是指高校從事教學、科研、管理等活動直接形成具有保存價值的各種圖文、聲像等不同形式的記錄載體。正因為這類信息資源最真實可靠、最具權威的特性,在進行大數據挖掘和分析技術處理時比其他信息資源更具優(yōu)勢。
3 西部高校檔案工作面臨尷尬現(xiàn)狀
大數據背景下高校檔案信息量與日俱增、種類繁多,傳統(tǒng)的檔案工作方式已無法適應新的變化,實施檔案信息化建設迫在眉睫,然而西部高校檔案工作面臨尷尬的現(xiàn)狀很難跨越第一步。
(一)對檔案信息化建設工作重視力度不夠
高校普遍存在對檔案工作重要性認識不夠,檔案工作未列入學校考核指標范疇,因此對檔案工作缺乏指導、關注少,資金投入不夠、人員配置匱乏,從而導致檔案事業(yè)的發(fā)展滯后。西部高校財政本身的困窘,檔案工作專項資金更少,要實施檔案信息化建設,需要必要的資金投入保障,用于檔案信息化的服務器、掃描儀等相關硬件設備高達數萬元,檔案資料繁多外包成本高達數百萬元,西部各高校檔案館每年可支配經費應付日常開銷尚且捉襟見肘,數百萬資金望而卻步,人員嚴重匱乏情況進行檔案信息化建設顯然是力不從心,如貴醫(yī)檔案館在編4人,在館檔案5000余份。
(二)檔案信息服務能力與方式滯后
檔案部門長期習慣保管重于利用的工作方式,以文書管理為主;館藏結構類型單一;僅限為教職員工生服務;用戶親自辦理相關審批手續(xù),程序較為繁瑣。部分西部高校沒有設立檔案館,檔案以科室隸屬于人事組織等部門,查閱登記等還是手工方式,沒有引入檔案管理系統(tǒng),即使應用該系統(tǒng)的高校也普遍存在以下問題:1、在檢索上查全率和查準率低,系統(tǒng)信息更新速度遠遠趕不上每日信息量。檔案利用常通常采用借閱、復印等形式,錄入系統(tǒng)的僅僅是簡單的目錄,很難對檔案信息分析處理,更難挖掘出有價值的信息。如貴醫(yī)檔案館2013年成立,目前還沒有引入檔案管理系統(tǒng),還是傳統(tǒng)人工收集、整理、登記等工作方式??梢?,檔案信息服務能力與方式遠遠滿足不了大數據發(fā)展需求。
(三)檔案信息安全問題凸顯
各類信息資源在大數據背景下逐漸開放和共享,同時給檔案信息帶來了安全隱患。西部高校進行檔案信息化的為數不多,國家相關法律法規(guī)滯后于檔案信息化的發(fā)展,因此沒有統(tǒng)一標準進行規(guī)范化控制,無法建立健全的檔案信息安全保障體系。如我國在上世紀90 年代初開始信息化建設,1999 年頒布《電子文件歸檔與電子檔案管理辦法》,直到2001 年才出臺《檔案管理軟件功能要求暫行規(guī)定》等。
大數據背景下西部高校檔案工作發(fā)展建議
在大數據背景下,西部高校檔案工作迫切需改變傳統(tǒng)的工作模式,充分挖掘檔案信息的價值,全面建設檔案信息化,改進工作方式,以適應大數據時代的發(fā)展要求。
(一)抓住發(fā)展機遇 加快檔案信息化基礎設施建設
西部高校檔案信息化建設的必要前提是大量資金支持,資金問題一直是制約檔案工作發(fā)展的主要因素,因此檔案部門應緊跟國家發(fā)展腳步,多方尋求支持,抓住發(fā)展機遇。五中全會公報提出實施“國家大數據戰(zhàn)略”,標志著大數據戰(zhàn)略正式上升為國家戰(zhàn)略,我國政府為搶占新一輪科技競爭戰(zhàn)的略制高點,戰(zhàn)略部署輾轉西部,國家級首個大數據綜合綜合試驗區(qū)落戶貴州,IBM在成都建立云計算大數據中心,騰訊云數據中心落地重慶,契合了西部高校檔案工作發(fā)展壯大的迫切實際需求,以此為依托爭取國家支持,全面實現(xiàn)檔案信息化,提升檔案利用價值。同時,應當把檔案事業(yè)納入到學校整體發(fā)展規(guī)劃中,實時進行監(jiān)督管理,給予必須的人財物等資源,為學校的檔案信息化建設堅實后備力量。
(二)提高檔案工作服務能力與方式
挖掘檔案有價值信息,西部高校信息化起步晚,首先就得規(guī)范收集,在原有范圍基礎上,增加對人物、歷史、文化等類型收集,
并且高校檔案工作須實時與各業(yè)務系統(tǒng)對接,確保電子文件的形成、運行和歸檔過程真實可靠性。同時還要關注并主動收集電視、互聯(lián)網等各種媒體上產生的檔案資源。搭建檔案管理系統(tǒng),確保該系統(tǒng)的擴展性,服務器能承載巨大的數據量,檢索方式延伸至可以搭建內容,確保該系統(tǒng)檢索功能良好。逐步開展檔案信息加工服務,針對用戶提出的需求,通過加工給予有價值的服務,提升檔案服務質量。對外經濟貿易大學檔案館開發(fā)了成績管理系統(tǒng),該系統(tǒng)能自動翻譯學生成績,并制作統(tǒng)一、規(guī)范的成績單等成品,實現(xiàn)檔案利用高效率,受到師大的好評也值得我們學習借鑒。
( 三 ) 加強檔案信息安全管理能力
大數據給檔案信息資源帶來隱患,西部高校檔案信息安全還是沿用傳統(tǒng)模式,因此要特別加強信息安全管理,構建信息安全保障體系。首先檔案工作人員要樹立高度的責任感與安全意識,認識數據重要性并確保其安全、保密,這是任何預防任何隱患的必要前提。高校檔案部門從技術著手,通過設立多重不同密碼、全方位進行監(jiān)控、網絡安全技術等嚴格控制訪問,加強隱私管理,保留檢索日志,避免檔案泄密;建立數據備份系統(tǒng)防止信息化資源被毀壞、遺失,實現(xiàn)信息化檔案異質異地、隨時保存?zhèn)浞荨M瑫r,高校檔案部門應根據學校檔案工作發(fā)展實際需求,制定信息安全方面的規(guī)章制度,確保各項工作有章可循。
總而言之,西部高校檔案信息化較發(fā)達地區(qū)高校起步晚,發(fā)展緩慢。大數據時代到來,不僅給傳統(tǒng)檔案管理工作帶來新的挑戰(zhàn)與機遇,以國家大數據戰(zhàn)略重心投入西部為契機,贏得相關管理部門與學校的大力支持,結合實際做好統(tǒng)籌規(guī)劃,全面推動實現(xiàn)高效檔案信息化的可持續(xù)發(fā)展,提升高校檔案利用。
參考文獻
[1] 工業(yè)和信息化部電信研究院.大數據白皮書 [R].2014.
[2] James M, Michael C, Brad B. Big data: the next frontier for innovation, competition and productivity [R].McKinsey Global Institute.2011.
[3] 維基百科. 大數據[EB/OL],(2014- 02- 21)[2014- 02- 27]. http://zh.Wikipedia.org/wiki/大數據.
[4] 黃欣榮.大數據時代的思維變革[J].重慶理工大學學報(社會科學).2014,(5):14
[5] 任祎.大數據時代下高校信息化建設思路探究 [J].電子測試,2014,(7):128-130.
作者簡介
龍宛苡(1986-)女,苗族,貴州銅仁人,貴州醫(yī)科大學檔案館,助理館員。