楊佳星
摘 要:關聯(lián)數據是信息時代下信息技術以及數據處理技術解決組織、共享、管理與服務信息的最新延伸技術。企業(yè)檔案管理是企業(yè)管理中難度較高的一項管理工作,企業(yè)檔案信息整合是指根據企業(yè)檔案信息的特點,圍繞特定主題或對象,將分散、異構、無序的檔案信息進行組織整理的活動過程。通過企業(yè)檔案信息整合可以集中反映某一主題或對象的具體情況、發(fā)展趨勢等內容,從而更好的為企業(yè)服務。文章通過SWOT分析法,分析了關聯(lián)數據技術在企業(yè)數字化檔案資源轉向數據化檔案資源整合應用中的優(yōu)勢劣勢以及相應的對策。
關鍵詞:關聯(lián)數據應用;企業(yè)檔案信息;SWOT分析
1 企業(yè)檔案信息資源整合與關聯(lián)數據
1.1 企業(yè)檔案信息資源整合內涵
企業(yè)檔案作為企業(yè)原始的真實的活動記錄,其內容有著不可替代的價值。但檔案信息的價值是需要通過有序的收集、整理、加工才能得到體現(xiàn)的。傳統(tǒng)企業(yè)檔案管理模式通常是按照國家規(guī)定綱目進行分類設定的,但傳統(tǒng)模式管理下的檔案,信息分散且個別有異構的特點,使利用受限。
企業(yè)檔案信息整合服務指根據企業(yè)檔案信息的特點,圍繞特定主題或對象,將分散、異構、無序的檔案信息進行組織整理的工作。例如:在行政管理類檔案中開展整合專業(yè)技術職稱信息、公司人事任免信息、企業(yè)科技檔案項目成果等信息,為企業(yè)在職工職稱評定、職務晉升等工作中,方便快速地檢索出所需的檔案信息,能極大地簡化辦事流程,提高工作效率;又如:通過對同一主題科技檔案信息的整合收集,從而為以后同一類型的項目提供參考依據或為某一領域的研究與技術突破提供有效的數據支持。
可以說企業(yè)檔案信息整合是一項可以幫助企業(yè)提高檔案利用效率、提升企業(yè)檔案增值服務、有利于檔案信息資源共享、影響企業(yè)科學決策、增強企業(yè)競爭力的工作。
1.2 關聯(lián)數據定義、本質及應用
1.2.1 關聯(lián)數據定義
“關聯(lián)數據”是一種用來組織、發(fā)布和鏈接各類數據、信息和知識的方法,運用網絡技術、信息技術等全新數據處理技術對現(xiàn)有各類的資源進行整合,使其在同一網絡基礎上構建一張計算機可以理解的語義數據網絡,使任何人都能夠準確、高效、可靠地查找、利用這些相互關聯(lián)的信息與知識。
關聯(lián)數據繼承了Web技術中的超文本傳輸協(xié)議(HTTP)和統(tǒng)一資源定位符(URI),采用數據資源描述框架(RDF)來描述各類“資源”對象。RDF用統(tǒng)一資源標識符(URI)標識事物,用簡單的屬性及屬性值來描述資源并組合成為一個陳述(被稱為陳述的主體、謂詞和客體),即RDF三元組(RDF triples),可被用于表達任何可在Web上被標識的事物的信息。此外,關聯(lián)數據采用SPARQL(Simple Pro-tocol and RDF Query Language)技術作為檢索查詢語言和數據獲取協(xié)議,它可以檢索任何用 RDF來表示的信息資源。
1.2.2 關聯(lián)數據本質與應用
關聯(lián)數據的本質是通過定義“統(tǒng)一資源標識符(URI)”規(guī)范,使用戶利用 HTTP 機制和 URI 機制獲取關聯(lián)化的數字信息資源,并打破封閉環(huán)境、減少數據冗余、形成關聯(lián)訪問,使信息資源關聯(lián)整合。關聯(lián)數據技術可以對不同類型的信息資源(如文件、圖片、音頻、視頻等)賦予相同標準規(guī)范的URI定位,這保證了數據資源的一致性,從而有機會打破數據壁壘與信息孤島;同時通過對不同類型信息資源的URI定位,還可以挖掘不同類型資源之間的隱性關系,實現(xiàn)同一主題或對象資源的融合,形成信息關聯(lián),方便檢索利用;
我國對關聯(lián)數據在檔案管理中的應用研究起步較晚,歐洲數據圖書館早在2008就通過OWL語言,對第一次世界大戰(zhàn)的相關檔案資料進行了重新編譯以及資源整合,法國國家檔案管早在2011年就發(fā)布了敘詞表,并提供PDF格式的查詢服務。
2 關聯(lián)數據應用于企業(yè)檔案信息資源整合中的SWOT分析
2.1 優(yōu)勢分析
1)關聯(lián)數據的優(yōu)勢。關聯(lián)數據的優(yōu)勢在于其數據信息的開放性與關聯(lián)性,隨著公開數據規(guī)模不斷擴大,最終形成數據間的交互網絡??梢杂行Т蚱苽鹘y(tǒng)檔案管理中,不同分類檔案、異構檔案之間的界限。對檔案資源整合有良好的促進作用。
另外通過HTTP協(xié)議、URI定位可以對資源進行更為準確的定位,在傳統(tǒng)檔案管理模式下,同一主題檔案信息資源整合過程中,可能會涉及多種門類檔案,而在查詢中需要分別檢索所涉及門類檔案的信息,以獲取想要的信息資源。而基于關聯(lián)數據的檔案信息整合技術,可以將查詢分解為只涉及單個檔案門類的查詢模式,現(xiàn)在階段在檔案資源整合工作主要分為收集、整理、分類、整合、利用五個主要環(huán)節(jié),在關聯(lián)數據的支持下,可以提高數據分析以及挖掘,實現(xiàn)數據的全程控制,充分滿足檔案資源整合的各項數據處理技術需求。
2)企業(yè)檔案自身的優(yōu)勢。企業(yè)檔案信息資源多為結構化或半結構化的信息資源,著錄格式與存儲格式也依照國家、公司有關規(guī)定執(zhí)行。因此據有格式的規(guī)范性,這有利于關聯(lián)數據的統(tǒng)一轉換與整合;此外企業(yè)檔案作為企業(yè)的原始真實的活動記錄,還具有憑證價值與情報價值;具有價值且規(guī)范性的企業(yè)檔案資源非常適合作為數據關聯(lián)中轉站,用于信息交換和語義互操作。
2.2 劣勢分析
1)檔案資源開放權限與閱讀權限。關聯(lián)數據在企業(yè)檔案信息資源整合中應用的最大阻力是關聯(lián)數據主要針對公開性的開放數據,而企業(yè)檔案資源數據中有許多數據是封閉性的非公開數據,部分檔案資料屬于企業(yè)機密有著嚴格的獲取以及閱讀權限要求,導致存在矛盾,這也是關聯(lián)數據在企業(yè)檔案信息資源整合中的劣勢所在。封閉性的企業(yè)檔案資源沒有辦法利用關聯(lián)數據技術實現(xiàn)對應的檔案資源整合。
2)企業(yè)檔案標準化程度低。由于企業(yè)檔案資源在不同的歷史時期所依據的著錄標準不同以及在企業(yè)不同歷史時期企業(yè)檔案信息的產生環(huán)節(jié)和產生渠道不同,導致檔案信息標準化程度低,標準化較低直接影響了檔案信息組織的質量,導致資源之間的關聯(lián)和語義操作的實在出現(xiàn)障礙。
2.3 機遇分析
1)企業(yè)自身發(fā)展的需要。企業(yè)檔案信息資源整合有利于挖掘檔案信息資源,提高檔案利用效率;有利于檔案信息集成,實現(xiàn)檔案增值服務;有利于檔案信息共享,增強企業(yè)競爭力。而關聯(lián)數據技術是實現(xiàn)企業(yè)檔案信息資源整合的一條可行之路。
2)存在可借鑒的實踐成果。目前國外已經已經開展了關聯(lián)數據應用于檔案工作中的相關研究,如:Linking Lives是英國聯(lián)合信息系統(tǒng)委員會(JISC)資助的項目,用于將Archives Hub中的檔案資源關聯(lián)數據化。
國內也開展了一系列的研究工作,如黃欣在《關聯(lián)數據在照片檔案管理中的應用研究》中,具體闡述了關聯(lián)數據應用的必要性、原則、RDF鏈接制作方法、基礎數據構建、元數據核心集基礎數據庫建設、數據庫關聯(lián)等一系列的研究成果;
2.4 挑戰(zhàn)分析
關聯(lián)數據技術在企業(yè)檔案信息資源整合中遇到的主要威脅來自于:檔案數據的安全性難以保障。檔案信息數據安全是檔案信息管理的根本工作之一,而關聯(lián)數據的公開性是管理數據應用于企業(yè)檔案資源整合中所必需面對的問題。關聯(lián)數據一般通過PDF以及API等格式進行開發(fā),此類API密鑰防盜性較弱,非常容易出現(xiàn)泄漏和入侵等現(xiàn)象,讓數據存在風險,影響檔案資源的數據安全。
3 管理數據在企業(yè)檔案資源整合應用中的策略
3.1 優(yōu)化檔案著錄標準
首先應依據關聯(lián)數據特點,重新優(yōu)化檔案著錄標準,以實現(xiàn)著錄字段向關聯(lián)數據映射,以滿足檔案資源整合的需要;其次,對于現(xiàn)有檔案資源標準化程度低的情況,研究公司發(fā)展脈絡,補充必要信息;
3.2 構建統(tǒng)一利用平臺
通過構建統(tǒng)一的檢索利用平臺,可以在提供跨種類檔案信息檢索的基礎上,為用戶構建參考咨詢或決策建議系統(tǒng)。再通過完善語義推理機制以及知識挖掘,向用戶提供個性化、可定制的檔案信息資源。以實現(xiàn)檔案信息精確推送從而影響科學決策、科研生產,提升企業(yè)競爭力。
3.3 鼓勵員工參與
應鼓勵公司員工參與檔案信息整合利用中來。應該在開放員工檢索利用的基礎上,允許普通用戶對檔案資源進行簡單的組織分類、添加標簽,通過簡單的組織分類可以研究不同用戶需求,從而改進本體推理并優(yōu)化檔案信息推送準確率。
參考文獻
[1]冷裕波.企業(yè)檔案信息整合服務研究[J].檔案學通訊,2011,06
[2]呂元智.數字檔案資源知識“關聯(lián)”組織研究[J].檔案學研究,2012.06
[3]馬寅源.關聯(lián)數據應用于檔案知識服務的SWOT分析及策略[J].檔案與建設,2017(02):17-20+12.
[4]宋香蕾,加小雙.多學科視角下的檔案學理論研究進展(之二)——管理學視角[J].山西檔案,2017(01):11-17.
[5]徐鶴田.國家治理視野下的大數據審計工作模式研究——基于SWOT分析[J].中國內部審計,2017(01):77-82.
[6]周耀林,賈聰聰.“互聯(lián)網+”戰(zhàn)略下數字檔案信息服務發(fā)展策略研究——基于SWOT框架的分析選擇[J].檔案學通訊,2016(04):56-61.
[7]梁俊娜.廣西北部灣經濟區(qū)農民工遠程教育培訓模式的SWOT分析及對策研究[J].廣西廣播電視大學學報,2014,25(03):23-28.