何琴
摘 要:隨著信息技術(shù)日新月異的發(fā)展,當前我們正處在大數(shù)據(jù)時代背景下,社會大眾高度重視檔案管理工作,檔案作為記錄歷史的一種形式,記載著原始數(shù)據(jù)信息的利用、收集等工作。在大數(shù)據(jù)時代背景下,各種信息量日益劇增,讓檔案管理工作變得復雜化、程序化。鑒于此。我們要立足于大數(shù)據(jù)時代背景下,深入研究檔案利用服務工作,分析大數(shù)據(jù)時代背景下檔案服務工作面臨難題,并提出相應的檔案利用服務策略。旨在希望進一步滿足用戶個性化、高層次的需求。
關(guān)鍵詞:大數(shù)據(jù);檔案;利用服務;策略
大數(shù)據(jù)主要就是將各種先進的信息技術(shù)合理有效的應用各個領域中,促使相應領域可以及時獲取信息,高效存儲、智慧處理,精準分析多樣化、大量化、快速化的匯總信息數(shù)據(jù)。在大數(shù)據(jù)時代背景下,挖掘分析檔案信息數(shù)據(jù)有助于給企業(yè)科學決策、節(jié)約開支,創(chuàng)新技術(shù)等提供極大的幫助,當前我們正處在大數(shù)據(jù)時代背景下,每天都會產(chǎn)生海量的數(shù)據(jù)信息,故而,企業(yè)如何在海量檔案信息數(shù)據(jù)中,準確且快捷的獲取自己所需的檔案信息數(shù)據(jù),分析數(shù)據(jù),最大限度發(fā)揮檔案信息的作用,為企業(yè)的科學管理,戰(zhàn)略發(fā)展,提供強有力的數(shù)據(jù)信息支持,是非常重要的。受多種因素的影響,當前檔案服務還面臨著諸多困難。
1 大數(shù)據(jù)時代給檔案服務帶來的困境
第一,在大數(shù)據(jù)時代,如何在海量信息數(shù)據(jù)中及時準確的查詢檔案資料是當前檔案服務工作順利有序開展所面臨的最大問題。在信息時代,數(shù)據(jù)庫信息技術(shù)一日千里的發(fā)展,此形勢下各種電子文化數(shù)據(jù)不斷增長,并且信息文件保存方式也呈現(xiàn)出多元化。
對于現(xiàn)代企業(yè)而言,卡片檢索。傳統(tǒng)手工著錄等方式已經(jīng)無法滿足現(xiàn)代企業(yè)的要求。雖然在大數(shù)據(jù)時代背景下,檔案管理人員可以充分利用各種先進信息技術(shù),查詢檔案,提高了檔案查詢和管理的效率,但是在檔案數(shù)量爆炸式增長的形勢下,檔案數(shù)據(jù)出現(xiàn)了“脹庫”問題,在進行檔案查詢時,往往需要的息會被埋沒在大量的不需要的數(shù)據(jù)中,并且檢索性能急劇下,甚至無法響應。因此,如何在海量的信息數(shù)據(jù)中,精準獲取所需信息,是檔案管理人員檔案利用服務前必須要解決的問題[1]。
第二,面臨著如何在海量數(shù)據(jù)中抽取和挖掘有用的信息和知識的挑戰(zhàn)。在新形勢下,檔案管理用戶已經(jīng)無法滿足對相關(guān)檔案文件的使用,一定要挖掘檔案文件中所蘊含的價值,扎這樣一來,就促使檔案管理逐漸朝著知識管理方面發(fā)展,與此同時,檔案利用服務也逐漸從提供數(shù)據(jù)轉(zhuǎn)供給知識方面發(fā)展。我們深知,知識絕對不是單一的數(shù)據(jù)信息,必須是通過深入挖掘所或缺的有價值的資料。如果單純的依靠人工挖掘信息是根本不夠的,因此,如何合理使用現(xiàn)代化技術(shù)有效挖掘信息,為用戶提有價值的信息,是現(xiàn)階段檔案利用服務所面臨的一大難題[2]。
2 大數(shù)據(jù)時代背景下的檔案利用服務策略
2.1 不斷轉(zhuǎn)變檔案業(yè)務流程
傳統(tǒng)檔案業(yè)務流程具體包含了檔案信息的收集、整理、存儲、利用等,在這過程中,檔案管理人員檔案主要使用的原始數(shù)據(jù)[3]。隨著信息技術(shù)的不斷發(fā)展,電子文件的廣泛使用,各種檔案數(shù)據(jù)信息量日益劇增,各種媒體形式越來越豐富,對于廣大用戶而言,傳統(tǒng)檔案流程已經(jīng)無法滿足他們對信息數(shù)據(jù)的使用,傳統(tǒng)檔案流程數(shù)據(jù)使用復雜,數(shù)據(jù)查詢性能較低,有時候還會出現(xiàn)無法及時響應,無法使用資料的情況?;诖耍诖髷?shù)據(jù)時代背景下,要不斷更新檔案數(shù)據(jù)庫,采取措施對結(jié)構(gòu)進行優(yōu)化,同時還可以將數(shù)據(jù)挖掘加入數(shù)據(jù)尋求前,通過這樣的方式,借助多媒體來篩選海量數(shù)據(jù),在海量的信息數(shù)據(jù)中獲取所需信息數(shù)據(jù)[4]。此外還需不斷優(yōu)化數(shù)據(jù)查詢性能,從整體上促使檔服務的提升。唯有如此,才能進一步解決檔案利用服務問題,促使檔案利用服務效率的提升。
2.2 數(shù)據(jù)挖掘的合理應用
一些沒有經(jīng)過處理,或是不完整的數(shù)據(jù)信息中,提取有價值的信資源,科學合理對挖掘數(shù)據(jù)進行分類,在這過程中,第一種是web數(shù)據(jù)挖掘,另一種是結(jié)構(gòu)型數(shù)據(jù)挖掘和文本數(shù)據(jù)挖掘,在檔案管理中合理使用數(shù)據(jù)挖掘技術(shù),能進一步縮短檔案管理的時間,及時提取檔案信息資料,最大限度的滿足檔案工作效率要求。文本檔案在數(shù)據(jù)挖掘中是最基礎的部分,同時文本檔案也是數(shù)據(jù)提取過程中非常普遍的一種技術(shù)[5]。檔案管理人員通過分析文字,能夠得到有用信息。在提取有用信息的過程中,主要有兩個步驟,第一,就是分類,第二,就是預測,數(shù)據(jù)分析是文本挖掘的基本要素,該步驟具有消除衍生語言的具體特點,之后再將這些信息放入到數(shù)據(jù)庫中,實現(xiàn)結(jié)構(gòu)化數(shù)據(jù)的目的。最后還必須要通過信息傳遞或是評價方式完成數(shù)據(jù)挖掘。我們可以將“高品質(zhì)”文本挖掘理解成是一種相似形式中實用性和關(guān)聯(lián)性的組合,在大數(shù)據(jù)時代,檔案文本數(shù)據(jù)挖掘的過程是很普遍的,比如,聲像數(shù)據(jù)轉(zhuǎn)換、數(shù)理統(tǒng)計等,這些數(shù)據(jù)轉(zhuǎn)化主要是采用文本形式來處理的。其具體存在以下兩方面,一是知識發(fā)現(xiàn),另一方面是信息訪問。
2.3 數(shù)據(jù)挖掘平臺的使用
要想從整體上提升檔案服務質(zhì)量,數(shù)據(jù)挖掘技術(shù)是非常關(guān)鍵的,眾所周知,文本智能數(shù)據(jù)處理主要是基于音頻識別技術(shù)和獨特模糊識別所構(gòu)建的。其作為數(shù)據(jù)挖掘平臺的中心,檔案管理人員可以通過調(diào)取數(shù)據(jù)挖掘平臺的中心的內(nèi)容,進一步分析需信息。從而提供用戶搜索應用服務,實現(xiàn)數(shù)據(jù)收集、挖掘、智能搜索等一系列的環(huán)節(jié),為檔案使用人員提供檔案服務,另外,還可以將相關(guān)數(shù)據(jù)結(jié)果直接有效地顯示在數(shù)據(jù)挖掘平臺上。在這過程中,檔案資源數(shù)據(jù)挖掘,具體包含了以下幾點,第一,檢索音頻內(nèi)容,自動識別關(guān)鍵,企業(yè)可以進一步區(qū)分定位視頻當中不同的內(nèi)容,促使視頻處理能力的提升,第二,檢索語義,作為當前檔案管理中最常見的一種搜索方式,我們在使用這種方法的過程中,只需要提供計算機識別語言。第三,檔案智能化輔助分類,這種方式,主要就是指工作人員從平臺中,提取檔案,借助數(shù)據(jù)挖掘平臺的中心現(xiàn)文獻的自動分類,利用數(shù)據(jù)平臺分類,促使了檔案準確率的提升,同時還能支持多維度動態(tài)分類。作為構(gòu)建在數(shù)據(jù)挖掘的平臺的載體,文本數(shù)據(jù)處理層目的就是以概論和特殊信息論為基礎,檔案管理人員在具體的工作中,借助相關(guān)技術(shù),提供搜索應用服務,提取所需信息,這樣一來,他們就可以在數(shù)據(jù)挖掘平臺合理使用智能搜索、數(shù)據(jù)分析、數(shù)據(jù)挖掘以及采集數(shù)據(jù)應用平臺,在采集平臺上進一步完成層次化數(shù)據(jù)采集。
3 結(jié)語
綜上所述,當前我們正處在大數(shù)據(jù)信息時代背景下,面對海量、形式多樣的檔案信息,導致檔案管理人員無法及時在海量信息中找到所需信息,信息查詢性逐漸下降,有時候還會出現(xiàn)無法相應等問題,加之傳統(tǒng)檔案查詢服務模式已經(jīng)無法進一步滿足時代發(fā)展的需求,基于此,我們必須要分析大數(shù)據(jù)時代背景下檔案利用服務所面臨的問題,針對問題,采用文本挖掘、數(shù)據(jù)挖掘,進一步發(fā)掘檔案之間的關(guān)聯(lián),最大限度挖掘檔案信息中所蘊含的知識,之后在利用智能化處理平臺推送給用戶,最大限度的滿足用戶需求。
參考文獻
[1]余紅光.關(guān)于大數(shù)據(jù)時代背景下的檔案利用服務分析[J].黑龍江史志,2015(3).
[2]朱建華.面向大數(shù)據(jù)的檔案信息資源服務與利用[J].信息與電腦(理論版),2014(8):46-47.
[3]楊菁華.基于大數(shù)據(jù)環(huán)境下檔案利用服務體系的建設[J].才智,2018(9).:75-77.
[4]王曉輝.大數(shù)據(jù)技術(shù)下服務導向型檔案利用管理策略[J].蘭臺世界,2019(6):109-111.
[5]魏振國.基于云計算大數(shù)據(jù)背景下檔案信息資源共享模式初探[J].機電兵船檔案,2019,200(01):102-105.