解玉蘭
摘要:本文從大數(shù)據(jù)分析方法在企業(yè)檔案管理中的應(yīng)用現(xiàn)狀出發(fā),結(jié)合相關(guān)資料為未來(lái)利用大數(shù)據(jù)進(jìn)行檔案管理提出了一些建議,并闡述了在實(shí)施過(guò)程中需要注意的一些事項(xiàng)。
關(guān)鍵詞:大數(shù)據(jù)分析;企業(yè);檔案管理
一、引言
信息時(shí)代下,大數(shù)據(jù)、云計(jì)算等各種新興技術(shù)層出不窮,其中大數(shù)據(jù)是以容量大、類(lèi)型多和應(yīng)用價(jià)值高為主要特征的數(shù)據(jù)集合。在企業(yè)的檔案管理中應(yīng)用大數(shù)據(jù)技術(shù)有利于對(duì)企業(yè)運(yùn)營(yíng)管理過(guò)程中產(chǎn)生的各種數(shù)據(jù)進(jìn)行深度挖掘,最終形成數(shù)據(jù)分析報(bào)告為企業(yè)管理層的相關(guān)決策提供支持,對(duì)于提高企業(yè)核心競(jìng)爭(zhēng)力具有積極意義。
二、大數(shù)據(jù)分析方法在企業(yè)檔案管理應(yīng)用現(xiàn)狀
(1)有關(guān)大數(shù)據(jù)的探究活動(dòng)更加深入
世界最權(quán)威雜志《科學(xué)》于2008年開(kāi)始開(kāi)設(shè)了大量的大數(shù)據(jù)專(zhuān)欄,帶動(dòng)了國(guó)內(nèi)外的很多專(zhuān)家紛紛開(kāi)始了對(duì)大數(shù)據(jù)的應(yīng)用研究,在經(jīng)過(guò)一系列研究之后大數(shù)據(jù)基本已經(jīng)能夠分成四部分:科學(xué)、技術(shù)、應(yīng)用和工程。目前技術(shù)的大數(shù)據(jù)應(yīng)用是兩個(gè)主要研究方向,并且當(dāng)前對(duì)大數(shù)據(jù)的研究更加成熟,企業(yè)在大數(shù)據(jù)技術(shù)的應(yīng)用方面也不斷增強(qiáng)。
(2)檔案資源是企業(yè)做出決策的依據(jù)
企業(yè)在進(jìn)行相關(guān)決策的時(shí)候必須要保證信息數(shù)據(jù)的準(zhǔn)確性,否則容易導(dǎo)致決策無(wú)效。所謂企業(yè)檔案是指企業(yè)在日常生產(chǎn)經(jīng)營(yíng)過(guò)程中形成的各種形式的對(duì)國(guó)家或者社會(huì)、職工具有保留意義的文件材料,企業(yè)的檔案能夠讓企業(yè)更好地采集和搜索相關(guān)信息,通過(guò)最優(yōu)方式對(duì)信息進(jìn)行開(kāi)發(fā)和利用,屬于企業(yè)的無(wú)形資產(chǎn)。隨著信息技術(shù)和互聯(lián)網(wǎng)應(yīng)用的飛速發(fā)展,大數(shù)據(jù)已經(jīng)得到了企業(yè)領(lǐng)導(dǎo)的更多重視,由此可以看出在企業(yè)檔案管理中提高大數(shù)據(jù)技術(shù)的應(yīng)用對(duì)于提高企業(yè)競(jìng)爭(zhēng)力具有重要意義。
三、企業(yè)利用大數(shù)據(jù)分析方法進(jìn)行檔案數(shù)據(jù)管理的建議
充分而且全面的掌握企業(yè)的信息資源是保證企業(yè)生產(chǎn)經(jīng)營(yíng)決策和各種管理決策良好利用大數(shù)據(jù)技術(shù)的前提,企業(yè)的整個(gè)信息資源利用管理過(guò)程中都不能忽視對(duì)于信息的利用,要按照資源運(yùn)作周期全面掌握信息數(shù)據(jù),同時(shí)還要做好數(shù)據(jù)的保存工作,做好相關(guān)數(shù)據(jù)信息的格式化預(yù)操作。常見(jiàn)大數(shù)據(jù)分析方法包括可視化分析、數(shù)據(jù)挖掘、預(yù)測(cè)分析、語(yǔ)義分析和數(shù)據(jù)質(zhì)量管理。
(1)數(shù)據(jù)質(zhì)量管理提升企業(yè)檔案數(shù)據(jù)的資源品質(zhì)
當(dāng)前企業(yè)的數(shù)據(jù)大都呈現(xiàn)出了4V特點(diǎn),傳統(tǒng)的數(shù)據(jù)管理形式已經(jīng)不能滿(mǎn)足對(duì)數(shù)據(jù)的處理和分析,目前使用比較廣泛的是數(shù)據(jù)并行處理系統(tǒng)和非關(guān)系型的數(shù)據(jù)庫(kù),將ETL工具移入到云計(jì)算平臺(tái)系統(tǒng)對(duì)于數(shù)據(jù)的清洗、重復(fù)檢測(cè)和缺失數(shù)據(jù)處理、邏輯錯(cuò)誤檢測(cè)都有重要意義,有利于保證企業(yè)檔案數(shù)據(jù)資源的數(shù)據(jù)質(zhì)量。
(2)可視化分析提升企業(yè)檔案數(shù)據(jù)資源可理解性
大數(shù)據(jù)的可視化分析就是在大數(shù)據(jù)自動(dòng)分析數(shù)據(jù)的同時(shí),利用可視化界面和人機(jī)交互技術(shù)提高人對(duì)數(shù)據(jù)的洞察力。企業(yè)檔案數(shù)據(jù)資源的可視化分析就是將檔案數(shù)據(jù)生成各種報(bào)表以及文本、視頻等,方便決策制定者理解運(yùn)用。以企業(yè)中的文本數(shù)據(jù)可視化為例,標(biāo)簽云是目前比較流行的文本可視化技術(shù),能夠?qū)n案文本中潛在的主題進(jìn)行分類(lèi)、邏輯結(jié)構(gòu)和詞頻重要度直觀的展現(xiàn)出來(lái),成為企業(yè)決策的依據(jù),相類(lèi)似的還有很多不同類(lèi)型的檔案信息可視化技術(shù),如網(wǎng)絡(luò)數(shù)據(jù)可視化、時(shí)間序列可視化等。
(3)語(yǔ)義引擎實(shí)現(xiàn)企業(yè)檔案數(shù)據(jù)資源的智能提取
信息時(shí)代下全球信息儲(chǔ)存量暴漲,傳統(tǒng)的百度搜索引擎僅僅能夠滿(mǎn)足對(duì)關(guān)鍵詞的匹配搜索,檢索的準(zhǔn)確率比較低,檢索結(jié)果的關(guān)聯(lián)度也不強(qiáng)。實(shí)現(xiàn)高質(zhì)量的搜索體驗(yàn)和智能提取是語(yǔ)義搜索引擎的主要優(yōu)勢(shì)。語(yǔ)義引擎是在語(yǔ)義網(wǎng)的發(fā)展帶動(dòng)下來(lái)實(shí)現(xiàn)語(yǔ)義搜索的引擎,能夠通過(guò)分析搜索者的語(yǔ)義檢索請(qǐng)求來(lái)理解搜索者的真正意圖,對(duì)語(yǔ)義分析通過(guò)語(yǔ)言處理進(jìn)行概念匹配。企業(yè)人事檔案中應(yīng)用語(yǔ)義引擎,能夠分析該檔案中人的職務(wù)和級(jí)別,提取出姓名、級(jí)別、時(shí)間等關(guān)鍵信息,提高檢索命中率。
(4)數(shù)據(jù)挖掘發(fā)現(xiàn)企業(yè)檔案數(shù)據(jù)資源的隱性?xún)r(jià)值
數(shù)據(jù)挖掘又稱(chēng)為數(shù)據(jù)庫(kù)知識(shí)再發(fā)現(xiàn),就是分析數(shù)據(jù)之間的關(guān)聯(lián)性。主要的數(shù)據(jù)挖掘方法有機(jī)器學(xué)習(xí)法和神經(jīng)網(wǎng)絡(luò)方法等。在大數(shù)據(jù)分析中,數(shù)據(jù)挖掘是核心,對(duì)企業(yè)來(lái)說(shuō)檔案數(shù)據(jù)數(shù)據(jù)由企業(yè)正常運(yùn)行管理中形成的檔案數(shù)據(jù)和企業(yè)運(yùn)行過(guò)程中遺存在互聯(lián)網(wǎng)上的數(shù)據(jù)組成。前者通過(guò)運(yùn)用聚類(lèi)、關(guān)聯(lián)等方式對(duì)企業(yè)內(nèi)部數(shù)據(jù)進(jìn)行挖掘,為創(chuàng)新人員的決策提供數(shù)據(jù)支持,后者通過(guò)網(wǎng)絡(luò)輿情及時(shí)跟蹤獲得市場(chǎng)前沿信息,調(diào)整企業(yè)的競(jìng)爭(zhēng)策略。
四、大數(shù)據(jù)分析方法運(yùn)用于企業(yè)檔案管理中的注意事項(xiàng)
(1)控制成本
使用大數(shù)據(jù)分析方法要借助一定的運(yùn)算工具,需要企業(yè)進(jìn)行相關(guān)投入,由于信息具有一定的復(fù)雜性因此很難控制好成本投入,要求企業(yè)提高自己的成本控制能力,盡量做到低投入高產(chǎn)出,增加大數(shù)據(jù)分析帶來(lái)的利潤(rùn)增加。
(2)增強(qiáng)時(shí)效性
大數(shù)據(jù)中運(yùn)用的數(shù)據(jù)動(dòng)態(tài)性比較強(qiáng),因此在分析過(guò)程中要認(rèn)識(shí)到這種特性帶來(lái)的影響,若是信息的時(shí)效性得不到保證,那么決策的制定也就不能及時(shí)發(fā)揮作用。其實(shí)大數(shù)據(jù)分析方法的關(guān)鍵環(huán)節(jié)在于建模,只要在建模過(guò)程中保持高度敏感和靈活,保證模型與數(shù)據(jù)更新之間不脫節(jié)就能保證信息的時(shí)效陛。
(3)重視人文情感
在企業(yè)檔案管理中,大數(shù)據(jù)分析方法具有一定的客觀性,因此也導(dǎo)致其存在一個(gè)明顯問(wèn)題——缺少人文感情。受到此方面的制約導(dǎo)致數(shù)據(jù)分析無(wú)法具體表達(dá)用戶(hù)情感,盡管大數(shù)據(jù)分析的工作效率比較高,但是畢竟是一種機(jī)械式的運(yùn)算程序,人文精神關(guān)懷方面為零。
五、結(jié)語(yǔ)
在大數(shù)據(jù)時(shí)代背景之下,企業(yè)檔案管理中應(yīng)用大數(shù)據(jù)分析方法具有重要意義,一方面有利于幫助企業(yè)的管理者在制定企業(yè)發(fā)展決策的時(shí)候提供科學(xué)依據(jù);另一方面有助于通過(guò)企業(yè)的運(yùn)營(yíng)數(shù)據(jù)分析來(lái)降低企業(yè)的運(yùn)行成本,提高市場(chǎng)競(jìng)爭(zhēng)力,在企業(yè)檔案管理中科學(xué)運(yùn)用大數(shù)據(jù)技術(shù)將會(huì)為企業(yè)發(fā)展做出巨大貢獻(xiàn)。
(作者單位:大唐湘潭發(fā)電有限責(zé)任公司)