王毅+李晶偉
摘 要:隨著大數(shù)據(jù)研究逐漸深入,企業(yè)創(chuàng)新決策越來(lái)越依賴于數(shù)據(jù)分析,而企業(yè)檔案數(shù)據(jù)資源為企業(yè)這一決策提供了數(shù)據(jù)基礎(chǔ)。因此,在此背景下企業(yè)檔案管理中運(yùn)用大數(shù)據(jù)分析方法具有重要性意義。本文詳細(xì)的闡述了數(shù)據(jù)質(zhì)量管理、可視化分析、語(yǔ)義引擎、數(shù)據(jù)挖掘、趨勢(shì)預(yù)測(cè)分析等五種大數(shù)據(jù)分析方法在企業(yè)檔案管理中的應(yīng)用及注意問(wèn)題。
關(guān)鍵詞:大數(shù)據(jù)分析方法;企業(yè)檔案管理;檔案數(shù)據(jù)資源;企業(yè)創(chuàng)新決策
Abstract: With the gradually go deep into the research of big data, the enterprise innovation decision-makings are more and more dependent on data analysis, and the enterprise archive data resources provide the data base for enterprises these decisions, therefore used of big data analysis in Enterprise Archive Management has important significance. This paper detailed expounds the Data Quality Management, Visualization Analysis, Semantic Engines, Data Mining, Tendency Prediction and so on five big data analysis methods in the application of Enterprise Archive Management and problems that deserve attention.
Keywords: Big data analysis method; Enterprise Archive Management; archives data resources; enterprise innovation decision-making
2015年9月5日,我國(guó)政府發(fā)布了《促進(jìn)大數(shù)據(jù)發(fā)展行動(dòng)綱要》,旨在促進(jìn)大數(shù)據(jù)和云計(jì)算、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)等新一代信息技術(shù)的融合,探索大數(shù)據(jù)和傳統(tǒng)產(chǎn)業(yè)發(fā)展新模式,推動(dòng)傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型升級(jí)和新興產(chǎn)業(yè)發(fā)展。正如大數(shù)據(jù)專家舍恩伯格所說(shuō):大數(shù)據(jù)正在改變?nèi)藗兊纳詈腿藗兝斫馐澜绲姆绞?,更多的變化正蓄?shì)待發(fā),大數(shù)據(jù)管理分析思維和方法也開(kāi)始影響到我們企業(yè)檔案管理的發(fā)展趨勢(shì)。
1 大數(shù)據(jù)分析方法在企業(yè)檔案管理中應(yīng)用的背景
1.1 大數(shù)據(jù)研究逐漸縱深化。自從2008年science雜志推出Big Data專刊以來(lái),國(guó)內(nèi)外對(duì)大數(shù)據(jù)的研究如火如荼。經(jīng)過(guò)一段時(shí)間的探索,“目前大數(shù)據(jù)領(lǐng)域的研究大致可以分為4個(gè)方向:大數(shù)據(jù)科學(xué)、大數(shù)據(jù)技術(shù)、大數(shù)據(jù)應(yīng)用和大數(shù)據(jù)工程。而人們對(duì)于大數(shù)據(jù)技術(shù)和應(yīng)用兩個(gè)方面的關(guān)注比較多”[1]。正如2012年奧巴馬政府投入2億美元啟動(dòng) “大數(shù)據(jù)研究和發(fā)展計(jì)劃”的目標(biāo)所顯示的那樣,目前大數(shù)據(jù)的研究逐漸向縱深化方向發(fā)展,著重從大型復(fù)雜的數(shù)據(jù)中提取知識(shí)和觀點(diǎn),幫助企業(yè)實(shí)現(xiàn)從“數(shù)據(jù)分析能力”向“數(shù)據(jù)決策能力與優(yōu)勢(shì)”的轉(zhuǎn)化。
1.2 企業(yè)創(chuàng)新決策越來(lái)越依賴于數(shù)據(jù)分析。對(duì)于企業(yè)技術(shù)創(chuàng)新者而言,目前更多的企業(yè)高層越來(lái)越依靠基于數(shù)據(jù)分析的企業(yè)技術(shù)創(chuàng)新決策。靠傳統(tǒng)的經(jīng)驗(yàn)方法去決策往往是滯后的,因此,大數(shù)據(jù)分析方法作為先進(jìn)的定量分析方法,目前出現(xiàn)的一些先進(jìn)數(shù)據(jù)分析方法與技術(shù)勢(shì)必會(huì)對(duì)企業(yè)的運(yùn)行管理、生產(chǎn)業(yè)務(wù)流程、管理決策產(chǎn)生飛躍式的影響。大數(shù)據(jù)分析方法也成為企業(yè)檔案數(shù)據(jù)分析、技術(shù)創(chuàng)新決策的有效工具。
1.3 企業(yè)檔案為企業(yè)創(chuàng)新決策提供數(shù)據(jù)基礎(chǔ)。對(duì)于一個(gè)企業(yè)而言,使用的數(shù)據(jù)資源必須具有真實(shí)性可靠性?!捌髽I(yè)檔案是在企業(yè)的各項(xiàng)活動(dòng)中直接形成并保存?zhèn)洳榈母鞣N文獻(xiàn)載體形式的歷史記錄”[2],企業(yè)檔案是企業(yè)在生產(chǎn)、經(jīng)營(yíng)、管理等活動(dòng)中形成的全部有用數(shù)據(jù)的總和。除了發(fā)揮著憑證參考維護(hù)歷史真實(shí)面貌的作用之外,企業(yè)檔案更“是企業(yè)知識(shí)資產(chǎn)和信息資源的重要組成部分”[3],具有知識(shí)創(chuàng)新性、不可替代性,為企業(yè)技術(shù)創(chuàng)新決策提供數(shù)據(jù)基礎(chǔ)。“特別是在當(dāng)前大數(shù)據(jù)背景下,企業(yè)檔案數(shù)據(jù)資源的開(kāi)發(fā)與建設(shè)對(duì)企業(yè)經(jīng)營(yíng)決策的制定與適應(yīng)市場(chǎng)競(jìng)爭(zhēng)環(huán)境起到關(guān)鍵性作用?!盵4]
在上述背景下,將大數(shù)據(jù)分析方法應(yīng)用在企業(yè)檔案管理中具有重要性意義:不僅拓展企業(yè)的管理決策理論,同時(shí)幫助企業(yè)運(yùn)用所擁有的檔案數(shù)據(jù)資源洞察市場(chǎng)環(huán)境,發(fā)現(xiàn)新的競(jìng)爭(zhēng)對(duì)手,進(jìn)行自我總結(jié),做出科學(xué)決策,使企業(yè)緊緊抓住大數(shù)據(jù)時(shí)代帶來(lái)的市場(chǎng)機(jī)遇。
2 大數(shù)據(jù)分析方法在企業(yè)檔案管理中應(yīng)用的方式
大數(shù)據(jù)分析方法在企業(yè)檔案管理中的實(shí)現(xiàn)方式即是將大數(shù)據(jù)分析方法運(yùn)用在企業(yè)檔案信息分析挖掘上。它貫穿企業(yè)數(shù)據(jù)處理的整個(gè)過(guò)程,遵循數(shù)據(jù)生命周期,廣泛收集數(shù)據(jù)進(jìn)行存儲(chǔ),并對(duì)數(shù)據(jù)進(jìn)行格式化預(yù)處理,采用數(shù)據(jù)分析模型,依托強(qiáng)大的運(yùn)行分析算法支撐數(shù)據(jù)平臺(tái),發(fā)掘潛在價(jià)值和規(guī)律并進(jìn)行呈現(xiàn)的過(guò)程。常見(jiàn)的大數(shù)據(jù)分析方法“其相關(guān)內(nèi)容包括可視化分析、數(shù)據(jù)挖掘、預(yù)測(cè)分析、語(yǔ)義分析及數(shù)據(jù)質(zhì)量管理”[5]。
2.1 數(shù)據(jù)質(zhì)量管理提升企業(yè)檔案數(shù)據(jù)資源品質(zhì)。大數(shù)據(jù)時(shí)代企業(yè)檔案數(shù)據(jù)資源呈現(xiàn)出4V特點(diǎn),這使得企業(yè)檔案數(shù)據(jù)很容易出現(xiàn)不一致、不精確、不完整、過(guò)時(shí)等數(shù)據(jù)質(zhì)量問(wèn)題。基于數(shù)據(jù)生命周期對(duì)企業(yè)檔案數(shù)據(jù)資源進(jìn)行數(shù)據(jù)質(zhì)量管理分為數(shù)據(jù)預(yù)處理、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)使用三個(gè)階段。在數(shù)據(jù)預(yù)處理階段,通過(guò)ETL工具即數(shù)據(jù)經(jīng)過(guò)萃?。‥xtract)、轉(zhuǎn)換(Transform)、加載(Load)至目的端這幾個(gè)預(yù)處理過(guò)程達(dá)到數(shù)據(jù)清洗和格式化的目的。目前Oracle公司的Data Integrator和Warehouse Build、微軟的Dynamics Integration及IBM的Data Integrator都是比較常見(jiàn)的ETL工具。在數(shù)據(jù)存儲(chǔ)與使用階段,針對(duì)目前企業(yè)檔案大數(shù)據(jù)呈現(xiàn)出4V的特點(diǎn),傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)在數(shù)據(jù)存儲(chǔ)與數(shù)據(jù)管理方面已經(jīng)難以勝任,非關(guān)系型數(shù)據(jù)庫(kù)以其高吞吐量、可拓展性、高并發(fā)讀寫、實(shí)時(shí)性等特性能夠滿足數(shù)據(jù)存儲(chǔ)與管理的要求。目前應(yīng)用最廣的是并行處理系統(tǒng)MapReduce和非關(guān)系型數(shù)據(jù)庫(kù)比如谷歌的Big Table和Hadoop的HBase。將ETL工具移植入云計(jì)算平臺(tái)系統(tǒng),將會(huì)大大有助于完成數(shù)據(jù)清洗、重復(fù)對(duì)象檢測(cè)、缺失數(shù)據(jù)處理、異常數(shù)據(jù)檢測(cè)、邏輯錯(cuò)誤檢測(cè)、不一致數(shù)據(jù)處理等數(shù)據(jù)質(zhì)量處理過(guò)程,從而保證企業(yè)檔案數(shù)據(jù)資源的數(shù)據(jù)質(zhì)量。
2.2 可視化分析提升企業(yè)檔案數(shù)據(jù)資源可理解性。
“大數(shù)據(jù)可視分析是指在大數(shù)據(jù)自動(dòng)分析挖掘方法的同時(shí),利用支持信息可視化的用戶界面以及支持分析過(guò)程的人機(jī)交互方式與技術(shù),有效融合計(jì)算機(jī)的計(jì)算能力和人的認(rèn)知能力,以獲得對(duì)于大規(guī)模復(fù)雜數(shù)據(jù)集的洞察力。”[6]那么企業(yè)檔案數(shù)據(jù)資源的可視化分析可以理解為借助可視化工具把企業(yè)檔案數(shù)據(jù)資源轉(zhuǎn)化成直觀、可視、交互形式(如表格、動(dòng)畫、聲音、文本、視頻、圖形等)的過(guò)程,便于企業(yè)經(jīng)營(yíng)者的理解利用。
以2015年2月15日最新版的“百度遷徙”(全稱“百度地圖春節(jié)人口遷徙大數(shù)據(jù)”)為例,該項(xiàng)目讓我們近距離了解到大數(shù)據(jù)可視化。它利用百度后臺(tái)每天數(shù)十億次的LBS定位獲得的數(shù)據(jù)進(jìn)行計(jì)算分析,全程展現(xiàn)中國(guó)人口遷徙軌跡,為政府部門科學(xué)決策提供科學(xué)依據(jù)。受該項(xiàng)目啟發(fā),企業(yè)可將擁有不同類型的檔案信息進(jìn)行可視化,比如進(jìn)行企業(yè)檔案的網(wǎng)絡(luò)數(shù)據(jù)可視化、時(shí)空數(shù)據(jù)可視化、時(shí)間序列數(shù)據(jù)可視化、多維數(shù)據(jù)可視化、文本數(shù)據(jù)可視化等[7]。以文本數(shù)據(jù)可視化為例,目前典型的文本可視化技術(shù)標(biāo)簽云,可以將檔案文本中蘊(yùn)含的主題聚類、邏輯結(jié)構(gòu)、詞頻與重要度、動(dòng)態(tài)演化規(guī)律直觀展示出來(lái),為企業(yè)決策提供依據(jù)。另外,常見(jiàn)的信息圖表類可視化工具主要有Google chart、 IBM Many Eyes、Tableau、Spotfire、Data-Driven Documents(D3.js)等;時(shí)間線類可視化工具主要是Timetoast,、Xtimeline、Timeslide、Dipity等;數(shù)據(jù)地圖類可視化工具主要有Leaflet、Google fushion tables、Quanum GIS等。這些新技術(shù)都為企業(yè)檔案數(shù)據(jù)資源可視化提供了科學(xué)工具。
2.3 語(yǔ)義引擎實(shí)現(xiàn)企業(yè)檔案數(shù)據(jù)資源的智能提取。大數(shù)據(jù)時(shí)代全球數(shù)據(jù)存儲(chǔ)量呈激增趨勢(shì),傳統(tǒng)的基于人工分類目錄或關(guān)鍵詞匹配的搜索引擎(谷歌、百度等)僅僅能夠進(jìn)行簡(jiǎn)單的關(guān)鍵詞匹配,用戶無(wú)法得到非常準(zhǔn)確的信息,檢索準(zhǔn)確率并不高,而且檢索結(jié)果相關(guān)度較低,檢索結(jié)果缺乏引導(dǎo)性。為提供給用戶高質(zhì)量的檢索結(jié)果,改善用戶搜索體驗(yàn),提高效率,實(shí)現(xiàn)智能提取,語(yǔ)義搜索引擎應(yīng)運(yùn)而生?!罢Z(yǔ)義引擎是隨著語(yǔ)義網(wǎng)的發(fā)展,采用語(yǔ)義網(wǎng)的語(yǔ)義推理技術(shù)實(shí)現(xiàn)語(yǔ)義搜索的語(yǔ)義搜索引擎。”[8]它具備從語(yǔ)義理解的角度分析檢索者的檢索請(qǐng)求,能夠理解檢索者的真正意圖,實(shí)現(xiàn)信息智能提取。對(duì)語(yǔ)義分析可以采取自然語(yǔ)言處理方法進(jìn)行概念匹配,提供與檢索者需求相同、相近或者相包含的詞語(yǔ)。目前存在基于本體的語(yǔ)義處理技術(shù),它以本體庫(kù)作為語(yǔ)義搜索引擎理解和運(yùn)用語(yǔ)義的基礎(chǔ)。對(duì)于企業(yè)而言,將語(yǔ)義引擎分析方法與協(xié)同過(guò)濾關(guān)聯(lián)規(guī)則相結(jié)合,可以挖掘用戶的需求,提供個(gè)性化的服務(wù)。比如亞馬遜公司通過(guò)對(duì)用戶檢索的語(yǔ)義進(jìn)行分析推理,結(jié)合協(xié)同過(guò)濾關(guān)聯(lián)規(guī)則,為用戶提供相近需求的產(chǎn)品,提升自己的經(jīng)濟(jì)效益。對(duì)于一份人事檔案而言,語(yǔ)義引擎也能分析出該份人事檔案中的某人的職務(wù)、級(jí)別,從中提取出姓名一職務(wù)一級(jí)別一時(shí)間等關(guān)鍵信息,提高檢索準(zhǔn)確率和效率,實(shí)現(xiàn)智能提取。
2.4 數(shù)據(jù)挖掘發(fā)現(xiàn)企業(yè)檔案數(shù)據(jù)資源的隱性價(jià)值?!皵?shù)據(jù)挖掘又稱數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)”[9]。簡(jiǎn)而言之,數(shù)據(jù)挖掘就是企業(yè)從數(shù)據(jù)集中發(fā)現(xiàn)知識(shí)模式,根據(jù)功能一般分為預(yù)測(cè)性模式和描述性模式,細(xì)分主要有分類與回歸模型、聚類分析模型、關(guān)聯(lián)規(guī)則模型、時(shí)間序列模型、偏差檢測(cè)模型等。主要挖掘方法有神經(jīng)網(wǎng)絡(luò)方法、機(jī)器學(xué)習(xí)方法數(shù)據(jù)庫(kù)方法和統(tǒng)計(jì)方法等。
數(shù)據(jù)挖掘是大數(shù)據(jù)分析方法的核心。對(duì)于企業(yè)而言,數(shù)據(jù)挖掘的檔案數(shù)據(jù)資源應(yīng)該由兩部分組成:一是企業(yè)正常運(yùn)行管理過(guò)程中所形成的檔案數(shù)據(jù)資源,通過(guò)運(yùn)用分類、聚類、關(guān)聯(lián)規(guī)則等方法對(duì)企業(yè)內(nèi)部的數(shù)據(jù)進(jìn)行挖掘,發(fā)現(xiàn)潛在模式,為企業(yè)技術(shù)創(chuàng)新人員決策提供支持。比如在2004年全球最大的零售商沃爾瑪在分析歷史記錄的顧客消費(fèi)數(shù)據(jù)時(shí),發(fā)現(xiàn)每次季節(jié)性颶風(fēng)來(lái)臨之前,手電筒和蛋撻的數(shù)量全部增加。根據(jù)這一關(guān)聯(lián)發(fā)現(xiàn),沃爾瑪公司會(huì)在颶風(fēng)用品的旁邊放上蛋撻,提升了企業(yè)的經(jīng)濟(jì)效益;二是企業(yè)在運(yùn)行過(guò)程中遺存在互聯(lián)網(wǎng)上的數(shù)據(jù),通過(guò)網(wǎng)絡(luò)輿情及時(shí)跟蹤可以獲取市場(chǎng)最新動(dòng)態(tài),為企業(yè)調(diào)整服務(wù)模式、市場(chǎng)策略、降低風(fēng)險(xiǎn)提供依據(jù)。比如Farecast公司運(yùn)用數(shù)據(jù)挖掘,從網(wǎng)絡(luò)抓取數(shù)據(jù)來(lái)預(yù)測(cè)機(jī)票價(jià)格以及未來(lái)發(fā)展趨勢(shì),幫助客戶把握最佳購(gòu)買時(shí)機(jī),獲得較大成功。
2.5 趨勢(shì)預(yù)測(cè)分析實(shí)現(xiàn)企業(yè)檔案數(shù)據(jù)資源的價(jià)值創(chuàng)造?!邦A(yù)測(cè)分析是利用統(tǒng)計(jì)、建模、數(shù)據(jù)挖掘工具對(duì)已有數(shù)據(jù)進(jìn)行研究以完成預(yù)測(cè)?!盵10]預(yù)測(cè)分析的方法分為定性與定量分析兩種方法:定性分析如德?tīng)柗品ㄒ约敖陙?lái)人工智能產(chǎn)生的Boos-ting·貝葉斯網(wǎng)絡(luò)法等;定量分析法一般從形成的歷史數(shù)據(jù)中發(fā)掘數(shù)據(jù)模型達(dá)到預(yù)測(cè)效果,如時(shí)間序列分析模型、分類與回歸分析模型等。
企業(yè)檔案數(shù)據(jù)資源預(yù)測(cè)分析是在企業(yè)檔案數(shù)據(jù)資源數(shù)據(jù)挖掘的基礎(chǔ)之上,發(fā)現(xiàn)適合模型,將企業(yè)檔案數(shù)據(jù)輸入該模型使得企業(yè)技術(shù)創(chuàng)新人員達(dá)到預(yù)測(cè)性的判斷效果,實(shí)現(xiàn)價(jià)值的創(chuàng)造。一個(gè)典型的例子即是市場(chǎng)預(yù)測(cè)問(wèn)題,企業(yè)技術(shù)創(chuàng)新者可以根據(jù)檔案數(shù)據(jù)預(yù)測(cè)某件產(chǎn)品在未來(lái)六個(gè)月內(nèi)的銷售趨勢(shì)走向,進(jìn)而進(jìn)行生產(chǎn)、物流、營(yíng)銷等活動(dòng)安排。具體來(lái)講企業(yè)可以通過(guò)數(shù)據(jù)時(shí)間序列分析模型預(yù)測(cè)產(chǎn)品銷售旺季和淡季顧客的需求量,從而制定針對(duì)獨(dú)特的營(yíng)銷策略,減少生產(chǎn)和銷售的波動(dòng)性,獲得利潤(rùn)和競(jìng)爭(zhēng)優(yōu)勢(shì)。預(yù)測(cè)分析在大數(shù)據(jù)時(shí)代彰顯出企業(yè)檔案數(shù)據(jù)資源獨(dú)特的魅力。
3 大數(shù)據(jù)分析方法運(yùn)用于企業(yè)檔案管理中應(yīng)當(dāng)注意的問(wèn)題
3.1 成本問(wèn)題。大數(shù)據(jù)分析需要依靠分析工具和運(yùn)算時(shí)間,特別是在復(fù)雜的企業(yè)檔案數(shù)據(jù)資源中采用相關(guān)大數(shù)據(jù)分析工具的科技成本還是很高的,要以最少運(yùn)算成本獲得更有價(jià)值的數(shù)據(jù)內(nèi)容。合理選擇大數(shù)據(jù)分析工具不光可以節(jié)省運(yùn)算成本而且能夠更快速獲取盈利增長(zhǎng)點(diǎn),同時(shí)在大數(shù)據(jù)分析和企業(yè)檔案數(shù)據(jù)資源的存儲(chǔ)成本方面也要適當(dāng)?shù)目刂圃诤侠淼姆秶鷥?nèi)。既要保證大數(shù)據(jù)分析質(zhì)量,又要降低企業(yè)檔案存儲(chǔ)成本是大數(shù)據(jù)分析方法運(yùn)用到企業(yè)檔案管理中的重要原則。
3.2 時(shí)效問(wèn)題?!按髷?shù)據(jù)的動(dòng)態(tài)性強(qiáng),要求分析處理應(yīng)快速響應(yīng),在動(dòng)態(tài)變化的環(huán)境中快速完成分析過(guò)程,有些甚至必須實(shí)時(shí)分析,否則這些結(jié)果可能就是過(guò)時(shí)、無(wú)效的”。[11]由此可見(jiàn),影響大數(shù)據(jù)分析的重要因素就是時(shí)效性問(wèn)題?!按髷?shù)據(jù)數(shù)據(jù)分析的核心內(nèi)容之一是數(shù)據(jù)建?!?,[12]數(shù)據(jù)分析模型要不斷的更新適應(yīng)數(shù)據(jù)的動(dòng)態(tài)變化。如果模型落后于數(shù)據(jù)的變化,那數(shù)據(jù)分析只能是失效的。同時(shí)由于經(jīng)濟(jì)環(huán)境、政治生態(tài)、社會(huì)文化等因素不斷變革,企業(yè)檔案數(shù)據(jù)的收集也會(huì)產(chǎn)生新的問(wèn)題。只有不斷加強(qiáng)對(duì)這些數(shù)據(jù)的實(shí)時(shí)監(jiān)測(cè)和有效分析,才能更好的識(shí)別出數(shù)據(jù)變化中的細(xì)微之處,建立與之相適應(yīng)的數(shù)據(jù)分析新模型。
3.3 情感問(wèn)題。“大數(shù)據(jù)的另一個(gè)局限性在于它很難表現(xiàn)和描述用戶的感情?!贝髷?shù)據(jù)分析方法在處理企業(yè)檔案數(shù)據(jù)方面可以說(shuō)如魚得水,大數(shù)據(jù)分析是一種科學(xué)的機(jī)器運(yùn)算方法,無(wú)法去實(shí)現(xiàn)人文價(jià)值提取,比如如何從企業(yè)檔案數(shù)據(jù)資源中提取企業(yè)文化,這更需要人的情感直覺(jué)去實(shí)現(xiàn),而嚴(yán)謹(jǐn)?shù)目茖W(xué)數(shù)據(jù)是無(wú)法實(shí)現(xiàn)的。因此,我們?cè)跓嶂杂诖髷?shù)據(jù)分析方法的量化結(jié)果時(shí),同時(shí)也不要忽略在傳統(tǒng)企業(yè)檔案管理中的那份人文精神。
總之,大數(shù)據(jù)時(shí)代環(huán)境下,在企業(yè)檔案數(shù)據(jù)資源開(kāi)發(fā)利用中應(yīng)用大數(shù)據(jù)分析方法具有重要意義和多種方式。通過(guò)大數(shù)據(jù)分析方法的應(yīng)用,可以幫助企業(yè)創(chuàng)新管理者從所擁有的海量檔案數(shù)據(jù)中提取有用的知識(shí)和觀點(diǎn),發(fā)掘隱藏在信息背后潛在的規(guī)律模式,推動(dòng)企業(yè)管理優(yōu)化,決策科學(xué),提升自身技術(shù)創(chuàng)新能力,同時(shí)合理解決好大數(shù)據(jù)分析方法在成本、時(shí)效、情感等方面的問(wèn)題,進(jìn)而使企業(yè)最終在激烈的市場(chǎng)競(jìng)爭(zhēng)中立于不敗之地。
*本文系2016年度遼寧經(jīng)濟(jì)社會(huì)發(fā)展立項(xiàng)課題《遼寧省企業(yè)技術(shù)創(chuàng)新與檔案大數(shù)據(jù)分析方法研究》(項(xiàng)目編號(hào):2016lslktzdian-30)前期研究成果之一。