黃海鏗
(廣東省潮州廣播電視大學(xué) 潮州 521000)
大數(shù)據(jù)環(huán)境下高校檔案用戶行為分析
黃海鏗
(廣東省潮州廣播電視大學(xué) 潮州 521000)
在對(duì)互聯(lián)網(wǎng)“用戶行為大數(shù)據(jù)分析”這一技術(shù)創(chuàng)新進(jìn)行深入考察的基礎(chǔ)上,對(duì)于其內(nèi)涵與實(shí)際研究的現(xiàn)實(shí)意義進(jìn)行了全面概括,并提出了與數(shù)據(jù)源集成機(jī)制相關(guān)的內(nèi)容?;诖?,將高校檔案用戶行為的大數(shù)據(jù)分析作為研究重點(diǎn)進(jìn)行了全方位探討,以期能夠進(jìn)一步促進(jìn)高校檔案機(jī)構(gòu)提供增值性服務(wù)。文章將大數(shù)據(jù)環(huán)境作為重要背景,闡述了高校檔案用戶行為分析的相關(guān)內(nèi)容,希望對(duì)大數(shù)據(jù)技術(shù)未來的應(yīng)用提供有力保障。
大數(shù)據(jù)環(huán)境 高校檔案 用戶行為分析 研究
在新時(shí)期背景下,互聯(lián)網(wǎng)技術(shù)的發(fā)展速度不斷加快,而其互動(dòng)性的特征也隨之彰顯出來。在這種情況下,用戶在身份注冊(cè)以后就可以參與到制造并流通信息當(dāng)中。而在大數(shù)據(jù)的環(huán)境中,充分發(fā)揮用戶行為分析價(jià)值,能夠在短時(shí)間內(nèi)了解不同領(lǐng)域的發(fā)展?fàn)顩r,備受認(rèn)可。在對(duì)大數(shù)據(jù)技術(shù)進(jìn)行運(yùn)用的過程中,進(jìn)一步挖掘了用戶基本信息資料所具備的使用價(jià)值,同樣,還可以為用戶行為數(shù)據(jù)增值工作的開展提供有力保障。文章針對(duì)大數(shù)據(jù)環(huán)境下的用戶行為分析相關(guān)問題展開了全面的研究與探討,將高校檔案用戶行為的大數(shù)據(jù)分析作為重點(diǎn),闡述了用戶行為大數(shù)據(jù)源的優(yōu)選和集成機(jī)制,以供參考。
1.檔案用戶行為信息。所謂的檔案用戶行為信息,具體指的就是用戶在檔案網(wǎng)站或是檔案信息管理系統(tǒng)當(dāng)中進(jìn)行操作所形成的數(shù)據(jù)痕跡。與此同時(shí),檔案用戶行為信息也涵蓋了使用第三方網(wǎng)站等途徑所表現(xiàn)的行為,比較典型的就是在社交媒體中交流與溝通等行為[1]16-21。
2.檔案用戶行為的大數(shù)據(jù)分析。針對(duì)大量的檔案用戶行為數(shù)據(jù)信息進(jìn)行集中收集并總結(jié)提煉,找到有效的數(shù)據(jù)內(nèi)容,深入挖掘用戶行為數(shù)據(jù)中潛在信息,并對(duì)數(shù)據(jù)的價(jià)值展開全面研究,這就是對(duì)檔案用戶行為的大數(shù)據(jù)分析。而大數(shù)據(jù)分析的重點(diǎn)就是能夠通過不同的檔案用戶在線行為,對(duì)其行為特性進(jìn)行詳細(xì)分析,實(shí)現(xiàn)與智能數(shù)據(jù)服務(wù)平臺(tái)用戶需求預(yù)測(cè)結(jié)果的優(yōu)化匹配,最終挖掘出信息數(shù)據(jù)中的潛在價(jià)值。
3.檔案用戶行為大數(shù)據(jù)分析的目的。在海量無用數(shù)據(jù)中潛藏著不可估量的使用價(jià)值,通過對(duì)數(shù)據(jù)持有人歷史數(shù)據(jù)的分析,能夠有效地預(yù)測(cè)出行為人后期動(dòng)作,具體表現(xiàn)在行為人的行動(dòng)軌跡、行為軌跡,甚至是思維軌跡等多個(gè)方面。其中,檔案管理機(jī)構(gòu)在利用大數(shù)據(jù)技術(shù)的情況下,就可以對(duì)不同種類行為軌跡本質(zhì)進(jìn)行深入探究,可以與檔案用戶行為參考數(shù)據(jù)進(jìn)行串聯(lián),進(jìn)而對(duì)在線用戶展開全方位剖析,為其提供最佳解決方案,以保證為用戶提供更優(yōu)質(zhì)的服務(wù)并留住用戶[2]27-31。與此同時(shí),對(duì)檔案用戶行為進(jìn)行大數(shù)據(jù)分析還可以有效地增強(qiáng)數(shù)據(jù)分析的能力,為業(yè)務(wù)活動(dòng)開展提供保障,另外,還能夠?qū)崿F(xiàn)與用戶的智能互動(dòng),有效地增強(qiáng)了信息的匹配概率。
大數(shù)據(jù)的根源就是數(shù)據(jù)源,也被稱之為Data Source。通常情況下,用戶行為數(shù)據(jù)這一大數(shù)據(jù)來源并不被關(guān)注,然而其作用卻是最重要的,價(jià)值極高。具體表現(xiàn)在,用戶行為數(shù)據(jù)豐富度明顯,集成機(jī)制會(huì)對(duì)大數(shù)據(jù)技術(shù)未來的發(fā)展帶來積極的作用[3]17-20?,F(xiàn)階段,高校檔案管理機(jī)構(gòu)的用戶行為數(shù)據(jù)信息積累量極大,因而在檔案用戶行為分析工作中已經(jīng)具備極為堅(jiān)實(shí)的資源基礎(chǔ)。但是,為了能夠?qū)崿F(xiàn)原創(chuàng)數(shù)據(jù)向增值數(shù)據(jù)的有效轉(zhuǎn)換,仍然要具備以下三種基本技術(shù)作為有力支撐。
第一,檔案用戶行為原創(chuàng)數(shù)據(jù)資源庫的創(chuàng)建;第二,檔案用戶行為增值數(shù)據(jù)集成模塊的創(chuàng)建;第三,檔案用戶行為增值數(shù)據(jù)匹配服務(wù)平臺(tái)的創(chuàng)建。但是,值得注意的是,通過上述三種技術(shù)支撐條件,找到最佳檔案用戶行為原創(chuàng)數(shù)據(jù)源,一定要采取Data Scrubbing方式,也就是清洗處理,有效地選擇優(yōu)質(zhì)的數(shù)據(jù)資源[4]39-43。與此同時(shí),將增值數(shù)據(jù)信息輸送至匹配服務(wù)平臺(tái)內(nèi)的問題也成為大數(shù)據(jù)環(huán)境下檔案用戶行為分析需要解決的問題。經(jīng)過實(shí)踐考察發(fā)現(xiàn),檔案用戶行為數(shù)據(jù)源凝練集成機(jī)制的創(chuàng)建,最重要的就是要針對(duì)關(guān)鍵影響因素展開技術(shù)分析。
1.基于時(shí)間維度的檔案用戶行為軌跡分析。充分結(jié)合營銷學(xué)理論內(nèi)容,同時(shí)深入研究了檔案用戶的行為軌跡,最終將其劃分成了五個(gè)階段:需求的產(chǎn)生;對(duì)信息數(shù)據(jù)的有效收集;方案的合理選擇使用;作出需求決策;后續(xù)的行為。根據(jù)上述研究,同樣可以對(duì)最后一個(gè)階段進(jìn)行細(xì)化,即用戶的使用習(xí)慣以及滿意程度等。而檔案用戶的行為軌跡時(shí)間記錄,則能夠?qū)ζ鋵?shí)際需求進(jìn)行更加合理的預(yù)判,由此可見,增值數(shù)據(jù)的開發(fā)與利用具有不可替代的作用。
2.基于空間維度的檔案用戶行為影響要素分析。通過對(duì)5W2H分析方法的合理運(yùn)用,可以把檔案網(wǎng)站所發(fā)生的用戶行為細(xì)化成七個(gè)要素。通過對(duì)上述要素的相關(guān)分析,不僅能夠獲取用戶所訪問的檔案網(wǎng)站時(shí)間與地點(diǎn),包括瀏覽的內(nèi)容與頁面停留時(shí)間等十分零散的信息內(nèi)容,還能夠?qū)唧w用戶行為進(jìn)行全面整理并提煉定義[5]27-28。除此之外,通過5W2H分析方法還能夠深入地挖掘出所需解答問題。
3.基于質(zhì)量維度的檔案用戶行為數(shù)據(jù)使用價(jià)值分析。靜態(tài)數(shù)據(jù)與動(dòng)態(tài)數(shù)據(jù)是檔案用戶行為數(shù)據(jù)的重要組成類型。其中,靜態(tài)數(shù)據(jù)所涵蓋的具體內(nèi)容有用戶姓名與年齡,另外還包括所從事工作與興趣愛好等內(nèi)容。這種大數(shù)據(jù)信息內(nèi)容,通常是檔案管理機(jī)構(gòu)在開展日常服務(wù)過程中所形成的,可以表現(xiàn)為檔案網(wǎng)絡(luò)管理系統(tǒng)要求用戶必須注冊(cè)ID,進(jìn)而構(gòu)成用戶身份的唯一性。在此過程中,用戶所填寫的注冊(cè)資料對(duì)于數(shù)據(jù)價(jià)值的分析以及評(píng)判都發(fā)揮著關(guān)鍵性的不可替代的作用。所謂的動(dòng)態(tài)數(shù)據(jù)則是在檔案管理機(jī)構(gòu)內(nèi)部,將用戶行為作為重點(diǎn)對(duì)象而自動(dòng)獲取的信息內(nèi)容。而這種類型的大數(shù)據(jù)信息,具體內(nèi)容涉及用戶檢索的相關(guān)內(nèi)容、瀏覽的網(wǎng)頁以及下載等行為所產(chǎn)生的操作數(shù)據(jù)等。而檔案管理機(jī)構(gòu)在對(duì)用戶靜態(tài)與動(dòng)態(tài)數(shù)據(jù)進(jìn)行獲取以后,不僅能夠?qū)τ脩粜袨榈囊?guī)律進(jìn)行了解與掌握,同時(shí),還能夠?qū)?shù)據(jù)信息所具備的使用價(jià)值分析及評(píng)判提供有價(jià)值的參考依據(jù)[6]103-107。
4.基于來源維度的檔案用戶行為數(shù)據(jù)結(jié)構(gòu)優(yōu)化方案分析。檔案用戶行為數(shù)據(jù)可以細(xì)化成內(nèi)部數(shù)據(jù)與外部數(shù)據(jù)兩種類型。通常來講,企業(yè)的內(nèi)部數(shù)據(jù)是大數(shù)據(jù)根本來源,而外部數(shù)據(jù)卻被嚴(yán)重忽視。現(xiàn)階段,對(duì)于高校檔案管理機(jī)構(gòu)而言,同樣也成為其需要解決的問題。另外,仍然需要對(duì)這種類型數(shù)據(jù)信息所潛藏的價(jià)值進(jìn)行深入開發(fā)。而外部傳統(tǒng)互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng),甚至是SNS社交網(wǎng)等隨之都能夠生成海量UGC公共數(shù)據(jù),但是當(dāng)前高校檔案管理機(jī)構(gòu)在人力與物力方面是無法全部顧及的。針對(duì)這種情況,不僅要對(duì)人力與物力條件進(jìn)行改變,同樣也必須要全面優(yōu)化數(shù)據(jù)源結(jié)構(gòu),致力于增值數(shù)據(jù)集成機(jī)制的遴選方案。而高校檔案部門用戶行為數(shù)據(jù)通常分布于各種數(shù)據(jù)庫、文件服務(wù)器以及數(shù)據(jù)存儲(chǔ)器當(dāng)中,所以對(duì)于所收集到的不同結(jié)構(gòu)類型數(shù)據(jù)都能夠展開有效梳理與歸納,最終形成結(jié)構(gòu)化的數(shù)據(jù)或是半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)[7]68-71。基于此,通過對(duì)數(shù)據(jù)價(jià)值的特性分析,將不同結(jié)構(gòu)類型數(shù)據(jù)信息細(xì)化成專屬、獨(dú)特與一般等多種層次的價(jià)值屬性,并實(shí)現(xiàn)數(shù)據(jù)信息的結(jié)構(gòu)全面優(yōu)化。需要注意的是,應(yīng)當(dāng)充分考慮裝備以及技術(shù)條件,以保證所選擇的存儲(chǔ)模式更理想,為后期開發(fā)與利用提供有力保障。
綜上所述,現(xiàn)階段數(shù)據(jù)科學(xué)作為一種新興學(xué)科與領(lǐng)域?qū)崿F(xiàn)了快速發(fā)展,而對(duì)數(shù)據(jù)的充分利用與深入理解,合理分析并應(yīng)用則成為未來競爭的關(guān)鍵。在這種形勢(shì)之下,高校檔案管理機(jī)構(gòu)一定要重視檔案用戶行為數(shù)據(jù)的作用,對(duì)大數(shù)據(jù)技術(shù)的發(fā)展動(dòng)態(tài)予以實(shí)時(shí)關(guān)注,深入研究并靈活應(yīng)用,進(jìn)一步推動(dòng)大數(shù)據(jù)環(huán)境下檔案用戶行為分析,同時(shí)促進(jìn)檔案用戶行為大數(shù)據(jù)分析技術(shù)的發(fā)展與升級(jí),使其更具精細(xì)化與智能化的特點(diǎn)。只有這樣,才能為高校檔案的增值服務(wù)提供保障,并且不斷滿足社會(huì)發(fā)展的具體需求。通過上述對(duì)高校檔案用戶行為分析問題的探討,希望為大數(shù)據(jù)技術(shù)的推廣應(yīng)用提供有價(jià)值的參考依據(jù)。
[1]張倩.高校檔案用戶行為大數(shù)據(jù)分析技術(shù)應(yīng)用研究[J].檔案與建設(shè),2014(8).
[2]張倩.“大數(shù)據(jù)”技術(shù)在高校檔案信息服務(wù)中應(yīng)用探索[J].檔案與建設(shè),2014(3).
[3]田偉,韓海濤.大數(shù)據(jù)時(shí)代檔案館服務(wù)創(chuàng)新研究:基于天津高校檔案數(shù)據(jù)變化[J].檔案與建設(shè),2016(3).
[4]張倩.高校檔案物聯(lián)網(wǎng)大數(shù)據(jù)處理平臺(tái)的構(gòu)建方案研究[J].檔案與建設(shè),2016(2).
[5]周才云,趙晶晶.大數(shù)據(jù)時(shí)代高校檔案的信息化建設(shè)探析[J].蘭臺(tái)世界,2015(11).
[6]謝怡.基于大數(shù)據(jù)的高校檔案管理模式變革[J].山東理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2015,31(6).
[7]周美蘭.大數(shù)據(jù)時(shí)代高校檔案資源體系建設(shè)的思考[J].山西檔案,2015(1).
黃海鏗,中學(xué)高級(jí)教師,本科,研究方向?yàn)闄n案管理。
10.16565/j.cnki.1006-7744.2017.10.16
G273.5
A
2016-11-15