• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      大數(shù)據(jù)環(huán)境下高校圖書館個性化信息服務系統(tǒng)研究

      2014-02-28 14:45:26欒旭倫
      圖書館學刊 2014年8期
      關(guān)鍵詞:數(shù)據(jù)挖掘個性化圖書館

      欒旭倫

      (淮陰師范學院圖書館,江蘇 淮安 223300)

      大數(shù)據(jù)環(huán)境下高校圖書館個性化信息服務系統(tǒng)研究

      欒旭倫

      (淮陰師范學院圖書館,江蘇 淮安 223300)

      針對當前高校圖書館個性化信息服務的不足,分析了大數(shù)據(jù)環(huán)境下高校圖書館建立個性化信息服務系統(tǒng)的可行性,構(gòu)建了高校圖書館個性化信息服務系統(tǒng)模型,并對模型的功能進行了闡述。

      大數(shù)據(jù)環(huán)境 個性化信息服務 數(shù)據(jù)挖掘 高校圖書館

      近年來,國內(nèi)高校圖書館致力于個性化信息服務的開展,作為信息定向明確、服務針對性強、使用便捷的一種新興服務模式,它的深入推廣受到了高校師生的廣泛好評。隨著個性化信息服務的大范圍推廣,如何根據(jù)用戶不斷變化的信息需求情境,實時調(diào)整信息服務策略,更好地體現(xiàn)信息服務的“個性化”特征成為個性化信息服務發(fā)展亟待解決的問題。

      1 個性化信息服務的發(fā)展瓶頸

      感知用戶真實的信息需求情境是開展個性化信息服務的前提。目前,在個性化信息服務過程中,各高校圖書館通行的做法是通過問卷調(diào)查、網(wǎng)絡訪談、電話咨詢等途徑事前獲知用戶的信息需求,通過對獲得的用戶需求信息進行分析,進而由學科館員或參考館員針對相應的信息需求開展獨具特色的相關(guān)服務。受用戶不斷變化的信息需求等因素的制約,傳統(tǒng)的個性化信息服務模式存在明顯不足。

      1.1 無從感知用戶真實的信息情境

      傳統(tǒng)的個性化信息服務模式在獲取用戶信息需求時大都以問卷調(diào)查或訪談為主,這些傳統(tǒng)的信息需求獲取模式受問卷調(diào)查表設計缺陷、用戶表達不清、擔憂網(wǎng)絡訪談泄露自身隱私等因素的限制,使得高校圖書館獲取的用戶信息需求往往存在一定偏差,在不真實的信息需求基礎上開展個性化信息服務勢必難以取得理想的效果[1]。

      1.2 服務針對性有所缺失

      高校圖書館的服務對象主要是在校師生。受師生的教學進度、研究任務不斷變化等相關(guān)因素的影響,個性化信息要取得良好的使用效益,必須及時根據(jù)用戶不斷變化的信息需求情境實時調(diào)整服務策略。然而受時間局限性、頻繁溝通的不便等各種因素的制約,日常服務中,師生往往無法做到或不愿向圖書館員來反映自己已經(jīng)變化了的信息需求,因無從實時感知用戶變化了的信息需求,導致高校圖書館所提供的個性化信息服務與用戶的信息需求存在嚴重脫節(jié),服務針對性較差。

      1.3 個性化信息服務遭遇用戶流失危機

      互聯(lián)網(wǎng)環(huán)境下成長起來的“90后”大學生,自身掌握了豐富的互聯(lián)網(wǎng)使用經(jīng)驗,他們對圖書館的依賴性有所降低,受圖書館信息服務針對性不強、信息使用不便等因素影響,當有信息需求時他們首先想到的是百度、谷歌、SNS、互聯(lián)網(wǎng)好友圈等途徑而非求助圖書館[2]。一方面,高校圖書館掌握了豐富的館藏資源,希望通過個性化信息服務方式為資源找到使用者;另一方面,個性化信息服務針對性不強,用戶大量流失。提高個性化信息服務針對性,強化用戶使用體驗滿意度,成為高校圖書館個性化信息服務過程中必須解決的難題。

      2 大數(shù)據(jù)環(huán)境下高校圖書館建立個性化信息服務系統(tǒng)的可行性

      2.1 豐富的數(shù)據(jù)來源

      高校圖書館作為全校的信息資源中心,積累了海量的用戶行為數(shù)據(jù),如用戶查詢書目產(chǎn)生的OPAC日志,用戶借還書所產(chǎn)生的借閱信息,用戶瀏覽、下載電子資源所產(chǎn)生的電子數(shù)據(jù)庫使用痕跡,用戶使用學科化信息服務中與學科館員的互動信息,用戶在圖書館微博中留下的評語,用戶訪問圖書館論壇停留時間等。這些海量數(shù)據(jù)從側(cè)面真實地反映了用戶變化著的信息情境,通過對這些海量數(shù)據(jù)進行有針對性的挖掘、分析,可真實反映用戶當下的信息情境,進而為圖書館開展個性化信息服務提供決策參考。

      2.2 較易識別的目標群體

      開展個性化信息服務,需實時跟蹤用戶不斷變化的信息行為,分析用戶的信息需求,進而實現(xiàn)精準定位的信息推送。獲取用戶的信息需求離不開實時的Web數(shù)據(jù)挖掘,而Web數(shù)據(jù)挖掘的難題之一是目標用戶的身份識別。對高校圖書館個性化信息服務系統(tǒng)而言,目標群體具有明顯的區(qū)分度,較易識別。受經(jīng)費、版權(quán)等因素的制約,目前高校圖書館的服務對象主要是在校師生,師生使用圖書館資源時,其信息均已在圖書館注冊過,通過對師生的信息記錄進行相應的識別,即可準確定位目標群體。此外,高校師生在校園內(nèi)訪問網(wǎng)絡資源時,其電腦IP地址大都已經(jīng)在校園網(wǎng)網(wǎng)絡中心注冊過,通過客戶端的用戶名及密碼,可輕松實現(xiàn)目標用戶的精準識別。

      2.3 用戶信息需求的實時感知

      用戶的信息需求可以通過其相關(guān)的信息行為體現(xiàn)出來。對高校師生而言,當他們在教學、科研或?qū)W習方面有信息需求時,大都會通過圖書館或互聯(lián)網(wǎng)等途徑進行自我服務。在自我服務過程中,后臺服務器能如實記錄用戶的信息行為數(shù)據(jù),通過對這些數(shù)據(jù)的深入挖掘,用戶實時的信息需求顯露無疑。

      3 個性化信息服務系統(tǒng)的構(gòu)建

      3.1 系統(tǒng)構(gòu)建目標

      大數(shù)據(jù)環(huán)境下構(gòu)建高校圖書館個性化信息服務系統(tǒng),其最終目的是通過對互聯(lián)網(wǎng)上用戶使用日志、會話信息、評論信息、搜索查詢記錄、圖書館使用記錄等進行深入挖掘,實時感知用戶變化著的信息需求,進而針對用戶的真實信息情境開展有針對性的個性化信息服務?;谙到y(tǒng)的構(gòu)建目的,系統(tǒng)的構(gòu)建目標為:在圖書館已有的信息服務平臺及服務模式的基礎上,整合來自不同數(shù)據(jù)倉庫中的相關(guān)記錄,通過Web數(shù)據(jù)挖掘,感知用戶實時的信息需求,并基于此開展有針對性的個性化信息服務。

      3.2 高校圖書館個性化信息服務系統(tǒng)模型[3]

      通過對用戶行為數(shù)據(jù)的實時跟蹤,獲取用戶的信息需求,涉及數(shù)據(jù)集合、數(shù)據(jù)規(guī)范化、信息分析、信息推送等功能。大數(shù)據(jù)環(huán)境下高校圖書館個性化信息服務系統(tǒng)應包含數(shù)據(jù)集成模塊、數(shù)據(jù)規(guī)范化處理模塊、信息分析模塊(含結(jié)構(gòu)化數(shù)據(jù)分析模塊、互聯(lián)網(wǎng)日志分析模塊、移動終端位置判定模塊)、信息匹配模塊、信息推送模塊、用戶使用評價模塊。系統(tǒng)模型如圖1。

      3.3 高校圖書館個性化信息服務系統(tǒng)模塊功能[4]

      3.3.1 數(shù)據(jù)集成模塊

      高校師生的信息行為數(shù)據(jù)分散地存儲在圖書館不同的自動化系統(tǒng)中,數(shù)據(jù)集成模塊用于將圖書館信息系統(tǒng)相關(guān)記錄、學科化信息服務平臺信息、電子資源使用記錄、網(wǎng)絡日志等多個數(shù)據(jù)源中的相關(guān)數(shù)據(jù)進行鏈接,將不同來源、不同格式、不同記錄結(jié)構(gòu)、不同含義特點的數(shù)據(jù)記錄在邏輯上進行有機集中,為數(shù)據(jù)規(guī)范化處理做好準備工作。

      3.3.2 數(shù)據(jù)規(guī)范化處理模塊

      數(shù)據(jù)規(guī)范化處理模塊用于對集成后數(shù)據(jù)進行規(guī)范化處理,以使數(shù)據(jù)符合數(shù)據(jù)挖掘相關(guān)算法的需要。數(shù)據(jù)規(guī)范化處理工作流程如圖2所示。

      圖2 數(shù)據(jù)規(guī)范化處理模塊流程

      合成記錄。圖書館所使用的自動化系統(tǒng)由不同的軟件開發(fā)商提供,因彼此之間缺乏溝通協(xié)調(diào),各服務供應商的系統(tǒng)數(shù)據(jù)庫中的數(shù)據(jù)字段其格式及含義各不相同,要對用戶的信息行為進行挖掘,必須選取唯一標識用戶的數(shù)據(jù)字段對來自不同系統(tǒng)的用戶行為數(shù)據(jù)進行有機集合。對高校師生而言,他們使用圖書館的資源,須通過先前辦理的圖書借閱證,因讀者編號具有唯一性,可以將讀者編號作為連接用戶存貯在不同數(shù)據(jù)庫中的相關(guān)記錄的連接標識符。

      數(shù)據(jù)規(guī)約。不同數(shù)據(jù)庫或網(wǎng)絡日志中的信息記錄具有不同的標識及記錄方法,比如讀者信息庫中的性別記錄可能為“男”或“女”;而校園網(wǎng)信息中心用戶網(wǎng)絡日志中的信息記錄可能為“Male”或“Female”,而實際他們具有相同的含義,數(shù)據(jù)規(guī)約功能用來對具有不同屬性名但含義相同的數(shù)據(jù)進行規(guī)范化處理,以達到降低數(shù)據(jù)歧義,提高數(shù)據(jù)分析準確性的目的。

      數(shù)據(jù)清理。經(jīng)合成記錄模塊、數(shù)據(jù)規(guī)約模塊處理后,同一用戶在不同數(shù)據(jù)庫中的記錄被集中到了同一字段,這些字段值中有的是重復記錄的,需要保留一個屬性值,剔除重復屬性值;有的部分數(shù)據(jù)不全,對于遺漏的數(shù)據(jù)信息,需要進行補充;有的數(shù)據(jù)有誤,需要進行更正;有的部分數(shù)值為實數(shù)值需要進行離散化處理。數(shù)據(jù)清理模塊主要用于清除噪聲數(shù)據(jù)、污染數(shù)據(jù)、錯誤數(shù)據(jù)及不一致數(shù)據(jù)。

      數(shù)據(jù)變換。不同的數(shù)據(jù)分析及數(shù)據(jù)挖掘算法對數(shù)據(jù)具有不同的要求,數(shù)據(jù)變換模塊主要通過平滑聚集、數(shù)據(jù)概化等方式將數(shù)據(jù)轉(zhuǎn)換成適合數(shù)據(jù)挖掘算法要求的數(shù)據(jù)形式。

      3.3.3 信息分析模塊

      高校師生有信息需求時,多通過3種途徑加以解決。一是通過圖書館提供的相應服務;二是通過互聯(lián)網(wǎng)搜索引擎進行信息搜索;三是通過移動互聯(lián)網(wǎng)求助社交網(wǎng)。對于用戶的這幾種信息資源利用方式,分別對應產(chǎn)生了結(jié)構(gòu)化信息、半結(jié)構(gòu)化信息和非結(jié)構(gòu)化信息。用戶使用圖書館信息服務時,圖書館大都通過一定的技術(shù)手段對用戶的咨詢內(nèi)容、服務反饋等進行了如實記載,這些記錄大都以規(guī)范的表格存儲在相應的數(shù)據(jù)倉庫中,屬于結(jié)構(gòu)化數(shù)據(jù)分析模塊處理范疇;用戶利用互聯(lián)網(wǎng)進行信息搜索時,會在服務器日志文件中留下使用痕跡,對用戶的網(wǎng)絡信息行為進行相關(guān)分析屬于互聯(lián)網(wǎng)日志分析模塊功能范疇;用戶使用移動互聯(lián)網(wǎng),利用虛擬人際關(guān)系進行信息求助時,其核心節(jié)點是人,而非網(wǎng)頁,因此對于移動互聯(lián)網(wǎng)日志我們需要采取特殊的信息分析策略來進行有效分析。

      ①結(jié)構(gòu)化信息分析模塊。結(jié)構(gòu)化信息具有固定與規(guī)范的數(shù)據(jù)格式,該模塊主要對數(shù)據(jù)聚合、數(shù)據(jù)規(guī)范化處理后的數(shù)據(jù)進行數(shù)據(jù)挖掘操作,對數(shù)據(jù)挖掘后的相關(guān)數(shù)據(jù)進行聚類與分類處理,根據(jù)用戶的信息行為,將用戶細分為不同的數(shù)據(jù)粒度,以識別不同用戶之間相似的信息行為及相同用戶在不同時間段差異性的信息需求行為。

      ②互聯(lián)網(wǎng)日志分析模塊?;ヂ?lián)網(wǎng)日志如實地記錄了用戶對Web服務器的訪問情況,通過對這些數(shù)據(jù)進行分析,可以快速、準確獲知用戶當前的信息需求。互聯(lián)網(wǎng)日志分析模塊分3個工作步驟。

      圖1 大數(shù)據(jù)環(huán)境下高校圖書館個性化信息服務系統(tǒng)模型

      圖3 互聯(lián)網(wǎng)日志分析模塊流程

      數(shù)據(jù)處理模塊主要用于對相關(guān)數(shù)據(jù)進行凈化處理,識別用戶身份,刪除不必要信息以達到縮減數(shù)據(jù)規(guī)模、降低系統(tǒng)響應時延的目的。經(jīng)數(shù)據(jù)處理模塊對數(shù)據(jù)處理后,可形成如下用戶訪問日志(見表1)。

      表1 用戶訪問日志

      在進行互聯(lián)網(wǎng)信息訪問時,用戶有可能不通過網(wǎng)頁上的鏈接功能進行頁面訪問,而是通過瀏覽器的后退功能直接調(diào)用緩存在計算機中的歷史記錄來進行訪問。路徑補充模塊用于識別用戶當前頁面信息的原始來源,補充缺失的用戶訪問路徑。

      網(wǎng)頁的訪問頻率及停留時間對于判定用戶的信息需求具有重要意義。如果用戶頻繁地訪問某一頁面或在某一頁面上停留了較長時間,則可以認為該頁面是用戶信息需求的一個集中反映。訪問統(tǒng)計模塊用于對用戶在不同時間段訪問的相關(guān)頁面進行頻次統(tǒng)計,填寫用戶訪問日志表中的“訪問頻次字段”,為用戶信息需求判斷提供決策參考。

      ③移動信息分析模塊。隨著智能手機終端、IPAD等各種移動設備的普及,高校師生通過移動終端獲取信息資源已成常態(tài),為改進服務方式,高校圖書館適時推出了微博、微信、掌上圖書館等服務模式,對這些服務模式中所積累的用戶信息進行挖掘,對于個性化信息服務的開展具有重要意義。移動信息分析模塊用于對用戶的移動互聯(lián)網(wǎng)瀏覽信息進行挖掘,以獲取用戶的地理位置、興趣點等信息行為特征,根據(jù)用戶的興趣點實現(xiàn)信息資源與用戶移動終端的精確匹配。

      3.3.4 信息匹配模塊

      獲知用戶的實時信息需求后,高校圖書館工作人員在信息匹配模塊針對用戶不同的信息需求,利用館藏資源及互聯(lián)網(wǎng)信息資源制定不同的信息服務策略,滿足用戶的個性化信息需求。

      3.3.5 信息推送模塊

      信息推送模塊用于對不同的用戶進行有針對性的信息推送。系統(tǒng)提供3種信息推送模式,一是用戶借閱相關(guān)書籍或使用電子資源時自動給用戶推薦數(shù)據(jù)挖掘中發(fā)現(xiàn)的其他用戶的信息選擇結(jié)果,有針對性地推薦用戶尚未發(fā)現(xiàn)的信息資源;二是當用戶使用圖書館微博、微信、學科服務時,第一時間根據(jù)數(shù)據(jù)分析的結(jié)果,向用戶進行相關(guān)信息推薦提示;三是根據(jù)用戶的移動終端位置及終端類型,及時向用戶推送其訂閱的相關(guān)信息。

      3.3.6 用戶使用評價模塊

      通過大量的數(shù)據(jù)挖掘與分析,個性化信息服務系統(tǒng)發(fā)現(xiàn)了用戶的行為意圖,并向用戶推送了相關(guān)信息。為提高個性化信息服務的針對性,提高系統(tǒng)服務的精準度,用戶在接收相關(guān)信息時,可以通過用戶使用評價模塊直接對接收的信息進行評價,系統(tǒng)自動將用戶的評價信息存入后臺的個性化信息服務庫。個性化信息服務庫中的信息積累可以為日后高校圖書館工作人員修正數(shù)據(jù)挖掘算法提供參考,以改進個性化信息服務系統(tǒng)的服務效果。

      4 個性化信息服務系統(tǒng)深入應用思考

      4.1 用戶隱私權(quán)可能受損

      個性化信息服務系統(tǒng)通過對用戶信息行為數(shù)據(jù)的集成、分析、聚類、分類等相應處理,發(fā)現(xiàn)數(shù)據(jù)之間隱藏著的用戶信息特質(zhì),為更好地獲取用戶信息需求,用戶信息行為痕跡被系統(tǒng)實時地監(jiān)控,無形中增加了用戶隱私權(quán)受威脅和侵犯的概率。為保障用戶的隱私權(quán),在進行用戶信息行為數(shù)據(jù)分析前必須征得用戶本人的同意,同時在數(shù)據(jù)分析前必須對涉及用戶隱私的相關(guān)數(shù)據(jù)進行相應的數(shù)據(jù)清洗操作,刪除與個性化信息服務無關(guān)的數(shù)據(jù),最大程度上避免用戶的隱私權(quán)受損[5]。

      4.2 數(shù)據(jù)來源的限制

      只有當用戶的信息行為數(shù)據(jù)達到一定的存儲規(guī)模并具有一定的數(shù)據(jù)耦合度時,才能通過個性化信息分析系統(tǒng)來進行數(shù)據(jù)的深度挖掘與分析,得到具有較高價值的用戶信息需求特征。個性化信息服務系統(tǒng)的數(shù)據(jù)來源大部分局限于校園內(nèi),對于用戶在校園外的信息行為數(shù)據(jù),必須通過與電信服務運營商和移動服務提供商進行溝通協(xié)調(diào)方能獲得。數(shù)據(jù)來源的局限性,在一定程度上降低了用戶信息行為特征識別的精準度。

      [1]吳新年,陳永平.關(guān)于學科化信息服務的思考與建議[J].情報科學,2007(12):1834.

      [2]艾春艷,游越,劉素清.讀者參與的高校圖書館學科服務新模式探討[J].大學圖書館學報,2011(5):70.

      [3]李善青,趙輝,宋立榮.基于大數(shù)據(jù)挖掘的科技項目查重模型研究[J].圖書館論壇,2014(2):81.

      [4]譚磊.大數(shù)據(jù)挖掘[M].北京:電子工業(yè)出版社,2014.

      [5]馬曉亭.大數(shù)據(jù)時代圖書館個性化服務讀者隱私保護研究[J].圖書館論壇,2014(2):85-87.

      欒旭倫男,1982年生,館員。

      G252

      2014-04-24;責編:王天泥。)

      猜你喜歡
      數(shù)據(jù)挖掘個性化圖書館
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      堅持個性化的寫作
      文苑(2020年4期)2020-05-30 12:35:12
      新聞的個性化寫作
      新聞傳播(2018年12期)2018-09-19 06:27:10
      圖書館
      小太陽畫報(2018年1期)2018-05-14 17:19:25
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
      電力與能源(2017年6期)2017-05-14 06:19:37
      上汽大通:C2B個性化定制未來
      飛躍圖書館
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
      滿足群眾的個性化需求
      去圖書館
      泰顺县| 新乡市| 清徐县| 罗江县| 汤原县| 积石山| 青浦区| 桂林市| 特克斯县| 鹤岗市| 道孚县| 北京市| 宁化县| 华容县| 奉节县| 静海县| 黔江区| 荥经县| 沿河| 清河县| 开鲁县| 汝州市| 张家界市| 肇庆市| 濮阳市| 通州市| 遂昌县| 屯留县| 馆陶县| 平定县| 昌黎县| 屯门区| 偃师市| 富裕县| 诸城市| 遂昌县| 托里县| 聂拉木县| 阳朔县| 临城县| 同江市|