• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于“用戶畫像”的圖書館資源推薦模式設(shè)計(jì)與分析

      2018-03-14 05:46:40趙發(fā)珍
      現(xiàn)代情報(bào) 2018年3期
      關(guān)鍵詞:用戶畫像畫像標(biāo)簽

      王 慶 趙發(fā)珍

      (1.西北工業(yè)大學(xué)圖書館,陜西 西安 710072;2.蘭州大學(xué)圖書館,甘肅 蘭州 730000)

      隨著大數(shù)據(jù)技術(shù)的應(yīng)用及用戶需求的多元化,圖書館轉(zhuǎn)型升級(jí)勢(shì)在必行。在轉(zhuǎn)型發(fā)展過(guò)程中圖書館開始重視通過(guò)用戶及資源大數(shù)據(jù)分析,了解用戶需求并利用新型智能技術(shù)來(lái)創(chuàng)新服務(wù)模式,以滿足用戶多元個(gè)性的需求從而提升圖書館的價(jià)值。在圖書館用戶需求感知方面,傳統(tǒng)的用戶需求以調(diào)研為主,主要了解用戶需要什么?什么時(shí)候?什么方式?以分析小體量結(jié)構(gòu)化數(shù)據(jù),甚至在經(jīng)驗(yàn)直覺(jué)的基礎(chǔ)上分析用戶需求。隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,用戶信息行為軌跡及相應(yīng)數(shù)據(jù)越發(fā)全面并且更易獲取,對(duì)用戶信息行為數(shù)據(jù)的分析能夠更加準(zhǔn)確掌握用戶的需求偏好進(jìn)而實(shí)現(xiàn)個(gè)性化服務(wù)提供了可能。同時(shí)隨著圖書館館藏資源的增加,尤其是數(shù)字資源的增加,使得用戶尋找自己感興趣的資源越發(fā)困難,圖書館也無(wú)法準(zhǔn)確、及時(shí)的將海量資源推送給有需求的讀者,用戶畫像作為大數(shù)據(jù)時(shí)代實(shí)現(xiàn)精準(zhǔn)營(yíng)銷及服務(wù)的應(yīng)用方法之一,為館藏資源推薦提供了新思路。用戶畫像已成為當(dāng)前的一個(gè)熱門話題,且被廣泛應(yīng)用于計(jì)算機(jī)領(lǐng)域和電子商務(wù)領(lǐng)域。對(duì)用戶與圖書館相關(guān)的門戶平臺(tái)、系統(tǒng)等交互產(chǎn)生的信息進(jìn)行深度挖掘,通過(guò)構(gòu)建圖書館用戶畫像預(yù)測(cè)用戶的資源興趣偏好,并提供精準(zhǔn)的資源推薦服務(wù)是解決資源利用率的重要途徑。本文通過(guò)借鑒計(jì)算機(jī)領(lǐng)域和電子商務(wù)領(lǐng)域的應(yīng)用實(shí)踐,引入用戶畫像來(lái)了解圖書館用戶的資源偏好及需求,并構(gòu)建用戶畫像模型以重塑圖書館資源服務(wù)模式,實(shí)現(xiàn)更加精準(zhǔn)的資源服務(wù)內(nèi)容。

      1 用戶畫像概述

      “用戶畫像”有兩種概念,一種是由交互設(shè)計(jì)之父Alan Cooper最早提出的用戶畫像(User Persona)的概念(也叫用戶角色),即“Personas are a Concrete Representation of Target Users”。Persona是真實(shí)用戶的虛擬代表,是建立在一系列真實(shí)數(shù)據(jù)(Marketing Data,Usability Data)之上的目標(biāo)用戶模型[1]。它是通過(guò)調(diào)研問(wèn)卷、電話訪談等手段認(rèn)知及獲得用戶的定性特征,是描繪或者抽象用戶屬性差異的方法,這是早期用戶畫像構(gòu)建方法。另一種英文表達(dá)是“User Profile”,是在大數(shù)據(jù)環(huán)境下產(chǎn)生的,與數(shù)據(jù)挖掘、大數(shù)據(jù)分析相關(guān),通過(guò)數(shù)據(jù)建立描繪用戶的標(biāo)簽,具體而言通過(guò)分析消費(fèi)者社會(huì)屬性、生活習(xí)慣、消費(fèi)行為等信息而抽象出該消費(fèi)者需求偏好的一個(gè)標(biāo)簽化的過(guò)程。構(gòu)建用戶畫像的核心工作即是給用戶貼“標(biāo)簽”,而標(biāo)簽是通過(guò)對(duì)用戶信息行為分析而來(lái)的高度精煉的特征標(biāo)識(shí)。簡(jiǎn)而言之,用戶畫像為了讓團(tuán)隊(duì)成員在產(chǎn)品設(shè)計(jì)的過(guò)程中能夠拋開個(gè)人喜好,將焦點(diǎn)關(guān)注在目標(biāo)用戶的動(dòng)機(jī)和行為上進(jìn)行產(chǎn)品設(shè)計(jì)。用戶畫像將用戶的屬性、行為與期待聯(lián)結(jié)起來(lái)。本文所指的用戶畫像即為第二種“User Profile”。

      用戶畫像通過(guò)對(duì)用戶屬性和用戶行為數(shù)據(jù)挖掘、分析進(jìn)而提取用戶的興趣標(biāo)簽,了解用戶需求的過(guò)程。用戶畫像多用于個(gè)性化推薦服務(wù)、精準(zhǔn)營(yíng)銷及用戶拓展等方面,如企業(yè)進(jìn)行精準(zhǔn)營(yíng)銷如廣告投放、產(chǎn)品研發(fā)[2-3]、移動(dòng)用戶畫像構(gòu)建及個(gè)性化服務(wù)提供[4]。在信息內(nèi)容推送領(lǐng)域,Amazon通過(guò)用戶在網(wǎng)站上的瀏覽、購(gòu)買和評(píng)分等行為進(jìn)行用戶畫像。構(gòu)建用戶畫像多采用統(tǒng)計(jì)、貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)、主題模型、聚類分析等方法。Xu G等[5]提出通過(guò)數(shù)據(jù)統(tǒng)計(jì)的方法對(duì)用戶的瀏覽記錄和點(diǎn)擊情況進(jìn)行分析。王慶福[6]和張小可等[7]采用貝葉斯網(wǎng)絡(luò)構(gòu)建用戶興趣模型,從而刻畫用戶畫像。辛菊琴等[8]提出了基于產(chǎn)品特征建立用戶畫像,然后采用神經(jīng)網(wǎng)絡(luò)訓(xùn)練得到具體的用戶畫像模型。單曉紅等[9]以在線評(píng)論數(shù)據(jù)為基礎(chǔ),從用戶信息屬性、酒店信息屬性和用戶評(píng)價(jià)信息屬性三個(gè)維度構(gòu)建用戶畫像模型的概念模型,并采用Protégé工具建立本體來(lái)實(shí)現(xiàn)用戶畫像屬性之間的關(guān)聯(lián),完成對(duì)酒店用戶特征的完整刻畫。

      圖情領(lǐng)域用戶畫像相關(guān)研究成果較少,主要有:胡媛等[10]對(duì)數(shù)字圖書館用戶畫像進(jìn)行建模分析,在此基礎(chǔ)上構(gòu)建綜合服務(wù)能力評(píng)價(jià)指標(biāo)體系,為數(shù)字圖書館社區(qū)用戶描述提供了參考。劉速[11]以天津圖書館為例,從數(shù)據(jù)來(lái)源、數(shù)據(jù)采集、信息識(shí)別、模型搭建等方面就用戶畫像的構(gòu)建進(jìn)行詳細(xì)闡述,并提出可視化統(tǒng)計(jì)描述、多維度交叉分析、用戶關(guān)系圖譜等用戶畫像分析方法。汪強(qiáng)兵等[12]融合內(nèi)容與用戶行為的用戶畫像構(gòu)建系統(tǒng)能夠挖掘用戶在閱讀文獻(xiàn)時(shí)的興趣,并進(jìn)行用戶畫像構(gòu)建。陳慧香等[13]探討了國(guó)外圖書館領(lǐng)域用戶畫像的研究現(xiàn)狀,從定義與組成、算法與技術(shù)、模型構(gòu)建、實(shí)踐應(yīng)用等方面作了詳細(xì)的闡述。韓梅花[14]提出了在大數(shù)據(jù)背景下基于“用戶畫像”的抑郁癥閱讀療法新模式。

      2 圖書館資源推薦服務(wù)研究現(xiàn)狀

      圖書館根據(jù)讀者個(gè)性化需求開展具有針對(duì)性和主動(dòng)性的資源推薦服務(wù),是提升資源服務(wù)質(zhì)量及資源利用率的重要手段。目前圖書館資源推薦主要通過(guò)現(xiàn)場(chǎng)推薦及網(wǎng)絡(luò)推薦系統(tǒng)渠道進(jìn)行資源推薦。在圖書館資源網(wǎng)絡(luò)式推薦中相關(guān)的研究主要圍繞讀者個(gè)性化推薦模式及計(jì)算機(jī)領(lǐng)域信息推薦系統(tǒng)相關(guān)推薦方法的應(yīng)用、技術(shù)的改進(jìn)和完善等展開。邱均平等[15]研究了資源的協(xié)同推薦系統(tǒng),李默等[16]研究了圖書館學(xué)術(shù)資源推薦策略及系統(tǒng)架構(gòu),陳淑英等[17]從某高校圖書館圖書借閱管理系統(tǒng)抽取2011級(jí)1 200名本科生的4年圖書借閱日志數(shù)據(jù),利用多維屬性間關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘技術(shù),探索其圖書推薦服務(wù)策略,何勝等[18]提出一種以文獻(xiàn)“混合關(guān)聯(lián)”為主要內(nèi)容的圖書館文獻(xiàn)推薦方案及實(shí)現(xiàn)算法,并應(yīng)用Spark內(nèi)存計(jì)算技術(shù)設(shè)計(jì)實(shí)證案例,畢強(qiáng)等[19]運(yùn)用聚類分析、語(yǔ)義相似度計(jì)算、協(xié)同過(guò)濾推薦算法等方法,提出了基于領(lǐng)域本體的數(shù)字文獻(xiàn)資源聚合及服務(wù)推薦的方法和途徑,洪亮等[20]基于相似用戶有相似選擇的考慮,引入角色的概念模擬用戶興趣選擇,設(shè)計(jì)一種有效的WSSQ算法構(gòu)建用戶信任網(wǎng)絡(luò),由此給出改進(jìn)的情境感知推薦方法,并在擴(kuò)展的Epinion數(shù)據(jù)集上進(jìn)行仿真實(shí)驗(yàn)。袁輝[21]結(jié)合重慶大學(xué)智慧圖書館系統(tǒng),對(duì)用戶各類信息數(shù)據(jù)進(jìn)行挖掘分析,預(yù)測(cè)和標(biāo)定依賴事件發(fā)生進(jìn)程產(chǎn)生的各類文獻(xiàn)需求,可有效提高圖書推薦服務(wù)的準(zhǔn)確性。尹麗玲[22]提出一種新的融合內(nèi)容特征和非內(nèi)容特征以及用戶行為的推薦算法,以實(shí)現(xiàn)學(xué)術(shù)資源的優(yōu)質(zhì)推薦。

      縱觀學(xué)術(shù)界在圖書館資源推薦領(lǐng)域所開展的研究,其研究側(cè)重點(diǎn)主要從技術(shù)角度出發(fā),集中在將不同的算法和分布式平臺(tái)引入文獻(xiàn)推薦,以提高資源的準(zhǔn)確性和多樣性,但缺乏從用戶視角對(duì)其偏好、時(shí)間、情感、行為等個(gè)人因素的考慮,導(dǎo)致用戶細(xì)分不足、對(duì)用戶的信息行為特征分析不深、用戶的閱讀、研究偏好及相關(guān)需求不夠了解,推送內(nèi)容不夠精準(zhǔn)。同時(shí),圖書館現(xiàn)有的資源推薦方法及文獻(xiàn)服務(wù)過(guò)程中用戶難以從海量的資源中全面獲取到所需要的文獻(xiàn),面對(duì)海量的資源列表清單無(wú)所適從,通過(guò)逐個(gè)瀏覽資源庫(kù)費(fèi)時(shí)費(fèi)力且難以判斷自己真正需要的資源。李民等[23]通過(guò)對(duì)國(guó)內(nèi)116所“211工程”院校圖書館資源推薦系統(tǒng)進(jìn)行網(wǎng)站訪查和問(wèn)卷調(diào)查,其問(wèn)題主要表現(xiàn)在圖書館推薦系統(tǒng)個(gè)性化程度不高,過(guò)于依賴圖書管理集成系統(tǒng)所附帶的推薦功能,不夠系統(tǒng)化、智慧化;推薦系統(tǒng)滿意度有待提高。隨著大數(shù)據(jù)技術(shù)的發(fā)展完善及文獻(xiàn)服務(wù)水平的提高,圖書館需要分析在大數(shù)據(jù)環(huán)境下用戶資源的新需求,需要提出新的資源推薦設(shè)計(jì)方案。通過(guò)研究用戶閱讀行為、興趣偏好,發(fā)現(xiàn)用戶的群體特征及需求,能夠更好地為用戶定制資源,細(xì)化資源服務(wù),用戶畫像應(yīng)用而生。目前,基于“用戶畫像”的信息智能推送服務(wù)已經(jīng)廣泛應(yīng)用于豆瓣、亞馬遜、京東、淘寶、百度等電商和信息服務(wù)企業(yè),為用戶提供個(gè)性、精準(zhǔn)的物品相關(guān)信息推薦。圖書館應(yīng)該借鑒該領(lǐng)域的成功模式,將用戶畫像及智能推薦技術(shù)融合引入館藏資源的個(gè)性化推薦機(jī)制。

      綜上所述,用戶畫像的研究為刻畫用戶特征及分析需求,為圖書館的精準(zhǔn)營(yíng)銷、資源服務(wù)推薦、科學(xué)決策等提供應(yīng)用基礎(chǔ)。基于用戶畫像的用戶行為及需求分析與圖書館資源精準(zhǔn)推薦在本質(zhì)上相契合。隨著智慧圖書館及新一代圖書館管理系統(tǒng)的發(fā)展,用戶在實(shí)體圖書館及網(wǎng)絡(luò)虛擬資源及服務(wù)的利用過(guò)程中,其信息行為軌跡及其數(shù)據(jù)更易獲取。圖書館用戶畫像主要是基于真實(shí)積累的用戶信息行為結(jié)合具體的服務(wù)場(chǎng)景產(chǎn)生一系列標(biāo)簽,這些標(biāo)簽共同構(gòu)成了對(duì)于一個(gè)用戶的真實(shí)描述。用戶畫像在圖書館資源推薦中的應(yīng)用價(jià)值主要有:1)分析資源潛在讀者,進(jìn)行精準(zhǔn)推薦;2)對(duì)資源進(jìn)行個(gè)性化定制。讀者根據(jù)自己的專業(yè)背景、閱讀偏好定制相關(guān)資源,系統(tǒng)根據(jù)讀者定制情況分析資源側(cè)重點(diǎn)及偏向,從而為訂購(gòu)資源提供科學(xué)依據(jù);3)資源利用效果評(píng)估。根據(jù)用戶資源偏好,對(duì)該類讀者進(jìn)行資源推薦,通過(guò)可視化技術(shù)分析資源在某段時(shí)間內(nèi)的利用效果。因此,本文提出了“用戶畫像”與圖書館個(gè)性化推薦融合模式,為資源推薦服務(wù)提供新思路。

      3 圖書館用戶畫像模型構(gòu)建

      3.1 圖書館用戶畫像數(shù)據(jù)源

      構(gòu)建用戶畫像是為了還原用戶信息,因此數(shù)據(jù)來(lái)源于所有用戶相關(guān)的數(shù)據(jù)。圖書館用戶畫像數(shù)據(jù)通常處于多種服務(wù)系統(tǒng)中,在數(shù)據(jù)獲取時(shí)各系統(tǒng)間無(wú)關(guān)聯(lián),相對(duì)獨(dú)立,在構(gòu)建用戶畫像之前,首先要實(shí)現(xiàn)各系統(tǒng)之間數(shù)據(jù)的整合。圖書館用戶畫像首先根據(jù)用戶的基本信息及行為數(shù)據(jù)對(duì)用戶進(jìn)行初步“刻畫”,然后關(guān)聯(lián)用戶的動(dòng)態(tài)行為數(shù)據(jù)進(jìn)行畫像的完善即修正標(biāo)簽體系。用戶數(shù)據(jù)分為靜態(tài)數(shù)據(jù)(相對(duì)穩(wěn)定的用戶信息)及動(dòng)態(tài)數(shù)據(jù)(用戶不斷變化的行為信息)。用戶的基礎(chǔ)數(shù)據(jù)如年齡、學(xué)歷、研究領(lǐng)域等變化較慢,屬于靜態(tài)信息;動(dòng)態(tài)數(shù)據(jù)包括圖書館門戶、圖書管理系統(tǒng)、機(jī)構(gòu)知識(shí)庫(kù)、教務(wù)選課系統(tǒng)、移動(dòng)訪問(wèn)平臺(tái)(微博、微信、APP)等個(gè)人網(wǎng)絡(luò)行為數(shù)據(jù)、用戶互動(dòng)數(shù)據(jù)、與其他用戶數(shù)據(jù)等,如表1所示。數(shù)據(jù)采集主要通過(guò)利用用戶身份統(tǒng)一識(shí)別號(hào)ID(如讀者證號(hào))登錄圖書館門戶及識(shí)別用戶常用電腦設(shè)備機(jī)器碼,識(shí)別用戶的網(wǎng)絡(luò)行為數(shù)據(jù),這樣能更全面收集用戶數(shù)據(jù)。由于圖書館服務(wù)類型及用戶群體的不同,既有針對(duì)單一用戶的資源服務(wù),也有針對(duì)群體用戶的資源服務(wù),因此本文根據(jù)上述兩類讀者為對(duì)象進(jìn)行構(gòu)建,以此提高用戶需求偏好的準(zhǔn)確度。

      表1 圖書館用戶畫像數(shù)據(jù)來(lái)源

      3.2 圖書館用戶畫像模型

      用戶畫像的構(gòu)建是一個(gè)長(zhǎng)期逐步完善的過(guò)程,其目標(biāo)是通過(guò)分析用戶行為,最終為每個(gè)用戶打上標(biāo)簽,為進(jìn)一步精準(zhǔn)、快速地分析用戶行為習(xí)慣、閱讀偏好等信息,以便提供個(gè)性化服務(wù)。圖書館用戶畫像的模型構(gòu)建過(guò)程主要有整合圖書館相關(guān)系統(tǒng)即平臺(tái)的用戶數(shù)據(jù),獲取和研究圖書館用戶基本信息、用戶交互信息、用戶行為信息數(shù)據(jù)進(jìn)而統(tǒng)計(jì)、分類/聚類分析,給用戶打標(biāo)簽建立標(biāo)簽體系,細(xì)分用戶并勾勒出單用戶及用戶群體的畫像。如圖1所示。

      圖1 圖書館用戶畫像的框架模型

      首先要整合用戶數(shù)據(jù),如在圖書館管理系統(tǒng)、圖書館門戶、移動(dòng)服務(wù)平臺(tái)、機(jī)構(gòu)知識(shí)庫(kù)以及開發(fā)的其他信息系統(tǒng)用戶身份統(tǒng)一識(shí)別信息、屬性信息、互動(dòng)信息、資源檢索、瀏覽、訪問(wèn)、收藏、分享、評(píng)價(jià)、用戶之間關(guān)注互動(dòng)信息、訪問(wèn)時(shí)間、資源下載量、收藏量等等。然后對(duì)這些用戶的基本信息及動(dòng)態(tài)行為信息數(shù)據(jù)利用網(wǎng)絡(luò)爬蟲、文本挖掘、網(wǎng)站日志獲取等技術(shù)進(jìn)行數(shù)據(jù)抓取,按照一定規(guī)則和篩選標(biāo)準(zhǔn)進(jìn)行數(shù)據(jù)歸類,并形成數(shù)據(jù)庫(kù)文件。將獲取的大數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換、規(guī)約等預(yù)處理,并進(jìn)行聚類、關(guān)聯(lián)、序列化等數(shù)據(jù)深度挖掘分析。再次要建立標(biāo)簽體系。用戶畫像標(biāo)簽是對(duì)用戶相關(guān)的抽象數(shù)字經(jīng)過(guò)統(tǒng)計(jì)分析處理后還原成更具指導(dǎo)意義、更形象、更容易被理解的信息,即從用戶海量數(shù)據(jù)中抽取關(guān)鍵信息,發(fā)掘數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系。模型標(biāo)簽層完成對(duì)用戶的標(biāo)簽分類建模和用戶標(biāo)識(shí),需要要有明顯的區(qū)分度。通過(guò)標(biāo)簽建模分析,可以進(jìn)一步挖掘出用戶個(gè)體特征和群體特征向量。相較于單用戶畫像,群用戶畫像分析用戶群體特征的相似度、如用戶群體基本屬性的相似度、用戶之間相互關(guān)注、用戶對(duì)資源和服務(wù)評(píng)價(jià)相似度以及用戶瀏覽、利用某類資源的相似度等。還要根據(jù)用戶基本信息數(shù)據(jù)及動(dòng)態(tài)行為數(shù)據(jù)更新情況,反饋到模型標(biāo)簽庫(kù)中以便及時(shí)調(diào)整其標(biāo)簽。根據(jù)單用戶及群用戶的畫像庫(kù)建立需求預(yù)測(cè)模型。最后通過(guò)用戶需求預(yù)測(cè)在圖書館服務(wù)層對(duì)單用戶及群用戶分別開展有針對(duì)性的個(gè)性化信息服務(wù)。另外,用戶畫像并非一成不變的,用戶的需求及興趣偏好會(huì)隨著時(shí)間的推移逐漸演變,需要定期進(jìn)行優(yōu)化更新。

      在用戶畫像建模中會(huì)應(yīng)用到一系列算法及技術(shù)。如機(jī)器學(xué)習(xí),對(duì)用戶收集的底層數(shù)據(jù)進(jìn)行規(guī)整處理,并將其轉(zhuǎn)化為相同維度的特征向量,這些特征標(biāo)簽?zāi)軌蚴褂脩舢嬒窀迂S富;聚類分析,在沒(méi)有先驗(yàn)知識(shí)的前提下,根據(jù)數(shù)據(jù)的相似度將數(shù)據(jù)聚合成不同的類(簇),使想同類中的元素盡可能相似,是數(shù)據(jù)挖掘中一種重要的算法,在圖書館用戶細(xì)分過(guò)程中主要使用聚類算法而k-means算法就是解決這類問(wèn)題的常用算法。除此之外還涉及大量的文本挖掘、自然語(yǔ)言處理、網(wǎng)絡(luò)爬蟲、預(yù)測(cè)算法、相似度計(jì)算、關(guān)聯(lián)規(guī)則等技術(shù)和統(tǒng)計(jì)算法。

      4 用戶畫像視角下資源精準(zhǔn)推薦模式

      4.1 用戶畫像視角下的資源推薦流程

      用戶畫像視角下的資源推薦流程是根據(jù)前期勾勒出的用戶畫像模型,預(yù)測(cè)用戶的需求偏好及潛在資源需求,然后將用戶感興趣、有價(jià)值的資源信息精準(zhǔn)推送給用戶。具體流程內(nèi)容包括:用戶數(shù)據(jù)及館藏資源元數(shù)據(jù)的采集與處理、用戶畫像特征提取,標(biāo)簽建立并細(xì)分單用戶及相似群體用戶、資源與用戶匹配、推送結(jié)果的展示。其中數(shù)據(jù)處理包括用戶數(shù)據(jù)的處理和館藏資源數(shù)據(jù)的處理。館藏資源元數(shù)據(jù)進(jìn)行揭示、組織、分類、相似性計(jì)算并匹配等。推薦系統(tǒng)進(jìn)一步感知、發(fā)現(xiàn)、關(guān)聯(lián)資源與用戶的需求偏好,根據(jù)用戶當(dāng)前的情景(位置、時(shí)間)及相應(yīng)的特征標(biāo)簽,為用戶個(gè)性化推送其感興趣的資源。推送結(jié)果的展示主要通過(guò)圖書館服務(wù)平臺(tái)如門戶、移動(dòng)端等分別推薦給單用戶及群體用戶。如圖2所示。經(jīng)過(guò)時(shí)間的推移,用戶再次檢索、發(fā)現(xiàn)館藏資源,用戶的資源需求偏好及基本數(shù)據(jù)可能會(huì)發(fā)生變化,此時(shí)需要對(duì)用戶畫像進(jìn)行監(jiān)測(cè)及修正,通過(guò)用戶數(shù)據(jù)及資源數(shù)據(jù)的處理生成新的用戶畫像及不同資源推薦內(nèi)容,并改進(jìn)推薦系統(tǒng)實(shí)現(xiàn)精準(zhǔn)推薦,通過(guò)資源推薦系統(tǒng)在服務(wù)平臺(tái)上重新更新、推薦、展示。如此循環(huán)最終形成一個(gè)良性的用戶資源推薦生態(tài)系統(tǒng)。

      圖2 用戶畫像視角下的資源推薦流程

      4.2 基于用戶畫像的單用戶及群體用戶的資源推薦

      圖書館資源推薦系統(tǒng)是資源與用戶資源需求之間的連接點(diǎn)。將館藏資源屬性特征及內(nèi)容特征進(jìn)行提取并描述建立資源特征模型,最后形成資源集。同時(shí)將用戶通過(guò)用戶畫像進(jìn)行標(biāo)簽化處理,通過(guò)用戶對(duì)相似資源的利用、評(píng)價(jià)等行為,計(jì)算用戶之間的相似性并完成細(xì)分單用戶及相似用戶群體,最后將用戶標(biāo)簽通過(guò)描述形成多個(gè)主題,其主題與相似資源進(jìn)行匹配,匹配成功則通過(guò)推薦系統(tǒng)進(jìn)行推薦,匹配失敗則通過(guò)反饋機(jī)制進(jìn)行反饋。如圖3所示。

      4.2.1 單用戶與群體用戶興趣及行為模型建立

      圖書館用戶的興趣模型及行為模型主要依據(jù)用戶畫像中的標(biāo)簽體系來(lái)完成,包括用戶興趣及行為數(shù)據(jù)的分類、整理,興趣、行為模型的表示、更新,計(jì)算出單一用戶及群體用戶相似度。通過(guò)戶標(biāo)簽體系聚類生成標(biāo)簽層次結(jié)構(gòu)并歸納為若干主題,利用主題描述用戶興趣及行為。這種主題法結(jié)合粗粒度及細(xì)粒度的表示方法,能夠較好的描述并展示出多層次、更全面的單用戶及群體用戶興趣主題。此外,用戶的興趣會(huì)隨時(shí)間的推移不斷變化的,包括原有興趣的增加或衰減,新的興趣生成,因此動(dòng)態(tài)實(shí)時(shí)地更新用戶原有的興趣行為模型是極為必要的。除了圖書館單用戶外,還存在一些群體用戶,這些用戶通常檢索相似的資源、與有相同資源的用戶進(jìn)行關(guān)注、互動(dòng)、分享、對(duì)同一資源進(jìn)行評(píng)價(jià)等因?yàn)楣餐d趣偏好而表現(xiàn)出較強(qiáng)的群體特征。群體用戶的興趣及行為模型構(gòu)建方法與單用戶興趣模型建立相通。首先根據(jù)用戶標(biāo)簽體系對(duì)多個(gè)用戶進(jìn)行聚類,通過(guò)用戶間之間的關(guān)注、同一資源評(píng)價(jià)、互動(dòng)等信息行為進(jìn)行相似度計(jì)算,尋找相似用戶并提取相似用戶群體特征,形成用戶相似群。需要說(shuō)明的是相似群之間盡可能的體現(xiàn)出差異性,如相似群1與相似群2的距離大一些,能明顯區(qū)分出興趣偏好的不同之處。對(duì)群體用戶的更新除了用戶興趣的變化外,可能涉及到用戶的增加與減少的問(wèn)題。

      圖3 基于用戶畫像的資源推薦模式

      4.2.2 單用戶與群體用戶資源精準(zhǔn)推薦

      在對(duì)用戶進(jìn)行打標(biāo)簽、聚類、相似度計(jì)算等分別建立單用戶及群體用戶興趣模型后,將用戶與館藏資源進(jìn)行匹配。館藏資源同樣首先進(jìn)行數(shù)據(jù)處理。對(duì)單用戶及群體用戶資源的數(shù)據(jù)處理即匹配過(guò)程大致相同,包括:資源屬性特征描述、資源內(nèi)容特征抽取及標(biāo)識(shí)、資源之間語(yǔ)義相關(guān)性分析,資源特征表示及動(dòng)態(tài)組織,資源集的確定,資源與用戶主題的匹配等。資源推薦系統(tǒng)能否成功實(shí)現(xiàn)精準(zhǔn)推薦,取決于形成的用戶標(biāo)簽與館藏資源信息的匹配度。一方面將資源通過(guò)分析進(jìn)行聚合形成相似資源集,另一方面通過(guò)用戶畫像所建立的標(biāo)簽體系進(jìn)行主題描述建模,即將用戶的資源偏好映射到主題中并最終形成多個(gè)主題。在多個(gè)主題與相似資源集之間進(jìn)行匹配,如果匹配成功則通過(guò)推薦系統(tǒng)進(jìn)行推薦,匹配失敗則通過(guò)反饋機(jī)制進(jìn)行反饋。同樣,群體用戶根據(jù)其群體用戶畫像的標(biāo)簽以及計(jì)算出用戶之間的相關(guān)性并形成相似群,將相似群的標(biāo)簽映射并描述為多個(gè)主題,其主題與相似資源集之間進(jìn)行匹配。與單用戶不同的是,群體用戶是一種基于對(duì)資源的共同興趣偏好特征所進(jìn)行的資源推薦,首先根據(jù)用戶資源檢索、瀏覽、評(píng)價(jià)、收藏、分享、下載等行為數(shù)據(jù),計(jì)算出用戶之間的相關(guān)性,然后聚類得到相似用戶群,最后建立用戶群體的興趣及行為模型。

      5 結(jié) 語(yǔ)

      大數(shù)據(jù)時(shí)代基于用戶畫像的圖書館館藏資源推薦模式為圖書館個(gè)性化推薦及資源服務(wù)質(zhì)量的提升帶來(lái)了新的發(fā)展機(jī)遇。本文通過(guò)上述模式設(shè)計(jì),討論了通過(guò)用戶屬性數(shù)據(jù)、動(dòng)態(tài)行為數(shù)據(jù)、交互數(shù)據(jù)等多維度分析用戶興趣偏好,并形成標(biāo)簽體系最終建立用戶畫像模型。利用勾勒出的用戶畫像進(jìn)一步細(xì)分用戶,從單用戶及群體用戶的角度去開展館藏資源精準(zhǔn)的推薦。值得注意的是,雖然本文從多個(gè)維度建立用戶畫像,現(xiàn)實(shí)中用戶畫像的標(biāo)簽體系可根據(jù)各圖書館實(shí)際情況進(jìn)行設(shè)計(jì),并非要從多個(gè)維度去構(gòu)建設(shè)計(jì),但要結(jié)合實(shí)際的應(yīng)用場(chǎng)景,構(gòu)建滿足條件的用戶畫像模型即可,且所設(shè)計(jì)到的數(shù)據(jù)要真實(shí)可靠。同時(shí)以上更多的是一種館藏資源精準(zhǔn)推薦模式的分析設(shè)計(jì),并未涉及具體數(shù)據(jù)、算法及相關(guān)技術(shù)的應(yīng)用,在構(gòu)建用戶畫像時(shí),能夠?yàn)閳D書館利用用戶數(shù)據(jù)及館藏資源數(shù)據(jù)并預(yù)測(cè)用戶潛在需求及資源需求偏好提供一個(gè)系統(tǒng)性、框架性的參考。下一步的研究重點(diǎn)在于具體的用戶畫像的利用,如依據(jù)國(guó)內(nèi)外智慧圖書館實(shí)施情況,進(jìn)一步提取用戶及資源數(shù)據(jù)進(jìn)行分析,以進(jìn)一步驗(yàn)證方案的實(shí)用性與有效性。

      [1]庫(kù)珀.交互設(shè)計(jì)之路[M].北京:電子工業(yè)出版社,2006:10.

      [2]曾鴻,吳蘇倪.基于微博的大數(shù)據(jù)用戶畫像與精準(zhǔn)營(yíng)銷[J].現(xiàn)代經(jīng)濟(jì)信息,2016,(16):306-308.

      [3]余孟杰.產(chǎn)品研發(fā)中用戶畫像的數(shù)據(jù)模建——從具象到抽象.設(shè)計(jì)藝術(shù)研究,2014,(6):60-64.

      [4]黃文彬,徐山川,吳家輝,等.移動(dòng)用戶畫像構(gòu)建研究[J].現(xiàn)代情報(bào),2016,36(10):54-61.

      [5]XU G,ZHANG Y,ZHOU X.Towards User Profiling for Web Recommendation[J].Lecture Notes in Computer Science,2005,lncs 3809:415-424.

      [6]王慶福.貝葉斯網(wǎng)絡(luò)在用戶興趣模型構(gòu)建中的研究[J].無(wú)線互聯(lián)科技,2016,(12):101-102.

      [7]張小可,沈文明,杜翠鳳.貝葉斯網(wǎng)絡(luò)在用戶畫像構(gòu)建中的研究[J].移動(dòng)通信,2016,40(22):22-26.

      [8]辛菊琴,蔣艷,舒少龍.綜合用戶偏好模型和 BP 神經(jīng)網(wǎng)絡(luò)的個(gè)性化推薦[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(2):57-60.

      [9]單曉紅,張曉月,劉曉燕.基于在線評(píng)論的用戶畫像研究——以攜程酒店為例.情報(bào)理論與實(shí)踐[EB].http://kns.cnki.net/kcms/detail/11.1762.G3.20171122.1026.004.html.

      [10]胡媛,毛寧.基于用戶畫像的數(shù)字圖書館知識(shí)社區(qū)用戶模型構(gòu)建[J].圖書館理論與實(shí)踐,2017,(4):82-85.

      [11]劉速.淺議數(shù)字圖書館知識(shí)發(fā)現(xiàn)系統(tǒng)中的用戶畫像——以天津圖書館為例[J].圖書館理論與實(shí)踐,2017,(6):103-106.

      [12]汪強(qiáng)兵,章成志.融合內(nèi)容與用戶手勢(shì)行為的用戶畫像構(gòu)建系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2017,(2):80-86.

      [13]陳慧香,邵波.國(guó)外圖書館領(lǐng)域用戶畫像的研究現(xiàn)狀及啟示[J].圖書館學(xué)研究,2017,(20):16-20.

      [14]韓梅花,趙景秀.基于“用戶畫像”的閱讀療法模式研究—以抑郁癥為例[J].大學(xué)圖書館學(xué)報(bào),2017,(6):109-114.

      [15]邱均平,張聰.高校圖書館館藏資源協(xié)同推薦系統(tǒng)研究[J].圖書情報(bào)工作,2013,(22):132-137.

      [16]李默,梁永全.高校圖書館學(xué)術(shù)資源推薦策略及系統(tǒng)架構(gòu)研究[J].圖書館學(xué)研究,2015,(14):57-61.

      [17]陳淑英,徐劍英,劉玉魏,等.關(guān)聯(lián)規(guī)則應(yīng)用下的高校圖書館圖書推薦服務(wù)[J].圖書館論壇,2018.

      [18]何勝,熊太純,柳益君,等.基于Spark的高校圖書館文獻(xiàn)推薦方案及實(shí)證研究[J].圖書情報(bào)工作,2017,(23):129-136.

      [19]畢強(qiáng),劉健.基于領(lǐng)域本體的數(shù)字文獻(xiàn)資源聚合及服務(wù)推薦方法研究[J].情報(bào)學(xué)報(bào),2017,(5):452-460.

      [20]洪亮,錢晨,樊星.移動(dòng)數(shù)字圖書館資源的情境感知個(gè)性化推薦方法研究[J].現(xiàn)代情報(bào)技術(shù),2016,(8):110-119.

      [21]袁輝.基于確定事件的智慧圖書館推薦服務(wù)策略實(shí)施探究[J].圖書館建設(shè),2017,(8):74-77.

      [22]尹麗玲.跨類型的學(xué)術(shù)資源優(yōu)質(zhì)推薦算法研究[J].情報(bào)學(xué)報(bào),2017,(7):715-722.

      [23]李民,王穎純,劉燕權(quán).“211工程”高校圖書館館藏資源推薦系統(tǒng)調(diào)查探析[J].圖書情報(bào)工作,2016,(9):55-60.

      猜你喜歡
      用戶畫像畫像標(biāo)簽
      威猛的畫像
      “00后”畫像
      畫像
      無(wú)懼標(biāo)簽 Alfa Romeo Giulia 200HP
      車迷(2018年11期)2018-08-30 03:20:32
      不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
      海峽姐妹(2018年3期)2018-05-09 08:21:02
      把聲音的魅力發(fā)揮到極致
      移動(dòng)用戶畫像構(gòu)建研究
      基于微博的大數(shù)據(jù)用戶畫像與精準(zhǔn)營(yíng)銷
      移動(dòng)互聯(lián)網(wǎng)下手機(jī)用戶使用行為特征的研究
      標(biāo)簽化傷害了誰(shuí)
      扶沟县| 西城区| 丰镇市| 平湖市| 巨野县| 资中县| 望江县| 蓬溪县| 华安县| 青海省| 县级市| 临潭县| 虞城县| 正镶白旗| 泰和县| 什邡市| 霞浦县| 阳曲县| 沙湾县| 青冈县| 大姚县| 文登市| 广东省| 英超| 桂东县| 柳江县| 葫芦岛市| 清流县| 浦东新区| 巴彦淖尔市| 南江县| 翼城县| 朝阳区| 神农架林区| 绩溪县| 龙泉市| 甘南县| 城固县| 镇赉县| 陆丰市| 盈江县|