喻萍萍,劉 敏
(1.惠州學(xué)院 圖書館,廣東 惠州 516007;2.湖南農(nóng)業(yè)大學(xué) 圖書館,湖南 長沙 410128)
近年來,圍繞著“真實用戶的虛擬代表”的用戶畫像技術(shù)逐漸成為學(xué)術(shù)界的關(guān)注熱點。用戶畫像成為大數(shù)據(jù)時代研究用戶主題的利器之一,可以將用戶心理、需求、行為、實時體驗、滿意度等有效融入圖書館服務(wù)實踐中。大數(shù)據(jù)時代的到來,引發(fā)了圖書館服務(wù)轉(zhuǎn)型及變革的浪潮,用戶畫像在圖書館領(lǐng)域的應(yīng)用,為建設(shè)智慧圖書館、智慧校園提供了技術(shù)支持,有利于圖書館為用戶實施精準(zhǔn)化、精細化和個性化服務(wù)創(chuàng)造了必要條件。筆者結(jié)合大數(shù)據(jù)需求驅(qū)動的時代背景,從圖書館視角切入,采用文獻計量法和主題分析方法,回顧我國圖書館用戶畫像研究進展,系統(tǒng)梳理最新研究成果,以期為今后圖書館服務(wù)及用戶畫像研究提供參考和借鑒。
從圖書館視角梳理用戶畫像相關(guān)主題文獻,可以把握業(yè)界研究動態(tài)、避免重復(fù)研究以及發(fā)現(xiàn)研究亮點。筆者采取“分類+主題途徑”的檢索策略,選用“中國知網(wǎng)CNKI”作為數(shù)據(jù)獲取來源,檢索語句為“主題=圖書館AND用戶畫像”,檢索時間為2021年2月21日。檢索結(jié)果顯示命中文獻264篇,其中圖書情報與數(shù)字圖書館學(xué)科領(lǐng)域228篇。經(jīng)去重、排除不相關(guān)文獻等數(shù)據(jù)清洗工作后,共獲得193篇文獻。
科學(xué)研究文獻分布狀態(tài)可以作為衡量科研成果累積量的重要衡量指標(biāo)。
如圖1,我國圖書館用戶畫像的研究文獻累積193篇,始于2014年,相關(guān)文獻累積主要集中在2018-2020年。2014年李業(yè)根在“基于大數(shù)據(jù)的圖書館信息營銷策略”[1]一文中首次提及采用用戶畫像策略實現(xiàn)圖書館信息精確營銷。從2017開始,國內(nèi)圖情人士開始關(guān)注用戶畫像研究,“基于用戶畫像的數(shù)字圖書館知識社區(qū)用戶模型構(gòu)建”[2]一文開啟了圖書館用戶畫像技術(shù)的研究新思路。隨后,用戶畫像技術(shù)引入到圖書館實踐領(lǐng)域,并逐步出現(xiàn)系列研究成果,年度發(fā)文量逐年穩(wěn)步增加。其中,2018年34篇,2019年66篇,2020年79篇。從文獻的年度分布趨勢來看,圖書館用戶畫像研究將逐步成為國內(nèi)圖情領(lǐng)域的研究熱點之一。從科研累積量來看,“用戶畫像”在圖書情報領(lǐng)域的研究明顯滯后于其他領(lǐng)域(筆者以“SU=用戶畫像”在CNKI數(shù)據(jù)庫中以主題途徑檢索獲得2111篇,最早始于2010年)。結(jié)合年度發(fā)文量和科研累積量可知,我國圖書館用戶畫像主題研究文獻起步不久,基于當(dāng)前智慧圖書館、智慧校園等建設(shè)需求,預(yù)計未來用戶畫像技術(shù)在圖書館領(lǐng)域的應(yīng)用研究將繼續(xù)保持研究勢態(tài)。
圖1 相關(guān)文獻年度發(fā)文量趨勢
對研究文獻來源統(tǒng)計結(jié)果顯示,174篇為期刊論文,17篇為碩博士學(xué)位論文,1篇會議論文。文獻類型以期刊分布為主的現(xiàn)象說明,該研究領(lǐng)域主要還是在學(xué)術(shù)期刊領(lǐng)域進行探討。相關(guān)文獻發(fā)表在39種期刊上,均刊載4.46篇,含23種圖情類專業(yè)期刊。發(fā)文6篇及以上文獻的期刊共10種,分別為《圖書館學(xué)研究》(21篇)、《圖書館學(xué)刊》(12篇)、《圖書情報工作》(11篇)、《圖書館研究與工作》(6篇)、《圖書館理論與實踐》(6篇)、《現(xiàn)代情報》(6篇)、情報科學(xué)(6篇)、新世紀(jì)圖書館(6篇)、河南圖書館學(xué)刊(6篇)、四川圖書館學(xué)報(6篇)。經(jīng)統(tǒng)計,所有期刊論文中發(fā)表在圖書情報類核心期刊上的論文約44%,其中CSSCI收錄文獻68篇,CSSCI來源期刊擴展版收錄文獻9篇。關(guān)于學(xué)位論文,相關(guān)研究碩士論文12篇,博士論文5篇,主要機構(gòu)為吉林大學(xué)、南京大學(xué)及鄭州大學(xué)。
通過對支持成果完成的項目或基金情況分析,可以了解和把握該領(lǐng)域的相關(guān)研究熱點及趨勢。從立項支持完成情況來看,相關(guān)課題累計63項,其中,國家級33項、部級7項、省級23項。經(jīng)統(tǒng)計,圖書情報學(xué)科領(lǐng)域項目名稱中明確含有“用戶畫像”一詞的國家級項目有4項,廳級項目5項。如2018年國家社科基金項目“基于大數(shù)據(jù)深度融合的移動圖書館用戶畫像情境化推薦模型研究”“多源異構(gòu)數(shù)據(jù)融合的圖書館用戶畫像研究”;2020年國家社科基金項目“基于用戶畫像的圖書館低幼兒主體閱讀推廣及閱讀服務(wù)創(chuàng)新研究”“基于群智圖譜的圖書館用戶畫像及知識服務(wù)優(yōu)化研究”;2019年教育部人文社科規(guī)劃項目“智慧校園環(huán)境下圖書館用戶畫像及其應(yīng)用研究”;2020年教育部人文社科規(guī)劃項目“基于用戶畫像的高校圖書館精準(zhǔn)服務(wù)模式構(gòu)建及實證研究”等。從項目資助情況來看,近兩年國家非常重視用戶畫像在圖書情報領(lǐng)域的應(yīng)用研究,具有明確的導(dǎo)向性。各省市也在積極探索引入用戶畫像技術(shù)促進圖書館服務(wù)的升級。如2017年福建省中青年教師教育科研項目“高校移動圖書館用戶畫像構(gòu)建研究”、2018年湖南省教育廳科學(xué)研究項目“基于用戶畫像的信息素養(yǎng)教育模式研究”、2019年浙江省高校圖工委項目“基于用戶畫像的高校圖書館數(shù)字閱讀推廣研究”等。
關(guān)鍵詞分析可以從主題揭示角度把握研究的具體熱點。193篇文獻共獲得關(guān)鍵詞607個,關(guān)鍵詞詞頻數(shù)為3-6個不等,均篇3.1個。利用EXCEL軟件對關(guān)鍵詞統(tǒng)計處理,匯總詞頻數(shù)大于或等于4的關(guān)鍵詞共43個,統(tǒng)計結(jié)果如表1所示。
表1 圖書館用戶畫像研究詞頻分布(詞頻≥4)
通過對高頻詞的分布進行分析,可了解我國圖書館用戶畫像研究文獻的一些基本特點:一是圍繞著“用戶”“讀者”“數(shù)據(jù)”“圖書館”等出現(xiàn)了和畫像關(guān)聯(lián)的概念,如“用戶畫像”“讀者畫像”“數(shù)據(jù)畫像”等,其表述的概念內(nèi)涵與用戶畫像接近?!坝脩粜枨蟆薄坝脩粜袨椤薄澳繕?biāo)用戶”等揭示了其需要解決的問題。二是關(guān)注于基于大數(shù)據(jù)背景探討用戶畫像技術(shù)在高校圖書館、數(shù)字圖書館、智慧圖書館的應(yīng)用研究,在圖書館服務(wù)實踐領(lǐng)域主要包括“精準(zhǔn)服務(wù)”“知識服務(wù)”“學(xué)科服務(wù)”“閱讀推廣”“移動圖書館”“個性化服務(wù)”“情景化推薦”等。三是“大數(shù)據(jù)”“數(shù)據(jù)驅(qū)動”“數(shù)據(jù)挖掘”“標(biāo)簽體系”“用戶數(shù)據(jù)”“模型構(gòu)建”等揭示了圖書館用戶畫像的主要實現(xiàn)路徑及技術(shù)手段。
通過梳理我國圖書館用戶畫像主題文獻,了解到大數(shù)據(jù)時代圖書館用戶畫像研究涉及研究方法、構(gòu)建方式、服務(wù)維度等內(nèi)容,從用戶需求角度提升圖書館服務(wù)效率,促進了理論研究推進實踐應(yīng)用的發(fā)展。
認識用戶畫像的概念及內(nèi)涵是開展高校圖書館用戶畫像研究的基礎(chǔ)。1999年,軟件開發(fā)者、程序設(shè)計師及理論家Alan Cooper[3]認為:用戶畫像(Personas)是“基于用戶真實的行為及動機,代表真實用戶并在數(shù)據(jù)基礎(chǔ)上形成綜合原型(Composite Archetype),即真實用戶數(shù)據(jù)的虛擬代表”。Harley A[4]認為Personas是真實用戶代表,是不同群體行為、動機及目標(biāo)的“典型用戶”,可以抓住用戶關(guān)鍵特征從支持以用戶為中心的整個項目生命周期進行設(shè)計。之后,絕大部分學(xué)者將用戶畫像翻譯為“User Profile”,用以表述基于用戶數(shù)據(jù)描述的標(biāo)簽集合。
用戶畫像可以全面細致地描述用戶信息全貌,是基于海量真實數(shù)據(jù)抽象化得到虛擬用戶并提煉出用戶行為習(xí)慣、態(tài)度偏好,進而歸類用戶[5]。在圖書館學(xué)研究領(lǐng)域,基于大數(shù)據(jù)和個性化圖書館的定制推送服務(wù)可以理解為用戶畫像技術(shù)的應(yīng)用之一。圖書館用戶群體屬性,使得用戶使用館藏資源和服務(wù)過程中,極易產(chǎn)生海量的靜態(tài)和動態(tài)數(shù)據(jù)。其中,靜態(tài)數(shù)據(jù),如姓名、性別、專業(yè)等,相對穩(wěn)定;而用戶的一些動態(tài)行為,如咨詢、借閱、訪問、下載等,因時間而異,具有較強的時效性。然而,圖書館對于用戶數(shù)據(jù)的廣度、深度的敏感度不高,使得用戶畫像研究尚處于理論探索與實踐同步階段。
圖書館用戶畫像需要緊密圍繞圖書館服務(wù)用戶群體展開,對其構(gòu)成要素及維度研究,可以準(zhǔn)確而更好地理解圖書館用戶屬性以及服務(wù)的維度和方向。由于圖書館服務(wù)類型和用戶群體不同,其構(gòu)成要素和維度也有所不同。用戶畫像標(biāo)簽通??梢詣澐譃榛緦傩詷?biāo)簽、社會屬性標(biāo)簽、用戶行為標(biāo)簽、用戶興趣標(biāo)簽、用戶能力標(biāo)簽等多種類別[6]。劉海鷗等[7]基于圖書館用戶的基本信息、內(nèi)容偏好數(shù)據(jù)、互動數(shù)據(jù)、會話數(shù)據(jù)、情境數(shù)據(jù)進行了標(biāo)簽化識別。李曉敏[8]從自然屬性、興趣屬性、社交屬性三個數(shù)據(jù)維度構(gòu)建了智慧圖書館用戶畫像。楊群等[9]認為高校圖書館用戶畫像構(gòu)成要素包括用戶基本信息數(shù)據(jù)、館藏資源利用數(shù)據(jù)、用戶設(shè)計活動及互動數(shù)據(jù)、第三方開放數(shù)據(jù)等。晁明娣[10]認為高校圖書館用戶畫像包括靜態(tài)屬性(學(xué)歷、性別、年齡、專業(yè)等)和動態(tài)屬性(性格、閱讀偏好、情緒狀態(tài)等)兩個維度,利用真實用戶在圖書館數(shù)據(jù)化平臺的互動痕跡,抓取關(guān)鍵信息分類篩選,實現(xiàn)屬性標(biāo)簽刻畫的專屬“用戶畫像”。
由于理解角度和構(gòu)建用戶畫像的目的不同,構(gòu)建模型運用的方法和工具也不盡相同。專門涉及用戶畫像構(gòu)建方法及模型的研究文獻較多。如基于設(shè)計與思維的目標(biāo)導(dǎo)向、參與導(dǎo)向、虛擬導(dǎo)向、角色導(dǎo)向等構(gòu)建法;基于行為或日志的構(gòu)建法;基于多維或融合的構(gòu)建法等[11]。王仁武[12]通過用戶訪問日志來構(gòu)建圖書館學(xué)術(shù)用戶畫像的信息行為標(biāo)簽和研究興趣標(biāo)簽。畢達天等[13]綜合運用問卷調(diào)查方法、訪問日志挖掘方法、出聲思考法挖掘用戶在不同場景的信息需求期望、信息搜索習(xí)慣和信息接受偏好,運用專家訪談法基于向量空間模型(VSM)構(gòu)建用戶畫像模型。許鵬程等[14]提出數(shù)據(jù)驅(qū)動下用戶畫像數(shù)據(jù)化→標(biāo)簽化→關(guān)聯(lián)化→可視化的驅(qū)動主路線,從自然維度、興趣維度、社交維度,構(gòu)建多維度、多層級、立體化的用戶畫像模型。吳智勤等[15]提出一種基于社交網(wǎng)絡(luò)分析方法的高校圖書館用戶畫像構(gòu)建策略。胡云飛[16]提出利用基于馬氏距離的二分K-means算法進行聚類得到用戶畫像。王震飛[17]通過八爪魚數(shù)據(jù)采集器在科學(xué)網(wǎng)上采集圖書館學(xué)、情報學(xué)、檔案學(xué)三個學(xué)科領(lǐng)域博主相關(guān)數(shù)據(jù),結(jié)合RFM模型和K-Means聚類算法構(gòu)建博主群體畫像。梁欣[18]提出一種基于Hadoop的數(shù)字圖書館用戶畫像系統(tǒng)。徐海玲[19]利用Con Exp1.3工具構(gòu)建不同群體用戶類別的細分標(biāo)簽,并生成Hasse圖,通過概念格“Calculate Association Rule”對不同群體的用戶行為進行關(guān)聯(lián)規(guī)則挖掘。馮齡萱和魏群義[20]運用扎根理論分析訪談數(shù)據(jù)并提取用戶流失因素、用戶變化、用戶行為、用戶基本屬性四個方面的用戶畫像標(biāo)簽,構(gòu)建高校移動圖書館流失用戶畫像標(biāo)簽框架及模型。陳添源[21]利用因子分析、聚類分析等方法選取用戶畫像個數(shù),借助R語言wordcloud2軟件包可視化不同用戶畫像的特征標(biāo)簽云并對每個畫像標(biāo)簽展開描述。
大數(shù)據(jù)背景下用戶畫像服務(wù)應(yīng)用領(lǐng)域涉及了基礎(chǔ)應(yīng)用、業(yè)務(wù)應(yīng)用和決策應(yīng)[22]。從圖書館用戶畫像服務(wù)領(lǐng)域研究則更多的是面向精準(zhǔn)服務(wù)、知識發(fā)現(xiàn)、閱讀推廣、情境化推薦等應(yīng)用層面。肖海清等[23]基于數(shù)據(jù)采集層、數(shù)據(jù)處理層、標(biāo)簽抽取層、用戶交互關(guān)聯(lián)層及應(yīng)用實現(xiàn)層構(gòu)建了高校圖書館閱讀推廣參與式用戶畫像模型。劉海鷗[24]從個性化學(xué)習(xí)的數(shù)據(jù)獲取、標(biāo)簽體系構(gòu)建、學(xué)習(xí)者畫像建模等多個層面深入挖掘大數(shù)據(jù)時代用戶個性化學(xué)習(xí)的精準(zhǔn)服務(wù)需求,提出契合用戶需求的個性化學(xué)習(xí)精準(zhǔn)服務(wù)模式。陳丹等[25]從知識服務(wù)、閱讀推廣、場景推薦、主動定制等方面提出基于用戶畫像的圖書館個性化智慧服務(wù)策略。王益成等[26]提出運用標(biāo)簽云技術(shù)為處于不同場景的科技情報用戶定制有針對性的個性化服務(wù)方案。劉漫[27]結(jié)合聚類、關(guān)聯(lián)算法構(gòu)建了高校圖書館大學(xué)生用戶畫像閱讀推廣模式。馬管[28]認為利用用戶畫像建模技術(shù)對學(xué)科用戶數(shù)據(jù)的深度挖掘分析,可為用戶提供更加精準(zhǔn)、高效的學(xué)科服務(wù)。朱會華[29]提出通過建立用戶畫像學(xué)科采訪系統(tǒng),實現(xiàn)線上圖采中心、用戶畫像學(xué)科群、分級分類式采訪、讀者決策等相融合的學(xué)科采訪模式。此外,袁軍[30]認為大數(shù)據(jù)環(huán)境下用戶畫像還可用于讀者信用管理、制定科學(xué)合理的發(fā)展規(guī)劃等,康存輝[31]研究了用戶畫像對智慧圖書館空間再造的作用,吳智勤[32]研究了高校圖書館科研用戶畫像構(gòu)建。
國內(nèi)學(xué)者積極引進國外圖書館用戶畫像的實踐經(jīng)驗并進行了初步探索,開拓了圖書館用戶畫像的本土化研究進程。鄂麗君等[33]以美國康奈爾大學(xué)、楊百翰大學(xué)、紐約大學(xué)、科羅拉多大學(xué)的圖書館為例,介紹了用戶畫像構(gòu)建的前期準(zhǔn)備、數(shù)據(jù)獲取及分析、構(gòu)建及驗證等環(huán)節(jié)。董麗[34]以美國北卡羅來納州立大學(xué)和中國社科院用戶畫像成功經(jīng)驗為例,認為高校圖書館精準(zhǔn)服務(wù)需要明確思路。王丹[35]介紹了加南大多倫多大學(xué)圖書館特色服務(wù),提出構(gòu)建讀者畫像并建設(shè)智慧型圖書館。李晶潔等[36]以天津商業(yè)大學(xué)圖書館閱讀者數(shù)據(jù)為例,建立關(guān)鍵詞數(shù)據(jù)畫像,并參照內(nèi)容對圖書館資源建設(shè)和服務(wù)提出了建議。楊帆[37]以國家圖書館大數(shù)據(jù)項目為例,實證了基于大數(shù)據(jù)平臺的迭代分析方法對圖書館大數(shù)據(jù)平臺構(gòu)建和精細化讀者服務(wù)的指導(dǎo)意義。蔣君等[38]以中國醫(yī)學(xué)科學(xué)院圖書館NSTL原文傳遞數(shù)據(jù)為例,采用文獻計量、聚類、分類和序列分析等方法,從用戶偏好、用戶行為兩個維度對原文傳遞用戶構(gòu)建用戶畫像。
通過對現(xiàn)有研究的總結(jié)分析可知:(1)圖書館用戶畫像理論研究較為薄弱,未形成研究體系。雖然業(yè)內(nèi)有大量有關(guān)用戶畫像的相關(guān)成果,但涉及圖書館用戶畫像的知識體系范疇、服務(wù)維度、構(gòu)建流程、評價指標(biāo)等研究深度不夠,有待進一步加強。(2)不斷完善中的圖書館用戶畫像構(gòu)建流程研究。對文獻研究主題梳理分析可知,我國圖書館用戶畫像主題涉及了服務(wù)要素及維度、設(shè)計模型、服務(wù)應(yīng)用范疇等,包括圖書館用戶屬性、用戶數(shù)據(jù)獲取、用戶標(biāo)簽提取等內(nèi)容并有相應(yīng)的實踐成功案例。這些涉及了圖書館用戶畫像的構(gòu)建流程,也說明該領(lǐng)域的研究具有較好的基礎(chǔ)并在不斷完善中。(3)圖書館用戶畫像應(yīng)用領(lǐng)域有限。大數(shù)據(jù)背景下,用戶畫像應(yīng)用范疇極為廣泛,包括通信、互聯(lián)網(wǎng)、搜索引擎、網(wǎng)絡(luò)視頻、即時聊天、圖書館等多個領(lǐng)域。但圖書館用戶畫像的應(yīng)用以閱讀推廣、推薦服務(wù)為主,仍有較大發(fā)展空間。
通過對現(xiàn)有文獻研究回顧,筆者認為圖書館用戶畫像主題領(lǐng)域研究有待進一步引起業(yè)內(nèi)重視,包括用戶信息安全與隱私保護、用戶畫像更新與評估、多源數(shù)據(jù)融合與統(tǒng)一等。未來在相應(yīng)領(lǐng)域開展相關(guān)研究,促進圖書館用戶畫像實踐研究的百花齊放。
1.豐富圖書館領(lǐng)域研究方法,促進圖書館學(xué)研究本土化發(fā)展。圖書館學(xué)研究思維是在圖書館學(xué)研究過程中,為解決或解答某個具體的圖書館學(xué)問題所使用或創(chuàng)造的思維方法及研究范式。從我國的圖書館學(xué)理論研究的發(fā)展可以看出,“引進”“移植”后“本土再造”是當(dāng)代圖書館學(xué)及圖書館事業(yè)實踐應(yīng)用發(fā)展的一大特色,即我國一部分圖書館學(xué)理論與研究方法借鑒了國外的概念、研究范疇、思想體系等,結(jié)合國情再進行本土改造后實現(xiàn)創(chuàng)新。未來,結(jié)合圖書館用戶畫像的理論思維和實踐效果研究以及圖書館發(fā)展的實際,促進本土圖書館領(lǐng)域技術(shù)方法的革新、服務(wù)模式的創(chuàng)新、服務(wù)質(zhì)量的提升、服務(wù)內(nèi)容的延伸等,有利于進一步拓寬本土化圖書館學(xué)研究方法和理論。
2.不斷完善圖書館用戶行為模型及服務(wù)模式的研究。在研究圖書館用戶行為時,學(xué)者們更多的是從用戶屬性、興趣愛好等靜態(tài)維度研究群體特征,具有一定的局限性。而從圖書館用戶畫像角度較好地融合了用戶群體的各類屬性特征,包括服務(wù)內(nèi)容、資源特征、閱讀屬性、教育范疇等多種特點并實現(xiàn)多維交互分析。因此,從靜態(tài)和動態(tài)角度研究用戶行為,以期為用戶匹配不同特征和屬性的圖書館服務(wù),為不斷完善中的圖書館用戶行為模型、服務(wù)模式提供了新的思維方法和角度。
3.加強對圖書館用戶畫像中信息安全、質(zhì)量評估等問題研究。用戶畫像是對用戶個人信息及數(shù)據(jù)的有效利用。因此,在搭建圖書館用戶畫像時面臨著隱私保護及個人信息安全的矛盾,比如用戶的姓名、性別、年齡、閱讀喜好等。用戶數(shù)據(jù)越全面、越多,則用戶畫像越有用、越精準(zhǔn),而這極易引起泄露用戶數(shù)據(jù)而引起不必要的侵害用戶權(quán)益的可能。因此,如何加強圖書館用戶畫像中涉及的隱私保護及個人信息安全是一個值得深入研究的主題。另外,圖書館用戶畫像更新、質(zhì)量評估及反饋機制,圖書館網(wǎng)絡(luò)輿情生態(tài)環(huán)境等都是未來圖書館用戶畫像領(lǐng)域中有待進一步研究內(nèi)容。