陸衡
摘? 要:本文介紹了用戶畫像技術(shù)在圖書館服務(wù)領(lǐng)域的研究現(xiàn)狀,探討了使用用戶小數(shù)據(jù)構(gòu)建用戶畫像在高校圖書館領(lǐng)域的應(yīng)用前景,研究了基于用戶小數(shù)據(jù)的高校圖書館用戶畫像標(biāo)簽系統(tǒng)的構(gòu)建流程,提出該系統(tǒng)的應(yīng)用價(jià)值和前景。跟蹤用戶需求變化,建立滿足用戶個(gè)性化需求的體系,對(duì)高校圖書館利用自身數(shù)據(jù)資源來提升用戶服務(wù)質(zhì)量提供了參考和借鑒。
關(guān)鍵詞:用戶小數(shù)據(jù)? 用戶畫像? 高校圖書館? 服務(wù)模式
中圖分類號(hào):G250.7? ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? ? ? ? ? ? 文章編號(hào):1674-098X(2021)05(c)-0240-04
Research on User profile of University Library Based on User Small Data
LU Heng
(Wuhan Textile University Library, Wuhan, Hubei Province,430200 China)
Abstract: This paper introduces the research status of user portrait technology in the field of library service, discusses the application prospect of using user small data to construct user portrait in the field of university library, studies the construction process of user portrait label system of University Library Based on user small data, and puts forward the application value and Prospect of the system. Tracking the changes of users' needs and establishing a system to meet users' personalized needs provide a reference for university libraries to use their own data resources to improve users' service quality.
Key Words: User small data; User portrait; University library; Service mode
在互聯(lián)網(wǎng)技術(shù)、大數(shù)據(jù)技術(shù)和各種新信息技術(shù)高速發(fā)展的背景下,高校圖書館的用戶需求日益多樣化和個(gè)性化,對(duì)服務(wù)的及時(shí)性、專業(yè)性和準(zhǔn)確性的要求也越來越高。另外,隨著各種IT技術(shù)的成熟應(yīng)用,當(dāng)前高校圖書館的數(shù)字資源數(shù)據(jù)、用戶特征數(shù)據(jù)、用戶服務(wù)數(shù)據(jù)、系統(tǒng)管理數(shù)據(jù)等各類數(shù)據(jù)正在快速增長(zhǎng),而圖書館所依賴的知識(shí)創(chuàng)造和利用環(huán)境正從信息時(shí)代進(jìn)入“數(shù)據(jù)時(shí)代”。因此,利用多形式的資源類型和多樣化的數(shù)據(jù)構(gòu)建新的服務(wù)模式已成為提高高校圖書館服務(wù)效率的重要途徑。
高校圖書館讀者用戶數(shù)據(jù)是基于以個(gè)體為唯一研究對(duì)象的全面數(shù)據(jù),數(shù)據(jù)的準(zhǔn)確性高,同時(shí)數(shù)據(jù)量小,可靠性和安全性高,數(shù)據(jù)中心IT系統(tǒng)具有小數(shù)據(jù)資源耗竭、小數(shù)據(jù)實(shí)時(shí)動(dòng)態(tài)決策、決策成本低的優(yōu)勢(shì),利用小數(shù)據(jù)為用戶提供個(gè)性化智能服務(wù),在成本控制、操作難度及技術(shù)實(shí)現(xiàn)方面具有大數(shù)據(jù)所沒有的優(yōu)勢(shì)。
在此概念下,本文通過對(duì)高校圖書館用戶數(shù)據(jù)挖掘分析,構(gòu)建高校圖書館用戶肖像標(biāo)簽系統(tǒng),從而進(jìn)一步研究用戶、用戶細(xì)分、用戶多維知識(shí),挖掘用戶潛在需求,滿足不同用戶個(gè)性化需求和專業(yè)準(zhǔn)確的服務(wù)要求。
1? 相關(guān)研究概述
1.1 用戶畫像在圖書館領(lǐng)域的研究現(xiàn)狀
用戶畫像技術(shù)最開始被應(yīng)用于交互設(shè)計(jì)和產(chǎn)品設(shè)計(jì)領(lǐng)域。用戶畫像是指對(duì)一些特定服務(wù)人群的真實(shí)特征進(jìn)行勾勒,是刻畫目標(biāo)用戶、連接用戶需求[1]的有效工具。早期的用戶畫像模型通常是設(shè)計(jì)師通過主觀想象將目標(biāo)客戶的輪廓具體化,從目標(biāo)輪廓中歸納出用戶特征,然后用虛擬特征設(shè)計(jì)產(chǎn)品原型的一種方式。但是這樣的用戶畫像完全依賴于設(shè)計(jì)師的主觀假設(shè),會(huì)比較容易產(chǎn)生偏差。
在圖書館領(lǐng)域,用戶畫像的應(yīng)用可追溯最早出現(xiàn)在大約1985年,當(dāng)時(shí)英國國家書目和Blaise-line通過電話采訪和個(gè)人訪談的方式調(diào)查用戶對(duì)Blaise-line的使用情況,并形成相關(guān)有效分析,從而優(yōu)化服務(wù)。伴隨用戶畫像技術(shù)研究的不斷發(fā)展,國外許多學(xué)者主要將用戶畫像應(yīng)用于圖書館的信息推薦[2]、信息過濾[3]及相關(guān)服務(wù)設(shè)計(jì)等領(lǐng)域。與之對(duì)比,我國在圖書館領(lǐng)域的用戶畫像相關(guān)研究則起步較晚,近年來逐漸成為研究熱點(diǎn),但是研究成果相對(duì)較少,主要集中在圖書館用戶畫像的模型構(gòu)建和實(shí)際應(yīng)用上。
綜上所述,在國外相關(guān)研究中,圖書館領(lǐng)域關(guān)于用戶畫像的研究從早期的理論基礎(chǔ)、模型建立、方法和技術(shù),最后到實(shí)際應(yīng)用,其研究線路相對(duì)比較成熟,但是國內(nèi)的研究對(duì)于圖書館領(lǐng)域的用戶畫像研究還有待豐富和完善,因此可以借鑒國外成熟的用戶畫像模式,結(jié)合我國圖書館發(fā)展的現(xiàn)狀和用戶群體的特點(diǎn),構(gòu)建完整的圖書館用戶畫像模式,以加強(qiáng)用戶畫像的實(shí)踐和應(yīng)用,從而更好地把握用戶需求,提升服務(wù)質(zhì)量。
1.2 用戶小數(shù)據(jù)的概念和研究現(xiàn)狀
小數(shù)據(jù)概念最早由康奈爾大學(xué)教授德波海爾·艾斯提提出,在2014年他通過其父親發(fā)現(xiàn)老人日常行為變化與身體異常的關(guān)系,經(jīng)過醫(yī)院的醫(yī)學(xué)檢查卻沒有發(fā)現(xiàn)異常, 德波海爾·艾斯提認(rèn)為這些日常行為數(shù)據(jù)是一種新的醫(yī)學(xué)數(shù)據(jù),并將這些數(shù)據(jù)應(yīng)用于疾病的診斷和治療,為醫(yī)療治療提供更直接的科學(xué)依據(jù)和數(shù)據(jù)支持。小數(shù)據(jù)來源于個(gè)體的數(shù)字軌跡,是個(gè)體用戶全方位、多層次的行為模式和情景感知[4]的整個(gè)數(shù)據(jù)集。小數(shù)據(jù)在圖書館服務(wù)中的核心價(jià)值在于預(yù)測(cè)和判斷用戶的需求信息,并為其提供個(gè)性化、精準(zhǔn)的服務(wù)。
在高校圖書館的數(shù)據(jù)服務(wù)創(chuàng)新中,尤其是數(shù)據(jù)采集的過程中,用戶小數(shù)據(jù)是個(gè)體用戶的重要研究對(duì)象。隨著傳感器網(wǎng)絡(luò)技術(shù)、移動(dòng)通信技術(shù)和閱讀終端技術(shù)的發(fā)展,高校圖書館能夠高效、不間斷、低成本地對(duì)用戶的小數(shù)據(jù)進(jìn)行采集、合成、分析和判斷,并利用小數(shù)據(jù)繪制出一種精確包含用戶需求的模式、方法、閱讀習(xí)慣以及使用者的社會(huì)網(wǎng)絡(luò)關(guān)系。
2? 高校圖書館用戶小數(shù)據(jù)的內(nèi)容與用戶畫像維度
高校圖書館用戶小數(shù)據(jù)是用戶整體特征的完整體現(xiàn),是個(gè)體用戶全方位、多層次的行為模式和情景感知的完整數(shù)據(jù)集。高校圖書館用戶的小數(shù)據(jù)來源于用戶的各種注冊(cè)信息、活動(dòng)信息和社會(huì)信息,具有數(shù)據(jù)價(jià)值高、數(shù)據(jù)準(zhǔn)確、易于識(shí)別等優(yōu)點(diǎn)。構(gòu)建高校圖書館用戶肖像標(biāo)簽系統(tǒng)的用戶小數(shù)據(jù)主要來源于用戶自然數(shù)據(jù)、用戶行為數(shù)據(jù)和用戶社交數(shù)據(jù)。用戶自然數(shù)據(jù)主要包括讀者ID、姓名、性別、年齡、年級(jí)、學(xué)歷、專業(yè)、聯(lián)系方式等。用戶行為數(shù)據(jù)主要包括登錄次數(shù)、瀏覽時(shí)間、頁面滾動(dòng)、點(diǎn)擊、跳躍、下載、收集、復(fù)制、移動(dòng)手勢(shì)滑動(dòng)、拖動(dòng)、借用、搜索、咨詢等。用戶社交數(shù)據(jù)包括點(diǎn)贊、分享、評(píng)論、討論、互動(dòng)、關(guān)注、引用、引用、合作等。
3? 高校圖書館用戶畫像標(biāo)簽系統(tǒng)
3.1 用戶小數(shù)據(jù)的采集
用戶小數(shù)據(jù)是構(gòu)建用戶畫像的基礎(chǔ),用戶數(shù)據(jù)越全面準(zhǔn)確,用戶畫像的刻畫就越接近于真實(shí)用戶,用戶畫像的分析結(jié)果就越趨近于用戶的真實(shí)需求。在數(shù)據(jù)的采集過程中,不同類型的用戶小數(shù)據(jù)可以通過不同的方法來實(shí)現(xiàn)。用戶自然數(shù)據(jù)可在學(xué)校教務(wù)系統(tǒng)、信息門戶系統(tǒng)或用戶在注冊(cè)時(shí)填寫的相關(guān)信息中獲取;用戶行為數(shù)據(jù)可在圖書館門禁管理系統(tǒng)、圖書借閱管理系統(tǒng)、數(shù)據(jù)庫檢索系統(tǒng)中獲取;用戶社交數(shù)據(jù)可以通過網(wǎng)絡(luò)數(shù)據(jù)采集、社會(huì)調(diào)查法、用戶訪談法等方法獲取。在數(shù)據(jù)采集的過程中,要注意數(shù)據(jù)信息的完整性和用戶隱私之間的界限,數(shù)據(jù)的采集要以保證用戶隱私為前提,同時(shí)要保證采集到的數(shù)據(jù)不會(huì)出現(xiàn)泄漏而導(dǎo)致用戶的損失。
3.2 用戶小數(shù)據(jù)的挖掘及過濾
數(shù)據(jù)挖掘和過濾是用戶肖像處理的核心和關(guān)鍵。用戶畫像技術(shù)可以通過挖掘用戶與用戶數(shù)據(jù)之間的關(guān)系,用戶畫像的分析結(jié)果可以應(yīng)用到個(gè)性化服務(wù)、精準(zhǔn)營(yíng)銷等領(lǐng)域?qū)崿F(xiàn)其價(jià)值。主要的數(shù)據(jù)挖掘方法有聚類、分類、關(guān)聯(lián)規(guī)則、決策樹、協(xié)同過濾等??梢愿鶕?jù)不同的目的來選擇最有效的數(shù)據(jù)挖掘方法,通過聚類和分類算法可以更好地將用戶劃分為具有相似特征的組,從而將這些人劃分為具有共同特征的個(gè)體。關(guān)聯(lián)規(guī)則是基于對(duì)象的相似度來建立數(shù)據(jù)關(guān)系。
3.3 用戶畫像的標(biāo)簽系統(tǒng)
標(biāo)簽提取和重組是用戶肖像處理的最后一步,直接影響用戶肖像結(jié)果的準(zhǔn)確性。標(biāo)注是對(duì)收集到的用戶數(shù)據(jù)進(jìn)行挖掘和過濾,提取目標(biāo)用戶群體的特征,并通過用高度精煉的詞語識(shí)別這些特征的過程,標(biāo)簽系統(tǒng)有語義明確、文本簡(jiǎn)潔、專一性高[5]等特點(diǎn)。在本文中,用戶畫像的標(biāo)簽具體可以分為用戶行為標(biāo)簽、用戶社交網(wǎng)絡(luò)標(biāo)簽和用戶興趣標(biāo)簽等,詳見圖1。
4? 用戶畫像的價(jià)值和應(yīng)用
通過融合用戶小數(shù)據(jù)的各種自然數(shù)據(jù)、行為數(shù)據(jù)和社交數(shù)據(jù),運(yùn)用聚類、關(guān)聯(lián)規(guī)則、決策樹、協(xié)同過濾等方法將其抽象化,最終繪制出讀者的用戶畫像及用戶標(biāo)簽體系[6]。這個(gè)體系用來作為服務(wù)的基礎(chǔ),有著廣泛而重要的價(jià)值,在具體應(yīng)用中,可以實(shí)現(xiàn)多種豐富的功能,從而提升用戶服務(wù)質(zhì)量。
4.1 個(gè)性化內(nèi)容推薦
使用用戶畫像來對(duì)用戶進(jìn)行個(gè)性化推薦的內(nèi)容更為精確,同時(shí)也更符合用戶的需求。用戶畫像的標(biāo)簽系統(tǒng)可以從多個(gè)維度來引導(dǎo)圖書館對(duì)用戶進(jìn)行個(gè)性化的內(nèi)容推薦和精準(zhǔn)營(yíng)銷。通過行為標(biāo)簽系統(tǒng)了解用戶過往的信息需求,從而推導(dǎo)用戶的服務(wù)需求;通過社交網(wǎng)絡(luò)標(biāo)簽,了解用戶在其社交圈內(nèi)其他用戶相關(guān)需求,從而推導(dǎo)用戶是否有類似需求。在線的時(shí)間和空間場(chǎng)景上也可以針對(duì)不同用戶特征,如空余時(shí)間和課程時(shí)間的不同分時(shí)段進(jìn)行推送,充分利用好用戶的碎片化時(shí)間;在空間上也可以因用戶在館或不在館進(jìn)行紙質(zhì)資源或電子資源的推送[7]。
4.2 用戶需求迭代與滿意度管理
高校圖書館用戶有著明顯的需求迭代性,隨著年級(jí)的增長(zhǎng)和學(xué)業(yè)階段的變化,其用戶需求會(huì)呈現(xiàn)出明顯的周期性。使用用戶畫像來對(duì)用戶需求進(jìn)行跟蹤分析,能夠有效地測(cè)算出用戶需求迭代的時(shí)間節(jié)點(diǎn)。因此通過高年級(jí)的用戶畫像來分析低年級(jí)的需求是有一定參考意義的。通過個(gè)性化的信息引導(dǎo),可以挖掘出用戶的潛在信息需求,從而幫助用戶在學(xué)習(xí)成長(zhǎng)階段更好的利用圖書館資源完成自己的學(xué)業(yè)。通過滿意度管理可以了解用戶對(duì)個(gè)性化推薦內(nèi)容的滿意程度,從而判斷標(biāo)簽系統(tǒng)的準(zhǔn)確性,并及時(shí)對(duì)用戶畫像標(biāo)簽系統(tǒng)進(jìn)行更新,可以使標(biāo)簽系統(tǒng)更為完善。
5? 結(jié)語
近年來通過構(gòu)建用戶畫像來提升圖書館的服務(wù)質(zhì)量,已經(jīng)成為行業(yè)研究熱點(diǎn)之一。但是在實(shí)際應(yīng)用過程中還面臨著一些問題急需解決。首先是信息采集的問題,在信息采集的過程中,如何判斷有效數(shù)據(jù)與用戶隱私的權(quán)益問題、道德問題,都還需進(jìn)一步的研究分析。其次,在構(gòu)建用戶畫像的過程中,雖然有很多不同的分析挖掘方法,但如何有效地融合多種方法來使構(gòu)建的用戶畫像更為準(zhǔn)確,目前尚無統(tǒng)一的標(biāo)準(zhǔn)。此外,在構(gòu)建完成用戶畫像之后,如何利用用戶畫像標(biāo)簽系統(tǒng)進(jìn)行開創(chuàng)性的新服務(wù)模式,是目前需要在實(shí)踐應(yīng)用過程中進(jìn)一步總結(jié)的問題。
參考文獻(xiàn)
[1] 亓叢,吳俊.用戶畫像概念溯源與應(yīng)用場(chǎng)景研究[J].重慶交通大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2017,17(5):82-87.
[2] MAOJ,LU K,LIG,et al.Profiling users with tag networks in diffusion-based personalized recommendation[J].Journal of information science,2016,42(5):711-722.
[3] SHARMA D,KAUR S.Neural network classification for user profile learning over digital library recommendation engine[J].Indian journal of science&technology,2016,9(33):1-7.
[4] 陳廉芳.大數(shù)據(jù)環(huán)境下圖書館用戶小數(shù)據(jù)的采集、分析與應(yīng)用[J].國家圖書館學(xué)刊,2016(3):69-74.
[5] 徐芳,應(yīng)潔茹.國內(nèi)外用戶畫像研究綜述[J].圖書館學(xué)研究,2020(12):7-16.
[6] 劉海鷗,孫晶晶,陳晶,等.用戶畫像模型及其在圖書館領(lǐng)域中的應(yīng)用[J].圖書館理論與實(shí)踐,2018(10): 92-97.
[7] 范宇,李宏宇.高校圖書館個(gè)性化服務(wù)建設(shè)研究[J].河南圖書館學(xué)刊,2019(1):46-48.