明海?楊曉農(nóng)
【摘 要】文章主要分析基于用戶畫像的數(shù)字圖館精準(zhǔn)服務(wù)體系的建設(shè)要點(diǎn)及流程,首先對數(shù)字圖書館用戶畫像的基本需求和功能需求進(jìn)行分析,確定用戶畫像體驗(yàn)構(gòu)建的核心要素,其次通過架構(gòu)模型和聚類算法分析等實(shí)現(xiàn)用戶畫像的結(jié)果可視化,為用戶群體和個體提供精準(zhǔn)的服務(wù)內(nèi)容推薦。
【關(guān)? 鍵? 詞】用戶畫像;大數(shù)據(jù);數(shù)字圖書館;服務(wù)推薦
【作者單位】明海,蘇州科技大學(xué)圖書館;楊曉農(nóng),鄭州大學(xué)信息管理學(xué)院。
【基金項(xiàng)目】2016年國家社科基金項(xiàng)目《“超越存取”推廣行動背景下圖書館社會影響力研究》(16BTQ008)。
【中圖分類號】G252 【文獻(xiàn)標(biāo)識碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2022.03.019
面向用戶畫像的數(shù)字圖書館精準(zhǔn)服務(wù)體系建設(shè)具有重要意義?;谟脩艚嵌瘸霭l(fā)進(jìn)行研究,通過建立畫像能夠讓用戶獲取更好的服務(wù)內(nèi)容,獲得更好的數(shù)字圖書館使用體驗(yàn)。用戶使用數(shù)字圖書館的主要目的是獲取圖書資源,傳統(tǒng)的圖書館只是作為資源提供方,給用戶提供檢索信息和獲取資源的平臺,本質(zhì)上與線下圖書館區(qū)別不大。而基于用戶畫像的數(shù)字圖書館能夠?yàn)榭蛻籼峁﹤€性化服務(wù),可以根據(jù)用戶的愛好和需求幫助用戶挖掘更多其感興趣的資源,拓寬知識獲取范圍[1]。對數(shù)字圖書館來說,精準(zhǔn)的用戶特征分析可以幫助自身完善產(chǎn)品結(jié)構(gòu),依據(jù)用戶的選擇增加不同的服務(wù)內(nèi)容,調(diào)整產(chǎn)品服務(wù)內(nèi)容的開發(fā)方向,從而提高資源的有效利用率。
一、數(shù)字圖書館用戶畫像分析
1.用戶需求分析
在數(shù)字內(nèi)容日趨可計(jì)算化、語義化和數(shù)據(jù)化的當(dāng)下,數(shù)字圖書館迎來了與大數(shù)據(jù)相契合的多模態(tài)化改革,由資料檢索存儲等單一功能向多元化的服務(wù)方向發(fā)展,給用戶帶來了更好的使用體驗(yàn)[2]。用戶畫像對規(guī)劃數(shù)字圖書館服務(wù)戰(zhàn)略至關(guān)重要,能夠解決服務(wù)內(nèi)容的精準(zhǔn)度以及個性化服務(wù)定制等難題,實(shí)現(xiàn)由“人找服務(wù)”向“服務(wù)找人”的轉(zhuǎn)變。同時,用戶畫像能夠解決數(shù)字圖書館與用戶細(xì)粒度不對稱的問題,為每一個用戶貼上精準(zhǔn)的標(biāo)簽,從而實(shí)現(xiàn)圖書資源和服務(wù)內(nèi)容的精準(zhǔn)化推送。
用戶畫像的建立本質(zhì)上屬于大數(shù)據(jù)分析,需要明晰用戶的基本屬性、行為屬性、情感屬性、愛好屬性等多個維度的屬性,再通過交叉分析確定用戶的基本特征,以現(xiàn)有的可提供的服務(wù)內(nèi)容和可使用的資源為基礎(chǔ),向用戶推送偏好資源以及個性化服務(wù)內(nèi)容,并且根據(jù)不同的使用場景和其他外部屬性調(diào)整推送策略。建立用戶畫像旨在為顧客提供更好的服務(wù)以增強(qiáng)用戶的忠誠度,并通過用戶畫像對用戶行為的預(yù)測幫助用戶拓寬獲取知識的途徑。比如用戶喜好科普類圖書,但由于知識獲取途徑有限,其難以發(fā)現(xiàn)更多的圖書資源,圖書館就能利用用戶畫像結(jié)合推送算法為其提供豐富的資源,激發(fā)用戶使用數(shù)字圖書館及館內(nèi)數(shù)字產(chǎn)品的主動性[3]。
2.用戶畫像層次
用戶畫像是將用戶數(shù)據(jù)進(jìn)行收集分析,從而將用戶需求實(shí)現(xiàn)數(shù)據(jù)化、可視化和關(guān)聯(lián)化的過程,在此過程中,用戶的行為數(shù)據(jù)被貼上特征標(biāo)簽,當(dāng)用戶的標(biāo)簽足夠多時,系統(tǒng)就能夠勾畫出用戶的整體特征,即建立此用戶的行為畫像。建立用戶的行為畫像可分為接觸點(diǎn)數(shù)據(jù)、體系標(biāo)簽和方案產(chǎn)出三層,接觸點(diǎn)數(shù)據(jù)層包括數(shù)據(jù)來源和數(shù)據(jù)處理,體系標(biāo)簽層包括標(biāo)簽體系、標(biāo)簽權(quán)重和標(biāo)簽更新,方案產(chǎn)出層包括用戶畫像可視化和場景定義。
接觸點(diǎn)數(shù)據(jù)層收集到的用戶相關(guān)信息,最能體現(xiàn)用戶行為的三種信息是內(nèi)容偏好行為、社交行為和會話行為。內(nèi)容偏好行為包括閱讀、檢索、借閱、下載、預(yù)約、續(xù)借等操作,能夠反映用戶的性格、興趣愛好、圖書愛好等特征。社交行為與交流、分享、點(diǎn)贊、評論等操作相關(guān)聯(lián),能夠反映用戶的社交能力和性格特征等。會話行為包括登錄、訪問、瀏覽等操作,能夠反映用戶的日常生活習(xí)慣、閱讀習(xí)慣和數(shù)字圖書館使用習(xí)慣等。數(shù)據(jù)在收集完成后經(jīng)分析形成標(biāo)簽體系,為了讓標(biāo)簽的描述更加精準(zhǔn),系統(tǒng)在不斷更新標(biāo)簽內(nèi)容的同時,還要為每個標(biāo)簽加以權(quán)重區(qū)分,從而讓用戶的關(guān)鍵行為特征在標(biāo)簽體系中更加突出[4]。在完成前兩個步驟之后,系統(tǒng)就可以產(chǎn)出具體的用戶畫像方案,方案通常以可視化的形式呈現(xiàn),管理人員通過場景定義可對整個方案進(jìn)行校正。在數(shù)字圖書館的交互界面,后臺管理人員能夠?qū)?shù)據(jù)進(jìn)行分類、排序、組合,并使用曲線、二維圖形、三維立體圖形和動畫等多種形式加以展現(xiàn),展現(xiàn)用戶的象形思維。
二、數(shù)字圖書館用戶畫像的功能分析
1.整合用戶數(shù)據(jù)
數(shù)字圖書館建立用戶畫像,并以此作為用戶的行為數(shù)據(jù)庫,其目的在于幫助數(shù)字圖書館發(fā)掘用戶需求以及用戶潛在的商業(yè)價(jià)值,以便更好地感知市場動向,提高數(shù)字圖書館產(chǎn)品的用戶滿意度,吸引更多用戶。隨著用戶感知服務(wù)、預(yù)測發(fā)展等概念的出現(xiàn),圖書館的服務(wù)內(nèi)容也向更加多元化的方向發(fā)展,各個平臺和組織之間存在更多的聯(lián)動性,能夠打破部門和系統(tǒng)之間的障礙,建立數(shù)據(jù)共享機(jī)制,形成統(tǒng)一規(guī)劃的綜合服務(wù)體系。用戶畫像要從用戶角度出發(fā),以線索分析為數(shù)據(jù)來源,收集與用戶有關(guān)的各項(xiàng)數(shù)據(jù),再進(jìn)行分類整理,推測行為數(shù)據(jù)。
2.定位目標(biāo)用戶
數(shù)字圖書館的用戶畫像建立后,要與用戶的屬性特征相關(guān)聯(lián),通過屬性特征定位目標(biāo)用戶,即系統(tǒng)設(shè)定用戶標(biāo)簽后根據(jù)用戶畫像標(biāo)簽庫聚類個體用戶,根據(jù)用戶間的互動行為找出用戶間的相似度以及用戶的行為特征,再由個體用戶的行為特征向外擴(kuò)散,形成用戶行為特征群,實(shí)現(xiàn)目標(biāo)用戶群體的定位。從用戶角度來看,用戶畫像能夠幫助其詳細(xì)了解自身的潛在需求,而數(shù)字圖書館可以將用戶群體進(jìn)行特征分類,使用戶的借閱體驗(yàn)感得到提升。對數(shù)字圖書館產(chǎn)品本身來說,定位目標(biāo)用戶是拓展用戶資源、促使服務(wù)內(nèi)容多元化的必要條件。
3.輔助精準(zhǔn)推薦
數(shù)字圖書館的核心功能為提供檢索、檢查、借還、下載、會員等服務(wù)內(nèi)容,這些基本的服務(wù)內(nèi)容對每個用戶來說體驗(yàn)都是一致的,但是用戶內(nèi)心的服務(wù)標(biāo)準(zhǔn)不同,不僅與其性格、社會閱歷有關(guān),還與其服務(wù)需求標(biāo)準(zhǔn)等有關(guān),這些維度形成了用戶畫像的“像素”體系。在輔助精準(zhǔn)推薦體系下,用戶的隱顯興趣都可以被捕捉到,并且能夠在不同情境下獲得智能差異化服務(wù)[5]。其實(shí),輔助精準(zhǔn)推薦就是用戶偏好的關(guān)聯(lián)推薦,比如用戶喜歡看美食類書籍,輔助精準(zhǔn)推薦體系就可以為其推送與美食相關(guān)的內(nèi)容。
三、基于用戶畫像的數(shù)字圖書館服務(wù)推送體系框架設(shè)計(jì)
在用戶畫像內(nèi)容體系下,數(shù)字圖書館想要完善精準(zhǔn)推送服務(wù),應(yīng)至少滿足服務(wù)定位精準(zhǔn)化和服務(wù)功能用戶化兩個基本要求。服務(wù)定位精確化指服務(wù)定位不以群體為單位,而是細(xì)分到個人,為不同背景、不同文化程度、不同知識獲取需求的人提供差異化的個性服務(wù)和內(nèi)容,利用數(shù)據(jù)挖掘、聚類分析、預(yù)測分析等方法發(fā)現(xiàn)用戶有意表述的需求、潛在的隱性需求和預(yù)測用戶未來的需求發(fā)展方向等,以實(shí)現(xiàn)服務(wù)定位精準(zhǔn)化。服務(wù)功能用戶化指從用戶角度制定服務(wù)內(nèi)容,將服務(wù)體系與用戶的自然特征結(jié)合起來,幫助數(shù)字圖書館做到認(rèn)識用戶、理解用戶、了解用戶[6]。
1.體系組成要素
數(shù)字圖書館的精準(zhǔn)推薦服務(wù)體系要素由用戶、基礎(chǔ)數(shù)據(jù)、畫像建模三部分組成。用戶是服務(wù)的對象,也是主體。用戶畫像分析是系統(tǒng)基于用戶在使用數(shù)字圖書館過程中積累下的行為數(shù)據(jù),通過用戶產(chǎn)生行為的原因、目的來分析用戶的真實(shí)需求和基礎(chǔ)需求,從而實(shí)現(xiàn)用戶的特征分類和定位,即當(dāng)前用戶屬于哪一類用戶,如基礎(chǔ)用戶、核心用戶或者粉絲用戶等。給用戶設(shè)置類型標(biāo)簽才能精準(zhǔn)地為其定制服務(wù),這一切均建立在挖掘用戶真實(shí)需求的基礎(chǔ)上,數(shù)字圖書館在滿足用戶需求的過程中發(fā)現(xiàn)并確定服務(wù)核心點(diǎn),使服務(wù)內(nèi)容更有計(jì)劃性?;A(chǔ)數(shù)據(jù)是分析用戶行為特征的工具,也是連接數(shù)字圖書館用戶畫像與真實(shí)用戶的紐帶,主要包括用戶數(shù)據(jù)和館藏資源數(shù)據(jù),二者的結(jié)合可以使用戶的行為特征與服務(wù)需求聯(lián)系起來,用戶的需求越大,其計(jì)算權(quán)重越大。行為數(shù)據(jù)又分為正向數(shù)據(jù)和負(fù)向數(shù)據(jù),如喜歡屬于正向數(shù)據(jù),討厭則屬于負(fù)向數(shù)據(jù),此兩種類型數(shù)據(jù)對于用戶畫像的構(gòu)建來說均屬于核心數(shù)據(jù)。
2.架構(gòu)模型構(gòu)建
數(shù)字圖書館用戶畫像模型由數(shù)據(jù)模塊、推薦模塊和用戶模塊三部分構(gòu)成。
一是數(shù)據(jù)模塊。數(shù)據(jù)層屬于構(gòu)架的基礎(chǔ)層,數(shù)據(jù)模塊使數(shù)字圖書館具備一定的外界感知能力。一方面,用戶的需求主要通過數(shù)據(jù)分析來完成,數(shù)據(jù)收集過程需要借助各種感應(yīng)器,由于用戶基本上無法獲知整個數(shù)據(jù)獲取過程,所以收集數(shù)據(jù)更能呈現(xiàn)用戶真實(shí)的內(nèi)心想法,這是一種單向的感知路徑。在收集數(shù)據(jù)時,數(shù)字圖書館需要利用高端的設(shè)備拓寬數(shù)據(jù)來源的深度和廣度,實(shí)現(xiàn)對數(shù)據(jù)的高精度控制。另一方面,由于時刻都在產(chǎn)生新的數(shù)據(jù),用戶數(shù)據(jù)量將達(dá)到巨量級,數(shù)字圖書館用戶數(shù)據(jù)處理系統(tǒng)應(yīng)得到一定水平的技術(shù)支持,以保證計(jì)算的高效性和準(zhǔn)確性。不管是非結(jié)構(gòu)化數(shù)據(jù)還是半結(jié)構(gòu)化或是流式數(shù)據(jù)都要重新解構(gòu),不同結(jié)構(gòu)的數(shù)據(jù)都要經(jīng)過擇選、去劣、存優(yōu)、轉(zhuǎn)換、裝載等一系列標(biāo)準(zhǔn)化處理后才能移入知識庫,以提高用戶畫像的刻畫能力。
二是推薦模塊。推薦模塊是實(shí)現(xiàn)用戶畫像實(shí)際應(yīng)用價(jià)值的中間模塊,也是整個構(gòu)架模型中最關(guān)鍵的一環(huán)。在完成用戶的數(shù)據(jù)分析后,依據(jù)用戶行為特征實(shí)現(xiàn)資源的智能匹配即推薦模型生效的過程。
三是用戶模塊。用戶模塊是數(shù)字圖書館與用戶進(jìn)行人機(jī)交流的橋梁,也是用戶畫像可視化應(yīng)用的例證之一。系統(tǒng)根據(jù)已經(jīng)收集的用戶背景信息,給用戶設(shè)置不同類型的標(biāo)簽,在數(shù)據(jù)庫中針對每一類型的標(biāo)簽建立服務(wù)項(xiàng)目索引,從而為不同類型的用戶提供相應(yīng)的服務(wù)內(nèi)容[7]。在用戶模塊中,系統(tǒng)為了給用戶提供更加直觀簡易的人機(jī)交互界面,方便用戶第一時間找到核心功能或主推功能應(yīng),還要給用戶提供反饋信息的渠道。
四、基于用戶畫像的數(shù)字圖書館精準(zhǔn)推薦服務(wù)應(yīng)用
1.用戶畫像的可視化處理
在實(shí)際應(yīng)用過程中,數(shù)字圖書館首先要根據(jù)主要目標(biāo)用戶確定數(shù)據(jù)權(quán)重,比如用戶是高校學(xué)生群體,則應(yīng)將其與學(xué)習(xí)屬性相結(jié)合,服務(wù)內(nèi)容更偏向于學(xué)術(shù)研究方向,主要收集的數(shù)據(jù)為學(xué)生的基本在校信息(包括系別、年級、專業(yè)等)、借閱圖書的詳細(xì)信息、借走及歸還時間信息、產(chǎn)品使用頻率等。同時,數(shù)字圖書館還可以將用戶的基本信息劃分為個人信息和閱讀信息兩個維度,根據(jù)維度場景提煉有用信息。在主題分類之后,數(shù)字圖書館要根據(jù)主題內(nèi)容進(jìn)行變量可靠性檢驗(yàn),從而確定各個變量間的隱性聯(lián)系。其次是分析標(biāo)準(zhǔn)分類抽取,用戶畫像的差異性主要表現(xiàn)在標(biāo)簽的差異性上,不同特征的標(biāo)簽應(yīng)與主題維度相契合。最后,系統(tǒng)在獲得差異化標(biāo)簽的公因子后,再將公因子作為聚類分析的變量,通常會選用K-means聚類算法對目標(biāo)用戶群體進(jìn)行聚類整理,形成樣本相似庫,最終獲得樣本特征信息。
2.精準(zhǔn)推薦服務(wù)實(shí)現(xiàn)流程
應(yīng)用協(xié)同過濾算法能夠計(jì)算目標(biāo)用戶與每類項(xiàng)目中用戶群體的主題偏好相似度,尋找具有同類偏好的用戶群。一是針對不同類型的用戶群進(jìn)行服務(wù)推薦,進(jìn)一步將個體特征差異化,實(shí)現(xiàn)對群體內(nèi)個體的精準(zhǔn)服務(wù)推薦;二是構(gòu)建從用戶到圖書類別的偏好映射矩陣,使用K-means聚類算法對用戶的圖書偏好類型進(jìn)行聚類分析,通過計(jì)算最近鄰居、產(chǎn)生推薦等過程得出精確的聚類結(jié)果;三是綜合準(zhǔn)確率和召回率,對推薦結(jié)果進(jìn)行評估與改進(jìn)學(xué)習(xí),達(dá)到理想的服務(wù)標(biāo)準(zhǔn)。
大數(shù)據(jù)時代,數(shù)據(jù)的價(jià)值明顯提升,通過構(gòu)建用戶畫像幫助數(shù)字圖書館實(shí)現(xiàn)精準(zhǔn)的戰(zhàn)略定位和服務(wù)內(nèi)容戰(zhàn)略化調(diào)整,是未來業(yè)界重要的發(fā)展趨勢。借助用戶畫像,數(shù)字圖館能夠集中核心資源發(fā)展更有商業(yè)競爭力的服務(wù)項(xiàng)目,在此過程中,不僅優(yōu)化了用戶的服務(wù)體驗(yàn),而且還能讓數(shù)字圖書館更好地把握市場動向,挖掘用戶的潛在價(jià)值。
|參考文獻(xiàn)|
[1]劉海鷗,姚蘇梅,黃文娜,等. 基于用戶畫像的圖書館大數(shù)據(jù)知識服務(wù)情境化推薦[J]. 圖書館學(xué)研究,2018(24):57-63+32.
[2]宋美琦,陳燁,張瑞. 用戶畫像研究述評[J]. 情報(bào)科學(xué),2019(4):171-177.
[3]單軫,邵波. 國內(nèi)圖書館領(lǐng)域用戶畫像研究的冷思考:困境與出路[J]. 圖書館學(xué)研究,2019(5):8-13+30.
[4]許鵬程,畢強(qiáng),張晗,等. 數(shù)據(jù)驅(qū)動下數(shù)字圖書館用戶畫像模型構(gòu)建[J]. 圖書情報(bào)工作,2019(3):30-37.
[5]陳丹,柳益君,羅燁,等. 基于用戶畫像的圖書館個性化智慧服務(wù)模型框架構(gòu)建[J]. 圖書館工作與研究,2019(6):72-78.
[6]王慶,趙發(fā)珍. 基于“用戶畫像”的圖書館資源推薦模式設(shè)計(jì)與分析[J]. 現(xiàn)代情報(bào),2018(3):105-109+137.
[7]陳慧香,邵波. 國外圖書館領(lǐng)域用戶畫像的研究現(xiàn)狀及啟示[J]. 圖書館學(xué)研究,2017(20):16-20.
3275500589248