• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      面向精準(zhǔn)服務(wù)的圖書館用戶畫像研究

      2021-11-10 09:46:28曹樹金岳文玉
      關(guān)鍵詞:畫像咨詢書籍

      曹樹金,岳文玉

      (中山大學(xué)信息管理學(xué)院,廣州 510006)

      1 引言

      在大數(shù)據(jù)智能化時(shí)代,信息技術(shù)的發(fā)展和社會(huì)需求的變化,為圖書館的服務(wù)創(chuàng)新提供了新技術(shù)和新思路。近年來(lái),以人為本的服務(wù)理念成為當(dāng)代圖書館的重要議題[1],圖書情報(bào)領(lǐng)域的學(xué)者和工作人員越來(lái)越關(guān)注以用戶個(gè)性化需求為導(dǎo)向的圖書館精準(zhǔn)化服務(wù)水平的提升。圖書館既是海量信息資源的平臺(tái),又產(chǎn)生各類大數(shù)據(jù)(包括業(yè)務(wù)數(shù)據(jù)、讀者軌跡數(shù)據(jù)、交互數(shù)據(jù)等),如何組織、管理和利用讀者數(shù)據(jù),準(zhǔn)確分析和預(yù)測(cè)讀者需求,使之應(yīng)用于圖書館的精準(zhǔn)化服務(wù)是當(dāng)前亟需解決的問(wèn)題之一。

      讀者畫像利用各類用戶數(shù)據(jù)實(shí)現(xiàn)用戶屬性特征的揭示和組織,為圖書館的精準(zhǔn)化服務(wù)研究提供了具象化結(jié)果。本文從圖書館的多維度用戶數(shù)據(jù)出發(fā),選取某市圖書館的讀者作為研究對(duì)象,通過(guò)收集讀者的個(gè)人基本數(shù)據(jù)、借閱數(shù)據(jù)和讀者與客服在線問(wèn)答過(guò)程中產(chǎn)生的各類交互數(shù)據(jù)為其構(gòu)建讀者畫像,挖掘讀者的現(xiàn)實(shí)需求及潛在需求,為精準(zhǔn)推薦和服務(wù)提供有效的科學(xué)依據(jù),提升圖書館服務(wù)的個(gè)性化與智慧化水平。

      2 相關(guān)研究

      2.1 圖書館精準(zhǔn)服務(wù)的相關(guān)研究

      當(dāng)前關(guān)于精準(zhǔn)服務(wù)比較有代表性的概念是:精準(zhǔn)服務(wù)是以用戶為導(dǎo)向的強(qiáng)調(diào)依據(jù)用戶個(gè)性化需求配置資源的服務(wù)模式[2]。在大數(shù)據(jù)時(shí)代,新思維和新技術(shù)推動(dòng)圖書館服務(wù)模式創(chuàng)新并促進(jìn)圖書館服務(wù)能力提升[3]。為順應(yīng)大數(shù)據(jù)給圖書館信息服務(wù)帶來(lái)的影響,學(xué)者們紛紛就圖書館服務(wù)轉(zhuǎn)型提出了不同的見(jiàn)解。SIGUENZAGUZMAN 等[4]認(rèn)為,大數(shù)據(jù)技術(shù)為針對(duì)館藏開(kāi)展個(gè)性化推薦與服務(wù)方面提供更多的可能性。利用數(shù)據(jù)挖掘和文獻(xiàn)計(jì)量工具對(duì)圖書館服務(wù)中產(chǎn)生的數(shù)據(jù)進(jìn)行處理和分析,輔助圖書館決策和評(píng)估服務(wù)[5]。此外,還有學(xué)者利用數(shù)據(jù)挖掘技術(shù)對(duì)圖書館收集的各種數(shù)據(jù)集進(jìn)行數(shù)字圖書館服務(wù)推薦[6,7]、圖書館服務(wù)質(zhì)量指標(biāo)[8]、圖書館的利用模式及對(duì)用戶的影響[9]、社交媒體關(guān)注者的組成及特征[10]等進(jìn)行研究。有不少學(xué)者探討了圖書館應(yīng)用大數(shù)據(jù)技術(shù)將對(duì)圖書館管理和服務(wù)模式具有重要影響。如蘇新寧[11]、陳傳夫等[12]、王云等[13]均強(qiáng)調(diào)了利用大數(shù)據(jù)技術(shù)進(jìn)行圖書館管理和服務(wù)轉(zhuǎn)型的重要性。

      2.2 用戶畫像及其在圖書館服務(wù)中的應(yīng)用

      用戶畫像是基于用戶的直接數(shù)據(jù)和間接數(shù)據(jù)建立的目標(biāo)用戶模型[14]。目前用戶畫像在模型構(gòu)建[15,16]、指標(biāo)體系[17,18]、方法應(yīng)用[19,20]等方面已有了大量研究。在圖書情報(bào)領(lǐng)域,學(xué)者們也展開(kāi)了大量的研究,WU 等[21]基于用戶興趣和社交關(guān)系提出了一種共同演化模型以描述用戶畫像;曾群等[22]在構(gòu)建用戶畫像庫(kù)的基礎(chǔ)上,為不同類型的讀者制定個(gè)性化服務(wù);畢達(dá)天[23]基于空間向量模型,構(gòu)建移動(dòng)圖書館的用戶畫像模型;ZAUGG[24]依據(jù)不同類別用戶群體的需求和行為的不同構(gòu)建用戶畫像。程秀峰等[25]從自然、情境等維度構(gòu)建了用戶畫像的指標(biāo)體系和智慧參考服務(wù)模式。

      2.3 基于短文本主題挖掘的LDA 建模研究

      進(jìn)行主題建模時(shí)常用的方法包括BTM[26,27](Biterm Topic Model)、狄利克雷多項(xiàng)式混合模型DMM[28]、word2vec[29]以及LDA[30]等。

      LDA 模型多用于處理海量的長(zhǎng)文本數(shù)據(jù),交互式短文本由于內(nèi)容簡(jiǎn)短和交互性強(qiáng)的特點(diǎn),導(dǎo)致其在主題挖掘過(guò)程中的文本矩陣過(guò)于稀疏而無(wú)法分析,為了解決這一問(wèn)題,學(xué)者們一般采用擴(kuò)充文本長(zhǎng)度的方法進(jìn)行處理。部分學(xué)者通過(guò)引入外部數(shù)據(jù)集的方法進(jìn)行文本長(zhǎng)度的擴(kuò)充,如引入外部搜索數(shù)據(jù)[31,32]、對(duì)短文本進(jìn)行定義和分類[33]等,但這種文本長(zhǎng)度的擴(kuò)充方法在匹配合理性方面存在一定的障礙。因此,為了避免引入外部數(shù)據(jù)的弊端,部分學(xué)者采取了句子集群合并的方法。HONG[34]等通過(guò)拼接微博文本的方法,對(duì)微博文本進(jìn)行處理;NAKATA 等[35]將同一時(shí)間段出現(xiàn)的文本進(jìn)行合并,通過(guò)計(jì)算文本集合與主題的關(guān)聯(lián)度分析句子類型。上述學(xué)者從源文本角度進(jìn)行句子集群合并有效解決文本簡(jiǎn)短導(dǎo)致的無(wú)法分析的障礙。

      目前,圖書館領(lǐng)域?qū)ψx者畫像的研究多以理論研究為主,而且屬性偏單一,不能對(duì)用戶進(jìn)行全面多維的描述。因此本文通過(guò)收集讀者的個(gè)人基本數(shù)據(jù)、借閱數(shù)據(jù)和讀者與客服在線問(wèn)答過(guò)程中產(chǎn)生的各類交互數(shù)據(jù)為其構(gòu)建讀者畫像;在采用LDA 模型進(jìn)行主題分析時(shí),采用會(huì)話切分的方式擴(kuò)充文本長(zhǎng)度,解決文本簡(jiǎn)短導(dǎo)致的矩陣過(guò)于稀疏而無(wú)法分析的問(wèn)題。

      3 讀者畫像及其群像構(gòu)建的研究設(shè)計(jì)

      3.1 圖書館讀者畫像建??傮w框架

      圖書館讀者畫像主要對(duì)讀者借閱數(shù)據(jù)和在線交互數(shù)據(jù)進(jìn)行挖掘,深度揭示讀者需求。基于TF-IDF 算法和LDA 建模方法進(jìn)行讀者畫像總體框架的構(gòu)建。構(gòu)建讀者畫像的流程主要包括數(shù)據(jù)收集處理、單個(gè)/群體特征分析及讀者畫像這3 個(gè)過(guò)程,如圖1 所示。

      圖1 讀者畫像構(gòu)建總體框架Fig.1 The framework of reader profile construction

      3.2 研究方法與步驟

      在數(shù)據(jù)采集處理階段,為提高實(shí)驗(yàn)結(jié)果準(zhǔn)確性,對(duì)采集到的文本數(shù)據(jù)進(jìn)行預(yù)處理。對(duì)在線咨詢交互文本進(jìn)行會(huì)話切分,并采用ICTCLAS 分詞工具進(jìn)行漢語(yǔ)分詞處理,添加用戶自定義詞典,再通過(guò)去停用詞和詞性篩選等流程,過(guò)濾文本中對(duì)分析沒(méi)有意義的部分。這一部分工作的目的在于將讀者借閱數(shù)據(jù)和在線交互數(shù)據(jù)轉(zhuǎn)化為能夠進(jìn)行主題建模的標(biāo)準(zhǔn)語(yǔ)料庫(kù)以提取讀者特征,降低模型計(jì)算的復(fù)雜度,提升模型的運(yùn)行效率,提高用戶特征標(biāo)簽的可解釋性。

      讀者畫像的構(gòu)建分為單個(gè)讀者畫像的構(gòu)建和群體讀者畫像的構(gòu)建兩個(gè)部分。主要采用TF-IDF 算法和LDA 模型對(duì)讀者畫像進(jìn)行文本特征分析。TF-IDF 可以用來(lái)評(píng)估一個(gè)字詞在一個(gè)語(yǔ)料庫(kù)中的重要程度,詞的重要性隨著它在文件中出現(xiàn)的次數(shù)增加而增加,但與它在語(yǔ)料庫(kù)中的出現(xiàn)頻率成反比,TF 表示字詞的頻率,IDF 表示逆文本頻率,TF 值和IDF 值相乘得到TF-IDF 值,具有較高詞頻和較低逆文本頻率的詞可作為該文檔的代表標(biāo)簽[36,37]。LDA 主題生成模型是三層貝葉斯概率模型,其生成主題詞的具體過(guò)程為面向語(yǔ)料庫(kù)中的文檔,從主題分布中抽取一個(gè)主題,并在該主題中抽取主題詞,直至遍歷所有文檔中的詞,形成從文本-主題-詞的多項(xiàng)式分布。計(jì)算每個(gè)詞在一篇文檔中出現(xiàn)的概率[38]公式為:p(特征詞| 文檔)=∑主題p(特征詞| 主題) ×p(主題| 文檔)。將LDA 模型運(yùn)用于交互文本主題的挖掘可以實(shí)現(xiàn)基于語(yǔ)義層面的文本建模。通過(guò)TF-IDF 算法尋找代表文本內(nèi)容的關(guān)鍵詞,實(shí)現(xiàn)對(duì)讀者文本數(shù)據(jù)的有效挖掘,分析出讀者偏好。LDA 主題模型可以排除主觀因素的影響,挖掘出各主題中相關(guān)詞項(xiàng)。

      單個(gè)讀者畫像需要基于讀者的所有數(shù)據(jù)進(jìn)行標(biāo)簽化。采用TF-IDF 算法對(duì)單個(gè)讀者畫像進(jìn)行借閱書籍文本特征和在線咨詢文本特征分析,構(gòu)建單個(gè)讀者畫像,并依據(jù)該畫像制定精準(zhǔn)化信息服務(wù)。群體讀者畫像的構(gòu)建,從性別、年齡和咨詢活躍度3 個(gè)不同的維度對(duì)讀者進(jìn)行分類,采用TF-IDF 算法對(duì)不同群體用戶進(jìn)行借閱書籍文本特征分析以及采用LDA 模型對(duì)不同群體在線交互文本進(jìn)行主題提取,同時(shí)對(duì)比不同維度讀者群體的交互數(shù)據(jù)文本特征以及借閱書籍文本特征,根據(jù)多視角聚類結(jié)果,更加精準(zhǔn)的給不同群體讀者進(jìn)行推薦和服務(wù)。

      需要說(shuō)明的是,圖書館為了給讀者提供個(gè)性化精準(zhǔn)服務(wù),需要對(duì)海量的讀者個(gè)人信息、借閱偏好、交互記錄進(jìn)行充分的挖掘,這必然會(huì)涉及到用戶的隱私問(wèn)題。因此,在進(jìn)行數(shù)據(jù)處理的過(guò)程中,需要保障讀者的知情權(quán)和選擇權(quán),降低對(duì)讀者個(gè)人隱私數(shù)據(jù)的關(guān)注度,禁止隱私數(shù)據(jù)的過(guò)度挖掘。同時(shí),圖書館用戶數(shù)據(jù)的相關(guān)管理人員需要形成良好的職業(yè)道德修養(yǎng),保障讀者隱私數(shù)據(jù)不受侵犯。

      4 讀者畫像及其群像的構(gòu)建研究

      4.1 數(shù)據(jù)的收集和預(yù)處理

      數(shù)據(jù)主要由某市圖書館的讀者借閱和在線咨詢行為產(chǎn)生,這里按照數(shù)據(jù)所在維度的不同,分為讀者維度數(shù)據(jù)、圖書借閱維度和在線咨詢的數(shù)據(jù)。讀者維度數(shù)據(jù)集主要是反映讀者個(gè)人基本屬性的數(shù)據(jù),如讀者編號(hào)、性別、年齡、辦證日期等;圖書借閱數(shù)據(jù)主要收集了書名、作者以及借閱時(shí)間;讀者在線咨詢的數(shù)據(jù)主要包括咨詢時(shí)間、咨詢內(nèi)容。具體讀者畫像數(shù)據(jù)集包含的數(shù)據(jù)類型詳見(jiàn)圖2。

      圖2 讀者畫像數(shù)據(jù)集Fig.2 Reader profile data set

      本研究收集某市圖書館2019 年5 月15 日到2020年6 月04 日的數(shù)據(jù),包括300 名讀者的在線咨詢交互數(shù)據(jù)1 809 條以及圖書借閱數(shù)據(jù)168 217 條。在數(shù)據(jù)預(yù)處理階段,利用ICTCLAS 分詞工具將會(huì)話文本轉(zhuǎn)化為多個(gè)詞向量,添加用戶自定義詞典,并依據(jù)停用詞典過(guò)濾掉高頻無(wú)意義的助詞、介詞以及標(biāo)點(diǎn)符號(hào),如“謝謝”“好的”“個(gè)”等,通過(guò)規(guī)范數(shù)據(jù)格式和去除冗余數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理和清洗以保證數(shù)據(jù)質(zhì)量。經(jīng)過(guò)預(yù)處理,本文最終保留了292 名有效讀者的1 801 條在線咨詢交互數(shù)據(jù)和圖書借閱數(shù)據(jù)14 609 條。對(duì)在線咨詢文本進(jìn)行會(huì)話切分,即按照會(huì)話交互的時(shí)間間隔進(jìn)行文本合并,形成多集合的文本數(shù)據(jù)。再對(duì)這些文本進(jìn)行分詞處理、添加用戶自定義詞典以及停用詞過(guò)濾,使得文本結(jié)構(gòu)符合LDA 模型的分析要求。

      4.2 單個(gè)讀者畫像構(gòu)建

      單個(gè)讀者畫像需要基于讀者的所有數(shù)據(jù)進(jìn)行標(biāo)簽化。通過(guò)標(biāo)簽化實(shí)現(xiàn)對(duì)讀者的特征揭示,并為后續(xù)的數(shù)據(jù)挖掘工作進(jìn)行鋪墊。表1 和表2 給出了某讀者在借還書以及在線咨詢過(guò)程中產(chǎn)生的主要數(shù)據(jù)。

      表1 某讀者借閱數(shù)據(jù)示例(部分)Table 1 An example of a reader's borrowing data(part)

      表2 某讀者在線咨詢數(shù)據(jù)示例Table 2 An example of online consultation data of a reader

      對(duì)該讀者借閱書籍?dāng)?shù)據(jù)以及在線咨詢文本數(shù)據(jù)進(jìn)行特征分析,即對(duì)這些數(shù)據(jù)進(jìn)行向量化表示,向量的每一維由特征項(xiàng)及其權(quán)重組成,權(quán)重用TF-IDF 的方法來(lái)計(jì)算,計(jì)算公式如下:

      其中w(ti,d)是ti的權(quán)重,d為全部信息數(shù)據(jù)的集合,tf(ti,d)為ti在全部信息數(shù)據(jù)中的詞頻,N為全部信息數(shù)據(jù)的總數(shù),ni是數(shù)據(jù)集中出現(xiàn)ti的文本數(shù)量。輸出該讀者借閱書籍文本特征以及在線咨詢文本特征,為讀者實(shí)現(xiàn)精準(zhǔn)化的信息服務(wù)提供依據(jù)。

      該讀者的借閱書籍文本特征和在線咨詢文本特征如圖3 和圖4 所示,圖中字體的大小和粗細(xì)反應(yīng)重要程度的高低。讀者個(gè)人畫像示例及讀者分析報(bào)告如圖5、表3 所示。

      表3 單個(gè)讀者分析報(bào)告Table 3 Single reader analysis report

      圖3 讀者借閱書籍文本特征Fig.3 Text features of books borrowed by readers

      圖4 讀者在線咨詢交互文本特征Fig.4 Interactive text features of readers'online consultation

      圖5 個(gè)人讀者畫像示例Fig.5 An example of reader profile

      4.3 多維度群體讀者畫像構(gòu)建與分析

      單個(gè)讀者畫像可以全面地揭示出某個(gè)獨(dú)立讀者的特征,但在圖書館具體的精準(zhǔn)化信息服務(wù)中,還需要對(duì)不同類型群體的讀者屬性進(jìn)行研究。用戶群體畫像的研究目的就是為了了解各類群體內(nèi)某些共同的特征和需求,從不同的維度對(duì)讀者進(jìn)行分類,能夠更加精準(zhǔn)的為讀者進(jìn)行推薦和服務(wù),同時(shí)對(duì)比不同維度的讀者的交互數(shù)據(jù)文本特征以及借閱書籍文本特征,能夠有效的借鑒數(shù)據(jù),在用戶群體內(nèi)總結(jié)提煉出共性指標(biāo)作為推薦的依據(jù),有助于更好地了解讀者,進(jìn)而能夠幫助圖書館為讀者提供精準(zhǔn)服務(wù)。為了更好地掌握不同維度的讀者特征,下面將從讀者咨詢活躍度維度、

      年齡維度、性別維度對(duì)讀者畫像進(jìn)行分析。

      4.3.1 讀者咨詢活躍度維度分析

      讀者咨詢活躍度最直觀的表現(xiàn)了讀者對(duì)圖書館的需求,將讀者咨詢活躍度t定義為在一段時(shí)間內(nèi)讀者的在線咨詢次數(shù),通過(guò)統(tǒng)計(jì)在同一周期內(nèi)讀者的在線咨詢次數(shù)將讀者進(jìn)行分層?;谕恢芷趦?nèi)訪問(wèn)次數(shù)計(jì)算出平均值A(chǔ)之后,將訪問(wèn)次數(shù)大于0 次并小于0.5A的讀者定義為低咨詢活躍度,訪問(wèn)次數(shù)大于0.5A小于A的讀者定義為中咨詢活躍度,將訪問(wèn)次數(shù)大于A的讀者定義為高咨詢活躍度。得到咨詢活躍度范圍定級(jí)表,如表4 所示。

      表4 咨詢活躍度范圍定級(jí)表Table 4 Activity range grading table

      依據(jù)咨詢活躍度等級(jí)將292 名讀者劃分為3 個(gè)讀者群體,分析這3 個(gè)群體借閱書籍文本特征,并結(jié)合讀者在線交互數(shù)據(jù)揭示不同群體讀者屬性特征,為其實(shí)現(xiàn)更為精準(zhǔn)化的信息服務(wù)。

      低咨詢活躍度讀者群、中咨詢活躍度讀者群以及高咨詢活躍度讀者群的借閱書籍文本特征如圖6、圖7和圖8 所示,文本字體的大小和粗細(xì)反應(yīng)重要程度的高低。

      圖6 低咨詢活躍度讀者借閱書籍文本特征Fig.6 Text features ofbooks borrowed byreaders with low activity

      圖7 中咨詢活躍度讀者借閱書籍文本特征Fig.7 Text features ofbooks borrowed bymoderatelyactive readers

      圖8 高咨詢活躍度讀者借閱書籍文本特征Fig.8 Text features ofbooks borrowed byhighlyactive readers

      低咨詢活躍度讀者借閱書籍文本特征:《三國(guó)演義》 《伯羅奔尼撒戰(zhàn)爭(zhēng)史》 《大禹治水》 等歷史類的書籍以及張嘉驊編著少年讀史記系列的叢書受到歡迎?!兜静萑恕?《偷影子的人》 以及邢卓著的 《數(shù)學(xué)王國(guó)游樂(lè)園:數(shù)字王國(guó)的秘密》 系列叢書等適合少年兒童閱讀的書籍受到歡迎;中咨詢活躍度讀者借閱書籍文本特征:楊紅櫻、敖幼祥以及 《暴走漫畫》 創(chuàng)作部編繪的漫畫深受讀者喜愛(ài),《老人與海》 《廖若晨星》《父》 以及 《落花生》 等小說(shuō)散文類也是讀者熱衷的讀物;高咨詢活躍度讀者借閱書籍文本:由中國(guó)青年出版社出版的 《青年文摘》 和上海文藝出版社出版的《故事會(huì)》 這類青年雜志受到歡迎,天蠶土豆、唐家三少所著的玄幻小說(shuō)以及 《山本》 《浮生六記》 等小說(shuō)類文學(xué)受到讀者喜愛(ài)。另外,《托德先生的故事》 和(英)畢翠克絲·波特編繪的繪本類讀物也深受歡迎。

      為了得出低咨詢活躍度讀者的在線咨詢交互文本的主題特征,采用LDA 模型方法進(jìn)行主題挖掘工作。在試驗(yàn)階段,本研究預(yù)將主題設(shè)置為2~6 類,對(duì)各類詞項(xiàng)的隸屬概率進(jìn)行實(shí)驗(yàn)。研究發(fā)現(xiàn)將主題分為2~4類時(shí),每一類中的詞項(xiàng)概率隨著分類數(shù)量的增加而上升,但各個(gè)主題間的區(qū)分度不夠明顯,當(dāng)主題數(shù)設(shè)置為4 時(shí),實(shí)驗(yàn)結(jié)果較為理想,在分為5 類時(shí)詞項(xiàng)的分布概率下降。因此,將主題數(shù)目設(shè)置T=4,超參數(shù)設(shè)置為α=0.01,β=0.05,迭代1 000 次,抽取各主題下概率最高的前20 個(gè)術(shù)語(yǔ),利用Gibbs Sampling 進(jìn)行參數(shù)估計(jì)和推斷。同理將中咨詢活躍度讀者主題數(shù)T設(shè)為4,高咨詢活躍度讀者主題數(shù)T設(shè)為5,擇優(yōu)選取概率較高的10 項(xiàng)特征詞進(jìn)行展示,如表5、表6 和表7所示。

      表5 低咨詢活躍度讀者在線咨詢文本主題分布情況表Table 5 Topic distribution of online consultation texts of low activity readers

      表6 中咨詢活躍度讀者在線咨詢文本主題分布情況表Table 6 Topic distribution of online consultation texts of active readers

      表7 高咨詢活躍度讀者在線咨詢文本主題分布情況表Table 7 Topic distribution of online consultation texts of highly active readers

      可以發(fā)現(xiàn)低咨詢活躍度讀者較為關(guān)心圖書的逾期歸還、還書續(xù)借、預(yù)約以及密碼修改問(wèn)題;中咨詢活躍度讀者較為關(guān)心違約金的繳納、各聯(lián)合圖書館的地址以及開(kāi)館時(shí)間、辦證問(wèn)題、東西丟失如何找回的問(wèn)題;預(yù)約進(jìn)館、館藏書目查詢、還書形式、館內(nèi)WIFI連接以及圖書丟失問(wèn)題是高咨詢活躍度讀者較為關(guān)心的問(wèn)題。

      對(duì)這3 個(gè)群體的讀者特征進(jìn)行分析,發(fā)現(xiàn)低咨詢活躍度讀者在圖書館的主要活動(dòng)為書籍借閱,屬于經(jīng)常在圖書館借書的人群。但是這類讀者的咨詢活躍度不是很高,因此可以具體分析原因進(jìn)行改善,從而能夠吸引更多的讀者。中咨詢活躍度讀者對(duì)圖書館的資源使用主要集中在公共資源方面,從咨詢的問(wèn)題來(lái)看,該類讀者屬于經(jīng)常來(lái)館的讀者群體,屬于圖書館的忠實(shí)讀者。這類讀者對(duì)圖書館的研究?jī)r(jià)值最高,可以對(duì)這類讀者進(jìn)行調(diào)研,從而了解圖書館需改進(jìn)之處;高咨詢活躍度讀者在圖書館的主要活動(dòng)為館藏資源的閱讀和公共資源的使用,屬于經(jīng)常在圖書館讀書的人群,這類讀者對(duì)圖書館的館藏資源比較感興趣且經(jīng)常使用公共資源進(jìn)行自修。依據(jù)讀者特征的分析結(jié)果,為精準(zhǔn)服務(wù)提供依據(jù),具體服務(wù)策略詳見(jiàn)表8。

      表8 咨詢活躍度維度讀者服務(wù)策略分析表Table 8 Analysis of reader service strategies in the dimension of consultation activity

      4.3.2 讀者年齡維度分析

      年齡維度也是推薦時(shí)需要參考的重要因素,不同年齡段的讀者感興趣的圖書以及關(guān)心的問(wèn)題不同,因此周期性參考年齡維度的書籍變化以及咨詢問(wèn)題的主題變化情況,可以及時(shí)有效地為讀者進(jìn)行更精準(zhǔn)化的服務(wù)。本次數(shù)據(jù)來(lái)源的讀者年齡在4 歲至61 歲之間,依據(jù)聯(lián)合國(guó)世界衛(wèi)生組織提出年齡分段[39],我們將讀者年齡維度劃分為4~17 歲少兒及青少年讀者、18~45歲青年讀者以及46~61 歲中年讀者。3 個(gè)年齡段讀者的借閱書籍文本特征如圖9、圖10 和圖11 所示,3 個(gè)年齡段讀者在線咨詢文本主題分布情況如表9、表10和表11 所示,對(duì)3 個(gè)年齡段的讀者進(jìn)行特征分析,可得到3 個(gè)年齡段讀者群體特征和相應(yīng)服務(wù)策略,如表12 所示。

      表9 少兒及青少年讀者在線咨詢文本主題分布情況表Table 9 Topic distribution of online consultation texts of children and young readers

      表10 青年讀者在線咨詢文本主題分布情況表Table 10 Topic distribution of online consultation texts of young readers

      表11 中年讀者在線咨詢文本主題分布情況表Table 11 Topic distribution of online consultation texts of middle-aged readers

      圖9 少兒及青少年讀者借閱書籍文本特征Fig.9 Text features of books borrowed by children and young readers

      圖10 青年讀者借閱書籍文本特征Fig.10 Text features of books borrowed by young readers

      圖11 中年讀者借閱書籍文本特征Fig.11 Text features of books borrowed by middle aged readers

      可以發(fā)現(xiàn)該市圖書館制作的蜂蜂書包深受少兒及青少年讀者喜愛(ài),楊紅櫻、張嘉驊、朱斌、孫幼軍等兒童類書籍的作家和漫畫家受到歡迎,中國(guó)青年出版社出版的讀物受到少兒及青少年讀者歡迎;《青年文摘》 和 《故事會(huì)》 等青年雜志受到青年讀者歡迎,三毛、余非魚等編著的浪漫言情小說(shuō)受到讀者喜愛(ài),同時(shí),天蠶土豆和天下霸唱所著玄幻推理類小說(shuō)也較受歡迎;《父》 《落花生》 以及 《故事會(huì)》 等散文和民間故事集受到中年讀者的喜愛(ài),《一千零一夜》 《天生一對(duì)》 等兒童文學(xué)作品以及楊紅櫻、崔鐘雷編著的兒童作品也受到關(guān)注。

      從在線咨詢文本主題來(lái)看,少兒及青少年讀者較為關(guān)心預(yù)約、開(kāi)館閉館時(shí)間、圖書館活動(dòng)以及圖書丟失等問(wèn)題;青年讀者讀者較為關(guān)心還書續(xù)借、開(kāi)館閉館時(shí)間、預(yù)約以及自修室的問(wèn)題;中年讀者較為關(guān)心還書續(xù)借、密碼以及開(kāi)館閉館時(shí)間的問(wèn)題。

      對(duì)這3 個(gè)群體的讀者特征進(jìn)行分析,發(fā)現(xiàn)少兒及青少年群體讀者在圖書館的主要活動(dòng)為進(jìn)館閱讀和參加活動(dòng),而且年齡較小,對(duì)新奇的活動(dòng)和設(shè)備興趣會(huì)比較大;青年群體讀者在圖書館的主要活動(dòng)為借閱書籍以及公共資源的使用;中年群體讀者的主要活動(dòng)為在館閱讀書籍,說(shuō)明這類讀者對(duì)圖書館的館藏資源比較感興趣。依據(jù)讀者特征的分析結(jié)果,為精準(zhǔn)服務(wù)提供依據(jù),具體服務(wù)策略詳見(jiàn)表12。

      4.3.3 讀者性別維度分析

      從性別維度對(duì)讀者的分析可以揭示出不同性別的讀者對(duì)書目以及圖書館公共資源使用的偏好,從而更精準(zhǔn)的為讀者提供信息服務(wù)。對(duì)男性讀者和女性讀者分別做借閱書籍文本特征分析和在線咨詢交互文本分析,兩個(gè)性別讀者的借閱書籍文本特征如圖12 和13所示,在線咨詢交互文本的主題分析采用LDA 模型的方法,擇優(yōu)選取概率較高的10 項(xiàng)特征詞進(jìn)行展示,如表13 和表14 所示。最終可得到不同性別讀者群體特征,并據(jù)此提出服務(wù)策略,如表15 所示。

      表13 女性讀者在線咨詢文本主題分布情況表Table 13 Topic distribution of online consultation texts of female readers

      表14 男性讀者在線咨詢文本主題分布情況表Table 14 Topic distribution of online consultation texts of male readers

      圖12 女性讀者借閱書籍文本特征Fig.12 Text features of books borrowed by female readers

      表12年齡維度讀者服務(wù)策略對(duì)比表Table 12 Comparison of reader service strategies in age dimension

      從借閱書籍文本特征來(lái)看,中國(guó)青年出版社出版的 《青年文摘》 受到女性讀者歡迎?!读稳舫啃恰贰对?jīng)滄?!?等愛(ài)情小說(shuō),天蠶土豆、唐家三少所著的玄幻類小說(shuō)也備受歡迎,《一千零一夜》 《天生一對(duì)》以及楊紅櫻編著的書籍等適合少年兒童閱讀的書籍受到歡迎;《偽裝者》 《薄冰》 《猛士》 和 《遠(yuǎn)大前程》等歷史諜戰(zhàn)類軍事類小說(shuō)是男性讀者熱衷的讀物,《三國(guó)演義》 是借閱次數(shù)最多的書籍。

      圖13 男性讀者借閱書籍文本特征Fig.13 Text features of books borrowed by male readers

      從在線咨詢文本主題來(lái)看,女性讀者較為關(guān)心違約金、館藏、預(yù)約以及辦證等問(wèn)題;男性讀者較為關(guān)心預(yù)約、館內(nèi)資源的使用、還書以及登錄密碼的問(wèn)題。

      對(duì)這兩個(gè)群體的讀者特征進(jìn)行分析,發(fā)現(xiàn)女性讀者在圖書館較為關(guān)注違約金的繳納以及館藏書籍;男性讀者對(duì)圖書館的資源使用主要集中在公共資源方面,包括WIFI 以及自修室的使用。依據(jù)讀者特征的分析結(jié)果,為精準(zhǔn)服務(wù)提供依據(jù),具體服務(wù)策略詳見(jiàn)表15。

      表15 基于兩性讀者群特征分析的服務(wù)策略Table 15 Service strategy based on the analysis of the characteristics of male and female readers

      5 結(jié)語(yǔ)

      本文以某市圖書館的讀者基本數(shù)據(jù)、圖書借閱數(shù)據(jù)和在線咨詢數(shù)據(jù)為基礎(chǔ),結(jié)合TF-IDF 模型和LDA模型進(jìn)行分析,得到讀者借閱書籍文本特征和在線咨詢文本特征,組成單個(gè)讀者畫像和群體讀者畫像,并依據(jù)讀者畫像提出針對(duì)性服務(wù)策略的建議。

      本研究具有一定的理論意義,以往學(xué)者多采用引入外部數(shù)據(jù)的方法進(jìn)行交互式短文本的主題挖掘。本文加入會(huì)話切分的預(yù)處理方法進(jìn)行LDA 建模,優(yōu)化LDA 模型結(jié)果,可以實(shí)現(xiàn)針對(duì)讀者在線咨詢數(shù)據(jù)這類交互式短文本的主題抽取,挖掘出讀者關(guān)注的問(wèn)題。

      本文構(gòu)建的多維圖書館讀者畫像分析框架,實(shí)現(xiàn)了讀者屬性特征的揭示與組織,為圖書館的精準(zhǔn)化服務(wù)研究提供了新思路。從不同維度讀者群體畫像的分析來(lái)看,不同群體咨詢的主題內(nèi)容側(cè)重點(diǎn)存在差異。圖書館應(yīng)在準(zhǔn)確挖掘用戶潛在需求的基礎(chǔ)上,向特定讀者提供所需的智慧型知識(shí)產(chǎn)品和服務(wù)[40],實(shí)現(xiàn)精準(zhǔn)化服務(wù)的最終目標(biāo)。

      本研究的數(shù)據(jù)覆蓋面有限,對(duì)數(shù)據(jù)所蘊(yùn)含讀者特征的揭示還不夠深入,未來(lái)可以沿著這個(gè)方向開(kāi)展更全面具體的研究。

      猜你喜歡
      畫像咨詢書籍
      魯迅與“書籍代購(gòu)”
      威猛的畫像
      “00后”畫像
      畫像
      AOS在書籍編寫的應(yīng)用
      書籍
      咨詢聯(lián)盟大有可為
      書籍是如何改變我們的
      潛行與畫像
      健康咨詢
      祝您健康(1987年2期)1987-12-30 09:52:28
      新津县| 成都市| 曲周县| 寿阳县| 从江县| 北川| 汕头市| 天全县| 株洲县| 哈尔滨市| 宕昌县| 长宁县| 蓝山县| 利川市| 独山县| 萨嘎县| 梁山县| 舒城县| 鄯善县| 周宁县| 宾川县| 灯塔市| 竹溪县| 虹口区| 连江县| 泸州市| 巧家县| 锡林浩特市| 奎屯市| 金坛市| 海门市| 芮城县| 东港市| 桐梓县| 甘肃省| 利津县| 孙吴县| 刚察县| 扶余县| 武冈市| 大丰市|