葉穎
摘 要 圖書館閱讀推廣活動(dòng)所產(chǎn)生的用戶數(shù)據(jù)對(duì)于進(jìn)行與讀者有關(guān)的研究具有重要價(jià)值。論文通過LDA主題模型對(duì)閱讀推廣活動(dòng)中讀者書目推薦評(píng)論的主題內(nèi)容進(jìn)行挖掘,再使用余弦定理進(jìn)行相似度計(jì)算,然后根據(jù)計(jì)算結(jié)果、融合讀者背景信息進(jìn)行個(gè)性化的書目推薦。實(shí)驗(yàn)結(jié)果表明,論文構(gòu)建的書目推薦方法能夠依據(jù)讀者參加的閱讀推廣活動(dòng)的內(nèi)容進(jìn)行相關(guān)書目的推薦,拓展了圖書館閱讀推廣服務(wù)有關(guān)研究的應(yīng)用范圍,為圖書館書目的采購與推薦工作提供了有益的參考。
關(guān)鍵詞 LDA 困惑度 相似度 推薦方法
分類號(hào) G251.4
DOI 10.16810/j.cnki.1672-514X.2021.10.006
Research on Bibliographic Personalized Recommendation Method for Reading Promotion Review Data
Ye Ying
Abstract The user data generated by library reading promotion activities is of great value for the research related to readers. This paper uses LDA topic model to mine the topic content of readers bibliographic recommendation comments in reading promotion activities, then uses cosine theorem to calculate the similarity, and then carries out personalized bibliographic recommendation according to the calculation results and integrating readers background information. The experimental results show that the bibliographic recommendation method constructed in this paper can recommend relevant bibliographies according to the contents of reading promotion activities participated by readers, expand the application scope of relevant research on library reading promotion services, and provide a useful reference for library bibliographic procurement and recommendation.
Keywords LDA. Perplexity. Similarity. Recommendation method.
閱讀推廣在過去二十年多年中逐漸成為圖書館的主流服務(wù)之一,目前已經(jīng)發(fā)展為圖書館服務(wù)中最具活力、最能體現(xiàn)圖書館核心價(jià)值的一環(huán)[1]。閱讀推廣服務(wù)由閱讀指導(dǎo)發(fā)展而來,而后經(jīng)歷讀者咨詢等形式上的變化,最后演化為如今的閱讀推廣服務(wù)[2]。通常意義下,圖書館閱讀推廣的主要工作可以分為激發(fā)閱讀意愿、培養(yǎng)閱讀能力、跨越閱讀障礙三個(gè)方面。隨著信息技術(shù)的迅猛發(fā)展,閱讀推廣的服務(wù)范圍與內(nèi)容越來越廣泛,形式越來越多樣,服務(wù)也由線下逐步轉(zhuǎn)移到了線上。在不斷的積累與完善中,圖書館閱讀推廣服務(wù)產(chǎn)生了大量的讀者推薦數(shù)據(jù),這些數(shù)據(jù)與傳統(tǒng)的書目借閱數(shù)據(jù)在圖書館讀者行為的研究中具有同樣重要的意義,因此如何利用圖書館閱讀推廣數(shù)據(jù)進(jìn)行讀者研究,甚至于提升文獻(xiàn)借閱指標(biāo),進(jìn)行智慧化的精準(zhǔn)服務(wù),成為了圖書館閱讀推廣服務(wù)研究的一個(gè)新方向。
1 相關(guān)文獻(xiàn)綜述
1.1 圖書館閱讀推廣的有關(guān)研究
當(dāng)前國(guó)內(nèi)外閱讀推廣的有關(guān)研究可以分為三個(gè)方面。首先是圖書館閱讀推廣的基礎(chǔ)理論、制度、體系的有關(guān)研究,如于良芝等[3]從循證圖書館學(xué)的角度對(duì)圖書館閱讀推廣的研究領(lǐng)域進(jìn)行劃分,明確了閱讀推廣的研究?jī)?nèi)容;Elliott[4]指出,閱讀推廣在進(jìn)行讀者服務(wù)中具有極為重要的意義,它是圖書館服務(wù)的基本組成部分,建立有效的制度體系對(duì)圖書館的發(fā)展至關(guān)重要;張偉[5]通過對(duì)閱讀推廣活動(dòng)中各種內(nèi)部資源要素進(jìn)行規(guī)劃和設(shè)置,構(gòu)建了閱讀推廣管理制度體系;謝蓉等[6]提出了圖書館閱讀推廣的定義,明確了閱讀推廣的目標(biāo)與類型,為閱讀推廣的發(fā)展提供了理論依據(jù)。其次是圖書館閱讀推廣的模式、案例、實(shí)踐的有關(guān)研究,如Tilley[7]研究了鼓勵(lì)對(duì)青少年進(jìn)行漫畫以外兒童書籍的閱讀推廣的活動(dòng)策略;耿寒冰等[8]研究孤兒學(xué)生的閱讀情況,發(fā)現(xiàn)其閱讀中出現(xiàn)的問題,通過閱讀循環(huán)圈理論提出為孤兒等弱勢(shì)群體進(jìn)行閱讀推廣服務(wù)的模式與策略;孫媛媛等[9]以二十四節(jié)氣為切入點(diǎn)將中華傳統(tǒng)文化與閱讀推廣進(jìn)行融合,研究了針對(duì)高校圖書館的立體閱讀推廣模式。最后,還有對(duì)閱讀推廣服務(wù)影響與評(píng)價(jià)的有關(guān)研究,如岳修志[10]提出了針對(duì)閱讀推廣活動(dòng)的評(píng)價(jià)指標(biāo)以及全民閱讀體系及其評(píng)價(jià)指標(biāo),同時(shí)依據(jù)這些指標(biāo)對(duì)閱讀推廣活動(dòng)的過程及其要素進(jìn)行了分析;劉一鳴等[11]針對(duì)傳統(tǒng)文化類有聲書的閱讀推廣服務(wù)構(gòu)建了績(jī)效評(píng)價(jià)指標(biāo)體系,從內(nèi)容等多個(gè)維度出發(fā),提出傳統(tǒng)文化類有聲書的閱讀推廣服務(wù)策略。
從上述文獻(xiàn)綜述可以發(fā)現(xiàn),國(guó)內(nèi)外有關(guān)閱讀推廣的研究從概念入手確定了閱讀推廣的定義,提供了閱讀推廣的理論基礎(chǔ);從案例入手介紹了閱讀推廣的應(yīng)用情況,進(jìn)行了閱讀推廣的可行性分析;從評(píng)價(jià)入手分析了閱讀推廣的實(shí)施效果,為閱讀推廣進(jìn)一步提升服務(wù)質(zhì)量提供了策略和措施。然而筆者發(fā)現(xiàn),針對(duì)閱讀推廣數(shù)據(jù)利用與分析的有關(guān)研究較為少見,因此如何利用閱讀推廣評(píng)論數(shù)據(jù)擴(kuò)展圖書館用戶行為分析的范圍,成為了閱讀推廣有關(guān)研究的一個(gè)新領(lǐng)域。
1.2 圖書館書目推薦的有關(guān)研究
當(dāng)前國(guó)內(nèi)外圖書館書目推薦的有關(guān)研究一方面集中在分析圖書相似度后依據(jù)用戶借閱記錄進(jìn)行推薦,如Tewari[12]依據(jù)圖書內(nèi)容提出了一種基于內(nèi)容過濾、協(xié)同過濾和關(guān)聯(lián)規(guī)則挖掘的圖書推薦方法;田野等[13]將館藏?cái)?shù)據(jù)與外部相關(guān)的關(guān)聯(lián)數(shù)據(jù)相融合,依據(jù)內(nèi)容關(guān)聯(lián)相似圖書針對(duì)不同用戶進(jìn)行書目推薦。另一方面書目推薦的有關(guān)研究依據(jù)用戶相似度,為相似用戶推薦具有共同特征的圖書,如Vaz等[14]根據(jù)讀者書單的相似性對(duì)讀者進(jìn)行分類,并根據(jù)讀者的不同類型進(jìn)行書目的分類推薦;Sohail等[15]根據(jù)用戶的書評(píng)構(gòu)建圖書標(biāo)簽,依據(jù)標(biāo)簽的相似性為用戶提供圖書的分類推薦;彭博[16]融合用戶的背景信息與借閱數(shù)據(jù),為具有相似特征的用戶進(jìn)行個(gè)性化的書目推薦。
在圖書館書目推薦的有關(guān)研究中,學(xué)者們多依據(jù)讀者的借閱行為與圖書內(nèi)容標(biāo)簽作為數(shù)據(jù)來源進(jìn)行書目推薦,而針對(duì)讀者的有關(guān)特征進(jìn)行的推薦研究多以讀者的年齡、職業(yè)、專業(yè)等固定屬性進(jìn)行分類,由于讀者數(shù)據(jù)采集的難度,難以根據(jù)讀者的內(nèi)在特征,如性格、愛好等進(jìn)行分類,致使分類精度較低。而圖書館閱讀推廣服務(wù)中產(chǎn)生的數(shù)據(jù),如讀者的推薦、評(píng)論、點(diǎn)贊等,為內(nèi)在特征的分類提供了新的數(shù)據(jù)來源,彌補(bǔ)了當(dāng)前書目推薦研究的缺失。
2 面向閱讀推廣的書目推薦算法及關(guān)系構(gòu)建
在高校圖書館的線上閱讀活動(dòng)中,讀者都會(huì)在閱讀行為中留下相關(guān)的閱讀偏好與評(píng)論,據(jù)此可以產(chǎn)生書目推薦數(shù)據(jù)與書目評(píng)論數(shù)據(jù)。由于參與讀者實(shí)名制的原因,可以通過圖書館管理系統(tǒng)同時(shí)獲取讀者的專業(yè)、年級(jí)等外部屬性數(shù)據(jù)。讀者的推薦數(shù)據(jù)代表了其對(duì)圖書的喜好;讀者的評(píng)論數(shù)據(jù)可以挖掘其內(nèi)在特征與書目的內(nèi)容特征,外部屬性數(shù)據(jù)的補(bǔ)充則可以進(jìn)一步強(qiáng)化讀者相似性的提取。使用高校圖書館閱讀推廣中的評(píng)論數(shù)據(jù)進(jìn)行讀者特征與書目?jī)?nèi)容的挖掘相較于當(dāng)前基于豆瓣讀書、微博等社會(huì)化媒體進(jìn)行的研究更貼合圖書館讀者的實(shí)際情況,其數(shù)據(jù)挖掘與書目推薦的效果也更加精確。
2.1 讀者相似度計(jì)算方法
讀者在閱讀推廣活動(dòng)中的書目推薦評(píng)論一方面概括了所推薦書目的主要內(nèi)容,另一方面評(píng)論中的語言風(fēng)格、用詞方式則是讀者思維與性格的體現(xiàn)。提取評(píng)論的主要內(nèi)容并加以精煉,可以將書目?jī)?nèi)容與讀者個(gè)性相結(jié)合,找出愛好相同類型書目及性格相近的讀者并進(jìn)行分類。
在用戶評(píng)論內(nèi)容的提取上,文章采用LDA主題模型對(duì)閱讀推廣活動(dòng)中的讀者推薦評(píng)論進(jìn)行主題識(shí)別。LDA模型是一種三層貝葉斯概率模型[17],通過分析文檔、主題、詞項(xiàng),假設(shè)所有的文檔中有一定數(shù)量的隱含主題,通過一定概率抽取主題,然后再選定主題中抽取的特征詞,通過預(yù)設(shè)的迭代次數(shù)得到足夠的特征詞[18],文檔中包含特征詞的概率為:
(1)
對(duì)每位讀者的推薦評(píng)論進(jìn)行主題識(shí)別后,由于參與閱讀推廣活動(dòng)的讀者數(shù)量有限,如果直接從主題關(guān)鍵詞相似程度來計(jì)算讀者相似度,會(huì)由于讀者評(píng)論數(shù)據(jù)的稀疏性而造成相似度為0的情況,而增加LDA主題模型所提取主題關(guān)鍵詞的個(gè)數(shù)則會(huì)忽略讀者評(píng)論中的語義相似度,進(jìn)一步放大數(shù)據(jù)稀疏性所帶來的影響,因此需要根據(jù)主題內(nèi)容的特征對(duì)讀者進(jìn)行分類,將具有一定特征的讀者視為一類,以增加讀者評(píng)論數(shù)據(jù)的關(guān)聯(lián)程度。鑒于上述情況,文章以讀者為單位,將每位讀者的評(píng)論匯集為一篇文檔,采用文檔集合的最優(yōu)主題數(shù)量作為讀者分類的基數(shù)。但LDA模型無法確定文檔集合的最優(yōu)主題數(shù)量,因此文章使用困惑度[19]指標(biāo),通過計(jì)算文檔集合的困惑度來決定最優(yōu)主題數(shù),計(jì)算公式為:
(2)
其中p(w)代表測(cè)試集中每一個(gè)詞的出現(xiàn)概率,N表示測(cè)試集,按照主題數(shù)量通過公式對(duì)文檔集合進(jìn)行困惑度計(jì)算,選擇變化程度最高的主題數(shù)作為最優(yōu)主題數(shù)。
文章將同一分類中的讀者相似度計(jì)為1,而不同分類間的相似度使用余弦定理進(jìn)行計(jì)算,以選定分類為入口進(jìn)行兩兩計(jì)算,其值越接近于1,則表明兩類讀者越相似,計(jì)算公式為:
(3)
為了更進(jìn)一步地體現(xiàn)讀者特征,文章把從圖書館管理系統(tǒng)中得到的讀者外部屬性作為相似度增項(xiàng)加入到最終相似度的計(jì)算中,如兩位讀者處于同一年級(jí)則相似度為1,若不同則為0;同理,兩位讀者屬于同一專業(yè)則相似度為1,不同則為0。讀者的年級(jí)信息、專業(yè)信息和基于評(píng)論內(nèi)容計(jì)算的相似度按1:1:8的比例,作為最終用戶相似度的計(jì)算結(jié)果。
2.2 讀者—書目關(guān)系構(gòu)建
文章根據(jù)閱讀推廣中的讀者推薦數(shù)據(jù)進(jìn)行讀者—書目關(guān)系的構(gòu)建,構(gòu)建方法為:若讀者在21天中推薦的書目只有一個(gè),則讀者與書目之間建立關(guān)聯(lián)關(guān)系,關(guān)系權(quán)重為1;若讀者在21天中推薦了多個(gè)書目,則按照單一書目推薦天數(shù)占總推薦天數(shù)的比例乘以1,作為單一書目的與讀者間關(guān)聯(lián)關(guān)系的權(quán)重。其計(jì)算公式為:
(4)
其中P為讀者與書目間的關(guān)系權(quán)重,dr為單一書目的推薦天數(shù),d為閱讀推廣活動(dòng)持續(xù)的天數(shù),在文章的研究中取值為21。
綜合上述內(nèi)容,面向閱讀推廣的書目推薦模型如圖1所示,書目推薦以選定讀者為切入點(diǎn)進(jìn)行讀者相似度的計(jì)算,最終的書目推薦權(quán)重以讀者相似度計(jì)算值與讀者—書目關(guān)系的乘積取得。其計(jì)算公式為:
(5)
其中Rs代表讀者相似度,P代表讀者—書目關(guān)系權(quán)重,Br值越接近于1,代表書目推薦的優(yōu)先度越高,最終推薦結(jié)果根據(jù)Br的值由高到低排列。面向閱讀推廣的書目推薦方法如圖1所示。
3 實(shí)驗(yàn)
文章以中南財(cái)經(jīng)政法大學(xué)“閱跑中南”閱讀推廣活動(dòng)的第一季為數(shù)據(jù)來源。中南財(cái)經(jīng)政法大學(xué)“閱跑中南”閱讀推廣活動(dòng)開始于2018年9月,活動(dòng)內(nèi)容為讀者連續(xù)21天閱讀一本或多本書籍,并堅(jiān)持每天在“閱跑中南”線上專區(qū)發(fā)布話題,進(jìn)行閱讀打卡,期間可以任意選擇書籍進(jìn)行閱讀。打卡內(nèi)容為語音朗誦、圖片記錄、視頻分享、閱讀心得、讀書筆記、人生感悟、思維導(dǎo)圖等。第一季活動(dòng)共有709名讀者報(bào)名參加,發(fā)表話題5628條。本實(shí)驗(yàn)將讀者、推薦書目與話題內(nèi)容進(jìn)行關(guān)聯(lián),對(duì)單個(gè)讀者推薦同一本書的話題數(shù)進(jìn)行累加,以計(jì)算該書在讀者推薦書目中的權(quán)重,并同時(shí)通過圖書館管理系統(tǒng)同步讀者專業(yè)及年級(jí)的背景信息。
3.1 讀者相似度的計(jì)算
文章首先對(duì)閱讀推廣活動(dòng)中的讀者評(píng)論進(jìn)行分詞,分詞工具選用Python語言下的Jieba分詞工具包,停用詞表選取哈工大停用詞表。分詞后的結(jié)果顯示每位讀者在整個(gè)活動(dòng)中發(fā)表評(píng)論的詞數(shù)平均值為274,文章按5%的比例抽取關(guān)鍵詞作為讀者評(píng)論的主題代表,因此LDA模型在每個(gè)主題下選取的主題關(guān)鍵詞數(shù)k都取值為14。隨后根據(jù)上文中的LDA困惑度計(jì)算方法,選擇主題詞個(gè)數(shù)14進(jìn)行困惑度的計(jì)算,以確定潛在的最優(yōu)主題數(shù)K,計(jì)算范圍選擇的主題個(gè)數(shù)為1~50。計(jì)算結(jié)果如圖2所示,橫軸表示主題個(gè)數(shù),縱軸表示困惑度值。從圖中可以發(fā)現(xiàn),主題增加,困惑度值呈波動(dòng)下降;隨著主題取值的進(jìn)一步增加,困惑度值不斷減小且趨于穩(wěn)定。在主題個(gè)數(shù)為9時(shí),困惑度出現(xiàn)首次波動(dòng)并呈現(xiàn)出局部極小值,之后繼續(xù)增加主題數(shù)所得收益要小于增加主題數(shù)的投入,因此確定9為最優(yōu)主題數(shù)[20],即表示在數(shù)據(jù)集中的評(píng)論內(nèi)容可以被分為9類,相應(yīng)地也代表參加本次閱讀推廣活動(dòng)的讀者根據(jù)其評(píng)論內(nèi)容可以被分為9種類型。
在確定了最優(yōu)主題數(shù)后,文章使用LDA主題模型對(duì)閱讀推廣讀者評(píng)論進(jìn)行主題分類,模型的超參數(shù)取α=50/K,β=0.01,迭代次數(shù)設(shè)置為50次,主題數(shù)選擇為9,主題關(guān)鍵詞數(shù)目選擇為14。通過LDA主題模型獲取的主題分類如表1所示,主題關(guān)鍵詞后的數(shù)字代表該關(guān)鍵詞與該主題的關(guān)聯(lián)程度,也代表其在分類中的重要程度。
隨后文章利用表1的結(jié)果進(jìn)行讀者相似度計(jì)算。該計(jì)算方法是以某一位讀者為切入點(diǎn)來計(jì)算出與其處于同一分類下的其他讀者,而后根據(jù)其他讀者的背景信息進(jìn)行復(fù)合加權(quán),選擇評(píng)論內(nèi)容最相似讀者的關(guān)聯(lián)書目進(jìn)行推薦。
文章以系統(tǒng)編號(hào)69924406的讀者為例進(jìn)行讀者相似度計(jì)算,其在21次的閱讀推廣活動(dòng)打卡中有15次推薦《人間有味是清歡》、3次推薦《不可承受的生命之輕》、3次推薦《并購之后》。通過LDA主題模型以主題數(shù)1、主題關(guān)鍵詞數(shù)14計(jì)算其評(píng)論中的主題關(guān)鍵詞。結(jié)果如表2所示,該讀者屬于分類6,而后根據(jù)余弦定理計(jì)算該讀者與其他分類中讀者的相似度。將讀者進(jìn)行分類是為了避免前文中讀者評(píng)論數(shù)據(jù)的稀疏性影響所有讀者間關(guān)聯(lián)關(guān)系的建立,分類后由于所有分類間具有一定的相似度,也就不會(huì)影響單個(gè)讀者間關(guān)聯(lián)關(guān)系的建立,繼而建立所有參加閱讀推廣活動(dòng)讀者間推薦書目的關(guān)聯(lián)。
在獲得讀者評(píng)論相似度后,文章根據(jù)前文中的方法,將該讀者的背景信息與各分類中讀者的背景信息進(jìn)行匹配,引入讀者專業(yè)與年級(jí)進(jìn)行加權(quán)讀者相似度的計(jì)算。與該讀者同專業(yè)背景的讀者專業(yè)相似度為1,不同則為0,專業(yè)判定標(biāo)準(zhǔn)以國(guó)務(wù)院學(xué)位委員會(huì)學(xué)科評(píng)議組審核的《授予博士、碩士學(xué)位和培養(yǎng)研究生的學(xué)科、專業(yè)目錄》中的12種學(xué)科門類為依據(jù)劃分;讀者年級(jí)相似度依照本科、研究生年級(jí)進(jìn)行劃分,與該讀者同年級(jí)的讀者年級(jí)相似度為1,不同則為0。專業(yè)、年級(jí)、評(píng)論相似度按1:1:8的比例加權(quán)計(jì)算最終讀者相似度。
3.2 基于讀者相似度的書目推薦
讀者相似度是衡量讀者間是否具有共同特征的指標(biāo),本實(shí)驗(yàn)通過讀者相似度挖掘讀者間的關(guān)聯(lián)關(guān)系,再根據(jù)相關(guān)讀者的推薦書目為目標(biāo)讀者進(jìn)行書目推薦,書目推薦結(jié)果的前5名如表3所示。由于不同讀者在閱讀推廣活動(dòng)中推薦書目的天數(shù)不一,經(jīng)過加權(quán)計(jì)算后,最相似的是讀者在閱讀推廣活動(dòng)中推薦了多本書目,導(dǎo)致其推薦書目在最終的相似度計(jì)算結(jié)果中權(quán)重較低。
從表3中關(guān)聯(lián)讀者書目前5名的推薦表可以發(fā)現(xiàn),目標(biāo)讀者“69924406”推薦權(quán)重最大書目為于丹著的《人間有味是清歡》,主要內(nèi)容是對(duì)人生、文化、社會(huì)、生活的再度思考,這也是她面對(duì)連連爭(zhēng)議和讀者、媒體、學(xué)界的種種誤解,首度自剖成長(zhǎng)經(jīng)歷和心路歷程,涉及生活感受、旅行隨想、對(duì)女兒的教育體悟等。推薦書目表中,威廉·薩默賽特·毛姆著的《人性的枷鎖》敘述了主人公菲利普從童年時(shí)代起在家庭、學(xué)校和社會(huì)中三十年的生活經(jīng)歷,反映了主人公成長(zhǎng)過程中的迷惘、挫折、痛苦、失望、探索及其所受到的身體缺陷、宗教和情欲的束縛,以及主人公最后擺脫這些枷鎖的成長(zhǎng)歷程,其主要內(nèi)容是敘述成長(zhǎng)的過程,與目標(biāo)讀者推薦書目相似。余華著的《我只知道人是什么》分享了他的觀察和思考,內(nèi)容包羅萬象,從往事到現(xiàn)實(shí),從自我到時(shí)代,既漫談生活體驗(yàn),也談及創(chuàng)作心得,展現(xiàn)出一位優(yōu)秀作家對(duì)生活的深刻洞察、對(duì)一切事物理解后的超然。雪小禪著的《繁華不驚,銀碗盛雪》散文集旨在記錄生活中不曾在意的溫柔細(xì)節(jié)和光陰之美。鄭淵潔著的《皮皮魯壓縮人生7天》從童話視角講述人生壓縮的故事,為讀者帶來人生的啟示。施瓦爾貝著的《生命最后的讀書會(huì)》講述其與母親通過讀書會(huì)開始的一段閱讀廣度和人生深度的對(duì)話之旅。以上的推薦結(jié)果表明,文章采用的書目推薦方法能夠以某一讀者為計(jì)算切入點(diǎn),依據(jù)該讀者與其他讀者參加閱讀推廣活動(dòng)時(shí)的書目推薦評(píng)論內(nèi)容進(jìn)行個(gè)性化的相似書目推薦。同時(shí)根據(jù)中南財(cái)經(jīng)政法大學(xué)圖書館現(xiàn)有的書目館藏,在前5的推薦書目中,有2冊(cè)不在圖書館紙質(zhì)資源的館藏中,文章推薦方法在進(jìn)行書目推薦的同時(shí),還能夠?yàn)閳D書館書目的薦購工作提供數(shù)據(jù)支持。
3.3 結(jié)論
在針對(duì)圖書館讀者參與閱讀推廣活動(dòng)的內(nèi)容進(jìn)行了個(gè)性化的書目推薦的實(shí)驗(yàn)中,首先計(jì)算讀者評(píng)論集合中的LDA主題模型困惑度,依據(jù)困惑度得到基于評(píng)論內(nèi)容的讀者分類依據(jù)。隨后通過LDA主題模型以單個(gè)讀者評(píng)論的集合得到讀者主題關(guān)鍵詞,并根據(jù)其與主題分類相似度的大小將其劃入相對(duì)應(yīng)的主題分類中。最后在以主題分類為依據(jù)的讀者相似度計(jì)算中加入讀者的背景信息權(quán)重,根據(jù)相似讀者推薦圖書時(shí)間的多少,按照相似度的高低為目標(biāo)讀者進(jìn)行書目推薦。在書目推薦結(jié)果的準(zhǔn)確性上,推薦結(jié)果顯示該方法能夠根據(jù)目標(biāo)讀者評(píng)論的內(nèi)容找到其他讀者推薦的內(nèi)容相似的書目,同時(shí)根據(jù)讀者相似程度、讀者推薦書目重要程度對(duì)推薦書目進(jìn)行排序。在書目推薦結(jié)果的范圍上,由于閱讀推廣活動(dòng)中讀者推薦書目的類型既包含傳統(tǒng)的紙質(zhì)出版物,也有部分網(wǎng)絡(luò)文獻(xiàn),極大地豐富了書目推薦的內(nèi)容;同時(shí)由于部分推薦圖書尚未購置進(jìn)圖書館館藏,該書目推薦方法也為圖書館薦購工作提供了一定的數(shù)據(jù)支持。在書目推薦結(jié)果的實(shí)用性上,其推薦結(jié)果也更具有實(shí)際使用價(jià)值。
4 結(jié)語
相較于基于豆瓣讀書、微博等引入外部書目評(píng)論數(shù)據(jù)進(jìn)行的書目推薦,高校圖書館閱讀推廣活動(dòng)中的讀者評(píng)論在內(nèi)容的精煉程度與相關(guān)性上更貼近圖書館讀者的真實(shí)情況,其推薦效率與推薦效果更加實(shí)用。同時(shí)與基于讀者借閱數(shù)據(jù)進(jìn)行的書目推薦相比,結(jié)合書目?jī)?nèi)容的推薦方法能夠準(zhǔn)確與更深層次地挖掘讀者特點(diǎn),依據(jù)內(nèi)容對(duì)讀者進(jìn)行用戶畫像,進(jìn)行推薦的質(zhì)量也更高。但另一方面,受制于圖書館閱讀推廣活動(dòng)的規(guī)模與參與度,面向閱讀推廣進(jìn)行的書目推薦范圍較小,無法滿足圖書館讀者的全部閱讀需求。在未來的研究中,本研究將進(jìn)一步擴(kuò)大閱讀推廣活動(dòng)數(shù)據(jù)采集的規(guī)模,同時(shí)根據(jù)累積的歷史數(shù)據(jù)對(duì)書目推薦效果進(jìn)行評(píng)價(jià),從而更加深入地挖掘閱讀推廣活動(dòng)中讀者有關(guān)數(shù)據(jù)的價(jià)值。
參考文獻(xiàn):
范并思.閱讀推廣與圖書館學(xué):基礎(chǔ)理論問題分析[J].中國(guó)圖書館學(xué)報(bào),2014,40(5):4-13.
李武,楊飛,毛遠(yuǎn)逸,等.圖書館閱讀推廣人角色研究:類型構(gòu)成、前置因素和后續(xù)影響[J].中國(guó)圖書館學(xué)報(bào),2020,46(3):73-87.
于良芝,于斌斌.圖書館閱讀推廣:循證圖書館學(xué)(EBL)的典型領(lǐng)域[J].國(guó)家圖書館學(xué)刊,2014,23(6):9-16.
ELLIOTT J. Academic libraries and extracurricular reading promotion[J].Reference & User Services Quarterly,2007,46(3):34-43.
張偉.公共圖書館閱讀推廣管理制度建設(shè)[J/OL].圖書館建設(shè),2020(5):64-70,99[2020-08-22].http://kns.cnki.
net/kcms/detail/23.1331.G2.20200612.1150.004.html.
謝蓉,劉煒,趙珊珊.試論圖書館閱讀推廣理論的構(gòu)建[J].中國(guó)圖書館學(xué)報(bào),2015,41(5):87-98.
TILLEY C L.“Superman Says,‘Read!”National comics and reading promotion[J].Childrens Literature in Education,2013,44(3):251-263.
耿寒冰,馬捷,趙天緣.“閱讀循環(huán)圈”理論框架下的弱勢(shì)群體閱讀服務(wù)模式與策略:以吉林省青少年孤兒為例[J].圖書情報(bào)工作,2020,64(4):24-33.
孫媛媛,張玲,于靜,等.高校圖書館中華傳統(tǒng)文化立體閱讀推廣探究:以北京師范大學(xué)圖書館“二十四節(jié)氣”閱讀推廣為例[J].圖書情報(bào)工作,2020,64(9):57-64.
岳修志.閱讀推廣活動(dòng)評(píng)價(jià)指標(biāo)體系構(gòu)建[J].圖書情報(bào)工作,2019,63(5):42-50.
劉一鳴,謝澤杭,汪全莉.基于績(jī)效評(píng)價(jià)的傳統(tǒng)文化類有聲書閱讀推廣研究[J].圖書情報(bào)工作,2020,64(4):15-23.
TEWARI A S,KUMAR A,BARMAN A G.Book recommendation system based on combine features of content based filtering,collaborative filtering and association rule mining[C]//2014 IEEE International Advance Computing Conference (IACC).IEEE,2014:500-503.
田野,祝忠明.關(guān)聯(lián)數(shù)據(jù)驅(qū)動(dòng)的數(shù)字圖書推薦模型[J].圖書情報(bào)工作,2013,57(17):34-38,52.
VAZ P C, MARTINS, MATOS D, MARTINS B, et al. Improving a hybrid literary book recommendation system through author ranking[C]//Proceedings of the 12th ACM/IEEE-CS joint conference on Digital Libraries. 2012: 387-388.
SOHAIL S S, SIDDIQUI J, ALI R.Book recommendation
system using opinion mining technique[C]//2013
international conference on advances in computing,
communications and informatics (ICACCI).IEEE,2013:1609-1614.
彭博.面向用戶屬性的個(gè)性化圖書推薦方法探究[J].圖書館工作與研究,2017(10):118-123.
BLEI D M,Ng A Y,JORDAN M I.Latent dirichlet allocation [J].Journal of Machine learning research,2003(3):993-1022.
劉雅姝,張海濤,徐海玲,等.多維特征融合的網(wǎng)絡(luò)輿情突發(fā)事件演化話題圖譜研究[J].情報(bào)學(xué)報(bào),2019,38(8):798-806.
THORNDIKE R L.Who belongs in the family?[J].
Psychometrika,1953,18(4):267-276.
吳江,侯紹新,靳萌萌,等.基于LDA模型特征選擇的在線醫(yī)療社區(qū)文本分類及用戶聚類研究[J].情報(bào)學(xué)報(bào),2017(11):1183-1191.
葉 穎 中南財(cái)經(jīng)政法大學(xué)圖書館館員。 湖北武漢,430073。
(收稿日期:2020-12-02 編校:左靜遠(yuǎn),劉 明)