漆月
摘 要 論文通過對(duì)高校圖書館OPAC搜索的數(shù)據(jù)挖掘,構(gòu)建了以國(guó)圖分類號(hào)劃分的圖書資源需求量預(yù)測(cè)模型。首先設(shè)計(jì)了針對(duì)OPAC關(guān)鍵詞的分類方法,對(duì)讀者外借、預(yù)約及OPAC搜索三個(gè)預(yù)測(cè)器的數(shù)據(jù)分布進(jìn)行統(tǒng)計(jì)分析,然后完成基于搜索量的線性回歸預(yù)測(cè)模型設(shè)計(jì),并與基礎(chǔ)預(yù)測(cè)模型進(jìn)行偽樣本外預(yù)測(cè)檢驗(yàn),驗(yàn)證了加入搜索關(guān)鍵詞變量后的模型能夠提供更準(zhǔn)確的數(shù)據(jù)預(yù)測(cè)結(jié)果。最后,提出了基于需求預(yù)測(cè)結(jié)果的采購(gòu)決策模型,為圖書采購(gòu)的比例分配提供數(shù)據(jù)參考。
關(guān)鍵詞 資源建設(shè) 需求預(yù)測(cè) 回歸分析
分類號(hào) G250.7
DOI 10.16810/j.cnki.1672-514X.2020.07.009
Abstract Based on the data mining of OPAC search in university library, this paper constructs a book resource demand forecasting model divided by national library classification number. First, we design a classification method for OPAC keywords, and make statistical analysis on the data distribution of three predictors: reader lending, reservation and OPAC search. Then, we complete the design of linear regression prediction model based on search volume, and carry out the false sample prediction test with the basic prediction model, which verifies that the model after adding the variables of search keywords can provide more accurate data prediction results. Finally, the paper proposes a purchase decision-making model based on the result of demand forecast, which provides data reference for the proportion distribution of book purchasing.
Keywords Resources construction. Demand prediction. Regression analysis.
0 引言
文獻(xiàn)資源建設(shè)是圖書館基礎(chǔ)建設(shè)工作的核心內(nèi)容之一,也是圖書館開展相關(guān)知識(shí)情報(bào)服務(wù)的基礎(chǔ)。根據(jù)教育部高等學(xué)校圖書情報(bào)指導(dǎo)委員會(huì)2018年底發(fā)布的《2017年879所高校圖書館文獻(xiàn)資源購(gòu)置費(fèi)統(tǒng)計(jì)表》,圖書館在文獻(xiàn)資源購(gòu)置中的經(jīng)費(fèi)投入越來(lái)越高,其中排名第一的中山大學(xué)圖書館文獻(xiàn)資源購(gòu)置經(jīng)費(fèi)高達(dá)上億元,超過一百所高校圖書館的購(gòu)置經(jīng)費(fèi)高于一千萬(wàn)元,而各高校圖書館的平均購(gòu)置經(jīng)費(fèi)也在500萬(wàn)元以上。然而經(jīng)費(fèi)的投入量并不代表文獻(xiàn)資源建設(shè)質(zhì)量,大多數(shù)圖書館仍然存在資源利用率逐年減低的問題[1]。這一方面是由于互聯(lián)網(wǎng)環(huán)境下讀者獲取信息的渠道更加多樣化,圖書館不再是知識(shí)傳遞的主要途徑。另一方面,信息化時(shí)代的發(fā)展使得讀者閱讀需求變化更加頻繁,而圖書館缺乏對(duì)當(dāng)代讀者需求的有效評(píng)估和及時(shí)響應(yīng)手段,其資源采購(gòu)效率往往滯后于讀者需求更新。因此,本文以高校圖書館為研究對(duì)象,探討了一種基于大數(shù)據(jù)技術(shù)的圖書館文獻(xiàn)資源建設(shè)策略,通過對(duì)讀者在OPAC中的搜索行為進(jìn)行采集和挖掘,構(gòu)建讀者需求的短期預(yù)測(cè)模型,對(duì)圖書館未來(lái)資源需求量進(jìn)行定量分析與計(jì)算,為圖書館資源采購(gòu)決策提供可信的參考依據(jù)。
1 研究現(xiàn)狀綜述
1.1 圖書采購(gòu)需求預(yù)測(cè)研究
隨著時(shí)代發(fā)展,“以人為本”的思想逐漸深入人心,圖書館服務(wù)工作已經(jīng)從“館藏為中心”向“讀者為中心”轉(zhuǎn)型,而讀者需求也成為圖書館資源采購(gòu)決策的重要驅(qū)動(dòng)因素。其中,基于 “讀者決策采購(gòu)”(Patron Driven Acquisition, PDA)模式的圖書采購(gòu)研究可以算是圖書館重點(diǎn)關(guān)注的領(lǐng)域之一。張甲等在2011年最早在國(guó)內(nèi)提出用戶為導(dǎo)向的圖書資源建設(shè)模式——PDA[2],之后眾多學(xué)者對(duì)該模式下的實(shí)踐方法[3]、服務(wù)效益[4]、影響因素[5]等各方面進(jìn)行了廣泛討論。PDA模式主要以讀者在線提交薦購(gòu)信息單的形式實(shí)現(xiàn)圖書資源采購(gòu),雖然一定程度上反映了讀者的個(gè)性化需求,但通常體現(xiàn)的是獨(dú)立個(gè)體的需求,難以從宏觀層面對(duì)館藏資源結(jié)構(gòu)進(jìn)行優(yōu)化。也有研究從圖書流通情況入手,進(jìn)行需求預(yù)測(cè)建模。例如魯萍等人以三年內(nèi)讀者借閱數(shù)據(jù)為樣本,利用BP神經(jīng)網(wǎng)絡(luò)和GM(1,1)灰色預(yù)測(cè)算法,分別以月和學(xué)期為周期,對(duì)未來(lái)一段時(shí)間內(nèi)的讀者借閱人次進(jìn)行了預(yù)測(cè)[6]。王健提出了一種圖書資源利用數(shù)據(jù)時(shí)間序列模型的構(gòu)建方法,強(qiáng)調(diào)季節(jié)特性對(duì)流通量的影響,并以此為基礎(chǔ)進(jìn)行采購(gòu)質(zhì)量控制[7]。孔超等以流通數(shù)據(jù)為基礎(chǔ),對(duì)圖書館普遍存在的零借閱情況進(jìn)行量化分析,并通過建模進(jìn)行讀者需求預(yù)測(cè),以探索合理館藏結(jié)構(gòu)和讀者需求之間的最佳結(jié)合點(diǎn)[8]。但是流通數(shù)據(jù)受到現(xiàn)有館藏種類和冊(cè)數(shù)的限制(比如副本數(shù)少的圖書流通量必然較?。?,并不能完整表達(dá)讀者對(duì)資源的需求,也影響了預(yù)測(cè)結(jié)果的準(zhǔn)確性。在充足的經(jīng)費(fèi)支持下,圖書館應(yīng)該尋求更加科學(xué)、準(zhǔn)確的資源需求預(yù)測(cè)策略,充分保證資源結(jié)構(gòu)的合理性和有效性,以有效提高文獻(xiàn)資源利用率。
1.2 圖書館OPAC搜索研究概述
大多數(shù)高校圖書館目前都建有自己的OPAC系統(tǒng),主要用于向讀者提供本館書目信息的搜索服務(wù)。作為圖書館使用率最高的系統(tǒng)之一,關(guān)于OPAC搜索的研究也一直受到圖書館學(xué)界的關(guān)注。例如在搜索功能優(yōu)化方面,李兵針對(duì)目前OPAC搜索結(jié)果排序不合理的情況,通過權(quán)威性和實(shí)效性權(quán)重的綜合計(jì)算實(shí)現(xiàn)了對(duì)檢索結(jié)果的排序策略優(yōu)化[9],陳雪通過對(duì)豆瓣圖書的社會(huì)化標(biāo)簽、評(píng)分和熱度等信息資源進(jìn)行整合,實(shí)現(xiàn)了OPAC的分面搜索優(yōu)化[10];在搜索性能評(píng)價(jià)方面,楊九龍等從用戶信息行為的角度出發(fā),基于技術(shù)接受模型、技術(shù)適配模型和信息系統(tǒng)成功模型, 利用層次分析法構(gòu)建了OPAC功能的評(píng)價(jià)指標(biāo)體系[11],黃崑等根據(jù)OPAC日志數(shù)據(jù)分析了高校用戶遭遇OPAC搜索失敗的不同原因及其應(yīng)對(duì)方式,并給出了應(yīng)對(duì)效果的評(píng)價(jià)機(jī)制[12]。然而現(xiàn)有的研究中幾乎沒有討論過OPAC搜索與圖書資源需求挖掘的關(guān)聯(lián)關(guān)系及其對(duì)采購(gòu)決策的指導(dǎo)作用。事實(shí)上,OPAC系統(tǒng)中記錄了所有讀者在圖書館的資源檢索信息,是反映讀者需求的重要指標(biāo),能夠?yàn)橘Y源需求分析和預(yù)測(cè)提供可靠的數(shù)據(jù)支持。因此本文將以高校圖書館的OPAC系統(tǒng)為數(shù)據(jù)來(lái)源,結(jié)合讀者在圖書館的外借和預(yù)約記錄,完成圖書資源需求的短期預(yù)測(cè)建模與計(jì)算。
2 需求預(yù)測(cè)模型的變量分析
2.1 變量選擇
高校圖書館建設(shè)的OPAC系統(tǒng)主要用于檢索現(xiàn)有的館藏書目資源,因此,讀者在OPAC中搜索的關(guān)鍵詞和預(yù)約能夠反映讀者對(duì)資源的需求,應(yīng)該作為需求預(yù)測(cè)模型的計(jì)算參數(shù),而圖書外借與預(yù)約次數(shù)的總和代表了當(dāng)年的資源需求量,可以用于驗(yàn)證預(yù)測(cè)結(jié)果的準(zhǔn)確性。由于圖書館的所有圖書資源都根據(jù)中國(guó)圖書館分類法進(jìn)行了編目,可以按照此分類法對(duì)關(guān)鍵詞進(jìn)行聚類。通過統(tǒng)計(jì)每個(gè)分類號(hào)下的搜索量,再結(jié)合該分類號(hào)下的借閱和預(yù)約量等數(shù)據(jù),即可建立圖書搜索與圖書未來(lái)需求量之間的函數(shù)關(guān)系,從而預(yù)測(cè)每個(gè)分類下的資源需求量。需要說明的是,中圖分類法是在5個(gè)基本部類的基礎(chǔ)上劃分了22個(gè)大類,每個(gè)大類下再細(xì)分為若干小類,而圖書館的編目分類則更加具體,為簡(jiǎn)化計(jì)算,本文僅按22個(gè)大類進(jìn)行資源類型劃分。
2.2 源數(shù)據(jù)采集與分類
本文以西南大學(xué)圖書館自建的OPAC系統(tǒng)歷史數(shù)據(jù)為樣本,并以SPSS為統(tǒng)計(jì)輔助工具,采集2016—2018年的操作日志、圖書外借日志以及圖書預(yù)約日志,作為反映圖書資源需求量的計(jì)算參數(shù)。采集2016年的數(shù)據(jù)是為了與2017年進(jìn)行比較,判斷搜索量的變化對(duì)預(yù)測(cè)結(jié)果的影響,2018年的數(shù)據(jù)則作為預(yù)測(cè)準(zhǔn)確性檢驗(yàn)的參照樣本。在統(tǒng)計(jì)時(shí)發(fā)現(xiàn)關(guān)鍵詞短時(shí)間內(nèi)重復(fù)出現(xiàn)的情況比較嚴(yán)重,分析可能是由于網(wǎng)絡(luò)問題導(dǎo)致讀者多次提交搜索信息。因此,本文對(duì)連續(xù)5分鐘內(nèi)來(lái)自同一用戶和IP地址的相同關(guān)鍵詞進(jìn)行合并,僅保留一條搜索記錄。此外,還發(fā)現(xiàn)部分關(guān)鍵詞為亂碼,因此通過正則表達(dá)式對(duì)非漢字和英文字符的內(nèi)容進(jìn)行了過濾。最終統(tǒng)計(jì)結(jié)果如表1所示。
為了按類別統(tǒng)計(jì)不同分類號(hào)下的圖書需求量,需要對(duì)采集的源數(shù)據(jù)進(jìn)行分類。外借、預(yù)約數(shù)據(jù)均可根據(jù)圖書首位分類號(hào)進(jìn)行歸類,這里主要說明關(guān)于OPAC搜索數(shù)據(jù)的分類方式。由于OPAC系統(tǒng)支持題目、責(zé)任者、主題詞、ISBN、索書號(hào)(即分類號(hào))等多種方式的書目查詢,且兼容模糊查詢和完全匹配模式,因此需要根據(jù)搜索類型分別進(jìn)行處理。本文對(duì)于ISBN、索書號(hào)、完全匹配的題目直接進(jìn)行分類;對(duì)于其他類型的搜索,則分為按兩種情況進(jìn)行處理。一種是用戶有后續(xù)訪問,讀者在搜索結(jié)果列表中發(fā)現(xiàn)需要或感興趣的圖書,會(huì)點(diǎn)擊書目詳情頁(yè)面繼續(xù)瀏覽。此時(shí)可以通過OPAC系統(tǒng)中的網(wǎng)頁(yè)跳轉(zhuǎn)跟蹤記錄,獲取緊鄰時(shí)間段內(nèi)讀者訪問的第一個(gè)詳情頁(yè),將該書目分類號(hào)作為本次搜索的分類。另一種是用戶無(wú)后續(xù)訪問,讀者在搜索結(jié)果列表中未找到需要的信息,則本次操作結(jié)束。此時(shí)可以調(diào)用OPAC系統(tǒng)提供的搜索接口,并將排序參數(shù)設(shè)置為“按相關(guān)度排序”,將返回的搜索結(jié)果列表中排在第一位的圖書分類號(hào)作為本次搜索的分類。
2.3 變量檢驗(yàn)
(1)相關(guān)性分析。為檢驗(yàn)搜索量與需求量的相關(guān)性,本文對(duì)2016—2018年的分類需求量與搜索量分別進(jìn)行了線性擬合,如圖1、圖2、圖3所示,其中需求量為外借次數(shù)與預(yù)約次數(shù)之和。可以看出,絕大多數(shù)數(shù)據(jù)都處于95%置信區(qū)間以內(nèi),其相關(guān)系數(shù)分別為R22016=0.883(p<0.01)、R22017=0.965(p<0.01)、R22018=0.793(p<0.01),由此可以證明出OPAC的搜索量與圖書資源需求量存在關(guān)聯(lián)性,能夠?qū)Y源的未來(lái)需求量起到預(yù)測(cè)作用。
(2) 數(shù)據(jù)分布檢驗(yàn)。本文以月為單位對(duì)變量進(jìn)行了描述性統(tǒng)計(jì),如表2所示。從統(tǒng)計(jì)結(jié)果可以看出,每年的需求量和搜索量離散性較大,這主要是因?yàn)楹?、暑假期間讀者的操作次數(shù)與學(xué)期間相比明顯減少。但在時(shí)間上數(shù)據(jù)整體接近于正態(tài)分布,因此可以對(duì)其進(jìn)行線性回歸分析。
3 圖書需求預(yù)測(cè)模型構(gòu)建
3.1 模型設(shè)定與估計(jì)
上節(jié)中離散趨勢(shì)分析結(jié)果可以證明OPAC的搜索量與圖書資源需求量存在關(guān)聯(lián)性,因此本文通過自回歸時(shí)間序列模型進(jìn)行需求量預(yù)測(cè)建模,將圖書資源的需求量作為因變量,設(shè)置了圖書外借、預(yù)約和搜索三個(gè)自變量(預(yù)測(cè)器),生成動(dòng)態(tài)面板形式如公式(1) 所示。
Demand(i)t=a0Borrow(i)t-1+a1Order(i)t-1+a2DSearch
(i)t-1+u(i)+ε(i)t ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? (1)
在公式(1)中,i=1,2……22表示22個(gè)圖書分類,Demand(i)表示對(duì)分類i的圖書需求量,DSearch(i)表示該分類的搜索量與前一年之差,u(i)表示分類i不隨時(shí)間改變的異質(zhì)性截距項(xiàng),ε(i)是該分類受時(shí)間影響的干擾項(xiàng)。其中u、ε為不可預(yù)測(cè)的隨機(jī)變量,因?yàn)閮?nèi)容特殊性,某些小眾化圖書需求量通常較少,另外一些特殊事件可能會(huì)造成當(dāng)年某類型圖書的需求量突然增加(例如《三體》獲雨果獎(jiǎng)后引起的科幻閱讀熱潮)。需要說明的是,模型中搜索量取的是增量指標(biāo),因?yàn)閰?shù)中已經(jīng)對(duì)借閱量和預(yù)約量進(jìn)行了累加計(jì)算。
利用逐個(gè)加入變量的方式對(duì)預(yù)測(cè)模型進(jìn)行多元線性回歸分析,通過偏相關(guān)性計(jì)算發(fā)現(xiàn)貢獻(xiàn)最大的是Borrow,其次是DSearch,第三是Order,在變量加入后得到的相關(guān)系數(shù)逐漸增大。且三個(gè)變量的系數(shù)分別為0的T值檢驗(yàn)下,其sig.值均<0.05,故所有變量均拒絕系數(shù)為0的假設(shè)。方差結(jié)果分析表明三個(gè)變量分別進(jìn)入模型后,F(xiàn)值的顯著性均<0.01,說明每個(gè)變量都對(duì)因變量Demand具有貢獻(xiàn)。根據(jù)擬合度分析結(jié)果對(duì)調(diào)整后的相關(guān)系數(shù)進(jìn)行檢驗(yàn),僅以Borrow為變量的模型能夠解釋需求量89.6%的方差,加入DSearch后的模型能夠解釋93.4%的方差,增加了3.8%的相關(guān)性,再加入Order后能夠解釋94.1%的方差,然而修正R2增長(zhǎng)較少,說明預(yù)約量雖然對(duì)模型有貢獻(xiàn),但貢獻(xiàn)不大。表3為對(duì)Borrow、DSearch、Order三個(gè)變量逐步加入模型得到的三個(gè)方程(記為方程1、方程2、方程3) 統(tǒng)計(jì)的估計(jì)結(jié)果。
3.2 模型驗(yàn)證
線性回歸預(yù)測(cè)模型通常采用偽樣本外預(yù)測(cè)進(jìn)行模型的預(yù)測(cè)能力檢驗(yàn)[13]。本文選擇一個(gè)分類號(hào)樣本作為預(yù)測(cè)對(duì)象,通過其他21個(gè)分類號(hào)樣本進(jìn)行模型參數(shù)估計(jì)以及樣本外預(yù)測(cè)。為檢驗(yàn)搜索量的貢獻(xiàn),本文設(shè)立了不含搜索增量的基本模型,如公式(2) 所示。
Demand(i)t=b1Borrow(i)t-1+b2Order(i)t-1+u(i)+ε(i)t ? ?(2)
然后將均方根誤差(RMSE)作為預(yù)測(cè)誤差衡量指標(biāo),對(duì)兩種模型的預(yù)測(cè)結(jié)果與實(shí)際值進(jìn)行比較,檢驗(yàn)?zāi)P偷念A(yù)測(cè)效果如公式(3)所示。
其中,n為樣本量,RD和PD分別表示圖書資源需求量的實(shí)際值和預(yù)測(cè)值,RMSE值越小越好。表4給出了按分類號(hào)分布的需求量預(yù)測(cè)結(jié)果??梢钥闯?,在絕大多數(shù)分類號(hào)下,基于搜索的預(yù)測(cè)模型的預(yù)測(cè)誤差小于基礎(chǔ)模型的預(yù)測(cè)誤差,前者的平均誤差約為986,低于基礎(chǔ)模型的約1314。由此可見,基于搜索的預(yù)測(cè)模型預(yù)測(cè)結(jié)果優(yōu)于基礎(chǔ)模型。
4 基于需求預(yù)測(cè)的采購(gòu)分配算法
由于圖書的內(nèi)容、時(shí)效性等原因,館藏使用率不可能達(dá)到100%,因此不能直接將館藏資源量與預(yù)測(cè)結(jié)果之差作為采購(gòu)數(shù)目的衡量標(biāo)準(zhǔn)。但是可以通過館藏結(jié)構(gòu)中每個(gè)分類所占的百分比,與預(yù)測(cè)結(jié)果的百分比進(jìn)行比較,對(duì)每個(gè)分類下的圖書進(jìn)行采購(gòu)的比例分配。根據(jù)回歸分析的特征可知,時(shí)間距離越近的參考樣本得到的預(yù)測(cè)模型越準(zhǔn)確。本文以2018年的讀者操作數(shù)據(jù)為基礎(chǔ),對(duì)2019年的圖書需求進(jìn)行預(yù)測(cè),然后將每個(gè)圖書分類號(hào)下的需求情況和館藏情況進(jìn)行對(duì)比,結(jié)果如圖4所示。
可以看出,就總體趨勢(shì)而言,館藏結(jié)構(gòu)與讀者未來(lái)需求情況基本一致,但是部分類別的館藏比例與需求仍然存在一定偏差,尤其是I類圖書,館藏量比之預(yù)測(cè)的讀者需求量遠(yuǎn)遠(yuǎn)不足。雖然部分分類下的館藏比例大于需求比例,但并不代表該分類的圖書完全不必采購(gòu)。本文首先確定一個(gè)圖書的最低采購(gòu)量,即設(shè)需求量與館藏量相減差值最小的分類號(hào)采購(gòu)圖書比例為B,則根據(jù)需求預(yù)測(cè)為每種分類號(hào)分配的采購(gòu)比例如公式(4) 所示。
其中,Purchase(i)表示分類號(hào)為i的圖書采購(gòu)經(jīng)費(fèi)占用比例,P_Demand(i)為i分類號(hào)需求量的百分比,P_Collection(i)為i分類號(hào)的現(xiàn)有館藏量百分比,x為根據(jù)最低采購(gòu)比例計(jì)算出的常量,如公式(5) 所示。
以實(shí)驗(yàn)數(shù)據(jù)為例,其中館藏量與需求量比例之差最大的為F類圖書,根據(jù)實(shí)際情況設(shè)置其最低采購(gòu)量為1%,計(jì)算得出采購(gòu)需求最大的I類圖書,需分配的采購(gòu)比例約為17.98%,其次是T類圖書,采購(gòu)比例約占8.43%,所有圖書的采購(gòu)比例分配結(jié)果如表5所示。
5 基于需求預(yù)測(cè)分析的采購(gòu)建議
本文提取了2018年搜索增量較大的關(guān)鍵詞,并繪制了增量排名前100的關(guān)鍵詞云,如圖5所示,以分析預(yù)測(cè)模型計(jì)算的需求量與館藏量出現(xiàn)差異的原因??梢钥闯?,“東野圭吾”“三體”及其相關(guān)關(guān)鍵詞搜索量比之前年有了大幅度增長(zhǎng),尤其是“東野圭吾”的相關(guān)搜索增量達(dá)到了兩萬(wàn)次以上,此外關(guān)鍵詞“python”“機(jī)器學(xué)習(xí)”等搜索增量也較為顯著,這正好解釋了I類和T類圖書館藏明顯低于預(yù)測(cè)需求的現(xiàn)象。
可見,在實(shí)際工作中,通過預(yù)測(cè)模型對(duì)每個(gè)分類號(hào)下的資源需求量進(jìn)行近似估計(jì),能夠幫助圖書館進(jìn)一步準(zhǔn)確把握讀者的需求變化,結(jié)合圖書館當(dāng)前館藏儲(chǔ)備,為資源采購(gòu)工作提供一定的數(shù)據(jù)參考,從而為用戶需求驅(qū)動(dòng)的圖書館資源建設(shè)模式提供一種新的思路?;谏鲜龇治?,這里對(duì)圖書館資源采購(gòu)提出以下一些建議。
(1) 保持對(duì)時(shí)代的敏感性。讀者的閱讀興趣容易受到當(dāng)年發(fā)生的熱點(diǎn)事件影響,例如2018年的高評(píng)分電影《嫌疑人X的獻(xiàn)身》、獲得“雨果獎(jiǎng)”的科幻小說《三體》等,都引發(fā)了閱讀的熱潮,此外國(guó)家政策的大力支持掀起了人工智能的井噴式發(fā)展,也促進(jìn)了相關(guān)資源的閱讀量增加。因此采訪人員除了具備一定的專業(yè)知識(shí)外,還需要充分了解政府規(guī)劃、市場(chǎng)及各行業(yè)的動(dòng)態(tài)和發(fā)展趨勢(shì),對(duì)讀者的未來(lái)閱讀需求做出準(zhǔn)確預(yù)判。
(2) 建立快捷采購(gòu)?fù)ǖ?。由于采?gòu)流程的限制,圖書資源從采訪、編目到最終上架流通往往需要經(jīng)過較長(zhǎng)的時(shí)間周期,通常在半年到一年,甚至更長(zhǎng),使得館藏資源結(jié)構(gòu)常常落后于讀者的需要變化。雖然圖書館難以在短期內(nèi)徹底改變工作方式,但可以另建一條快捷采購(gòu)?fù)ǖ溃ɡ缭O(shè)立專用經(jīng)費(fèi)在網(wǎng)上或?qū)嶓w書店采購(gòu)圖書),以對(duì)時(shí)效性較強(qiáng)的閱讀需求做出及時(shí)響應(yīng),當(dāng)監(jiān)測(cè)到關(guān)鍵詞搜索增量在短周期內(nèi)超過閾值時(shí),即可評(píng)估是否啟用該通道對(duì)相關(guān)資源進(jìn)行補(bǔ)充,并通過預(yù)測(cè)模型計(jì)算采購(gòu)數(shù)量。
參考文獻(xiàn):
王躍虎.基于讀者需求的館藏文獻(xiàn)利用率研究[J].圖書情報(bào)導(dǎo)刊,2017,2(12):1-6.
張甲, 胡曉菁.讀者決策的圖書館藏書采購(gòu):館藏建設(shè)2.0版[J].中國(guó)圖書館學(xué)報(bào), 2011(2) :36-39.
劉惠敏.紙電同步趨勢(shì)下我國(guó)高校圖書館開展讀者決策采購(gòu)(PDA)的策略分析[J].圖書館建設(shè),2018(6):18-22,38.
陳艷.高職院校圖書館讀者決策采購(gòu)服務(wù)效益研究[J].情報(bào)探索,2018(10):101-104.
段玉昆.圖書館成功實(shí)施讀者決策采購(gòu)的關(guān)鍵因素分析[J].圖書館,2019(1):107-111.
魯萍,張駿毅.讀者驅(qū)動(dòng)資源建設(shè)中預(yù)測(cè)算法的研究及應(yīng)用[J].計(jì)算機(jī)應(yīng)用與軟件,2019,36(3):112-115,153.
王健.基于圖書資源利用數(shù)據(jù)時(shí)間序列模型的圖書采購(gòu)質(zhì)量控制研究[J].圖書館研究與工作,2018(2):41-46.
孔超,丁璇.高校圖書館零借閱率的量化分析與館藏優(yōu)化策略[J].新世紀(jì)圖書館,2015(6):51-55.
李兵.圖書館OPAC檢索中融合權(quán)威性和時(shí)效性的排序優(yōu)化[J].圖書館學(xué)研究,2017(19):61-65,73.
陳雪.基于豆瓣圖書信息資源整合的OPAC分面檢索優(yōu)化[J].圖書館學(xué)研究,2016(24):47-54.
楊九龍,趙嘉文.用戶信息行為視角下的圖書館OPAC功能評(píng)價(jià)研究[J].新世紀(jì)圖書館,2018(3):59-63.
黃崑,程志強(qiáng),李京津,等.基于OPAC檢索失敗提問的用戶應(yīng)對(duì)效果研究[J].圖書館學(xué)研究,2018(7):64-75.
王煉.網(wǎng)絡(luò)環(huán)境下基于消費(fèi)者搜索的市場(chǎng)預(yù)測(cè)研究[D].成都:西南交通大學(xué),2014:52-54.