張宏偉 史惠媛
摘要:在高校圖書(shū)館文獻(xiàn)采購(gòu)過(guò)程中,應(yīng)用數(shù)據(jù)挖掘技術(shù)對(duì)讀者利用圖書(shū)館歷史數(shù)據(jù)進(jìn)行分析,可以預(yù)測(cè)出圖書(shū)采購(gòu)經(jīng)費(fèi)分配比例,按照讀者閱讀需求采購(gòu)熱點(diǎn)圖書(shū),補(bǔ)充缺漏圖書(shū)及復(fù)本量不足圖書(shū),進(jìn)而為文獻(xiàn)采購(gòu)工作提供科學(xué)、合理的決策依據(jù)。
關(guān)鍵詞:高校圖書(shū)館;文獻(xiàn)采購(gòu);數(shù)據(jù)挖掘
中圖分類號(hào):G253.1 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2095-5707(2016)02-0022-03
程煥文先生認(rèn)為資源是圖書(shū)館絕對(duì)的至高無(wú)上的王。文獻(xiàn)采購(gòu)是高校圖書(shū)館文獻(xiàn)資源建設(shè)的第一站,是決定文獻(xiàn)資源建設(shè)質(zhì)量的最重要的關(guān)鍵環(huán)節(jié)。隨著圖書(shū)價(jià)格持續(xù)上漲,高校圖書(shū)館文獻(xiàn)購(gòu)置費(fèi)相對(duì)有限,在圖書(shū)采購(gòu)過(guò)程中如何保證館藏結(jié)構(gòu)科學(xué)性的同時(shí),提高紙質(zhì)文獻(xiàn)資源利用率,是圖書(shū)館亟待解決的問(wèn)題。
數(shù)據(jù)挖掘(date mining)是從大量的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、潛在有用的信息和知識(shí)的過(guò)程。圖書(shū)館自動(dòng)化管理系統(tǒng)每天會(huì)產(chǎn)生大量流通、檢索、查詢等數(shù)據(jù),對(duì)這些數(shù)據(jù)進(jìn)行挖掘,可以獲知讀者個(gè)性化需求、文獻(xiàn)利用率等信息。利用這些信息對(duì)已有館藏進(jìn)行評(píng)估,可以為文獻(xiàn)采購(gòu)工作提供科學(xué)、合理的決策依據(jù)。
1.傳統(tǒng)文獻(xiàn)采購(gòu)工作存在的不足
目前,高校圖書(shū)館紙質(zhì)文獻(xiàn)傳統(tǒng)采購(gòu)決策過(guò)程中,決策主觀性較強(qiáng),客觀依據(jù)不足。文獻(xiàn)采購(gòu)多以現(xiàn)場(chǎng)采購(gòu)和書(shū)目采購(gòu)為主,采購(gòu)人員少,對(duì)各專業(yè)、學(xué)科所需文獻(xiàn)資源把握不到位、訂購(gòu)精確度不高。一方面受采購(gòu)人員的知識(shí)結(jié)構(gòu)、專業(yè)背景、業(yè)務(wù)素質(zhì)及工作經(jīng)驗(yàn)等因素的限制,圖書(shū)館文獻(xiàn)采購(gòu)決策長(zhǎng)期以來(lái)停留在憑經(jīng)驗(yàn)和靠感覺(jué)的水平上,文獻(xiàn)采購(gòu)時(shí)主觀判斷成分過(guò)多。另一方面讀者參與文獻(xiàn)采購(gòu)的熱情不高,使得文獻(xiàn)采購(gòu)的采全率和采準(zhǔn)率不高,導(dǎo)致學(xué)校投入的有限購(gòu)書(shū)經(jīng)費(fèi)所購(gòu)文獻(xiàn)資源利用率不高,讀者文獻(xiàn)需求得不到滿足和保障。
為了使文獻(xiàn)采購(gòu)工作更客觀、科學(xué)、合理,有必要應(yīng)用數(shù)據(jù)挖掘技術(shù)對(duì)讀者借閱流通、檢索查詢、預(yù)約借書(shū)、博碩學(xué)位論文引文等歷史數(shù)據(jù)進(jìn)行定性和定量分析,獲知讀者個(gè)性化閱讀需求,為圖書(shū)館文獻(xiàn)采購(gòu)決策提供數(shù)據(jù)參考,進(jìn)而提高文獻(xiàn)資源采選質(zhì)量和館藏資源利用率。
2.數(shù)據(jù)挖掘在文獻(xiàn)采購(gòu)決策中的應(yīng)用
2.1依據(jù)借閱流通數(shù)據(jù)指導(dǎo)采購(gòu)資金分配
利用金盤(pán)圖書(shū)管理系統(tǒng)集成統(tǒng)計(jì)模塊對(duì)每年各大類圖書(shū)借閱流通情況進(jìn)行統(tǒng)計(jì),得到讀者借閱量趨勢(shì)變化情況,進(jìn)而預(yù)測(cè)讀者需求量,指導(dǎo)下一年采購(gòu)經(jīng)費(fèi)在各大類文獻(xiàn)中的投入增減情況川。遵循文獻(xiàn)利用率最大效應(yīng)原則,對(duì)于零借閱的圖書(shū)應(yīng)減少或停止采購(gòu),保證各大類圖書(shū)的借閱流通數(shù)量和采購(gòu)經(jīng)費(fèi)所占比重相一致,有針對(duì)性地補(bǔ)充館藏文獻(xiàn)資源,從而達(dá)到資源優(yōu)化配置。
黑龍江中醫(yī)藥大學(xué)圖書(shū)館2013、2014、2015年圖書(shū)采購(gòu)經(jīng)費(fèi)分別為166.1萬(wàn)、155.9萬(wàn)、143.2萬(wàn)元人民幣,借閱量分別為71 112、87 278、80 538冊(cè)。表1中列出這3年各類借出圖書(shū)所占采購(gòu)經(jīng)費(fèi)及借閱量的百分比,據(jù)此可以指導(dǎo)2016年制定文獻(xiàn)資源采購(gòu)計(jì)劃,合理分配各類圖書(shū)采購(gòu)經(jīng)費(fèi),使采購(gòu)決策更加科學(xué)合理,最大限度地提升館藏資源利用率。
2.2依據(jù)檢索查詢數(shù)據(jù)獲知讀者亟需文獻(xiàn)
利用數(shù)據(jù)挖掘的關(guān)聯(lián)規(guī)則對(duì)讀者每個(gè)月圖書(shū)檢索查詢數(shù)據(jù)進(jìn)行自動(dòng)捕捉、采集和整理,過(guò)濾冗余信息。將讀者關(guān)注度較高的檢索詞按使用次數(shù)降序排列(見(jiàn)圖1)。對(duì)照2014年熱門(mén)圖書(shū)檢索詞排行榜,取檢索次數(shù)≥50次的圖書(shū)作為熱點(diǎn)圖書(shū),這些是讀者迫切亟需的文獻(xiàn)資源,圖書(shū)館應(yīng)對(duì)照館藏規(guī)劃,優(yōu)先采購(gòu)人氣熱點(diǎn)圖書(shū)。
2.3依據(jù)圖書(shū)預(yù)約借書(shū)數(shù)據(jù)補(bǔ)充館藏復(fù)本量
預(yù)約借書(shū)是指讀者預(yù)約登記某種借出狀態(tài)的圖書(shū),該圖書(shū)歸還后,預(yù)約讀者優(yōu)先得到此書(shū)的借閱權(quán),館藏復(fù)本量不足是讀者預(yù)約借書(shū)的原因。圖書(shū)預(yù)約信息真實(shí)反映了讀者對(duì)某類圖書(shū)的實(shí)際需求。首先,采購(gòu)人員基于金盤(pán)管理系統(tǒng),對(duì)預(yù)約數(shù)據(jù)進(jìn)行統(tǒng)計(jì)。其次,根據(jù)讀者預(yù)約次數(shù),形成預(yù)約熱點(diǎn)圖書(shū)的書(shū)目表。最后,通過(guò)與館藏書(shū)目數(shù)據(jù)比較,制定符合讀者需求的采購(gòu)計(jì)劃,確定復(fù)本采購(gòu)數(shù)量。及時(shí)補(bǔ)充館藏復(fù)本量不足的圖書(shū),提升圖書(shū)館的服務(wù)質(zhì)量和服務(wù)效果,使高校圖書(shū)館文獻(xiàn)資源保障能力得到加強(qiáng)。
2.4依據(jù)博碩士論文引文量補(bǔ)充缺漏圖書(shū)
博碩士學(xué)位論文的引文真實(shí)地反映出作者在撰寫(xiě)過(guò)程中對(duì)專業(yè)文獻(xiàn)的需求特點(diǎn)和規(guī)律,其引文具有數(shù)量大、范圍廣和學(xué)術(shù)質(zhì)量高的特點(diǎn)。博碩士學(xué)位論文是對(duì)以前成果的借鑒、利用和創(chuàng)新,參考文獻(xiàn)具有精選性,對(duì)文獻(xiàn)的學(xué)術(shù)價(jià)值具有評(píng)測(cè)功能。因此,對(duì)博碩士學(xué)位論文引文進(jìn)行數(shù)據(jù)挖掘,可以發(fā)現(xiàn)博碩士所在學(xué)科信息需求的一般規(guī)律和特點(diǎn),有利于指導(dǎo)圖書(shū)館文獻(xiàn)信息資源的館藏建設(shè)。基于博碩士學(xué)位論文在線提交系統(tǒng),對(duì)博碩論文引文量進(jìn)行統(tǒng)計(jì)分析,對(duì)照館藏將文獻(xiàn)引用頻次≥3的缺漏圖書(shū),列為預(yù)采購(gòu)圖書(shū)。并根據(jù)文獻(xiàn)購(gòu)置經(jīng)費(fèi)的許可程度,最終有重點(diǎn)、有層次對(duì)缺漏圖書(shū)進(jìn)行補(bǔ)充。
2.5依據(jù)科技查新參考文獻(xiàn)獲知教學(xué)科研文獻(xiàn)需求
科技查新,是為避免科研課題重復(fù)立項(xiàng)和客觀正確地判別科研成果的創(chuàng)新性而設(shè)立的一項(xiàng)工作。通過(guò)科技查新工作,能為科研立項(xiàng),科技成果的鑒定、評(píng)估、驗(yàn)收、獎(jiǎng)勵(lì),專利申請(qǐng)等提供客觀依據(jù),為科研人員提供快捷、可靠、豐富的文獻(xiàn)支持。
黑龍江中醫(yī)藥大學(xué)圖書(shū)館檢索中心(中國(guó)中醫(yī)藥文獻(xiàn)檢索中心黑龍江分中心),是國(guó)家中醫(yī)管理局于1995年批準(zhǔn)成立的,為首批國(guó)家級(jí)定點(diǎn)查新分中心,也是我省中醫(yī)藥領(lǐng)域唯一的國(guó)家級(jí)查新單位。由于科研人員研究方向多,文獻(xiàn)需求廣,因此不易從個(gè)體角度來(lái)分析其文獻(xiàn)需求,但可以從群體角度來(lái)研究高校教研室、重點(diǎn)實(shí)驗(yàn)室所需文獻(xiàn)需求。基于我館科技查新系統(tǒng),對(duì)科研人員申報(bào)的科技查新參考文獻(xiàn)進(jìn)行數(shù)據(jù)挖掘,可以對(duì)我校重點(diǎn)實(shí)驗(yàn)室所關(guān)注的研究領(lǐng)域、研究熱點(diǎn)和發(fā)展方向進(jìn)行分類和預(yù)測(cè)。通過(guò)專家咨詢、建立模型與數(shù)據(jù)可視化等動(dòng)態(tài)結(jié)合方式,生成重點(diǎn)實(shí)驗(yàn)室所需科研文獻(xiàn)采購(gòu)報(bào)告,為滿足該重點(diǎn)實(shí)驗(yàn)室文獻(xiàn)需求提供客觀準(zhǔn)確的采購(gòu)依據(jù)。
2015年,我館采購(gòu)原則是“保證中醫(yī)藥學(xué)科,兼顧醫(yī)學(xué)相關(guān)門(mén)類,關(guān)注學(xué)校新增專業(yè),滿足醫(yī)、理、文、工、管多學(xué)科發(fā)展需求”。通過(guò)對(duì)上述5類數(shù)據(jù)綜合分析,形成科學(xué)、合理的客觀采購(gòu)依據(jù),輔助管理層作出及時(shí)有效的決策,進(jìn)而制定2016年的圖書(shū)采購(gòu)原則,即“中醫(yī)類求精、西醫(yī)類求新、關(guān)注新增專業(yè)、滿足醫(yī)、理、文、工、管多學(xué)科發(fā)展要求”。
3.小結(jié)
應(yīng)用數(shù)據(jù)挖掘技術(shù)從海量的借閱流通數(shù)據(jù)中預(yù)測(cè)采購(gòu)經(jīng)費(fèi)比例,對(duì)照年度采購(gòu)原則和計(jì)劃,將讀者亟需的圖書(shū)進(jìn)行分類,按需求頻度進(jìn)行排序,頻度相同、資金有限或數(shù)量已達(dá)上限的情況下,以優(yōu)先滿足教學(xué)和科研圖書(shū)為采購(gòu)原則。需要指出的是,采購(gòu)決策應(yīng)以實(shí)際數(shù)據(jù)為參考,同時(shí)也要避免唯數(shù)據(jù)論,對(duì)時(shí)效性強(qiáng)、借閱量大的教材、輔導(dǎo)類等圖書(shū)要控制其采購(gòu)的種數(shù)和復(fù)本量,可通過(guò)購(gòu)買電子書(shū)形式予以解決。在經(jīng)費(fèi)有限的情況下使投入產(chǎn)出收益達(dá)到最大化,真正做到“每位讀者有其書(shū)”和“每本書(shū)有其讀者”。
中國(guó)中醫(yī)藥圖書(shū)情報(bào)2016年2期