徐 震,李 楊,馮玉平
(中國(guó)人民解放軍戰(zhàn)略支援部隊(duì)信息工程大學(xué),河南 鄭州 450000)
圖書(shū)館借閱量的影響因素較多,數(shù)據(jù)的變化相對(duì)復(fù)雜,存在一定的周期性和混沌性,為此,本文以一年為周期,利用大數(shù)據(jù)對(duì)借閱數(shù)據(jù)特征進(jìn)行分析。
本文對(duì)借閱特征的分析是建立在大數(shù)據(jù)的基礎(chǔ)之上的,因此需要采集估計(jì)目標(biāo)前一年的實(shí)際借閱數(shù)據(jù)。假設(shè)得到的樣本數(shù)據(jù)中共包含n個(gè)數(shù)據(jù),首先將其按照借閱資源的類(lèi)目進(jìn)行分類(lèi)處理,此時(shí)的數(shù)據(jù)可以表示為
n={a1,a2,…,ai}
(1)
其中,a表示不同類(lèi)目資源的借閱量,i表示類(lèi)目總數(shù),此時(shí)的借閱量實(shí)現(xiàn)初步劃分。因此,要實(shí)現(xiàn)對(duì)不同因素作用強(qiáng)度的分析,才能根據(jù)新學(xué)期的入學(xué)人數(shù)信息估計(jì)出準(zhǔn)確的借閱量。
本文將學(xué)生的專(zhuān)業(yè)、年齡以及性別作為影響因素,分析其在不同類(lèi)目資源借閱量中的影響權(quán)重,得到不同影響因素在不同類(lèi)目資源借閱量中的作用大小,以此作為估計(jì)模型的構(gòu)建基礎(chǔ),實(shí)現(xiàn)對(duì)新周期內(nèi)圖書(shū)館借閱量的準(zhǔn)確估計(jì)。
在得出不同因素對(duì)圖書(shū)館借閱量的影響作用基礎(chǔ)上,構(gòu)建的圖書(shū)館借閱量估計(jì)模型如圖1所示。
圖1 圖書(shū)館借閱量估計(jì)模型
模型對(duì)最終借閱量的估計(jì)是以新周期內(nèi)學(xué)生的數(shù)量為基礎(chǔ)。首先將學(xué)生按照性別、專(zhuān)業(yè)以及年齡分別進(jìn)行分類(lèi),統(tǒng)計(jì)不同類(lèi)別的數(shù)量后,按照大數(shù)據(jù)特征分析得到的各自在借閱量中的影響權(quán)重初步計(jì)算出借閱量,圖書(shū)館資源的儲(chǔ)備量低于實(shí)際借閱需求時(shí),會(huì)對(duì)借閱量產(chǎn)生一定的抑制作用,因此,模型通過(guò)將估計(jì)結(jié)果與實(shí)際資源儲(chǔ)備之間建立對(duì)應(yīng)關(guān)系,得出抑制效果的大小,以此為基礎(chǔ)實(shí)現(xiàn)對(duì)圖書(shū)館借閱量的準(zhǔn)確估計(jì)。
以某高校圖書(shū)館作為實(shí)驗(yàn)對(duì)象,利用Microsoft Visual C++6.0軟件實(shí)現(xiàn)對(duì)本文模型的編程。同時(shí),為了提高估計(jì)結(jié)果評(píng)價(jià)的客觀性,將文獻(xiàn)[2]和文獻(xiàn)[3]提出的估計(jì)方法作為對(duì)照組。
本文以高校借閱系統(tǒng)的實(shí)際數(shù)據(jù)為實(shí)驗(yàn)數(shù)據(jù),調(diào)取圖書(shū)館某一年內(nèi)的借閱量原始數(shù)據(jù),其中包含借閱者姓名、年齡、性別、專(zhuān)業(yè)以及借閱書(shū)籍信息數(shù)據(jù)。將其作為樣本數(shù)據(jù),構(gòu)建了估計(jì)模型,利用該模型估計(jì)樣本數(shù)據(jù)下一年的借閱情況。為了簡(jiǎn)化多估計(jì)接軌評(píng)價(jià)的難度,本文將誤差作為評(píng)價(jià)指標(biāo),計(jì)算方式為:
(2)
其中,d表示估計(jì)結(jié)果的誤差,Xi表示i類(lèi)目資源的實(shí)際借閱量,xi表示i類(lèi)目資源的估計(jì)借閱量。以此為基礎(chǔ),分析統(tǒng)計(jì)不同方法的估計(jì)效果。
在上述數(shù)據(jù)的基礎(chǔ)上,分別采用3種方法對(duì)圖書(shū)館的借閱量進(jìn)行估計(jì),不同方法估計(jì)結(jié)果如表1所示。
表1 不同方法的估計(jì)結(jié)果 單位:%
從表1可看出,估計(jì)結(jié)果與實(shí)際之間的差異出現(xiàn)了明顯的波動(dòng),最大值幾乎達(dá)到500,并且在估計(jì)結(jié)果中出現(xiàn)了多個(gè)類(lèi)目借閱量估計(jì)值低于實(shí)際借閱量的情況,這將直接影響學(xué)生的實(shí)際閱讀需求,雖然在整體借閱量的估計(jì)上誤差僅為-1.13%,但對(duì)那個(gè)類(lèi)目的估計(jì)誤差最大值達(dá)到了12.24%(綜合);文獻(xiàn)[3]方法對(duì)整體借閱量的估計(jì)誤差也相對(duì)較低,僅為0.56%,通過(guò)觀察單個(gè)類(lèi)目的估計(jì)結(jié)果可發(fā)現(xiàn),其穩(wěn)定性較差,最大誤差達(dá)到了13.42%(交通),最小誤差僅為-0.41%(農(nóng)業(yè))??煽闯龉烙?jì)結(jié)果并不理想。相比之下,本文方法的估計(jì)結(jié)果具有更高的可靠性,不僅整體誤差僅為0.55%,單個(gè)類(lèi)目的估計(jì)誤差最高值也僅為2.82%,表明本文設(shè)計(jì)的估計(jì)模型可實(shí)現(xiàn)對(duì)圖書(shū)館借閱量的精準(zhǔn)估計(jì)。
圖書(shū)館資源管理工作作為一項(xiàng)重要的工作,既要對(duì)書(shū)籍資料的采購(gòu)方向進(jìn)行合理控制,又要對(duì)不同類(lèi)型資料的儲(chǔ)備量作出合理規(guī)劃,這些都需要以實(shí)際的圖書(shū)借閱需求為參考。本文設(shè)計(jì)了一種基于大數(shù)據(jù)的圖書(shū)館借閱量估計(jì)模型,實(shí)現(xiàn)了對(duì)圖書(shū)借閱需求的高精度預(yù)測(cè),為圖書(shū)館的資源管理工作提供了重要的數(shù)據(jù)指導(dǎo)。