摘 要:圖書(shū)借閱量是評(píng)價(jià)圖書(shū)館服務(wù)的重要參考指標(biāo),而數(shù)據(jù)分析與智能計(jì)算可以得到圖書(shū)借閱量與入藏量的某種擬合關(guān)系。通過(guò)數(shù)據(jù)降維處理與人工智能訓(xùn)練,可以量化這種擬合。最后,對(duì)圖書(shū)館員提出相應(yīng)的改善措施,進(jìn)而提高圖書(shū)的借閱量。
關(guān)鍵詞:圖書(shū);借閱量;智能計(jì)算;數(shù)據(jù)分析
基金項(xiàng)目:陜西省教育廳專項(xiàng)科研計(jì)劃項(xiàng)目(編號(hào):16JK1521)。
0 引言
高校圖書(shū)館的圖書(shū)借閱量是評(píng)價(jià)其服務(wù)的重要參考指標(biāo),如何更好地服務(wù)高校師生閱讀,提高圖書(shū)館文獻(xiàn)資源的使用量,是圖書(shū)館員需要思考的重要問(wèn)題。因此研究圖書(shū)館圖書(shū)借閱量的統(tǒng)計(jì)數(shù)據(jù),分析其發(fā)展變化規(guī)律,對(duì)于圖書(shū)借閱量的管理工作具有重要意義。
國(guó)內(nèi)諸多學(xué)者對(duì)圖書(shū)借閱量開(kāi)展大量研究工作。田梅采用支持向量機(jī)作為建模工具,利用混沌時(shí)間序列理論對(duì)圖書(shū)借閱流量行為進(jìn)行建模[1]。張惠玲為精準(zhǔn)獲取各類圖書(shū)的剔舊書(shū)齡,構(gòu)建圖書(shū)平均借閱次數(shù)和書(shū)齡之間的回歸模型[2]。鄒梅利用神經(jīng)網(wǎng)絡(luò)技術(shù),通過(guò)分析影響圖書(shū)借閱量的幾大要素得到最可靠的邏輯表達(dá)式,進(jìn)而預(yù)測(cè)下年度的借閱量[3]。鄧奇強(qiáng)等對(duì)依據(jù)文獻(xiàn)老化定律,利用TP類圖書(shū)的老化曲線方程預(yù)測(cè)其借閱量[4]。李靜利用Excel函數(shù),闡述了回歸方程的計(jì)算方法及圖書(shū)館借閱量的預(yù)測(cè)趨勢(shì)曲線[5]。
在上述研究中,已有學(xué)者采用智能計(jì)算方法,如支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)技術(shù)等,但這些方法技術(shù)依然存在一些缺點(diǎn),在輸入數(shù)據(jù)維度較高時(shí),容易導(dǎo)致其計(jì)算網(wǎng)絡(luò)結(jié)構(gòu)臃腫,造成訓(xùn)練擬合欠缺[6]。而數(shù)據(jù)降維方法可以優(yōu)選出與目標(biāo)因素關(guān)聯(lián)度較高的影響因素,從而剔除影響較小的指標(biāo),達(dá)到簡(jiǎn)化學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)的目的。因此,本文混合數(shù)據(jù)降維和智能方法探討圖書(shū)借閱量計(jì)算。
1 圖書(shū)借閱量
圖書(shū)借閱量是全校師生借閱圖書(shū)的總冊(cè)次數(shù),影響其數(shù)值的因素有很多,最為直接的即為圖書(shū)館新入藏的圖書(shū)數(shù)量。新入藏的圖書(shū)數(shù)量是由文獻(xiàn)資源建設(shè)部門(mén)進(jìn)行調(diào)研后展開(kāi)訂購(gòu)工作,其采購(gòu)工作主要是按照中圖法的22個(gè)基本大類進(jìn)行。由于每年采購(gòu)圖書(shū)的數(shù)量種類不同,因此每年這22個(gè)大類的新入藏圖書(shū)量也有相應(yīng)的變化,從而直接影響到該年的圖書(shū)借閱量。而通過(guò)歷年的數(shù)據(jù)分析其規(guī)律變化,可以獲取到圖書(shū)借閱量與這22個(gè)基本大類圖書(shū)入藏量的某種擬合關(guān)系。
2 研究步驟
為了獲取上述這種擬合關(guān)系,文章通過(guò)數(shù)據(jù)分析與智能計(jì)算進(jìn)行探討。研究步驟主要包括下述幾個(gè)方面:數(shù)據(jù)預(yù)處理,獲取歷年的圖書(shū)入藏量與借閱量;數(shù)據(jù)降維,將圖書(shū)入藏量的22個(gè)數(shù)據(jù)盡可能保留其特征分布的情況下,減少數(shù)據(jù)輸入數(shù)量;智能方法訓(xùn)練,主要采用人工神經(jīng)網(wǎng)絡(luò)等方法對(duì)已有數(shù)據(jù)進(jìn)行訓(xùn)練擬合;測(cè)試,將訓(xùn)練好的人工神經(jīng)網(wǎng)絡(luò)進(jìn)行測(cè)試,驗(yàn)證其正確性。
2.1 數(shù)據(jù)降維
數(shù)據(jù)降維是指高維數(shù)據(jù)化為低維度數(shù)據(jù)的操作,常用的數(shù)據(jù)降維方法有2種,灰色關(guān)聯(lián)分析與主成分分析,分述如下:
(1)灰色關(guān)聯(lián)分析:根據(jù)因素之間發(fā)展趨勢(shì)的相似或相異程度來(lái)衡量因素間關(guān)聯(lián)程度的一種方法。其計(jì)算步驟包括:a.確定參考數(shù)列和比較數(shù)列;b.無(wú)量綱化處理;c.求灰色關(guān)聯(lián)系數(shù);d.求關(guān)聯(lián)度,即關(guān)聯(lián)系數(shù)的平均值;e.關(guān)聯(lián)度排序。
(2) 主成分分析:一種線性輸入降維技術(shù),它的目的是將高維數(shù)據(jù)投影到較低維空間,即求得一個(gè)k維特征的變換矩陣,這個(gè)變換矩陣可以將特征從高維降到低維。特征向量都是正交的,通過(guò)求取樣本矩陣的協(xié)方差矩陣,可以獲得協(xié)方差矩陣的特征向量,構(gòu)成變換矩陣。
2.2 智能方法訓(xùn)練
智能方法訓(xùn)練主要是對(duì)人工神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,通過(guò)已知的輸入數(shù)據(jù)和輸出結(jié)果(圖書(shū)借閱量)對(duì)人工神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí)。常用的人工神經(jīng)網(wǎng)絡(luò)有BP神經(jīng)網(wǎng)絡(luò)以及近年興起的深度學(xué)習(xí),分述如下:
(1)BP神經(jīng)網(wǎng)絡(luò):多層前饋神經(jīng)網(wǎng)絡(luò),信號(hào)前向傳遞,誤差反向傳播。根據(jù)預(yù)測(cè)誤差調(diào)整網(wǎng)絡(luò)權(quán)值和閾值。拓?fù)浣Y(jié)構(gòu)一般為3層的神經(jīng)元單位組成,其訓(xùn)練步驟包括:a.網(wǎng)絡(luò)初始化;b.隱含層輸出計(jì)算;c.輸出層輸出計(jì)算;d.誤差計(jì)算;e.權(quán)值更新;f.閾值更新;g.判斷算法是否結(jié)束,若沒(méi)有結(jié)束,返回b。
(2)深度學(xué)習(xí)[7]:深度學(xué)習(xí)架構(gòu)由多層非線性運(yùn)算單元組成,每個(gè)較低層的輸出作為更高層的輸入,可以從大量輸入數(shù)據(jù)中學(xué)習(xí)有效的特征表示。深度學(xué)習(xí)具有許多優(yōu)點(diǎn):a.實(shí)現(xiàn)高變函數(shù)等復(fù)雜高維函數(shù)的表示;b.減少計(jì)算的復(fù)雜度;c.人類大腦皮層的最好模擬;d.在類似的不同任務(wù)中重復(fù)共享使用。典型的深度學(xué)習(xí)模型有卷積神經(jīng)網(wǎng)絡(luò)、DBN和堆棧自編碼網(wǎng)絡(luò)。
2.3 測(cè)試
為了檢驗(yàn)智能方法計(jì)算的準(zhǔn)確性,需要對(duì)數(shù)據(jù)進(jìn)行測(cè)試,與真實(shí)結(jié)果比對(duì)后才能確定智能計(jì)算的有效性。一般將數(shù)據(jù)分為3個(gè)部分:訓(xùn)練集(60%),驗(yàn)證集(20%)和測(cè)試集(20%),其中訓(xùn)練集和驗(yàn)證集的數(shù)據(jù)用于智能方法訓(xùn)練種,然后用沒(méi)有參加訓(xùn)練的測(cè)試集數(shù)據(jù)對(duì)訓(xùn)練好的智能方法進(jìn)行計(jì)算獲取輸出結(jié)果,以此評(píng)價(jià)智能計(jì)算方法的優(yōu)劣。
在得到訓(xùn)練好的有效智能計(jì)算方法后,可以通過(guò)輸入今年預(yù)定采購(gòu)的圖書(shū)入藏量計(jì)算相應(yīng)的圖書(shū)借閱量,不斷調(diào)整22個(gè)大類圖書(shū)的入藏?cái)?shù)量,將得到不同的借閱量值。因此,也幫助圖書(shū)館員進(jìn)行服務(wù)整改措施,最終達(dá)到提高圖書(shū)借閱量的目的。
3 結(jié)論
文章通過(guò)數(shù)據(jù)分析與智能計(jì)算闡述如何研究圖書(shū)借閱量與入藏量的擬合關(guān)系。通過(guò)數(shù)據(jù)降維處理與智能方法訓(xùn)練,可以量化這種擬合。在得到訓(xùn)練好的有效智能計(jì)算方法后,可以通過(guò)輸入預(yù)定采購(gòu)的圖書(shū)入藏量計(jì)算圖書(shū)借閱量。不斷調(diào)整這些圖書(shū)入藏?cái)?shù)量,將得到不同的借閱量值,進(jìn)而對(duì)圖書(shū)館員如何提高圖書(shū)借閱量有一定啟示。
參考文獻(xiàn)
[1]田梅.基于混沌時(shí)間序列模型的圖書(shū)借閱流量預(yù)測(cè)研究[J].圖書(shū)館理論與實(shí)踐,2013(7):1-3,26.
[2]張惠玲.基于書(shū)齡分析的圖書(shū)剔舊實(shí)證研究[J].圖書(shū)館論壇,2013,33(4):126-129.
[3]鄒梅.利用神經(jīng)網(wǎng)絡(luò)技術(shù)預(yù)測(cè)圖書(shū)借閱量[J].蘭臺(tái)世界,2013(20):135-136.
[4]鄧奇強(qiáng),熊燕,郭鋒.文獻(xiàn)老化在圖書(shū)館書(shū)目挖掘中的應(yīng)用研究[J].圖書(shū)情報(bào)工作,2013,57(6):91-96.
[5]李靜.Excel函數(shù)圖表功能在文獻(xiàn)統(tǒng)計(jì)預(yù)測(cè)中的應(yīng)用[J].內(nèi)蒙古科技與經(jīng)濟(jì),2017(1):97-99.
[6]史峰,王小川,郁磊,等.MATLAB神經(jīng)網(wǎng)絡(luò)30個(gè)案例分析[M].北京:北京航空航天大學(xué)出版社,2010:11-20.
[7]劉建偉,劉媛,羅雄麟.深度學(xué)習(xí)研究進(jìn)展[J].計(jì)算機(jī)應(yīng)用研究,2014,31(7):1921-1928.
作者簡(jiǎn)介
馬微(1988-),男,漢族,陜西銅川人,碩士,助理館員,研究方向:數(shù)據(jù)分析,圖書(shū)情報(bào)。endprint