宰姣姣
(北京工商大學圖書館,北京 100048)
復本率作為衡量讀者需求程度的指標,直接影響圖書館藏書的利用情況和讀者服務工作的質量。在經(jīng)費一定的情況下,過低的復本率會增加讀者的等待時間,提高圖書的拒借率;過高的復本率則會縮小圖書館藏書范圍,延長圖書的滯架時間[1]。因此,如何合理確定復本率成為我國高校圖書館館藏建設中亟待解決的難題。然而,在現(xiàn)有高校圖書館的運行過程中,圖書復本率通常只是根據(jù)圖書館工作人員的相關工作經(jīng)驗進行確定,并未根據(jù)高校圖書館的性質、服務對象和館藏范圍以及圖書館的購書經(jīng)費、讀者數(shù)量和流通情況等因素進行定性定量分析。因此,本文以北京工商大學圖書館經(jīng)濟類圖書為例,借助于SPSS 統(tǒng)計軟件,首先利用相關分析確定復本率的主要影響因子,并利用回歸分析進一步探求這些相關因素與復本率之間的關系。
影響圖書復本率的因素頗多,如:購買經(jīng)費、圖書價格、采購的品種數(shù)、讀者需求、品質指數(shù)、科等級、學術水平、生命周期、需求程度、作者知名度、出版社知名度、價格水平等[2]。但這些指標難以量化,進而影響數(shù)學模型的建立。因此,本文通過對高校圖書館的相關流通數(shù)據(jù)進行統(tǒng)計分析,選取圖書借閱冊數(shù)、新書總冊數(shù)、新書種數(shù)以及總藏書冊數(shù)等數(shù)據(jù),結合相關性分析方法確定其與新書復本率之間的線性關系,并最終選定影響高校圖書復本率的主要影響因子。
相關分析是利用適當?shù)慕y(tǒng)計指標衡量變量之間相關程度及相關方向的統(tǒng)計分析方法[3]。本文主要以Pearson相關系數(shù)作為統(tǒng)計指標來衡量各影響因子之間的關系。Pearson相關系數(shù)通常用r表示,其取值范圍為[-1,1],其中,當r 取值為正數(shù)時,表示xi 和yi 兩變量之間為正相關關系,一個變量會隨著另一個變量的增加或減少呈現(xiàn)相同的趨勢;當r 取值為負數(shù)時,表示xi 和yi 兩變量之間為負相關,一個變量會隨著另一個變量的增加或減少呈現(xiàn)相反的變化趨勢;當r 取值為零時,表示xi 和yi 兩變量之間不存在線性相關關系。另外,如果變量xi 和yi 之間為線性相關關系,則針對不同的r 值,可以反映兩者之間線性相關的微弱關系,當|r|<0.3時,則兩者之間的線性相關關系微弱,近似為不相關;當0.3≤|r|<0.5時,則兩者之間的線性相關關系較弱;而當0.5<|r|<0.8則兩變量之間的線性相關度較顯著;當|r|=1時,表示變量xi和yi完全相關。
通過上節(jié)相關分析確定對復本率產(chǎn)生影響的主要影響因子之后,還需要根據(jù)相關統(tǒng)計分析工具建立主要影響因子與復本率之間的線性回歸模型。本文主要采用SPSS中的線性回歸方法進行分析。
在具體的線性回歸模型建立過程中,假設(xi1,xi2,…,xip;yi),i=1,2,…,n 是變量(x1,x2,…,xp;y)的一組樣本數(shù)據(jù),則模型可表示為
其中:β0,β1,β2,…,βP為線性回歸系數(shù),εi為隨機誤差且εi~N(0,σ2)。
對于未知系數(shù)β0,β1,β2,…,βP,需要選用最小二乘法進行估計。即:尋找估計值β0,β1,β2,…,βp,使得公式1達到極小[4],即
同時,根據(jù)SPSS 獲取回歸方程顯著性檢驗參數(shù)t 值和其概率p 值,通過對其概率p 值和給定的顯著水平α進行比較,確定回歸方程系數(shù)的顯著性。如果線性方程滿足顯著性檢驗,且每個系數(shù)都顯著不為0時,則可以利用該線性方程進行復本率預測。
在具體的復本率預測過程中,將相應的預測變量代入線性回歸方程得:
對于預測問題,給定點估計的預測值后,為了得到更多與估計有關的信息,還應該知道預測的精度[5]??梢宰C明:
從而可以求得置信水平為1-α的預測區(qū)間為:
其中:
(X為回歸方程的系數(shù)矩陣)。
北京工商大學是北京市重點建設的以經(jīng)、管、工為主的多科性大學,因此,合理配置F經(jīng)濟類(中圖法)圖書的復本率尤為重要,它是保障科研和教學所需文獻資源的前提,進而影響著學校的發(fā)展方向。本文從金盤圖書館net集成系統(tǒng)中統(tǒng)計出:2004年至2014年的10個學年中,本館F類圖書的借閱冊數(shù)、新書總種數(shù)、新書總冊數(shù)和總藏書冊數(shù)作為研究對象(如表1所示)。
表1 北京工商大學圖書館F類圖書近10年來流通數(shù)據(jù)
利用SPSS 進行簡單相關分析,分析結果如表2所示。從中可以看出,新書復本率與總藏書冊數(shù)的Pearson相關系數(shù)為-0.722,且相關系數(shù)右側帶一個星號,表示在0.05的顯著水平下,兩影響因子線性相關關系顯著,且為負相關;新書復本率與文獻利用率的Pearson相關系數(shù)為0.868,且相關系數(shù)右側帶兩個星號,表示在0.01 的顯著水平下,兩因子高度正線性相關。
確定主要影響因子后,以總藏書冊數(shù)和文獻利用率為自變量,通過他們之間的最優(yōu)線性組合對因變量新書復本率進行預測或估計,建立如下新書復本率的二元回歸模型:y=β0+β1x1+β2x2,其中變量x1表示文獻利用率,x2表示總藏書冊數(shù),變量y 表示新書復本率。利用SPSS 進行回歸分析,得到如下結果。
表2 新書復本率與各影響因子相關分析結果
從回歸系數(shù)的顯著性檢驗結果(如表3)可以看出,總藏書冊數(shù)的t 值為1.318,其概率P 值大于顯著性水平0.05,故自變量x2與因變量y 之間不存在顯著的線性關系,應剔除出回歸方程;文獻利用率的t 值為3.155,其概率P 值為0.016 且小于顯著性水平0.05,故自變量x1與因變量y之間存在顯著的線性關系,應保留在回歸方程中,其回歸系數(shù)為3.636;常數(shù)項的t值為2.962,其概率P值為0.021且小于顯著性水平0.05,故常數(shù)項同樣要保留在回歸方程中,其值為2.111。于是得到回歸方程如下:
表3 回歸系數(shù)表
X1—文獻利用率;X2—總藏書冊數(shù)
由表4可以知,新書復本率y 的殘差介于-0.3091 與0.48857之間,且均值為0,可見預測值與實際值之間差異較小,模型的擬合效果比較好。因此,可根據(jù)公式5對我校2014—2015 學年度經(jīng)濟類圖書復本率進行預測。由于我校近兩年用于購買紙本圖書的經(jīng)費基本保持穩(wěn)定,故可預測2014—2015 學年度經(jīng)濟類新書冊數(shù)約25 000冊,為保證其得到充分利用,可估算其利用率最低約為x0=0.089,結合公式5 得到復本率y0=5.347 04。最后,取α=0.01,將x0,y0代入公式4 得到置信水平為99%的置信區(qū)間(4.523 8,6.170 3)。
表4 殘差分析表
本文針對高校圖書館新書復本率如何確定的問題,通過選取圖書館的相關流通數(shù)據(jù),結合線性回歸分析理論和SPSS數(shù)據(jù)分析軟件,實現(xiàn)了對影響高校圖書館圖書復本率的影響因子的確定,并以北京工商大學圖書館內經(jīng)濟類圖書的流通數(shù)據(jù)為例,實現(xiàn)了對相關方法的實證分析,并求得了2014—2015年度經(jīng)濟類圖書復本率的預測值以及相應的置信區(qū)間,為該校圖書采購部門提供采購借鑒。
[1] 李華.回歸分析在測定最佳圖書復本量中的應用[J].數(shù)理統(tǒng)計與管理,1994(5):39-42.
[2] 劉新文.圖書館圖書復本量的定量分析[J].西南師范大學學報(自然科學版),2008(4):87-89.
[3] 汪冬華.多元統(tǒng)計分析與SPSS 應用[M].上海:華東理工大學出版社,2010.
[4] 薛薇.基于SPSS 的數(shù)據(jù)分析[M].中國人民大學出版社,2006.
[5] 孫寶,付曉艷,劉玲,陳曉紅.基于回歸分析的高校圖書館平均復本量研究[J].情報雜志,2009(4):189-192.