李 偉
(江蘇農(nóng)林職業(yè)技術(shù)學(xué)院圖書館,江蘇 句容 212400)
高校圖書館的采訪工作是圖書館文獻資源建設(shè)的源頭,直接影響了圖書流通和讀者閱讀需求。采訪工作的起點是從采訪數(shù)據(jù)開始的,從數(shù)據(jù)流向的角度來看,采訪數(shù)據(jù)包括兩個方面,一是圖書館接收館配商(下文簡稱書商)的書目數(shù)據(jù),二是書商接收圖書館的圖書訂購數(shù)據(jù)。采訪數(shù)據(jù)是圖書采訪質(zhì)量量化的體現(xiàn),考量采訪數(shù)據(jù)質(zhì)量高低、是否實用,不僅要對采訪數(shù)據(jù)進行量化分析,還要對采訪圖書到館入藏、被讀者利用等相關(guān)數(shù)據(jù)進行跟蹤分析,這樣才能比較全面地評價采訪數(shù)據(jù),為優(yōu)化采訪策略、有效控制采訪數(shù)據(jù)提供第一手資料。筆者以江蘇農(nóng)林職業(yè)技術(shù)學(xué)院圖書館(下文稱我館)為案例,對書目數(shù)據(jù)、圖書訂購數(shù)據(jù)、圖書入藏數(shù)據(jù)和圖書利用數(shù)據(jù)等方面數(shù)據(jù)進行處理和分析,以期充分評價采訪數(shù)據(jù),為我館選擇書商、調(diào)整采訪范圍和復(fù)本提供依據(jù)。
由于書商提供的書目數(shù)據(jù)成為圖書館獲取書目信息的主要來源[1],與我館合作的書商是通過招標形式確定的,因而,采訪的書目數(shù)據(jù)主要來源于中標書商(書商A 和書商B)。本文書目數(shù)據(jù)采集的樣本是2010年和2011年兩個年度書商A 和書商B 提供的書目數(shù)據(jù)。為保證樣本數(shù)據(jù)采集的全面性,書目數(shù)據(jù)包括預(yù)訂書目數(shù)據(jù)和現(xiàn)場采購圖書的數(shù)據(jù),并對這些數(shù)據(jù)的來源書商、年份和批次進行了標識。為確保書目數(shù)據(jù)的可靠性和準確性,筆者批量核查了所有數(shù)據(jù)的關(guān)鍵字段,包括ISBN、分類號、出版日期等字段。
圖書訂購數(shù)據(jù)包括2010年和2011年兩個年度內(nèi)提交給書商A 和書商B 的所有圖書訂購數(shù)據(jù),包括現(xiàn)場采購圖書的數(shù)據(jù)。我館所有現(xiàn)采數(shù)據(jù)必須經(jīng)過確認程序,即書商將現(xiàn)采數(shù)據(jù)發(fā)給采訪人員,進行二次查重,刪除因操作不當(dāng)而產(chǎn)生的重復(fù)數(shù)據(jù),并微調(diào)部分圖書的品種和復(fù)本,以采訪人員確認后的數(shù)據(jù)為最終的現(xiàn)采數(shù)據(jù)。這是保證采訪人員能夠有效控制現(xiàn)采圖書的品種和復(fù)本的一個舉措。
圖書入藏數(shù)據(jù)和流通數(shù)據(jù)是從圖書管理系統(tǒng)(匯文系統(tǒng))批量導(dǎo)出的,時間跨度從2010年1月1日至2012年6月30日(下文稱為統(tǒng)計時段)。比圖書訂購數(shù)據(jù)采集的時間延遲了半年,基于三個因素,一是我館與書商的圖書采購合同約定:合同期滿后六個月內(nèi)仍有義務(wù)接收并結(jié)算我館預(yù)訂的圖書,我館于每年1月初進行圖書招標;二是預(yù)訂圖書絕大部分在六個月左右能夠到館;三是最大限度地把上一年度絕大部分預(yù)訂圖書到館及其流通情況統(tǒng)計在內(nèi)。
另外,在圖書入藏數(shù)據(jù)中添加了到館日期字段。因為入藏日期是匯文系統(tǒng)自動產(chǎn)生的,造成了到館時間相同的一批圖書,入藏時間不一樣。所以,我館對到館圖書實行登記制,即書商送到我館的每批圖書都進行登記,包括送達日期、件數(shù)和接收人等信息。驗收、編目時,再在登記表上填寫這批圖書的起止財產(chǎn)號。再將到館日期批量添加到圖書入藏數(shù)據(jù)中,這對準確統(tǒng)計采訪圖書到館周期是十分必要的,同時,還能了解圖書編目加工周期。
由于采集的樣本數(shù)據(jù)為原始數(shù)據(jù),采集與處理的數(shù)據(jù)量比較大,基本上都是進行批量處理,必須依賴于計算機軟件,本文采用的數(shù)據(jù)處理軟件為Visual Fox Pro(9.0 版)和Office Excel(2003 版)。
2010年和2011年兩個年度中,與我館合作的兩個書商向我館提供的書目數(shù)據(jù)均包括期貨、現(xiàn)貨和專題三種預(yù)訂書目數(shù)據(jù)和現(xiàn)采書目數(shù)據(jù)。每個書商的四種書目數(shù)據(jù)之間相互重復(fù)比例較高,兩個書商之間的書目數(shù)據(jù)重復(fù)比例更高,因此,必須對書目數(shù)據(jù)進行有效性處理,即重復(fù)書目數(shù)據(jù)只保留的最先發(fā)送的書目數(shù)據(jù)記錄,第二次及其之后的重復(fù)數(shù)據(jù)不計入統(tǒng)計數(shù)據(jù)。
書商A 在2010 和2011年度中提供了565 期、293,286 種預(yù)訂書目數(shù)據(jù)以及4 批、7,054 種現(xiàn)采圖書數(shù)據(jù),累計有300,340 種書目數(shù)據(jù),經(jīng)過數(shù)據(jù)有效性處理之后,只有216,573 條記錄,重復(fù)率達27.89%,沒有重復(fù)過的書目數(shù)據(jù)只占49.05%。重復(fù)記錄最多次數(shù)達5 次,重復(fù)次數(shù)、記錄及其比例如表1 所示。書商B 在兩個年度中提供了642 期、266,244 種預(yù)訂書目數(shù)據(jù)以及8 批、24,441 種現(xiàn)采圖書數(shù)據(jù),累計有290,685 種書目數(shù)據(jù),剔除重復(fù)記錄后,共有212,122 條記錄。重復(fù)率達27.03%,沒有重復(fù)的記錄有53. 07%,重復(fù)記錄最多次數(shù)達6次,重復(fù)次數(shù)、記錄及其比例如表1 所示。書商A 的書目數(shù)據(jù)中有163,086 條書目記錄與書商B 的書目數(shù)據(jù)重復(fù),占總記錄比例為75.27%;書商B 的書目數(shù)據(jù)中有165,083 條記錄與書商A 的書目數(shù)據(jù)重復(fù),占總記錄比例為76.55%,可見,兩者相互重復(fù)比例非常高。
表1 書商A、書商B 書目數(shù)據(jù)重復(fù)數(shù)量、次數(shù)及比例
書商A 和書商B 累計提供了591,026 條(計重復(fù))書目數(shù)據(jù),各自刪除重復(fù)數(shù)據(jù)之和為428,695 條記錄,將兩個書商數(shù)據(jù)合并后,剔除了162,945 條重復(fù)數(shù)據(jù),最終剩下265,750 條記錄,重復(fù)率也有38.01%。而2010年和2011年全國各類圖書初版395,516 種、重印300,746 種[2-3],兩個書商的書目數(shù)據(jù)只占初版的67.19%、總數(shù)的38.17%,這固然與兩個書商提供有針對性的書目數(shù)據(jù)有關(guān),但書目數(shù)據(jù)提供數(shù)量還是偏少。
筆者認為,造成重復(fù)比例較高的原因有四種情況:①出版商重復(fù)提供書目數(shù)據(jù)給書商,一般情況下,出版商會向書商發(fā)送期貨預(yù)訂書目和現(xiàn)貨發(fā)行書目。②出版商的期貨書目與社科新書目、科技新書目和地科新書目重復(fù)。③書商現(xiàn)貨與其他書目重復(fù)提供給圖書館。④現(xiàn)采圖書與其他書目數(shù)據(jù)重復(fù),現(xiàn)采也有書市、新書展銷會以及書商庫房集中選購等形式之分,重新印刷的舊版圖書也時常充斥于新書之中,無形中增加了重復(fù)比例。
將書商A、書商B 提供的書目數(shù)據(jù)(不計重復(fù))按《中國圖書館分類法》進行分類統(tǒng)計,分布的柱形圖如圖1 所示(左右兩側(cè))。兩個書商書目數(shù)據(jù)合并后數(shù)據(jù)的類別分布情況如圖1 中書商AB 所示(中間)。
圖1 采訪數(shù)據(jù)分類統(tǒng)計柱形圖
書商A 和書商B 書目數(shù)據(jù)分類統(tǒng)計的結(jié)果表明:二十二大類中排在前十位的類別相同,順序有所區(qū)別。排在前四位的類別順序完全相同,數(shù)量多少依次排列為T、F、I、D,后面六個類別次序略有不同,書商A 的類別次序為H、K、B、G、R、J,書商B 的次序為K、G、H、J、B、R,這十個大類書目數(shù)量占書商A 和書商B 總書目數(shù)比例分別為88.66%、88.14%。排在前十位的大類與2010年和2011年全國各類圖書出版種數(shù)的統(tǒng)計數(shù)據(jù)相一致[2-3],順序略有差異(G、T、I、F、J、D、K、H、R、B),所占比例比較接近(90.44%)。但每個類別的數(shù)量相差甚遠,最突出的類別是G 大類,書商只提供了17,335 種,而同期全國初版圖書有109,437 種,只占15.84%。
兩個書商提供書目數(shù)量最多的類別都是T 大類(工業(yè)技術(shù)),分別占書商A 和書商B 書目總數(shù)的18.56%和17.32%,比排在后十二個大類數(shù)量總和(11.34%、11.86%)還多,排在前五位的二級類目都是TP、TU、TS、TN、TM,數(shù)量多少的排列順序也一樣,這五個二級類目書目數(shù)量占書商A 和書商B 的T 大類書目數(shù)量的比例分別為78.13%、74.58%,其中,TP 類和TU 類書目的數(shù)量較多,占T 大類書目數(shù)量的比例分別為30.73%、19.78%。
書商A 和書商B 提供的當(dāng)年新書書目數(shù)據(jù)分別占總書目記錄的78.60%和78.14%,所占比例非常接近。書商A 和書商B 的現(xiàn)采書目數(shù)據(jù)占總書目記錄分別為3.26%、11.52%,兩者相差較大。將兩個書商的現(xiàn)采書目數(shù)據(jù)與預(yù)訂書目數(shù)據(jù)進行重復(fù)性比較,結(jié)果表明:現(xiàn)采書目大部分(書商A 有80.34%、書商B 有85.65%)與預(yù)訂書目數(shù)據(jù)相同。這個現(xiàn)象說明了現(xiàn)采圖書中只有部分(不到20%)圖書在此之前的預(yù)訂書目數(shù)據(jù)中沒有出現(xiàn)過,而且出于商業(yè)利益的需要,在現(xiàn)采之后,書商還會將所有參展的書目數(shù)據(jù)發(fā)給圖書館,現(xiàn)采只是打了個時間差,提前將新書提供給圖書館選購。
在現(xiàn)采圖書中,書商A 和書商B 當(dāng)年新書所占的比例分別只有5.78%和5.05%,而絕大部分是前一年度甚至更早出版的圖書。當(dāng)然,這個統(tǒng)計數(shù)字并不代表書商提供現(xiàn)采的新書很少,而是適合我館收藏的絕大部分當(dāng)年新書在此之前已預(yù)訂過了。其實,這種情形在意料之中,原因是書商提供現(xiàn)采的絕大部分圖書是與此合作的出版商提供的,而這些出版商必然會提供預(yù)訂書目數(shù)據(jù)給書商。筆者的體會是:書商庫房現(xiàn)采的主要目的是館藏或預(yù)訂補缺,而類似于新書展銷會的現(xiàn)采策略則是優(yōu)先挑選與書商沒有或很少合作的出版商提供的圖書,這樣才能減少適合館藏的遺漏圖書,降低現(xiàn)采圖書與預(yù)訂書目的重復(fù)率,這就要求采訪人員平時要留心書商預(yù)訂書目的出版商信息,或在現(xiàn)采之前收集與書商合作的出版商信息,有備而采,因為新書展銷會或書市的布展基本上是以出版商為單元來布局的,這種策略在實際操作中是可行的。
2010年和2011年我館根據(jù)書商提供的書目數(shù)據(jù)定期征訂(包括現(xiàn)采數(shù)據(jù))圖書,將圖書訂購數(shù)據(jù)以E-mail 形式發(fā)送給書商。在此期間,我館采訪人員向書商A 發(fā)送了49個批次、21,125 種(31,624冊)圖書征訂數(shù)據(jù);向書商B 發(fā)送了59個批次、23,162種(33,401 冊)圖書;向兩個書商共計采訪了108個批次、44,287 種(65,025 冊)圖書,平均每個批次410 種,平均每種圖書復(fù)本率為1.47 冊,書商A和書商B 品種所占比例分別為47.94%和52.06%。圖書訂購品種的分類統(tǒng)計如圖2(中間柱形)所示。訂購數(shù)量排在前十位的類別依次為T、F、I、H、B、S、G、J、K、C,共39,334 種,所占比例為88.82%,最多是T 大類,有11,380 種,所占比例為25.70%,是排在后十二大類的2.3 倍。
圖2 圖書征訂分類統(tǒng)計柱形圖
訂購圖書中有3,483 種圖書未到館,總體未到館率為7.86%,其中,現(xiàn)采圖書未到館率為5.08%,預(yù)訂圖書未到館率為9.63%;書商A 圖書未到館率為5.80%,書商B 圖書未到館率為9.76%。未到館圖書中,書商A 和書商B 所占比例分別為35.37%和64.63%,書商B 未到館比例明顯高于書商A,是其的1.83 倍。未到館的訂購圖書分類統(tǒng)計如圖2(右側(cè)柱形)。從每個類別的絕對數(shù)量來看,數(shù)量較多的前十個類別是T、H、S、I、F、G、J、B、K、C,與訂購圖書數(shù)量前十位排列一樣,順序略有不同。圖書訂購數(shù)量多,未到館數(shù)量也會較多,這是正常現(xiàn)象。每個類別的未到館訂購圖書與訂購圖書比例的統(tǒng)計結(jié)果表明:比總體未到館率(7.86%)高的類別有十一個,比例最高的類是S 大類(14.97%),另外十個大類依次是A、G、P、E、H、Q、N、J、O、K,比例分別為13.75%、12. 83%、12. 61%、11. 93%、10. 08%、9.81%、9.33%、8.94%、8.55%、8.54%。從這個結(jié)果的另外一個方面來看,在書目數(shù)據(jù)及其訂購的數(shù)量排前十位的類別中分別有七個類(T、I、F、J、D、R、B)和六個類(T、F、I、B、G、C)的圖書未到館率低于平均數(shù)。說明書目數(shù)據(jù)類別數(shù)量、圖書訂購類別數(shù)量與圖書未到館率之間沒有必然聯(lián)系。
征訂圖書中有40,804 種、59,868 冊到館,總體到館率為92.14%。到館圖書中,書商A 和書商B所占品種比例分別為49.01%和50.99%,書商A 和書商B 的征訂圖書綜合到館率分別為94. 20% 和90.24%,書商A 比書商B 高出4個百分點左右。到館圖書品種的分類統(tǒng)計如圖2(左側(cè)柱形),排在前十個類別與征訂數(shù)據(jù)相同,共有36,227 種,所占比例為88.78%,到館最多是T 大類,有10,657 種,占到館圖書總數(shù)的26.12%,是排在后十二大類的2.33 倍。T 大類中,排在前五位的二級類目是TP、TU、TS、TH、TG,有9,199 種,占T 大類的86.32%。最多的二級類目是TP,有4,017 種,占二十二大類總數(shù)的9.84%。將每個類別圖書的到館數(shù)量與訂購數(shù)量進行比較,比例最高的類別是V 類(100%),最低的是S 類,比例較高的類別還有F(95.27%)、Z(95.26%)、R(94.59%)、D(93.73%)、T(93.65%)、B(93.24%)、U(92.94%)、X(92.93%)九個類別。
圖書到館周期和到館率是圖書館比較關(guān)心的,我館在圖書采購合同條款中對圖書到館周期有明確要求。由于我館實行圖書到館登記制度,我們把每種圖書到館日期與訂購日期(以E-mail 發(fā)出日期為準)的時間差作為到館周期,圖書到館數(shù)量(種)與訂購數(shù)量的比例(百分比)作為圖書到館率。筆者對圖書到館周期及到館率進行了細化統(tǒng)計,將圖書到館周期按10 天內(nèi)、30 天內(nèi)、60 天內(nèi)、90 天內(nèi)、180天內(nèi)、365 天以內(nèi)以及一年以上七個時段進行統(tǒng)計,各個時段的圖書到館率如表2 所示。到館圖書平均到館周期為69 天。
表2 圖書到館周期及到館率統(tǒng)計表
從表2 可以看出,書商A 和書商B 的圖書到館周期都沒有規(guī)律可循,都沒有出現(xiàn)理想化的正態(tài)分布,而是呈現(xiàn)各自的波浪狀。在一個月和二個月時間內(nèi)書商A 比書商B 的圖書到館率分別高13. 43%、6.33%;在三個月、半年和一年內(nèi)書商A 比書商B 的圖書到館率分別低0.66%、1.26%、2.78%,呈遞減趨勢。兩個書商的綜合到館情況:一個月內(nèi)圖書到館率為33.43%;兩個月內(nèi)圖書到館率為52.54%;三個月內(nèi)圖書到館率為67. 18%;半年內(nèi)圖書到館率為87.15%;一年內(nèi)圖書到館率為91.55%。
2010年和2012年度入藏的訂購圖書有40,804種(59,868 冊),在統(tǒng)計時段內(nèi)有290 種(290 冊)圖書屬于工具書,入藏在本館參考咨詢室,只限于室內(nèi)閱覽,無法統(tǒng)計其利用情況,也就沒有計入圖書利用情況統(tǒng)計范圍。因此,在入藏圖書中,零借閱圖書的記錄就由原來的28,692 種調(diào)整為28,402 種(39,447 冊),占訂購圖書品種的比例為69.61%。在此期間入藏圖書有流通記錄有12,112 種(59,868 冊)圖書,品種流通率為29.90%。在統(tǒng)計時段內(nèi)累計流通了34,100 冊(次)圖書,冊數(shù)流率為56.96%。
在零借閱記錄圖書中書商A 有14,466 種(20,175 冊)圖書,所占比例為50. 42%;書商B 有14,226 種(19,562 冊),所占比例為49.58%,幾乎各占一半,比較接近。從側(cè)面反映了我館采訪人員對兩個書商沒有偏頗,尺度掌握得較好。
將零借閱記錄圖書進行分類統(tǒng)計,統(tǒng)計結(jié)果如圖3 左側(cè)柱形所示,數(shù)量最多的前十個類別依次是T、F、H、I、B、G、S、J、C、K,占零借閱記錄圖書總數(shù)的88.01%,其中T 大類占27.10%,比其他十二個類別所占比例還多。在T 大類中最多的五個類別依次是TP、TU、TS、TG、TH,占T 大類的81.97%,其中TP 占36.88%,是其他十四類別的兩倍多。
筆者還統(tǒng)計了零借閱記錄圖書各個類別的品種數(shù)量占統(tǒng)計時段內(nèi)入藏圖書類別的品種數(shù)量的百分比,結(jié)果表明:排在前十位的大類依次是V、A、F、U、D、N、G、X、O、P,最多大類(V)達90%,最少大類(P)也有78.64%。這十個類別品種數(shù)量占零借閱記錄圖書的品種總數(shù)的比例為31.27%,占統(tǒng)計時段內(nèi)入藏圖書品種總數(shù)的比例為25.87%。從類別角度分析,這十個類別的圖書利用率較低,在以后采訪中要控制這十個類別的品種及復(fù)本數(shù)量。在品種數(shù)量上和類別比例上,零借閱圖書類別較多的類有F 和G兩個類別,特別是F 大類,筆者認為這兩個類別的品種和復(fù)本都有適當(dāng)減少,要對這兩個類別進一步深入分析、細化采訪范圍。
另外,零借閱圖書中2010年入藏了12,052 種,其中當(dāng)年(2010年)出版的圖書有9,627 種,所占比例為79.88%;2011年入藏了16,357 種,其中當(dāng)年(2011年)出版的圖書有12,816 種,所占比例為78.35%,這二年中,當(dāng)年出版圖書占入藏圖書的比例為79%。從側(cè)面說明圖書出版時間并不是造成讀者零借閱率高的主要原因。
圖3 圖書流通分類統(tǒng)計柱形圖
4.2.1 品種利用分析
將有借閱記錄圖書的品種數(shù)量進行分類統(tǒng)計,結(jié)果如圖3(右側(cè)柱形)所示,書商A 和B 分別占有比例為47.66%、52.34%。品種數(shù)量最多的前十個大類依次是T、I、H、F、B、K、S、J、R、C,占91.63%,前四個類占64.09%,接近三分之二,是讀者借閱的主要類別,也是訂購和入藏數(shù)量前四位的類別;T 大類所占比例最多(23.41%),主要分布在TP、TU、TS 三個二級類目中,占T 大類的87.13%,這與計算機等級考試、計算機技術(shù)普及以及學(xué)校開設(shè)了與計算機、風(fēng)景園林和食品加工相關(guān)專業(yè)或?qū)I(yè)課程有關(guān)。
從圖3 可以得出品種分類利用比例的情況,即各個大類的借閱圖書品種(左側(cè)柱形)與入藏圖書品種(中間柱形)的比例,排在前十位的大類依次是Z(54.19%)、I(53.51%)、R(46.51%)、K (43.14%)、H(41.36%)、B(31.48%)、S(31.19%)、J(28.02%)、T(26.87%)、E(26.56%),其中,高出品種流通百分比平均值(29.90%)的大類有Z、I、R、K、H、B、S 七個大類。這七個大類圖書品種利用率相對較高,在采訪時,可以調(diào)整采訪策略,適當(dāng)增加這七個類別的圖書品種數(shù)量或復(fù)本,這不僅可以提高圖書品種利用率,降低圖書零借閱率,更主要的是可以更好地滿足讀者對圖書品種的需求。雖然T 大類和F 大類圖書品種流通數(shù)量較多,占圖書品種流通總數(shù)的30.64%,但品種分類利用比例較低,特別是F 大類,只有14.83%,是品種流通百分比平均值(29.90%)的二分之一,并且這兩個大類圖書品種占零借閱品種總數(shù)的44.88%,是零借閱率較高的主要因子,因此,在采訪過程,對T 大類和F 大類圖書采訪策略要進一步細化、優(yōu)化,才能提高品種利用率、降低零借閱率。訂購和到館圖書類別較多的G 大類,其流通數(shù)量和相對比例都較低,應(yīng)引起采訪人員的注意。
將流通圖書、到館圖書、訂購圖書和書目數(shù)據(jù)(不計重復(fù))按品種進行縱向比較,得出四種數(shù)據(jù)的比例為1:3.37:3.66:21.94,書目數(shù)據(jù)中最終被讀者利用的圖書只有4.56%,被采訪人員選擇的圖書有16.66%。如果按冊次進行縱向比較,得出前三個數(shù)據(jù)的比例為1:1.76:1.91,比品種比例高出很多。
書商A 的書目數(shù)據(jù)略多于書商B,高出2.06%,書商B 在圖書訂購數(shù)量(品種)、到館數(shù)量(品種)和流通數(shù)量(品種)方面多于書商A,分別高出7.92%、8.49%和8.93%。圖書到館周期和到館率,書商B也比書商A 有優(yōu)勢??傮w而言,書商B 的綜合指標略高于書商A,在其他指標相同的情況下,書商B 稍有優(yōu)勢,但不是非常明顯。
如果能對書商的書目數(shù)據(jù)及其延伸數(shù)據(jù)進行持續(xù)、深入、細化的研究,并融入采訪理念,必然會對科學(xué)地選擇書商、降低圖書零借閱率、提高圖書利用率大有裨益。
[1]麻娜娜.書目信息與到貨率:全國圖書館采購最看重的和最糾結(jié)的[N]. 中國圖書商報,2011-04-26.
[2]2010年全國新聞出版業(yè)基本情況[N].中國新聞出版報,2011-09-06.
[3]2011年全國新聞出版業(yè)基本情況[N].中國新聞出版報,2012-08-06.