宗燕燕,張秉軍
(天津職業(yè)技術(shù)師范大學(xué)圖書館,天津 300222)
圖書采集查重系統(tǒng)的個(gè)性化設(shè)想與實(shí)現(xiàn)
宗燕燕,張秉軍
(天津職業(yè)技術(shù)師范大學(xué)圖書館,天津 300222)
根據(jù)高校圖書館采書、查重的業(yè)務(wù)流程,借助電子信息技術(shù)提出更具個(gè)性化的圖書采訪查重系統(tǒng)。該系統(tǒng)集硬件采集和軟件處理于一體,從圖書館采訪業(yè)務(wù)的流程以及電子信息化技術(shù)的交叉層面出發(fā),解決目前市場上主流的圖書采集器無法滿足采訪流程的一些環(huán)節(jié),并針對館藏?cái)?shù)據(jù)和采購數(shù)據(jù)進(jìn)行了更具專業(yè)化的設(shè)計(jì)和開發(fā)。
圖書采集系統(tǒng);查重系統(tǒng);個(gè)性化
隨著高校對圖書館建設(shè)的重視以及投入的增多,圖書館的圖書采購數(shù)量也在不斷增加。為了提高采購的質(zhì)量和效率,很多高校圖書館采訪業(yè)務(wù),都由傳統(tǒng)的書目訂單征訂轉(zhuǎn)變?yōu)楝F(xiàn)場采購。對采購人員來說,現(xiàn)場采購很直接,但是最需要解決的是查重問題,圖書的采集和查重,是圖書館采訪業(yè)務(wù)最核心的工作,如何更好地將新技術(shù)融合到圖書館傳統(tǒng)工作中來,如何借助電子信息技術(shù)提高工作效率,是信息時(shí)代圖書館采訪工作建設(shè)的必然趨勢[1]。
通過收集、統(tǒng)計(jì)該領(lǐng)域的相關(guān)研究,關(guān)于圖書采集查重方面的研究思路主要從兩個(gè)方向展開:一類是專業(yè)的電子信息技術(shù)人員,他們注重新技術(shù)的引進(jìn)和新功能的實(shí)現(xiàn),從研發(fā)的角度,針對圖書館采訪人員使用的圖書采集器、圖書查重軟件進(jìn)行改進(jìn)。市面上出售的圖書采集器按照硬件來分,可以分為紅光掃描圖書采集器和激光掃描圖書采集器;按照性能可以分為聯(lián)網(wǎng)式和非聯(lián)網(wǎng)式;按照連接方式又可以分為串口連接和USB連接[2]。各圖書館根據(jù)自己的需求購買適合自己的采集器,我館使用的是一款紅光、非聯(lián)網(wǎng)式、USB口連接的采集器,這一類型的采集器,每次外出采集新書之前,要把館藏的圖書信息放在圖書采集器里,用于對比查重。出去采購的時(shí)候,采集器就會(huì)根據(jù)儲(chǔ)存的館藏信息進(jìn)行對比,所掃的ISBN號,如果館藏有則有提示;如果沒有,就將掃描到的ISBN號存進(jìn)采集器自帶的一個(gè)數(shù)據(jù)庫里。等采書回來后再將掃描到的、館藏沒有的圖書數(shù)據(jù)信息導(dǎo)出來,導(dǎo)出的數(shù)據(jù)類型是TXT文檔,再借助其他軟件或者手動(dòng)方式處理成EXCEL文檔,再借助EXCEL做一些后期處理。此類采集器的優(yōu)點(diǎn)是:基本滿足采購需求,操作簡單。缺點(diǎn)是:①輸入界面只能靠掃描,不支持手動(dòng)輸入,有時(shí)候掃描口出問題,則無法掃描,也無法判斷是否應(yīng)該購買;②查看掃描到的數(shù)據(jù)匯總時(shí),只能看到ISBN號和總冊數(shù);③導(dǎo)出的數(shù)據(jù)是TXT文本格式,沒有配套的處理系統(tǒng),只能自己處理成EXCEL再做處理,費(fèi)時(shí)費(fèi)力;④每個(gè)掃描槍都是獨(dú)立的,采集到的數(shù)據(jù)沒有互相查重的功能,只能通過后期導(dǎo)出數(shù)據(jù),借助第三方軟件實(shí)現(xiàn)數(shù)據(jù)之間的查重。因?yàn)椴橹氐牧鞒袒静畈欢?,所以其他類型的圖書查重器在基本功能上都大同小異,有所區(qū)別的地方表現(xiàn)在:屏幕(尺寸大小,是否可觸摸等),是否支持手動(dòng)更改掃描數(shù)據(jù),是否提示重復(fù)以及重復(fù)后的處理方式(直接忽略繼續(xù)掃描,提示用戶是否追加等)等。目前市場主打品牌有卡西歐、訊寶、衛(wèi)天人等,主流的圖書采集器的功能是支持手動(dòng)更改數(shù)據(jù)的非聯(lián)網(wǎng)的采集器[3]。
另一類是圖書館專業(yè)人員,他們更注重基于某一款產(chǎn)品而進(jìn)行更深層次的應(yīng)用和擴(kuò)展研究,如圖書采集前后數(shù)據(jù)的處理和整理,使用圖書采集器的過程遇到的各種問題及解決方案等。很少有人結(jié)合采訪業(yè)務(wù)的流程自行制定一款便捷化、個(gè)性化的圖書采集系統(tǒng)。
本文就從這個(gè)交叉層面出發(fā),在熟知高校圖書館采訪工作業(yè)務(wù)的前提下,借助電子信息技術(shù)提出更具個(gè)性化的圖書采訪查重系統(tǒng)。該系統(tǒng)集硬件采集和軟件處理于一體,既解決了采集過程中經(jīng)常遇到的各種問題,也從其他角度提出了不同的可行性改進(jìn)方案。
針對目前市場上主流的圖書采集器所存在的問題,提出硬件和軟件兩個(gè)部分值得改進(jìn)的地方以及改進(jìn)方案。
2.1 硬件部分
目前市場上支持聯(lián)網(wǎng)的圖書采集器,基本是通過無線網(wǎng)絡(luò)與在采購區(qū)域內(nèi)搭建的服務(wù)器進(jìn)行數(shù)據(jù)交換,圖書采集器掃描到的條碼號傳輸?shù)椒?wù)器的數(shù)據(jù)庫,跟數(shù)據(jù)庫中的館藏?cái)?shù)據(jù)進(jìn)行比對,如果數(shù)據(jù)不重復(fù),則保存此次數(shù)據(jù)記錄,并反饋無重復(fù)的信息給采集器;如果重復(fù),則只反饋信息給采集器即可。通過這樣的數(shù)據(jù)交換方式,實(shí)現(xiàn)聯(lián)網(wǎng)工作。但是這種方式受到圖書采購現(xiàn)場大小的限制,如果場地太大,有可能信號會(huì)無法覆蓋;再者,需要采購者提前在采購現(xiàn)場搭建服務(wù)器。此方法適合特定的圖書商家在固定的展示場所使用。對于臨時(shí)搭建的采購場所,則不太適用;而對于異地采購的人員,外出采購,如果還需要攜帶諸如服務(wù)器這樣的設(shè)備,是很不方便的。采購者寧可采購回來查重去掉重復(fù)的數(shù)據(jù),也不愿意增設(shè)設(shè)備來實(shí)現(xiàn)實(shí)時(shí)的查重。但事實(shí)上,這種實(shí)時(shí)的查重,可以不通過服務(wù)器來實(shí)現(xiàn)。只需要解決聯(lián)網(wǎng)和實(shí)時(shí)數(shù)據(jù)交換兩個(gè)問題即可實(shí)現(xiàn)。
方案一:借助手機(jī)實(shí)現(xiàn)。手機(jī)本身就可以通過wifi、藍(lán)牙以及運(yùn)營商提供的網(wǎng)絡(luò)服務(wù)進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)交換。圖書采集器也可以借助這種技術(shù),將采集系統(tǒng)跟手機(jī)結(jié)合在一起,實(shí)現(xiàn)采集器間的數(shù)據(jù)通信。就目前各館外出現(xiàn)采的情況來說,一種是采購新書,一種是有針對性的補(bǔ)購某些方面的書。不論是哪種情況,所攜帶的館藏?cái)?shù)據(jù)都不會(huì)太大。所以完全可以將館藏?cái)?shù)據(jù)存放在手機(jī)里或者外置的存儲(chǔ)卡里。這就完全可以將采購程序編制成手機(jī)APP軟件,安裝到手機(jī)里,采訪人員只需攜帶手機(jī)以及一個(gè)可以連接到手機(jī)的掃描裝置即可實(shí)現(xiàn)圖書采集功能。對于少量的圖書采購,甚至可以舍去外置的圖書掃描裝置,直接通過手機(jī)按鍵實(shí)現(xiàn)條碼錄入進(jìn)行采購。這種情形的改進(jìn),只需要一個(gè)APP程序,程序流程如下:
掃描圖書的ISBN號后比對館藏?cái)?shù)據(jù)和訂購數(shù)據(jù)(采購到的館藏中沒有的圖書信息),如果兩個(gè)數(shù)據(jù)都沒有查到,則表示該書不重復(fù),可以購買;如果其中任何一個(gè)數(shù)據(jù)庫里有重復(fù)則不予購買。
方案二:如果多個(gè)采集器一起工作,實(shí)現(xiàn)互通查重,則可以在原有圖書采集器的基礎(chǔ)上,加設(shè)通訊裝置,主要是以無線傳輸(距離遠(yuǎn))或藍(lán)牙傳輸(距離近)為主[4]。這兩種傳輸成本低,傳輸速率基本滿足圖書采集需求。我館目前就采用此方案,改進(jìn)了購買的圖書采集器無法多臺(tái)一起工作的缺陷。改進(jìn)思路如下:對于多線圖書采購,即多個(gè)采集器一起工作的情況,通過設(shè)置主從采集器來實(shí)現(xiàn)相互的查重。如有3把圖書采集器外出采購,可以設(shè)置1號采集器為主采集器,其他2個(gè)為輔采集器。輔采集器采集到的數(shù)據(jù)都需要跟主采集器交換數(shù)據(jù),從而得知是否重復(fù);而對于主采集器來說,它只需要跟自己存儲(chǔ)的數(shù)據(jù)進(jìn)行查重即可。這種主從的關(guān)系,本質(zhì)上是主采集器履行了服務(wù)器的職責(zé),但卻沒有增加額外的設(shè)備負(fù)擔(dān)。具體的實(shí)現(xiàn)方法是將廢棄的掃描槍的紅外掃描器件拆卸下來,外加單片機(jī)做主控器件,增設(shè)存儲(chǔ)來實(shí)現(xiàn)。具體的電路改進(jìn)圖如圖1所示。
該方案已經(jīng)在本館測試成功,并投入使用。
在硬件方面,還有一個(gè)常見的問題,就是采集到的圖書信息與電腦通訊的問題。大部分的圖書采集器都需要專用的軟件和設(shè)備,實(shí)現(xiàn)與電腦的通訊,還可以通過存儲(chǔ)卡的形式,將數(shù)據(jù)保存在普通的TF、SD卡上,然后通過普通的讀卡器,經(jīng)由USB接口就能直接獲取數(shù)據(jù),省去了很多中間環(huán)節(jié)。
圖1 主電路圖
2.2 軟件部分
軟件部分主要是解決圖書采集過程中館藏?cái)?shù)據(jù)和訂單數(shù)據(jù)的完整與準(zhǔn)確。
2.2.1 館藏?cái)?shù)據(jù)
館藏?cái)?shù)據(jù)的提取,最容易出現(xiàn)問題的是一號多書,以及一書多號的情況。一號多書的情況主要出現(xiàn)在叢書及書號未變的新版次書;而一書多號的情況主要出現(xiàn)在原版書。為了提高館藏?cái)?shù)據(jù)的質(zhì)量,數(shù)據(jù)庫的字段應(yīng)包括ISBN號、題名、作者、版本、出版發(fā)行項(xiàng)、索書號、價(jià)格、文獻(xiàn)類別、建立時(shí)間、索書號、年代,除此之外,為了解決一些特殊的圖書信息,需要增設(shè)如下字段:叢書號。
ISBN號是關(guān)鍵字,但并不唯一,因?yàn)楝F(xiàn)在圖書業(yè)也有很多同一個(gè)ISBN號,但卻不是一種書的情況叢書號的數(shù)據(jù),提取自索書號字段,但是只是索書號里的一部分,如索書號是O136/154:2,那叢書號就提取2。叢書號字段的設(shè)置是為了避免一號多書漏采圖書的情況。由于這類情況多是因?yàn)閰矔托掳娲蔚臅R詤矔鵀槔?。假設(shè)采訪者在書市看到一套叢書:《中國古典文藝學(xué)叢編》,該書有3冊,分別是(一)創(chuàng)造,(二)作品,(三)接受,3種書都用同一個(gè)ISBN號:7-301-05079-8。假設(shè)現(xiàn)在館藏?cái)?shù)據(jù)只有(一)和(三),沒有(二)。采訪者在使用采集器的掃描前,開啟叢書檢測功能,掃描其中一種圖書的ISBN號時(shí),圖書采集器屏幕會(huì)顯示2條記錄,分別是:
①叢書號:1,輔助題名:創(chuàng)造;
②叢書號:3,輔助題名:接受。
這個(gè)時(shí)候,采訪者需要訂購該叢書的(二)作品,則點(diǎn)擊采購按鈕,采集器就會(huì)顯示采購數(shù)據(jù),采購者只需在叢書號一欄填寫2,在輔助題名中填寫作品,確定后即可保存采購數(shù)據(jù)。這樣的處理方法,避免了一號多書的情況,使得外出采購工作更精準(zhǔn)。對于書號未變的新版次書,也是同樣的處理方法,如索書號為TS153/6=2,則會(huì)在叢書號項(xiàng)中保留2。對于普通采書,不需要開啟叢書檢測功能,主要是為了提高采集數(shù)據(jù)比對后的顯示速度。
對于一書多號的情況,主要是英文原版書[5]。這種情況,不單獨(dú)增設(shè)字段,有幾個(gè)ISBN號就將該書的信息做成幾條記錄進(jìn)行數(shù)據(jù)處理,如有一本原版書,題名是:Balancing change and tradition in global education reform,該書有3個(gè)ISBN號,那么就將這條由SIRSI系統(tǒng)所出的報(bào)表數(shù)據(jù)拆分成3條數(shù)據(jù)。報(bào)表數(shù)據(jù)如下:
ISBN:9781607095002(cloth:alk.paper)
ISBN:9781607095019(pbk.:alk.paper)
題名:Balancing change and tradition in global education reform/edited by Iris C.Rotberg.
版本:2nd ed.
出版信息:Lanham,Md.:Rowman&Littlefield Publishers,c2010.
物理描述:xv,439 p.:24 cm.LCCN:2009047773 G40-059.3/B171=2
索書號:G40-059.3/B171=2
價(jià)格:Y343.00
文獻(xiàn)類別1:G
已建立:2013/1/8
當(dāng)前館址:外文閱覽室
拆分后的2條數(shù)據(jù)為:
ISBN:9781607095002(cloth:alk.paper)
題名:Balancing change and tradition in global education reform/edited by Iris C.Rotberg.
版本:2nd ed.
出版信息:Lanham,Md.:Rowman&Littlefield Publishers,c2010.
物理描述:xv,439 p.:24 cm.
索書號:G40-059.3/B171=2
復(fù)本:1
標(biāo)識(shí):P100E000019070
圖書館:技術(shù)師院館
價(jià)格:Y343.00
文獻(xiàn)類別1:G
已建立:2013/1/8
當(dāng)前館址:外文閱覽室
ISBN:9781607095019(pbk.:alk.paper)
題名:Balancing change and tradition in global education reform/edited by Iris C.Rotberg.
版本:2nd ed.
出版信息:Lanham,Md.:Rowman&Littlefield Publishers,c2010.
物理描述:xv,439 p.:24 cm.
索書號:G40-059.3/B171=2
復(fù)本:1
標(biāo)識(shí):P100E000019070
圖書館:技術(shù)師院館
價(jià)格:Y343.00
文獻(xiàn)類別1:G
已建立:2013/1/8
當(dāng)前館址:外文閱覽室
將上述數(shù)據(jù)按照各個(gè)字段進(jìn)行提取即可保證多個(gè)ISBN號對應(yīng)一本圖書,避免了查重中出現(xiàn)的問題。
2.2.2 訂單數(shù)據(jù)
館藏?cái)?shù)據(jù)的字段設(shè)定后,訂單數(shù)據(jù)的字段格式,只需要跟館藏?cái)?shù)據(jù)的字段完全一致,就可以一方面保證了查重,另一方面也保證了軟件處理的有效性。
根據(jù)圖書館采訪業(yè)務(wù)流程改進(jìn)的圖書采集查重系統(tǒng),在很多地方彌補(bǔ)了目前市場上主流產(chǎn)品的不足,對于外出采購數(shù)據(jù)的精準(zhǔn)率以及訂單處理的人性化、高效化有了提高。但是,采訪工作并不能完全自動(dòng)化,還有很多地方需要采訪人員憑借經(jīng)驗(yàn)來采購。如目前的查重只是基于ISBN號的重復(fù)與否進(jìn)行檢查,但是圖書采購的前提是根據(jù)借閱狀況,使得采購到的書有更多的讀者閱讀,發(fā)揮更大的價(jià)值。所以流通量是考核書籍購買的一個(gè)重要指標(biāo)[6]。借閱高的某類圖書,可以考慮提供采購量,加大復(fù)本量;而對無人借閱的圖書,可以考慮減少購買,這樣才能讓資金的花費(fèi)更合理、更有價(jià)值。而這些,是無法通過單純的圖書采集器完成,還需要采訪人員根據(jù)經(jīng)驗(yàn)和館藏分析統(tǒng)計(jì)后作出定論。不過,隨著科技的進(jìn)步發(fā)展、軟件的升級開發(fā),圖書采集器在圖書現(xiàn)采中的應(yīng)用將會(huì)更加個(gè)性化、人性化和智能化。
[1] 蔡毅.一種圖書外采查重系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代情報(bào),2005(9):160-161.
[2] 童旭.使用數(shù)據(jù)采集器進(jìn)行圖書查重常遇問題探討[J].圖書館建設(shè),2007(3):62-63.
[3] 徐淑琴.數(shù)據(jù)采集器在圖書現(xiàn)采中的應(yīng)用與探析[J].黑河學(xué)刊,2013(5):157-158.
[4] 方旭明,何蓉.短距離無線與移動(dòng)通信網(wǎng)絡(luò)[M].北京:人民郵電出版社,2004:65-70.
[5] 李梅.授權(quán)影印西文圖書著錄的規(guī)范問題探究[J].蘭臺(tái)世界,2013(3):49-50.
[6] 馮澤泗.圖書流通量的理論計(jì)算與實(shí)際確定[J].四川圖書館學(xué)報(bào),1981(3):32-35.
Design and implementation of the acquisitioning and duplicate checking system
ZONG Yan-yan,ZHANG Bing-jun
(Library,Tianjin University of Technology and Education,Tianjin 300222,China)
According to the working process of the library in university,I came up with a personal solution to the acquisition and duplicate-checking for the acquisition and cataloging department by using electronic and informational technology.This system includes both hardware collecting and software handling at the same time.My plan is based on the ground of the using of electronic and informational technology in the library acquisition process.My target is to give a solution to the problem which the mainstream cannot solve and to design more professional data for what the library has already owned and ongoing acquisition.
book acquisition system;duplicate checking system;personal
G253
A
2095-0926(2014)03-0071-04
2014-05-12
天津職業(yè)技術(shù)師范大學(xué)科研發(fā)展基金項(xiàng)目(KJ0825).
宗燕燕(1981—),女,館員,研究方向?yàn)閿?shù)字圖書館建設(shè).