楊振力,谷艷鋒,宋 妮
( 大連外國語大學圖書館,遼寧 大連116044;鄖陽師范高等??茖W校圖書館,湖北 十堰442000;大連外國語大學圖書館,遼寧 大連116044)
隨著先進技術(shù)的發(fā)展,數(shù)字化圖書(電子書)在20 世紀末最先在美國出現(xiàn)。隨著技術(shù)手段的進步,數(shù)字化圖書得到跨越式的發(fā)展。圖書館作為專門的文獻情報部門,在圖書數(shù)字化的進程中發(fā)揮了重要的作用并將在今后的圖書數(shù)字化過程中扮演更加重要的角色。大連外國語學院圖書館(以下簡稱大外圖書館)充分考慮本校的專業(yè)設置情況(大連外國語學院是東北地區(qū)唯一一所以外語教育為主的高等院校,專業(yè)設置以語言類專業(yè)為主)把外文文獻作為文獻資源建設的重點。接收國外贈書是我館外文文獻建設的重要手段之一,“大外圖書館”接收的國外贈書以“日本科學協(xié)會(以下簡稱日科協(xié))”所贈外文圖書所占比重最大,它們對圖書館的外文文獻資源建設具有重要的作用[1]。大外圖書館日文贈書專題數(shù)據(jù)庫建設就是對這些“日科協(xié)”所贈圖書中的日文部分進行數(shù)字化。
圖書的數(shù)字化是每個圖書館都在做或即將要做的工作。在國內(nèi),圖書數(shù)字化規(guī)模較大的有國家圖書館的“中國數(shù)字圖書館工程”、超星公司和書生公司所開發(fā)的數(shù)字化圖書系統(tǒng)。這些數(shù)字化圖書系統(tǒng)的開發(fā)成功,大大促進了圖書數(shù)字化的進程,加快了文獻信息的交流速度,拓展了信息交流的時空[2]。
國外的圖書數(shù)字化發(fā)展超前于國內(nèi)同行。如,Google 聯(lián)手世界名校,開創(chuàng)業(yè)內(nèi)先河,進軍數(shù)字化搜索市場。有人把這一創(chuàng)舉與人類印刷術(shù)的發(fā)明相提并論,認為這將在全世界掀起一場信息化革命。2004年12月,Google 在業(yè)內(nèi)宣布聯(lián)手哈佛大學、斯坦福大學、密歇根大學、牛津大學和紐約公共圖書館共推圖書數(shù)字化,把4,000多萬冊最優(yōu)秀的圖書和人類的知識精華放到網(wǎng)上,供所有的用戶使用[3]。在圖書數(shù)字化方面,中國最大的數(shù)字圖書館“超星”已完成了260多萬冊中文書籍的數(shù)字化工作,“超星”還發(fā)展了很多中文檢索技術(shù)[4]。國內(nèi)外學者對電子閱讀行為的研究也呈上升趨勢,這種上升趨勢反映了電子書越來越被人們所接受的這樣一個變化過程[5]。
1.2.1 節(jié)約館藏空間
數(shù)字化圖書采用高密度存儲,可以用很小的空間存儲更多的圖書,便于收藏。圖書館館藏空間的不足是當前絕大多數(shù)圖書館面臨的迫切問題。而數(shù)字版的圖書現(xiàn)在只需要很小體積的磁盤就可以把過去整個圖書館的藏書盡收其中,大大節(jié)約了圖書館的館藏空間,減輕了圖書館空間不足的壓力。
1.2.2 提高檢索效率
圖書數(shù)字化使資料查詢和文獻檢索變得極為方便。數(shù)字化圖書給讀者提供了多方面的檢索途徑,靠翻閱傳統(tǒng)文獻需要幾天查詢的東西,通過數(shù)字化圖書的檢索功能僅幾秒鐘就可以解決,讓人們真正感受到高科技的神奇魅力。
1.2.3 提高資源共享程度
數(shù)字化圖書復制簡單,便于圖書的廣泛傳播。同時,由于聯(lián)機操作,一時難以找到的紙質(zhì)圖書,也能立即獲得其電子版來替代。傳統(tǒng)的圖書共享是通過各成員館之間的館際互借來實現(xiàn)的,這種館際互借方式步驟多、速度慢、成本高、可控性差。傳統(tǒng)館際互借諸多的缺點促使了新形勢下數(shù)字化資源共享[6]。數(shù)字化資源共享具有實時、高效、節(jié)能等諸多優(yōu)點,已經(jīng)基本上取代了傳統(tǒng)紙質(zhì)圖書的館際互借方式。
“大外圖書館”現(xiàn)有日文藏書45 萬余冊,日文文獻館藏量位居全國高校圖書館之首。豐富的日文文獻給專題數(shù)據(jù)庫建設提供了可靠保障。近年來,圖書館接收“日科協(xié)”大量贈書,從1999年7月開始,“日科協(xié)”向“大外圖書館”贈書301,151 冊[1],是國內(nèi)接受“日科協(xié)”贈書最多的高校圖書館。“日科協(xié)”贈書包括日語、英語等多個語種的原版圖書,圖書種類包括政治、法律、軍事、經(jīng)濟、文教體育等,亦有自然科學方面的圖書,如數(shù)理科學、天文學、地球科學等。這些贈書極大地豐富了圖書館的日文館藏,使圖書館在經(jīng)費有限的情況下最大限度地滿足讀者對外文原版書籍的需求,促進了外語教學和科研工作的開展。同時也確立了“大外圖書館”在國內(nèi)日文文獻建設方面的領(lǐng)先地位,為今后“大外圖書館”建設日語文獻中心打下了堅實基礎,目前日文原版藏書已成為“大外圖書館”的特色館藏之一[1]。
資金不足一直是制約圖書館文獻建設、圖書數(shù)字化建設的瓶頸問題,圖書數(shù)字化需要大量的專項經(jīng)費。按照特色的日文圖書30 萬冊計算,以平均每冊圖書500 頁計算,需掃描頁碼約1.5 億頁,掃描費用為0.1 元/頁,總計需要經(jīng)費約1,500 萬元。這只是用于支付圖書掃描加工的費用,其他相關(guān)的軟硬件升級費用約100 余萬元。2011年,日文贈書專題數(shù)據(jù)庫項目——“大連外國語學院日語共享平臺”獲省財政支持,借此“東風”,日文圖書的數(shù)字化建設才得以正式開始。
日文贈書專題數(shù)據(jù)庫建設考慮到本館技術(shù)、人員等因素,把數(shù)據(jù)庫的建設任務外包給北京世紀超星信息技術(shù)發(fā)展有限責任公司(以下簡稱超星公司),圖書掃描、數(shù)據(jù)加工、平臺建設等所有相關(guān)工作由超星公司全權(quán)負責。超星數(shù)字圖書館因其在同行業(yè)中處于數(shù)字圖書資源數(shù)量最多、專業(yè)資源最為權(quán)威、加工能力最大、技術(shù)最為成熟、用戶最多的優(yōu)勢地位,已被公認為數(shù)字圖書館行業(yè)的第一品牌[4]。
超星公司已經(jīng)和多家圖書館合作以業(yè)務外包的方式對各圖書館需要數(shù)字化的圖書進行加工,筆者統(tǒng)計了2010年4月27日~2011年9月14日期間,東北地區(qū)圖書數(shù)字化的情況(見表1)。
?
表1 超星公司東北區(qū)數(shù)字化工作量統(tǒng)計表
從表1 可見,以外包形式委托超星進行圖書數(shù)字化的機構(gòu)有高校圖書館、公共圖書館、企事業(yè)單位圖書館、研究所等;數(shù)字化文獻的數(shù)量多少不等,從幾十冊、數(shù)千冊到數(shù)萬冊;數(shù)字化文獻類型有圖書、期刊,以圖書所占比重居多;數(shù)字化文獻類型語種上中英文均有,絕大部分為中文文獻。圖書數(shù)字化外包具有非常明顯的優(yōu)勢。
2.3.1 成本優(yōu)勢
超星公司開展圖書數(shù)字化經(jīng)驗豐富,在成本上同樣具有巨大優(yōu)勢?!按笸鈭D書館”之前由本館人員進行圖書數(shù)字化工作,由于設備、管理體制等諸多因素影響造成數(shù)字化圖書成本很高,經(jīng)筆者統(tǒng)計,本館進行數(shù)字化圖書成本是1.7 元/頁,超星進行數(shù)字化圖書付出費用是0.1 元/頁,因此,利用超星公司外包服務方式能夠大大節(jié)約數(shù)字化圖書的成本。
2.3.2 效率優(yōu)勢
“大外圖書館”工作人員由于受到設備、管理體制等諸多因素的影響,數(shù)字化圖書效率很低,外包之后超星工作人員因為采取計件工資形式,極大地激發(fā)了工作人員的工作熱情,效率極大提高,掃描平均速度可達人均8,000 頁/天。超星公司數(shù)字化圖書的高效率保障了圖書館大量的日文文獻能在短時間內(nèi)集中進行數(shù)字化,方便讀者利用數(shù)字化圖書進行學習、教學、科研。
2.3.3 效果優(yōu)勢
從掃描效果上看,超星公司依托先進的技術(shù)設備、強大的技術(shù)力量、高效的人員管理等使掃描出的電子圖書不僅頁面清晰而且可操作性強。本館之前掃描的電子圖書是JPG 格式,無法實現(xiàn)復制粘貼等實用性的編輯功能。超星公司通過購買專門的日文OCR(Optical Character Recognition,光學字符識別)軟件,降低了OCR 的拒識率、誤識率,提高了識別速度。對于識別不出、識別出錯的文本有專門的工作人員進行校對,保障了數(shù)字化圖書的質(zhì)量。超星公司數(shù)字化的圖書最為關(guān)鍵的特點是能夠?qū)崿F(xiàn)復制粘貼等實用性的編輯功能,大大方便廣大讀者的利用。
日文贈書專題數(shù)據(jù)庫共享平臺由超星公司設計完成,超星公司設計的數(shù)據(jù)庫共享平臺參照了在業(yè)內(nèi)獲得廣泛認可的讀秀學術(shù)搜索平臺,保留了讀秀所有的實用功能。因為讀秀平臺是個通用版的平臺(適合所有圖書館),所以日文贈書專題數(shù)據(jù)庫共享平臺剔除了一些不適合本館實際的功能模塊,并且增加了一些根據(jù)本館實際提出的獨特功能模塊,使日文贈書專題數(shù)據(jù)庫共享平臺非常便于廣大讀者利用(平臺頁面效果見圖1)。
圖1 大連外國語學院外語共享平臺
另外,共享平臺還支持Web2.0,一定程度上做到了開放和互動。開放和互動是Web2.0 的主要特征,也是Web2.0 發(fā)展的一大基礎[7],共享平臺強調(diào)用戶體驗和社會性服務[8],可實現(xiàn)讀者寫書評及專家推薦圖書的功能[9],這些實用功能有助于充分調(diào)動讀者參與圖書館信息組織建設的積極性[10]。
日文贈書專題數(shù)據(jù)庫共享平臺內(nèi)的資源主要面向大連外國語學院全體師生員工,對使用范圍采用IP 控制的方法,只允許校內(nèi)IP 范圍的用戶使用,校外IP 無權(quán)訪問。這種IP 控制的方式有利于保障日文贈書專題數(shù)據(jù)庫內(nèi)的資源不被惡意利用,減少侵犯著作權(quán)的風險。但是出于促進資源共享的良好初衷,平臺可以提供面向校外用戶的文獻傳遞,校外用戶的需求可以通過文獻傳遞窗口進行申請,由圖書館專門負責文獻傳遞的工作人員負責辦理其文獻傳遞請求。對于文獻傳遞的費用收取郵寄成本費、數(shù)字化圖書成本費,不收取其他額外費用。收取成本費和使用范圍限制在教學研究領(lǐng)域的措施保障了圖書數(shù)字化不侵犯著作者的知識產(chǎn)權(quán)[11]。
日文贈書專題數(shù)據(jù)庫建設的工作均外包給超星公司,售后服務及升級的服務也由超星公司負責。日文贈書專題數(shù)據(jù)庫共享平臺設計上考慮到大連外國語學院是專門的語言類高校,學院共設有10個語種專業(yè),因此,平臺需要具有開放性及擴展性,能夠支持多語種共享及增加新的外文數(shù)據(jù)庫。
信息資源只用通過共享才能最大限度地發(fā)揮它的作用,信息資源共享需要一個平臺來承載。數(shù)字化之后的國外贈書要想最大限度地予以利用也同樣需要一個共享平臺,大連外國語學院日語共享平臺是數(shù)字化之后的國外贈書進行廣泛共享的嘗試,它順應了圖書數(shù)字化的大潮流,日文贈書的數(shù)字化工作是對國外贈書數(shù)字化工作的有益嘗試。
[1]楊振力等.高校圖書館接收國外贈書管理工作探討[J].大學圖書情報學刊,2011(2) :39.
[2]趙文龍等. 基于ASP 的圖書數(shù)字化平臺[J].圖書情報工作,2002(11) :86.
[3]靳生璽. Google,圖書數(shù)字化計劃的三大硬傷[J].IT 時代周刊,2005(7) :20,62-63.
[4]http: //baike. baidu. com/view/47727. htmlwtp=tt.2011.11.09.
[5]劉日升,楊振力.國外用戶電子閱讀需求與行為研究綜述[J].情報資料工作,2012(1) :36.
[6]卜世波.高校圖書館印刷型圖書館際互借模式分析[J].圖書館學研究,2010(2) :69.
[7]董慧,唐敏. 語義檢索在Web2.0 環(huán)境下的應用探討[J].中國圖書館學報,2011(3) :117.
[8]高衛(wèi)民. Web2.0 技術(shù)在圖書館采編業(yè)務中的應用[J].圖書館工作與研究,2011(9) :51.
[9]陳紅艷.Web2.0 環(huán)境下用戶參與圖書館信息組織的調(diào)查與分析[J].圖書館建設,2011(9):36.
[10]谷聰聰,肖希明.基于Web2.0 的圖書館服務現(xiàn)狀調(diào)查與分析—以華中地區(qū)高校圖書館為例[J].圖書館,2011(1) :61.
[11]楊振力.數(shù)字圖書館數(shù)據(jù)庫知識產(chǎn)權(quán)問題及保護研究[D].河北大學碩士論文,2009.