許 瓊
(昆明冶金高等??茖W(xué)校圖書館,云南 昆明 650033)
在現(xiàn)代社會中,人類已經(jīng)進(jìn)入了數(shù)字化時(shí)代,計(jì)算機(jī)數(shù)字技術(shù)對社會生活的各個(gè)領(lǐng)域都產(chǎn)生了革命性的影響。為此,同屬圖書館領(lǐng)域的古籍也不可避免地受到影響[1]。在數(shù)字社會里,古籍整理已經(jīng)不能再拘泥于傳統(tǒng)的方式與方法,必須有所創(chuàng)新。這是數(shù)字化社會賦予圖書館工作者、古籍整理工作者的歷史使命,也是為古籍整理工作和歷史學(xué)研究注入新生機(jī)和新活力的必然[2]。
中國古籍是我國歷代保存下來的歷史文化瑰寶。它既反映了我國在人類社會發(fā)展進(jìn)程中的歷史地位和作用,同時(shí)所蘊(yùn)含的中華民族特有的精神價(jià)值、思維方式和想像力、創(chuàng)造力,也是中華文明綿延數(shù)千年,一脈相承的歷史見證[3]。古籍?dāng)?shù)字化是指利用現(xiàn)代信息技術(shù)對古籍文獻(xiàn)進(jìn)行加工處理,使其轉(zhuǎn)化為電子數(shù)據(jù)形式,通過光盤、網(wǎng)絡(luò)等介質(zhì)保存和傳播[4]。我國古籍?dāng)?shù)字化經(jīng)歷了數(shù)據(jù)庫版、光盤版、網(wǎng)絡(luò)版3個(gè)建設(shè)階段。數(shù)據(jù)庫版古籍包括書目數(shù)據(jù)庫和全文數(shù)據(jù)庫兩種形式;光盤版古籍一般有圖像版、全文版和圖文版3種類型;網(wǎng)絡(luò)版古籍主要是將數(shù)字化的古籍資源在網(wǎng)絡(luò)上有償或無償發(fā)布,供互聯(lián)網(wǎng)用戶使用,這是目前古籍?dāng)?shù)字化的主要目標(biāo)[5]。
古籍是我國科技文化與歷史文化的寶貴資源。因此,圖書館保護(hù)好有限且珍貴的古籍是我們的重要職責(zé)。盡管我國在古籍保護(hù)方面投入了巨大的人力和物力,但是古籍保護(hù)的任務(wù)仍然十分艱巨。我們知道,古籍屬于非再生性的文化遺產(chǎn),隨著時(shí)間的推移,在數(shù)量上將會不斷減少,而開展數(shù)字環(huán)境下的古籍?dāng)?shù)字服務(wù)是解決這一問題的有效途徑。
在數(shù)字環(huán)境下開展古籍?dāng)?shù)字化服務(wù)必須依托古籍?dāng)?shù)據(jù)庫。就古籍書目數(shù)據(jù)庫而言,傳統(tǒng)的古籍目錄只能按照書名、責(zé)任者、分類等途徑進(jìn)行檢索。數(shù)字化的古籍書目數(shù)據(jù)庫著錄的書目則甚為廣泛,還可提供多種途徑檢索和資源鏈接,可以實(shí)現(xiàn)多種條件的組配檢索。同時(shí)古籍書目數(shù)據(jù)庫為開發(fā)利用古籍提供了快捷準(zhǔn)確的途徑[6]。
由于數(shù)字化資源都具有快捷檢索和交互流通的特點(diǎn),古籍?dāng)?shù)字化資源的出現(xiàn)將徹底改變以前查找資料需要逐本翻閱大量書刊的狀態(tài)。當(dāng)前科學(xué)研究和弘揚(yáng)中華文化對數(shù)字化古籍的需求非常大,開展數(shù)字環(huán)境下的古籍服務(wù)將極大地改善廣大科學(xué)研究人員的科研環(huán)境,有利于提高科學(xué)研究水平。
2.1 古籍?dāng)?shù)字化打破了以往在古籍整理中給古籍圈定的范圍,原來不屬于古籍范疇的甲骨文、金文、遼文等都成為古籍?dāng)?shù)字化的對象,這是對古籍整理傳統(tǒng)觀念的突破,更符合現(xiàn)代社會科學(xué)研究的需要。不過目前就連紙質(zhì)古典文獻(xiàn)的大規(guī)模錄入問題也只能說是有所突破,并沒有完全解決。多種古典文獻(xiàn)的數(shù)字提取和錄入尚處于起步階段[7]。
2.2 大多數(shù)古籍?dāng)?shù)字化產(chǎn)品都實(shí)現(xiàn)了任意字、詞和字符串的檢索,一些較好的則實(shí)現(xiàn)了按條件檢索。有的檢索系統(tǒng)實(shí)現(xiàn)了在檢索時(shí)簡繁互換等關(guān)聯(lián),但同古籍?dāng)?shù)字化實(shí)際要求達(dá)到的檢索性能相比,還有相當(dāng)大的差距。使用這樣的檢索系統(tǒng)檢索出的結(jié)果中夾雜著大量不符合要求的數(shù)據(jù),而一些不是檢索詞但是符合要求的數(shù)據(jù)卻沒有檢索出來[8]。
2.3 目前的古籍?dāng)?shù)字化產(chǎn)品僅僅是基本實(shí)現(xiàn)了古籍載體的轉(zhuǎn)換和全文檢索功能等,這只是所有數(shù)字化文獻(xiàn)具有的普遍特點(diǎn),并不是古籍?dāng)?shù)字化產(chǎn)品的特色。在解決使用計(jì)算機(jī)數(shù)字技術(shù)表現(xiàn)古籍特征這一問題上,把古籍的特點(diǎn)與數(shù)字技術(shù)結(jié)合起來,是古籍?dāng)?shù)字化下一步工作的重點(diǎn)和難點(diǎn),是一項(xiàng)極為復(fù)雜和困難的工作。
2.4 古籍整理軟件的數(shù)量和種類都很少,缺乏通用性,更沒有形成一個(gè)集成的古籍整理平臺。目前的古籍整理軟件基本上都是首先將掃描圖像與原稿進(jìn)行校對的校對系統(tǒng),及對古籍文本圖像進(jìn)行文字切分的數(shù)字化處理系統(tǒng)。它們還不是通用軟件,僅適用于當(dāng)前的古籍?dāng)?shù)字化項(xiàng)目。
構(gòu)建內(nèi)部局域網(wǎng)自動(dòng)化管理系統(tǒng),實(shí)現(xiàn)文獻(xiàn)的數(shù)字化制作、編輯、流通與利用自動(dòng)化,是網(wǎng)絡(luò)信息服務(wù)的平臺。當(dāng)前我國基于網(wǎng)絡(luò)平臺的古籍信息服務(wù)比較多,我們綜合考慮到現(xiàn)有自動(dòng)化系統(tǒng)水平、數(shù)據(jù)標(biāo)準(zhǔn)化和運(yùn)行穩(wěn)定性,認(rèn)為清華同方的TPI數(shù)字圖書館系統(tǒng)功能較強(qiáng)。使用其中的數(shù)字加工子系統(tǒng)和內(nèi)部管理發(fā)布系統(tǒng),可以集多種功能于一體,完成古籍?dāng)?shù)字化的建庫、掃描、圖像處理、生成電子書、建立導(dǎo)航系統(tǒng)、古籍網(wǎng)上發(fā)布與瀏覽等功能。同時(shí)對于存儲容量500頁以上的古籍,如果全文放在網(wǎng)上,下載速度非常慢,而系統(tǒng)提供了在線瀏覽功能,讀者可以進(jìn)行在線瀏覽,傳輸速度非常理想。
針對館藏資源數(shù)字化問題,可以綜合比較多個(gè)公司的數(shù)字化解決方案,其中,北京萬方公司的數(shù)字化系統(tǒng)由于采用了國際標(biāo)準(zhǔn)的數(shù)字格式和無損壓縮格式,同時(shí)支持GIF、JPG、PNG、MP3等圖形格式,描述數(shù)字資源的元數(shù)據(jù)采用了國際通用標(biāo)準(zhǔn),為將來數(shù)據(jù)開放、交換和系統(tǒng)升級提供了廣闊的環(huán)境;數(shù)字化加工的差錯(cuò)率低于萬分之五,且加工成本較低,因此,可以采用北京萬方公司的系統(tǒng)實(shí)現(xiàn)館藏資源的數(shù)字化。
由于數(shù)字化館藏資源的存儲、組織以及全文檢索等問題是相互聯(lián)系的,因此,在確定古籍資源數(shù)字化整合建設(shè)方案時(shí),應(yīng)該進(jìn)行統(tǒng)一考慮。國內(nèi)目前適合中文數(shù)字全文檢索的軟件系統(tǒng)也有多個(gè),其中,易寶公司的TRS系統(tǒng)功能強(qiáng)大,可實(shí)現(xiàn)多庫并行檢索,內(nèi)置1萬多條智能檢索規(guī)則,輸出格式靈活,能夠把PS數(shù)據(jù)轉(zhuǎn)換成HTML、XML、PDF以及用戶自定義模式,完全滿足了用戶Web下載的要求。為此考慮到二次開發(fā)的易用性和通用性,我們建議可以考慮采用易寶的TRS系統(tǒng)作為數(shù)字館藏文獻(xiàn)的存儲、組織和全文檢索的基礎(chǔ)數(shù)字平臺。
當(dāng)前我國很多大學(xué)的圖書館數(shù)字中心在互聯(lián)網(wǎng)上建成了初具規(guī)模的網(wǎng)站系統(tǒng),數(shù)字用戶以高速寬帶接入方式建立二級網(wǎng)站,因此,具備了數(shù)字化共享與發(fā)布的基礎(chǔ)平臺。在內(nèi)部數(shù)字管理系統(tǒng)的劃分與銜接上,設(shè)計(jì)了先進(jìn)的數(shù)字結(jié)構(gòu)并引入了相關(guān)的數(shù)字設(shè)施,成功實(shí)現(xiàn)了二者的有效安全連接。
按照我國頒布的著作權(quán)與知識產(chǎn)權(quán)法的要求,對數(shù)字化古籍應(yīng)區(qū)別情況分類管理。首先對于無知識產(chǎn)權(quán)作品和已進(jìn)入公有領(lǐng)域的作品,數(shù)字化加工后可以自由使用。其次對于他人擁有知識產(chǎn)權(quán)的來源作品經(jīng)數(shù)字化加工后,可利用合理使用制度,在公益條件下,讀者可以為教學(xué)和科研的需要自由閱讀,不過要防止非法復(fù)制。第三,對于當(dāng)前普遍具備原創(chuàng)性的數(shù)據(jù)庫作為版權(quán)法的編輯作品加以保護(hù),信息資源數(shù)字化整合建設(shè)中形成的二次和三次文獻(xiàn)數(shù)據(jù)庫,具備自主知識產(chǎn)權(quán)。第四,對于購買的各類電子文獻(xiàn)數(shù)據(jù)庫,作者和出版社享有知識產(chǎn)權(quán),可使用數(shù)字版權(quán)保護(hù)技術(shù)。當(dāng)前北大方正的Apabi數(shù)據(jù)圖書館支持軟件Apabi-library,該軟件使用數(shù)字版權(quán)保護(hù)技術(shù),實(shí)現(xiàn)了網(wǎng)上管理、讀者注冊、檢索與閱讀,妥善地解決了數(shù)字版權(quán)的保護(hù)問題。
我們認(rèn)為,圖書館古籍?dāng)?shù)字化交流模式的發(fā)展趨勢有以下幾個(gè)方面:按數(shù)字圖書館模式對古籍?dāng)?shù)字化進(jìn)行組織,建立古籍整理的自動(dòng)完成集成系統(tǒng),檢索系統(tǒng)和支持系統(tǒng)研究將成為重點(diǎn),國家對數(shù)字化古籍資源進(jìn)行整體規(guī)劃,加大資金投入力度,人才培養(yǎng)勢在必行,古籍?dāng)?shù)字化項(xiàng)目的國際性合作將是未來發(fā)展的目標(biāo)。
總之,圖書館古籍的數(shù)字化交流模式構(gòu)建是一項(xiàng)系統(tǒng)工程,筆者還沒有涉及到具體的設(shè)施、硬件設(shè)備和技術(shù)問題。但是隨著計(jì)算機(jī)技術(shù)與數(shù)字技術(shù)的發(fā)展,圖書館古籍的數(shù)字化交流模式將被越來越多的人接受,對于圖書館古籍的數(shù)字化需求也將越來越深化,數(shù)字化服務(wù)的系統(tǒng)化、規(guī)?;貙⒊蔀閳D書館古籍?dāng)?shù)字化服務(wù)發(fā)展的趨向。
[1] 李玉梅,遲偉凡.略論我國大學(xué)與科研單位館藏建設(shè)的基本特點(diǎn)及成因[J].圖書館論壇,2006(2):147-149.
[2] 李勇,閔維方.論大學(xué)與科研單位的特征[J].教育研究,2004(1):61-64.
[3] 汪肇兵.個(gè)性化智能數(shù)字檢索的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與應(yīng)用,2009(11):62-64.
[4] 孔燕.?dāng)?shù)字時(shí)代高校圖書館用戶需求及服務(wù)研究[J].大學(xué)圖書情報(bào)學(xué)刊,2010(1):39-42.
[5] 吳葉葵.?dāng)?shù)字圖書館中面向用戶數(shù)字服務(wù)的組織[J].情報(bào)理論與實(shí)踐,2008(4):21-28.
[6] 金更達(dá).?dāng)?shù)字圖書館模式探討[J].圖書館建設(shè),2008(2):54-56.
[7] 杜文巒.?dāng)?shù)字圖書館數(shù)字個(gè)性化定制服務(wù)現(xiàn)狀分析[J].情報(bào)資料工作,2010(1):112-114.
[8] 陳晶.從用戶的可用性角度看數(shù)字環(huán)境下圖書館數(shù)字資源建設(shè)[J].情報(bào)資料工作,2002(1):56-58.