夏超群
(河南省圖書館,河南 鄭州 450000)
我國是一個歷史文化古國,古籍是我國的不可再生的文化遺產,隨著時間的變化,古籍的數量將會越來越少。因此怎么保存好現有的古籍已經成為圖書和檔案管理部門最為重要的任務[1]。由于電子掃描技術具有成本低、操作簡單和保存時間比較久的特點,因此對古籍進行數字化管理是解決目前古籍檔案管理中面臨的一系列問題的最有效的辦法。
我們從古籍數字化成就來,能夠對古籍數字化歸納為下面幾個方面的特點:
我國政府長久以來對非常對古籍保護進行重視,自從二十一世紀以來,我國在政策方面對古籍數字化工作給以高度的支持,給我國古籍數字化工作的健康發(fā)展打下良好的基礎。
除了不一樣級別圖書館以及科研學術機構外,更多的商業(yè)機構都參加到了古籍數學化工作當中,另外從參加到的組織來看,國際數字化國際合作力量也越來越大,其給古籍數字化管理發(fā)展帶來新的方法以及內容。
從經典文集到方志的家譜,從紙質的善本到碑帖的甲骨。我國的古籍資源越來越多。這帶來了古籍數字化工作在內容方面也越來越多。民族古籍、中醫(yī)藥的古籍以及農業(yè)古籍等等也越來越細化以及深化,不斷對現有古籍數字化成果進行完善。
古籍數字化為古籍整理工作的發(fā)展以及延長。在數字化的過程當猴子呢個,將面對這構建字庫,選擇版本和古籍整理基礎技術等方面。國外技術以及經驗不能給我國古籍數字化建設帶來一定的參考和借鑒。這就需要我國古籍數字化工作人員研究一種適合中華古籍數字化技術方案,并且不斷的進行升級以及優(yōu)化。
中華民族是一個擁有著悠久歷史的文化古國,古書籍的版本也比較多,就拿我們大家都熟悉的《紅樓夢》來說吧,就分為兩個版本,其中一個版本是八十回抄本系統(tǒng),題名為《石頭記》,也叫“脂本”系統(tǒng)。另外一種是一百二十回本系統(tǒng),也叫程高本。這兩個系統(tǒng)中還包括乙卯本和庚辰本等版本。古代的人總是說“書非借不能讀也”。所以,我們在對古籍進行數字化管理是要選擇合適的底本,還要對其進行查缺補漏。而且由于一些保存條件的原因或者書的材質本身的原因,造成了一些藏書已經破損和殘缺等現象[2]。
在對古籍進行數字化的過程中面臨的難點問題就是漢字的處理。古籍數字化需要字庫作為支撐,然而字庫中的漢字量是有限的。但是古代的書籍中又有很多的繁體字、通假字、避諱字等,這些不規(guī)范的字體導致計算機文字的編碼沒有辦法使用?,F階段行業(yè)內一般采用的是Unicode文字處理標準,然而這項技術定義的漢字也僅有7萬多字,這個數字量和古籍中所涵蓋的漢字量比還有一定的差距,這直接影響了古籍數字化的發(fā)展[3]。OCR雖然是一種很先進的信息輸入技術,但是他對圖像和文字的規(guī)范化程度要求都比較高,經常應用于近代文獻以及現代文獻的數字化中。因為古籍的字跡一般都具有比較模糊和污漬等特點,因此利用OCR進行處理,也沒辦法真正有效的處理這些信息資源,甚至可能會出現亂碼的情況。還有一些手寫的古籍更沒有辦法通過這種技術進行識別。
目前,在我國的圖書館古籍管理人員中,從事古籍數字化掃描工作的人員是非常少的,這是我國古籍數字化的一個普遍問題。使得從事古籍數字化工作的人員的工作壓力比較大,如一個工作人員把古籍從前期整理到后期數據著錄等工作做完的話,一天只能處理100幅左右的書影,導致掃描的進度較慢,甚至可能會造成漏掃或者重復掃描等問題的發(fā)生[4]。
數字化是一類工具,古籍數字化存在許多用途,當有助于古籍的利用及再利用,有助于保護古籍原件及有利于對原件修復等等。古籍數字化多類用途和最終目標不一樣,其最終目標是實現保護原典以及方便古籍的而利用及再利用。當前,我國對古籍數字化認識還不夠全面。例如:古籍數字化最終定位在了知識發(fā)展服務方面。古籍數字化最終目的是更大范圍、更便捷以及更有效的讓文獻給人們所用。古籍數組化應用立足古典保存和內容服務。此外,還能更方便典藏以及研究等。如果對古籍數字化認識不全面將會造成數字化過程中出現一定的風險,或直接影響古籍數字化有關技術方法以及技術指標的選擇,同時還會影響古籍數據管理策略方面的制定,其中含有制定有關古籍數字化有關技術等。
古籍數字化是一類系統(tǒng)工程,其要利用科學的規(guī)劃以及發(fā)展戰(zhàn)略來統(tǒng)籌。但是,當前我國古籍的數字化工作還缺少宏觀的調控以及管理。在這個環(huán)境當中,缺少分工協作意識。此外,各單位在建設完成的估計數字化方面,還存在許多不足。首先,選題方面出現偏頗,資源大多在熱點的項目當中,特別對商業(yè)機構在資源來發(fā)的時候大多集中到比較少的常用古籍內。第二,資源集中造成了許多重復的建設,大大對人力以及財力進行了浪費。
如果想建立一個健全完善的古籍數據庫,讓借閱人員上電腦就能看到古籍的整體面貌,就要建立一個統(tǒng)一的、行之有效的機讀目錄,且一定要制定統(tǒng)一的標準,這是我國現階段古籍數字化必須解決的問題。在古籍數字化中,僅對卷冊的頁碼、文獻的形態(tài)及題名等方面進行健全,且對這些方面進行了一同的分類原則以及分類標準。這將會讓制作成的產品更加便于閱覽者進行操作及進行訪問,更好的讓古籍數字化的成果發(fā)揮到最大,且更好的對資源進行共享。這些方面的制定不但要通過信息產業(yè)界、標準的有關軟件、圖書館的情報界等有關軟件進行開發(fā)商的參與,且也含有一些古籍整理專業(yè)人員的參加。只有如此,才可給讀者帶來對古籍文獻進行共享的一個平臺。
在進行古籍數字化管理中,有一個非常重要的環(huán)節(jié)就是對底本的選擇,這環(huán)節(jié)必須要謹慎,盡量從所有底本中選擇出最優(yōu)的底本,善本的好壞對所制作的電子產品質量有非常大的影響,因此在選擇底本的過程中,首先要看善本的情況。所謂的善本,就是古書籍中保存相對較完整的書。善本也是我國的一種比較珍貴的歷史文化遺產,對其進行科學合理的利用和選擇,并對其進行數字化管理,有利于我國文化遺產的長期保存。
要想提高古籍數字化管理人員的素質,不僅要對其進行古籍整理方面的知識的培訓,還要對其進行相關的信息技術的培訓。所以古籍的數字化管理是在傳統(tǒng)的古籍管理的基礎上利用當代的科學技術進行信息化管理。為了保證古籍數字化工作能順利進行,培養(yǎng)一批既具有古籍整理專業(yè)知識又掌握當代的信息技術的綜合型人才是我們現階段的首要任務,不僅要具有良好的職業(yè)道德,還應具有良好的品行和較高的文化修養(yǎng)。
制作古籍掃描設備的企業(yè)要多采納古籍數字化工作人員的意見,并不斷的對軟件進行升級,比如要將一些參數的設置固定化,減少重復設定的問題,增加一些按照批次處理的功能等等;還要對掃描設備的硬件配置進行不斷的完善,比如可在以往的操作臺上增加升降功能。只有不斷的更新和完善掃描設備,才能提高古籍數字化的工作效率和書影的質量。此外,還可通過一些通訊軟件,多與用戶進行實時溝通,并進行不斷的改進。
通過我國的古籍保護中心等機構來牽頭組織,更好的規(guī)劃,科學分工,對古籍資源共同建設進行統(tǒng)籌,給控制管理古籍數字化工作進行選題。首先,避免充分建設,盲目的進行建設。第二,鼓勵及促進特色古籍資源數字化建設,讓古籍數字化工作持續(xù)健康的發(fā)展。除此之外,利用統(tǒng)籌規(guī)劃沖破建設單位來另起爐灶,對共享共建提出比較高的要求,盡可能的整合以及利用數字化成果,大大提升使用的效率,降低物力、財力、人力方面的浪費。
我國是一個歷史文化古國,古籍是我國的不可再生的文化遺產,隨著時間的變化,古籍的數量將會越來越少。因此怎么保存好現有的古籍已經成為圖書和檔案管理部門最為重要的任務。目前古籍數字化雖然取得了一定的成果,但是還存在一些列問題。所以,我國要對中文古籍檔案標準的進行研究,并制定檔案標準,還要慎重的選擇底本,建立完善的古籍資源庫,并加強相關人員的培訓工作。