• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      關(guān)于制定古籍?dāng)?shù)字化標(biāo)準(zhǔn)的思考

      2010-03-22 11:08:29姚俊元南京圖書館南京210018
      圖書館理論與實(shí)踐 2010年2期
      關(guān)鍵詞:古籍統(tǒng)一數(shù)據(jù)庫(kù)

      ●姚俊元 (南京圖書館,南京 210018)

      2007年1月,國(guó)務(wù)院辦公廳發(fā)布了《關(guān)于進(jìn)一步加強(qiáng)古籍保護(hù)工作的意見》,文中明確指出:“進(jìn)一步加強(qiáng)古籍的整理、出版和研究利用。制訂古籍?dāng)?shù)字化標(biāo)準(zhǔn),規(guī)范古籍?dāng)?shù)字化工作,建立古籍?dāng)?shù)字資源庫(kù)?!?008年7月28日,在全國(guó)古籍保護(hù)工作會(huì)議上文化部副部長(zhǎng)周和平講到:“要制定古籍?dāng)?shù)字化標(biāo)準(zhǔn),加快古籍?dāng)?shù)字化工作,逐步為公眾提供古籍全文數(shù)字化閱覽服務(wù)?!痹倬C觀國(guó)內(nèi)外專家學(xué)者的意見和專業(yè)機(jī)構(gòu)的做法,可以斷定,古籍?dāng)?shù)字化已經(jīng)成為21世紀(jì)古籍整理的主流,代表著未來(lái)古籍整理、開發(fā)、利用的發(fā)展方向,但在我國(guó)目前還缺乏相應(yīng)的工作標(biāo)準(zhǔn),需要業(yè)界人士進(jìn)一步的研究、探索和制定。

      1 古籍?dāng)?shù)字化標(biāo)準(zhǔn)的概念

      《標(biāo)準(zhǔn)化與相關(guān)活動(dòng)的基本術(shù)語(yǔ)及其定義(1991年第六版)》對(duì)“標(biāo)準(zhǔn)”定義為:“標(biāo)準(zhǔn)是由一個(gè)公認(rèn)的機(jī)構(gòu)制定和批準(zhǔn)的文件,它對(duì)活動(dòng)或活動(dòng)的結(jié)果規(guī)定了規(guī)則、導(dǎo)則或特性值,供共同和反復(fù)使用,以實(shí)現(xiàn)在預(yù)定結(jié)果領(lǐng)域內(nèi)最佳秩序的效益?!睒?biāo)準(zhǔn)是標(biāo)準(zhǔn)化活動(dòng)的結(jié)果,它雖然不是商品,卻能加速商品的生產(chǎn)流通,提高效率和管理水平,保證產(chǎn)品、工程、服務(wù)的質(zhì)量。所謂古籍?dāng)?shù)字化標(biāo)準(zhǔn),簡(jiǎn)言之,就是在古籍?dāng)?shù)字化過程中以達(dá)到最佳有序化程度為目的,共同遵守的準(zhǔn)則和依據(jù)。

      2 制訂古籍?dāng)?shù)字化標(biāo)準(zhǔn)的必要性

      從20世紀(jì)80年代起,我國(guó)大陸地區(qū)開始古籍?dāng)?shù)字化工作,網(wǎng)上可見的中文古籍?dāng)?shù)據(jù)庫(kù)共有70多個(gè)。但令人遺憾的是,至今我國(guó)沒有相關(guān)的標(biāo)準(zhǔn)和規(guī)范,造成了目前古籍?dāng)?shù)字化在概念上百家爭(zhēng)鳴、在開發(fā)理念上千差萬(wàn)別、在質(zhì)量上參差不齊和在標(biāo)準(zhǔn)上各自為政的局面,給使用者帶來(lái)了不便,也嚴(yán)重困擾了古籍?dāng)?shù)字化工作的健康、快速、協(xié)調(diào)發(fā)展。

      2.1 認(rèn)識(shí)上概念模糊

      經(jīng)過20多年的努力,我國(guó)古籍?dāng)?shù)字化工作取得一定成果,建設(shè)了一批優(yōu)秀的古籍?dāng)?shù)字化產(chǎn)品,比如:國(guó)家圖書館的碑砧菁華、西夏碎金、敦煌遺珍、數(shù)字方志以及甲骨文、永樂大典等,上海圖書館的名人家譜庫(kù),天津圖書館的古籍善本選粹,北京大學(xué)的中國(guó)基本古籍光盤庫(kù)等等。但是由于缺乏統(tǒng)一領(lǐng)導(dǎo)和工作標(biāo)準(zhǔn),目前官方或?qū)W術(shù)界還處于探索階段,仍然沒有一個(gè)準(zhǔn)確、統(tǒng)一的概念界定,導(dǎo)致古籍?dāng)?shù)據(jù)化程度深淺不一、參差不齊。

      2.2 儲(chǔ)存上格式眾多

      當(dāng)前數(shù)字化古籍的文件格式可謂五花八門,種類繁多,除了常見的txt、doc、hind格式外,還有exe、pdf、wdl、ebk、edb、peb、sep、ifr、xeb、pdg、nlc 格式,以及基于unicode、倉(cāng)頡碼、Big5碼或其他字符集,這些不同格式的文件,往往需要各自專門的閱讀器才能進(jìn)行瀏覽,相互之間難以兼容,給讀者造成了不少麻煩,也給我國(guó)古籍資源的共享制造了隱患。[1]

      2.3 檢索上平臺(tái)各異

      一般數(shù)字化資源大多需要納入數(shù)據(jù)庫(kù),才可調(diào)用和檢索,但各家所用數(shù)據(jù)庫(kù)很不統(tǒng)一,如access、mysql、sqlsever都有,給跨庫(kù)檢索帶來(lái)極大不便。

      2.4 方式上千差萬(wàn)別

      目前,古籍?dāng)?shù)字化的基本方法大體包括全文數(shù)據(jù)庫(kù)、全文圖像、圖文三種方式,但在檢索功能、古籍原貌、研究效果、方便利用等方面存在著差別。

      2.5 協(xié)作上缺乏溝通

      由于分散作業(yè)、各自為用,我們至今無(wú)法完整地了解哪些古籍已經(jīng)被數(shù)字化,更無(wú)法知曉其數(shù)字化的格式、利用的程度等情況,這一方面造成了數(shù)不清的重復(fù)建設(shè),另一方面又使這些有用的學(xué)術(shù)資源無(wú)法充分發(fā)揮其作用。

      荷蘭國(guó)家圖書館在數(shù)字化文獻(xiàn)領(lǐng)域領(lǐng)先世界,該館保存部主任希爾德·范韋恩加德指出,數(shù)字化產(chǎn)品能否長(zhǎng)期保存和方便利用,需要在數(shù)字化開始時(shí)就考慮選擇什么樣的文件格式(file format)、制作標(biāo)準(zhǔn)(production settings) 和字型等。[2]通過以上分析不難看出,標(biāo)準(zhǔn)化是古籍?dāng)?shù)字化的基礎(chǔ),直接影響古籍?dāng)?shù)字資源的制作質(zhì)量和查詢服務(wù)的效果。只有不斷采用新技術(shù),統(tǒng)一新標(biāo)準(zhǔn),確立古籍?dāng)?shù)字化的統(tǒng)一著錄格式和標(biāo)引方法,研制與用戶要求相匹配的系統(tǒng),數(shù)字化的古籍文獻(xiàn)信息才能在不同的計(jì)算機(jī)系統(tǒng)之間交換數(shù)據(jù),才能實(shí)現(xiàn)用戶和系統(tǒng)以及系統(tǒng)與系統(tǒng)之間的有效溝通,確保數(shù)據(jù)庫(kù)的使用性能。

      3 制訂古籍?dāng)?shù)字化標(biāo)準(zhǔn)的幾點(diǎn)思考

      3.1 統(tǒng)一概念認(rèn)識(shí),明確古籍?dāng)?shù)字化的真正內(nèi)涵

      古籍?dāng)?shù)字化是從保護(hù)和利用古籍的目的出發(fā),采用計(jì)算機(jī)技術(shù),將常見的語(yǔ)言文字或圖形符號(hào)轉(zhuǎn)化為能被計(jì)算機(jī)識(shí)別的數(shù)字符號(hào),從而制成古籍全文數(shù)據(jù)庫(kù),用以揭示古籍文獻(xiàn)信息資源的一項(xiàng)系統(tǒng)工作。古籍?dāng)?shù)字化不等于對(duì)古籍進(jìn)行掃描后在計(jì)算機(jī)上瀏覽,其科學(xué)內(nèi)涵是必須對(duì)古籍原典進(jìn)行具有計(jì)算機(jī)瀏覽、檢索、利用特點(diǎn)的深度開發(fā)。[3]基于這個(gè)概念,我們可以將古籍?dāng)?shù)字化的基本性質(zhì)定位為:古籍?dāng)?shù)字化是對(duì)已存古籍的再現(xiàn)和加工,屬于古籍整理的范疇,是古籍整理的一部分,最終達(dá)到開發(fā)利用和保護(hù)的目的。

      3.2 統(tǒng)一工作宗旨,明確古籍?dāng)?shù)字化的基本特征

      古籍?dāng)?shù)字化,主要是將古籍文獻(xiàn)的內(nèi)容轉(zhuǎn)化為數(shù)字形式后移植到新的載體上。應(yīng)該講,除了檢索方法外,它不是古籍內(nèi)容的再創(chuàng)造,而只是載體形式的變更,因而保持古籍內(nèi)容的原始性至關(guān)重要。我國(guó)歷史上每一次古籍文獻(xiàn)載體形式的變更或同一載體的移植,總會(huì)造成一部分文獻(xiàn)內(nèi)容的失真,給古籍考證帶來(lái)諸多麻煩,??奔液托?睂W(xué)的形成就是很好的例證?,F(xiàn)在古籍文獻(xiàn)數(shù)字化采用高科技手段,其移植數(shù)量之大、速度之快遠(yuǎn)勝于歷史上任何一次文獻(xiàn)載體的變革,所以保持古籍文獻(xiàn)內(nèi)容的原始性應(yīng)是其首要的標(biāo)準(zhǔn),且同時(shí)必須具有四個(gè)基本特征:(1)文本字符的數(shù)字化;(2)具有基于超鏈接設(shè)計(jì)的瀏覽閱讀環(huán)境;(3)具有強(qiáng)大的檢索功能;(4) 具有研究支持功能。[4]

      3.3 統(tǒng)一方式標(biāo)準(zhǔn),明確古籍?dāng)?shù)字化的基本方法

      比較三種古籍?dāng)?shù)字化的方式不難發(fā)現(xiàn),圖文方式集全文數(shù)據(jù)庫(kù)方式和全文圖像方式的優(yōu)點(diǎn)于一身,且又避免了各自的缺點(diǎn),是古籍?dāng)?shù)字化的最佳方式,也是古籍?dāng)?shù)字化的發(fā)展方向。香港中文大學(xué)的漢達(dá)古籍資料庫(kù)、北京大學(xué)古籍?dāng)?shù)字圖書館的古籍拓片圖像數(shù)據(jù)庫(kù)和古籍拓片全文數(shù)據(jù)庫(kù),都是先將古籍和拓片進(jìn)行掃描加工,建成圖像數(shù)據(jù)庫(kù),之后逐步通過OCR技術(shù)轉(zhuǎn)換進(jìn)行全文數(shù)據(jù)庫(kù)建設(shè),最終實(shí)現(xiàn)基于內(nèi)容的全文檢索。[5]

      3.4 統(tǒng)一存儲(chǔ)格式,明確古籍?dāng)?shù)字化的技術(shù)標(biāo)準(zhǔn)

      文件格式標(biāo)準(zhǔn)的統(tǒng)一,是當(dāng)前數(shù)字圖書館標(biāo)準(zhǔn)化建設(shè)的重要目標(biāo)。從古籍?dāng)?shù)字化的長(zhǎng)遠(yuǎn)目標(biāo)而言,業(yè)界主要機(jī)構(gòu)要聯(lián)合起來(lái),制訂出統(tǒng)一的文件存儲(chǔ)格式。這種格式既要適合漢字尤其是繁體字的存儲(chǔ),又能具備足夠強(qiáng)大的加密功能,以保護(hù)各自的知識(shí)產(chǎn)權(quán)。同時(shí)為保證數(shù)字化古籍的科學(xué)、嚴(yán)謹(jǐn)、規(guī)范,這種文檔格式還應(yīng)該能夠方便地進(jìn)行漢語(yǔ)拼音標(biāo)注和人名地名標(biāo)記。另外,這種文檔格式特別應(yīng)該有利于全文檢索。考慮到處理古籍文獻(xiàn)時(shí)需要處理海量圖片,如何制訂一種具有較高壓縮比,又能清晰地再現(xiàn)原始圖書頁(yè)面風(fēng)貌的圖片格式便顯得尤為重要。軟件的選用主要根據(jù)古籍?dāng)?shù)字化最終形成的格式而決定。就目前而言,“書同文數(shù)碼翰林”軟件可以說是較成熟的古籍?dāng)?shù)字化處理軟件。用該軟件制作的“四庫(kù)全書”及“四部叢刊”電子圖書,文本頁(yè)面保持了原書的豎排格式,增強(qiáng)了古籍閱讀的真實(shí)感,基本實(shí)現(xiàn)了圖文關(guān)聯(lián)和閱讀檢索及全文檢索的功能。

      3.5 統(tǒng)一數(shù)據(jù)形式,對(duì)古籍?dāng)?shù)字資源進(jìn)行元數(shù)據(jù)標(biāo)引

      所謂的統(tǒng)一,是基于目前圖書館界和國(guó)外學(xué)術(shù)資料信息化的普遍經(jīng)驗(yàn),將資源對(duì)象的語(yǔ)義信息統(tǒng)一為元數(shù)據(jù)格式。對(duì)古籍?dāng)?shù)字資源進(jìn)行元數(shù)據(jù)標(biāo)引主要有以下好處:(1)它不必對(duì)現(xiàn)有資源進(jìn)行格式改造,只是加以外部屬性描述;(2)將為全部古籍?dāng)?shù)字化資源的調(diào)查和格式轉(zhuǎn)換或再度開發(fā)創(chuàng)造統(tǒng)一的數(shù)據(jù)環(huán)境(元數(shù)據(jù)元素集中定義了相關(guān)標(biāo)識(shí)字段)。隨著學(xué)術(shù)需求和開發(fā)建設(shè)的不斷發(fā)展,可以想象,對(duì)現(xiàn)有數(shù)字古籍資源做元數(shù)據(jù)回溯標(biāo)引也將勢(shì)在必行(類似對(duì)圖書館館藏的回溯標(biāo)引一樣)。

      3.6 統(tǒng)一漢字編碼,完善漢字字符代碼集

      古籍?dāng)?shù)字化,首先要將過去抄寫、印刷的東西轉(zhuǎn)換為計(jì)算機(jī)可讀并能在屏幕上準(zhǔn)確再現(xiàn)的代碼。目前業(yè)界大多采用Unicode作為文字處理的標(biāo)準(zhǔn),Unicode已經(jīng)定義了70000多漢字,因此,漢字字符不足以及編碼混亂的問題已基本上得到了解決。但是,古籍?dāng)?shù)字化的內(nèi)容并不只是字符的轉(zhuǎn)換問題,要實(shí)現(xiàn)運(yùn)用數(shù)字技術(shù)與現(xiàn)代信息處理技術(shù)對(duì)傳統(tǒng)文獻(xiàn)通過信息加工、信息重組達(dá)到方便使用、知識(shí)挖掘的目的,實(shí)現(xiàn)數(shù)字時(shí)代對(duì)中華傳統(tǒng)文化的繼承與弘揚(yáng)的目的,這才是古籍?dāng)?shù)字化工作最主要的內(nèi)容和最重要的目標(biāo),而要達(dá)到這個(gè)目標(biāo),漢字的處理仍然是一個(gè)基礎(chǔ)的和關(guān)鍵的問題。書同文公司在其開發(fā)制作的電子版《四庫(kù)全書》中能較好地處理冷僻字和異體字,但這些字符一旦脫離這個(gè)系統(tǒng),例如被復(fù)制到字處理程序中,便會(huì)顯示亂碼,可以說仍未真正解決這個(gè)問題。所幸的是,國(guó)家有關(guān)部門已經(jīng)意識(shí)到該問題的嚴(yán)重性,《國(guó)家“十一五”時(shí)期文化發(fā)展規(guī)劃綱要》在“重大文化產(chǎn)業(yè)推進(jìn)項(xiàng)目”中列有“中華字庫(kù)”工程——建立全部漢字的編碼和主要字體字符集,為解決這一問題提供了政策支持。

      3.7 提高古籍?dāng)?shù)字化人才素質(zhì)

      目前,古籍?dāng)?shù)字化多數(shù)項(xiàng)目的開發(fā)屬于單一人員或機(jī)構(gòu)的個(gè)體行為,缺乏有效的人力資源的組織與控制,很多古籍整理專業(yè)人員不懂電子技術(shù),計(jì)算機(jī)技術(shù)人員又缺少古籍知識(shí)。需要指出的是,古籍?dāng)?shù)字化屬于古籍整理和學(xué)術(shù)研究(或稱校讎學(xué))的范疇,是傳統(tǒng)學(xué)術(shù)方法與現(xiàn)代科學(xué)技術(shù)的結(jié)合,需要培養(yǎng)一批既懂得古籍整理又精通計(jì)算機(jī)技術(shù)的復(fù)合型人才,才有能力決定實(shí)現(xiàn)古籍?dāng)?shù)字化的基本路向和基本框架,在既定的框架內(nèi)實(shí)現(xiàn)古籍?dāng)?shù)字化的目標(biāo)。

      [1]毛建軍.古籍?dāng)?shù)字化的概念與內(nèi)涵[J].圖書館理論與實(shí)踐,2007(4):82-84.

      [2]孫琴.兩大中文古籍?dāng)?shù)據(jù)庫(kù)比較研究[J].新世紀(jì)圖書館,2007(1):52-54.

      [3]王立清,董梅香.港臺(tái)地區(qū)古籍?dāng)?shù)字化現(xiàn)狀分析及啟示[J].圖書情報(bào)工作,2006(8):87-89.

      [4]姚伯岳,張麗娟.古籍元數(shù)據(jù)標(biāo)準(zhǔn)的設(shè)計(jì)及其系統(tǒng)實(shí)現(xiàn)[J].大學(xué)圖書館學(xué)報(bào),2003(1):17-22.

      [5]李致忠.《古籍定級(jí)標(biāo)準(zhǔn)》釋義[J].圖書館工作與研究,2008(1):77-81.

      猜你喜歡
      古籍統(tǒng)一數(shù)據(jù)庫(kù)
      中醫(yī)古籍“疒”部俗字考辨舉隅
      堅(jiān)持嚴(yán)管和厚愛相統(tǒng)一的著力點(diǎn)
      活力(2021年6期)2021-08-05 07:23:54
      關(guān)于版本學(xué)的問答——《古籍善本》修訂重版說明
      天一閣文叢(2020年0期)2020-11-05 08:28:06
      碑和帖的統(tǒng)一,心和形的統(tǒng)一,人和藝的統(tǒng)一
      統(tǒng)一數(shù)量再比較
      關(guān)于古籍保護(hù)人才培養(yǎng)的若干思考
      天一閣文叢(2018年0期)2018-11-29 07:48:08
      我是古籍修復(fù)師
      金橋(2017年5期)2017-07-05 08:14:41
      數(shù)據(jù)庫(kù)
      數(shù)據(jù)庫(kù)
      數(shù)據(jù)庫(kù)
      新营市| 布拖县| 乌海市| 宣恩县| 万源市| 保康县| 新安县| 那曲县| 西吉县| 安岳县| 哈尔滨市| 临高县| 墨竹工卡县| 辽宁省| 蒲江县| 页游| 营山县| 建昌县| 合阳县| 大埔区| 徐闻县| 济源市| 兴隆县| 尚志市| 通许县| 武乡县| 贵阳市| 岳阳县| 聂荣县| 马鞍山市| 区。| 林西县| 阜平县| 肥乡县| 化州市| 京山县| 张家港市| 随州市| 红安县| 甘德县| 科技|