• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      西文編目中的CNMARC到USMARC轉(zhuǎn)換系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

      2014-03-13 05:33:40艾金勇陳小瑩
      電腦與電信 2014年8期
      關(guān)鍵詞:西文編目字段

      艾金勇 陳小瑩

      (1.西藏民族學(xué)院圖書館,陜西 咸陽 712082;2.西藏民族學(xué)院信息工程學(xué)院,陜西 咸陽 712082)

      西文編目中的CNMARC到USMARC轉(zhuǎn)換系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

      艾金勇1陳小瑩2

      (1.西藏民族學(xué)院圖書館,陜西 咸陽 712082;2.西藏民族學(xué)院信息工程學(xué)院,陜西 咸陽 712082)

      在分析編目數(shù)據(jù)從CNMARC格式到USMARC格式自動轉(zhuǎn)換可行性的基礎(chǔ)上,研究了兩種MARC的字段和字符內(nèi)容對應(yīng)關(guān)系,找出其中的對應(yīng)規(guī)律,編制出轉(zhuǎn)換關(guān)系對應(yīng)表,設(shè)計(jì)了西文編目中的CNMARC到USMARC的轉(zhuǎn)換軟件,實(shí)現(xiàn)了兩種MARC格式的平滑轉(zhuǎn)換。

      CNMARC;USMARC;西文編目;自動轉(zhuǎn)換

      1.引言

      MARC作為書目數(shù)據(jù)的基本存儲格式,是圖書館界對數(shù)據(jù)描述的重要手段,已經(jīng)得到各國圖書館界的普遍認(rèn)可和采納。但是由于語言以及應(yīng)用環(huán)境的差異,不同國家使用了不同的MARC格式,它們之間的標(biāo)準(zhǔn)也不相同。在我國的西文編目中,目前主要有CNMARC和USMARC兩種。其中CNMARC是我國的機(jī)讀目錄格式,它是在UNIMARC的基礎(chǔ)上,結(jié)合我國編目工作經(jīng)驗(yàn)于1990年正式發(fā)布的[l]。而USMARC是加拿大國家圖書館與美國國會圖書館通過對兩國MARC格式的修改共同頒布的MARC格式版本[2]。我國大多數(shù)圖書館的西文文獻(xiàn)最開始都是采用AACR2編目,后來考慮到數(shù)據(jù)共享和交換,開始向國際標(biāo)準(zhǔn)接軌,由于USMARC主要依據(jù)《英美編目條例第2版》制訂的,同我國的西文原始數(shù)據(jù)基本類似,所以西文編目時能直接套錄USMARC的機(jī)讀記錄,因而USMARC在西文文獻(xiàn)編目中很快得到了普及推廣。而我館使用的集成系統(tǒng)由于對于西文圖書編目未做出明確規(guī)定,加之西文書目數(shù)據(jù)不多且編目人員比較緊張,因此西文圖書著錄一直套用中文圖書著錄規(guī)則。但是隨著越來越多的西文圖書的購置,并且國內(nèi)大部分圖書館聯(lián)盟可以用來共享的西文圖書編目數(shù)據(jù)均為USMARC格式,這就需要我們考慮如何更好地實(shí)現(xiàn)西文圖書編目數(shù)據(jù)的交換和共享,提高西文圖書編目工作的效率和規(guī)范化進(jìn)程。正是基于這種目的,本文將針對西文圖書編目數(shù)據(jù)CNMARC格式到USMARC格式轉(zhuǎn)換系統(tǒng)的實(shí)現(xiàn)過程展開研究。

      2.系統(tǒng)實(shí)現(xiàn)的可行性

      CNMARC與USMARC都遵循ISO2709格式,它們的主體結(jié)構(gòu)原理相同,都是由記錄頭標(biāo)區(qū)、地址目次區(qū)、數(shù)據(jù)字段區(qū)組成[3]。在對MARC構(gòu)成的幾個部分進(jìn)一步分析發(fā)現(xiàn)兩種格式在具體的字段設(shè)計(jì)上也是類似的。謝蓉[4]曾對CNMARC與USMARC的常用項(xiàng)目進(jìn)行分析,發(fā)現(xiàn)二者在字段和子字段的設(shè)置與使用方面的差異也有一定的對應(yīng)性,歸納起來,主要有如下幾種近似關(guān)系[5-7]:

      (1)一對一的情況,即一個源字段和一個目標(biāo)字段對應(yīng)。例如USMARC分別在245和250字段上表示題名和版本項(xiàng),CNMARC中對應(yīng)的內(nèi)容分別設(shè)置在200和205字段上。

      (2)一對多的情況,即一個源字段對應(yīng)多個目標(biāo)字段。例如在相關(guān)題名項(xiàng)的設(shè)置上,USMARC中只設(shè)置了一個246字段,通過其指示符2的不同取值來表示不同的相關(guān)題名類型,而CNMARC格式卻用了6個字段來說明各種相關(guān)題名。

      (3)多對一的情況,即多個源字段對應(yīng)一個目標(biāo)字段。例如責(zé)任者項(xiàng)的表示上,USMARC中則設(shè)有表示團(tuán)體名稱責(zé)任者和會議名稱責(zé)任者的主要款目字段,分別在字段110和111上,而CNMARC中對應(yīng)的內(nèi)容僅用710字段來表述上面兩個字段的內(nèi)容。

      (4)多對多的情況,即多個源字段和多個目標(biāo)字段對應(yīng)。例如在責(zé)任者的責(zé)任方式描述方面,CNMARC設(shè)有表示主要責(zé)任者、次要責(zé)任者的字段701、702和711、712,另外,還在200字段中分別用$f、$g來表示第一責(zé)任說明和其它責(zé)任說明。USMARC對應(yīng)的內(nèi)容分別用245和701的子字段進(jìn)行了描述。

      由于兩種MARC格式在結(jié)構(gòu)上的相似性以及字段和子字段的可映射性,因此兩種MARC格式之間的自動轉(zhuǎn)換存在可能性。

      3.轉(zhuǎn)換系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)

      3.1 轉(zhuǎn)換系統(tǒng)的流程分析

      由于MARC數(shù)據(jù)格式比較復(fù)雜且差異較大,想正確轉(zhuǎn)換每條記錄,必須根據(jù)記錄每個字段的特點(diǎn),依不同的轉(zhuǎn)換表對應(yīng)映射進(jìn)行轉(zhuǎn)換。轉(zhuǎn)換過程中,按照如下幾個步驟進(jìn)行:MARC數(shù)據(jù)的校驗(yàn)、MARC數(shù)據(jù)的分解描述、MARC格式轉(zhuǎn)換、人工修正編輯。具體流程如圖1所示。

      圖1 CNMARC格式到USMARC自動轉(zhuǎn)換系統(tǒng)流程圖

      3.2 必備字段的選擇

      首先要進(jìn)行的第一步工作是對照西文普通圖書著錄規(guī)則選取采用USMARC格式的必備字段及子字段。因?yàn)镃NMARC和USMARC中所設(shè)字段都是針對能著錄多種文獻(xiàn)類型及多文種文獻(xiàn)而制定的,數(shù)據(jù)格式結(jié)構(gòu)復(fù)雜繁多,同一本圖書可能會從多角度進(jìn)行描述,采取的是詳盡著錄的方式,且字段重疊,重復(fù)性高。況且兩者之間的對應(yīng)關(guān)系也不是絕對的,因此在轉(zhuǎn)換時沒有必要也不可能轉(zhuǎn)換所有字段,只需要按照圖書著錄標(biāo)準(zhǔn)選擇適用的機(jī)讀目錄格式字段進(jìn)行轉(zhuǎn)換即可。

      3.3 轉(zhuǎn)換對應(yīng)關(guān)系表的設(shè)計(jì)

      3.3.1 字段對應(yīng)關(guān)系表的設(shè)計(jì)

      在編制轉(zhuǎn)換關(guān)系表時要認(rèn)真分析CNMARC和USMARC各個字段的對應(yīng)關(guān)系,一個CNMARC與USMARC字段對應(yīng)關(guān)系的轉(zhuǎn)換表是轉(zhuǎn)換系統(tǒng)設(shè)計(jì)與開發(fā)的首要任務(wù)。轉(zhuǎn)換表中要詳細(xì)注明字段與字段的對應(yīng)關(guān)系,對應(yīng)的轉(zhuǎn)換方式及以可以其它需要描述的內(nèi)容,字段轉(zhuǎn)換時要特別注意各方面的對應(yīng):字段標(biāo)識符的對應(yīng),字段指示符的對應(yīng),子字段標(biāo)識符的對應(yīng)。如USMARC中的008字段的數(shù)據(jù)代碼內(nèi)容對應(yīng)于CNMARC中的多個字段,轉(zhuǎn)換規(guī)則中需要排列出其所有的對應(yīng)關(guān)系。

      在實(shí)際記錄中,由于一些字段的可重復(fù)性造成該字段重復(fù)出現(xiàn),要考慮其字段對應(yīng)的USMARC格式字段的可重復(fù)性,不能只取其一或讓后者覆蓋前者。對于CNMARC格式中一些無對應(yīng)的USMARC數(shù)據(jù)字段或利用價值不大的字段不建立對應(yīng)關(guān)系,轉(zhuǎn)換時可以不予考慮。由于CNMARC與USMARC的對應(yīng)關(guān)系復(fù)雜,首次建立的對應(yīng)表及轉(zhuǎn)換規(guī)則不可能完全合適用于所有的編目數(shù)據(jù),因此還需要建立轉(zhuǎn)換表的動態(tài)添加功能。

      3.3.2 字符內(nèi)容轉(zhuǎn)換表的設(shè)計(jì)

      兩種MARC格式中還可能出現(xiàn)同樣的內(nèi)容著錄的字段名、位置相同,但是指示符代表的內(nèi)容卻不一樣的情況;還可能存在字段名和位置不同,使用的代碼符號各異的情況。因此在具體轉(zhuǎn)換時,在考慮正確對應(yīng)字段及位置的同時,也要正確替代使用的符號,例如:描述文學(xué)體裁為小說時,USMARC著錄于008字段的第33位,著錄內(nèi)容為f,而對應(yīng)的在CNMARC中,使用a代表小說,卻在105@a字段的第11位用a表示。根據(jù)這些可能存在的情況,系統(tǒng)也設(shè)定了對于此類內(nèi)容描述不同的字符的對應(yīng)關(guān)系。

      3.4CNMARC數(shù)據(jù)的校對與規(guī)范

      數(shù)據(jù)的規(guī)范性是正確轉(zhuǎn)換的前提條件。在一般的應(yīng)用中,CNMARC中的代碼內(nèi)容如果出現(xiàn)錯誤,編目員通過對其它相關(guān)字段的分析比較,大多數(shù)內(nèi)容可以正確修改和認(rèn)識。但是,在系統(tǒng)轉(zhuǎn)換過程中,所有代碼內(nèi)容都要以位為單位逐個轉(zhuǎn)換,系統(tǒng)無法通過相關(guān)字段進(jìn)行全面對比分析。所以在轉(zhuǎn)換之前,需要人工對所有的CNMARC數(shù)據(jù)進(jìn)行判別檢驗(yàn)。CNMARC的檢驗(yàn)應(yīng)當(dāng)全面,包括定長字段的各個元素代碼的合法性。必備字段、子字段的齊全性,字段的重復(fù)性及所有字段使用指示符的合法性,甚至也要校驗(yàn)個別字段必備的字符串信息以及字段間的對應(yīng)關(guān)系。

      3.5 轉(zhuǎn)換程序設(shè)計(jì)與實(shí)現(xiàn)

      具體的轉(zhuǎn)換程序主要有數(shù)據(jù)分析、數(shù)據(jù)轉(zhuǎn)換、修正編輯和記錄生成四個主要模塊。

      (1)數(shù)據(jù)分析模塊:數(shù)據(jù)分析模塊主要實(shí)現(xiàn)MARC數(shù)據(jù)的分解和切分。對MARC文件中按照結(jié)構(gòu)信息進(jìn)行切分,對切分出來的內(nèi)容分塊存放,分解標(biāo)記不同內(nèi)容,然后傳送到數(shù)據(jù)轉(zhuǎn)換模塊。

      (2)數(shù)據(jù)轉(zhuǎn)換模塊:數(shù)據(jù)轉(zhuǎn)換模塊主要實(shí)現(xiàn)兩種MARC格式差異的變換。分別對應(yīng)于轉(zhuǎn)換規(guī)則數(shù)據(jù)庫中的字段對應(yīng)關(guān)系表和字符內(nèi)容轉(zhuǎn)換表。轉(zhuǎn)換過程即為數(shù)據(jù)映射的關(guān)系,首先針對匹查詢到待轉(zhuǎn)換的內(nèi)容,按照不同的轉(zhuǎn)換規(guī)則,逐條轉(zhuǎn)換。

      (3)修正模塊:數(shù)據(jù)修正編輯模塊主要是對于兩種MARC格式中可能存在的一些需要手工添加的部分進(jìn)行處理,還負(fù)責(zé)對轉(zhuǎn)換后的MARC格式可能出現(xiàn)的錯誤進(jìn)行校對。例如在CNMARC中中文數(shù)據(jù)顯示的標(biāo)識符號完全依賴子字段代碼來完成,USMARC的標(biāo)識符號則需要人工輸入,而且這些符號只限于子字段之間,結(jié)尾處的符號則因USMARC對不同的字段有不盡相同的規(guī)定,很難整體考慮。因此需要根據(jù)字段的特殊要求人工實(shí)現(xiàn)。

      (4)生成模塊:生成模塊是對轉(zhuǎn)換以后的結(jié)果按USMARC字段的要求逐條字段生成,并對字段排序形成數(shù)據(jù)區(qū),再形成目次區(qū),生成完整的USMARC數(shù)據(jù)。

      4.結(jié)束語

      本文在認(rèn)真分析CNMARC與USMARC規(guī)則的基礎(chǔ)上,歸納整理了國內(nèi)西文編目中CNMARC與USMARC著錄數(shù)據(jù)的特點(diǎn),設(shè)計(jì)實(shí)現(xiàn)了CNMARC到USMARC的自動轉(zhuǎn)換系統(tǒng),該系統(tǒng)已在實(shí)際工作中得到較好的應(yīng)用。系統(tǒng)的實(shí)現(xiàn)為下一步批量實(shí)現(xiàn)西文編目數(shù)據(jù)從CNMARC向USMARC的轉(zhuǎn)換提供了較好的思路。但由于兩種編目格式在細(xì)節(jié)上的設(shè)計(jì)差異以及中英文表達(dá)方式的不確定性等原因的存在,仍需要在實(shí)際的轉(zhuǎn)換工作中,不斷地更新和完善映射規(guī)則,以便最終實(shí)現(xiàn)數(shù)據(jù)的直接交換和共享使用。

      參考文獻(xiàn):

      [1]北京圖書館《中國機(jī)讀目錄格式使用手冊》編委會.中國機(jī)讀目錄格式使用手冊[M].北京:華藝出版社,1995.

      [2]陳穎.從MARC21和CNMARC對叢書項(xiàng)著錄的差異看編目工作國際化[J].重慶圖情研究,2012,02:56-58.

      [3]張贊,梁肇英,楊維利.淺談CNMARC與MARC21[J].圖書館工作與研究,2011,09:83-85.

      [4]謝蓉.USMARC與CNMARC的比較研究[J].現(xiàn)代情報,2005, 04:124-127.

      [5]宓永迪.《USMARC和CNMARC雙向轉(zhuǎn)換系統(tǒng)》的分析和實(shí)現(xiàn)[J].現(xiàn)代圖書情報技術(shù),2002,03:32-34.

      [6]孫華,陳世海.USMARC與CNMARC自動轉(zhuǎn)換系統(tǒng)[J].大學(xué)圖書館學(xué)報,2000,01:56-58.

      [7]余敏.從CNMARC到MARC21數(shù)據(jù)轉(zhuǎn)換研究[J].圖書館論壇,2011,03:105-108.

      Analysis and Implement of Transition System between CNMARC and USMARC in the Cataloguing of Foreign Books

      Ai Jinyong1Chen Xiaoying2
      (1.The Library of Xizang University of Nationalities,Xianyang 712082,Shaanxi; 2.College of Information Engineering,Xizang University of Nationalities,Xianyang 712082,Shaanxi)

      tract】 Based on analyzing the feasibility of cataloguing data automatic conversion from CNMARC format to USMARC format,this paper compiles the character map about two MARC formats;and then finds the law between the two formats.At last we design the conversion software that realizes the smooth conversion from CNMARC to USMARC.

      words】 USMARC;CNMARC;cataloguing of foreign books;automatic conversion

      艾金勇,男,湖北襄陽人,館員,研究方向:藏文信息處理。

      西藏民族學(xué)院科研項(xiàng)目(13myQ12)的階段性成果。

      猜你喜歡
      西文編目字段
      高校圖書館西文古籍開發(fā)整理實(shí)踐及對策探討
      ——以河北大學(xué)圖書館為例
      樂籍西譯:五種《樂記》西文譯本、譯者及其傳播
      圖書館中文圖書編目外包數(shù)據(jù)質(zhì)量控制分析
      國家圖書館藏四種古籍編目志疑
      天一閣文叢(2020年0期)2020-11-05 08:28:36
      粵劇編目整理之回顧與展望
      戲曲研究(2017年3期)2018-01-23 02:51:01
      西文圖書編目中RDA書目記錄使用分析
      高等教育英語專業(yè)建設(shè)回顧
      CNMARC304字段和314字段責(zé)任附注方式解析
      無正題名文獻(xiàn)著錄方法評述
      圖書館編目業(yè)務(wù)外包發(fā)展探討
      河南科技(2014年22期)2014-02-27 14:18:37
      当雄县| 汉源县| 三河市| 鹤山市| 滁州市| 重庆市| 织金县| 泉州市| 赣州市| 工布江达县| 卫辉市| 长宁县| 临泉县| 襄城县| 奉贤区| 同德县| 巨鹿县| 南川市| 沈丘县| 石门县| 甘谷县| 甘肃省| 九江县| 绥德县| 景谷| 西乡县| 冕宁县| 南郑县| 南丰县| 常山县| 大名县| 文登市| 永平县| 阿克| 辽阳市| 沾益县| 遵义县| 喀喇| 巴彦县| 类乌齐县| 建德市|