李春新
(中國國家圖書館,北京 100081)
首先是兩岸文獻出版形式不同,大陸出版物出版形式較為正規(guī),封面、題名頁、書脊等上的信息比較全面,包括ISBN號、出版社、正題名、副題名、英文題名、著者、主編、出版年、開本、價格、在版編目(CPI)數(shù)據等,這些信息是編目員制作數(shù)據的重要依據;而臺版文獻出版形式比較開放,致使著錄信息往往存在不確定性,有相當一部分圖書沒有題名頁或版權頁。在編文獻中提供的信息源位置往往與大陸使用的《中國文獻編目規(guī)則》出入較大。ISBN與之相對應的出版社為異地出版社,這在大陸中文圖書中是不會出現(xiàn)的問題,但在臺版文獻中卻屢見不鮮。有些信息需要編目員在文獻中仔細辨認、尋找。以上這些都給臺版文獻的編目工作帶來極大困擾,增加了編目員的工作強度,進而影響到編目質量、效率和進度。
其次,大陸出版物均為簡化字,編目員認、讀、錄入不存在障礙,而臺版文獻基本都是豎版繁體字,在一定程度上影響編目員的認讀。
由于兩岸編目規(guī)則存在差異,導致在格式著錄上的不一致。目前大陸使用《中國機讀目錄格式使用手冊》,臺灣使用《中國機讀編目格式》,雖然二者都是以UNIMARC為藍本制定的機讀目錄,但卻存在某些差異。例如:在文獻外部特征的描述上二者存在不一致,以出版年(2000年)的著錄來說,臺版文獻中的出版年信息有2000、89、民89、民國89、民國八十九年、中華民國八十九年6種之多。大陸2005年之前的臺版文獻,無論在編文獻中出版年信息以何種形式出現(xiàn),一律直接換算成公元年(2000),將其著錄在215字段的@d子字段中。這不僅忽略了客觀著錄的原則,也使得在使用ALEPH系統(tǒng)后,很多不規(guī)范的問題凸現(xiàn)出來。作為權宜之計,目前國家圖書館將非公元紀年著錄于“()”內,以表示客觀著錄,(在編文獻提供的出版年信息),公元年著錄于“[]”內,以示編目員提供的信息,即215@d[2000](中華民國八十九年)。但無論以上何種著錄方式,都談不上客觀著錄,也更談不上標準化。
聯(lián)合編目發(fā)展到今天已經是非常成熟的編目形式,且成為信息編目的主流,基本實現(xiàn)了書目數(shù)據的共建共享,而大陸的臺版文獻書目數(shù)據在全國的書目數(shù)據中還僅限于數(shù)據庫狀態(tài)且相互獨立,缺乏共建共享。這樣就為制作書目數(shù)據帶來了一定的困難。時至今日兩岸資源共享已是大勢所趨,兩岸MARC又屬同宗同源,都以UNIMARC為藍本制訂了各自的機讀目錄格式,為資源共享打下了堅實的基礎。
1980年臺灣成立了“圖書館自動化作業(yè)規(guī)劃委員會”,標志其正式開始研究制定中文機讀編目格式。同年5月成立了“中文機讀編目格式工作小組”,開始制訂符合國際標準的MARC格式,以便于在本島及國際間交流與共享文獻資源。
1981年1月,《中文圖書機讀編目格式》(CMARC)第1版問世,同年7月出版了修訂第2版及其使用手冊。隨后,做出兩個重大調整:①擴大CMARC的適用類型,除原有的普通圖書外,還包括了連續(xù)出版物、地圖、樂譜、視聽資料等。②作為書目數(shù)據交換的通用格式,不受數(shù)據文種的限制,適用的范圍擴大到中文以外的文字。1984年再次修訂出版《中文圖書機讀編目格式》(CMARC)第2版,依照國際上MARC發(fā)展趨勢調整了內容,增加了對善本書和拓片的適用字段。
1988年,基于新信息媒體的涌現(xiàn),參酌1987年出版的國際機讀編目格式手冊和美國國會圖書館書目服務部發(fā)表的美國機讀編目格式修訂建議書,以及“臺灣圖書館”歷年來的實踐經驗,歷經一年多的修訂,于1989年出版CMARC第3版。
大陸機讀目錄研制于20世紀70年代。1979年成立了全國信息與文獻標準化技術委員會和北京地區(qū)機讀目錄研制小組,1982年中國標準總局公布了參照ISO2709制訂的大陸標準《文獻目錄信息交換用磁帶格式》(GB2901-82),為中文MARC格式的標準化奠定了基礎。
1986年UNIMARC中譯本問世。在此基礎上,大陸根據實際情況,編制了《中國機讀目錄通訊格式》討論稿,1992年2月正式出版《中國機讀目錄通訊格式》,即CNMARC。1995年12月又出版了《中國機讀目錄格式使用手冊》。
1996年2月6日,《中華人民共和國文化行業(yè)標準·中國機讀目錄格式(CNMARC)WH/T0503296》作為國家標準在大陸誕生,并于1996年7月1日予以實施,2004年出版《新版中國機讀目錄格式使用手冊》。至此,CNMARC格式為大陸機讀目錄實現(xiàn)標準化并與國際接軌,從數(shù)據結構方面提供了保障。
MARC是推進書目數(shù)據規(guī)范與統(tǒng)一,加速文獻信息網絡建設,實現(xiàn)國內外圖書館間書目信息交換與共享的重要工具。目前,大陸、臺港澳和世界其他一些國家和地區(qū)圖書館著錄中文文獻的MARC主要有兩種:一種是大陸版的CNMARC,另一種是臺灣版的CMARC。雖然兩種MARC分別由大陸和臺灣編訂而成,但因為從編訂的主要依據(均以UNIMARC為藍本)到各個具體環(huán)節(jié),它們采用的標準大同小異,所以記錄結構完全相同,主要字段、子字段基本一致,這為整合二者打下了良好的基礎。
二者的字段和子字段都是由標志塊(CMARC為識別段)、編碼信息塊(CMARC為代碼資料段)、著錄信息塊(CMARC為著錄段)、附注塊(CMARC為附注段)、款目連結塊(CMARC為連結款目段)、相關題名塊(CMARC為相關題名段)、主題分析塊(CMARC為主題分析段)、知識責任塊(CMARC為著者段)、國際使用塊(CMARC為國際使用段)組成,字段定義都大同小異。
記錄結構遵循ISO2709規(guī)定,都是由記錄頭標區(qū)(CMARC為記錄標區(qū))、地址目次區(qū)(CMARC為指引)和數(shù)據字段區(qū)(CMARC為書目資料登錄欄)3部分組成。
從語種看,兩岸MARC均用LC語種和語種代碼修訂表。
從分類法看,CMARC使用臺灣《中國圖書分類法》(賴永祥增訂7版),西文分類采用杜威十進分類法(DDC)和美國國會分類法(LCC)。CNCMARC采用《中國圖書館分類法》(第4版)。CMARC的681、682、686、687字段分別用于記錄臺灣《中國圖書分類法》、《臺灣農業(yè)科學情報中心分類法》和《美國國家醫(yī)學圖書館分類法》、《美國國家農業(yè)圖書館分類法》的分類號。CNMARC的690、692、696字段分別著錄《中國圖書館分類法》、《中國科學院圖書館圖書分類法》和國內其他分類法分類號。
漢語拼音方面,CMARC采用韋士杰羅馬系統(tǒng),CNMARC采用漢語拼音。
地理區(qū)域代碼方面,CMARC采用LC1980地理區(qū)域代碼,國家代碼采用 ISO3166(1974)。
CNMARC采用ISO3166—1981國名代碼表和GB2659—81世界各國和地區(qū)名稱及代碼。
字符集方面,CMARC在處理中文圖書時,采用臺灣的字符集標準“中文資訊交換碼”,這個字符集的標準是繁體字的字符集標準。另外,CMARC還采用了LCMARC的年代范圍代碼和IFLA1977年訂的讀者代碼。而CNMARC采用GB2312—80信息交換用漢字編碼字符集(基本集)及第1、3、5輔助標準集。
綜上所述,既然兩種MARC存在相同和不同的地方,要達到共建共享則必須將二者進一步整合,使其逐漸趨于一致。
整合的首要工作是整合概念與術語,只有這樣才不會使用戶、編目人員、軟件開發(fā)商等由于概念與術語的混淆而產生理解與使用上的分歧。下面是兩種MARC中內涵相同但名稱不同的主要概念與術語。
例如:CNMARC中的“塊”對應CMARC中的“段”
CNMARC中的“字段”對應CMARC的“欄”
CNMARC中的“子字段標志符”對應CMARC的“分欄識別”
CNMARC中的“字段分隔符”對應CMARC的“欄間符號”
CNMARC中的“記錄投標”對應CMARC的“記錄標志”
CNMARC中的“地址目次區(qū)”對應CMARC的“指引”
CNMARC中的“數(shù)據字段”對應CMARC的“書目資料登錄欄”
CNMARC中的“字符集”對應CMARC的“內碼”
CNMARC中的“數(shù)據”對應CMARC的“字元”
統(tǒng)一二者字段和子字段,其中包括字段的名稱、子字段的名稱、具體內容、指示符等。從0字段到9字段有大量的不同點,以下僅舉幾例說明。
例如:009字段,在CNMARC中沒有,而在CMARC中有
014字段,在CNMARC中為“論文標志號”,而在CMARC中是“篇章識別號”
016字段在CNMARC中沒有,而在CMARC中有
091字段在CNMARC中有,而在CMARC中沒有
094字段在CNMARC中有,而在CMARC中沒有
CNMARC采用《中國文獻編目規(guī)則》等標準進行著錄,而CMARC采用CCR2r《中國編目規(guī)則》、AACR2等標準進行著錄。編目規(guī)則不同導致著錄結構不同,所以必須對編目規(guī)則進行整合以確保記錄一致。
例如:交替題名的著錄
天下才子必讀書,又名,才子古文/(清)金圣嘆評注
CMARC著錄為:
2001#$a天下才子必讀書,又名,才子古文 $f(清)金圣嘆評注
CNMARC著錄為:
2001#$a天下才子必讀書$a又名,才子古文$f(清)金圣嘆評注
CMARC采用《中國編目規(guī)則》,交替題名視為一個整體著錄在200字段的$a子字段;而CNMARC采用《中國文獻編目規(guī)則》,交替題名分別著錄在200字段的兩個$a子字段中。
目前,大陸圖書館采購的港臺中文圖書日漸增多,數(shù)據加工量也逐年增加,對臺灣CMARC數(shù)據加以利用將是今后大陸圖書館的一個趨勢。
“全國圖書書目資訊網”是臺灣地區(qū)圖書館專用的書目性網絡,也是臺灣目前唯一的合作編目機制。包含了臺灣77家高校及公共圖書館的館藏目錄,數(shù)據達620萬條之多。其中,中文書目360萬條,西文190萬條,其他語種70萬條。此外,還包括連續(xù)出版物、多媒體、電子資源以及網絡資源等各種資料類型。如此豐富的中文書目數(shù)據資源,并且免費下載,將這些開放的資源加以利用,對實現(xiàn)資源共享將大有好處。
其一,可以減少重復性編目,減少編目流程,最大限度地提高編目效率,降低編目成本,使新書以最快的速度進入流通環(huán)節(jié),提高時效性。
其二,可以提高書目數(shù)據的整體質量,促進臺版文獻書目數(shù)據的標準化、規(guī)范化進程。
其三,為資源共享創(chuàng)造條件。通過網絡技術可對書目信息進行實時在線檢索與利用,達到“一館錄入,多館使用”。
其四,聯(lián)合編目使其書目數(shù)據上傳或下載,供成員館交流與使用,使其書目信息更加公開透明,有利于交流館藏信息,合理配置館藏資源,最終實現(xiàn)編目工作理想境界,即資源共享。
聯(lián)合編目與規(guī)范控制是編目工作發(fā)展到一定程度的必然結果,也是編目工作的重要組成部分;是實現(xiàn)文獻信息著錄規(guī)范化與標準化的重要措施,也是確保書目數(shù)據質量、檢索效率、完善數(shù)據庫功能的重要保障。我國兩岸三地圖書館界應進一步加強合作,在CNMARC和CMARC的基礎上制訂出一部既能與二者兼容又能被國外圖書館漢語文獻著錄共同接受的MARC格式,以便更加廣泛地實現(xiàn)文獻信息資源的共建共享,最大限度地提高書目文獻資源的利用率。
[1]王維納.國家圖書館臺港書目數(shù)據的規(guī)范化與質量控制.圖書館論壇,2007(2).
[2]陳富良.大陸和臺灣的中文MARC比較.圖書館工作與研究,1994(1).
[3]謝蓉.USMARC與CNMARC的比較研究.現(xiàn)代情報,2005(4).