作者簡(jiǎn)介:苗青(1980-),女,館員,碩士,研究方向:文獻(xiàn)資源建設(shè),發(fā)表論文2篇。·業(yè)務(wù)研究·
〔摘要〕從傳統(tǒng)的印刷品到電子圖書以及隨處可見(jiàn)的網(wǎng)絡(luò)資源,各種信息正以排山倒海之勢(shì)闖入我們的生活,本文通過(guò)對(duì)數(shù)字復(fù)合出版環(huán)境下自動(dòng)編目情況的簡(jiǎn)要概述,試圖分析這一新環(huán)境對(duì)圖書館編目工作的影響,進(jìn)而提出對(duì)圖書館在新環(huán)境下擴(kuò)展編目對(duì)象的思考。
〔關(guān)鍵詞〕數(shù)字復(fù)合出版;自動(dòng)編目;網(wǎng)絡(luò)資源的組織;藏品揭示;編目
DOI:10.3969/j.issn.1008-0821.2014.03.029
〔中圖分類號(hào)〕G25434〔文獻(xiàn)標(biāo)識(shí)碼〕A〔文章編號(hào)〕1008-0821(2014)03-0135-04
Discussion on the Library Develops Cataloging
Objects in Digital Publishing EnvironmentMiao Qing
(Shanghai Library,Shanghai 200031,China)
〔Abstract〕From the traditional print to electronic books and ubiquitous network resources,all kinds of information with the avalanche of power into our life.In the article,through a brief overview of the automatic cataloging in digital composite publishing environment,trying to analyze the impaction on library cataloguing work,and then thinking of expanding cataloging objects in the new environment.
〔Keywords〕digital composite publishing;automatic cataloging;network resources organization;collection revealing;cataloging
2008年4月,國(guó)家數(shù)字復(fù)合出版系統(tǒng)工程在多方努力下正式啟動(dòng)。該工程的推出將在很大程度上增加數(shù)字文獻(xiàn)的館藏比例,減少了圖書館文獻(xiàn)資源的電子化成本以及對(duì)版權(quán)問(wèn)題的過(guò)分擔(dān)心。但與此同時(shí),我們也要看到,基于自動(dòng)編目基礎(chǔ)上的數(shù)字復(fù)合出版系統(tǒng)工程,在為圖書館界提供機(jī)遇的同時(shí),也帶來(lái)了一定的挑戰(zhàn)。本文試圖從編目對(duì)象的角度對(duì)這一問(wèn)題進(jìn)行分析和探討。
1數(shù)字復(fù)合出版系統(tǒng)及其對(duì)圖書館編目工作的影響
11數(shù)字復(fù)合出版和自動(dòng)編目的概況
數(shù)字復(fù)合出版系統(tǒng)工程是在對(duì)ECIP和自動(dòng)編目的研究過(guò)程中擴(kuò)展誕生的,是新聞出版總署在數(shù)字出版方面的第1號(hào)工程,以實(shí)現(xiàn)一種信息多種傳播,信息處理、出版發(fā)行能夠在一個(gè)系統(tǒng)里完成。如圖1:
圖1數(shù)字復(fù)合出版系統(tǒng)〖〗
自動(dòng)編目從根本上改變了編目模式,變圖書館的“描述性編目”為出版社的“標(biāo)識(shí)性編目”,即在圖書印前電子文本上進(jìn)行編目處理。具體操作是對(duì)其中的屬性數(shù)據(jù)進(jìn)行標(biāo)識(shí),而不是描述[1]。從源頭規(guī)范了數(shù)據(jù)生產(chǎn),改變了信息生產(chǎn)的無(wú)序狀態(tài),有利于文獻(xiàn)信息資源的有序整合。文獻(xiàn)編目工作也不再由圖書館的采編部門來(lái)完成,而是前移至上游出版社在文獻(xiàn)產(chǎn)生的過(guò)程中自動(dòng)生成。
12數(shù)字復(fù)合出版對(duì)圖書館編目工作的影響
網(wǎng)絡(luò)化的今天,當(dāng)人們的閱讀方式正發(fā)生著悄然變化的時(shí)候,圖書館仍然在從事著以紙本文獻(xiàn)為主的編目工作,而這一工作也即將面臨數(shù)字出版的沖擊:
(1)文獻(xiàn)產(chǎn)生過(guò)程中的自動(dòng)編目替代了文獻(xiàn)產(chǎn)生后依據(jù)文獻(xiàn)實(shí)體的客觀性著錄;
(2)針對(duì)“描述性編目”的理論不再適用,自動(dòng)編目需要提出一套自己的編目理論,而這一理論是否適合圖書館對(duì)文獻(xiàn)的組織要求我們尚不明確;
(3)圖書館的編目工作將逐漸淡出或消失,隨之一同流失的是編目工作人員對(duì)文獻(xiàn)的組織能力和經(jīng)驗(yàn)。
此外,信息技術(shù)的發(fā)展、Web20技術(shù)的產(chǎn)生、讀者閱讀習(xí)慣的變化、各種手持閱讀器、移動(dòng)閱讀的興起,都讓我們?cè)诿鎸?duì)信息資源如此龐大的社會(huì)有些不知所措。而數(shù)字復(fù)合出版系統(tǒng)作為出版系統(tǒng)而言處理的只是已經(jīng)或即將正式出版的文獻(xiàn)著作,面對(duì)各種復(fù)雜的信息還無(wú)法做到全面整合和揭示。因此,從圖書館界出發(fā),在面臨傳統(tǒng)文獻(xiàn)編目工作前移至出版社的情況下,我們是否可以考慮擴(kuò)大編目對(duì)象,將隨處可見(jiàn)的網(wǎng)絡(luò)資源納入我們編目(或者說(shuō)組織)的范圍內(nèi)。這樣不但能加強(qiáng)圖書館編目工作者對(duì)各種信息的組織能力,也可以滿足用戶對(duì)信息有效使用的需求。
2圖書館編目對(duì)象的拓展
隨著社會(huì)進(jìn)步和讀者個(gè)性化的發(fā)展,傳統(tǒng)圖書館已從對(duì)文獻(xiàn)的加工發(fā)展為對(duì)信息的組織,進(jìn)而爭(zhēng)取達(dá)到知識(shí)管理的層次。從文獻(xiàn)的分類編目到信息組織再到信息資源管理,就是一個(gè)對(duì)傳統(tǒng)分類編目工作不斷擴(kuò)大、更新與升級(jí)的過(guò)程[2]。
21對(duì)網(wǎng)絡(luò)信息資源的獲取和組織
在今天科技水平日新月異、個(gè)性不斷張揚(yáng)的世界中,各種網(wǎng)絡(luò)信息資源呈幾何倍數(shù)增長(zhǎng),與此同時(shí),伴隨著網(wǎng)絡(luò)信息資源動(dòng)態(tài)變化性的特點(diǎn),網(wǎng)絡(luò)新聞、電子郵件、博客等各種類型的網(wǎng)絡(luò)信息資源瞬間產(chǎn)生也瞬間消失,因此也提出了對(duì)網(wǎng)絡(luò)信息資源選取、序化的問(wèn)題。
211網(wǎng)絡(luò)信息資源的獲取
在解決網(wǎng)絡(luò)資源選取問(wèn)題上,各種搜索引擎應(yīng)運(yùn)而生,如傳統(tǒng)的通用搜索引擎Yahoo!、Google、百度等。但基于傳統(tǒng)搜索引擎無(wú)法搜索到深層網(wǎng)絡(luò)(Deep Web)信息的原因,深層網(wǎng)絡(luò)爬蟲技術(shù)逐漸興起并在實(shí)踐中得到大量應(yīng)用,取得一定成效[3]。所謂網(wǎng)絡(luò)爬蟲,又稱網(wǎng)絡(luò)機(jī)器人。英文名有Spider、Crawler、Bots、Robot、Wanderer等,是一個(gè)自動(dòng)提取網(wǎng)頁(yè)的程序,是搜索引擎的重要組成部分[4]。網(wǎng)絡(luò)爬蟲能夠自動(dòng)獲取使用者所需資源,使用起來(lái)相對(duì)容易。相比之下,對(duì)網(wǎng)絡(luò)信息資源的組織序化則是目前我們需要研究的重點(diǎn)問(wèn)題。
212網(wǎng)絡(luò)信息資源的組織序化
網(wǎng)絡(luò)有著如此豐富的“館藏”資源,因此必須建立一個(gè)通用的、合理的、規(guī)范的網(wǎng)絡(luò)信息資源著錄規(guī)則,這就要求在信息加工過(guò)程中引入編目理念,深化對(duì)網(wǎng)絡(luò)信息資源的組織。對(duì)網(wǎng)絡(luò)信息資源的組織是指采用一定的方法與模式,按照一定的原則將因特網(wǎng)上某一領(lǐng)域大量的、分散的、雜亂無(wú)章的、良莠不齊的信息通過(guò)搜索、評(píng)價(jià)、篩選、分析、標(biāo)引、著錄、排序等手段加工處理,使其形成一個(gè)有序的、便于用戶獲取與利用的信息系統(tǒng)的過(guò)程[5]。
在對(duì)網(wǎng)絡(luò)資源組織方法的研究上,谷麗萍提出用傳統(tǒng)文獻(xiàn)組織方法組織網(wǎng)絡(luò)資源,即使用元數(shù)據(jù)為網(wǎng)絡(luò)信息資源著錄提供最基本的著錄項(xiàng);將分類法思想引入網(wǎng)絡(luò)信息服務(wù)系統(tǒng)中;將主題詞引入搜索引擎中作為查找的關(guān)鍵詞等[6]。目前,越來(lái)越多的學(xué)者將注意力轉(zhuǎn)移到利用元數(shù)據(jù)對(duì)網(wǎng)絡(luò)資源乃至其他不同載體形式的信息資源進(jìn)行描述和組織方面。從20世紀(jì)90年代至今,世界各國(guó)就已先后制定出數(shù)十種具有一定影響的描述性元數(shù)據(jù),根據(jù)其用途不同、對(duì)象不同、行業(yè)不同又可劃分為不同的類型。萬(wàn)變不離其宗,王松林老師在其《信息組織與編目規(guī)則》中提到:“無(wú)論是今天的信息組織還是以往的文獻(xiàn)編目,它們的信息組織在組織機(jī)制上是一致的”[7]。從另一角度來(lái)說(shuō),無(wú)論是利用傳統(tǒng)的MARC格式還是現(xiàn)代不同種類的元數(shù)據(jù),我們對(duì)各種載體的信息進(jìn)行描述、揭示、組織的目的是相同的,即實(shí)現(xiàn)圖書館這一人類文化遺產(chǎn)保存機(jī)構(gòu)的收集信息、組織信息和傳遞信息的職能。
endprint
雖然早在21世紀(jì)初一些專家學(xué)者就已經(jīng)開始了對(duì)網(wǎng)絡(luò)資源組織的研究,但筆者通過(guò)對(duì)維普中文期刊全文數(shù)據(jù)庫(kù)1989-2009年的數(shù)據(jù)進(jìn)行檢索,檢索格式采用布爾邏輯運(yùn)算符“and”,關(guān)鍵詞為“網(wǎng)絡(luò)資源”和“組織”,檢索到相關(guān)文獻(xiàn)只有181篇??梢?jiàn),圖書館界對(duì)網(wǎng)絡(luò)資源組織的研究還處于初級(jí)階段,實(shí)踐應(yīng)用不足,我們應(yīng)將數(shù)字出版對(duì)圖書館編目工作的沖擊和挑戰(zhàn)轉(zhuǎn)化為圖書館界擴(kuò)大編目對(duì)象、深化信息組織的動(dòng)力。
22對(duì)珍貴稀有藏品的揭示
2008年美國(guó)國(guó)會(huì)圖書館出具的《書目控制的未來(lái)報(bào)告》中曾建議“將稀有和僅有資料的發(fā)現(xiàn)工作作為優(yōu)先考慮的工作。優(yōu)化稀有和僅有資料的編目工作,重視更廣的覆蓋范圍和更多資料的存取,而不是全面揭示一些資料而對(duì)其他資料不予揭示。建立可行的和靈活的編目實(shí)踐,反映用戶的需求和有限資源的現(xiàn)實(shí)。共享這部分資料的元數(shù)據(jù)?!保郏福蓦S后,世界各國(guó)對(duì)圖書館、博物館和檔案館三館合作方面的研究和實(shí)踐逐漸興起。2009年IFLA大會(huì)也將教育與培訓(xùn)專業(yè)組的征文主題定為“圖書館及文化機(jī)構(gòu)專業(yè)人員在文化遺產(chǎn)領(lǐng)域發(fā)揮的作用:為圖書館、檔案館、博物館(ALM)整合而教育”[9]。由此可見(jiàn),圖書館、博物館和檔案館的合作是近兩年來(lái)圖書館界的一個(gè)熱點(diǎn)問(wèn)題。同時(shí),也為我們擴(kuò)展編目對(duì)象提供了一個(gè)新的可能性。
221博物館和檔案館對(duì)數(shù)字化的需求
博物館、圖書館和檔案館三館作為國(guó)家的科學(xué)文化事業(yè)機(jī)構(gòu),擔(dān)負(fù)著收藏、保管人類文化遺產(chǎn)、提供信息服務(wù)的重任,這一共同的使命也讓三館合作建設(shè)成為可能。
但相比圖書館文獻(xiàn)的數(shù)字化比例及其開放程度,博物館和檔案館由于其藏品和文獻(xiàn)的珍貴性及保密性等一些其他原因,對(duì)數(shù)字信息資源的建設(shè)和開放存取的程度不能令用戶滿意。據(jù)國(guó)家檔案局網(wǎng)站統(tǒng)計(jì),我國(guó)2007年開放檔案比2006年同比增長(zhǎng)181%,到2008年1月1日,我國(guó)各級(jí)各類館藏檔案開放率已達(dá)1/3,雖已取得顯著進(jìn)步,但30%的開放率仍不能滿足用戶需求[10]。
而蓬勃發(fā)展的數(shù)字圖書館運(yùn)動(dòng)無(wú)疑反映了將圖書館、檔案館、博物館館藏資源聯(lián)合起來(lái)互為補(bǔ)充的思想,舉兩個(gè)例子:美國(guó)加利福尼亞在線檔案館(OAC,Online Archive of California)[11]和歐洲數(shù)字圖書館、博物館和檔案館[12]。這些項(xiàng)目的進(jìn)行使得用戶能夠直接獲取三館的數(shù)字化資源,但是獲取這些數(shù)字化資源的前提是對(duì)在線數(shù)字化資源進(jìn)行組織描述。而對(duì)三館館藏描述的互操作性、檢索點(diǎn)的一致性是目前三館面臨的主要挑戰(zhàn)。
2223館合作的出發(fā)點(diǎn)
目前,圖書館、博物館和檔案館面臨著同樣的問(wèn)題,即力求館藏資源為用戶所知、為用戶獲取,甚至是通過(guò)聯(lián)合資源發(fā)現(xiàn)的方式來(lái)達(dá)到這個(gè)目的。與此同時(shí),“純粹的”館藏——也就是,完全由圖書構(gòu)成的館藏,或者全部是藝術(shù)品的館藏——正變得越來(lái)越罕見(jiàn)。即使一所小型圖書館也能夠采購(gòu)一筆豐富的館藏,包括替代圖書的視頻資料、藝術(shù)品、物質(zhì)文化產(chǎn)品、或自然歷史的遺跡樣本。為了滿足用戶對(duì)于一站式信息檢索的需求,文化機(jī)構(gòu)必須做好準(zhǔn)備,明智地采用各種類型的元數(shù)據(jù)標(biāo)準(zhǔn),并且找到辦法,將不同的數(shù)據(jù)元素、常規(guī)的描述方法融合為一個(gè)和諧的整體。因此,相對(duì)于著錄標(biāo)準(zhǔn)的統(tǒng)一而言,三館對(duì)檢索點(diǎn)描述和規(guī)范記錄方面的協(xié)調(diào)才是合作能夠持續(xù)并推進(jìn)的一個(gè)很重要的因素。
3在擴(kuò)展編目對(duì)象時(shí)可能存在的問(wèn)題
對(duì)圖書館而言,擴(kuò)展編目對(duì)象并不簡(jiǎn)單意味著轉(zhuǎn)變館藏資源建設(shè)政策,只是在圖書館面臨傳統(tǒng)編目工作流失的背景下,為圖書館的編目工作尋找新的發(fā)展契機(jī)。因此,我們?cè)趯?duì)網(wǎng)絡(luò)信息資源和檔案館、博物館館藏資源進(jìn)行分析下,綜合目前國(guó)內(nèi)外的信息資源組織情況,對(duì)實(shí)際操作中將會(huì)存在的問(wèn)題進(jìn)行簡(jiǎn)單說(shuō)明。
31網(wǎng)絡(luò)資源內(nèi)容的選取
雖然我們可以利用深層網(wǎng)絡(luò)爬蟲對(duì)所需資源進(jìn)行搜尋,但具體在要獲取哪些資源的問(wèn)題上還需要結(jié)合本館的特點(diǎn)和館藏資源的建設(shè)方向進(jìn)行綜合分析,例如,對(duì)某一領(lǐng)域內(nèi)專家博客的收藏、對(duì)涉及某一內(nèi)容的相關(guān)新聞的選擇等,這些都需要圖書館的采訪人員能夠在新環(huán)境下對(duì)讀者的閱讀習(xí)慣進(jìn)行深層認(rèn)知和分析:哪些信息讀者喜歡從印刷型的文獻(xiàn)上獲?。荒男┬畔⒆x者喜歡從網(wǎng)絡(luò)上獲取等。并據(jù)此來(lái)確定圖書館網(wǎng)絡(luò)信息資源建設(shè)的方向和重點(diǎn)。
32統(tǒng)一標(biāo)準(zhǔn)的問(wèn)題
單從圖書館領(lǐng)域來(lái)說(shuō),對(duì)文獻(xiàn)著錄標(biāo)準(zhǔn)的規(guī)范控制就是編目界一直在探討的問(wèn)題。在圖書館與博物館、檔案館開展合作的過(guò)程中,該問(wèn)題更是亟待解決和研究的重點(diǎn)。
(1)一些已開展的試驗(yàn)性合作項(xiàng)目表明,合作中首先要明確的是各館在著錄方面的分歧,例如,藝術(shù)名信息中采用的是詞首字母大寫方式,而英美編目條例規(guī)定句首字母大寫。雖然,我們并不一定要求對(duì)這些著錄規(guī)則進(jìn)行統(tǒng)一,但作為編目工作者來(lái)說(shuō)要對(duì)這些差異有所認(rèn)識(shí)。
(2)上文強(qiáng)調(diào)過(guò)的對(duì)檢索點(diǎn)的描述和規(guī)范記錄的統(tǒng)一問(wèn)題。三館合作的目的之一便是能夠通過(guò)一個(gè)平臺(tái)將博物館的珍貴藏品、檔案館的檔案資料和圖書館有關(guān)的文獻(xiàn)資源整合起來(lái),方便用戶對(duì)信息資源的檢索和使用。因此,在數(shù)字圖書館發(fā)展迅速和三館檢索入口統(tǒng)一的背景下,通用標(biāo)準(zhǔn)的使用對(duì)各種文化遺產(chǎn)機(jī)構(gòu)來(lái)說(shuō)很有必要。
33深化對(duì)元數(shù)據(jù)的研究和應(yīng)用問(wèn)題
元數(shù)據(jù)在很多情況下被視為20世紀(jì)末、21世紀(jì)初編目的同義詞。伴隨著各種載體文獻(xiàn)的出現(xiàn),元數(shù)據(jù)在對(duì)資源描述和揭示方面的重要性日漸凸顯。若按對(duì)象分類,描述性元數(shù)據(jù)具體可分為描述數(shù)字文獻(xiàn)的元數(shù)據(jù)、描述數(shù)字圖像的元數(shù)據(jù)、描述博物館藏品的元數(shù)據(jù)和描述特殊資源的元數(shù)據(jù)等。 描述性元數(shù)據(jù)的特點(diǎn)是“跨行業(yè)”,這體現(xiàn)在所形成的記錄上,每條記錄都是在對(duì)采用的數(shù)據(jù)值和數(shù)據(jù)內(nèi)容標(biāo)準(zhǔn)精心思考后得以完成的。
目前,元數(shù)據(jù)編制的一個(gè)新趨勢(shì)是將描述(即“編目”)視為一個(gè)合作、擴(kuò)充的過(guò)程,而不是一個(gè)僅僅獨(dú)立在一家機(jī)構(gòu)的單獨(dú)一個(gè)部門開展的活動(dòng)。在數(shù)字資源時(shí)代,元數(shù)據(jù)編制在很多情況下能夠而且的確應(yīng)該是一項(xiàng)合作開展的工作,也因此需要我們對(duì)其進(jìn)行更加深入的研究和開發(fā)。
34加強(qiáng)編目員對(duì)相關(guān)知識(shí)的學(xué)習(xí)問(wèn)題
近年來(lái),編目員面臨一種挑戰(zhàn),需要描述不斷變化中的資源——像是一直變化中的網(wǎng)絡(luò)資源,或是定期更新的在線出版物。針對(duì)這些類型資源的元數(shù)據(jù)記錄會(huì)時(shí)常更新以反映其最新版本。與傳統(tǒng)的對(duì)某一專著文獻(xiàn)的描述反映一成不變的情況不同,21世紀(jì)的編目員不再是簡(jiǎn)單的信息著錄員,他要有能力使元數(shù)據(jù)編制成為一種行之有效的工具,要對(duì)各種標(biāo)準(zhǔn)的精心研究、整合利用,將文獻(xiàn)編目工作延伸到各行各業(yè)、各個(gè)領(lǐng)域和環(huán)節(jié)上。
4結(jié)束語(yǔ)
在網(wǎng)絡(luò)化的今天,圖書館面臨的編目對(duì)象已不再僅僅局限于印刷型文獻(xiàn)和電子圖書方面,圖書館、博物館、檔案館的試驗(yàn)性合作已經(jīng)開展,對(duì)信息資源的揭示已深入到實(shí)體藏品層面。而對(duì)網(wǎng)絡(luò)資源和實(shí)體藏品的信息組織則是數(shù)字復(fù)合出版系統(tǒng)所不可及的。因此,如何保持圖書館編目工作不流失則成為今后我們需要關(guān)注的重點(diǎn)。
參考文獻(xiàn)
[1]陳源蒸.論“標(biāo)識(shí)性編目”[J].數(shù)字圖書館論壇,2007,(6):36-40.
[2]高紅.抓住機(jī)遇迎接挑戰(zhàn)把我國(guó)文獻(xiàn)編目工作推向深入——第一屆全國(guó)編目工作研討會(huì)大會(huì)總結(jié)發(fā)言[C]∥21世紀(jì)的信息資源編目.北京:北京圖書館出版社,2006:8.
[3]曾偉輝,李淼.深層網(wǎng)絡(luò)爬蟲研究綜述[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2008,(5):122-125.
[4]劉金紅,陸余良.主題網(wǎng)絡(luò)爬蟲研究綜述[J].計(jì)算機(jī)應(yīng)用研究,2007,24(10):26-29.
[5]謝曉專.網(wǎng)絡(luò)信息資源組織模式研究[J].圖書情報(bào)工作,2006,(1):64-67.
[6]谷麗萍.論用傳統(tǒng)文獻(xiàn)組織方法組織網(wǎng)絡(luò)資源[J].文獻(xiàn)信息論壇,2009,(1):42-43.
[7]王松林.文獻(xiàn)編目與編目原則[C]∥21世紀(jì)的信息資源編目.北京:北京圖書館出版社,2006:1-7.
[8]美國(guó)國(guó)會(huì)圖書館書目控制的未來(lái)報(bào)告[EB/OL].http:∥www.1oc.gov/bibli0graphic-future/news/draf-report.html,2007-11-30.
[9]2009年國(guó)際圖聯(lián)大會(huì)將在意大利米蘭召開[EB/OL].http:∥www.tedala.gov.cn/cmsfile/2009-3-5/1236217128951.htm,2014-01-15.
[10]陸懿琦.檔案館與圖書館信息資源服務(wù)比較研究[J].蘭臺(tái)世界,2009,(2):10-11.
[11]美國(guó)加利福尼亞在線檔案館[EB/OL].http:∥www.oac.cdlib.org/,2014-01-15.
[12]歐洲數(shù)字圖書館、博物館和檔案館[EB/OL].http:∥www.europeana.eu/,2014-01-15.
(本文責(zé)任編輯:馬卓)
endprint