董 莉 何俊偉 斯 蕓 劉 蓉
〔摘 要〕指出當(dāng)前圖書館OPAC書目系統(tǒng)檢索效率低的原因主要是由于MARC數(shù)據(jù)著錄中存在問題,并對造成數(shù)據(jù)質(zhì)量問題的原因進(jìn)行分析,最后提出改善圖書館OPAC檢索效果的對策?
〔關(guān)鍵詞〕圖書館OPAC;MARC數(shù)據(jù);檢索效率;策略;檢索點(diǎn)
〔中圖分類號〕G252.7 〔文獻(xiàn)標(biāo)識碼〕A 〔文章編號〕1008-0821(2009)08-0166-03
Strategies of Improving Literature Search Efficiency by Library OPAC SystemDong Li1,2 He Junwei2 Si Yun2 Liu Rong2
(1.School of Information Management,Wuhan University,Wuhan 430072,China;
2.Library,Dali University,Dali 671000,China)
〔Abstract〕This paper pointed out the cause of document search with lower efficiency through OPAC system and analysed the problems of MARC data,and finally put forwards the measures of improving literature search efficiency by library OPAC sys tem.
〔Key words〕library OPAC system;MARC data;literature search efficiency;strategies;access point
OPAC是英文 Online Public Access Catalogue 的縮寫,即聯(lián)機(jī)公共檢索目錄,是供圖書館讀者查詢館藏資源的聯(lián)機(jī)目錄檢索系統(tǒng)?它改變了過去利用卡片目錄手工檢索館藏文獻(xiàn)的狀況,通過計(jì)算機(jī)網(wǎng)絡(luò)對館藏的信息資源進(jìn)行檢索,是現(xiàn)代圖書館檢索信息資源的重要工具?
OPAC作為圖書館計(jì)算機(jī)集成管理系統(tǒng)的核心組成部分,集中體現(xiàn)了圖書館文獻(xiàn)組織的成果?它不但是圖書館開展各項(xiàng)工作的基礎(chǔ)和前提,同時(shí)也是現(xiàn)代圖書館向讀者提供館藏書目查詢最重要的途徑和網(wǎng)絡(luò)服務(wù)項(xiàng)目之一?它的檢索功能是否強(qiáng)大,顯示的內(nèi)容是否全面,很大程度上影響到用戶對圖書館的評價(jià)和館藏資源的利用率和保障率?
但是,讀者通過OPAC進(jìn)行館藏資源查詢時(shí),檢索效果卻常常不盡人意,不是檢索出大量無關(guān)結(jié)果,讓人難以選擇;就是返還結(jié)果為“零”,讓人十分沮喪和失望?造成誤檢?漏檢的結(jié)果有多方面的原因,如集成管理系統(tǒng)本身也存在一定的原因?本文則主要從MARC數(shù)據(jù)制作方面的問題來探討造成誤檢?漏檢的原因,這是導(dǎo)致書目數(shù)據(jù)庫混亂和OPAC系統(tǒng)檢索效率低的最主要原因?
1 MARC數(shù)據(jù)著錄中存在的問題是造成圖書館OPAC檢索效率低的主要原因
圖書館的書目數(shù)據(jù)庫是由無數(shù)條MARC記錄構(gòu)成的,MARC即Machine-Readable Catalogue,機(jī)器可讀目錄,是現(xiàn)代圖書館利用計(jì)算機(jī)組織文獻(xiàn)的手段?如果其數(shù)據(jù)制作中存在問題,將直接造成圖書館目錄體系的混亂和讀者的誤檢和漏檢?以下是目前圖書館MARC數(shù)據(jù)著錄中存在的主要問題?
1.1 MARC格式中重要字段著錄的遺漏
所謂重要字段,主要是指題名?著者與主題詞等這些讀者檢索中最常用的檢索途徑[1],未在MARC格式中相應(yīng)的生成這些檢索點(diǎn)的字段進(jìn)行著錄,結(jié)果是讀者通過OPAC檢索時(shí)查不到這些書,極大地影響了圖書館文獻(xiàn)資源的流通和利用,降低了文獻(xiàn)資源的保障率?
如CNMARC格式中,有的圖書館在遇到并列題名以及其他多種題名(封面題名?書脊題名?叢書題名?原文題名等)時(shí),僅僅只在“200題名責(zé)任”字段做版權(quán)頁的正題名,而沒有在4-5這些能夠生成檢索點(diǎn)字段進(jìn)行相應(yīng)其它題名的著錄或字段的復(fù)制,導(dǎo)致目錄的檢索功能大為降低?例如,“英文原版教材”是一個(gè)重要的檢索詞和檢索途徑,但是在大理學(xué)院的OPAC檢索中,無論用“題名”還是“文獻(xiàn)名”檢索項(xiàng),均不能檢出一本,其實(shí)該館有不少這方面的藏書?漏檢的原因是:“225叢編項(xiàng)”字段是對文獻(xiàn)叢編的客觀性描述,它本身是不可檢索的,其檢索點(diǎn)形式記錄在連接款目410字段和461字段[2]?如果數(shù)據(jù)中遺漏4-字段的著錄,就不能檢出以叢書名為檢索詞的文獻(xiàn)?所以,未進(jìn)行生成檢索點(diǎn)字段的著錄就造成了漏檢?
1.2 MARC格式中字段著錄的混亂和錯(cuò)誤
如翻譯者的字段著錄,有的著錄在“701人名等同”字段,有的著錄在“702人名次要”字段;還有的在著錄生成檢索點(diǎn)的字段701的外國著者時(shí),人名前加上國名,或原文姓名不進(jìn)行倒置等等,都導(dǎo)致目錄匯聚同一責(zé)任者文獻(xiàn)的功能減弱,造成讀者從著者途徑檢索時(shí)查不到某一著者的大量著作?比如,用大理學(xué)院圖書館的OPAC檢索英國著名女作家J.K.羅琳(J.K.Rowling)(《哈利?波特》系列書作者)的著作,在“作者”項(xiàng)進(jìn)行館藏書目的查詢,返還的4個(gè)結(jié)果沒有一個(gè)是《哈利?波特》系列書之一,而是中國人名為“羅琳”主編的書,或是美國的“羅琳斯”的著作;用作者原名“Rowling”檢“中文圖書”,則返還結(jié)果為“零”,其實(shí)該館收藏了不少此作家的《哈利?波特》系列書,用翻譯名“羅琳”檢索不出的原因是因?yàn)樵凇?01人名等同”,這個(gè)生成檢索點(diǎn)的字段,著錄為“(英)羅琳”, 加上了國名;并且因?yàn)闆]有復(fù)制一個(gè)“701人名等同”字段來著錄作家的原名“Rowling”,就造成了以上漏檢的結(jié)果?
1.3 MARC格式中字段指示符使用的不正確
如“200題名責(zé)任”字段的指示符1是題名檢索意義指示符,當(dāng)它取值0時(shí),表明本字段的題名信息(@a)不作檢索點(diǎn),當(dāng)它取值1時(shí),本字段的題名信息(@a)才能作為檢索點(diǎn)?但是在套錄編目時(shí),編目員往往不注意此處的指示符,也會對檢索造成問題?
1.4 多余的MARC數(shù)據(jù)
是指完全相同圖書卻有2條或更多的MARC數(shù)據(jù),如,查大理學(xué)院圖書館的金盤書目檢索系統(tǒng),《鹿苑長春》有3條MARC數(shù)據(jù)記錄,其實(shí)這3條記錄都指向同一本書,索書號也完全相同,都是I712.45/6014;有時(shí),多余的MARC數(shù)據(jù)還存在或分類號的不同,如《藥用高分子材料學(xué)》有2個(gè)號:R94/8727和TQ31/8727;或區(qū)分號的不同,如《現(xiàn)代英語慣用法簡明詞典》:H316/2124和H316/2124/1982?以上這些情況造成了書目數(shù)據(jù)庫的冗余龐大?讀者檢索的噪聲?分類查重工作的障礙以及編目員的無所適從?
此外,MARC格式著錄中還存在其它問題,如錄入文字的錯(cuò)誤?無法調(diào)出的字忽略不著錄且不加任何說明?隨意添加空格以及全角/半角?英語/漢語等不同情況下不加注意的著錄等,都會影響到書目數(shù)據(jù)的規(guī)范和質(zhì)量,造成讀者檢索時(shí)的漏檢和誤檢?為了避免這些問題的出現(xiàn)和找到針對性強(qiáng)的解決策略,有必要對其產(chǎn)生的原因進(jìn)行分析?
2 書目數(shù)據(jù)存在問題的原因分析
2.1 突擊加工,無暇顧及MARC數(shù)據(jù)質(zhì)量
比如說,高校圖書館為了迎評,要達(dá)到評估指標(biāo)對紙質(zhì)圖書的數(shù)量要求,必須在短期內(nèi)購入大量的圖書?在分編任務(wù)繁重的情況下,只能追求分編?套錄工作的速度,趕進(jìn)度的結(jié)果是無暇顧及書目制作的質(zhì)量問題?
2.2 編目規(guī)則的滯后
首先,由于我國圖書著錄標(biāo)準(zhǔn)發(fā)展滯后,致使制作編目數(shù)據(jù)的機(jī)構(gòu)和書商各行其是,這是造成著錄標(biāo)準(zhǔn)不統(tǒng)一?著錄內(nèi)容不規(guī)范的主要原因之一?其次,著錄規(guī)則源于編目實(shí)踐,某些具體規(guī)定只能不斷從編目實(shí)踐中總結(jié)?提升[3]?這樣著錄規(guī)則落后于編目實(shí)際,就導(dǎo)致了數(shù)據(jù)的不一致現(xiàn)象?
2.3 編目規(guī)則的變動和缺乏可操作性
首先,為了適應(yīng)科學(xué)技術(shù)發(fā)展引起的出版物變化,文獻(xiàn)的分編規(guī)則只能不斷的修訂?改動;其次,所有的分編規(guī)則都不可能囊括實(shí)際分編工作中遇到的各種具體現(xiàn)象,并進(jìn)行具體的操作指導(dǎo)?此外,分編規(guī)則本身也不是完美無缺,也存在制定的規(guī)則前后矛盾或不統(tǒng)一等現(xiàn)象?這在某種程度上導(dǎo)致了館藏書目數(shù)據(jù)的混亂?
2.4 分編人員專業(yè)水平的局限和對分編規(guī)則的理解各異 實(shí)際編目中,由于各個(gè)分編人員專業(yè)知識水平高低不同,看問題的角度不同,自然對規(guī)則的理解也各不相同,往往會出現(xiàn)對同一文獻(xiàn)的描述?著錄不一致?
2.5 缺乏專門人員進(jìn)行數(shù)據(jù)維護(hù)
從實(shí)際工作的角度說,由各類人員編制的書目數(shù)據(jù)存在問題是必然的,就是再仔細(xì)?責(zé)任心再強(qiáng)?專業(yè)知識再多的人,也不可能保證制作的數(shù)據(jù)完美無缺;加上回溯建庫?突擊加工?多館合并?規(guī)則變動等種種客觀因素和條件限制,致使書目數(shù)據(jù)庫存在各種問題,而且這些問題只能在投入流通使用之后才逐步顯現(xiàn)出來?如果對出現(xiàn)問題的數(shù)據(jù)缺乏專門人員及時(shí)修正?進(jìn)行維護(hù),那么,越往后書目數(shù)據(jù)庫的混亂現(xiàn)象會更加嚴(yán)重?
2.6 對院系資料室的共享數(shù)據(jù)缺乏指導(dǎo)
高校文獻(xiàn)資源實(shí)行共享后,各系?院資料室所藏文獻(xiàn)的MARC數(shù)據(jù)就納入了圖書館的OPAC檢索系統(tǒng)?因?yàn)檫@部分資源的書目數(shù)據(jù)一般由系?院資料員制作,他們的分編知識自然不能和專業(yè)的圖書館員相比,而圖書館又常常忽略對其進(jìn)行專業(yè)上的指導(dǎo),所以,數(shù)據(jù)出現(xiàn)問題的可能性較大,這也是造成書目數(shù)據(jù)混亂的一個(gè)因素?
3 提高圖書館OPAC檢索效率的策略
提高OPAC檢索效率最根本的方法,是保證每一條新做的MARC數(shù)據(jù)都以較高的質(zhì)量進(jìn)入書目數(shù)據(jù)庫,并且還要對歷史遺留的問題數(shù)據(jù)記錄進(jìn)行修改,理順整個(gè)目錄體系,才能讓讀者通過圖書館的OPAC進(jìn)行高效率的檢索,獲得較高的查全率和查準(zhǔn)率,提高讀者滿意度和館藏資源的利用率?
3.1 分編人員應(yīng)牢固樹立“從讀者檢索的角度”進(jìn)行文獻(xiàn)編目的意識 機(jī)讀目錄與傳統(tǒng)的卡片目錄相比,最大的優(yōu)勢在于通過MARC格式的字段著錄能提供更多的檢索途徑,其強(qiáng)大的檢索功能是卡片目錄遠(yuǎn)不能及的?但是,要發(fā)揮好計(jì)算機(jī)檢索的優(yōu)勢,前提是分編人員必須牢固樹立“從讀者檢索的角度”進(jìn)行文獻(xiàn)編目的意識?站在讀者檢索的角度對文獻(xiàn)進(jìn)行描述要求我們:進(jìn)行文獻(xiàn)編目時(shí)務(wù)必注重生成檢索點(diǎn)字段的著錄;在客觀著錄原則與讀者檢索習(xí)慣沖突時(shí),選擇讀者檢索習(xí)慣用詞作為檢索點(diǎn)入口詞進(jìn)行著錄?
增強(qiáng)書目的檢索功能,為讀者增加更多更有用的檢索點(diǎn),也是近年來盛行于國際編目界的觀點(diǎn),如《FRBR》(《書目記錄的功能需求》)和《the Statement of International Cataloguing Principles》(《國際編目原則聲明》,俗稱法蘭克福原則)等國際編目規(guī)則條例,主張將目錄功能擴(kuò)展到發(fā)現(xiàn)?識別?選擇?獲取和導(dǎo)航[4]?
3.2 制定詳細(xì)的分編規(guī)則
由于分編規(guī)則的滯后?變動?缺乏可操作性以及各館服務(wù)對象?學(xué)科設(shè)置的不同?藏書組織的具體性和分編人員的變動性等原因,制定適用于本館計(jì)算機(jī)軟件的分編細(xì)則很有必要,有助于規(guī)范來源不一?質(zhì)量參差的套錄數(shù)據(jù),保證數(shù)據(jù)制作的質(zhì)量?
3.3 重視分編人員專業(yè)技能的培訓(xùn),提高書目制作質(zhì)量 只有具備較高專業(yè)素質(zhì)的人員才能保證書目制作的質(zhì)量?尤其是面對當(dāng)今日新月異的信息技術(shù)以及國內(nèi)外編目理念的變化,更應(yīng)注重對分編人員進(jìn)行專業(yè)技能的培訓(xùn),這是提高編目數(shù)據(jù)質(zhì)量的重要保證?
3.4 注重收集實(shí)際使用中的錯(cuò)誤數(shù)據(jù),并設(shè)專人進(jìn)行數(shù)據(jù)維護(hù) 由于編目數(shù)據(jù)存在錯(cuò)誤的不可避免以及當(dāng)時(shí)不易發(fā)現(xiàn),只能通過讀者的查詢和圖書館的各項(xiàng)服務(wù)工作來檢驗(yàn)和發(fā)現(xiàn),所以各服務(wù)部門應(yīng)注意收集和記錄平時(shí)使用中的錯(cuò)誤數(shù)據(jù),并且圖書館應(yīng)設(shè)專人進(jìn)行數(shù)據(jù)維護(hù)[5],其職責(zé)是對新入庫的MARC數(shù)據(jù)進(jìn)行審校和對反饋回來的錯(cuò)誤數(shù)據(jù)進(jìn)行修改?此外,此人還負(fù)責(zé)對系?院資料室的文獻(xiàn)分編進(jìn)行指導(dǎo)?這樣有利于達(dá)到優(yōu)化數(shù)據(jù)?理順目錄體系?提高OPAC檢索效果的目的?
3.5做好規(guī)范控制工作
規(guī)范控制(Authority Control),又稱為權(quán)威控制,是為確保標(biāo)目(檢索點(diǎn)的形式)在檢索款目及書目系統(tǒng)中的惟一性和穩(wěn)定性,而建立?維護(hù)?使用規(guī)范款目和規(guī)范文檔的工作過程[6]?這是從根本上提高OPAC檢索效率的手段?我國編目界這方面的工作比較薄弱,一貫重視對文獻(xiàn)進(jìn)行客觀描述,而忽視文獻(xiàn)之間的橫向關(guān)聯(lián),導(dǎo)致存在大量同書異名?同名異書?同人異名?同名異人的情況[7],極為影響檢索的效率和準(zhǔn)確率?我國應(yīng)盡快建立如美國LC[8]那樣供所有圖書館共享的規(guī)范記錄數(shù)據(jù)庫,這將有利于各圖書館做好規(guī)范控制工作?プ苤,我們應(yīng)充分利用計(jì)算機(jī)管理系統(tǒng)的優(yōu)勢,不斷提高M(jìn)ARC數(shù)據(jù)制作的質(zhì)量,盡量完善各個(gè)有價(jià)值的檢索點(diǎn),確保能從每一個(gè)可能的角度和途徑檢索到文獻(xiàn),為讀者提供高效率的OPAC檢索,提高圖書館文獻(xiàn)資源的利用率?
參考文獻(xiàn)
[1]王紹平,湯莉華.OPAC vs搜索引擎——從上海交大看我國高校師生的信息獲取行為[J].大學(xué)圖書情報(bào)學(xué)刊,2008,(2):63-68.
[2]陳立紅.從檢索角度談410字段和461字段的著錄規(guī)則[J].晉圖學(xué)刊,2005,(6):49-51.
[3]文榕生.文獻(xiàn)編目再論[J].中國圖書館學(xué)報(bào),2007,(3):103-106.
[4]胡小菁.“國際編目原則聲明”研究[J].大學(xué)圖書館學(xué)報(bào),2005,(9):57-59.
[5]孫秀娟.現(xiàn)代圖書館的數(shù)據(jù)維護(hù)[J].航海教育研究,2006,(1):107-109.
[6]黃俊貴.規(guī)范控制概說[J].高校圖書館工作,1999,(3):1-8.
[7]馮亞惠.我國圖書館目錄規(guī)范控制的分析研究[J].圖書情報(bào)工作,2007,(8):102-104.