• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      OPAC數(shù)據(jù)在發(fā)現(xiàn)系統(tǒng)部署及維護(hù)的策略

      2015-11-26 08:03:11邱萍周琴
      山東圖書館學(xué)刊 2015年6期
      關(guān)鍵詞:西安交通大學(xué)編目書目

      邱萍周琴

      (西安交通大學(xué)圖書館,陜西西安710049)

      OPAC數(shù)據(jù)在發(fā)現(xiàn)系統(tǒng)部署及維護(hù)的策略

      邱萍周琴

      (西安交通大學(xué)圖書館,陜西西安710049)

      OPAC數(shù)據(jù)在發(fā)現(xiàn)系統(tǒng)成功部署,必須具備優(yōu)良的書目數(shù)據(jù)及準(zhǔn)確的數(shù)據(jù)映射。維護(hù)需根據(jù)記錄類型選擇不同的上載策略,在上載目錄的劃分,記錄唯一識別符及刪除策略的選擇上也要結(jié)合本館的工作方式作出明確的規(guī)定。

      發(fā)現(xiàn)系統(tǒng) OPAC數(shù)據(jù) 數(shù)據(jù)部署

      1 引言

      自PROQUEST公司旗下的Serial solution于2009年7月推出了首款發(fā)現(xiàn)系統(tǒng)Summon[1],這一新的信息發(fā)現(xiàn)工具立即引起了全球圖書館、信息集成商、內(nèi)容提供商的廣泛關(guān)注。繼Summon之后,Exlibris公司的Primo、Ebsco公司的EDS、OCLC的Worldcat Local等發(fā)現(xiàn)系統(tǒng)的產(chǎn)品也相繼出現(xiàn)。在國內(nèi)高校圖書館如清華大學(xué)圖書館、北京大學(xué)圖書館、西安交通大學(xué)圖書館等首批引進(jìn)發(fā)現(xiàn)系統(tǒng)并取得良好效果后,更多國內(nèi)圖書館開始調(diào)研、試用并引進(jìn)發(fā)現(xiàn)系統(tǒng)。

      從某種意義上說,發(fā)現(xiàn)系統(tǒng)是一個學(xué)術(shù)搜索引擎,是擁有海量學(xué)術(shù)信息(包括圖書館引進(jìn)的紙質(zhì)資源、數(shù)據(jù)庫資源、以及網(wǎng)絡(luò)免費(fèi)學(xué)術(shù)資源)的元數(shù)據(jù)倉儲。元數(shù)據(jù)質(zhì)量不僅關(guān)系到發(fā)現(xiàn)內(nèi)容的質(zhì)量,還關(guān)系到針對海量元數(shù)據(jù)倉儲進(jìn)行數(shù)據(jù)挖掘的效果[2]。OPAC數(shù)據(jù),作為圖書館的自生元數(shù)據(jù),是發(fā)現(xiàn)系統(tǒng)元數(shù)據(jù)倉儲中非常重要的部分,其在發(fā)現(xiàn)系統(tǒng)的部署及維護(hù),也是圖書館參與度與可控性最高的部分,因此成為各圖書館發(fā)現(xiàn)系統(tǒng)調(diào)研的關(guān)注點(diǎn)。

      本文以西安交通大學(xué)圖書館的實(shí)踐為例,從數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)映射、數(shù)據(jù)上載等方面,探討OPAC數(shù)據(jù)在發(fā)現(xiàn)系統(tǒng)部署及維護(hù)的策略,以期為同行順利地引進(jìn)與運(yùn)行發(fā)現(xiàn)系統(tǒng)提供一些參考。

      2 發(fā)現(xiàn)系統(tǒng)OPAC數(shù)據(jù)部署的策略

      發(fā)現(xiàn)系統(tǒng)OPAC數(shù)據(jù)部署的目標(biāo)是全面、準(zhǔn)確地將本館OPAC中的書目記錄整合到發(fā)現(xiàn)系統(tǒng)的元數(shù)據(jù)倉儲中,主要包括數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)映射兩項(xiàng)內(nèi)容。

      2.1 數(shù)據(jù)準(zhǔn)備工作

      國內(nèi)高校圖書館管理系統(tǒng)已經(jīng)歷了20多年的發(fā)展歷史,多校合并帶來的書目數(shù)據(jù)整合、回溯建庫、編目外包等都對OPAC數(shù)據(jù)庫的質(zhì)量造成了影響,數(shù)據(jù)冗余以及書目質(zhì)量良莠不齊是普遍存在的問題。為保證發(fā)現(xiàn)的效果,OPAC數(shù)據(jù)在發(fā)現(xiàn)系統(tǒng)資源部署之前,必須改善質(zhì)量。

      高校圖書館的OPAC系統(tǒng)經(jīng)過多年建設(shè),已形成資源類型豐富,記錄數(shù)量龐大的書目體系。以西安交通大學(xué)圖書館為例,截止2011年6月圖書館OPAC數(shù)據(jù)庫的書目總量為86萬余條,其中包含紙本圖書、紙本期刊、光盤、磁帶、學(xué)位論文、電子圖書、電子期刊記錄……等。清除數(shù)據(jù)冗余,改善書目質(zhì)量,是非常繁雜瑣碎的工作。鑒于此,西安交通大學(xué)圖書館制定了分塊、分步的數(shù)據(jù)整理方針。根據(jù)館藏建設(shè)階段,OPAC系統(tǒng)的書目記錄被分為三塊:基本對應(yīng)回溯建庫階段、合校整合階段、新書建設(shè)階段,整理按照規(guī)范類型標(biāo)注,剔除垃圾數(shù)據(jù),修改錯誤記錄3個步驟依次進(jìn)行。

      2.1.1 規(guī)范類型標(biāo)注

      書目記錄的類型標(biāo)注反映書目的文獻(xiàn)類型,是OPAC數(shù)據(jù)在發(fā)現(xiàn)系統(tǒng)中文獻(xiàn)類型的映射源。一個完善的書目系統(tǒng),必須對類型標(biāo)注做明確的規(guī)定,并保證其應(yīng)用的準(zhǔn)確。表1為西安交通大學(xué)圖書館OPAC書目的類型標(biāo)注。

      表1 文獻(xiàn)類型MARC頭標(biāo)對應(yīng)表

      類型標(biāo)注信息出現(xiàn)在書目記錄頭標(biāo)中,對應(yīng)頭標(biāo)區(qū)的書目級別代碼和記錄類型代碼(leader06-07),是在建立書目記錄時生成的。目前圖書館廣泛利用外部數(shù)據(jù)源的書目,不同書目系統(tǒng)的類型標(biāo)注不禁相同,若不加修改的直接利用,將造成OPAC系統(tǒng)中類型標(biāo)注體系的混亂。由于類型標(biāo)注是不易識別的代碼形式,很容易在編目及維護(hù)過程中被忽視,因此OPAC書目系統(tǒng)中類型標(biāo)注的錯誤比較普遍。例如:CALIS規(guī)定書目級別s=連續(xù)出版物,包括現(xiàn)刊……專著叢編等[3],而西安交通大學(xué)圖書館編目細(xì)則規(guī)定專著叢編按照專著單獨(dú)著錄,因此從CALIS套中的專著叢編必須把類型標(biāo)注leader06-07由as改為am,否則將與期刊混淆不清。再如:從OhioLINK(The Ohio Library and Information Network,俄亥俄圖書館與信息網(wǎng)絡(luò))套中的電子圖書leader06-07=am,而本館規(guī)定leader06-07=an,因此進(jìn)入本館系統(tǒng)也需要修改。

      需要指出的是,類型標(biāo)注不僅反映文獻(xiàn)類型,也是書目記錄完整性與準(zhǔn)確性的考量依據(jù),它為進(jìn)一步的書目整理提供依據(jù)。

      2.1.2 剔除垃圾數(shù)據(jù)

      OPAC數(shù)據(jù)庫冗余數(shù)據(jù)的產(chǎn)生有多種原因。在回溯建庫及多校合并階段主要的原因有:卡片目錄及圖書的信息缺失,錄入的錯誤、合并書目不完全……等,造成的結(jié)果是重復(fù)書目記錄、孤單書目記錄……等。而新書建設(shè)階段由于工作方法的問題,也會產(chǎn)生冗余數(shù)據(jù),例如:西安交通大學(xué)圖書館訂購記錄遴選工作在OPAC系統(tǒng)內(nèi)進(jìn)行,未選中書目應(yīng)及時刪除,但實(shí)際操作中,刪除工作經(jīng)常被遺忘,未選中書目長期滯留,給OPAC數(shù)據(jù)庫造成了嚴(yán)重的冗余。

      無關(guān)聯(lián)記錄的孤單書目記錄,在確定不屬于本館館藏外必須予以剔除。西安交通大學(xué)圖書館OPAC系統(tǒng)各類型記錄(書目記錄、訂購記錄、記到記錄、館藏記錄……)具有關(guān)聯(lián)性,如:圖書書目記錄的關(guān)聯(lián)記錄有館藏記錄和訂購記錄,期刊書目記錄的關(guān)聯(lián)記錄有記到記錄和館藏記錄。因此垃圾數(shù)據(jù)的確定可通過文獻(xiàn)類型結(jié)合記錄關(guān)聯(lián)性來實(shí)現(xiàn)。圖1為垃圾圖書記錄的確定條件,同法可以確定期刊、學(xué)位論文……等類型文獻(xiàn)的垃圾數(shù)據(jù),進(jìn)而剔除冗余。重復(fù)書目記錄的情況由于數(shù)量少且難于發(fā)現(xiàn),不作為數(shù)據(jù)準(zhǔn)備的重點(diǎn)。

      圖1 OPAC垃圾圖書書目的確定條件

      2.1.3 修改錯誤記錄

      OPAC數(shù)據(jù)庫在新書建設(shè)階段,編目規(guī)范化程度較高,編目員普遍接受過權(quán)威編目機(jī)構(gòu)(CALIS、中國國家圖書館等)的培訓(xùn),實(shí)際工作有《CALIS聯(lián)機(jī)合作編目手冊》及《中國機(jī)讀目錄格式使用手冊》等工具書做指導(dǎo),書目質(zhì)量得到根本保證,但回溯階段及多校合并階段的書目數(shù)據(jù)則質(zhì)量不佳,字段使用的錯誤及著錄的錯誤較多。

      MARC格式作為標(biāo)準(zhǔn)的機(jī)讀目錄格式,具有結(jié)構(gòu)嚴(yán)謹(jǐn)、字段豐富的特點(diǎn),MARC記錄的錯誤也是復(fù)雜多樣的,因此對OPAC數(shù)據(jù)進(jìn)行徹底的修改難度很大。發(fā)現(xiàn)系統(tǒng)類似搜索引擎,為用戶提供學(xué)術(shù)資源檢索,并可按時間、類型、主題、學(xué)科、作者……等維度對檢索結(jié)果進(jìn)行聚類顯示,對于元數(shù)據(jù)中檢索字段及索引字段的要求相對更高。因此修改錯誤記錄主要應(yīng)針對檢索及索引字段,包括題名、責(zé)任者、ISBN,出版發(fā)行等字段。修改采用批量方式,針對普遍問題,包括易錯字段,如210$c;及對著錄內(nèi)容有明確規(guī)定的字段,如010$a、210$d;以及錯字符、亂字符等問題。

      西安交通大學(xué)圖書館數(shù)據(jù)準(zhǔn)備耗時6個月,共刪除垃圾數(shù)據(jù)6萬余條,修改記錄10余萬條。為OPAC數(shù)據(jù)在發(fā)現(xiàn)系統(tǒng)的部署打下了良好的數(shù)據(jù)基礎(chǔ)。

      2.2 數(shù)據(jù)映射工作

      OPAC數(shù)據(jù)必須通過映射轉(zhuǎn)換成發(fā)現(xiàn)系統(tǒng)的數(shù)據(jù)字段,映射的精準(zhǔn)直接影響發(fā)現(xiàn)的效果。

      為簡化數(shù)據(jù)映射工作,發(fā)現(xiàn)系統(tǒng)平臺商會為圖書館提供基礎(chǔ)映射表,其中包含Introduction,Content Type Mapping(文獻(xiàn)類型映射),MARC Mapping (MARC映射),Location List(館藏地)等表單,Content type mapping針對的是文獻(xiàn)類型的映射,主要對應(yīng)MARC記錄頭標(biāo)區(qū),如圖(2)。MARC Mapping (MARC映射)是針對MARC格式字段的映射,基本對應(yīng)MARC記錄數(shù)據(jù)區(qū),如圖(3)。

      圖2 Content Type Mapping

      圖3 MARC Mapping

      基礎(chǔ)映射表單含蓋了發(fā)現(xiàn)系統(tǒng)全部數(shù)據(jù)字段與OPAC數(shù)據(jù)的映射關(guān)系,為圖書館OPAC數(shù)據(jù)在發(fā)現(xiàn)系統(tǒng)的映射提供了便利。需要指出的是,鑒于各館對MARC格式字段使用的個性化規(guī)定,基礎(chǔ)映射表必須經(jīng)過逐項(xiàng)分析、調(diào)整、映射測試后才能正式利用,否則可能出現(xiàn)映射錯誤或丟失數(shù)據(jù)的情況。西安交通大學(xué)圖書館在利用基礎(chǔ)映射表做測試的過程中,曾出現(xiàn)主要責(zé)任者項(xiàng)映射丟失的情況,原因在于本館編目細(xì)則規(guī)定使用CNMARC的700 $a子字段著錄主要責(zé)任者,而映射表中主要責(zé)任者對映的卻是701$a子字段,由于錯誤的映射關(guān)系,主要責(zé)任者未能映射成功。

      3 發(fā)現(xiàn)系統(tǒng)OPAC數(shù)據(jù)維護(hù)的策略

      發(fā)現(xiàn)系統(tǒng)與OPAC的數(shù)據(jù)整合并不是一勞永逸的。部署完成后,圖書館還須制定持續(xù)維護(hù)的政策保證發(fā)現(xiàn)系統(tǒng)與OPAC數(shù)據(jù)的同步,維護(hù)針對的是新增、刪除、更新的記錄,圖書館應(yīng)按需設(shè)置上載目錄,確定書目唯一識別符及刪除策略,并根據(jù)記錄類型制定上載策略。

      3.1 按需設(shè)置上載目錄

      將OPAC系統(tǒng)中的哪些數(shù)據(jù)整合到發(fā)現(xiàn)系統(tǒng),各圖書館有不同的考量。清華大學(xué)將中西文紙本資源,多媒體光盤、電子期刊、電子圖書、學(xué)位論文等數(shù)據(jù)配置到發(fā)現(xiàn)系統(tǒng)中[4]。而華中科技大學(xué)圖書館、北京工商大學(xué)圖書館等只將傳統(tǒng)文獻(xiàn)資源數(shù)據(jù)整合到發(fā)現(xiàn)系統(tǒng)。

      鑒于國內(nèi)圖書館普遍采用2種MARC格式編制中外文文獻(xiàn)書目,發(fā)現(xiàn)系統(tǒng)平臺商會提供2個基礎(chǔ)上載目錄,分別對應(yīng)CNMARC及USMARC格式的記錄。對于提交多類型文獻(xiàn)記錄的圖書館,僅有2個基礎(chǔ)目錄將會導(dǎo)致大而全的映射,容易造成邏輯的混亂從而影響映射效果,同時也不利于圖書館監(jiān)視OPAC數(shù)據(jù)在發(fā)現(xiàn)系統(tǒng)的整合結(jié)果。基于以上考慮,建議提交多類型文獻(xiàn)的圖書館,按需求設(shè)置上載目錄的個數(shù)。如西安交通大學(xué)圖書館規(guī)定將OPAC中的傳統(tǒng)文獻(xiàn)(中西文紙本書刊,磁帶、光盤等)、電子期刊、電子圖書、學(xué)位論文數(shù)據(jù)整合到發(fā)現(xiàn)系統(tǒng),因此設(shè)置了5個上載目錄,分別對應(yīng)CNMARC傳統(tǒng)文獻(xiàn)、USMARC傳統(tǒng)文獻(xiàn),電子期刊、電子書、學(xué)位論文數(shù)據(jù)。

      3.2 書目唯一識別符的確定及刪除策略的選擇

      唯一識別符(Unique identifier)的作用是匹配維護(hù)記錄以及指引發(fā)現(xiàn)系統(tǒng)創(chuàng)建超鏈接到達(dá)OPAC相關(guān)記錄。書目中具有唯一性的字段,如索書號,控制號,書目記錄號等都可作為唯一識別符。但索書號、控制號是人為生成的字段,容易在編目過程中被錯誤更改,導(dǎo)致失敗或錯誤的匹配。而書目記錄號是系統(tǒng)生成的,穩(wěn)定性高,因此建議選擇書目記錄號作為唯一識別符。

      為保證數(shù)據(jù)同步,OPAC系統(tǒng)中的刪除記錄也需同時在發(fā)現(xiàn)系統(tǒng)中刪除。刪除記錄的上載有幾種策略,策略一:在書目記錄中標(biāo)記刪除信息[如將記錄頭標(biāo)的記錄狀態(tài)符改為d(被刪除的記錄)],作為更新記錄統(tǒng)一上載update目錄中。策略二:刪除記錄單獨(dú)形成文件,上載delete目錄,記錄會從發(fā)現(xiàn)系統(tǒng)刪除并不會檢查標(biāo)識字段的意義。策略三:只輸出刪除記錄的唯一標(biāo)示符,形成.txt,.keys,或.xm文件。

      刪除策略如何選擇應(yīng)根據(jù)OPAC系統(tǒng)處理刪除記錄的方式而定。如圖書館編目管理要求:刪除記錄必須先標(biāo)記為刪除狀態(tài),再由專人刪除,則可選取策略一,同時需要保證上載發(fā)現(xiàn)系統(tǒng)先于OPAC刪除。選擇策略二的前提是,圖書館批量備份全部刪除記錄,該策略也適用采用批量方法更新維護(hù)的電子資源書目記錄。如果圖書館管理系統(tǒng)能夠提供批量刪除書目記錄報表,策略三也將是很好的選擇。

      3.3 不同類型的數(shù)據(jù)制定不同的上載策略

      OPAC中不同類型文獻(xiàn)的書目記錄,編制周期及維護(hù)方式具有差異。因此在發(fā)現(xiàn)系統(tǒng)中維護(hù)方式也不應(yīng)一概而論,而需要綜合考慮數(shù)據(jù)的同步性以及維護(hù)的必要性。

      西安交通大學(xué)圖書館,根據(jù)書目編制周期及維護(hù)方式的不同,將需上載的書目記錄分為3大類:傳統(tǒng)文獻(xiàn)書目、電子資源書目、特色館藏書目,并對其制定了不同的上載策略(見表2)。傳統(tǒng)文獻(xiàn)包括中、西、日、俄不同語種的圖書、期刊、資料等。傳統(tǒng)文獻(xiàn)在OPAC系統(tǒng)中采用持續(xù)編目、持續(xù)維護(hù)的方式,具有記錄穩(wěn)定,更新速度快,數(shù)量龐大的特點(diǎn),因此上載采用定期批量策略,每周抓取上載一次。OPAC中電子資源的編目及維護(hù)根據(jù)數(shù)據(jù)庫的引進(jìn)和更新不定期進(jìn)行,因此電子資源記錄的抓取上載應(yīng)按照維護(hù)頻次不定期進(jìn)行。學(xué)位論文的編目是當(dāng)年完成上一年度論文的編目,因此抓取和上載應(yīng)以年為單位。若圖書館管理系統(tǒng)的開放性較好,發(fā)現(xiàn)系統(tǒng)也可通過API接口實(shí)現(xiàn)OPAC更新數(shù)據(jù)的自動抓取上載,這樣更加有利于發(fā)現(xiàn)系統(tǒng)與OPAC系統(tǒng)的數(shù)據(jù)同步。

      表2 各類型書目的提交策略

      4 結(jié)語

      在發(fā)現(xiàn)系統(tǒng)元數(shù)據(jù)倉儲的建設(shè)中,OPAC數(shù)據(jù)的部署及維護(hù)是圖書館參與度最高,可控性最強(qiáng)的工作。因此圖書館要認(rèn)真制定OPAC數(shù)據(jù)在發(fā)現(xiàn)系統(tǒng)部署及維護(hù)的政策。部署中要做好數(shù)據(jù)準(zhǔn)備工作,確保元數(shù)據(jù)的質(zhì)量,同時逐項(xiàng)審視并修訂OPAC數(shù)據(jù)與發(fā)現(xiàn)系統(tǒng)元數(shù)據(jù)的映射關(guān)系,保證映射的準(zhǔn)確。維護(hù)過程則要結(jié)合本館實(shí)際,制定不同資源的上載策略,確定書目唯一識別符及書目刪除的策略,同時盡量簡化映射層次,保證映射的效果。

      〔1〕The Summon Service[EB/OL].[2013-05-03].http://www.proquest.com/products-services/The-Summon-Service.html

      〔2〕竇天芳,姜愛蓉.資源發(fā)現(xiàn)系統(tǒng)功能分析及應(yīng)用前景[J].圖書情報工作,2012(7):38-43

      〔3〕謝琴芳.CALIS聯(lián)機(jī)合作編目手冊(上)[M].北京:北京大學(xué)出版社,2000:67

      〔4〕竇天芳,等.清華大學(xué)學(xué)術(shù)資源發(fā)現(xiàn)平臺的建設(shè)及思考—以“水木搜索”為例[J].圖書館雜志,2013(12):71-75

      Strategies of Deploying and Maintaining OPAC Data in Discovery System

      Qing Ping Zhou Qin

      Excellent bibliographic data and accurate data mapping are the premise that OPAC data can be successfully deployed into Discovery System.Data maintenance needs to choose different upload strategies depending on data record types.Upload directory partition,unique identifier recording and deletion strategy selection should be clearly defined in conjunction with library’s work.

      Discovery system;OPAC data;Data deployment

      G254.3

      A

      邱萍(1974~),女,碩士,副研究館員,西安交通大學(xué)采編部副主任,目前從事電子資源整合工作,發(fā)表論文數(shù)篇。周琴(1970~),女,碩士,副研究館員,西安交通大學(xué)信息咨詢部副主任。

      猜你喜歡
      西安交通大學(xué)編目書目
      推薦書目《初春之城》
      都市人(2022年3期)2022-04-27 00:44:57
      《西安交通大學(xué)(社會科學(xué)版)》青年編委招募
      《西安交通大學(xué)(社會科學(xué)版)》再獲“最受歡迎期刊”
      西安交通大學(xué)馬克思主義學(xué)院簡介
      國家圖書館藏四種古籍編目志疑
      天一閣文叢(2020年0期)2020-11-05 08:28:36
      粵劇編目整理之回顧與展望
      戲曲研究(2017年3期)2018-01-23 02:51:01
      échanges humains dans le contexte de la mondialisation
      圖書館編目業(yè)務(wù)外包發(fā)展探討
      河南科技(2014年22期)2014-02-27 14:18:37
      本刊郵購書目
      圖書在版編目(CIP)數(shù)據(jù)
      全國新書目(2009年8期)2009-05-22 11:31:16
      长春市| 金寨县| 永德县| 西乡县| 平阳县| 云南省| 鲁甸县| 哈密市| 古丈县| 秦安县| 田阳县| 安陆市| 策勒县| 新巴尔虎左旗| 长乐市| 漳平市| 龙江县| 蓝山县| 苍南县| 成都市| 普洱| 武清区| 宣城市| 山东| 长子县| 姚安县| 资中县| 乐都县| 新平| 兴安县| 德江县| 黑山县| 建瓯市| 武清区| 聂拉木县| 上思县| 文成县| 张家界市| 宁远县| 城市| 谷城县|