• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      MarcEdit在MARC數(shù)據(jù)庫質(zhì)量管理中的應用

      2010-05-03 08:50:34姚曉鋒嘉興學院圖書館浙江嘉興314001
      圖書館建設(shè) 2010年1期
      關(guān)鍵詞:批處理字段批量

      姚曉鋒 (嘉興學院圖書館 浙江 嘉興 314001)

      隨著圖書館自動化水平的不斷提升,圖書館的在線服務(wù)功能也在不斷增加,越來越多的讀者選擇利用圖書館的網(wǎng)站來滿足自己的信息需求。然而,不管這個過程達到了何種程度的飛躍,圖書館基礎(chǔ)服務(wù)和在線服務(wù)的柱石依然是自身的MARC數(shù)據(jù)庫。MARC數(shù)據(jù)庫質(zhì)量的優(yōu)劣直接影響到讀者的檢索使用效率和數(shù)據(jù)資源共享的實現(xiàn)。因此,MARC數(shù)據(jù)庫質(zhì)量管理是圖書館工作的一個重點。

      隨著自動化建設(shè)、讀者需求和資源共享等形勢的不斷變化,原有的書目記錄已經(jīng)不適應于當前的需要,如描述過于簡單、著錄不規(guī)范、標引錯誤等,這就涉及到書目質(zhì)量的管理問題。這些缺陷如果得不到及時解決,將會嚴重影響到讀者的檢索和資源的共享。這樣一來,工作人員就必須面對大批量的MARC數(shù)據(jù)修改任務(wù)。雖然國內(nèi)有些圖書館自動化系統(tǒng)已經(jīng)集成了某些批處理的功能,如北京清大新洋信息技術(shù)有限公司的圖書館管理軟件“通用圖書館集成系統(tǒng)”(General Library Integrated System,簡稱GLIS),能夠?qū)崿F(xiàn)一些批量修改的任務(wù),但由于其功能不是很完善(只提供字段的添加、刪除和內(nèi)容的替換)[1],很多批量修改任務(wù)無法完成。有幸的是,一個新型的MARC數(shù)據(jù)編輯工具——MarcEdit已被開發(fā)出來,它可以讓工作人員簡單快捷地完成批量修改的任務(wù)。本文主要探討如何利用MarcEdit工具完成MARC數(shù)據(jù)的批量修改任務(wù),以有效地對MARC數(shù)據(jù)庫進行質(zhì)量管理。

      1 MarcEdit的背景

      MarcEdit最初的構(gòu)思主要是針對美國俄勒岡州立大學圖書館的電子目錄數(shù)據(jù)庫清理項目。這個項目的主要問題在于系統(tǒng)中有太多需要清除的無效記錄。而面對數(shù)量如此龐大的清理任務(wù),美國國會圖書館(Library of Congress,簡稱LC)現(xiàn)有的MARCBreakr或者MARCMakr工具顯然已經(jīng)無法勝任,必須要有一個功能更強大的工具。為此,美國著名編目人員Terry Reese(俄勒岡州立大學圖書館網(wǎng)絡(luò)和數(shù)字資源編目負責人)帶領(lǐng)著他的團隊,在MARCBreakr和MARCMakr的基礎(chǔ)上開發(fā)了一個新型的MARC數(shù)據(jù)編輯工具——MarcEdit,從而非常輕松地完成了數(shù)量龐大的清理任務(wù)[2]。

      MarcEdit自問世以來,因其便捷的操作和強大的批處理功能在國外圖書館界受到了相當多的關(guān)注,許多圖書館已經(jīng)開始將MarcEdit納入其自動化系統(tǒng)。俄勒岡州立大學圖書館首先運用MarcEdit完成了電子目錄數(shù)據(jù)庫的清理任務(wù)。隨后,賓州州立大學圖書館也采用了MarcEdit,從而加快了電子和縮微資源MARC數(shù)據(jù)庫的建設(shè)任務(wù)[3];密歇根州立大學圖書館也相繼采用了MarcEdit,解決了批下載MARC數(shù)據(jù)時因編碼錯誤而無法繼續(xù)操作的問題[4]129-131等。MarcEdit能在短時間內(nèi)被圖書館界所接受并采用,足以證明它在批處理方面的功能是極為強大的。

      2 MarcEdit的批處理功能

      MarcEdit是一款功能強大的MARC數(shù)據(jù)編輯工具,專門為批量編輯MARC記錄而研制,適用于各種MARC格式,具有編輯數(shù)量大、編輯功能多的特點。其批處理的主要功能有數(shù)據(jù)有效性統(tǒng)計、字段核對、內(nèi)容替換、字段和子字段編輯、指示符編輯、字段交換等。

      2.1 數(shù)據(jù)有效性統(tǒng)計——MARCValidator

      數(shù)據(jù)有效性統(tǒng)計是一個比較特別的功能,它主要用于驗證MARC數(shù)據(jù)是否有效。用戶可以自己制定有效數(shù)據(jù)的規(guī)則,比如哪些字段是必備的,哪些字段是不需要的,哪些字段是可以重復的,哪些字段是不可以重復的,哪些子字段是必備的,相應的指示符是什么,哪些子字段是不需要的,等等,然后將數(shù)據(jù)庫中的MARC數(shù)據(jù)與此規(guī)則進行核對。通過這個功能,用戶可以詳細地了解MARC數(shù)據(jù)庫的質(zhì)量情況,并根據(jù)實際需要進行批量修改。

      2.2 字段核對——RobertCompare

      字段核對是另一個比較特別的功能,主要用于核對MARC數(shù)據(jù)中的某些字段。用戶只需制定出某個字段的標準格式,然后在書目數(shù)據(jù)庫中進行核對即可。通過這個功能,用戶可以充分了解MARC數(shù)據(jù)庫中的款目標引情況,并制定出一個標準形式對款目標引進行批量修改。比如可以將“James David Kiley”、“James D. K.”、“James D. Kiley”、“James David K.”這些混亂的個人名稱標引統(tǒng)一成“James David Kiley”的形式,這樣就避免了名稱標引的混亂。

      2.3 內(nèi)容替換——Replace

      內(nèi)容替換功能可以對MARC記錄中任何位置的數(shù)據(jù)內(nèi)容進行批量替換。用戶只要簡單地輸入替換和被替換的文字,點擊“替換”就可以輕松地完成批量替換任務(wù)。此功能可以修改MARC數(shù)據(jù)中一些常見的文字錄入錯誤,但是由于替換面太廣,替換時必須考慮周到,以免將一些原本無需修改的內(nèi)容也同時替換掉。

      2.4 字段和子字段編輯——Edit Fields/Edit Subfields

      字段和子字段編輯功能允許對MARC記錄中的字段進行批量的添加或刪除,也允許對子字段進行批量的添加或刪除,同時還允許批量替換子字段中的相關(guān)內(nèi)容。

      2.4.1 批量添加字段、子字段

      通過批量添加字段、子字段,可以完善MARC數(shù)據(jù)庫中的簡編數(shù)據(jù),使它更完整、更精確。比如可以在856字段中批量添加嘉興學院圖書館的統(tǒng)一資源定位地址(見圖1)。

      2.4.2 批量刪除字段、子字段

      通過批量刪除字段、子字段,可以清除MARC數(shù)據(jù)中一些冗余的內(nèi)容,讓MARC數(shù)據(jù)顯得簡明。比如將本單位不需要的杜威十進分類號刪除,以免過多的分類號讓讀者感到困惑。

      2.4.3 批量替換子字段內(nèi)容

      通過批量替換子字段內(nèi)容同樣可以修正文字錄入錯誤,而且修改面相對比較窄,替換的結(jié)果將更加精確,能減少錯誤替換的發(fā)生率。比如將300字段的$c中的所有“CM”全部替換成“cm”(見圖2)。

      2.5 指示符編輯——Edit Indicators

      指示符編輯功能允許對指示符進行批量修改,不僅允許用戶批量修改某子字段的指示符,還允許用戶對某指定內(nèi)容的子字段指示符進行批量修改。比如以“An”打頭的題名,排檔時應將這個詞排除在外。如果因為一時疏忽而沒有當時準確定義指示符的話,可以對這些指示符進行批量修改(見圖3)。

      2.6 字段交換——Swap Fields

      字段交換功能允許將某個字段的內(nèi)容移動到另一個字段,實現(xiàn)字段內(nèi)容的批量交換。利用這個功能可以修正字段著錄不規(guī)范的問題,比如西文多卷書著錄時,如果分卷題名有檢索意義的話,則不能著錄在500字段,而應當著錄在505字段。如果已經(jīng)著錄在500字段,那么可以將此字段$a子字段的內(nèi)容移動到505字段$g子字段,并將第二指示符定義成增強級(見圖4)。

      除此以外,MarcEdit還有一些其他的功能,比如元數(shù)據(jù)的自動獲取、元數(shù)據(jù)格式和MARC格式的相互轉(zhuǎn)換[4]121-127等功能。這些功能對圖書館的在線服務(wù)而言,無疑也具有非常重大的意義。特別是將一些描述電子資源的元數(shù)據(jù)轉(zhuǎn)換成MARC數(shù)據(jù)后,同樣支持批量修改操作,以完善和修正元數(shù)據(jù)對數(shù)據(jù)的內(nèi)容描述,這對于MARC數(shù)據(jù)庫建設(shè)而言也是十分重要的。

      3 MarcEdit應用實例

      3.1 MARC數(shù)據(jù)庫的垃圾清理

      嘉興學院圖書館在清理MARC數(shù)據(jù)庫時發(fā)現(xiàn),數(shù)據(jù)庫中竟然有超過1萬條的垃圾記錄需要清理。面對如此龐大的清理任務(wù),工作人員用逐條清理的方式在短期內(nèi)顯然無法完成。為了盡快完成MARC數(shù)據(jù)庫的清理任務(wù),工作人員采用了MarcEdit批處理工具,運用其數(shù)據(jù)有效性統(tǒng)計功能模塊——MARCValidator,按照自己制定的有效數(shù)據(jù)規(guī)則,將數(shù)據(jù)庫中所有的垃圾數(shù)據(jù)導出并將它們刪除,僅花了幾個小時的時間,就完成了數(shù)量如此龐大的清理任務(wù)。

      3.2 MARC數(shù)據(jù)庫的修改完善

      嘉興學院圖書館曾幾經(jīng)合并(由浙江經(jīng)濟高等??茖W校圖書館、金庸圖書館、浙江會計學校圖書館、嘉興衛(wèi)生學校圖書館等合并而成),由于原來各個圖書館的編目規(guī)則不一致,導致MARC數(shù)據(jù)庫中的書目數(shù)據(jù)相當混亂,亟需修改完善。據(jù)MarcEdit的有效性統(tǒng)計發(fā)現(xiàn),庫中竟有35 000多條記錄需要修改。在以往,如此巨大的數(shù)據(jù)修改任務(wù)對工作人員而言簡直是一種災難。通過利用MarcEdit強大的批處理功能,工作人員不到一個星期就輕松快捷地完成了修改任務(wù),從而也有了充足的時間去驗證這些已修正過的錯誤數(shù)據(jù)。

      3.3 建設(shè)電子資源MARC數(shù)據(jù)庫

      嘉興學院圖書館的工作人員在建設(shè)電子資源MARC數(shù)據(jù)庫時發(fā)現(xiàn),下載的MARC數(shù)據(jù)在導入數(shù)據(jù)庫前大部分都需要修改,如從聯(lián)機計算機圖書館中心的WorldCat上下載的數(shù)據(jù)都沒有949字段,但是自動化系統(tǒng)卻要求必須具備此字段,還有像排字錯誤、某些字段內(nèi)容必須移動到另外一些字段、指示符的修改等,問題非常多。使用MarcEdit工具后,工作人員輕松地完成了全部MARC數(shù)據(jù)的修改工作,成功地將WorldCat上的MARC數(shù)據(jù)導入到本地的自動化系統(tǒng),加快了電子資源MARC數(shù)據(jù)庫建設(shè)的進程。

      4 結(jié) 語

      當然,任何一種工具都不可能是完美的,MarcEdit也不例外,比如MARC數(shù)據(jù)的導入導出就比較麻煩。針對這個問題,如果能將MarcEdit嵌入圖書館的自動化系統(tǒng)中,那么MARC數(shù)據(jù)庫的質(zhì)量管理就會變得更加簡單快捷。例如,為圖書館提供Koha[Koha是新西蘭Horowhenua Library Trust(一個社團組織)開發(fā)的整合性圖書館自動化系統(tǒng)]服務(wù)的美國LibLime公司就曾經(jīng)應圖書館的要求提出了13項最迫切的構(gòu)想,其中一項就是將MarcEdit整合入Koha[5]。相信隨著信息技術(shù)和圖書館自動化管理手段的進一步發(fā)展,一系列新型的功能更強大的工具將會被不斷地開發(fā)出來,人們對MARC數(shù)據(jù)庫的管理手段也會不斷加強和提升。

      [1]劉泳潔.提高機讀目錄數(shù)據(jù)庫質(zhì)量的有效途徑[J].圖書館工作與研究,2005(5):47-49.

      [2]Reese T. MarcEdit——Your Complete Free MARC Editing Utility[EB/OL].(2009-04-16)[2009-05-20].http://oregonstate.edu/~reeset/marcedit/html/about.html.

      [3]Mugridge R L, Edmunds J. Using Batchloading to Improve Access to Electronic and Microform Collections[J].Library Resources &Technical Services,2009(1):53-61.

      [4]Reese T. Automated Metadata Harvesting: Low-Barrier MARC Record Generation from OAI-PMH Repository Stores Using MarcEdit[J].Library Resources & Technical Services,2009(2).

      [5]毛慶禎.Koha在臺灣的應用——GPL授權(quán)的整合性圖書館系統(tǒng)[EB/OL].(2007-10-24) [2009-05-28].http://blue.lins.fju.edu.tw/~mao/works/20071024.htm.

      猜你喜歡
      批處理字段批量
      圖書館中文圖書編目外包數(shù)據(jù)質(zhì)量控制分析
      批量提交在配置分發(fā)中的應用
      科學家(2021年24期)2021-04-25 12:55:27
      淺議高校網(wǎng)銀批量代發(fā)
      CNMARC304字段和314字段責任附注方式解析
      無正題名文獻著錄方法評述
      基于PSD-BPA的暫態(tài)穩(wěn)定控制批處理計算方法的實現(xiàn)
      基于AUTOIT3和VBA的POWERPOINT操作題自動批量批改
      考慮價差和再制造率的制造/再制造混合系統(tǒng)生產(chǎn)批量研究
      關(guān)于CNMARC的3--字段改革的必要性與可行性研究
      批處理天地.文件分類超輕松
      体育| 延安市| 朝阳市| 侯马市| 大理市| 永定县| 鄂伦春自治旗| 凭祥市| 怀集县| 黄冈市| 睢宁县| 普定县| 肇东市| 青州市| 张掖市| 博兴县| 阳泉市| 郯城县| 马鞍山市| 临夏市| 孟连| 呼图壁县| 扶余县| 洪泽县| 东阳市| 阿图什市| 开化县| 改则县| 岢岚县| 娱乐| 卢湾区| 驻马店市| 南郑县| 灌云县| 泸定县| 衡山县| 余江县| 潜山县| 廉江市| 闽侯县| 徐汇区|