• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于TPI的特色數(shù)據(jù)庫建設(shè)探索——以民國文獻(xiàn)數(shù)據(jù)庫為例

      2012-02-15 13:39:34
      圖書館學(xué)刊 2012年8期
      關(guān)鍵詞:文獻(xiàn)數(shù)據(jù)庫標(biāo)引民國

      (遼寧省圖書館,遼寧 沈陽 110015)

      郭 男,1981年生。本科學(xué)歷,館員。

      民國元年(1911年)至民國38年(1949年)是從清王朝到中華人民共和國成立之間的一個歷史時期,它經(jīng)歷了辛亥革命、五四運(yùn)動、北伐戰(zhàn)爭、抗日戰(zhàn)爭和解放戰(zhàn)爭,是中國社會發(fā)生深刻變革的歷史時期,圖書報刊等文獻(xiàn)資料作為重要的傳播手段,在這一變革中發(fā)揮了重要作用。民國文獻(xiàn)即指1911年辛亥革命到1949年9月期間我國出版發(fā)行的中文文獻(xiàn)。這些文獻(xiàn)從不同側(cè)面反映了民國時期的政治軍事、社會經(jīng)濟(jì)、教育科學(xué)、歷史文化、文學(xué)藝術(shù)等多方面的內(nèi)容,既具有重要的史料價值,也具有很高的研究利用價值。

      1 建設(shè)民國文獻(xiàn)數(shù)據(jù)庫的意義

      1.1 保護(hù)珍貴文獻(xiàn)的需要

      民國文獻(xiàn)的年代雖距今并不久遠(yuǎn),但卻是館藏所有文獻(xiàn)中很不易保存、損壞情況非常嚴(yán)重的。由于當(dāng)時機(jī)械造紙工藝落后,造紙材料混雜,使用酸性化學(xué)漿紙,使得紙張的酸性強(qiáng)、質(zhì)量差、保存期短。據(jù)2004年國家圖書館完成的“館藏紙質(zhì)文獻(xiàn)酸性和保存現(xiàn)狀的調(diào)查與分析”課題顯示,國家圖書館收藏的民國文獻(xiàn)老化、損毀現(xiàn)象相當(dāng)嚴(yán)重,這些紙張的酸堿度平均值低于4.5。遼寧省圖書館也同樣存在這一情況,民國圖書普遍紙張發(fā)黃發(fā)脆掉渣,讀者每翻閱一次都加大了其損壞的程度。據(jù)國內(nèi)一些專家研究,民國時期普通報紙的保存壽命一般為50至100年,民國時期圖書的保存壽命為100至200年,也就說,現(xiàn)存的民國文獻(xiàn)大都已經(jīng)達(dá)到或接近保存壽命,如果任由其發(fā)展下去,收藏于館內(nèi)的民國文獻(xiàn)很有可能在50年至100年間消失殆盡。如何有效保護(hù)民國文獻(xiàn),延長其存世壽命,同時又能方便讀者使用,解決保存與利用的矛盾,這是所有收藏有民國文獻(xiàn)的圖書館所面臨的一個重大問題。而對民國文獻(xiàn)進(jìn)行數(shù)字化處理,建立民國文獻(xiàn)全文圖片數(shù)據(jù)庫,是一個最佳選擇。所有民國文獻(xiàn)進(jìn)行數(shù)字化加工后,讀者可上網(wǎng)瀏覽,而不必翻閱原件,原件可以在適合的環(huán)境中保存,這樣就能使民國文獻(xiàn)得到有效的保護(hù)。

      1.2 民國文獻(xiàn)數(shù)據(jù)庫的建設(shè)有利于豐富圖書館資源,便于讀者使用

      遼寧省圖書館所保存的民國文獻(xiàn)為讀者研究中國現(xiàn)代史提供了豐富的原始資料,然而繁瑣的借閱手續(xù)、損毀的圖書,以及民國圖書不能復(fù)印等等不利條件,都給讀者查閱民國文獻(xiàn)制造了不小的障礙,影響了讀者的使用,而建立民國文獻(xiàn)數(shù)據(jù)庫就能很好地解決這一問題。讀者只需有一臺連通互聯(lián)網(wǎng)的計算機(jī),就能隨時隨地上網(wǎng)查詢。讀者可通過書名、著者、主題詞檢索等途徑進(jìn)行檢索,方便又快捷,并且不受限制,一次可供多人查詢,極大地滿足了讀者的需求。同時民國文獻(xiàn)專題數(shù)據(jù)庫的建立也極大地豐富、充實(shí)了本館的數(shù)字資源,為開展網(wǎng)絡(luò)信息服務(wù)提供了堅實(shí)的基礎(chǔ)。

      2 數(shù)據(jù)庫建庫模式與設(shè)計

      2.1 電子書掃描與制作

      此數(shù)據(jù)庫將民國文獻(xiàn)進(jìn)行掃描(或縮微膠片轉(zhuǎn)換)形成電子文檔,通過著錄得到每本書的題錄信息,入庫形成民國文獻(xiàn)數(shù)據(jù)庫。因圖書文本為繁體字,豎排版,加之有破損情況,因此很難進(jìn)行文字識別,所以應(yīng)以圖片形式存儲為宜。使用TPI(清華同方專業(yè)數(shù)據(jù)庫制作管理系統(tǒng))系統(tǒng)的電子書制作工具制作成電子書,每條題錄作為一條數(shù)據(jù),對應(yīng)一本CAJ電子書(顯示為CAJ圖片格式),生成圖書名稱索引,實(shí)現(xiàn)文獻(xiàn)資料的題名、日期、作者、目錄等的檢索。這樣做的優(yōu)點(diǎn)是:用戶接口多為菜單驅(qū)動型,易學(xué)易用,檢索直接。確定收錄范圍后,由工作人員對圖書進(jìn)行掃描或者縮微拍攝。由于我們制作的是全文數(shù)據(jù)庫,所以圖書的每一頁包括封面、書名頁、前言頁、目錄、正文、后記頁、封底等等都要掃描進(jìn)計算機(jī)。掃描時要保持與原書頁面內(nèi)容的一致性和完整性,忠實(shí)于原始文獻(xiàn)形態(tài)。假如某一頁只有頁碼而無任何文字,這一空白頁也要掃描,以保持頁碼的連貫性。掃描完成后,須從頭到尾檢查是否有漏掃的頁面及重復(fù)掃描的頁面,若有,則及時添加或刪除。

      2.2 元數(shù)據(jù)制定及錄入

      此庫的元數(shù)據(jù)采取學(xué)術(shù)性和實(shí)用性的原則,嚴(yán)格按照《中國數(shù)字圖書館基本元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范》制定,著錄時對照規(guī)范,結(jié)合此庫特點(diǎn),設(shè)立了包括題名、責(zé)任者、內(nèi)容提要、目錄、出版者等10個核心元素和包括副題名、出版發(fā)行年、地區(qū)、人名等項(xiàng)內(nèi)容的12個修飾詞,能較全面地反映圖書的客觀信息。同時為方便讀者檢索,將出版發(fā)行年同時轉(zhuǎn)換并著錄公元紀(jì)年。元數(shù)據(jù)在錄入過程中,錄入人員要做到認(rèn)真核對,仔細(xì)校驗(yàn),保證錄入數(shù)據(jù)的準(zhǔn)確。在錄入后,上傳已經(jīng)制作好的電子書,這樣,一條數(shù)據(jù)就制作完成了。

      3 加工平臺的使用

      針對文獻(xiàn)數(shù)字化加工的特點(diǎn),遼寧省圖書館使用清華同方公司開發(fā)的TPI平臺系統(tǒng),以保證加工的高效及數(shù)據(jù)的質(zhì)量。清華同方知網(wǎng)自主研發(fā)的TPI平臺是基于非結(jié)構(gòu)化文檔管理而開發(fā)的大型智能內(nèi)容管理系統(tǒng),它圍繞著數(shù)字圖書館建設(shè)內(nèi)容而設(shè)計,能夠同時管理文字、圖片、多媒體、電子檔案等信息。支持網(wǎng)頁的動態(tài)發(fā)布,支持分級權(quán)限認(rèn)證;電子圖書制作及元數(shù)據(jù)加工工具系統(tǒng)共同實(shí)現(xiàn)了原始文獻(xiàn)資料的數(shù)字化和組織;內(nèi)容發(fā)布、檢索網(wǎng)關(guān)和TPI檢索服務(wù)器等共同實(shí)現(xiàn)資源的發(fā)布。平臺具有以下功能:

      3.1 電子書制作功能

      TPI系統(tǒng)中的電子書加工工具為書籍電子化提供了一種快捷、方便、高效的全面解決方案。Book-Shop尤其支持各類紙質(zhì)文檔加工成電子書的全過程。其中包括書頁圖像掃描及管理、書面圖像處理、書面圖像識別導(dǎo)入及編改、目錄加工處理、書頁圖像及目錄合并形成電子書。利用這一特色功能,我們可以把掃描的每頁圖片加工成一整本書,便于讀者下載和瀏覽。

      3.2 元數(shù)據(jù)標(biāo)引工具(MET)

      MET是通過TCPPIP與FTS(全文檢索服務(wù)器)相配合,對分配的元數(shù)據(jù)進(jìn)行標(biāo)引,因此標(biāo)引工具與檢索服務(wù)不必運(yùn)行在同一臺計算機(jī)上,可以進(jìn)行遠(yuǎn)程標(biāo)引工作,也可以多臺機(jī)器同時運(yùn)行,提高效率。數(shù)據(jù)標(biāo)引就是給項(xiàng)目中記錄的部分或全部字段填上合適的值,以此來標(biāo)識這條記錄,使用戶能通過對字段的檢索來搜索到此記錄。數(shù)據(jù)標(biāo)引中對原文類型為KDH、NH、PDF、HTML和WORD文件的記錄可以通過原文進(jìn)行標(biāo)引。對不能通過原文進(jìn)行標(biāo)引的記錄,需要利用相應(yīng)的文檔編輯器配合進(jìn)行間接標(biāo)引。

      3.3 檢查功能

      檢查工具(CKT)。CKT也是采用TCPPIP與FTS相聯(lián)接,實(shí)現(xiàn)分布式的并行數(shù)據(jù)加工。檢查操作是對標(biāo)引、分類操作結(jié)果進(jìn)行檢查,將錯誤數(shù)據(jù)記錄重新返回給標(biāo)引工序,確保數(shù)據(jù)的正確性、準(zhǔn)確性。

      3.4 內(nèi)容發(fā)布功能

      內(nèi)容發(fā)布系統(tǒng)(CPS)。CPS完成圖書館數(shù)據(jù)的分布式采編入庫,實(shí)現(xiàn)網(wǎng)站信息的發(fā)布與管理,實(shí)現(xiàn)動態(tài)實(shí)時發(fā)布,即發(fā)即得,立即生效。CPS中提供了多種庫結(jié)構(gòu)模板以供選擇,同時還可以根據(jù)需要進(jìn)行自定義。在CPS中還可以建立Web訪問數(shù)據(jù)庫的賬號及操作員賬號。前者允許限定賬號的有效期限及指定訪問的數(shù)據(jù)庫,還可以通過IP地址限定訪問者的范圍。操作員的設(shè)置是為了更好地實(shí)現(xiàn)職責(zé)明確的信息加工,支持多人協(xié)同采編,實(shí)現(xiàn)信息發(fā)布之前的編審控制。根據(jù)需要賦予操作員標(biāo)引、分類、檢查等權(quán)限。CPS還可以進(jìn)行數(shù)據(jù)庫的分類管理,建立導(dǎo)航分類。

      4 數(shù)據(jù)庫發(fā)布

      數(shù)據(jù)加工制作完畢后,就可以使用TPI系統(tǒng)中“內(nèi)容發(fā)布工具”的“Web發(fā)布向?qū)А惫δ苓M(jìn)行數(shù)據(jù)庫網(wǎng)上發(fā)布的相關(guān)配置。通過該向?qū)Э梢詫?shí)現(xiàn)設(shè)置數(shù)據(jù)庫的版權(quán)信息、選擇數(shù)據(jù)庫發(fā)布模板、確立檢索點(diǎn)指定字段屬性、配置個性化的初級和高級檢索界面等。根據(jù)數(shù)據(jù)庫內(nèi)容的不同,TPI系統(tǒng)預(yù)制了與之相對應(yīng)的不同形式和不同特點(diǎn)的發(fā)布模板。系統(tǒng)提供了CNKI模板、Google模板、EI模板和OCLC模板等,本數(shù)據(jù)庫采用的是CNKI模板。

      5 問題與思考

      5.1 提高數(shù)據(jù)庫利用效率

      圖書館自建數(shù)據(jù)庫是為了更充分地滿足用戶對某專題信息的需求。自建數(shù)據(jù)庫利用率的高低決定數(shù)據(jù)庫建設(shè)效果的好壞。因此自建數(shù)據(jù)庫的名稱、專業(yè)類型是否清晰,在主頁上的位置是否明顯,是否具有使用幫助、檢索界面友好性、檢索策略的多樣性、查準(zhǔn)率與查全率、檢索結(jié)果的輸出方式、檢索結(jié)果輸出速度、系統(tǒng)穩(wěn)定性等都將直接影響數(shù)據(jù)庫的使用率。民國文獻(xiàn)數(shù)據(jù)庫與其他自建數(shù)字資源被一并整合在遼寧省圖書館主頁中的數(shù)字資源欄目內(nèi),檢索界面清晰、直觀、界面友好,同時TPI系統(tǒng)的優(yōu)點(diǎn)是檢索結(jié)果準(zhǔn)確,響應(yīng)時間快,并且可以提供多種排序方式,便于讀者使用,提高了利用率。

      5.2 數(shù)據(jù)庫后期維護(hù)與安全問題

      民國文獻(xiàn)數(shù)據(jù)庫數(shù)據(jù)量比較大,在制作的過程中投入了大量的人力、物力,所以后期的維護(hù)與安全防護(hù)是一個很重要的問題。在數(shù)據(jù)庫制作的過程中,每天進(jìn)行自動備份,在數(shù)據(jù)庫完成后,我們準(zhǔn)備將這些數(shù)據(jù)刻錄成光盤,作為物理備份,這樣,即使服務(wù)器數(shù)據(jù)出現(xiàn)問題導(dǎo)致無法瀏覽,也可用物理備份進(jìn)行恢復(fù)。這就為讀者查閱使用和數(shù)據(jù)的安全性提供了保障。

      5.3 知識產(chǎn)權(quán)問題

      知識產(chǎn)權(quán)是數(shù)字圖書館發(fā)展中遇到的最大阻力。從圖書館發(fā)展建設(shè)的角度來看,特色館藏資源是具有較高學(xué)術(shù)和史料價值的資料,比如本館所建立的《盛京時報》數(shù)據(jù)庫、東北抗戰(zhàn)書目庫、建國前東北期刊數(shù)據(jù)庫等。但數(shù)據(jù)庫開發(fā)涉及著作權(quán)許可和確認(rèn)問題。如果對已經(jīng)發(fā)表作品進(jìn)行數(shù)字化,會涉及署名權(quán)、修改權(quán)、保護(hù)作品完整權(quán)、使用權(quán)和獲得報酬的權(quán)利。圖書館進(jìn)行公益性的文獻(xiàn)數(shù)字化主要是為保護(hù)文獻(xiàn)、方便讀者使用,借助網(wǎng)絡(luò)使更多人共享,但這又將侵害權(quán)利人的網(wǎng)絡(luò)傳播權(quán),是建庫的矛盾所在。為此,我們盡量選擇年代久遠(yuǎn)的,過了保障期或即將過期的作品來規(guī)避版權(quán)問題,同時通過控制用戶權(quán)限、IP登陸等方式,避免惡意下載,保護(hù)數(shù)據(jù)的安全性,以此來最大限度地保護(hù)著作權(quán)人的知識產(chǎn)權(quán)。

      [1] 黃立華.TPI與我國數(shù)字圖書館建設(shè)[J].圖書館論壇,2004(4):76-78.

      [2] 孫琴.民國文獻(xiàn)數(shù)字化建設(shè)現(xiàn)狀分析研究[J].山東圖書館季刊,2008(1):71-73.

      [3] 溫泉.館藏民國圖書數(shù)據(jù)庫建設(shè)探討[J].河南圖書館學(xué)刊,2010(8):96-98.

      [4]萬華英.民國文獻(xiàn)數(shù)字化建設(shè)——以重慶圖書館為例[J].四川圖書館學(xué)報,2008(4):31-33.

      猜你喜歡
      文獻(xiàn)數(shù)據(jù)庫標(biāo)引民國
      《感染、炎癥、修復(fù)》雜志檢索數(shù)據(jù)庫
      《感染、炎癥、修復(fù)》雜志檢索數(shù)據(jù)庫
      檔案主題標(biāo)引與分類標(biāo)引的比較分析
      他們?yōu)楹味紣勖駠?
      電影(2018年10期)2018-10-26 01:55:26
      本刊對來稿中關(guān)鍵詞標(biāo)引的要求
      論我國學(xué)術(shù)文獻(xiàn)數(shù)據(jù)庫的質(zhì)量調(diào)控
      出版廣角(2017年4期)2017-04-22 19:58:01
      民國人愛刷朋友圈
      百家講壇(2016年6期)2016-09-28 08:10:15
      中文文獻(xiàn)數(shù)據(jù)庫中撤銷論文的分布規(guī)律研究
      本刊對來稿中關(guān)鍵詞標(biāo)引的要求
      民國書家與民國書風(fēng)
      台湾省| 旌德县| 乌兰察布市| 濮阳县| 平利县| 筠连县| 故城县| 贵阳市| 吉木萨尔县| 库车县| 涟源市| 湄潭县| 金山区| 邹平县| 乌拉特后旗| 根河市| 阜阳市| 樟树市| 阜宁县| 齐齐哈尔市| 闸北区| 凤台县| 苏尼特左旗| 开远市| 留坝县| 海安县| 临猗县| 定边县| 修水县| 乌拉特后旗| 玉屏| 和顺县| 永康市| 北流市| 汾西县| 临泽县| 清原| 闵行区| 秭归县| 荆门市| 如皋市|