• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      地方文獻全文數(shù)據(jù)庫建設(shè)的一點嘗試

      2011-03-18 09:21:48
      圖書情報研究 2011年1期
      關(guān)鍵詞:文獻數(shù)據(jù)庫全文文檔

      周 艷

      (遼寧省圖書館 沈陽 110015)

      ·一得之見·

      地方文獻全文數(shù)據(jù)庫建設(shè)的一點嘗試

      周 艷

      (遼寧省圖書館 沈陽 110015)

      在分析地方文獻全文數(shù)據(jù)庫類型的基礎(chǔ)上,指出地方文獻數(shù)據(jù)庫全文建設(shè)的一般做法,并針對其缺點,設(shè)計程序予以改進,最后給出具體實現(xiàn)步驟。

      地方文獻 數(shù)據(jù)庫 全文

      地方文獻是指有關(guān)本地方的一切資料[1],包括“史料、地方出版物和地方人士著述”三部分,含括了地方政治、經(jīng)濟、歷史、地理、文化、科學(xué)、教育、軍事、邊防、民族、宗教、風(fēng)土人情、自然資源等各個方面。地方文獻既反映地方特色,又體現(xiàn)時代特色和社會發(fā)展歷程,具有很高的歷史、科學(xué)和情報價值,也是一個正在被日益廣泛利用的文化寶庫。

      目前,我國各級公共圖書館都非常重視地方文獻的收集、整理、網(wǎng)上發(fā)布等工作,建立了地方文獻專藏,把文獻資料的保護與提供利用緊密地結(jié)合起來。同時,為方便讀者網(wǎng)上閱讀,建立了地方文獻全文數(shù)據(jù)庫[2]。

      1 地方文獻全文數(shù)據(jù)庫的類型

      按照全文字段的存儲形式和占用存儲空間大小劃分,地方文獻全文數(shù)據(jù)庫主要有純文本、圖像、多媒體三種類型。

      1.1 純文本

      是將文獻經(jīng)過掃描及光學(xué)字符識別(0CR)后,保存為文本文件。優(yōu)點是占用空間小,讀者可以進行全文檢索,文獻的查全率較高;缺點是圖書館工作人員的勞動強度大,差錯率高。

      1.2 圖像

      是將文獻正文掃描為 .jpg、.tiff等圖像文件,將書名、作者、出版發(fā)行項、目錄、關(guān)鍵詞等字段進行著錄。優(yōu)點是可對文本字段進行檢索,速度快,工作人員的勞動強度小,差錯率低,也能閱讀及下載全文;缺點是占用空間大,不能進行全文信息檢索。

      1.3 多媒體

      是將文獻資料數(shù)字化為MP3等格式,通過關(guān)鍵詞進行檢索。數(shù)據(jù)占用空間非常大,圖書館一般不采用此種方式存儲數(shù)據(jù)。

      2 地方文獻全文數(shù)據(jù)庫建設(shè)的一般做法

      盡管地方文獻全文數(shù)據(jù)庫有多種表現(xiàn)形式,但圖像形式比其它形式建庫速度快,圖書館工作人員的勞動強度小,差錯率低,而且隨著圖像壓縮技術(shù)的發(fā)展和計算機大容量存儲設(shè)備的出現(xiàn),占用空間大小已不是主要考慮的問題,因此,在圖書館地方文獻數(shù)字化建設(shè)中,全文數(shù)據(jù)庫采用的大都是這種存儲方式。

      具體做法通常是購買成型的數(shù)字化產(chǎn)品(TRS等),然后將掃描后的每張圖片(對應(yīng)文獻中的頁碼)鏈接在文獻相關(guān)的字段上。這樣,按文獻的題名、責(zé)任者、出版項進行檢索,就可以找到全文文獻存儲的界面,再一頁一頁的閱覽文獻全文。這樣做的優(yōu)點是可以降低圖書館工作人員的勞動強度,只要將全文文獻掃描后,按照書中的頁碼存儲就可以了。但對于讀者來說,上網(wǎng)下載全文時會非常麻煩,必須一頁一頁的瀏覽、下載,如果需連續(xù)閱讀,則更為繁瑣。

      3 我館地方文獻全文數(shù)據(jù)庫建設(shè)的一點嘗試

      如果圖書館自建的全文數(shù)據(jù)庫,也能像在網(wǎng)上閱讀電子書一樣,既可以一頁一頁的閱讀,也可以跳躍式的閱讀,不是就能滿足讀者方便快捷地閱讀及下載全文的需要了嗎?筆者在我館地方文獻全文數(shù)據(jù)庫建設(shè)實踐中,根據(jù)實際需要,設(shè)計了簡單實用的兩個小程序,巧妙的實現(xiàn)了數(shù)據(jù)庫中全文字段的存儲,同時利用Adobe Acorbat 和Word軟件的轉(zhuǎn)化接口,實現(xiàn)了適合讀者網(wǎng)上瀏覽的全文存儲方式,使讀者可以像閱讀電子書那樣在網(wǎng)上閱覽文獻。同時,采用.pdf 格式存儲的文件,還能實現(xiàn)與其他格式文件的轉(zhuǎn)換,實現(xiàn)文檔加密、數(shù)字簽名、文檔只讀瀏覽等功能。

      3.1 建文件夾,逐頁掃描

      將需要做全文的書籍,逐頁掃描為 .jpg或 .tif格式,并將掃描后的文件放入已建好的文件夾中。如:《遼東半島石棚》一書(d:-dbdsp),文件名可依次為順序號:1.jpg、2.jpg、3.jpg、4.jpg……(也可以按書內(nèi)容的順序,依照書名的命名方法對文件進行命名,然后用批量轉(zhuǎn)換軟件進行轉(zhuǎn)換。)

      3.2 打開Word編輯宏的界面,將下面代碼粘貼到模塊中

      Dim i As Integer

      For i = 1 To 1329 * 書的頁數(shù)…

      ChangeFileOpenDirectory “d:-dbdsp”

      Documents.Add DocumentType:=wdNewBlankDocument

      Selection.InlineShapes.AddPictureFileName:=i&“.jpg”, LinkToFile:= False, SaveWithDocument:=True

      ActiveDocument.SaveAsFileName:=i&“.doc”, FileFormat:=wdFormatDocument, _

      LockComments:=False,Password:=“”,AddToRecentFiles:=True, WritePassword:=“”,ReadOnlyRecommended:=False, EmbedTrueTypeFonts:=False,

      SaveNativePictureFormat:=False,SaveFormsData:=False, SaveAsAOCELetter:= False

      ActiveWindow.Close

      Next

      運行上面的程序后,原來掃描的.jpg圖片格式的文獻,就轉(zhuǎn)換成了.doc格式的 word文檔文件。

      3.3 將一個個獨立的word文檔轉(zhuǎn)換為一個能容納整個文獻的word長文檔

      For i = 10 To 1329

      ChangeFileOpenDirectory “d:-dbdsp”

      Documents.Open FileName:=i & “.doc”, ConfirmConversions:=False, ReadOnly:= False, AddToRecentFiles:=False, PasswordDocument:=“”, PasswordTemplate:= “”, Revert:=False, WritePasswordDocument:=“”, WritePasswordTemplate:=“”, _

      Format:=wdOpenFormatAuto, XMLTransform:=“”

      Selection.WholeStory

      Selection.Copy

      ActiveWindow.Close

      Selection.PasteAndFormat (wdPasteDefault)

      Next

      ActiveDocument.Save

      這樣,就生成了一個含有全部文獻內(nèi)容的word長文檔。

      3.4 將word文檔轉(zhuǎn)換為.pdf文檔

      安裝Adobe Acorbat軟件,在word中按“轉(zhuǎn)換到Adobe PDF”按紐。運行Acorbat,打開生成的 .pdf文檔,對文檔進行加密、數(shù)字簽名等安全設(shè)置。

      通過以上幾個步驟,就可以將一本本珍貴的紙制地方文獻書籍全文數(shù)字化,簡便易行,特別適合文獻數(shù)量不是很大的中小型圖書館采用,而且由于.pdf格式為電子圖書的格式,非常方便讀者網(wǎng)上瀏覽。

      [1] 李 誠. 關(guān)于地方文獻數(shù)據(jù)庫建設(shè)的思考[J]. 圖書館工作與研究,2002(1):54-57.

      [2] 林淑晶. 對圖書館地方文獻數(shù)據(jù)庫建設(shè)工作的討論[J]. 今日科苑,2008(16):241-242.

      OnConstructionoftheFullTextDatabaseofLocalLiterature

      Zhou Yan

      Liaoning Province Library, ShenYang 110015, China

      Based on an analysis of the types of the full text database of local literature, the present paper first summaries the usual methods of building the database, then in view of its demerits designs programs for its improvement, and finally offers the specific procedures for its construction.

      local literature; database; full text

      G250.7

      周 艷,女,1964年生,副研究館員,碩士,研究方向為數(shù)字圖書館,發(fā)表論文10余篇。

      猜你喜歡
      文獻數(shù)據(jù)庫全文文檔
      《感染、炎癥、修復(fù)》雜志檢索數(shù)據(jù)庫
      《感染、炎癥、修復(fù)》雜志檢索數(shù)據(jù)庫
      全文中文摘要
      有人一聲不吭向你扔了個文檔
      全文中文摘要
      青年再造
      論我國學(xué)術(shù)文獻數(shù)據(jù)庫的質(zhì)量調(diào)控
      出版廣角(2017年4期)2017-04-22 19:58:01
      基于RI碼計算的Word復(fù)制文檔鑒別
      中文文獻數(shù)據(jù)庫中撤銷論文的分布規(guī)律研究
      Persistence of the reproductive toxicity of chlorpiryphos-ethyl in male Wistar rat
      嘉禾县| 梓潼县| 贡觉县| 文昌市| 洞头县| 永嘉县| 武威市| 塘沽区| 涞水县| 普宁市| 凤台县| 安多县| 太湖县| 玉树县| 清水县| 江北区| 正蓝旗| 无为县| 哈巴河县| 原阳县| 丹江口市| 镇江市| 涟源市| 林周县| 克山县| 繁昌县| 大新县| 丹巴县| 视频| 东辽县| 美姑县| 游戏| 鸡泽县| 黑山县| 沁阳市| 富顺县| 汉沽区| 调兵山市| 班玛县| 如皋市| 丹寨县|