• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      特色數(shù)據(jù)庫建設(shè)

      2020-09-26 11:59:53李秀東徐培德
      群文天地 2020年5期
      關(guān)鍵詞:版面日?qǐng)?bào)青海

      李秀東 徐培德

      中小型圖書館立足本館特色,建設(shè)本地區(qū)、本館獨(dú)有的數(shù)據(jù)庫是當(dāng)前圖書館數(shù)據(jù)庫建設(shè)的一個(gè)亮點(diǎn)。由于老舊報(bào)紙酸性大、存儲(chǔ)難、學(xué)者使用率低、科研價(jià)值高等原因,老舊報(bào)紙的數(shù)字化加工成為當(dāng)下解決問題的主要途徑。通過查訪各類文獻(xiàn)和咨詢情況,青海省尚未對(duì)《青海日?qǐng)?bào)》1990年以前的老舊報(bào)紙進(jìn)行數(shù)字化加工,本文本著方便讀者檢索、提供圖書館多樣服務(wù)的原則,在充分考察報(bào)紙數(shù)字化的最新技術(shù)的基礎(chǔ)上,針對(duì)館藏《青海日?qǐng)?bào)》老舊報(bào)紙的數(shù)字化加工建庫工作進(jìn)行項(xiàng)目論證。

      一、《青海日?qǐng)?bào)》老舊報(bào)紙數(shù)字化的必要性

      據(jù)統(tǒng)計(jì),1995年至2004年,全國只有15家報(bào)社投資歷史報(bào)紙數(shù)字化項(xiàng)目,2005年到2006年,投入制作的有10家。近年來,向“數(shù)字報(bào)業(yè)”轉(zhuǎn)型已成為全國報(bào)業(yè)的共識(shí)?!肚嗪H?qǐng)?bào)》作為中共青海省委機(jī)關(guān)報(bào),創(chuàng)刊于1949年10月20日,《青海日?qǐng)?bào)》忠實(shí)記錄了青海省解放以來的歷史變遷、文化發(fā)展、生產(chǎn)實(shí)踐等綜合性知識(shí),是青海地方政治、經(jīng)濟(jì)、文化、社會(huì)發(fā)展、風(fēng)俗民情及自然資源等的綜合反映。經(jīng)過70多年的厚重積淀,《青海日?qǐng)?bào)》既是一部鮮活的青海地方志,也是保存地方記憶、傳承地方文化的重要載體,是研究青海的文史資料、發(fā)展青海的決策參考。但眾所周知,報(bào)紙所采用的新聞紙不是可以長期保管的檔案介質(zhì),青海省委黨校圖書館收藏了該報(bào)自創(chuàng)刊至今的紙質(zhì)報(bào)紙,由于紙質(zhì)版報(bào)紙受館藏條件限制,1960年以前報(bào)紙由于受損、受潮、菌害、酸腐現(xiàn)象嚴(yán)重。近年來校院教職工對(duì)歷史報(bào)紙的需求不斷上升,以黨史黨建教研部為甚。2021年是中國共產(chǎn)黨建黨100周年,對(duì)《青海日?qǐng)?bào)》過報(bào)歷史見報(bào)數(shù)據(jù)進(jìn)行技術(shù)性開發(fā),充分挖掘見報(bào)數(shù)據(jù)的價(jià)值,既為建黨100周年獻(xiàn)禮,也為充實(shí)校院數(shù)字圖書館服務(wù)內(nèi)容,滿足讀者對(duì)青海歷史資料的檢索需求,實(shí)現(xiàn)歷史見報(bào)數(shù)據(jù)的增值利用,對(duì)青海省文化建設(shè)、歷史事實(shí)還原、輿論引導(dǎo)有一定的現(xiàn)實(shí)意義。此外,開發(fā)以歷史報(bào)紙為基礎(chǔ)的全媒體數(shù)據(jù)庫,利用歷史報(bào)紙數(shù)字化最新成熟技術(shù)和新聞分類標(biāo)準(zhǔn),對(duì)報(bào)紙版面制作環(huán)節(jié)采用版面全信息重構(gòu),建立技術(shù)先進(jìn)、管理便利、通篇檢索、具有良好兼容性的數(shù)據(jù)庫,形成新聞數(shù)字內(nèi)容的服務(wù)平臺(tái),以更加快捷、方便、真實(shí)的方式,為用戶服務(wù)。

      1.老舊《青海日?qǐng)?bào)》數(shù)字化是解決文獻(xiàn)資源保護(hù)與利用矛盾的有效途徑

      老舊報(bào)紙數(shù)字化,就是通過最新數(shù)字出版技術(shù)把紙質(zhì)報(bào)紙上的內(nèi)容進(jìn)行掃描、文字識(shí)別以及插入音視頻或動(dòng)畫進(jìn)行版面重構(gòu)等一系列步驟,轉(zhuǎn)換成可以被電腦、手機(jī)、平板等多終端使用的格式,通過互聯(lián)網(wǎng)展現(xiàn)的一種基于PDF版面的Flash形態(tài)的多媒體數(shù)字報(bào)?!肚嗪H?qǐng)?bào)》老舊報(bào)紙由于長期保存在庫房里,重藏少用,少有讀者。由于黨校圖書館多次館舍搬遷、報(bào)刊庫房調(diào)整,長期封存的報(bào)紙紙張,由于年代久遠(yuǎn),大部分報(bào)紙已經(jīng)老化、發(fā)脆、破損嚴(yán)重,假如繼續(xù)以舊報(bào)紙?zhí)峁┳x者查詢、翻閱,將造成更為嚴(yán)重的破損。而老舊報(bào)紙數(shù)字化后,則可以在保護(hù)文獻(xiàn)版權(quán)的同時(shí),放開使用權(quán)限,盡可能使用戶利用網(wǎng)絡(luò)不受時(shí)空限制的查閱資源,還可以通過加密、禁止非法下載等相關(guān)手段保護(hù)版權(quán),報(bào)紙數(shù)字化的信息在檢索、復(fù)制、傳輸上可以給讀者提供極大方便,不僅可以被多人同時(shí)重復(fù)使用,也有利于報(bào)紙?jiān)谋Wo(hù),切實(shí)做到了舊報(bào)紙的保存與利用并舉,從而解決了保護(hù)與利用的矛盾,對(duì)于提高資源的利用率,實(shí)現(xiàn)資源的社會(huì)功用具有十分重要的現(xiàn)實(shí)意義。

      2.老舊《青海日?qǐng)?bào)》數(shù)字化便于挖掘舊報(bào)紙的史料價(jià)值

      我國近代辦報(bào)人提倡“秉筆直書”“春秋筆法”精神,這也就是為什么近代以來會(huì)將新式報(bào)紙或新聞紙看作史書的延續(xù)。英國薩里-羅漢普頓大學(xué)歷史學(xué)教授約翰·托什在《史學(xué)導(dǎo)論》中就曾說英國早期報(bào)紙“它們記錄了當(dāng)時(shí)產(chǎn)生最大影響的各種觀點(diǎn)”“提供了對(duì)事件的日常記錄”“經(jīng)常會(huì)提供有關(guān)一些問題的更全面的調(diào)查結(jié)果”等,研究青海歷史,老舊《青海日?qǐng)?bào)》中有最重要、最可靠的史料,其史料價(jià)值需要重視,在相關(guān)研究中應(yīng)注意收集并挖掘。鄭曦原的《帝國的回憶》就是利用《紐約時(shí)報(bào)》晚清對(duì)華報(bào)道選編,和《泰晤士報(bào)》晚清改革觀察記,翻譯編寫而成的。

      老舊《青海日?qǐng)?bào)》作為當(dāng)時(shí)歷史的真實(shí)記錄,其時(shí)代特征中蘊(yùn)藏著許多極其珍貴的史料,如實(shí)記錄了當(dāng)時(shí)社會(huì)政治、文化生活、經(jīng)濟(jì)、新聞動(dòng)態(tài)等諸多方面的現(xiàn)實(shí)狀況。為充分發(fā)揮舊報(bào)紙的潛在史料價(jià)值,滿足不受時(shí)空限制的研究利用需求,數(shù)字化開發(fā)老舊《青海日?qǐng)?bào)》刻不容緩。

      從另一方面說,報(bào)紙是一種有歷史積淀的印刷文獻(xiàn),一直是各類型圖書館收藏、整理、編目的主要對(duì)象。老舊報(bào)紙的數(shù)字化開發(fā)便于檢索,這就為我校及學(xué)者的多學(xué)科、多視角的學(xué)術(shù)研究開啟了便利之門。

      二、老舊《青海日?qǐng)?bào)》數(shù)字化的主要內(nèi)容

      1.紙質(zhì)資料數(shù)據(jù)處理

      限于當(dāng)下圖書館普遍存在數(shù)字化技術(shù)設(shè)施設(shè)備缺乏、人員技術(shù)水平參差不齊,最新報(bào)紙數(shù)字化技術(shù)適宜引入數(shù)據(jù)商對(duì)圖書館館藏1949年10月2日至1989年12月紙質(zhì)報(bào)紙進(jìn)行數(shù)字化處理,生成高清晰度圖像及文檔。

      數(shù)據(jù)商利用先進(jìn)的技術(shù)和管理方式,解決報(bào)紙?jiān)谔幚戆婷鏀?shù)字化過程中存在的問題,諸如版面還原不清晰、文字錯(cuò)誤率高、字形還原非原貌等遺憾和缺失,特別注意針對(duì)2001年1月1日《中華人民共和國國家通用語言文字法》生效前的非規(guī)范漢字(含繁體字、港臺(tái)字、試行簡化字等)的正確表達(dá)。實(shí)現(xiàn)目前行業(yè)普遍實(shí)行的標(biāo)準(zhǔn)數(shù)字報(bào)刊功能,在保留目前現(xiàn)有數(shù)字報(bào)刊功能的基礎(chǔ)上,增加如下主要功能:

      建立以XML對(duì)報(bào)紙結(jié)構(gòu)和內(nèi)容進(jìn)行描述和封裝的數(shù)據(jù)基礎(chǔ),實(shí)現(xiàn)信息的多通道發(fā)布和個(gè)性化服務(wù);創(chuàng)建文本間的關(guān)聯(lián)、特殊的交互設(shè)計(jì)實(shí)現(xiàn)文本的輸入、跳轉(zhuǎn)、檢索等操作;圖片采用動(dòng)態(tài)鏈接,實(shí)現(xiàn)視頻新聞鏈接,增加新聞的附加屬性;利用多媒體技術(shù)中的線條處理技術(shù),條塊分割成各自獨(dú)立的信息空間;利用多媒體技術(shù)實(shí)現(xiàn)對(duì)內(nèi)容的分類導(dǎo)航、導(dǎo)讀功能;采用國家新聞分類法標(biāo)準(zhǔn)和數(shù)字化技術(shù)標(biāo)準(zhǔn),將版面結(jié)構(gòu)和版面內(nèi)容等完整信息實(shí)施數(shù)字化展示。

      2.數(shù)據(jù)索引及數(shù)據(jù)庫特性

      實(shí)現(xiàn)數(shù)據(jù)索引,使用基于概率和詞典的分詞庫數(shù)據(jù)索引技術(shù),上萬條記錄情況下,檢索響應(yīng)時(shí)間不超過1秒,且數(shù)據(jù)庫具備以下特性:

      (1)安全性。索引數(shù)據(jù)自動(dòng)定期進(jìn)行備份,備份目標(biāo)支持本機(jī)和遠(yuǎn)程服務(wù)器。提供手動(dòng)備份和自動(dòng)備份選項(xiàng),自動(dòng)備份又分為定時(shí)備份和指定時(shí)間間隔循環(huán)備份,備份工作進(jìn)行一次設(shè)置后,無需后續(xù)干預(yù)可有效運(yùn)行。隨著資源庫中數(shù)據(jù)的不斷增加,索引庫也不斷增大。系統(tǒng)允許對(duì)索引庫進(jìn)行分割,分割后檢索效率不受影響。支持按日期進(jìn)行索引庫的自動(dòng)分割。

      (2)靈活性。系統(tǒng)中索引數(shù)據(jù)庫可以是多個(gè),按照語種、資料類型等生成多個(gè)索引數(shù)據(jù)庫。索引數(shù)據(jù)可以按照任意的規(guī)則進(jìn)行排序,例如可以指定某一時(shí)間段內(nèi)的文章,或者文件大小在某一范圍內(nèi)的資料,均可以作為篩選條件應(yīng)用于索引數(shù)據(jù)庫中,篩選的結(jié)果還可以按照正序和反序進(jìn)行自動(dòng)排列。

      (3)易用性。索引數(shù)據(jù)庫中,除保存索引數(shù)據(jù),還需保存附加信息,例如資料原文,數(shù)字指紋,日期信息,內(nèi)部編碼和其他定制的信息。對(duì)于不同的索引資料,可以通過設(shè)置配置文件,來決定要索引的字段,要保存的字段。

      實(shí)現(xiàn)全文檢索?;谒饕龜?shù)據(jù)庫和用戶給出的查詢條件,實(shí)現(xiàn)快速讀取,對(duì)海量信息的檢索在毫秒級(jí)時(shí)間內(nèi)完成。用戶可以使用中文、英文進(jìn)行檢索,檢索結(jié)果界面友好、信息豐富、分類清晰,檢索結(jié)果按照相關(guān)度進(jìn)行排序,同時(shí),參考用戶使用習(xí)慣、大數(shù)據(jù)分析結(jié)果、數(shù)據(jù)聚合信息等,對(duì)檢索結(jié)果的排序進(jìn)行調(diào)整,提升用戶的使用體驗(yàn)。檢索系統(tǒng)能滿足以下要求:

      ①支持多種編碼

      對(duì)于不同編碼的檢索關(guān)鍵詞,系統(tǒng)能自動(dòng)識(shí)別和轉(zhuǎn)換。無論是中文的GB碼,BIG5碼,系統(tǒng)都能正確識(shí)別并統(tǒng)一轉(zhuǎn)換成UTF8編碼,能在索引數(shù)據(jù)庫中正確查找到需要的結(jié)果。

      ②支持多關(guān)鍵詞

      多關(guān)鍵詞之間可以指定邏輯關(guān)系,如邏輯“與”,邏輯“或”,邏輯“非”等,并且多個(gè)關(guān)鍵詞能自動(dòng)按照權(quán)重對(duì)結(jié)果進(jìn)行排序,提高檢索的易用性和準(zhǔn)確性。

      ③高召回率、高準(zhǔn)確率

      提供精準(zhǔn)的中文分詞,中文分詞準(zhǔn)確、完整,在檢索時(shí),對(duì)用戶輸入的檢索關(guān)鍵詞進(jìn)行分析和分詞,如果檢索結(jié)果不理想,自動(dòng)進(jìn)行二次精細(xì)分詞,再次查找,確保查詢精確度。

      ④模塊化可升級(jí)

      全文檢索的分詞部分、檢索部分、展現(xiàn)部分獨(dú)立模塊化。每一模塊有自己的配置文件,可以單獨(dú)進(jìn)行配置。如果需要對(duì)某一模塊進(jìn)行升級(jí),僅需要替換該模塊的動(dòng)態(tài)庫即可。各個(gè)模塊所使用的詞典,語料庫等,可以隨時(shí)替換更新。

      三、老舊《青海日?qǐng)?bào)》數(shù)據(jù)庫建庫原則及結(jié)構(gòu)設(shè)計(jì)

      構(gòu)建《青海日?qǐng)?bào)》老報(bào)紙數(shù)據(jù)庫不但充實(shí)了圖書館的數(shù)字資源,而且讀者能夠在極短的時(shí)間內(nèi)獲得自己想要的文獻(xiàn)資料,實(shí)現(xiàn)圖書館“收藏”和“使用”的有機(jī)統(tǒng)一為最終目標(biāo)。構(gòu)建《青海日?qǐng)?bào)》老報(bào)紙數(shù)據(jù)庫時(shí)需堅(jiān)持以下原則。一是先進(jìn)性思想,在數(shù)據(jù)庫的建設(shè)上要具有高強(qiáng)度的檢索性,確保檢索在各種環(huán)境下能夠進(jìn)行,包括系統(tǒng)脫機(jī)、光盤、聯(lián)機(jī)與網(wǎng)絡(luò)檢索等,同時(shí)為了能夠獲得檢索的全面性,內(nèi)容要做到詳盡,覆蓋要全,能夠滿足不同讀者的各類信息需求,才能確保讀者一次就可以搜索到自己所需要的文獻(xiàn)資料。二是發(fā)展性原則,數(shù)據(jù)庫的構(gòu)建要確保每個(gè)時(shí)段系統(tǒng)發(fā)展的一致性原則,還要確保將來數(shù)據(jù)庫的發(fā)展,以達(dá)到符合社會(huì)發(fā)展性原則。三是協(xié)調(diào)性原則,在數(shù)據(jù)庫的建設(shè)中要朝著集約化、正軌化、統(tǒng)一化、全面化、產(chǎn)業(yè)化和規(guī)?;矫姘l(fā)展,對(duì)信息化資源能采取取長補(bǔ)短,有效互補(bǔ),使得數(shù)據(jù)庫的使用范圍變得更廣,確保社會(huì)效益的有效提升,以此實(shí)現(xiàn)資源的真正意義上的互通。

      數(shù)據(jù)庫的結(jié)構(gòu)設(shè)計(jì)是數(shù)據(jù)庫建設(shè)質(zhì)量高低的一個(gè)重要性參數(shù)。《青海日?qǐng)?bào)》舊報(bào)紙信息格式包含文本、圖片,基本字段為標(biāo)題,主題標(biāo)題、引題、副題、提要和小標(biāo)題等標(biāo)題?!肚嗪H?qǐng)?bào)》老舊報(bào)紙?zhí)厣珨?shù)據(jù)庫應(yīng)提供多類型檢索方式,而且都可以在系統(tǒng)內(nèi)存在,包含分類查詢、關(guān)鍵字模糊檢索、數(shù)據(jù)庫分類檢索、數(shù)據(jù)庫高級(jí)檢索等方式。本文庫有效采用TRS全文檢索系統(tǒng)里全文檢索功能,提供各種方式的全文檢索,包括整個(gè)字段檢索、組合檢索、文章關(guān)鍵字檢索,以及二次檢索,方便用戶從不同角度找到自己想要的數(shù)據(jù)。本項(xiàng)目宏觀上分為兩大環(huán)節(jié),一是館藏舊報(bào)紙的整理、數(shù)字化,二是搭建多媒體數(shù)據(jù)庫。

      四、老舊《青海日?qǐng)?bào)》數(shù)字化建庫工作的重點(diǎn)難點(diǎn)

      本課題采用經(jīng)驗(yàn)總結(jié)法進(jìn)行數(shù)字化建庫,經(jīng)驗(yàn)總結(jié)法是通過對(duì)實(shí)踐活動(dòng)中的具體情況,進(jìn)行歸納與分析使之系統(tǒng)化、理論化,上升為經(jīng)驗(yàn)的一種方法??偨Y(jié)推廣先進(jìn)經(jīng)驗(yàn)是人類歷史上長期運(yùn)用的較為行之有效的方法之一。

      系統(tǒng)總體結(jié)構(gòu)要求實(shí)現(xiàn)入庫、索引、WEB服務(wù)和客戶端四部分,并設(shè)計(jì)相應(yīng)的數(shù)據(jù)庫。入庫程序?qū)崿F(xiàn)內(nèi)容的自動(dòng)、手動(dòng)導(dǎo)入;索引工具構(gòu)建索引;WEB服務(wù)響應(yīng)用戶的查閱請(qǐng)求并生成讀報(bào)頁面或檢索結(jié)果頁面。

      閱讀頁面要求實(shí)現(xiàn)原版原式,給讀者原汁原味的讀報(bào)體驗(yàn),與紙質(zhì)報(bào)刊版面效果、字型完全一致。實(shí)現(xiàn)流行的閱讀視圖,包括版面圖,版面導(dǎo)航,標(biāo)題導(dǎo)航,及“上一版”“下一版”和“上一期”“下一期”導(dǎo)航區(qū)。版面導(dǎo)航能夠以合理的形式列出本期報(bào)紙所有版面,并可點(diǎn)擊跳轉(zhuǎn)到相應(yīng)版面。標(biāo)題導(dǎo)航能夠以合理的形式列出本版報(bào)紙所有文章標(biāo)題,并可點(diǎn)擊跳轉(zhuǎn)到相應(yīng)文章。同時(shí),要求實(shí)現(xiàn)全部報(bào)紙內(nèi)容的版面、標(biāo)題、圖片導(dǎo)航功能??傊?,整合《青海日?qǐng)?bào)》的各項(xiàng)新聞資源,實(shí)現(xiàn)新聞資源標(biāo)準(zhǔn)化、智能化的統(tǒng)一管理,實(shí)現(xiàn)新聞歷史數(shù)據(jù)庫建庫工作。

      參考文獻(xiàn):

      [1]王茂華.歷史報(bào)紙檔案數(shù)字化項(xiàng)目的幾點(diǎn)經(jīng)驗(yàn):《重慶日?qǐng)?bào)》歷史報(bào)紙搶救工程的回顧與總結(jié)[J].新聞研究導(dǎo)刊,2013.5.

      [2]胡陽.《沈陽日?qǐng)?bào)》歷史報(bào)紙數(shù)字化的開發(fā)與應(yīng)用[J].中國記者,2017.

      [3]劉家強(qiáng).遼寧省圖書館藏舊報(bào)紙數(shù)字化管見[J].圖書館學(xué)刊,2013.

      [4]玉翠玲,劉斌.大學(xué)生媒介文化概論[M].北京,北京師范大學(xué)出版社,2016.

      [5]張艷國.大學(xué)本科畢業(yè)論文創(chuàng)作指導(dǎo)[M].武漢,華中師范大學(xué)出版社,2017.10.

      (作者簡介:李秀東,中共青海省委黨校圖書館研究館員。研究方向:中小型數(shù)字圖書館建設(shè)。徐培德,中共青海省委黨校圖書館研究館員。研究方向:數(shù)字圖書館建設(shè)及讀者服務(wù)。)

      猜你喜歡
      版面日?qǐng)?bào)青海
      65歲,《焦作日?qǐng)?bào)》正青春
      大美青海
      青海行七首(錄二)
      岷峨詩稿(2017年4期)2017-04-20 06:26:36
      靈感日?qǐng)?bào)
      37°女人(2016年12期)2016-12-09 17:32:36
      青海 管放相宜 漸入佳境
      版面擷英
      好版面要有獨(dú)到的創(chuàng)新技巧
      新聞傳播(2016年3期)2016-07-12 12:55:35
      靈感日?qǐng)?bào)
      37°女人(2016年12期)2016-02-07 03:34:47
      青海“闖關(guān)”
      對(duì)《朝鮮日?qǐng)?bào)》涉藏報(bào)道的思考
      新聞傳播(2015年7期)2015-07-18 11:09:57
      通州市| 博兴县| 彩票| 纳雍县| 万荣县| 广饶县| 宣城市| 正蓝旗| 宁化县| 卓尼县| 元阳县| 鄄城县| 淳安县| 万源市| 伊川县| 蓬溪县| 台北市| 土默特左旗| 宁陵县| 兴城市| 珲春市| 桃江县| 马边| 高阳县| 湖南省| 梅州市| 隆子县| 玛多县| 深圳市| 禹城市| 龙陵县| 基隆市| 蒲城县| 泾川县| 宿州市| 安乡县| 石屏县| 蓝山县| 辽阳县| 炎陵县| 即墨市|