• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      數(shù)字化助推民國報紙知識資源生命延續(xù)

      2023-07-28 00:55:38曹鑫新
      文化產(chǎn)業(yè) 2023年20期
      關(guān)鍵詞:民國報紙數(shù)字化

      曹鑫新

      現(xiàn)首先介紹民國報紙資源建設(shè)的意義,其次對當前民國報紙數(shù)字化資源利用存在的難點進行分析,再次總結(jié)數(shù)字化建設(shè)的方向,最后提出民國報紙數(shù)字化建設(shè)改造重點與知識資源建設(shè)實施路徑。希望對民國時期文獻知識資源建設(shè)提供參考。

      近年來,圖書館業(yè)務(wù)形態(tài)從傳統(tǒng)圖書館到數(shù)字圖書館再到智慧圖書館的轉(zhuǎn)變,促進了圖書館相關(guān)業(yè)務(wù)的推陳出新。如何利用當前資源為讀者提供智慧化服務(wù),進行智慧化轉(zhuǎn)型,成為圖書館在新階段需要思考的問題。民國文獻是對民國時期政治、經(jīng)濟、文化、民生等方面的記載,在史料中有著十分重要的地位。民國報紙具有覆蓋地域范圍廣、出版周期短等特點,能夠從多方面立體地呈現(xiàn)出民國時期社會面貌及相關(guān)知識。因此,對民國報紙的加工與建設(shè)也成為民國文獻保護與利用的重要工作之一。

      民國報紙資源建設(shè)的重要意義

      為學科研究提供史料依據(jù)

      筆者對中國知網(wǎng)“篇名=民國+報紙、篇名=民國+報刊”的中文文獻進行搜索,截至2023年2月,共獲得相關(guān)文獻351篇。對其內(nèi)容進行分析研究發(fā)現(xiàn),民國報紙的文獻研究涉及歷史、廣告、圖書館學等多學科,研究內(nèi)容基本分為兩大類別,分別為報紙內(nèi)容信息的利用和民國報紙館藏建設(shè)。數(shù)量龐大的民國報紙內(nèi)容信息利用的文獻研究表明民國報紙在民國文獻中的重要價值,并從側(cè)面體現(xiàn)出各個學科的內(nèi)容,挖掘民國報紙中的知識信息對歷史、文學、文化、藝術(shù)等方面具有的深遠意義。如陳雅莉以民國報紙對“國貨”意義的生產(chǎn)為例,闡釋了中國近代時尚觀念對民族意識的雙重構(gòu)建問題[1]。

      充分揭示館藏資源

      民國不同階段的報紙資源建設(shè)文獻研究側(cè)重點不同。2014年至2015年初,圖書館強調(diào)民國報紙的保護和開發(fā),側(cè)重報紙實體的保護與修復(fù),對民國報紙數(shù)字化等再生性保護進行了初步探索,如上海圖書館、重慶圖書館等。2015年至2020年間,圖書館側(cè)重民國報紙的數(shù)字化工作,將縮微膠片進行數(shù)字化轉(zhuǎn)換,分地區(qū)、分主題進行數(shù)字化加工,有些圖書館開始嘗試對標題、作者等信息進行著錄,如國家圖書館、首都圖書館等。在此期間還出現(xiàn)了專題特色文獻數(shù)據(jù)庫的探索性建設(shè)、影印資源建設(shè)。2021年,隨著智慧圖書館概念的普及與推廣,圖書館開始注重對數(shù)字資源的語義標注,并引入細粒度標引,強調(diào)知識的關(guān)聯(lián)與可視化。

      當前民國報紙數(shù)字化資源利用存在的難點

      關(guān)于民國報紙建設(shè)的研究,有的圖書館注重數(shù)據(jù)庫的建設(shè),也有的圖書館注重知識化抽取的探索。在數(shù)字化形式上有PDF格式的全文數(shù)字化,也有標題OCR文字識別[2]。在數(shù)字化成品利用上應(yīng)注重數(shù)據(jù)庫的建設(shè),如大而全且覆蓋范圍較廣的綜合數(shù)據(jù)庫、圍繞某一專題建設(shè)的特色主題數(shù)據(jù)庫[3]。

      目前,檢索的結(jié)果很大程度源于搜索者對搜索主題的認識,因此這種檢索在一定程度上難以充分展示相關(guān)主題的館藏資源。當前各圖書館都在開展民國報紙數(shù)字化項目,該項目是建立在自身館藏資源與數(shù)字化建設(shè)基礎(chǔ)上的,在成品展現(xiàn)上各具特色。“百家爭鳴”雖然可以促進建設(shè)的良性前進,但與此同時也造成了資源的浪費,重復(fù)的資源建設(shè)所體現(xiàn)出的“投入與產(chǎn)出”顯然不太合理。

      在智能化時代,通過對數(shù)字資源進行統(tǒng)計分析,在已有資源的基礎(chǔ)上進行決策,為已完成建設(shè)或即將投入建設(shè)的數(shù)字資源賦予新的生命力,使原有的已完成建設(shè)的“信息孤島”式的數(shù)據(jù)成品轉(zhuǎn)變?yōu)殛P(guān)聯(lián)數(shù)據(jù)庫數(shù)據(jù)或者匯編資源,知識資源建設(shè)可以更好地實現(xiàn)從信息到知識網(wǎng)的螺旋式上升?!笆奈濉睍r期,我國圖書館信息資源建設(shè)需要實現(xiàn)從認識到實踐的多維度轉(zhuǎn)變,即信息資源從藏到用、從單一紙質(zhì)到多類型資源以及從信息資源的組織到語義化組織、從信息表達到向詞表數(shù)據(jù)治理的轉(zhuǎn)變[4]。對民國報紙數(shù)字資源進行知識抽取能夠最大限度地體現(xiàn)出民國報紙在民國歷史時期的作用,因此新時期民國報紙的建設(shè)要在原有的基礎(chǔ)上進行細化。

      數(shù)字化建設(shè)方向

      智慧圖書館的智慧化管理、智慧化建設(shè)與服務(wù)突出了智慧圖書館更加全面與個性化的服務(wù)。圖書館對資源的建設(shè)工作更加側(cè)重資源的統(tǒng)籌與數(shù)據(jù)的關(guān)聯(lián)性建設(shè)。智慧圖書館對內(nèi)容的建設(shè)已經(jīng)從最初的以收藏為主體轉(zhuǎn)變?yōu)橐栽鲋禐槟康腫5]。

      資源從數(shù)據(jù)向知識轉(zhuǎn)化

      通常數(shù)字資源可以通過自建、合作共建、征集等方式獲取,文獻類型可以分為圖書、期刊、報紙等,體現(xiàn)了數(shù)字資源來源與建設(shè)內(nèi)容的多樣化。以往數(shù)字化加工多針對某一主題的相關(guān)資源,在完成當前主題資源的加工與發(fā)布后,資源會進入庫房得到長期保存,變成一種“一次性數(shù)字資源”。王世偉指出,在數(shù)字圖書館建設(shè)基礎(chǔ)上,智慧圖書館使得以往文獻能夠按照一定的規(guī)則呈現(xiàn)給讀者,并為其提供豐富的服務(wù),使文獻“活化”且更加智能化,有利于讀者更加便捷地獲取所需資源[6]。因此,如何讓文獻“活化”與智能化這個問題將成為智慧圖書館時代知識資源建設(shè)的核心工作。

      知識資源共建化

      智慧圖書館的檢索平臺主要提供知識的可視化與智慧服務(wù)。讀者不僅能夠一站式獲取相關(guān)資源,同時也為平臺帶來了產(chǎn)生更多信息增值的可能。讀者在享受精準化服務(wù)的同時,也能參與數(shù)據(jù)建設(shè),并在其中扮演數(shù)據(jù)建設(shè)方、質(zhì)檢方、文獻提供方等角色。依據(jù)用戶類型標簽及需求進行智能推送的同時,邀請讀者參與知識資源建設(shè)服務(wù)與勘誤工作,并通過收集用戶平臺行為確定新的建設(shè)方向,指導下一步知識資源建設(shè)工作。知識資源建設(shè)不再是“一勞永逸”的工作,而是一項隨著不同角色進入、調(diào)整、更新形成的“至臻完美”的工作。

      數(shù)據(jù)類型多樣化

      隨著新媒體、新技術(shù)的不斷迭代更新,數(shù)字資源也有了相應(yīng)的改變,除了以往原生數(shù)字資源、館藏實體資源的再生資源以外,還涉及針對某一主題建設(shè)形成的AR、VR、MR等類型的新型數(shù)字資源。資源類型的多樣化與知識資源建設(shè)的個性化密切相關(guān),需要在建設(shè)初期考慮后期閱讀推廣可能出現(xiàn)的問題,例如推廣針對的人群、推廣的平臺以及實踐模式與策略等。

      民國報紙數(shù)字化建設(shè)改造重點

      對民國報紙資源進行知識化加工,能夠在保護紙質(zhì)資源的前提下,達到對數(shù)字資源利用最大化的目的。在梳理知識化加工的工作環(huán)節(jié)后發(fā)現(xiàn),開展知識資源加工工作還面臨一些挑戰(zhàn)。

      語料庫范圍的設(shè)定

      民國報紙資源的語料庫主要以紙質(zhì)資源為基礎(chǔ),在原有的數(shù)字化前提下進行建設(shè)。因此,語料庫建設(shè)的批次與范圍需要具體斟酌,特色數(shù)據(jù)庫的建設(shè)是基于豐富的語料庫搭建的。就加工而言,需要區(qū)分不同內(nèi)容主題文本篇目,如在文章分類上分為廣告、新聞、文學作品等。不同的分類元素是否需要加入語料庫則需要進一步斟酌。

      多類型知識資源的描述

      報紙的數(shù)字化涉及不同的文檔類型。在進行知識化加工時,如何描述不同類型的知識資源,以及在提質(zhì)增效的同時最大限度地展現(xiàn)知識資源內(nèi)容也是需要進一步思考的問題。

      建設(shè)語料庫解決的是從哪里抽取、從多大范圍內(nèi)抽取的問題,關(guān)鍵字段的抽取就是具體抽取誰,如何抽取的問題。這涉及對不同類型篇目的知識元分類,比如新聞性篇目的知識元分類、廣告篇目的知識元分類以及圖片篇目的知識元分類,一個好的知識元分類能夠涉及民國報紙中所有類型篇目的信息,并且能在不同類型信息上完成非必備字段的標引。“自動抽取加人工描述”的運用使得知識資源的描述更加科學化,有助于最大限度地對資源進行知識抽取。

      識別準確率的把控

      知識資源建設(shè)要基于全文內(nèi)容進行檢索與抽取。在報紙文章構(gòu)成上,有純文字篇目、文字加配圖篇目、圖片篇與漫畫篇目。這就意味著知識資源建設(shè)工作的要求要比以往的數(shù)字資源建設(shè)更加詳細與準確。不論是報紙信息的噪點處理、文字的識別工作,還是民國時期語言、語法的檢查等工作,都需要在標題識別的基礎(chǔ)上更加精準化。

      民國報紙知識資源揭示與服務(wù)

      知識資源數(shù)據(jù)類型決定了知識資源建設(shè)的服務(wù)形態(tài),這意味著在進行知識資源建設(shè)的同時還需要考慮數(shù)字化成品的揭示與服務(wù)問題。不論是知識網(wǎng)絡(luò)、知識圖譜等的可視化呈現(xiàn),還是形成針對某一主題的專題庫、針對不同類型讀者的有聲庫等,抑或是可以讓讀者身臨其境的VR資源,這些不同的服務(wù)形態(tài)資源的統(tǒng)籌與建設(shè)都是進一步開展知識資源加工需要考慮的問題。

      民國報紙知識資源建設(shè)實施路徑

      引入深度學習識別技術(shù),提升識別準確率

      傳統(tǒng)的OCR技術(shù)已經(jīng)無法滿足文字方向不定、紙張噪點較多、文檔類型多樣的民國報紙知識資源建設(shè)的需求,因此應(yīng)當引入深度學習識別技術(shù),對語料庫進行更新與校正,降低人工成本,用機器識別代替大規(guī)模的人力投入,一方面能夠節(jié)省人力成本,另一方面也能最大限度地避免由于工作人員失誤所造成的資源提取缺失等問題的發(fā)生。

      知識資源深加工與共建整合,推陳出新

      對知識內(nèi)容、主題詞、分類、作者、標題、地域、時間、事件等進行標引,細化加工粒度,方便后續(xù)開展資源的關(guān)聯(lián)性加工等工作。未來已經(jīng)建成的數(shù)字資源成品不再是以某一項目主題為單位的建設(shè),而是更加注重知識內(nèi)容的深度挖掘,通過前期對資源的精細化標引,針對某一主題將多項目資源、多類型資源進行整合,對項目的揭示注重關(guān)聯(lián)性建設(shè),從某項目資源轉(zhuǎn)向?qū)n}數(shù)據(jù)庫建設(shè)、多庫聯(lián)合以及知識圖譜的建設(shè),通過這樣的轉(zhuǎn)變完成對資源的深度揭示,以便為專題領(lǐng)域的研究提供相應(yīng)的史料參考。當前國內(nèi)開展知識資源建設(shè)的單位應(yīng)該聯(lián)合起來,發(fā)揮各家特長,在數(shù)字化、知識化與技術(shù)化等不同領(lǐng)域中貢獻力量,合力促成知識資源的共建共享。

      聯(lián)合讀者互動建設(shè),鼓勵創(chuàng)作

      在智能時代,讀者不僅是知識的獲取者,也是知識的提供者,不同類型讀者的加入使得知識網(wǎng)絡(luò)更加立體。文獻不再是建設(shè)完成后的“一潭死水”,而是源源不斷的“涓涓細流”。各個專題庫與平臺間的標準化設(shè)計與簡易鏈接能夠助推讀者參與到知識資源建設(shè)當中。圖書館的讀者不乏具有各個專業(yè)特長的“大家”,將“讀者、專家、學者”引入圖書館知識資源建設(shè)中來,使其成為知識資源建設(shè)的一份子,幫助圖書館資源建設(shè)單位更精準、更客觀地呈現(xiàn)知識資源。

      更新培養(yǎng)機制,識人善任

      在智慧圖書館中,圖書館館員的角色也發(fā)生了變化,智慧圖書館館員在數(shù)據(jù)、數(shù)字人文、學術(shù)交流、出版、創(chuàng)客、智庫、閱讀推廣、健康信息等方面均能發(fā)揮作用[7]。在知識資源加工工作的每一個環(huán)節(jié)中,圖書館館員充當了決策者、執(zhí)行者、質(zhì)檢者、驗收者、管理者等多個角色。簡單來說,圖書館館員參與了知識資源建設(shè)工作的全流程,并在其中發(fā)揮了至關(guān)重要的作用。因此數(shù)字圖書館館員本身的素養(yǎng),包括其學科背景與專業(yè)水平等在一定程度上影響著數(shù)字化建設(shè)中資源整合與揭示的程度。

      對知識資源建設(shè)人才的培養(yǎng)要從人才引進策略、培養(yǎng)流程與機制以及激勵機制三方面著手,在高效率完成數(shù)字化工作的同時,保障長效持久且吸引人才的政策,完善人員構(gòu)成,制定人才配置規(guī)劃。

      在智慧圖書館背景下,知識資源建設(shè)工作是在原有數(shù)字化的基礎(chǔ)上進行深度整合,挖掘文獻知識信息,對相應(yīng)節(jié)點進行細粒度標引,建立文獻數(shù)據(jù)庫,將以往獨立的信息或項目通過關(guān)鍵詞或知識項關(guān)聯(lián)起來,將不同類型的資源按照知識體系匯總成庫,為讀者提供一站式知識服務(wù)。隨著智慧圖書館的建設(shè),未來知識資源建設(shè)工作必將有更加廣闊的發(fā)展空間。

      注釋

      [1]陳雅莉.中國近代時尚觀念對民族意識的雙重建構(gòu)——以民國報紙對“國貨”意義的生產(chǎn)為例[J].新聞大學,2022(09):60-72+119.

      [2]任靜,林衛(wèi)東,李洪梅.公共圖書館民國報刊數(shù)字化建設(shè)現(xiàn)狀研究[J].山東圖書館學刊,2021(03):88-92.

      [3]姚昕.智慧圖書館環(huán)境下圖書館報紙專題庫建設(shè)探討[J].河南圖書館學刊,2022,42(05):96-100.

      [4]蘇力.“十四五”時期圖書館信息資源建設(shè)的發(fā)展轉(zhuǎn)向[J].甘肅科技,2021,37(14):84-85.

      [5]吳建中.從數(shù)字圖書館到智慧圖書館:機遇、挑戰(zhàn)和創(chuàng)新[J].圖書館雜志,2021,40(12):4-11.

      [6]王世偉.圖書館智慧體是對圖書館有機體的全面超越[J].圖書館建設(shè),2022(03):4-9.

      [7]顧品浩.圖書館智慧化轉(zhuǎn)型中館員角色轉(zhuǎn)變研究[J].圖書館學刊,2023,45(01):1-6.

      猜你喜歡
      民國報紙數(shù)字化
      家紡業(yè)亟待數(shù)字化賦能
      報紙
      高中數(shù)學“一對一”數(shù)字化學習實踐探索
      高中數(shù)學“一對一”數(shù)字化學習實踐探索
      他們?yōu)楹味紣勖駠?
      電影(2018年10期)2018-10-26 01:55:26
      賣報紙
      可以吃的報紙
      賣報紙
      數(shù)字化制勝
      民國人愛刷朋友圈
      百家講壇(2016年6期)2016-09-28 08:10:15
      浙江省| 安溪县| 临邑县| 石景山区| 东平县| 龙岩市| 施秉县| 江阴市| 黔西县| 德阳市| 南京市| 水富县| 礼泉县| 韶关市| 瑞安市| 红原县| 保亭| 当阳市| 通江县| 陈巴尔虎旗| 德安县| 海南省| 红原县| 佛山市| 临澧县| 广南县| 左权县| 益阳市| 通榆县| 城口县| 宁晋县| 财经| 青海省| 汉沽区| 炉霍县| 山东| 通渭县| 波密县| 习水县| 丹巴县| 内江市|