• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      民國檔案數(shù)字人文服務平臺建設思路研究

      2021-08-30 02:35陳宇
      北京檔案 2021年8期

      摘要:明確數(shù)字人文及數(shù)字人文服務平臺的內(nèi)涵,解析目前數(shù)字人文服務平臺建設中存在的誤區(qū)。通過提煉民國檔案數(shù)字人文服務平臺建設的價值目標,確立民國檔案數(shù)字人文服務平臺的功能定位,進一步(從完善跨學科研究體系、構建檔案整理開發(fā)自動化體系、優(yōu)化知識服務體系、加強網(wǎng)絡文獻資源采集和信息組織等四個方面)提出民國檔案數(shù)字人文服務平臺的建設思路。

      關鍵詞:開放利用 民國檔案 數(shù)字人文服務平臺

      新《檔案法》把創(chuàng)新檔案信息資源共享服務平臺建設作為推進檔案開放利用體系和開放利用能力現(xiàn)代化的重要內(nèi)容,提出了“推動檔案數(shù)字資源跨區(qū)域、跨部門共享利用”的目標要求。民國檔案資源建設是檔案信息資源建設的重要組成部分,是提升民國檔案服務能力的一項基礎建設,也是當前和今后民國檔案工作的一項重點任務。

      一、數(shù)字人文及數(shù)字人文服務平臺的內(nèi)涵

      數(shù)字人文是借助數(shù)字科技進行人文研究的新型跨學科研究領域,從技術角度看,其熱點主題有文本挖掘與可視化、語義網(wǎng)技術兩類。前者又可以分成三個子主題:文獻計量與知識圖譜,自然語言處理、機器學習與可視化,文本挖掘、可視化與地理信息系統(tǒng)(GIS)技術。[1]空間人文通過抽取文獻中不同粒度的地理位置、人口、自然等信息,利用GIS重現(xiàn)原文對地點的描述,或與現(xiàn)實地理位置關聯(lián),為歷史、考古等研究提供支撐。文本挖掘則是沿著“從真實的數(shù)據(jù)到結(jié)構化數(shù)據(jù),再到有用的知識”這條路,通過標記數(shù)據(jù)或發(fā)現(xiàn)數(shù)據(jù)隱式結(jié)構,將文本數(shù)據(jù)轉(zhuǎn)化為多維知識。[2]

      數(shù)字人文服務平臺本質(zhì)上就是基于數(shù)字人文技術構建的一個聚合數(shù)據(jù)資源、數(shù)據(jù)工具、數(shù)據(jù)服務的知識共享平臺、內(nèi)容開放平臺。通過對國內(nèi)數(shù)字人文項目的考察,當前數(shù)字人文服務平臺主要實現(xiàn)的功能包括六類:一是文本挖掘。利用文本挖掘、關聯(lián)數(shù)據(jù)等技術對文本內(nèi)容信息與外部特征進行捕獲與收集,分類組織、定量分析并提供多種檢索途徑;二是可視化分析。基于可視化工具將地理空間與時間空間的相互疊加,以圖表、詞云、動圖等形式勾勒地理空間和特定歷史事件、事物或數(shù)據(jù)間的聯(lián)系,形成路線圖、演進圖、沿革圖、遷徙圖等可視化圖表[3];三是場景模擬與復原。通過對文獻記載、圖像、音視頻資料進行分析、挖掘,運用計算機建模、關聯(lián)數(shù)據(jù)等技術將相關元素集中分析提煉,立體、多維、生動的還原各類歷史場景;四是語料庫利用。挖掘口述文獻、文本文獻中的大量地名、機構、人物等名稱,建立人名庫、地名庫、地理名詞表、機構名錄等規(guī)范數(shù)據(jù)庫,提供多途徑檢索服務;五是用戶參與。對開放瀏覽的數(shù)字化資料提供自由創(chuàng)建標簽、百科辭典編輯、數(shù)據(jù)審核眾包等互動參與式的利用服務;六是研究支持。匯集必要的背景知識、參考數(shù)據(jù),以及歷史年表、歷史地圖、字典詞典等研究工具。

      二、數(shù)字人文服務平臺建設面臨的誤區(qū)

      一是單學科利用需求大于社會公眾需求,導致數(shù)字人文服務平臺的價值迷失。數(shù)字人文服務平臺建設的實質(zhì)是以實現(xiàn)和維護公眾權利為目標,通過匹配和實現(xiàn)公眾表達資源需求、利用資源、參與建設的權利,推動數(shù)字資源的合理配置和有效利用。但目前數(shù)字人文服務平臺建設一方面把某一學科利用需求作為平臺建設的核心價值需求,把建設中的主要資源和精力都用于學科內(nèi)部“表淺化的檢索”,忽視學科間、數(shù)據(jù)間聯(lián)結(jié)的建立,不足以提供增加新認知的結(jié)構性信息。另一方面,平臺匯集了大量面向公眾開放的數(shù)字資源,但在運行方式上,開放程度普遍不高,多數(shù)僅限內(nèi)部使用,實際并沒有讓社會公眾享受數(shù)字技術福利、降低查找文獻資料的成本。

      二是數(shù)字化外包替代多元參與,導致數(shù)字人文服務平臺的協(xié)作格局沒有形成。隨著眾包、共享等服務功能的出現(xiàn),平臺資源的提供者由單一的保管機構向個人、企業(yè)、團體等多中心轉(zhuǎn)變,數(shù)字人文服務平臺的建設主體不僅是人文社會科學學者、資源保管機構,還要依托群體智慧和用戶的協(xié)同參與?!埃ňW(wǎng)絡世界資源交換群體)以社區(qū)論壇為活動中心,以網(wǎng)絡云盤作存儲場所,利用微博、微信群傳遞消息,通過這些形式發(fā)布的資源具有公開、免費和即時性。”[4]然而,由于部分資源涉及版權糾紛,存在大量繁復的甄別工作,并且數(shù)字化外包已規(guī)?;?、專業(yè)化,使國內(nèi)網(wǎng)絡信息資料的采集與保存工作沒有獲得足夠的重視,從而忽略了豐富的網(wǎng)絡文獻資源在數(shù)字人文服務平臺中的作用,漠視了網(wǎng)絡資源的集聚效應實際傳達出的社會公眾對自由、平等、開放數(shù)字人文服務平臺建設的公共需求。結(jié)果不僅會導致協(xié)同合作的數(shù)字人文服務平臺建設難以持續(xù),也會因為缺乏用戶參與和多主體參與而缺乏認同,演變成閉門造車式的自娛自樂。

      三是被動開放重于用戶需求,導致數(shù)字人文服務平臺建設的路徑本末倒置。目前數(shù)字人文服務平臺一方面把主要精力放在新功能的豐富和實驗上,對文本標引、詞頻統(tǒng)計、語義標記、文本對比、影像文字辨識等基礎功能、工具的升級更新研究不足,使用戶的參與度、參與數(shù)只是平臺功能自我驗證的實驗數(shù)據(jù)。另一方面,平臺旨在滿足用戶個性化的知識需求,但用戶需求又無法影響數(shù)字資源供給的范圍和水平,由此導致平臺數(shù)據(jù)質(zhì)量不高、數(shù)據(jù)間缺乏關聯(lián)等不足,會不斷帶來新的功能訴求。因此,只有把用戶需求作為數(shù)字人文服務平臺建設的基本,通過優(yōu)化知識服務模式,形成資源共建共享的高效分享機制,才有可能從根本上實現(xiàn)不同功能的合理實現(xiàn)與劃分。[5]

      四是項目式舉措多于科學規(guī)劃,導致數(shù)字人文服務平臺建設的穩(wěn)定保障不足。目前數(shù)字人文服務平臺的原始語料庫多是各類社科項目數(shù)據(jù)庫建設成果的衍生,具備學術創(chuàng)新,但由于多數(shù)屬于專題式、局部式、個人式的學術積累,缺乏宏觀的統(tǒng)籌設計和科學規(guī)劃,往往出現(xiàn)課題結(jié)項后數(shù)據(jù)庫關閉或停止更新維護,可持續(xù)性不足的情況。當前,一方面數(shù)據(jù)庫建設質(zhì)量、規(guī)模的參差不齊,分類體系、功能設置的不一致,銜接溝通、配合協(xié)調(diào)的缺乏,使得單一數(shù)據(jù)庫成為資源“孤島”,難以構建縱向貫通、橫向集成的數(shù)字人文服務平臺資源庫,實現(xiàn)量化研究和質(zhì)性研究的對話;[6]另一方面部分平臺建設缺乏數(shù)字人文和傳統(tǒng)研究方式的融通。人文學科具有特定的屬性,這些屬性對于數(shù)字人文的功能要求實際超出了文本間關聯(lián)的發(fā)現(xiàn),同時也對平臺設計者、維護者的素質(zhì)提出了更高的要求。

      三、民國檔案數(shù)字人文服務平臺的價值目標

      新《檔案法》不僅對“推進電子檔案管理信息系統(tǒng)建設,有條件的檔案館應當建設數(shù)字檔案館,國家推動檔案數(shù)字資源跨區(qū)域、跨部門共享利用”的主要任務做了明確部署,也深刻指出數(shù)字人文服務平臺的建設既包括檔案開放范圍、利用形式,還包括平臺建設的內(nèi)涵和基本原則。民國檔案數(shù)字人文服務平臺理應是工具價值和獨立價值兼具的系統(tǒng)平臺。

      共享共建。在民國檔案數(shù)字人文服務平臺建設中必須堅持公眾的主體地位。要樹立檔案活態(tài)保護、動態(tài)利用的服務理念,一切以維護公眾利用檔案的合法權益為根本,變“被動開放”為“主動開放”,最終走向“合作開放”,促進民國檔案開放利用制度化、規(guī)范化、程序化,在學術科研、社會服務等方面發(fā)展更加廣泛、更加充分、更加健全的共享共建機制。[7]

      精準公平。一方面,檔案部門絕不能只以“資源提供者”的角色參與到數(shù)字人文浪潮中,因為只有以公共服務部門為主導的數(shù)字人文項目才最有可能實現(xiàn)數(shù)字人文成果面向社會公眾的免費開放。另一方面,民國檔案數(shù)字人文服務平臺的建設也是檔案資源重新組織、配置的過程,必然面臨各方主體的不同利用需求,只有建立精準的用戶需求調(diào)查機制、公平的檔案資源利用機制,才能有效化解供需矛盾,讓檔案整理編研、開放利用的成果更精準地惠及每一名用戶,保障普通用戶平等參與共建過程,構建資源匹配精準、機會開放公平的數(shù)字人文服務平臺。

      多元活力。在當前學科劃分細化、學者跨界頻繁、學術交流深化、學術原創(chuàng)精神不斷拓展、學術視野更趨開闊的條件下,民國檔案數(shù)字人文服務平臺既要確保公共服務能力的最大化,堅守“為黨管檔、為國守史、為民服務”價值體系,確?;緝r值功能不受侵害,也要鼓勵社會多元,理解用戶多樣化和個性化的需求。特別是在數(shù)字人文服務功能的設置上,及時把合理的個性化訴求轉(zhuǎn)化為服務功能的創(chuàng)新,讓用戶和網(wǎng)絡文獻資源充滿生機活力,使民國檔案收集與開放保持動態(tài)平穩(wěn)狀態(tài)。[8]

      安全有序。民國檔案數(shù)字人文服務平臺的宗旨是確保檔案開放有序、檔案數(shù)據(jù)安全。面向社會化網(wǎng)絡的平臺建設并不是完全沒有潛在風險,因此要在共同遵循規(guī)則秩序的前提下將檔案安全風險控制在有限范圍內(nèi),用戶矛盾糾紛可以在統(tǒng)一的解決機制下獲得較快解決。[9]首先需要平臺具備完善的管理系統(tǒng),依靠身份管理、誠信管理、知識管理彌合由于信息不對稱、關系聯(lián)結(jié)松散帶來的風險形成;其次需要構建網(wǎng)絡環(huán)境下民國檔案資源建設的標準體系,包括收集、流轉(zhuǎn)、存儲、利用等方面的技術標準,以及檔案元數(shù)據(jù)標準;最后需要建立知識產(chǎn)權保護機制,運用數(shù)字版權管理技術,全過程保護平臺知識貢獻者的正當權益,防止知識產(chǎn)權的濫用。

      四、民國檔案數(shù)字人文服務平臺的功能定位

      民國檔案數(shù)字人文服務平臺是以滿足和維護公眾需求為核心,發(fā)揮各類主體作用,針對現(xiàn)有檔案開放利用中的不足,創(chuàng)新開放形式,強化服務功能,提高數(shù)字化水平,促進社會共享,推動民國檔案工作緊跟時代改革創(chuàng)新。[10]《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》鼓勵加大檔案資源跨領域、跨區(qū)域、跨層級整合力度,推動檔案數(shù)字資源跨區(qū)域、跨部門共享利用,具有很強的時代創(chuàng)新性和戰(zhàn)略指導性,為我們深刻理解民國檔案數(shù)字人文服務平臺在促進民國檔案開放利用中的功能定位提供了引導作用。[11]

      一是推進檔案治理能力現(xiàn)代化的先行示范。民國檔案開放利用體系在形式上體現(xiàn)為一系列規(guī)范機制的檔案管理制度,內(nèi)容涉及保管、修復、整理、信息化、編研、利用等六個方面,重點在于利用規(guī)則、開放形式、服務功能、協(xié)作方向、數(shù)字化內(nèi)容、信息安全的完善,實質(zhì)是通過運用民國檔案資源為國家機關和社會公眾開展有關問題研究提供文獻支持和便利,適應檔案管理體系和檔案治理能力現(xiàn)代化要求,實現(xiàn)民國檔案事業(yè)走向依法治理、走向開放、走向現(xiàn)代化。民國檔案開放利用能力,就是運用上述各項檔案管理體制機制推進民國檔案開放利用的水平和績效。[12]因為民國檔案開放利用能力反映了開放利用行為的水平和質(zhì)量,是對創(chuàng)新模式有效性、合理性和長期性的直觀度量。

      二是提升民國檔案開放利用實效的知識中心。民國檔案的開放利用由于經(jīng)過鑒定審查、劃控、審核等流程,與公共需求存在一定時間上的延滯。隨著近代史、抗戰(zhàn)史研究的日益精細化,對外交流合作的日益國際化,公眾閱文查檔的日益頻繁化,在加快民國檔案開放范圍擴大、開放方式轉(zhuǎn)變、利用形式多樣的過程中,必然面臨知識觀念深刻變化、協(xié)作方式深刻調(diào)整、檔案需求深刻變動等現(xiàn)實難題,能否正確處理好民國檔案事業(yè)發(fā)展與社會共享,數(shù)據(jù)化、全文化與檔案保護,用戶需求與檔案信息安全,需求增長與服務供給不足等開放利用問題,這既是構建民國檔案開放利用體系的基礎,也是提升民國檔案開放利用能力的前提。[13]

      三是民國檔案數(shù)字化成果集中展示的創(chuàng)新基地。民國檔案數(shù)字化建設,既包括發(fā)展檔案數(shù)字化工作,即數(shù)據(jù)信息挖掘、檔案史料眾包、檔案文件級目錄著錄、檔案信息安全等基本服務功能[14],也包括網(wǎng)絡文獻資料的采集、檔案編研數(shù)字化出版。這些既是民國檔案數(shù)字人文服務平臺的核心內(nèi)容,也是民國檔案開放利用的基礎。

      四是強化社會協(xié)同合作的共享平臺。其基本方向:一是以跨學科合作為利用方式。要實現(xiàn)民國檔案數(shù)字人文服務平臺的建設,必須建立一個以資源互通為基礎,以多維度協(xié)作為特征的多元統(tǒng)一的數(shù)字人文服務平臺結(jié)構。促進與博物館、地方館、科研院校等主體廣泛協(xié)作的制度化發(fā)展。二是資源主體趨于多元化,檔案保管機構必須與各種網(wǎng)絡文獻資源一起形成互補網(wǎng)絡,在共同開放利用的基礎上形成信息的重組與增值,共享檔案資源,并使各方共同獲益。[15]三是檔案資源向社會的回歸。檔案資源的開放利用過程不再是自上而下、由內(nèi)而外的,而是回歸社會和網(wǎng)絡之中成為服務者。

      五、民國檔案數(shù)字人文服務平臺的建設思路

      一是要完善跨學科研究體系??鐚W科研究既指在平臺建設中加入如文獻學、民俗學、人類學、經(jīng)濟學、教育學、敦煌學等不同學科領域的方法和數(shù)據(jù),也指在已有的海量文本數(shù)據(jù)挖掘中采用不同學科視角多維度、多粒度的提取文本數(shù)據(jù)中的知識信息??鐚W科研究體系是推進民國檔案數(shù)字人文服務平臺建設的基本保障,也是影響其建設質(zhì)量的制度基礎。

      二是要構建檔案整理開發(fā)自動化體系。自動化體系主要是指實現(xiàn)檔案整理開發(fā)自動化的技術保障和功能規(guī)則制度。檔案的整理開發(fā)如果缺乏實現(xiàn)識別檢錯、主題提取、自動分類等技術工具僅依靠人工進行文本字符的數(shù)字化,就很難充分發(fā)揮檔案資源的研究支持功能。首先,要建立民國檔案文獻語料庫,利用抽取民國公文、職官、機構、軍事、人名、區(qū)劃等,與異名別稱規(guī)則、分類規(guī)則、斷句標點規(guī)則、書法字體、圖片唱片等形成豐富的語料庫,為實現(xiàn)規(guī)范數(shù)據(jù)的重用和共享構建基礎;其次,要運用語料庫實現(xiàn)民國檔案整理與開發(fā)自動化。通過基數(shù)龐大的語料庫,組織編纂期刊論文索引、職官機構索引、卷宗主題索引等各類索引,構建起語料庫之間的元數(shù)據(jù)交叉聯(lián)系,并結(jié)合語言學方法,實現(xiàn)計算機的輔助識別、自動校勘、自動斷句,從而實現(xiàn)成果挖掘和知識增值功能。[16]

      三是要優(yōu)化知識服務體系。首先,要提升知識服務模式的共建化水平,平臺可以打通館藏資源和社會資源、工作人員與檔案館、讀者與工作人員之間的聯(lián)系,而且挖掘出廣大社會讀者的知識資源;其次,轉(zhuǎn)變?nèi)藛T服務角色,構建多主體協(xié)同供給機制。借助平臺可以實現(xiàn)知識資源的交換,實現(xiàn)用戶參與與知識貢獻的互動關系,逐步形成檔案館主導,多主體協(xié)同共建的知識聚合格局。[17]

      四是要加強網(wǎng)絡文獻資源采集和信息組織。首先要統(tǒng)一網(wǎng)絡文獻資源采集的標準規(guī)范。針對目前網(wǎng)絡文獻資源標引不規(guī)范導致難以二次開發(fā)利用的問題,探索建立“垂直典藏、專題建設、深層檢索”的元數(shù)據(jù)加工制度,實施分類管理;[18]其次構建網(wǎng)絡文獻資源的信息組織機制。檔案館作為知識的存儲機構,可以承擔對網(wǎng)絡文獻資源的采集與信息組織分析機制的探索,制定網(wǎng)絡文獻資源采集、編目、管理工作規(guī)范。引導社會公眾參與對網(wǎng)絡文獻資源的信息抽取、知識組織等環(huán)節(jié),引入網(wǎng)絡文獻資源觀察評估制度,編制網(wǎng)絡文獻資源的年度報告書,逐步建立起一個嵌入民國檔案數(shù)字人文服務平臺,與既有檔案資源數(shù)據(jù)相互補充的互聯(lián)網(wǎng)資源服務體系;最后,要建立網(wǎng)絡文獻資源采集的激勵機制。制定激勵公眾用戶參與網(wǎng)絡文獻資源發(fā)展的管理策略,運用欣賞激勵、獎勵激勵,鼓勵用戶在學習、交流中完成網(wǎng)絡文獻資源的轉(zhuǎn)移、留存和流動。[19]

      注釋與參考文獻

      [1]王東波.面向知識挖掘的平行句法語料庫構建研究[M].南京:南京大學出版社,2019:12-31.

      [2張超,韓家煒等.海量文本數(shù)據(jù)的多維挖掘[M].北京:機械工業(yè)出版社,2020:1-10.

      [3]王華.晚清民國華僑文獻整理與研究[M].廣州:廣東人民出版社,2021:448-459.

      [4]陳宇.應急保障視角下對網(wǎng)絡資源“集聚效應”的重新審視[J].高校圖書館工作.2020(5):50.

      [5]程靜.國內(nèi)外數(shù)字人文服務平臺建設現(xiàn)狀及思考[J].圖書館學研究. 2020(2):41-43.

      [6]周耀林,趙躍等.非物質(zhì)文化遺產(chǎn)檔案資源建設“群體智慧模式”[M].武漢:武漢大學出版社,2020:272-276.

      [7]陳果.面向網(wǎng)絡社區(qū)的領域知識聚合研究[M].北京:科學技術文獻出版社, 2019:30-35.

      [8]賀晨芝,張磊.圖書館數(shù)字人文眾包項目實踐[J].圖書館論壇. 2020(5):6-8.

      [9]左娜,張衛(wèi)東.面向數(shù)字人文的檔案資源整合模式構想:解構與重組[J].檔案學通訊. 2020(3):33-34.

      [10]唐燕,劉小榕等.智慧圖書館空間再造與數(shù)字人文服務創(chuàng)新研究[J].圖書館. 2020(5):74-76.

      [11]劉舒妍.以法治化促進檔案治理現(xiàn)代化[N].中國檔案報. 2020-12-10(3).

      [12]朱麗梅.檔案信息化建設的績效評價研究[D].華南理工大學,2014:24-27.

      [13]李明華.在全國檔案局長館長會議上的工作報告[J].中國檔案. 2019(4):25-28.

      [14]馬振犢,王俊明等.檔案數(shù)字化前整理工作的實踐研究[J].創(chuàng)新:檔案與文化強國建設——2014年檔案事業(yè)發(fā)展研究報告集. 2014:93-100.

      [15]馬費成.信息管理與信息系統(tǒng)研究進展第2輯[M].武漢:武漢大學出版社,2017:496-498.

      [16]王雅戈著.古籍計算機自動索引研究以民國農(nóng)業(yè)文獻自動索引為例[M].蕪湖:安徽師范大學出版社, 2013:2-6.

      [17]尉遲文珠.試論我國高校圖書館知識服務模式構建[D].天津師范大學,2007:27.

      [18]李曉明,馬寧寧.國家圖書館網(wǎng)絡信息采集的實踐與發(fā)展[J].網(wǎng)絡資源采集與數(shù)字資源長期保存學術研討會論文集. 2013:15-17.

      [19]陳鶴陽.眾包平臺用戶持續(xù)知識貢獻行為研究[M].2020:164-166.

      作者單位:中國第二歷史檔案館

      新和县| 通城县| 天柱县| 三都| 苏尼特右旗| 湘潭县| 翼城县| 离岛区| 邢台市| 平塘县| 得荣县| 尉氏县| 休宁县| 界首市| 那坡县| 黎城县| 盐城市| 济阳县| 错那县| 库车县| 文山县| 米林县| 康定县| 祁阳县| 云阳县| 乌什县| 若尔盖县| 筠连县| 连城县| 同心县| 广宁县| 樟树市| 临漳县| 澄迈县| 措勤县| 祁东县| 栾川县| 交城县| 彭山县| 瓦房店市| 贡山|