• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      數(shù)字人文視域下歷史檔案知識(shí)組織研究
      ——以五四運(yùn)動(dòng)為例

      2022-01-06 12:52:14孫振嘉
      蘭臺(tái)世界 2021年12期
      關(guān)鍵詞:五四運(yùn)動(dòng)實(shí)例本體

      孫振嘉 汪 澤 鄧 君

      一、引言

      數(shù)字人文(Digital Humanities)可以追溯到20世紀(jì)中期的人文計(jì)算,而人文計(jì)算則公認(rèn)源于Busa教父為Thomas Aquinas作品編制詞匯索引[1]190。從21世紀(jì)開(kāi)始,數(shù)字化技術(shù)、數(shù)據(jù)挖掘技術(shù)等的應(yīng)用推動(dòng)了數(shù)字人文研究的進(jìn)一步發(fā)展,更是推動(dòng)了歷史、藝術(shù)、考古等諸多人文社科類學(xué)科不斷嘗試使用新的技術(shù)和理念,以實(shí)現(xiàn)學(xué)科的新發(fā)展,檔案學(xué)領(lǐng)域也應(yīng)勢(shì)而為。

      近年來(lái),檔案領(lǐng)域數(shù)字人文研究成果不斷增加,馮惠玲等專家學(xué)者更是將其作為“十四五”檔案學(xué)重點(diǎn)研究領(lǐng)域之一[2]74。作為檔案的重要組成部分,歷史檔案資源是歷史事件的有機(jī)統(tǒng)一體,也是國(guó)家與民族發(fā)展的見(jiàn)證。數(shù)字人文視域下,如何有效利用數(shù)字技術(shù)對(duì)數(shù)量巨大、內(nèi)容龐雜多樣的歷史檔案資源進(jìn)行細(xì)粒度組織,實(shí)現(xiàn)歷史檔案資源有效組織與管理,是目前檔案學(xué)者需要解決的問(wèn)題之一。有關(guān)這一問(wèn)題的研究,有助于推動(dòng)人文學(xué)者對(duì)歷史檔案資源的深度開(kāi)發(fā)與利用,從而更好地實(shí)現(xiàn)該類檔案資源見(jiàn)證過(guò)去、服務(wù)現(xiàn)在和啟迪未來(lái)的重要作用。

      因此,本文以五四運(yùn)動(dòng)這一歷史檔案資源為研究對(duì)象,立足數(shù)字人文視角,應(yīng)用CIDOC-CRM本體模型,嘗試用層次化方式,以歷史事件為中心對(duì)其進(jìn)行知識(shí)組織研究,以較為全面有效地展現(xiàn)歷史事件的原本面貌及其相關(guān)要素間的關(guān)聯(lián),為歷史檔案資源開(kāi)發(fā)利用提供新的思路,實(shí)現(xiàn)歷史檔案資源的“活化”。

      二、文獻(xiàn)回顧

      隨著數(shù)字技術(shù)的更新迭代,數(shù)字人文研究的不斷深入,引起了檔案領(lǐng)域?qū)<覍W(xué)者的重點(diǎn)關(guān)注,數(shù)字檔案和歷史檔案是數(shù)字人文研究的對(duì)象與熱點(diǎn)之一[3]1。檔案是較早與數(shù)字人文交融的學(xué)科,其研究主題主要體現(xiàn)在兩者關(guān)系探究、檔案數(shù)字人文項(xiàng)目、面向數(shù)字人文的檔案資源開(kāi)發(fā)利用等方面。兩者關(guān)系研究方面,左娜、張衛(wèi)東從學(xué)科建設(shè)角度,由“跟風(fēng)論”的觀點(diǎn)出發(fā),梳理了數(shù)字人文與檔案學(xué)研究之間的邏輯關(guān)系[4]94;龍家慶等立足數(shù)字人文背景,分析其對(duì)檔案工作思維方式、技術(shù)工具、業(yè)務(wù)流程和研究思路及議題的影響[5]4;牛力等從檔案工作角度總結(jié)了檔案參與數(shù)字人文建設(shè)的五種模式[6]62。在檔案數(shù)字人文項(xiàng)目方面,有學(xué)者通過(guò)對(duì)美國(guó)馬里蘭州檔案館奴隸制文化遺產(chǎn)項(xiàng)目[7]21、“歐洲時(shí)光機(jī)”項(xiàng)目[8]10等進(jìn)行分析,為國(guó)內(nèi)開(kāi)展檔案數(shù)字人文實(shí)踐提供了借鑒;國(guó)內(nèi)也涌現(xiàn)出了一部分以“北京記憶”項(xiàng)目[9]、“數(shù)字敦煌”項(xiàng)目[10]等為代表的中國(guó)特色的數(shù)字人文項(xiàng)目。不僅如此,學(xué)者們還聚焦檔案資源的組織、開(kāi)發(fā)利用,探討其理論與路徑,如賈瓊等提出從元數(shù)據(jù)描述、元數(shù)據(jù)—本體映射、RDF數(shù)據(jù)發(fā)布、語(yǔ)義聚合與訪問(wèn)層面實(shí)現(xiàn)檔案資源聚合與組織[11]105;牛力等提出了數(shù)字人文下檔案資源“發(fā)現(xiàn)”“重構(gòu)”和“故事化”為主線的檔案研究路徑[12]88。而在具體檔案資源開(kāi)發(fā)利用方面,學(xué)者們借助數(shù)據(jù)庫(kù)、文本挖掘、可視化、語(yǔ)義檢索等數(shù)字技術(shù)和工具,以案例分析的方式,對(duì)抗戰(zhàn)檔案資源[13]111、傳統(tǒng)家譜檔案資源[14]72、清代職官檔案資源[15]18、僑批檔案資源[16]83等進(jìn)行了研究,很大程度上為數(shù)字檔案和歷史檔案“變藏為用”提供了借鑒。

      在歷史檔案開(kāi)發(fā)的諸多成果中,部分學(xué)者們應(yīng)用本體方法對(duì)多樣的歷史檔案開(kāi)展了知識(shí)組織與關(guān)聯(lián)研究。例如,鄧君等結(jié)合口述歷史檔案資源特征,構(gòu)建了口述歷史檔案資源領(lǐng)域本體,檢驗(yàn)了本體實(shí)現(xiàn)口述歷史檔案信息組織關(guān)聯(lián)的可行性和實(shí)用性[17]58。Koho等利用本體方法,重建了整個(gè)WarSampo知識(shí)圖(KG),對(duì)有關(guān)第二次世界大戰(zhàn)的異構(gòu)芬蘭歷史資源進(jìn)行知識(shí)描述和組織[18]265。除此之外,還有部分專家借助本體方法在檔案著錄[19]100、檔案編研[20]138、檔案知識(shí)庫(kù)構(gòu)建[21]51等方面也取得了重要成果,為檔案科研及智慧檔案管理的實(shí)踐賦能。FOAF[22]、SEM[23]128、RiC-CM(即檔案情境信息概念模型)[24]49、CIDOC-CRM[25]等一系列通用本體模型吸引學(xué)者廣泛探討。其中CIDOC-CRM這一模型的應(yīng)用主要集中于文化遺產(chǎn)、考古學(xué)等領(lǐng)域,學(xué)者們不僅立足于宏觀視角,將該模型應(yīng)用于博物館文物數(shù)字化元數(shù)據(jù)規(guī)范[26]131、數(shù)字時(shí)代考古資源組織共享[27]1等,還結(jié)合該模型特點(diǎn)對(duì)民族傳統(tǒng)節(jié)日[28]、宗教建筑遺產(chǎn)信息[29]、第一次世界大戰(zhàn)史料[30]、先秦人物史料[31]、近代人物史料[32]35等微觀具體領(lǐng)域資源進(jìn)行知識(shí)組織研究。

      綜上所述,人文學(xué)者立足數(shù)字人文背景,利用相關(guān)技術(shù)工具,對(duì)數(shù)字檔案和歷史檔案展開(kāi)了豐富的研究。雖然本體方法在歷史檔案資源相關(guān)研究中獲得學(xué)者青睞,但在文化遺產(chǎn)和考古等領(lǐng)域中表現(xiàn)突出的CIDOC-CRM本體模型直接用于歷史檔案資源知識(shí)組織的探索略顯不足。因此,本文利用CIDOC-CRM本體模型,以五四運(yùn)動(dòng)相關(guān)檔案資源為例構(gòu)建歷史檔案資源本體模型,并以實(shí)例可視化方式進(jìn)行展示和驗(yàn)證,嘗試以事件為基礎(chǔ)的方式對(duì)歷史檔案資源進(jìn)行語(yǔ)義層面的細(xì)粒度知識(shí)組織。

      三、研究方法及相關(guān)概念

      1.本體。本體一詞本是哲學(xué)子領(lǐng)域的一個(gè)名詞,屬于形而上學(xué)的一個(gè)分支,其注重識(shí)別現(xiàn)實(shí)存在事物的類別,并對(duì)它們進(jìn)行描述。后來(lái)隨著計(jì)算機(jī)等技術(shù)的發(fā)展,其被引入到科學(xué)研究的諸多領(lǐng)域,并被賦予了有別于原始含義的具體技術(shù)意義。Studer等學(xué)者對(duì)本體進(jìn)行深入研究后,對(duì)其概念進(jìn)行了總結(jié),即本體是共享概念模型明確的形式化規(guī)范說(shuō)明[33]161。本體通過(guò)定義類、屬性等要素賦予數(shù)據(jù)語(yǔ)義關(guān)系,對(duì)相應(yīng)知識(shí)集合實(shí)現(xiàn)細(xì)粒度的描述與歸納[34]36。因此,借助此方法,選用應(yīng)用較為廣泛、重用和共享價(jià)值較高的本體模型,可以更好地進(jìn)行歷史檔案資源的知識(shí)組織研究。

      2.CIDOC-CRM本體模型。CIDOC-CRM是國(guó)際文獻(xiàn)委員會(huì)(CIDOC)通過(guò)十多年標(biāo)準(zhǔn)開(kāi)發(fā)工作而構(gòu)建的概念參考模型,它旨在實(shí)現(xiàn)各種異構(gòu)文化遺產(chǎn)知識(shí)、信息資源的交互與集成[25]。目前,于2021年5月發(fā)布了最新版Version 7.1.1(見(jiàn)圖1),該版本定義了81個(gè)類、160個(gè)屬性。CIDOC-CRM定義了E2 Temporal Entity、E52 Time-Span、E53 Place、E54 Dimension、E59 Primi tive等7個(gè)核心類。

      圖1 CIDOC-CRM概念模型結(jié)構(gòu)圖

      CIDOC-CRM本體包含的類與屬性雖呈現(xiàn)出復(fù)雜、多樣的特點(diǎn),但依靠明確的邏輯語(yǔ)義能更好地實(shí)現(xiàn)對(duì)知識(shí)對(duì)象的表達(dá)。這也使其呈現(xiàn)出了一些簡(jiǎn)單本體無(wú)法具備的優(yōu)勢(shì)。

      (1)較細(xì)致的規(guī)范性。CIDOC-CRM中類(Class)用“E+數(shù)字”形式表示,如E1 CRM Entity表示“CRM實(shí)體”、E5 Event表示“事件”;屬性(Property)用“P+數(shù)字”形式進(jìn)行標(biāo)識(shí),用于連接屬性兩端的兩個(gè)類,前者稱為“域”,后者稱為“范圍”,如E1 CRM Entity.P2 has type:E55 Type表示“CRM實(shí)體的類型為……”CIDOC-CRM通過(guò)規(guī)范化方式,可以從時(shí)空、地理、政治等多個(gè)角度,充分展現(xiàn)歷史活動(dòng)起源、演變的過(guò)程,從而實(shí)現(xiàn)對(duì)單一復(fù)雜歷史事件檔案信息資源的動(dòng)態(tài)描述。

      (2)極強(qiáng)的可擴(kuò)展性。CIDOC-CRM的可擴(kuò)展性是其能夠處理跨領(lǐng)域、異構(gòu)信息資源的重要因素之一。這也意味著,該特點(diǎn)能夠更好地迎合利用者的需求或跟進(jìn)時(shí)代發(fā)展的新側(cè)重點(diǎn)去新增一些類或?qū)傩?,如此就能更好地保證對(duì)歷史檔案資源的有效描述和組織[35]40。

      (3)較好的針對(duì)性。CIDOC-CRM預(yù)期使用范圍覆蓋了用于交換和整合博物館藏品的異構(gòu)科學(xué)文獻(xiàn)所需的所有信息,廣泛應(yīng)用于文化遺產(chǎn)領(lǐng)域,可以更好地對(duì)歷史事件檔案資源展開(kāi)組織、描述。

      綜上,從CIDOC-CRM的特點(diǎn)可知,該模型中與事件相關(guān)的類含義十分廣泛,包含了出生、死亡、遷移等一系列的事件,這也決定了其能從事件角度去實(shí)現(xiàn)歷史檔案資源知識(shí)組織的特性。復(fù)用該本體對(duì)歷史事件檔案資源進(jìn)行語(yǔ)義化描述和組織,可以有效地、深層次地展現(xiàn)歷史事件整體面貌,進(jìn)一步實(shí)現(xiàn)對(duì)歷史檔案的細(xì)粒度組織和管理。

      四、歷史檔案資源知識(shí)組織——以五四運(yùn)動(dòng)為例

      1.五四運(yùn)動(dòng)歷史檔案資源。五四運(yùn)動(dòng)又稱“五四風(fēng)雷”,是典型的、參與主體廣泛、形式多樣的復(fù)雜歷史事件。五四運(yùn)動(dòng)檔案資源是包含其“導(dǎo)火線”“運(yùn)動(dòng)擴(kuò)展”等所有具有直接關(guān)系歷史事件的檔案資源在內(nèi)的檔案集合。首先,該事件檔案資源具有顯著的連續(xù)性、層次化特征,其包含了五四運(yùn)動(dòng)“爆發(fā)”“發(fā)展”“高潮”到“結(jié)束”的各個(gè)子過(guò)程。其次,該事件檔案資源具有多樣性的特點(diǎn)。從來(lái)源來(lái)看,主要有當(dāng)時(shí)報(bào)刊檔案、親歷者的口述和評(píng)議形成的檔案、已保存的館藏檔案三類[36]40。這一特點(diǎn)也使得人文學(xué)者可以從不同的側(cè)面了解整個(gè)歷史事件的情況。從檔案形式來(lái)看,主要分為文字類、視頻照片類、畫作類三種,其中以文字類檔案居多。另外,這部分檔案資源還具有一定分散性和異構(gòu)性。由于五四運(yùn)動(dòng)影響范圍廣泛,許多地方機(jī)構(gòu)都有相關(guān)的檔案資源,之后更是有部分革命家、學(xué)者等群體對(duì)其進(jìn)行過(guò)回憶性的描述,這些檔案資源依據(jù)不同的分類標(biāo)準(zhǔn)和規(guī)則分別存儲(chǔ)在當(dāng)?shù)氐臋n案館、圖書館或博物館。

      由此可見(jiàn),五四運(yùn)動(dòng)歷史檔案資源特點(diǎn)與CIDOC-CRM本體模型功能性特征十分契合,利用本體方法復(fù)用CIDOC-CRM模型可以實(shí)現(xiàn)部分資源語(yǔ)義化組織和描述,有助于日后對(duì)該類資源的開(kāi)發(fā)和利用、開(kāi)展智能化檔案服務(wù)。

      2.五四運(yùn)動(dòng)歷史檔案資源本體核心類及屬性構(gòu)建。為清晰呈現(xiàn)五四運(yùn)動(dòng)事件概況,筆者基于CIDOC-CRM模型,結(jié)合該事件及相關(guān)檔案資源特點(diǎn)定義了7個(gè)核心類(表1,見(jiàn)下頁(yè)),從人、時(shí)、地、物等多維層面確切反映該歷史事件的狀態(tài)及過(guò)程。

      表1 五四運(yùn)動(dòng)歷史檔案資源本體核心類及其說(shuō)明

      事件屬性(E5 Event),是指在特定的時(shí)空條件下,歷史主體實(shí)施的具有持續(xù)性或時(shí)空跨度相對(duì)較大的行為,即用于表示較為復(fù)雜的歷史事件類。該類所表征的歷史事件主要是在宏觀把握歷史脈絡(luò)時(shí)不可或缺的歷史“節(jié)點(diǎn)”,在本文研究中特指五四運(yùn)動(dòng)這一實(shí)例。

      活動(dòng)屬性(E7 Activity),特指歷史人物或組織在一定時(shí)空條件下發(fā)生的一個(gè)短暫性的或持續(xù)時(shí)間相對(duì)較短的行為,可以將其視為表征較為簡(jiǎn)單的歷史事件的類。而這些簡(jiǎn)單事件是構(gòu)成五四運(yùn)動(dòng)史實(shí)的基本單元,其相關(guān)檔案更是開(kāi)展該事件歷史研究的重要語(yǔ)料,是實(shí)現(xiàn)復(fù)雜歷史事件檔案資源組織和描述的核心。五四運(yùn)動(dòng)歷史檔案資源從北洋政府、親歷人員等不同角度反映了學(xué)生罷課、商人罷市、工人罷工、政府鎮(zhèn)壓等活動(dòng)的事實(shí)情況,如北京學(xué)生集體罷課、上海工人罷市、北洋軍閥政府逮捕游行學(xué)生等。

      時(shí)間屬性(E52 Time-Span),是事件屬性和活動(dòng)屬性的基本特征。利用該屬性,可以實(shí)現(xiàn)對(duì)各個(gè)活動(dòng)的順序串聯(lián),以展現(xiàn)整個(gè)歷史事件的演變過(guò)程,實(shí)現(xiàn)對(duì)檔案資源的有序組織。當(dāng)然,該屬性可通過(guò)特定時(shí)間點(diǎn)或時(shí)間段與資源對(duì)象中的大小事件實(shí)現(xiàn)對(duì)應(yīng)。例如,五四當(dāng)日北京學(xué)生天安門游行(1919年5月4日下午1時(shí))、大規(guī)模罷工(1919年6月6-8日)。

      地點(diǎn)屬性(E53 Place),即事件參與者在執(zhí)行某一活動(dòng)時(shí)所處的空間地理位置或空間范圍。就歷史研究來(lái)說(shuō),對(duì)其時(shí)空信息的研究極為重要。例如,在對(duì)五四運(yùn)動(dòng)相關(guān)檔案的研究中發(fā)現(xiàn),各地曾發(fā)起過(guò)聲援北京學(xué)生運(yùn)動(dòng)的愛(ài)國(guó)活動(dòng)。比如,遼寧學(xué)生群體開(kāi)展響應(yīng)活動(dòng),奉天(今沈陽(yáng)市)當(dāng)局對(duì)進(jìn)步思想和學(xué)生運(yùn)動(dòng)進(jìn)行鎮(zhèn)壓與防范;閻錫山當(dāng)局對(duì)山西兩次學(xué)生運(yùn)動(dòng)進(jìn)行壓制與約束。借助特定的空間范圍和五四運(yùn)動(dòng)期間相關(guān)史實(shí),可以有效推知不同地點(diǎn)當(dāng)局政府對(duì)相關(guān)愛(ài)國(guó)活動(dòng)的情感態(tài)度[37]21。

      參與者屬性(E39 Actor),即在一定時(shí)空條件下,某一行為的發(fā)出者、某一活動(dòng)的實(shí)施主體。在歷史事件中,其發(fā)起者可為單一個(gè)體或一個(gè)團(tuán)體組織,也可為多個(gè)個(gè)體或多個(gè)組織。由于個(gè)體和組織存有不同的特點(diǎn),筆者對(duì)二者予以區(qū)分,在參與者屬性之下復(fù)用了人物(E21 Person)和組織(E74 Group)兩個(gè)概念屬性,作為其子屬性。實(shí)施主體的實(shí)例分別添加于相應(yīng)的子屬性之下,這也為實(shí)現(xiàn)個(gè)體與一些組織的關(guān)聯(lián)奠定了基礎(chǔ)。五四運(yùn)動(dòng)中人物屬性的實(shí)例包括蔡元培、梁?jiǎn)⒊㈥惇?dú)秀、羅家倫、林長(zhǎng)民等,組織屬性的實(shí)例包含北洋軍閥政府、京師檢察廳、上海學(xué)生聯(lián)合會(huì)、新潮社等。

      佐證材料屬性(E31 Document),即資源對(duì)象所涉及的文本、圖像、視頻等記錄,用于證明活動(dòng)的真實(shí)情況。同時(shí)該類相關(guān)的實(shí)例是開(kāi)展知識(shí)組織研究的重要基礎(chǔ),是還原歷史、研究歷史的重要基礎(chǔ)。例如,1919年5月22日《申報(bào)》7版《京學(xué)界重行罷課》對(duì)當(dāng)時(shí)學(xué)生運(yùn)動(dòng)的報(bào)道,即在5月4日以后,學(xué)生罷課的活動(dòng)仍在醞釀之中,并且進(jìn)一步呈現(xiàn)擴(kuò)大的趨勢(shì)。

      類型屬性(E55 Type),用于表征事件或者檔案資源的類型,其實(shí)例是活動(dòng)屬性和佐證材料屬性的實(shí)例與其所屬范疇、類型的集合。從資源對(duì)象來(lái)看,其事件類型主要有活動(dòng)謀劃、示威游行、請(qǐng)?jiān)?、罷課、罷工、罷市、暴力對(duì)抗政府、政府鎮(zhèn)壓等多種形式;其佐證材料類型主要包括親歷者口述和評(píng)議形成檔案、所存檔案(其中包括政府所存文字類檔案、照片視頻類檔案)、報(bào)刊報(bào)道檔案三類。

      為清晰明辨復(fù)雜事件的體系結(jié)構(gòu)以及簡(jiǎn)單事件相關(guān)要素之間的語(yǔ)義關(guān)系,筆者同時(shí)復(fù)用CIDOC-CRM模型的部分關(guān)系屬性,構(gòu)建特定活動(dòng)與相關(guān)要素之間的對(duì)應(yīng)關(guān)系,見(jiàn)表2。

      表2 五四運(yùn)動(dòng)歷史檔案資源本體關(guān)系屬性及其說(shuō)明

      根據(jù)上述類和關(guān)系屬性構(gòu)建五四運(yùn)動(dòng)歷史檔案資源本體(見(jiàn)圖2),以實(shí)現(xiàn)相關(guān)事件單元和檔案資源組織可視化,為同類歷史事件檔案資源開(kāi)發(fā)利用提供參考。圖2中,實(shí)線用于表示“上位類”和“下位類”間的層次關(guān)系,虛線則用于表示“類”之間的關(guān)聯(lián)(即關(guān)系屬性)。

      圖2 五四運(yùn)動(dòng)歷史檔案資源本體模型

      3.五四運(yùn)動(dòng)史料資源本體模型實(shí)例可視化。資源對(duì)象的實(shí)例化是為用戶提供語(yǔ)義化檢索服務(wù)的重要基礎(chǔ),而可視化是為了讓用戶以更為直觀的方式了解信息檢索結(jié)果。根據(jù)前文構(gòu)建的框架模型,本文以北京市檔案館2019年國(guó)家重點(diǎn)檔案保護(hù)與開(kāi)發(fā)項(xiàng)目成果《五四運(yùn)動(dòng)檔案史料選編》[38]、湖南省青蘋果數(shù)據(jù)中心華文報(bào)刊文獻(xiàn)數(shù)據(jù)庫(kù)[39]為數(shù)據(jù)源,利用Protege進(jìn)行實(shí)例添加,如圖3。

      圖3 五四運(yùn)動(dòng)歷史檔案資源本體實(shí)例可視化

      鑒于五四運(yùn)動(dòng)中涉及的參與者、佐證史料數(shù)量眾多,內(nèi)容較為復(fù)雜,考慮到用戶多層次性、需求的多樣性,為方便知識(shí)利用者直觀獲取相關(guān)資源,筆者利用Protege軟件的comment屬性為相應(yīng)的概念屬性和實(shí)例添加注釋。在E31佐證材料、E21人物類下的各實(shí)例中,以注釋方式分別添加了檔案材料內(nèi)容和參與人信息等相關(guān)內(nèi)容,如圖4、圖5。人文學(xué)者通過(guò)閱讀注釋起到與閱讀檔案原材料一樣的效果,也可借助具體事件與實(shí)例之間的關(guān)聯(lián),結(jié)合注釋內(nèi)容,更好地深入了解當(dāng)時(shí)的歷史環(huán)境。當(dāng)然,也能為相關(guān)檔案資源的進(jìn)一步開(kāi)發(fā)利用做好數(shù)據(jù)準(zhǔn)備。

      圖4 佐證材料實(shí)例具體內(nèi)容注釋

      圖5 人物實(shí)例基本情況注釋

      為進(jìn)一步驗(yàn)證該本體模型的可行性和實(shí)用性,筆者以“火燒趙家樓痛打章宗祥”為檢索詞進(jìn)行知識(shí)查詢,檢索結(jié)果見(jiàn)圖6。實(shí)線表示類與實(shí)例之間的關(guān)系,虛線則用于表示各個(gè)類的實(shí)例之間的關(guān)聯(lián)。

      圖6 按照單一簡(jiǎn)單事件檢索結(jié)果可視化

      結(jié)合圖6,可以得出“火燒趙家樓痛打章宗祥”這一事件的語(yǔ)義信息:“火燒趙家樓痛打章宗祥”是五四運(yùn)動(dòng)中暴力對(duì)抗政府的事件,發(fā)生于1919年5月4日下午,地點(diǎn)在北京趙家樓,傅斯年、段錫朋、匡互生、鄧中夏、章宗祥為主要參與人,此事件也直接推動(dòng)了“政府逮捕學(xué)生,鎮(zhèn)壓學(xué)生運(yùn)動(dòng)”事件的發(fā)生,而《章宗祥傷勢(shì)診斷書》《京師地方審判廳訊問(wèn)保安隊(duì)排長(zhǎng)何文貴的筆錄》《趙惠全關(guān)于章宗祥被打情形的報(bào)告》等佐證材料反映了事件的實(shí)際情況。就可視化結(jié)果表達(dá)的信息而言,除了能了解到該事件的一些基本要素外,還可以看出該事件的佐證材料涉及了京師審判廳、醫(yī)院、京師檢查廳和京師警察廳等多個(gè)檔案形成者。可見(jiàn),該事件在當(dāng)時(shí)社會(huì)環(huán)境下引發(fā)了強(qiáng)烈轟動(dòng)。另外,該結(jié)果中所表達(dá)的事件間的推動(dòng)關(guān)系,更容易讓用戶從橫向的角度去動(dòng)態(tài)感知?dú)v史事件的發(fā)展趨勢(shì)。

      由上述實(shí)例可視化檢驗(yàn)結(jié)果可知,本文基于CIDOC-CRM構(gòu)建的本體模型可以實(shí)現(xiàn)對(duì)歷史檔案資源的知識(shí)描述和知識(shí)組織,也實(shí)現(xiàn)了計(jì)算機(jī)對(duì)數(shù)據(jù)間語(yǔ)義關(guān)系的理解。該過(guò)程能圍繞單一復(fù)雜歷史事件進(jìn)行相關(guān)檔案資源的知識(shí)聚類,為用戶檢索的關(guān)聯(lián)性、準(zhǔn)確性提供了有力支撐。當(dāng)然,結(jié)合特定的歷史事件檔案的特征及所構(gòu)建模型的可擴(kuò)展性,新增相應(yīng)的類(Class)及關(guān)系屬性(Property),有助于滿足用戶多樣化需求,也能更好地推動(dòng)相關(guān)研究人員對(duì)資源對(duì)象的深層次挖掘和開(kāi)發(fā)。

      數(shù)字人文浪潮下,信息數(shù)量以爆炸式速度增長(zhǎng),龐大的數(shù)據(jù)量與用戶想要快捷準(zhǔn)確獲取知識(shí)資源的需求之間的矛盾日益凸顯。在檔案資源的開(kāi)發(fā)和利用中也面臨同樣的問(wèn)題,而知識(shí)組織是實(shí)現(xiàn)檔案資源結(jié)構(gòu)化、檔案檢索便捷化、檢索結(jié)果準(zhǔn)確化、檔案服務(wù)智能化的重要方法之一。通過(guò)利用本體等研究方法為檔案資源建立語(yǔ)義層面上的關(guān)聯(lián),對(duì)檔案資源的細(xì)粒度、層次化管理和高效開(kāi)發(fā)利用大有裨益。

      本文通過(guò)復(fù)用CIDOC-CRM概念模型構(gòu)建五四運(yùn)動(dòng)歷史檔案資源本體,將所涉的知識(shí)單元以“事件”為中心進(jìn)行結(jié)構(gòu)化、語(yǔ)義化組織,揭示了主體要素、時(shí)間要素、空間要素、信息資源要素與特定事件的關(guān)聯(lián),借由這些相關(guān)關(guān)系可以從不同角度去定位用戶所需信息,對(duì)知識(shí)對(duì)象整體和檢索結(jié)果以可視化方式呈現(xiàn)。

      本研究構(gòu)建的五四運(yùn)動(dòng)歷史檔案資源本體是充分發(fā)揮CIDOC-CRM概念模型在歷史事件描述方面的功能性特征,實(shí)現(xiàn)相關(guān)歷史檔案資源知識(shí)描述與組織的一次有益嘗試。筆者認(rèn)為,未來(lái)數(shù)字人文視域下,歷史檔案資源知識(shí)組織研究可以從以下四個(gè)方面推進(jìn):一是結(jié)合典型的通用語(yǔ)義模型、元數(shù)據(jù)模型,抽取其中的部分屬性,來(lái)進(jìn)一步豐富對(duì)歷史檔案知識(shí)單元的語(yǔ)義化描述和組織;二是結(jié)合知識(shí)圖譜、關(guān)聯(lián)數(shù)據(jù)技術(shù)方法,深入挖掘歷史檔案資源,更全面地呈現(xiàn)歷史事件發(fā)展演變過(guò)程;三是綜合現(xiàn)有知識(shí)資源,利用數(shù)據(jù)庫(kù)和網(wǎng)絡(luò)技術(shù),構(gòu)建面向歷史事件知識(shí)的GLAM(美術(shù)館、圖書館、檔案館、博物館)融合數(shù)據(jù)平臺(tái);四是利用語(yǔ)義分析技術(shù),結(jié)合統(tǒng)計(jì)學(xué)、計(jì)量學(xué)的學(xué)科理論與方法,依據(jù)歷史事件間的關(guān)聯(lián)節(jié)點(diǎn)數(shù)量、檔案資料涉及某事件頻次等的不同賦予相應(yīng)權(quán)重,用定量的方法去衡量一個(gè)歷史事件的重要性或影響力,以更好地抓住復(fù)雜歷史事件的重要轉(zhuǎn)折點(diǎn),為人文學(xué)者借助歷史檔案開(kāi)展歷史研究賦以羽翼。

      猜你喜歡
      五四運(yùn)動(dòng)實(shí)例本體
      Abstracts and Key Words
      百年大黨 壯闊歷程 《五四運(yùn)動(dòng)》
      黨員文摘(2022年11期)2022-06-10 07:33:14
      對(duì)姜夔自度曲音樂(lè)本體的現(xiàn)代解讀
      論五四運(yùn)動(dòng)的啟蒙辯證法
      《過(guò)五四運(yùn)動(dòng)趙家樓》
      《我應(yīng)該感到自豪才對(duì)》的本體性教學(xué)內(nèi)容及啟示
      95年前的“五四運(yùn)動(dòng)”
      齊魯周刊(2014年16期)2014-05-07 10:52:55
      完形填空Ⅱ
      完形填空Ⅰ
      Care about the virtue moral education
      卷宗(2013年6期)2013-10-21 21:07:52
      舒城县| 锦州市| 湖南省| 天全县| 沁源县| 蓬安县| 姜堰市| 清水县| 西乌珠穆沁旗| 阜新| 渑池县| 屏东县| 娄底市| 虎林市| 仲巴县| 木兰县| 湛江市| 吉木乃县| 慈溪市| 泸西县| 平乡县| 休宁县| 乳山市| 海南省| 镇原县| 乡宁县| 湖州市| 旌德县| 鄄城县| 桂阳县| 增城市| 金湖县| 湖口县| 潢川县| 宝应县| 古浪县| 南昌县| 外汇| 渭源县| 毕节市| 寿光市|