• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      知識圖譜在數(shù)字資源開發(fā)與利用中的應(yīng)用研究

      2022-07-10 23:29:35孫安
      河南圖書館學(xué)刊 2022年6期
      關(guān)鍵詞:數(shù)字資源知識圖譜

      孫安

      關(guān)鍵詞:知識圖譜;數(shù)字資源;知識組織;語義化建設(shè)

      摘 要:知識圖譜強(qiáng)大的語義數(shù)據(jù)表示能力與智能化的語義數(shù)據(jù)檢索能力深受數(shù)字資源組織青睞。文章闡述了知識圖譜的概念,介紹了數(shù)字資源建設(shè)發(fā)展概況,構(gòu)建了基于知識圖譜的數(shù)字資源開發(fā)與利用的技術(shù)體系,總結(jié)了知識圖譜在數(shù)字資源開發(fā)與利用中的特點(diǎn),以期為相關(guān)研究提供參考。

      中圖分類號:G250.7 文獻(xiàn)標(biāo)識碼:A 文章編號:1003-1588(2022)06-0121-05

      自2012年5月Google公司提出“知識圖譜”概念后,知識圖譜強(qiáng)大的語義數(shù)據(jù)表示能力與智能化的語義數(shù)據(jù)檢索能力深受數(shù)字資源組織青睞。近年來,數(shù)字人文研究熱不斷升溫,圖書館作為文獻(xiàn)信息資源的集中地,逐漸在該領(lǐng)域顯現(xiàn)出“數(shù)字資源占有”這一獨(dú)特優(yōu)勢,涌現(xiàn)出大量圍繞數(shù)字人文數(shù)據(jù)基礎(chǔ)設(shè)施平臺建設(shè)的相關(guān)研究成果,主要討論如何將信息資源進(jìn)行數(shù)字化、數(shù)據(jù)化、語義化轉(zhuǎn)變,以滿足人文研究與數(shù)字計(jì)算等服務(wù)要求,這給圖書館的數(shù)字資源開發(fā)與利用工作帶來了機(jī)遇與挑戰(zhàn)[1]。

      然而,學(xué)界給“知識圖譜”概念賦予了多種含義,不同領(lǐng)域研究的知識圖譜其概念所指與研究方法差異頗大。文章首先理清了知識圖譜在圖書情報(bào)領(lǐng)域中的概念內(nèi)涵,并指出筆者研究的知識圖譜屬于知識組織領(lǐng)域范疇;其次分析數(shù)字資源建設(shè)發(fā)展的三個(gè)階段,指出當(dāng)前本體、知識圖譜、自然語言處理等語義技術(shù)被廣泛應(yīng)用于數(shù)字資源的知識組織與語義描述中;再次討論了基于知識圖譜的數(shù)字資源開發(fā)與利用工作的關(guān)鍵步驟;最后對知識圖譜在圖書館學(xué)領(lǐng)域的應(yīng)用實(shí)踐特點(diǎn)進(jìn)行了總結(jié),并展望了知識圖譜未來的發(fā)展趨勢及其研究任務(wù)。本研究可為當(dāng)前圖書館、檔案館、博物館的數(shù)字資源建設(shè)提供技術(shù)與理論指引。

      1 知識圖譜概念闡述

      知識圖譜在學(xué)界被賦予了多種含義且涉及不同研究領(lǐng)域,主要有兩類:第一類為科學(xué)學(xué)研究范疇中的科學(xué)知識圖譜,簡稱知識圖譜(Knowledge Mapping,KM)。該研究領(lǐng)域主要關(guān)注科學(xué)研究發(fā)展動(dòng)態(tài)及趨勢、科學(xué)熱點(diǎn)問題以及科研合作狀況。其概念可被定義為:用可視化的方式描述人類隨時(shí)間擁有的知識資源及其載體;繪制、挖掘、分析和顯示科學(xué)技術(shù)知識以及它們之間的相互聯(lián)系,在組織內(nèi)創(chuàng)造知識共享的環(huán)境以促進(jìn)科學(xué)技術(shù)研究的合作和深入[2]。研究方法主要有:引文分析、共現(xiàn)分析、統(tǒng)計(jì)分析、聚類分析等。圖譜類型不限,主要有:點(diǎn)狀圖、球狀圖、根狀圖、節(jié)點(diǎn)聯(lián)系圖、聚類圖、時(shí)間坐標(biāo)系、戰(zhàn)略坐標(biāo)系等一系列可視化圖譜[3]。

      第二類為知識組織研究范疇中的知識圖譜(Knowledge Graph,KG),由Google公司阿密特·辛格(Amit Singhal)于2012年5月在公司官方微博上發(fā)表的“Introducing the Knowledge Graph: things,not strings”一文中正式提出,它以圖數(shù)據(jù)模型來組織互聯(lián)網(wǎng)中的海量數(shù)據(jù),并通過概念(concept)、實(shí)體(entity)及其之間的相互關(guān)系(relation)描述客觀世界中的萬事萬物,實(shí)現(xiàn)了對客觀世界從簡單字符串描述向結(jié)構(gòu)化語義描述的轉(zhuǎn)變(things,not strings),因此也被稱為語義知識圖譜[4]。其研究方法主要有2類:基于本體建模+RDF三元組圖模型方法(來源于關(guān)聯(lián)數(shù)據(jù)技術(shù))、基于圖數(shù)據(jù)建模+屬性圖模型方法(來源于圖數(shù)據(jù)庫技術(shù))[5]。前者強(qiáng)調(diào)數(shù)據(jù)的概念語義描述和數(shù)據(jù)的URI表示,有利于知識圖譜的開放與互聯(lián);后者強(qiáng)調(diào)圖數(shù)據(jù)的數(shù)據(jù)模式構(gòu)建和原生圖的存儲(chǔ),有利于圖數(shù)據(jù)的大規(guī)模運(yùn)算和圖數(shù)據(jù)的知識挖掘。

      筆者研究的是第二類知識圖譜,也是當(dāng)前圖書館領(lǐng)域關(guān)于數(shù)字資源開發(fā)與利用研究中關(guān)注較多的一類。兩類知識圖譜的概念、技術(shù)、方法、研究領(lǐng)域等相關(guān)內(nèi)容如表1所示。

      2 數(shù)字資源建設(shè)發(fā)展概況

      隨著國民數(shù)字素養(yǎng)的不斷提高,其數(shù)字資源需求也在不斷提升,其數(shù)字資源建設(shè)已成為當(dāng)前信息資源建設(shè)的重點(diǎn)工作?;仡櫄v史,數(shù)字資源建設(shè)按照資源的加工深度可以劃分為三個(gè)發(fā)展階段:數(shù)字化發(fā)展初始階段、數(shù)字化向數(shù)據(jù)化發(fā)展階段以及數(shù)據(jù)化向語義化發(fā)展階段。

      2.1 數(shù)字化發(fā)展初始階段

      數(shù)字資源建設(shè)發(fā)展初期的重點(diǎn)工作是將傳統(tǒng)文獻(xiàn)信息資源進(jìn)行簡單的數(shù)字化加工,即加工成電子文獻(xiàn)。簡單數(shù)字化加工主要是利用掃描儀、數(shù)碼照相機(jī)、數(shù)碼攝像機(jī)等光學(xué)儀器設(shè)備將紙質(zhì)文獻(xiàn)資源、實(shí)物文獻(xiàn)資源加工成圖像、視頻等數(shù)字資源,任務(wù)是實(shí)現(xiàn)信息資源載體的數(shù)字化。目前,國內(nèi)各大圖書館、檔案館、博物館還保留了大量掃描件。該類數(shù)字資源輔以簡單的元數(shù)據(jù)描述,同時(shí)采用結(jié)構(gòu)化關(guān)系數(shù)據(jù)庫進(jìn)行存儲(chǔ),可以為讀者提供查詢、檢索、下載等信息服務(wù)。由于缺乏數(shù)字資源的內(nèi)容信息,數(shù)字資源蘊(yùn)含的知識處于封閉狀態(tài),還需后期人工閱讀與理解,不利于數(shù)字資源的有效傳播與利用。

      2.2 數(shù)字化向數(shù)據(jù)化發(fā)展階段

      該階段主要是對數(shù)字資源進(jìn)行數(shù)據(jù)化、文本化建設(shè)和研究。研究內(nèi)容是將簡單掃描、拍照獲得的數(shù)字化資源進(jìn)行文本識別,實(shí)現(xiàn)數(shù)字資源的數(shù)據(jù)化方向發(fā)展,或是在數(shù)字資源加工源頭采集人工編輯錄入的可編輯電子文件。此時(shí),數(shù)字資源能夠提供大量文獻(xiàn)資源的內(nèi)容數(shù)據(jù)。利用文本分析工具對數(shù)據(jù)化的文獻(xiàn)資源進(jìn)行文本分析和內(nèi)容分析后,數(shù)字資源就可以支持更豐富的內(nèi)容查詢與檢索,如:對文本內(nèi)容進(jìn)行詞性標(biāo)注、關(guān)鍵詞自動(dòng)生成、文本摘要提取、情感分析等。數(shù)字資源的數(shù)據(jù)化建設(shè)也為下一階段數(shù)字資源的語義化建設(shè)提供了數(shù)據(jù)基礎(chǔ)。

      2.3 數(shù)據(jù)化向語義化發(fā)展階段

      該階段主要是利用本體、知識圖譜、自然語言處理等語義技術(shù)對數(shù)據(jù)化的數(shù)字資源進(jìn)行語義化建設(shè)。這里的“語義”并非指對人,而是指對機(jī)器,語義化工作的目的是增強(qiáng)數(shù)字資源的機(jī)器可理解程度,讓計(jì)算機(jī)更好地“讀懂”數(shù)字資源。目前,知識圖譜語義技術(shù)被廣泛應(yīng)用于數(shù)字資源的知識組織與知識的語義描述中。該技術(shù)先運(yùn)用本體的知識建模技術(shù)將數(shù)字資源中蘊(yùn)含的知識進(jìn)行知識建模,獲得數(shù)字資源中內(nèi)容知識的概念模型,再從數(shù)字資源中抽取知識實(shí)例并按照概念模型進(jìn)行組織。機(jī)器在讀取數(shù)據(jù)時(shí),可以通過知識本體明白所讀取數(shù)據(jù)的概念類別、關(guān)系名稱,從而增強(qiáng)數(shù)據(jù)的語義表示。數(shù)字資源的語義化建設(shè)對資源的語義檢索、智慧服務(wù)提供了強(qiáng)有力的基礎(chǔ)語義數(shù)據(jù)支撐,是當(dāng)前數(shù)字資源建設(shè)研究的前沿與重點(diǎn)開發(fā)工作。

      3 基于知識圖譜的數(shù)字資源開發(fā)與利用技術(shù)體系

      目前,語義化建設(shè)是數(shù)字資源建設(shè)的重點(diǎn)工作,富含語義表示的知識圖譜KG技術(shù)被廣泛應(yīng)用其中,從知識的獲取到知識的應(yīng)用——知識圖譜在數(shù)字資源開發(fā)與利用實(shí)踐活動(dòng)過程中已經(jīng)初步形成其理論框架與技術(shù)體系,詳見圖1。

      3.1 知識建模

      知識建模即構(gòu)建知識圖譜的本體(ontology)或模式(schema),也即設(shè)計(jì)知識圖譜的數(shù)據(jù)骨架?;陉P(guān)聯(lián)數(shù)據(jù)技術(shù)構(gòu)造的知識圖譜采用RDF三元組圖數(shù)據(jù)模型,知識建模采用本體的構(gòu)建思想;基于圖數(shù)據(jù)庫技術(shù)構(gòu)造的知識圖譜大多采用屬性圖模型,此時(shí)知識建模任務(wù)是構(gòu)造圖數(shù)據(jù)庫的數(shù)據(jù)模式。不論是本體構(gòu)建還是模式構(gòu)建,其工作內(nèi)涵都是定義知識圖譜中有關(guān)知識的概念、類別、屬性、關(guān)系,形成知識的語義關(guān)系模型,指導(dǎo)知識圖譜中的實(shí)例對象進(jìn)行語義組織。以Freebase通用知識圖譜為例,其定義了2,000多個(gè)概念類型、4萬個(gè)屬性,并為每個(gè)類型定義了若干關(guān)系,以及關(guān)系的定義域和值域[6]。常見的知識建模方法有:骨架法[7]、TOVE法[8]、IDEF5法[9]、七步法[10]、Methontology方法等[11],總體可以概括為:確定領(lǐng)域及任務(wù)、羅列概念元素、確定分類關(guān)系、定義屬性及關(guān)系、定義關(guān)系約束,過程中還應(yīng)考慮對已有本體元素的復(fù)用,如可以通過“上海圖書館本體服務(wù)中心”下載復(fù)用已有的合適本體[12]。

      3.2 知識獲取

      知識獲取是指由“人工編輯知識”或“機(jī)器自動(dòng)從海量文本數(shù)據(jù)中獲取知識”。人工編輯知識主要依賴專家經(jīng)驗(yàn),知識產(chǎn)生過程耗時(shí)費(fèi)力,不利于大規(guī)模知識圖譜的構(gòu)建。因此,如何利用機(jī)器自動(dòng)地從不同數(shù)據(jù)源中獲取知識是人們關(guān)注的焦點(diǎn)。數(shù)據(jù)源按照結(jié)構(gòu)化程度可以劃分為結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)源。

      3.2.1 結(jié)構(gòu)化數(shù)據(jù)主要來源于各個(gè)企業(yè)以及互聯(lián)網(wǎng)公司的關(guān)系型數(shù)據(jù)庫。其數(shù)據(jù)質(zhì)量較高,可采用“直接映射(Direct Mapping)”法,如采用RDB2RDF方法將關(guān)系型數(shù)據(jù)庫轉(zhuǎn)換為RDF數(shù)據(jù)集,生成的RDF數(shù)據(jù)集的語義標(biāo)簽均來自原關(guān)系型數(shù)據(jù)庫中表的名稱及表的列屬性。

      3.2.2 半結(jié)構(gòu)化數(shù)據(jù)是一類特殊的結(jié)構(gòu)化數(shù)據(jù)。它擁有說明數(shù)據(jù)的語義標(biāo)簽,但其數(shù)據(jù)模式和數(shù)據(jù)組織相對結(jié)構(gòu)化數(shù)據(jù)較為松散,具有結(jié)構(gòu)多變、模式不統(tǒng)一等特點(diǎn),知識抽取時(shí)較結(jié)構(gòu)化數(shù)據(jù)復(fù)雜,一般采用包裝器法(Wrapper)進(jìn)行數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)注、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)評估。自萬維網(wǎng)出現(xiàn)以來,半結(jié)構(gòu)化數(shù)據(jù)越來越豐富,蘊(yùn)含了海量的人類知識,逐漸成為大型知識圖譜獲取知識的主要來源。

      3.2.3 非結(jié)構(gòu)化數(shù)據(jù)(純文本)的知識獲取也叫文本信息抽取(Information Extraction,IE)。它是指從自然語言文本中抽取事實(shí)知識,這些事實(shí)知識可以是一組預(yù)先指定的實(shí)體、關(guān)系或事件信息,然后將這些信息用結(jié)構(gòu)化的方式進(jìn)行存放,便于機(jī)器利用。隨著自然語言處理(NLP)技術(shù)的不斷發(fā)展,非結(jié)構(gòu)化文本中的語義知識顯得愈發(fā)重要,知識圖譜構(gòu)建技術(shù)也越來越關(guān)注如何從純文本數(shù)據(jù)中抽取知識。

      3.3 知識表示與存儲(chǔ)

      知識圖譜中的知識表示是指用什么語言和方法對知識進(jìn)行建模與描述,從而方便知識的存儲(chǔ)與計(jì)算。知識圖譜采用什么樣的圖數(shù)據(jù)模型決定了知識表示的方法與特質(zhì)。當(dāng)前,知識圖譜主要存在兩種圖數(shù)據(jù)模型:一種是來自語義網(wǎng)技術(shù)背景下的RDF三元組圖模型,另一種是來自圖數(shù)據(jù)庫技術(shù)背景下的屬性圖模型。其中,萬維網(wǎng)聯(lián)盟W3C為語義網(wǎng)下的知識圖譜提供了RDFS/OWL本體描述語言,方便本體與本體實(shí)例數(shù)據(jù)的組織與描述,同時(shí)采用RDF三元組存儲(chǔ)(triple store)的方式進(jìn)行存儲(chǔ),常見的支持三元組存儲(chǔ)的數(shù)據(jù)庫管理系統(tǒng)有RDF4J、Virtuoso、GraphDB等。屬性圖模型由各個(gè)圖數(shù)據(jù)庫產(chǎn)品提供各自的知識建模語言,尚未形成行業(yè)標(biāo)準(zhǔn),如Neo4J的Cypher語言、HugeGraph的Gremlin語言等,其存儲(chǔ)采用原生圖——“無索引鄰接邊”的方式進(jìn)行存儲(chǔ),具備高效的圖計(jì)算性能。這里需要指出,來自語義網(wǎng)技術(shù)背景下的RDF三元組圖模型采用的是關(guān)聯(lián)數(shù)據(jù)技術(shù)發(fā)布數(shù)據(jù),其核心是使用URI表示資源內(nèi)容,這使得知識圖譜具有開放互聯(lián)功能,為知識圖譜的開發(fā)與利用提供了一個(gè)開放包容的互聯(lián)網(wǎng)環(huán)境。

      3.4 知識融合

      知識融合是指對不同來源、不同語言或不同結(jié)構(gòu)的知識進(jìn)行融合,從而對已有知識圖譜進(jìn)行知識的補(bǔ)充、更新、對齊和去重。目前,關(guān)聯(lián)數(shù)據(jù)開放項(xiàng)目(linked Open Data)會(huì)定期發(fā)布較為成熟的語義知識圖譜,如通用領(lǐng)域的Dbpedia、行業(yè)領(lǐng)域的DrugBank、上海市圖書館的名人規(guī)范庫等。從融合的對象看,知識融合包括本體層的融合與實(shí)例層的融合。其中,本體層融合指借助本體映射方對多個(gè)異構(gòu)的本體模型進(jìn)行對齊操作,包括概念、屬性、關(guān)系的對齊。實(shí)例層融合主要指對概念實(shí)例、關(guān)系實(shí)例的融合,涉及實(shí)例的補(bǔ)充、更新和去重等工作。

      3.5 知識推理

      知識推理是指基于已有的事實(shí)或知識推理出未知的事實(shí)或知識的過程。目前,利用知識推理完成知識圖譜的補(bǔ)全任務(wù)(Knowledge Base Completion,KBC)是關(guān)于知識圖譜的一個(gè)研究熱點(diǎn)。知識圖譜中的知識不一定完整,通過對已有的知識進(jìn)行推理獲取新的知識,可以實(shí)現(xiàn)知識圖譜的補(bǔ)全動(dòng)作,尤其是補(bǔ)全一些實(shí)體之間的關(guān)系,幫助完善知識圖譜的構(gòu)建工作。此外,知識推理還可以用于知識圖譜的質(zhì)量檢測任務(wù),用于發(fā)現(xiàn)一些存在沖突的知識結(jié)論。

      3.6 知識應(yīng)用

      近年來,隨著人工智能的研究熱度不斷升溫,知識圖譜作為機(jī)器大腦中的知識庫在各行各業(yè)中得到了越來越多的關(guān)注。例如,語義搜索、自動(dòng)問答、推薦系統(tǒng)、決策支持、知識可視化中都能看到知識圖譜的身影。在語義搜索中,知識圖譜采用本體方法進(jìn)行知識的組織與描述,為數(shù)據(jù)附上其所屬的概念或關(guān)系語義。在自動(dòng)問答中,知識圖譜利用實(shí)體與實(shí)體之間的關(guān)系進(jìn)行鏈接和推理,進(jìn)而獲得人們所需要的答案。在推薦系統(tǒng)中,系統(tǒng)通過知識圖譜中顧客與購買商品的實(shí)體關(guān)系構(gòu)建用戶畫像,以便獲得更精準(zhǔn)的推薦依據(jù)。在決策支持中,系統(tǒng)可以從知識圖譜里挖掘出概率較高的關(guān)系實(shí)例作為決策依據(jù)供人采納。知識可視化是將人物之間的人際關(guān)系進(jìn)行可視化展示,如親屬圈、朋友圈、學(xué)術(shù)圈等。

      4 應(yīng)用實(shí)踐

      近年來涌現(xiàn)出不少關(guān)于知識圖譜在數(shù)字資源建設(shè)中的應(yīng)用研究成果。楊海慈(2019)將中國歷代人物傳記資料庫CDBD作為數(shù)據(jù)源,構(gòu)建了宋代學(xué)術(shù)師承關(guān)系知識圖譜并將其進(jìn)行可視化展示,該知識圖譜的本體建模共設(shè)計(jì)了5個(gè)類,39個(gè)關(guān)系,囊括了48,018位人物和6,599條信息,并采用關(guān)聯(lián)技術(shù)對外發(fā)布[13]。周莉娜(2019)設(shè)計(jì)了“詩歌—詩人”二元本體和面向史學(xué)的時(shí)空經(jīng)歷本體,采用網(wǎng)絡(luò)爬蟲技術(shù)從百科類網(wǎng)站、中文詩歌類網(wǎng)站、人名地名辭典、時(shí)空坐標(biāo)等網(wǎng)站爬取數(shù)據(jù),并按照設(shè)計(jì)好的知識本體進(jìn)行知識抽取,最后采用RDF三元組構(gòu)建知識圖譜[14]。張娜(2019)在文物知識圖譜構(gòu)建關(guān)鍵技術(shù)研究中,對大量文物文本數(shù)據(jù)進(jìn)行一定數(shù)量的實(shí)體關(guān)系人工標(biāo)注,采用半監(jiān)督學(xué)習(xí)方法訓(xùn)練獲得可自動(dòng)抽取文本實(shí)體關(guān)系的分類器,共定義了10種關(guān)系模式,如(博物館、收藏、書法)等,抽取后采用RDF三元組進(jìn)行組織并進(jìn)行可視化研究[15]。劉芳(2020)以博物館藏品為研究對象,構(gòu)建了博物館藏品知識圖譜的本體模型,采用映射方法和D2R工具從第三方數(shù)據(jù)庫系統(tǒng)中抽取博物館藏品知識數(shù)據(jù),并進(jìn)行了知識融合和可視化展示[16]。孫鳴蕾(2020)收集作家名人檔案數(shù)據(jù)資料,構(gòu)建作家名人檔案知識圖譜本體,并對名人檔案數(shù)據(jù)資料進(jìn)行知識圖譜組織與可視化研究[17]。李永卉(2021)以《中國歷史地圖集》、《嘉定鎮(zhèn)江志》、《至順鎮(zhèn)江志》、北京大學(xué)出版社《全宋詩》、中華書局《全宋詞》等近十種與宋代鎮(zhèn)江詩詞有關(guān)的歷史文獻(xiàn)作為數(shù)據(jù)源,構(gòu)建了宋代鎮(zhèn)江詩詞知識圖譜本體模型,并進(jìn)行文本知識抽取,然后采用RDF三元組進(jìn)行描述與圖數(shù)據(jù)庫存儲(chǔ),最后進(jìn)行了知識圖譜查詢和知識推理研究[18]。梁科(2021)針對古籍《山經(jīng)》中的專名進(jìn)行知識圖譜構(gòu)建,共設(shè)計(jì)山類、水類、草類、鳥類、魚類等15個(gè)類,采用正則表達(dá)式的匹配方法抽取《山經(jīng)》文本中的實(shí)體和實(shí)體關(guān)系,并采用Neo4j圖數(shù)據(jù)庫進(jìn)行存儲(chǔ)和可視化研究[19]。歐陽劍(2021)從國內(nèi)外古籍書目網(wǎng)絡(luò)數(shù)據(jù)庫、CBDB、在線百科等網(wǎng)頁中抽取古代典籍書目數(shù)據(jù),并按照自行設(shè)計(jì)的典籍知識圖譜概念本體進(jìn)行組織,所構(gòu)建的典籍知識圖譜包含649,549種古籍實(shí)體、221,783位典籍責(zé)任者、1,498,383個(gè)古籍版本、13,960個(gè)地名[20]。

      5 結(jié)語

      采用知識圖譜的數(shù)字資源開發(fā)與利用研究工作主要集中在知識抽取、知識建模、知識的RDF三元組表示與存儲(chǔ)、知識的可視化方面。其中,知識建模廣泛采用RDF三元組圖模型的本體建模方法,主要設(shè)計(jì)知識圖譜中的實(shí)體概念類別及其關(guān)系類型,而采用屬性圖模型的研究相對較少。知識抽取研究中,大部分是基于結(jié)構(gòu)化或半結(jié)構(gòu)化的數(shù)據(jù)源,如:中國歷代人物傳記資料庫CDBD、網(wǎng)絡(luò)百科、專業(yè)領(lǐng)域數(shù)據(jù)庫等,這類研究構(gòu)造的知識圖譜質(zhì)量相對較高,多數(shù)研究獲取的實(shí)體與實(shí)體關(guān)系數(shù)量已初具規(guī)模。而非結(jié)構(gòu)化文本數(shù)據(jù)的知識抽取研究受自然語言處理技術(shù)發(fā)展限制,尚處于研究初級階段,未來也將被廣泛關(guān)注。知識應(yīng)用方面,可視化研究較為普遍,而知識推理研究較少或不夠深入,部分研究僅有若干條推理規(guī)則。在知識圖譜的數(shù)據(jù)類型方面,研究者主要圍繞文本知識圖譜進(jìn)行構(gòu)建,圖像、視頻等多模態(tài)知識圖譜研究相對較少,未來還有發(fā)展空間??傊?,知識圖譜能為學(xué)科研究提供切實(shí)、有價(jià)值的參考,其研究將持續(xù)受到關(guān)注。

      參考文獻(xiàn):

      [1] 夏翠娟.面向人文研究的“數(shù)據(jù)基礎(chǔ)設(shè)施”建設(shè):試論圖書館學(xué)對數(shù)字人文的方法論貢獻(xiàn)[J].中國圖書館學(xué)報(bào),2020(3):24-37.

      [2] 陳悅,劉則淵.悄然興起的科學(xué)知識圖譜[J].科學(xué)學(xué)研究,2005(2):149-154.

      [3] 秦長江,侯漢清.知識圖譜:信息管理與知識管理的新領(lǐng)域[J].大學(xué)圖書館學(xué)報(bào),2009(1):30-37,96.

      [4] AMIT S. Introducing the Knowledge Graph: Things,Not Strings[EB/OL].[2021-05-12].https://www.blog.google/products/search/introducing-knowledge-graph- things-not/.

      [5] 陳濤,劉煒,單蓉蓉,等.知識圖譜在數(shù)字人文中的應(yīng)用研究[J].中國圖書館學(xué)報(bào),2019(6):34-49.

      [6] 趙軍,劉康,何世柱,等.知識圖譜[M].北京:高等教育出版社,2018:72-73.

      [7]Uschold M,Gruninger M. Ontologies: Principles,methods and applications[J].The Knowledge Engineering Review,1996(2):93-136.

      [8] THAM K D, FOX M S, Gruninger M. Cost ontology for enterprise modelling[C]//Workshop on Enabling Technologies:Infrastructure for Collaborative Enterprises. IEEE,1994:111-117.

      [9]SARDER M B. IDEF5 Ontology Description Capture Method [EB/OL].[2021-10-23].https://www. pomsmeetings.org/confpapers/004/004-0127.pdf.

      [10] NOY N F, MCGUINES D L. A Guide to Creating YourFirst Ontology[EB/OL].[2021-10-20].https://www.docin.com/p-1005678470.html.

      [11] JURISTO N. METHONTOLOGY: From Ontological Art Towards Ontological Engineering[J]. Ontological Engineering,1997(6):33-40.

      [12] 上海市圖書館.本體服務(wù)中心[EB/OL].[2021-10-20].http://www.usources.cn/ont.

      [13] 楊海慈,王軍.宋代學(xué)術(shù)師承知識圖譜的構(gòu)建與可視化[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2019(6):109-116.

      [14] 周莉娜,洪亮,高子陽.唐詩知識圖譜的構(gòu)建及其智能知識服務(wù)設(shè)計(jì)[J].圖書情報(bào)工作,2019(2):24-33.

      [15] 張娜.文物知識圖譜構(gòu)建關(guān)鍵技術(shù)研究與應(yīng)用[D].杭州:浙江大學(xué),2019.

      [16] 劉芳,謝靖.以藏品為核心的知識圖譜設(shè)計(jì)與應(yīng)用[J].數(shù)字圖書館論壇,2020(6):8-14.

      [17] 孫鳴蕾,房小可,陳忻.數(shù)字人文視角下名人檔案知識圖譜構(gòu)建研究:以作家檔案為例[J].山西檔案,2020(6):79-88.

      [18] 李永卉,周樹斌,周宇婷,等.基于圖數(shù)據(jù)庫Neo4j的宋代鎮(zhèn)江詩詞知識圖譜構(gòu)建研究[J].大學(xué)圖書館學(xué)報(bào),2021(2):52-61.

      [19] 梁科.《山經(jīng)》專名的知識圖譜構(gòu)建及價(jià)值分析[D].北京:中國社會(huì)科學(xué)院研究生院,2021.

      [20] 歐陽劍,梁珠芳,任樹懷.大規(guī)模中國歷代存世典籍知識圖譜構(gòu)建研究[J].圖書情報(bào)工作,2021(5):126-135.

      (編校:周雪芹)

      猜你喜歡
      數(shù)字資源知識圖譜
      國內(nèi)圖書館嵌入式服務(wù)研究主題分析
      國內(nèi)外政府信息公開研究的脈絡(luò)、流派與趨勢
      美術(shù)教科書使用應(yīng)把握的幾個(gè)視角
      近十五年我國小學(xué)英語教學(xué)研究的熱點(diǎn)、問題及對策
      基于知識圖譜的產(chǎn)業(yè)集群創(chuàng)新績效可視化分析
      基于知識圖譜的智慧教育研究熱點(diǎn)與趨勢分析
      圖書館員新角色
      建立中文DOI標(biāo)識在科技期刊出版中的作用
      高校數(shù)字資源云服務(wù)平臺的建設(shè)研究
      評價(jià)高校圖書館數(shù)字資源綜合服務(wù)能力
      高淳县| 孙吴县| 靖州| 界首市| 大石桥市| 馆陶县| 台江县| 定州市| 榆林市| 鄂州市| 新化县| 衢州市| 台江县| 贵南县| 弋阳县| 大厂| 太谷县| 永春县| 清徐县| 东至县| 红河县| 木里| 朝阳县| 泰兴市| 洪雅县| 深泽县| 邹平县| 龙山县| 龙泉市| 宁德市| 颍上县| 松桃| 上犹县| 建昌县| 长葛市| 湖北省| 静乐县| 丹棱县| 卢龙县| 罗田县| 海宁市|