• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      軍事系統(tǒng)工程中的知識圖譜應(yīng)用及研究

      2022-02-16 06:51:30馬玉鳳豆亞杰楊克巍譚躍進(jìn)
      關(guān)鍵詞:軍事圖譜實(shí)體

      馬玉鳳, 向 南, 豆亞杰, 姜 江, 楊克巍, 譚躍進(jìn)

      (國防科技大學(xué)系統(tǒng)工程學(xué)院, 湖南 長沙 410003)

      0 引 言

      當(dāng)前,蓬勃發(fā)展的信息技術(shù)、通信技術(shù)使得人工智能、物聯(lián)網(wǎng)與機(jī)器學(xué)習(xí)逐漸成為生活的一部分,各行各業(yè)為提高工作效率、挖掘更多行業(yè)潛能,引入了大量新技術(shù),這些新技術(shù)產(chǎn)生了海量數(shù)據(jù)。在軍事上,廣泛應(yīng)用的各種傳感器使得數(shù)據(jù)產(chǎn)生速度成指數(shù)增加,因此,全軍正在面臨著來源廣泛、格式多樣、數(shù)據(jù)價值密度低、數(shù)據(jù)體量大、種類繁多的數(shù)據(jù)困境。同時,未來全軍作戰(zhàn)樣式也將從傳統(tǒng)樣式轉(zhuǎn)變?yōu)榛诰W(wǎng)絡(luò)信息體系的聯(lián)合作戰(zhàn)樣式。為了獲得作戰(zhàn)的信息優(yōu)勢,打破武器裝備平臺、現(xiàn)場作戰(zhàn)部隊(duì)、各地指揮系統(tǒng)、后勤保障部隊(duì)之間的信息隔閡,軍事領(lǐng)域需要將數(shù)據(jù)轉(zhuǎn)化為知識,化被動為主動?;谏鲜鲂枨?建立了各種基于某種服務(wù)的軍事信息系統(tǒng),這些軍事信息系統(tǒng)是結(jié)構(gòu)化的,在傳統(tǒng)關(guān)系型數(shù)據(jù)庫的基礎(chǔ)上進(jìn)行數(shù)據(jù)集中存儲、人工計(jì)算結(jié)果、數(shù)據(jù)挖掘分析等工作,但上述操作在數(shù)據(jù)量激增、數(shù)據(jù)多源異構(gòu)的背景下面臨嚴(yán)峻的挑戰(zhàn)。

      因此,在當(dāng)前大數(shù)據(jù)背景下,軍事系統(tǒng)中也應(yīng)該更多引入人工智能、深度學(xué)習(xí)、數(shù)據(jù)挖掘等技術(shù),提高軍隊(duì)分析數(shù)據(jù)的效率。軍事系統(tǒng)包含復(fù)雜、多源、大量的數(shù)據(jù)。基于此,將知識圖譜作為軍隊(duì)轉(zhuǎn)型過程中使用的圖數(shù)據(jù)庫。軍事領(lǐng)域需要一個高效的信息系統(tǒng),知識圖譜作為信息系統(tǒng)的核心、人工智能的信息容器與知識孵化器,為了適應(yīng)未來戰(zhàn)場的需求,共享各個平臺之間的信息,學(xué)術(shù)界展開了對軍事知識圖譜構(gòu)建的研究,從而輔助決策者的分析與決策。

      然而,目前學(xué)術(shù)界缺乏對軍事領(lǐng)域知識圖譜的系統(tǒng)性綜述,目前有關(guān)軍事知識圖譜構(gòu)建的論文也是針對某種應(yīng)用場景進(jìn)行總體設(shè)計(jì),對構(gòu)建知識圖譜各個流程缺乏細(xì)節(jié)描述,并且應(yīng)用的技術(shù)手段需要更新?;诖?本文首先定義了軍事領(lǐng)域知識圖譜;然后結(jié)合軍事獨(dú)有的特點(diǎn)及知識圖譜領(lǐng)域最新面臨的挑戰(zhàn),對軍事領(lǐng)域知識圖譜的構(gòu)建困境進(jìn)行了總結(jié);歸納了前人對軍事領(lǐng)域知識圖譜做出的構(gòu)建嘗試,為了促進(jìn)該領(lǐng)域的發(fā)展,本文在各個階段根據(jù)知識圖譜領(lǐng)域最新提出的技術(shù)為各個構(gòu)建階段提供了新的思路。

      1 軍事領(lǐng)域知識圖譜的定義

      1.1 知識圖譜的定義與構(gòu)成

      知識圖譜融合數(shù)據(jù)庫、信息檢索、數(shù)據(jù)挖掘、自然語言處理、圖計(jì)算分析等技術(shù)方法,將某一學(xué)科領(lǐng)域知識可視化展現(xiàn),起源于語義網(wǎng)絡(luò)這一概念,由谷歌于2012年最先提出知識圖譜這一概念。知識圖譜的應(yīng)用顯著地提高了谷歌的搜索能力,此后,通用知識圖譜開始蓬勃發(fā)展。目前,知識圖譜數(shù)據(jù)集規(guī)模達(dá)到百萬頂點(diǎn)和上億條邊。

      知識圖譜分為模式層與數(shù)據(jù)層兩部分,模式層用于規(guī)范數(shù)據(jù)層,制定了數(shù)據(jù)層應(yīng)該遵守的規(guī)范;數(shù)據(jù)層可看做是模式層的實(shí)例,存儲具體的知識。按照知識圖譜中包含知識的深度與廣度,將知識圖譜分為通用知識圖譜與領(lǐng)域知識圖譜,前者包含各個領(lǐng)域的知識,而后者是針對某一個垂直領(lǐng)域構(gòu)建的知識網(wǎng)絡(luò)。

      1.2 軍事領(lǐng)域知識圖譜的定義

      軍事知識圖譜建設(shè)一般會聚焦在軍事、政治、后勤、裝備、科技等具體特定的領(lǐng)域,是一種典型的面向垂直領(lǐng)域的知識圖譜。

      在知識圖譜構(gòu)建的全周期中,軍事領(lǐng)域知識圖譜構(gòu)建流程如圖1所示。

      圖1 軍事領(lǐng)域知識圖譜構(gòu)建流程Fig.1 Construction process of military domain knowledge graph

      圖2中的知識圖譜構(gòu)建流程與通用圖譜的流程相似,但各個階段的技術(shù)需求有所不同。在知識表示方面,軍事領(lǐng)域知識圖譜涉及到的知識層級更深,對知識的表達(dá)能力要求更高、更準(zhǔn)確;在知識獲取方面,軍事領(lǐng)域知識圖譜的知識顆粒度小,各個作戰(zhàn)場景中對知識圖譜的精確度要求十分高,因此需要專業(yè)人員進(jìn)行知識抽取與辨析,模式層的建立也以人力為主;在知識應(yīng)用方面,相較于其他涉及面更廣的知識圖譜,軍事領(lǐng)域知識圖譜在使用過程中針對單個實(shí)體的相關(guān)實(shí)體更多,因此推理鏈條更長,這對領(lǐng)域知識圖譜的專業(yè)性、準(zhǔn)確性、邏輯性提出了更高的要求。

      2 軍事領(lǐng)域知識圖譜的構(gòu)建

      2.1 軍事領(lǐng)域知識圖譜構(gòu)建難點(diǎn)

      領(lǐng)域知識圖譜的構(gòu)建難度大,人工構(gòu)建方法效率低,自動化方法目前還很不成熟,目前比較折中的辦法就是結(jié)合自動化與人工構(gòu)建的方法,楊玉基等人提出了一種“四步法”構(gòu)建知識圖譜方法,用于對知識召回率、覆蓋率、準(zhǔn)確率要求較高的領(lǐng)域。軍事領(lǐng)域知識圖譜的構(gòu)建目標(biāo)是將來自各種數(shù)據(jù)源的非結(jié)構(gòu)化軍事流媒體數(shù)據(jù)、半結(jié)構(gòu)化軍事文本數(shù)據(jù)以及結(jié)構(gòu)化軍事關(guān)系數(shù)據(jù)庫中的數(shù)據(jù),通過各種技術(shù)進(jìn)行信息獲取,并將有價值的軍事信息提取出來,最終采用一定形式可視化,最后輔助指揮官進(jìn)行決策。

      軍事領(lǐng)域數(shù)據(jù)專業(yè)性強(qiáng),保密要求高,知識圖譜的建設(shè)工作與在開放環(huán)境下不同。因此,在知識圖譜構(gòu)建的各個環(huán)節(jié)都面臨很多困境。

      (1) 在數(shù)據(jù)來源方面,目前軍事領(lǐng)域知識圖譜構(gòu)建數(shù)據(jù)主要有兩方面:領(lǐng)域內(nèi)部專業(yè)數(shù)據(jù)庫中的結(jié)構(gòu)化數(shù)據(jù)和百度百科等開源數(shù)據(jù)庫上的半結(jié)構(gòu)化數(shù)據(jù)。軍事領(lǐng)域由于保密原則,數(shù)據(jù)庫數(shù)據(jù)難獲取,而基于開源數(shù)據(jù)構(gòu)建的知識圖譜信息噪音大,因此,構(gòu)建起初就面臨數(shù)據(jù)困難。

      (2) 在知識表示環(huán)節(jié)中,首先,軍事領(lǐng)域?qū)嶓w之間有更加復(fù)雜的關(guān)系,除了三元組包含的實(shí)體、關(guān)系與屬性,還額外增加了時間與空間維度等動態(tài)規(guī)則,普通的三元組知識表示方式很難實(shí)現(xiàn)以上的表示;其次,軍事領(lǐng)域知識圖譜在不同的應(yīng)用場景中對不同部分有不同的細(xì)粒度要求,經(jīng)常使用的圖譜要求更高的細(xì)粒度,但是高細(xì)粒度會帶來更高的處理代價,因此,平衡細(xì)粒度與構(gòu)建效率也是知識表示階段面臨的一大問題。

      (3) 在知識抽取與加工環(huán)節(jié)中,實(shí)體抽取是知識圖譜構(gòu)建過程中的核心環(huán)節(jié),雖然目前實(shí)體抽取的技術(shù)有所發(fā)展,但在低資源、開放抽取、文檔級抽取的工作中準(zhǔn)確率較低,只有抽取工作充分細(xì)致,才能挖掘隱關(guān)系來滿足領(lǐng)域知識圖譜的深度需要;此外,知識圖譜的形式多樣,在通用知識圖譜中發(fā)展出很多的知識推理方法,但這些方法不能直接遷移到領(lǐng)域知識圖譜中,需要考慮更多邏輯要求。

      (4) 在知識存儲環(huán)節(jié)中,以文件形式保存的知識圖譜無法進(jìn)行查詢、檢索、推理、分析等操作。由于關(guān)系型數(shù)據(jù)庫與知識圖譜圖模型之間有顯著差異,無法對大規(guī)模知識圖譜進(jìn)行有效的管理,語義網(wǎng)領(lǐng)域有存儲資源描述框架(resource description framework, RDF)數(shù)據(jù)的三元組庫,數(shù)據(jù)庫領(lǐng)域有用于管理屬性圖的圖數(shù)據(jù)庫,但目前沒有一種公認(rèn)的具有指導(dǎo)地位的知識圖譜數(shù)據(jù)庫。

      綜上所述,軍事領(lǐng)域知識圖譜除了要解決知識圖譜本身有的難題之外,還有軍事領(lǐng)域的復(fù)雜性、專業(yè)性、準(zhǔn)確性、保密性等帶來的特有問題,這些問題加大了軍事領(lǐng)域知識圖譜構(gòu)建的難度。

      2.2 軍事領(lǐng)域知識圖譜構(gòu)建流程

      2.2.1 信息來源

      在當(dāng)前聯(lián)合作戰(zhàn)的大背景下,軍事信息來源于不同部門,例如軍用數(shù)據(jù)庫、作戰(zhàn)文書、情報文本、圖像、音頻、視頻等,數(shù)據(jù)類型繁多,并且存在很多冗余數(shù)據(jù);其次,對方會釋放“數(shù)據(jù)迷煙”,傳統(tǒng)的信息系統(tǒng)構(gòu)建方式難以表示這些數(shù)據(jù),因此,需要首先對數(shù)據(jù)進(jìn)行預(yù)處理以降低數(shù)據(jù)稀疏性、維度,再進(jìn)行知識圖譜構(gòu)建的各個流程。

      2.2.2 知識表示與信息抽取

      知識表示是現(xiàn)實(shí)世界的可計(jì)算模型,是一種由人可理解的機(jī)器語言構(gòu)建的用于高效計(jì)算的數(shù)據(jù)結(jié)構(gòu)。

      早期知識表示方法如RDF、OWL(web ontology language),都屬于以符號邏輯為基礎(chǔ)的知識表達(dá)方式。隨著表示學(xué)習(xí)的發(fā)展與自然語言處理領(lǐng)域詞向量等嵌入技術(shù)的出現(xiàn)?,F(xiàn)階段構(gòu)建軍事領(lǐng)域知識圖譜的基本模型是基于離散符號和基于連續(xù)向量的融合知識表示方式,表1對兩種知識表示方式的進(jìn)行了比較。

      表1 知識表示方法比較

      知識圖譜是一個維數(shù)巨大的稀疏矩陣,為減少數(shù)據(jù)的稀疏性,提出一種基于深度學(xué)習(xí)的知識表示方法,先進(jìn)行維度壓縮,再對實(shí)體增加語義描述文本以增加知識表示能力,此方式更容易與深度學(xué)習(xí)模型集成?,F(xiàn)在常使用基于向量的知識表示,現(xiàn)在已經(jīng)出現(xiàn)了TransE、TransH、TransR、TransA等方法。

      知識抽取對應(yīng)三元組中的實(shí)體、關(guān)系與屬性抽取,屬性抽取可以采用與關(guān)系抽取同樣的方法,實(shí)體抽取的完整性、準(zhǔn)確率、召回率將直接影響知識圖譜的質(zhì)量。

      實(shí)體抽取方法即為命名實(shí)體識別,根據(jù)模型類型可以分為基于統(tǒng)計(jì)模型的方法、基于深度學(xué)習(xí)的方法和基于文本挖掘的方法,現(xiàn)在常用的方法是卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)—長短期記憶(long short term memory, LSTM)—條件隨機(jī)場(conditional random field, CRF)模型。為解決小樣本問題,可在深度學(xué)習(xí)模型中融合文本特征的方式。關(guān)系抽取方法包括基于模式匹配、基于語義詞典、基于特征和基于機(jī)器學(xué)習(xí)。實(shí)體識別中3種方法的優(yōu)缺點(diǎn)比較如表2所示。

      表2 實(shí)體識別方法比較

      在構(gòu)建軍事領(lǐng)域知識圖譜的實(shí)際應(yīng)用中,知識抽取針對結(jié)構(gòu)不同的數(shù)據(jù)有不同的知識抽取技術(shù)。對結(jié)構(gòu)化的數(shù)據(jù)直接通過既定的規(guī)則抽取,基于軍事領(lǐng)域關(guān)系數(shù)據(jù)庫的結(jié)構(gòu)化數(shù)據(jù)可以建立關(guān)系型數(shù)據(jù)庫與知識圖譜三元組的映射;現(xiàn)階段研究主要針對非結(jié)構(gòu)化數(shù)據(jù),在基于開源數(shù)據(jù)的軍事領(lǐng)域命名實(shí)體識別中,可以構(gòu)建多神經(jīng)網(wǎng)絡(luò)協(xié)作的模型,該模型通過BERT的字向量表達(dá)層獲得字級別的特征,通過BiLSTM層抽取上下文特征形成特征矩陣,最后由CRF生成最優(yōu)標(biāo)簽序列;在作戰(zhàn)文書的實(shí)體識別中利用了CNN-BiLSTM-CRF的方法;當(dāng)領(lǐng)域內(nèi)標(biāo)注數(shù)據(jù)缺乏以及實(shí)體標(biāo)注不一致時,提出了將生成式對抗網(wǎng)絡(luò)與BiLSTM-Attention-CRF模型。為提高知識抽取的可解釋性,可以在深度學(xué)習(xí)的基礎(chǔ)是使用統(tǒng)計(jì)學(xué)習(xí)方法。

      2.2.3 知識融合與推理

      知識融合解決知識重復(fù)、知識關(guān)聯(lián)不夠明確等問題,經(jīng)過數(shù)據(jù)整合、消歧、加工、推理驗(yàn)證、更新等步驟后形成高質(zhì)量的知識庫。軍事領(lǐng)域知識圖譜的模式層是人工輔助構(gòu)建的,準(zhǔn)確率較高;主要需要處理的是數(shù)據(jù)層的融合。抽取后的信息存在信息冗余的狀況,通過計(jì)算相似度的方式實(shí)現(xiàn)實(shí)體對齊與屬性值整合。面向非結(jié)構(gòu)化文本的關(guān)系抽取中,存在知識抽取效率低的問題,可采用一種面向非結(jié)構(gòu)化數(shù)據(jù)的弱監(jiān)督關(guān)系抽取技術(shù)。這種方式不需要大量的人工標(biāo)注、不需要外部互聯(lián)網(wǎng)知識庫的支持,可有效減少泄密風(fēng)險。

      數(shù)據(jù)層的數(shù)據(jù)融合要解決的就是與三元組有關(guān)的問題:實(shí)體的同義詞和一詞多義問題,關(guān)系缺失,屬性值沖突。針對數(shù)據(jù)融合的不同問題,目前常用的方式如圖2所示。

      圖2 多源異構(gòu)數(shù)據(jù)融合實(shí)現(xiàn)過程Fig.2 Realization process of multi-source heterogeneous data fusion

      知識推理是挖掘隱含知識、豐富并拓展知識庫的手段,從構(gòu)建技術(shù)上主要分為基于邏輯的推理和基于圖的推理。由于推理需要從豐富的實(shí)體及其關(guān)系總結(jié)的關(guān)聯(lián)規(guī)則,因此,數(shù)據(jù)量越大,知識推理的正確率越高,但針對這種開源大規(guī)模知識圖譜推理的方式有限。小樣本問題的推理難度較大,針對這個問題提出一種協(xié)同過濾機(jī)制下的混合遠(yuǎn)程監(jiān)督和深度學(xué)習(xí)的知識推理方法。

      2.2.4 知識存儲與更新

      知識存儲使用的數(shù)據(jù)庫包含關(guān)系型數(shù)據(jù)庫與圖數(shù)據(jù)庫。為了有效管理多種類型的數(shù)據(jù),并提高數(shù)據(jù)查詢、維護(hù)的效率,采用多種存儲媒介來滿足軍事領(lǐng)域的需求。采用關(guān)系數(shù)據(jù)庫存儲如概念、實(shí)體的基本信息等相對固定的數(shù)據(jù);使用圖數(shù)據(jù)庫對三元組的數(shù)據(jù)進(jìn)行存儲,目前比較流行的是Neoj圖數(shù)據(jù)庫存儲屬性關(guān)系類的數(shù)據(jù);采用內(nèi)存數(shù)據(jù)庫存儲查詢頻繁的數(shù)據(jù)。

      在多源異構(gòu)數(shù)據(jù)場景中,將半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)以分布式圖存儲與標(biāo)注,利用關(guān)系數(shù)據(jù)庫、內(nèi)存數(shù)據(jù)庫對多源異構(gòu)數(shù)據(jù)進(jìn)行存儲管理,利用文件索引系統(tǒng)對圖像、音頻、視頻數(shù)據(jù)進(jìn)行存儲。并提出一種基于多約束條件的分塊管理框架,優(yōu)化查詢效率。將傳統(tǒng)的知識表示框架與基于潛在特征的知識存儲框架相結(jié)合,即對每一個實(shí)體與關(guān)系添加潛在特征。

      知識圖譜構(gòu)建完成后,為了保證信息的新穎度,要進(jìn)行實(shí)時更新??刹捎迷隽扛碌姆绞匠掷m(xù)使用網(wǎng)絡(luò)爬蟲的方式采集數(shù)據(jù),經(jīng)過去重、人工篩選等操作之后對知識圖譜進(jìn)行更新,更新分為模式層的更新與數(shù)據(jù)層的更新,模式層的更新即為本體的更新,精度要求高,需要人的參與;數(shù)據(jù)層可采用自動更新。在知識圖譜精讀要求更高的場景中采用半自動化更新的方式,分布式爬取出置信度更高的數(shù)據(jù)源,抽取實(shí)體,人工抽取關(guān)系,對得到的新的三元組驗(yàn)證后更新到知識圖譜中。

      如今知識圖譜數(shù)據(jù)規(guī)模不斷擴(kuò)大,DBpedia中包含超過30億條三元組數(shù)據(jù),因此傳統(tǒng)的集中式數(shù)據(jù)處理方法不能滿足當(dāng)前的需要,因此可以利用分布式集群來存儲、處理大規(guī)模數(shù)據(jù)庫。如何劃分大規(guī)模知識圖譜使得跨分區(qū)邊數(shù)目最小化,同時提高知識圖譜查詢處理性能是一個研究難點(diǎn)。

      3 軍事領(lǐng)域知識圖譜的現(xiàn)狀與展望

      3.1 軍事知識圖譜應(yīng)用現(xiàn)狀

      為分析在“軍事大數(shù)據(jù)”的背景下,基于“軍事系統(tǒng)工程”的思想,軍隊(duì)轉(zhuǎn)型過程中使用的技術(shù)手段,本文選取了近十年知網(wǎng)上與軍事有關(guān)的參考文獻(xiàn),使用citespace分析,結(jié)果如圖3所示。

      圖3 軍事大數(shù)據(jù)知識圖譜Fig.3 Knowledge map of military big data

      從圖3中可以看出,知識圖譜是軍事大數(shù)據(jù)分析的重要手段,在各種關(guān)鍵技術(shù)中所占比重最高。對上述文獻(xiàn)進(jìn)行篩選、閱讀與總結(jié)后發(fā)現(xiàn):軍事領(lǐng)域知識圖譜在不同的應(yīng)用場景中具有不同的功能需求側(cè)重點(diǎn),在平時的應(yīng)用場景中,知識圖譜可用于軍事問答、軍事推薦、涉軍輿情分析等;戰(zhàn)時應(yīng)用場景中,知識圖譜應(yīng)具有即時情報保障、作戰(zhàn)輔助規(guī)劃、戰(zhàn)時分析與輔助決策的功能,用以保障決策準(zhǔn)確率并提高決策的速度。

      為減小軍事領(lǐng)域知識圖譜構(gòu)建難度,同時提高知識圖譜的利用率,目前建立的軍事知識圖譜為場景知識圖譜,即為提高知識圖譜的安全性與可解釋性,以想定聯(lián)合作戰(zhàn)場景內(nèi)的軍事力量部署情況、武器裝備知識、指揮關(guān)系知識、作戰(zhàn)支撐保障知識為主要內(nèi)容,基于不同的場景構(gòu)建的知識圖譜。

      本文對目標(biāo)識別、軍事知識問答、情報分析幾個方面知識圖譜的應(yīng)用進(jìn)行了匯總。

      在目標(biāo)識別方面,首先利用知識圖譜和圖數(shù)據(jù)庫技術(shù)構(gòu)建戰(zhàn)場??漳繕?biāo)智能識別庫;然后利用基于規(guī)則的推理技術(shù)和基于案例的推理技術(shù)構(gòu)建多個具有領(lǐng)域知識推理能力的智能體,最后利用分類器融合推理技術(shù)進(jìn)行戰(zhàn)場海空目標(biāo)智能綜合推理,以推送和問答等形式提供給情報人員。

      在軍事知識問答方面,針對軍事裝備領(lǐng)域的知識問答,現(xiàn)已經(jīng)實(shí)現(xiàn)了基于模板匹配的知識問答方式。軍事裝備存在裝備種類、裝備型號、功能等一系列信息,在缺乏專業(yè)知識的指導(dǎo)下,很難了解各種裝備的功能,對裝備的管理造成了很大的阻礙,因此可以提供軍事裝備有關(guān)的知識體系,建立知識問答系統(tǒng),用于輔助分析與決策。

      在情報輿論分析方面,邢萌等人提出軍事領(lǐng)域知識圖譜在作戰(zhàn)指揮中的應(yīng)用模型。軍事情報分析在作戰(zhàn)指揮、情報研判、目標(biāo)分析等工作中起到重要作用,情報之間的關(guān)聯(lián)是進(jìn)行綜合分析的橋梁和手段,軍事知識圖譜是實(shí)現(xiàn)關(guān)聯(lián)的有效工具。知識圖譜也能從社交軟件中自動抓取信息來構(gòu)建知識圖譜,可以用來進(jìn)行涉軍輿情大數(shù)據(jù)分析,進(jìn)行輿情管理。

      3.2 軍事知識圖譜展望

      知識圖譜本身具有局限性,再復(fù)雜的知識圖譜都難以表達(dá)現(xiàn)實(shí)世界的豐富語義,在層級較深與邏輯鏈條長的情況下,知識圖譜的推理過程也比較困難,這方面在短時間內(nèi)很難得到改進(jìn)。

      人工參與多,知識建模環(huán)節(jié)是人對未來應(yīng)用需求的充分理解上設(shè)計(jì)出來的,機(jī)器目前無法做到理解應(yīng)用場景,給出軍事領(lǐng)域知識圖譜的需求;對于稀疏、隱含、小樣本知識的利用,人的處理更快、更可靠。此外,知識圖譜的應(yīng)用場景需要人來構(gòu)建。

      軍事領(lǐng)域成型的知識圖譜少,目前的知識圖譜多為概念建模,例如,在實(shí)體抽取階段,采用效果最好的BiLSTM_Att模型對軍事類中文語料進(jìn)行關(guān)系抽取任務(wù)中,“上下級”“平級”關(guān)系類型的識別沒有關(guān)注召回率。即使成功建立了知識圖譜,也缺乏準(zhǔn)確率、召回率、反應(yīng)時間等定量分析。但目前在通用知識圖譜領(lǐng)域出現(xiàn)了一些列評估構(gòu)建準(zhǔn)確率的方法,可供軍事知識圖譜使用。

      建設(shè)知識圖譜要考慮時間、空間等動態(tài)的知識,才能滿足軍事領(lǐng)域復(fù)雜的需求。目前知識推理的方法主要針對靜態(tài)知識圖譜的方法進(jìn)行,然而知識圖譜因?yàn)闀r間推移、增刪改操作是處于動態(tài)變化的??傊?軍事領(lǐng)域知識圖譜現(xiàn)存的問題主要來源于知識圖譜固有缺陷、數(shù)據(jù)源保密、技術(shù)有限。針對最后技術(shù)問題,結(jié)合當(dāng)前知識圖譜技術(shù)的最新進(jìn)展,接下來提出一系列可以改進(jìn)的思路與方向。

      首先,在數(shù)據(jù)源方面,不同部門針對不同的領(lǐng)域有不同的數(shù)據(jù)庫,為了減小構(gòu)建大型軍事領(lǐng)域知識圖譜的難度,可以采用先分別構(gòu)建、后融合的方式來進(jìn)行知識圖譜的構(gòu)建,圖4為兩個部門針對不同數(shù)據(jù)源的知識圖譜構(gòu)建與融合過程。

      圖4 子圖到總圖的融合流程Fig.4 Fusion process from subgraph to total graph

      在知識圖譜構(gòu)建的技術(shù)中,知識表示階段將符號邏輯與表示學(xué)習(xí)結(jié)合起來研究更加魯棒、易于捕獲隱含知識、易于與深度學(xué)習(xí)集成的表示框架;并在構(gòu)建過程中引入知識表示學(xué)習(xí)的方法來提高計(jì)算效率、緩解數(shù)據(jù)稀疏、實(shí)現(xiàn)異質(zhì)信息的融合;實(shí)體抽取與實(shí)體加工環(huán)節(jié)中,在有大量訓(xùn)練語料與預(yù)先明確定義目標(biāo)實(shí)體類別的前提下,可以采用深度學(xué)習(xí)方法;面對大數(shù)據(jù)環(huán)境下的開放實(shí)體分析任務(wù),文本挖掘方法能從結(jié)構(gòu)化數(shù)據(jù)源中抽取出質(zhì)量高的知識,與文本抽取方法結(jié)合一下;在知識推理階段,當(dāng)前使用的推理方法只適應(yīng)于固定的知識圖譜,可以采用基于結(jié)構(gòu)-描述-種類的模型來處理;最后互聯(lián)網(wǎng)上RDF知識圖譜數(shù)據(jù)集已經(jīng)遠(yuǎn)超了現(xiàn)有的單機(jī)系統(tǒng)能力,利用分布式數(shù)據(jù)庫系統(tǒng)相關(guān)技術(shù)來進(jìn)行RDF數(shù)據(jù)上的查詢處理成為未來研究的趨勢。

      4 結(jié) 論

      知識圖譜的發(fā)展為軍隊(duì)提供了一個存儲數(shù)據(jù)、分析數(shù)據(jù)的新思路,本文在通用知識圖譜與領(lǐng)域知識圖譜概念的基礎(chǔ)上,提出了軍事領(lǐng)域知識圖譜的概念,概括了軍事領(lǐng)域的特殊性給知識圖譜的構(gòu)建帶來的困難,總結(jié)了當(dāng)前軍事領(lǐng)域知識圖譜構(gòu)建流程中所使用的技術(shù)手段,匯總了目前仍面對的困難。可見,通用知識圖譜的構(gòu)建日益成熟,其他行業(yè)知識圖譜的構(gòu)建處于上升期,但軍事領(lǐng)域知識圖譜的研究正還處于初步發(fā)展階段,未來可將其他行業(yè)知識圖譜的技術(shù)發(fā)展借鑒應(yīng)用到軍事領(lǐng)域中,主要總結(jié)研究方向如下:

      (1) 如何在保密的前提下保證數(shù)據(jù)源的多樣性與準(zhǔn)確性?當(dāng)前構(gòu)建軍事知識圖譜的方法是基于網(wǎng)絡(luò)上開源數(shù)據(jù)的,這些數(shù)據(jù)的權(quán)威性不強(qiáng),即使圖譜構(gòu)建取得成功,也難以應(yīng)用到實(shí)際的軍事場景中。針對這種情況,未來可以使用數(shù)據(jù)隔離的方法來控制不同角色的查看權(quán)限;針對不同部門的權(quán)限問題,各個部門采用眾包構(gòu)建知識圖譜子圖,并將子圖加權(quán)融合來形成最終的知識圖譜。

      (2) 如何對軍事中的時間、空間等動態(tài)特性的知識進(jìn)行表示?目前其他行業(yè)知識圖譜已經(jīng)開始引入動態(tài)特征,但考慮因素單一,構(gòu)建圖譜的規(guī)模較小。在軍事領(lǐng)域中需要研究一種知識表示方法,合理表示時間等信息。

      (3) 自動化構(gòu)建知識圖譜時,如何保證本體構(gòu)建的準(zhǔn)確率,實(shí)體、關(guān)系、屬性的正確率?解決保密性的一大有效手段是完全采用自動化提取相關(guān)信息,當(dāng)前實(shí)體抽取的正確率越來越高,但是對關(guān)系抽取的研究仍不夠充分。

      (4) 如何驗(yàn)證構(gòu)建軍事場景知識圖譜的準(zhǔn)確率、召回率、反應(yīng)時間?構(gòu)建的圖譜要有一定的使用價值,在使用前,必須驗(yàn)證其準(zhǔn)確率;并在使用時保證即時性。

      猜你喜歡
      軍事圖譜實(shí)體
      繪一張成長圖譜
      前海自貿(mào)區(qū):金融服務(wù)實(shí)體
      中國外匯(2019年18期)2019-11-25 01:41:54
      實(shí)體的可感部分與實(shí)體——兼論亞里士多德分析實(shí)體的兩種模式
      補(bǔ)腎強(qiáng)身片UPLC指紋圖譜
      中成藥(2017年3期)2017-05-17 06:09:01
      兩會進(jìn)行時:緊扣實(shí)體經(jīng)濟(jì)“釘釘子”
      振興實(shí)體經(jīng)濟(jì)地方如何“釘釘子”
      主動對接你思維的知識圖譜
      雜草圖譜
      軍事幽默:局
      軍事文摘(2009年9期)2009-07-30 09:40:44
      軍事
      海门市| 清涧县| 同心县| 苗栗县| 专栏| 黑水县| 扶风县| 福建省| 阿拉尔市| 盐津县| 城步| 岱山县| 海盐县| 博客| 喀什市| 桂东县| 武乡县| 五大连池市| 南华县| 镇宁| 乌兰察布市| 宁夏| SHOW| 高邑县| 乌拉特后旗| 芦山县| 兰西县| 高雄县| 博乐市| 泗洪县| 汪清县| 璧山县| 周口市| 永城市| 韶关市| 拉萨市| 呼和浩特市| 偏关县| 麦盖提县| 安塞县| 边坝县|