• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      使用LDA構建預警情報的本體映射依據(jù)研究

      2019-07-17 10:01:00劉冬瑞潘越郭繼光
      關鍵詞:映射本體

      劉冬瑞 潘越 郭繼光

      【摘 要】 針對軍事預警情報具有多元、復雜、無序和異構等挑戰(zhàn),使用本體技術對其進行描述,并且結合LDA主題建模技術提出一種構建本體映射依據(jù)的方法。使用10個預警情報本體進行分析,結果表明,該方法能夠為本體映射提供依據(jù),為自動化構建本體映射提供支撐。

      【Abstract】Aiming at the challenges of military early warning information, such as multivariate, complex, disordered and heterogeneous, etc., the ontology technology is used to describe it, and combined with LDA subject modeling technology, a method of constructing ontology mapping basis is proposed. The analysis with 10 early warning information ontologies shows that this method can provide basis for ontology mapping and support for automatic construction of ontology mapping.

      【關鍵詞】預警情報;本體;LDA;映射

      【Keywords】 early warning information; ontology; LDA; mapping

      【中圖分類號】TP391.1? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?【文獻標志碼】A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 【文章編號】1673-1069(2019)04-0190-04

      1 引言

      軍事預警情報在戰(zhàn)爭中扮演著重要的角色。傳統(tǒng)戰(zhàn)爭過程中,首先圍繞情報的爭奪拉開戰(zhàn)爭序幕[1]。隨著信息技術的飛速發(fā)展以及網(wǎng)絡的高度普及,軍事預警信息承載形式也發(fā)生了變革[2]。收集到的預警情報數(shù)據(jù)具有多元、復雜、無序和異構等挑戰(zhàn),為軍事預警情報準確定位及服務帶來巨大挑戰(zhàn),是情報工作者必須解決的問題。使用本體技術能夠更加規(guī)范、完整地將情報內容描述出來,增強情報的透明度和共享性。

      由于本體可以描述數(shù)據(jù)語義,所以在網(wǎng)絡或傳統(tǒng)數(shù)據(jù)庫中的任何數(shù)據(jù)都可以用本體來表示,使不同用戶可以進行高效的數(shù)據(jù)交互,有效解決了預警情報信息共享和復用效率低的問題。本體映射是解決異構本體之間互操作的有效方法[3,4],是本體研究領域中的基礎性研究。

      本文針對互聯(lián)網(wǎng)絡中的預警情報信息,使用本體技術描述預警情報的特征,為決定作戰(zhàn)決策提供輔助。并且結合LDA主題建模技術,建立本體之間的映射依據(jù),提供自動化本體映射的有利依據(jù),為研究本體構建策略提供參考。

      2 預警情報需求

      20世紀90年代以來,以信息化為核心的軍事預警變革蓬勃發(fā)展,信息化武器裝備大量出現(xiàn)和廣泛運用,信息作戰(zhàn)正成為一種全新的作戰(zhàn)樣式,信息化戰(zhàn)爭的核心之一就是情報戰(zhàn)。隨著現(xiàn)代技術在情報領域的運用,軍事預警情報呈現(xiàn)出情報范圍廣泛、數(shù)據(jù)量大、保密性強、成為戰(zhàn)爭前沿等特性,增加了軍事預警情報搜集和使用的難度,針對這些特性研究者進行了相關研究,包括實現(xiàn)了基于Web軍事預警情報挖掘模型[5]、提出一種基于云計算架構的四層軍事預警情報融合系統(tǒng)實現(xiàn)模型[6]、建立了基于本體的情報元數(shù)據(jù)模型等。

      3 構建本體映射關系探索

      使用本體技術能夠有效解決情報信息共享和復用效率低的問題,但由于本體本身具有分散性,不同用戶可以構建不同本體,而導致在同一個領域產(chǎn)生了大量冗余的本體,出現(xiàn)本體異構問題。異構的本體之間不能進行互操作,用戶之間也不能進行相互理解。本體映射能夠很好地解決本體異構的問題,為本體之間的互操作提供支撐。

      3.1 軍事領域中本體的應用價值

      目前本體理論在軍事情報領域當中已經(jīng)有了相關的研究,如信息檢索、知識管理、信息服務等方面?;诒倔w的元數(shù)據(jù)思想引入軍事情報描述中,建立了用于描述軍事情報資源的元數(shù)據(jù)模型,能夠更加清楚地反映軍事情報資源所涵蓋的信息,提出了基于本體的情報需求滿足度計算方法,解決了海量軍事情報排序問題,提出基于軍事訓練本體的向量空間模型構建方法,使用文檔相似度作為參考標準,解決了語義相關問題。

      以上研究將本體技術應用于軍事情報領域,在一定程度上提升了情報共享和信息檢索的效率。但本體自身帶有分散的特性,很多具有相似屬性的數(shù)據(jù)可能來自多個不同本體。由于本體的創(chuàng)建和建模方法不同,即使對同一領域內數(shù)據(jù)的建模,不同專家開發(fā)的本體也很可能存在差異,導致本體異構問題,限制了本體之間的互操作。本體映射可以有效解決本體異構的問題,從根本上解放本體互操作的限制,從而進一步提升本體應用價值。

      3.2 本體映射方法

      本體異構問題已經(jīng)成為語義網(wǎng)所面臨的重要問題之一,而本體映射能夠較好地解決本體異構問題。國內外對本體映射較為統(tǒng)一的認識是:“假設O1和O2兩個本體,用一種方式來映射本體O1中的每一個概念,使其能在本體O2中找到相應的類或概念,反之亦然”。

      近年來,本體映射技術已經(jīng)成為一個研究的熱點,許多國內外研究者開發(fā)出了不同的本體映射方法。例如:基于Schema的本體映射方法、基于上層本體的映射方法、基于語義相似度的本體映射方法、基于機器學習的本體映射方法、組合映射方法等。

      本文首先使用LDA主題模型提取本體文本的主題,將文本主題詞作為本體的文本概念,通過比較不同文本概念的相似度,為確認本體之間的映射關系提供依據(jù)。

      3.3 LDA簡介

      最早在2003年,David M.Blei等人提出LDA主題模型。該模型的目標是識別文檔中的主題詞集,根據(jù)詞集對文檔進行分類。目前LDA已經(jīng)廣泛應用于文檔分類、人臉識別、信息演化分析等方面。本文結合LDA和本體技術,構建語境情報領域內容本體映射關系,為數(shù)據(jù)共享提供支撐。

      3.4 使用LDA提取本體的文本特征

      本文對本體映射依據(jù)進行研究,主要分為3個步驟:

      ①根據(jù)專家經(jīng)驗為本體添加描述性綜述文檔作為本體文本特征;

      ②抽取文本特征的主題信息,作為本體映射依據(jù);

      ③構建本體映射依據(jù)的映射關系。

      在構建本體過程中,依靠專家經(jīng)驗,為每一個本體添加描述,作為本體的文本特征。在不解讀本體概念關系前,提供本體摘要性描述,該過程依賴于專家的經(jīng)驗。

      4 基于文本特征構建本體映射依據(jù)

      本文目標給本體映射提供依據(jù),為實現(xiàn)自動構建本體映射關系提供支撐。所謂本體映射,是根據(jù)兩個本體O1、O2之中不同概念的相似度進行比較,認為概念相似度較大的本體屬于同一本體庫。給出本體O1和O2的映射過程:

      ①map:O1→O2;

      ②如果Sim(C1,C2)>ε,則map(C1)=C2,其中ε是設定的閾值,C1∈O1,C2∈O2。

      概念C1和C2的相似度sim<(C1,C2)如果高于閾值ε時,則建立O1和O2之間的映射關系,將異構本體不同概念建立映射關系的過程轉化為概念語義相似度計算。如果本體庫中存在大量本體,構建本體映射關系以前,首先要確定相似的本體集合。

      為了提高映射的整體效率,對于待映射的本體概念,首先直接比對本體的文本主題詞集,如果相似度大于閾值ε,繼續(xù)建立映射關系,否則沒有映射關系,閾值ε根據(jù)專家經(jīng)驗給出,公式(1)表示如下:

      simtopics=0? ? ? ? ? ? ? ? ? simtopics<εsim(C1,C2)? ? ? simtopics>ε? ?(1)

      使用Jaccard相似度模型計算不同本體中不同主題詞集Ct1與Ct2的相似度,如公式(2)所示:

      針對多本體之間構建映射關系問題,設計了適用于本體文本映射的算法,如算法1所示。算法思想:在所有本體Os中,本體Oi之間的文本特征Ct進行相似度比較,若相似度大于閾值ε,則對本體間的文本概念建立映射關系,繼續(xù)建立其余概念映射關系。

      算法1:

      For each Oi∈Os do

      For each Ct∈Oi do

      Ct.next =

      End for

      End for

      For each Oi∈Os do

      For each Ct∈Oi do

      If

      Ct.next.append(Ct.findNext(Oi+1))

      End if

      End for

      End for

      通過以上方法,能夠確認本體之間的映射依據(jù)。在映射依據(jù)的基礎之上,對本體之間繼續(xù)構建映射關系,提升多本體之間建立映射關系的效率。

      5 試驗

      5.1 實驗數(shù)據(jù)

      本文選擇10個有關預警情報特征的本體進行試驗。根據(jù)專家經(jīng)驗為每個本體添加綜述性文檔特征,試驗數(shù)據(jù)描述如表1所示,其中每個文檔特征用一篇綜述性文章進行表示。依照本體的構建過程,本體3與本體4非常類似。

      5.2 試驗結果及分析

      使用Mallet主題建模工具提取每個本體文本特征的主題,設置主題個數(shù)為20。例如提取本體7文檔特征的主題如下:model space vector training military ontology based construct revelance semantic representation text index problem solve VSM show results experimental reduction。

      依照主題之間的相似度作為本體映射的依據(jù),選擇了本體1、3、5、7、9的數(shù)據(jù)進行顯示,如圖1所示,其中橫軸表示10個本體,縱軸表示本體間文本概念相似度。明顯發(fā)現(xiàn)其中本體3和本體4的文本主題相似度達到50%,而其余本體之間的文本主題相似度均低于25%。說明本體3和本體4具有映射依據(jù),很有可能是異構的本體,應該對其進行本體映射處理。

      進一步分析發(fā)現(xiàn),影響構建映射依據(jù)有效性的原因可能有以下幾個方面:①根據(jù)專家經(jīng)驗為本體添加文本概念,能夠在解析本提前對其進行描述,為后期本體映射提供依據(jù)。但該文本概念還沒有固定的形式,依賴于專家的決策,直接影響到本體的映射依據(jù)。②LDA提取到的主題,能夠對文本概念進行較為準確的描述。但字符數(shù)較多的文本概念無法用20個主題進行準確表現(xiàn),因此LDA提取的主題個數(shù)應該隨著文本概念長度的變化而變化,可以進一步提升映射依據(jù)的準確性。

      6 結語

      本文在軍事預警情報領域當中,使用本體相關技術,提升軍事情報的共享和復用性。首先根據(jù)專家經(jīng)驗為每一個本體添加文本概念,接著使用LDA技術提取文本概念的主題,最后通過比較主題之間的相似度,為本體映射提供依據(jù)。試驗選取了10個預警情報領域的本體,經(jīng)驗證發(fā)現(xiàn)本文所提方法能夠在多個本體映射之間,提供本體映射依據(jù),為本體之間自動構建映射關系提供支撐。

      【參考文獻】

      【1】李月麗,趙旭峰.軍事情報特征與軍事情報系統(tǒng)構建[J].圖書館工作與研究,2009(7):73-75.

      【2】馬建威,陳洪輝.軍事信息精準服務過程中信息特征捕獲方法[J].指揮信息系統(tǒng)與技術,2015,6(3):24-30.

      【3】朱珍元.基于多策略的自動化本體映射[D].合肥:安徽大學,2011.

      【4】李日暉.語義Web搜索中的本體映射研究[D].武漢:華中科技大學,2005.

      【5】傅暢,宋佳慶.一種基于文本聚類的web軍事情報挖掘系統(tǒng)設計與實現(xiàn)[J].中國電子科學研究院學報,2015,10(5):541-545.

      【6】許輝輝,許榮榮.云計算在軍事情報融合中的應用研究[J].西安文理學院學報:自然科學版,2014,17(1):97-100.

      猜你喜歡
      映射本體
      Abstracts and Key Words
      哲學分析(2023年4期)2023-12-21 05:30:27
      對姜夔自度曲音樂本體的現(xiàn)代解讀
      中國音樂學(2020年4期)2020-12-25 02:58:06
      從映射與運算的角度定義線性空間
      RMI原則在代數(shù)學教學中的應用
      論美國動畫電影題材變化及現(xiàn)實映射意義
      電影文學(2016年22期)2016-12-20 15:21:26
      試論泰國文化對外來廣告的映射
      東方教育(2016年3期)2016-12-14 20:50:00
      概念隱喻在構建語篇連貫中的作用探析
      考試周刊(2016年85期)2016-11-11 00:44:35
      馬克思幸福思想的印度語境
      《我應該感到自豪才對》的本體性教學內容及啟示
      文學教育(2016年27期)2016-02-28 02:35:15
      專題
      圖書與情報(2013年1期)2013-11-16 22:24:00
      盘锦市| 齐齐哈尔市| 札达县| 新竹市| 屏山县| 江城| 徐闻县| 潜山县| 安新县| 潞城市| 金沙县| 海南省| 甘南县| 古丈县| 吉首市| 安国市| 新余市| 禄丰县| 乾安县| 石楼县| 徐汇区| 巫溪县| 哈巴河县| 西城区| 临夏市| 广德县| 石家庄市| 准格尔旗| 石嘴山市| 杭锦后旗| 德钦县| 那曲县| 平顺县| 琼结县| 石河子市| 泾源县| 兰西县| 黄梅县| 诏安县| 静宁县| 上虞市|