張宇玲,杜偉偉,張靜雅,范 鑫,楊 剛
(1.北方自動控制技術(shù)研究所,太原 030006;2.北京理工大學(xué)機(jī)電學(xué)院,北京 100081;3.智能信息控制技術(shù)山西省重點(diǎn)實(shí)驗(yàn)室,太原 030006)
作為信息化戰(zhàn)爭的基本作戰(zhàn)形式,陸軍合成作戰(zhàn)的戰(zhàn)場要素多、作戰(zhàn)環(huán)境變化快、參戰(zhàn)實(shí)體關(guān)聯(lián)關(guān)系復(fù)雜,海量異構(gòu)的資源信息規(guī)劃過程中可能會造成大規(guī)模資源沖突問題[1]。只有作戰(zhàn)資源的調(diào)用時(shí)序、空間占用、頻域分配等約束一致,才能保證任務(wù)執(zhí)行按計(jì)劃完成[2-3]。資源信息組織管理模式是否合理,直接影響沖突檢測策略的可行性與執(zhí)行效率,因此,需要研究一種能夠打破領(lǐng)域隔閡的信息管理方法,為沖突檢測提供更全面、更高效的資源信息支撐。
知識圖譜是一種通過實(shí)體、關(guān)系、屬性及屬性值擴(kuò)展本體知識的語義網(wǎng)絡(luò)[4],專注于破除實(shí)體界限,將各實(shí)體連接形成“網(wǎng)”,以網(wǎng)狀結(jié)構(gòu)展現(xiàn)實(shí)體間關(guān)聯(lián)[5]?;贠verview Detials 的圖譜可視化方法有助于篩選知識、探索知識關(guān)聯(lián),并進(jìn)一步展現(xiàn)知識層次體系[6]。知識圖譜在知識總結(jié)、知識理解、知識推理、知識演化等方面有強(qiáng)大的組織管理能力,在問答系統(tǒng)、智能搜索、輔助決策、個(gè)性化推薦等領(lǐng)域已經(jīng)展開大量研究[7-11]。知識圖譜構(gòu)建與可視化方法的出現(xiàn),為海量異構(gòu)信息結(jié)構(gòu)化管理問題提供了新的解決思路。
面向沖突檢測,作戰(zhàn)資源信息根據(jù)任務(wù)執(zhí)行時(shí)序呈現(xiàn)屬性局部密集關(guān)聯(lián)的特點(diǎn)。但傳統(tǒng)的知識圖譜中節(jié)點(diǎn)排列沒有明確的時(shí)間關(guān)系,并且在表示整體稀疏、局部密集的結(jié)構(gòu)時(shí)有局限。例如兩個(gè)局部密集結(jié)構(gòu)間的屬性關(guān)聯(lián)會破壞圖譜整體結(jié)構(gòu)的穩(wěn)定性,給后續(xù)知識提取與轉(zhuǎn)化應(yīng)用帶來困難。為解決相關(guān)問題,首先面向陸軍合成作戰(zhàn)行動特點(diǎn)與沖突檢測場景需求,基于知識圖譜框架,結(jié)合ESTN 模型,設(shè)計(jì)資源規(guī)劃圖譜構(gòu)建方法;其次,針對圖譜整體稀疏、局部密集的結(jié)構(gòu)特點(diǎn),引入ChordLink 模型優(yōu)化圖譜的可視化表達(dá);最后通過一個(gè)作戰(zhàn)案例說明資源規(guī)劃圖譜構(gòu)建方法的可行高效。
資源規(guī)劃圖譜框架基于三元組模型實(shí)現(xiàn),即以“實(shí)體-關(guān)系-實(shí)體”結(jié)構(gòu)儲存各種實(shí)體、關(guān)系、屬性及屬性值信息,并分別以節(jié)點(diǎn)、邊表示實(shí)體、實(shí)體間關(guān)系,實(shí)體由關(guān)系連接生成網(wǎng)狀結(jié)構(gòu)的資源規(guī)劃圖譜。資源規(guī)劃圖譜中各元素內(nèi)涵如下,資源規(guī)劃圖譜框架如圖1 所示。
圖1 資源規(guī)劃圖譜框架Fig.1 Framework of resource planning graph
1)實(shí)體:執(zhí)行作戰(zhàn)任務(wù)相關(guān)各類信息。實(shí)體是資源規(guī)劃圖譜基本組成元素,每個(gè)實(shí)體都應(yīng)設(shè)置唯一標(biāo)識;
2)關(guān)系:圖譜中各實(shí)體或概念間的聯(lián)系。資源規(guī)劃中實(shí)體根據(jù)時(shí)間關(guān)系建立聯(lián)系;
3)屬性:實(shí)體特性。資源規(guī)劃圖譜中指空域約束、頻域約束。
任務(wù)規(guī)劃資源信息保密性強(qiáng)、專業(yè)針對性高,資源規(guī)劃圖譜的構(gòu)建無法在公開環(huán)境下進(jìn)行,因此,需要從任務(wù)計(jì)劃中提取資源約束信息,構(gòu)建資源規(guī)劃信息知識庫,以實(shí)現(xiàn)對資源信息的分類管理。
資源規(guī)劃信息知識庫的構(gòu)建包括信息檢測、無效信息過濾、有效信息清洗、特征提取、分類儲存5個(gè)步驟,構(gòu)建結(jié)果如圖2 所示。
圖2 資源規(guī)劃信息知識庫Fig.2 Resource planning information knowledge base
1)信息檢測:針對信息冗余、錯(cuò)誤情況進(jìn)行檢測;
2)無效信息過濾:去除標(biāo)點(diǎn)符號、語氣詞、連接詞、停用字符等無意義信息;
3)有效信息清洗:對保留的有效信息進(jìn)行一致性檢查,并補(bǔ)充缺省值;
4)特征提?。焊鶕?jù)信息來源、參數(shù)數(shù)值以及數(shù)據(jù)單位等提取信息特征,并按結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化信息分類儲存;
5)分類儲存:結(jié)構(gòu)化信息采用Neo j 圖數(shù)據(jù)庫存儲,半結(jié)構(gòu)化與非結(jié)構(gòu)化信息采用分布式儲存方法。
資源規(guī)劃信息知識庫中既有基礎(chǔ)作戰(zhàn)數(shù)據(jù)、作戰(zhàn)環(huán)境特征數(shù)據(jù)、實(shí)時(shí)/非實(shí)時(shí)格式報(bào)信息等結(jié)構(gòu)化信息,也有海洋、水文、氣象等半結(jié)構(gòu)化信息,還有視頻、音頻、文本等非結(jié)構(gòu)化信息。針對不同類型信息要采取不同的提取方法,結(jié)構(gòu)化信息經(jīng)異構(gòu)信息整合后即可提取,提取半結(jié)構(gòu)化與非結(jié)構(gòu)化信息時(shí)需先進(jìn)行實(shí)體抽取、關(guān)系抽取與屬性抽取,并將抽取結(jié)果進(jìn)行同構(gòu)整合。復(fù)雜作戰(zhàn)環(huán)境下的信息在提取整合過程中,不可避免地會引入知識缺失問題。由于資源規(guī)劃信息的特殊性,大量關(guān)系出現(xiàn)的頻次很低,但知識補(bǔ)全往往需要大量的訓(xùn)練數(shù)據(jù),因此,考慮通過基于元學(xué)習(xí)訓(xùn)練少量已知三元組來對缺失的三元組進(jìn)行預(yù)測補(bǔ)全。
數(shù)據(jù)層旨在通過屬性對齊和實(shí)體對齊消除作戰(zhàn)資源信息的沖突冗余。其中,屬性對齊是將指向同一實(shí)體的相同內(nèi)涵屬性進(jìn)行合并,實(shí)體對齊指將含義相同的不同實(shí)體進(jìn)行對齊。
1.3.1 基于ESTN 的屬性對齊
簡單時(shí)間網(wǎng)絡(luò)模型(simple temporal network,STN)是一種對計(jì)劃中時(shí)間關(guān)系進(jìn)行推理的約束網(wǎng)絡(luò)[12],是解決時(shí)間沖突檢測問題的有力工具。擴(kuò)展時(shí)間網(wǎng)絡(luò)模型(extend simple temporal network,ESTN)是在STN 的框架基礎(chǔ)上,將空域、頻域占用及其約束關(guān)系添加到相應(yīng)的時(shí)間節(jié)點(diǎn)上,在完成時(shí)間沖突檢測的基礎(chǔ)上進(jìn)行空域、頻域沖突檢測,與作戰(zhàn)資源沖突檢測策略有很高的適配性?;贓STN 解決沖突問題的信息需求,需要對空域約束、頻域約束進(jìn)行規(guī)范化描述,以合并相同內(nèi)涵的屬性,實(shí)現(xiàn)屬性對齊。
空域不僅包含火力安全線邊界、地炮落地區(qū)域范圍等二維平面范圍規(guī)劃,也包括飛行器航跡、彈道軌跡等三維空間航線規(guī)劃。合理安排戰(zhàn)場空間占用可以有效避免發(fā)生空域沖突,既要保證單位空間區(qū)域內(nèi)不能因占用率過高而產(chǎn)生擁堵,也要保證作戰(zhàn)實(shí)體間不能超過各自行動安全距離??沼蚣s束可表示為SD(ΔLon(i,j),ΔLat(i,j),ΔH(i,j),ΔT)。其中,ΔLon(i,j)=Lonj-Loni、ΔLat(i,j)=Latj-Lati、ΔH(i,j)=ΔHj-ΔHi,分別表示經(jīng)度間隔、緯度間隔與高度間隔,ΔT 指空域占用時(shí)間間隔。
頻域可劃分為監(jiān)視頻域、保護(hù)頻域和禁止頻域。監(jiān)視頻域指戰(zhàn)斗中用以搜集情報(bào)的敵方頻率段;保護(hù)頻域指需在對敵實(shí)施電磁干擾時(shí)施加保護(hù)的頻率段;禁止頻域指對己方作戰(zhàn)起關(guān)鍵作用的頻率段,需施加絕對保護(hù)防止意外干擾??捎脮r(shí)間交疊范圍內(nèi)實(shí)體頻率波段來表示頻域約束,即同一時(shí)間區(qū)間、在可發(fā)生頻率干擾的范圍內(nèi),不同實(shí)體占用的頻率波段產(chǎn)生交集表示頻域沖突。頻域約束表達(dá)式為FD(ΔF(α,β),γ,ΔT)。其中,ΔF(α,β)=Fβ-Fα,表示頻率區(qū)間,α 與β 分別表示頻率區(qū)間的上限與下限,γ 表示頻率類型,ΔT 表示頻域占用時(shí)間間隔。
1.3.2 基于屬性相似度的實(shí)體對齊
多源異構(gòu)的作戰(zhàn)資源信息不經(jīng)實(shí)體對齊很難構(gòu)造出清晰準(zhǔn)確的“實(shí)體-關(guān)系-屬性”映射關(guān)系。因此,需要通過計(jì)算規(guī)范化表示的屬性值間最小編輯距離得到屬性相似度,并基于屬性相似度實(shí)現(xiàn)實(shí)體對齊。
定義s1與s2間最小編輯距離為edit(s1,s2),字符串s1長度為p,字符串s2長度為q,s1[p]表示s1中第p 個(gè)字符。求解edit(s1,s2)方程組如下:
設(shè)實(shí)體A 有p 個(gè)屬性SA={SA1,SA2,…,SAp},對應(yīng)屬性值為QA={QA1,QA2,…,QAp};同理實(shí)體B 有q 個(gè)屬性SB={SB1,SB2,…,SBq},對應(yīng)屬性值為QB={QB1,QB2,…,QBq}。CS=SAj∩SB表示A 與B 間相同屬性集合。則實(shí)體對齊通過以下3 步實(shí)現(xiàn)。
首先,設(shè)edit(QAi,QBi)為CS中第i 個(gè)相同屬性QAi與QBi間的最小編輯距離,l(QAi)與l(QBi)分別指QAi與QBi長度?;谧钚【庉嬀嚯x計(jì)算CS中第i 個(gè)相同屬性的相似度simCS(SAi,SBi):
然后,根據(jù)式(5)計(jì)算實(shí)體A 與實(shí)體B 間屬性相似度。其中,t 為CS中元素個(gè)數(shù),ωi指第i 個(gè)屬性權(quán)值。
最后,基于歷史作戰(zhàn)數(shù)據(jù),運(yùn)用深度學(xué)習(xí)算法挖掘數(shù)據(jù)深層規(guī)律并得出相似度閾值。根據(jù)屬性相似度計(jì)算結(jié)果得到一個(gè)相似度由高到低的實(shí)體集合,該集合中屬性相似度高于閾值的實(shí)體實(shí)現(xiàn)對齊。
為進(jìn)一步實(shí)現(xiàn)對數(shù)據(jù)層節(jié)點(diǎn)的邏輯規(guī)范與組織管理,通過層次規(guī)約構(gòu)建概念層,使圖譜層次結(jié)構(gòu)更符合沖突檢測的信息調(diào)用邏輯。分層映射所得各層節(jié)點(diǎn)概念規(guī)約如表1 所示,概念層結(jié)構(gòu)如圖3所示。
表1 概念層Table 1 Concept layer
圖3 概念層結(jié)構(gòu)Fig.3 Concept layer structure
關(guān)于概念層結(jié)構(gòu)需注意:
1)概念層面向沖突檢測構(gòu)建,作戰(zhàn)資源調(diào)用具有時(shí)序特性,因此,各實(shí)體的時(shí)間約束信息要進(jìn)行時(shí)間同步后排列;
2)實(shí)際作戰(zhàn)中各空域、頻域等屬性交叉占用,因此,除任務(wù)ID 層外的各層節(jié)點(diǎn)間存在交叉、跨層映射的情況。
資源規(guī)劃圖譜可以實(shí)現(xiàn)對陸軍合成作戰(zhàn)中海量異構(gòu)資源信息的有效組織管理,但大型圖譜的層次體系難以清晰呈現(xiàn),不利于后續(xù)對圖譜的轉(zhuǎn)化應(yīng)用。圖譜可視化可以直觀展現(xiàn)領(lǐng)域知識間的層次體系結(jié)構(gòu),有助于研究人員對其提取、理解、應(yīng)用,能夠有效提高資源規(guī)劃效率。
圖譜可視化常通過節(jié)點(diǎn)關(guān)系圖表示圖譜中知識間的關(guān)聯(lián)結(jié)構(gòu),若將調(diào)用資源的作戰(zhàn)任務(wù)看作局部,則網(wǎng)狀的資源規(guī)劃圖譜具備全局稀疏、局部密集的結(jié)構(gòu)特征。常用的圖譜可視化模型有:NodeTrix模型、OntoTrix 模型、ChordLink 模型等[13-15]。其中,ChordLink 模型是一種將表示密集子圖的弦圖嵌入節(jié)點(diǎn)關(guān)系圖中表示稀疏全局網(wǎng)絡(luò)中的局部密集結(jié)構(gòu)的混合可視化模型[15]。因此,為保留整體布局的同時(shí)更好地表達(dá)局部交互情況,基于ChordLink 模型進(jìn)行資源規(guī)劃圖譜可視化。
設(shè)陸軍合成作戰(zhàn)全局行動中任務(wù)Γ 相關(guān)節(jié)點(diǎn)集合為C,C 中時(shí)間關(guān)系節(jié)點(diǎn)位于一個(gè)圓形拓?fù)鋮^(qū)域R(C)內(nèi),稱為內(nèi)部節(jié)點(diǎn),屬性節(jié)點(diǎn)位于R(C)外,稱為外部節(jié)點(diǎn)。對于內(nèi)部節(jié)點(diǎn)w,z,h,f∈C 和外部節(jié)點(diǎn)a,b,u?C,可視化生成流程如下:
1)節(jié)點(diǎn)復(fù)制:在uw 與R(C)邊界之間的交點(diǎn)上創(chuàng)建w 的復(fù)制點(diǎn)w',并用uw'替換uw。對每一個(gè)內(nèi)部節(jié)點(diǎn)同理處理,可以沿R(C)邊界得到每個(gè)內(nèi)部節(jié)點(diǎn)的唯一復(fù)制點(diǎn)。然后刪除位于R(C)內(nèi)部的所有節(jié)點(diǎn),即可沿R(C)邊界得到一個(gè)復(fù)制點(diǎn)序列;
2)節(jié)點(diǎn)排列:首先為減少同一節(jié)點(diǎn)的非連續(xù)復(fù)制點(diǎn)數(shù)量,當(dāng)且僅當(dāng)復(fù)制點(diǎn)與同一外部節(jié)點(diǎn)相鄰時(shí),沿R(C)邊界重新排列復(fù)制點(diǎn);
3)節(jié)點(diǎn)合并:用一個(gè)至少跨越整個(gè)子序列的圓弧替換所有連續(xù)復(fù)制點(diǎn),得到圓弧cw、cz、ch、cf,并插入弦表示時(shí)間關(guān)系。
對于任務(wù)Γ 所屬事件集,經(jīng)過節(jié)點(diǎn)復(fù)制、排列、合并生成由時(shí)間關(guān)系建立連接的弦圖集。各弦圖根據(jù)作戰(zhàn)主體在不同時(shí)間對空域、頻域等資源的調(diào)用情況與外部屬性節(jié)點(diǎn)建立連接,從而構(gòu)成作戰(zhàn)資源知識圖譜全局稀疏、局部密集的布局結(jié)構(gòu)。隨著陸軍合成作戰(zhàn)中各任務(wù)的資源規(guī)劃進(jìn)程,不斷有新的弦圖生成并與外部屬性節(jié)點(diǎn)建立聯(lián)系,圖譜可視化流程及結(jié)果如下頁圖4 所示。
圖4 圖譜可視化Fig.4 Graph visualization
以作戰(zhàn)任務(wù)“炮兵火力壓制,裝甲推進(jìn)”為例構(gòu)建資源規(guī)劃圖譜。子任務(wù)I1~I(xiàn)4要求20 min 內(nèi)完成,空域包含:SD1(ΔLon(0,1),ΔLat(0,1),ΔH(0,1),ΔT),SD2(ΔLon(0,2),ΔLat(0,2),ΔH(0,2),ΔT);頻域劃分為監(jiān)視頻域FD1(ΔF(α1,β1),γ1,ΔT)、保護(hù)頻域FD2(ΔF(α2,β2),γ2,ΔT)以及禁止頻域FD3(ΔF(α3,β3),γ3,ΔT)。根據(jù)實(shí)體、關(guān)系、屬性抽取結(jié)果構(gòu)建數(shù)據(jù)層和概念層,各實(shí)體、關(guān)系、屬性、屬性值間映射關(guān)系如表2 所示,資源規(guī)劃圖譜可視化結(jié)果如下頁圖5 所示。
圖5 可視化結(jié)果Fig.5 Visualization results
表2 實(shí)體-關(guān)系-屬性映射關(guān)系Table 2 Entity-relation-attribute mapping relationship
通過上述分析可知,面向沖突檢測,資源規(guī)劃圖譜的構(gòu)建不僅能完成資源信息的時(shí)間同步,并且可以在時(shí)間同步的基礎(chǔ)上進(jìn)行高效知識搜索,清晰展示時(shí)域、空域、頻域等信息間關(guān)聯(lián)關(guān)系。能夠有效提升信息價(jià)值,給后續(xù)資源沖突檢測提供結(jié)構(gòu)化信息支撐。
陸軍合成作戰(zhàn)信息混雜、域界模糊的特點(diǎn)給沖突檢測信息管理方法提出了更高的要求,信息管理方法的選擇會影響沖突檢測的效率與準(zhǔn)確度?;陉戃姾铣勺鲬?zhàn)行動特點(diǎn)與場景需求,面向沖突檢測構(gòu)建資源規(guī)劃圖譜,一方面集成知識圖譜與可視化方法,展示各領(lǐng)域知識間關(guān)聯(lián)關(guān)系以及資源規(guī)劃圖譜的可擴(kuò)展性;另一方面積累整合各類作戰(zhàn)資源信息,使得沖突檢測不僅可以解決某一類沖突問題,更可以基于資源規(guī)劃圖譜研究復(fù)合沖突檢測策略解決陸軍合成作戰(zhàn)中發(fā)生的大型沖突問題。