曲靖野+高俊峰
〔摘 要〕本文提出一個面向增值的應急知識挖掘模型。以形式概念分析和概念格理論為基礎(chǔ),建立應急知識形式背景和應急知識概念格,通過格上作業(yè),發(fā)現(xiàn)應急知識定域隱含的知識關(guān)系,達到應急知識增維的目的。實證結(jié)果表明,該模型具有良好的應急知識挖掘表現(xiàn),所獲得的高維應急知識能在一定程度上給下次同類型突發(fā)事件的應對提供啟迪。
〔關(guān)鍵詞〕危機管理;應急知識挖掘;概念格;模型
DOI:10.3969/j.issn.1008-0821.2017.11.006
〔中圖分類號〕G203 〔文獻標識碼〕A 〔文章編號〕1008-0821(2017)11-0034-06
Study on a Model for Emergency Knowledge Mining Based on Concept Lattice
Qu Jingye1,2 Gao Junfeng3
(1.Institute of Scientific and Technical Information of China,Beijing 100038,China;
2.College of Information Technology and Media,Beihua University,Jilin 132013,China;
3.Library,Beihua University,Jilin 132013,China)
〔Abstract〕This paper proposed an emergency knowledge mining model for knowledge increment.Based on formal concept analysis and concept lattice theory,formal background and concept lattice of emergency knowledge had been established.Through the lattice operation,the implicit knowledge relation of emergency knowledge domain was found,and the goal of increasing the dimension of emergency knowledge had been achieved.The empirical results showed that the model had good performance for emergency knowledge mining,and the acquired high dimension emergency knowledge could provide some enlightenment for the next same type of emergency.
〔Key words〕crisis management;emergency knowledge mining;concept lattice;model
1 研究背景
隨著后工業(yè)化社會的發(fā)展,自然環(huán)境遭到持續(xù)破壞,而其也因此報復性地導致一系列的天災人禍,人類社會正面臨著空前復雜的突發(fā)性危機事件地考驗。以往的經(jīng)驗表明無論何種類型的突發(fā)事件,其應急決策與管理過程都受到危機事件所處的自然環(huán)境、經(jīng)濟水平、政治規(guī)律、文化習俗等諸多因素的制約。此外,突發(fā)事件應急過程中所涉及到的諸多部門與組織,也增加了應急管理決策任務的復雜性[1],因此對于過往應急知識的總結(jié)、分享、增值和復用變得尤為重要??偹苤R具有顯性和隱性的區(qū)分,顯性知識通常能夠通過某種載體以結(jié)構(gòu)化的形式進行表述;而隱性知識更具有個體性,存在于個體潛意識中的隱性知識,由于個體語言邏輯上的匱乏而無法將隱性知識外顯[2]。有鑒于此,本文所提出的應急知識增值模型主要著眼于能夠被形式化描述和編碼的外顯型應急知識,對于模糊生澀且不容易表述的內(nèi)隱型應急知識暫不考慮。
概念格(Concept Lattice)作為形式概念分析(Formal Concept Analysis,F(xiàn)CA)理論的核心算法[3],一經(jīng)提出即在知識發(fā)現(xiàn)、數(shù)據(jù)分析與知識描述等領(lǐng)域展現(xiàn)出一定的優(yōu)勢。本研究嘗試借助概念格強大的頻繁項目集生成和關(guān)聯(lián)規(guī)則運算功能,以突發(fā)事件應急管理過程中應急知識之間的關(guān)聯(lián)關(guān)系挖掘為目標,構(gòu)建應急知識挖掘模型,通過對過往的應急數(shù)據(jù)、應急信息和應急知識進行整合,探索其中的應急管理規(guī)律,進而實現(xiàn)對應急知識的增值再利用。
2 研究現(xiàn)狀綜述
2.1 應急知識管理的研究現(xiàn)狀
通過文獻回溯發(fā)現(xiàn),國內(nèi)外學者在應急知識的描述、序化和管理等方面已經(jīng)取得了一定的研究成果:2011年,國外就有學者提出將突發(fā)事件的具體情境與應急知識片段相結(jié)合來進行應急管理[4],在此基礎(chǔ)上,基于應急知識描述框架的應急決策支持系統(tǒng)[5]、基于知識單元的應急管理方法集成模型[6]、面向知識管理的應急知識庫結(jié)構(gòu)與功能描述[7]、城市危機事件的應急策略[8]等一系列研究得到了相應的討論。由此可見,應急知識在突發(fā)事件處理過程中所起到的關(guān)鍵作用及其重要性已經(jīng)逐漸被認可,但如何就應急知識進行深度挖掘以便發(fā)現(xiàn)知識間的隱含規(guī)律,進而實現(xiàn)應急知識增值等方面的探索研究仍稍顯稀疏。
2.2 基于概念格的知識挖掘研究現(xiàn)狀
由于形式概念分析理論在生成數(shù)據(jù)頻繁項目集和發(fā)現(xiàn)蘊含規(guī)則方面具有天然的優(yōu)勢[9],因此利用FCA和概念格進行數(shù)據(jù)挖掘與知識發(fā)現(xiàn)的相關(guān)研究并不罕見,例如:應用概念格對數(shù)字圖書館用戶的信息習慣進行規(guī)則挖掘,進而實現(xiàn)個性化知識服務[10]、運用概念格分析企業(yè)競爭情報的差異性需求,從而揭示需求之間的共現(xiàn)和關(guān)聯(lián)[11]、基于用戶在虛擬社區(qū)的被動知識行為構(gòu)建被動知識需求概念格,并在格上進行規(guī)則挖掘,建立用戶社區(qū)知識“推式”服務模型的基礎(chǔ)[12]。此外,基于概念格理論進行三支決策算法改進[13]、利用概念格進行案例集成學習[14]等研究也在陸續(xù)開展。但形式概念分析和概念格理論應用于應急信息挖掘、應急知識發(fā)現(xiàn)等方面的成果尚不常見,且概念格在該領(lǐng)域所具有的天然優(yōu)勢尚未得到彰顯。因此,本文嘗試構(gòu)建基于概念格的應急知識挖掘模型,以期為應急人員的危機事件管理和決策提供一定的借鑒和知識支持。endprint
3 基于概念格的應急知識挖掘模型構(gòu)建
3.1 面向增值的應急知識挖掘原理和路徑
設(shè)Event={e1,e2,…,en}表示已發(fā)危機事件的集合,Emergency knowledge={ek1,ek2,…,ekn}表示從事件集中抽取出的應急知識單元的集合,Rule={r1,r2,…,rn}表示應急知識與危機事件之間的關(guān)系集合。那么一個完整的應急知識定域可通過一個三元組加以描述:EKS=(Event,Emergencyknowledge,Rule),“(e,ek)∈R”表示在此定域中的某事件“e”中蘊含某應急知識單元“ek”。
反觀形式概念分析與概念格理論,應急知識定域恰好能與形式背景三元組K=(G,M,I)無縫對應。其中K(形式背景)=EKS(應急知識定域),G(對象)=Event(危機事件),M(屬性)=Emergency knowledge(應急知識),I(偏序關(guān)系)=Rule(應急知識與危機事件的隸屬關(guān)系)。那么應急知識定域即可以形式概念分析的方法來對其進行描述和處理。例如現(xiàn)存某應急知識事件集EventX={e1,e2,e3,e4,e5,e6},其中蘊含的應急知識單元集為Emergency knowledgeX={ek1,ek2,ek3,ek4,ek5},那么二者之間的蘊含關(guān)系集合RuleX則可以表示成一個二模的矩陣,該矩陣即形式概念分析理論中的形式背景:
矩陣中的行與列分別代表突發(fā)事件和應急知識元,其中行列交叉部分的“X”代表某事件的應對活動中包含某應急知識元。顯然事件與應急知識元的關(guān)系集“Rule”已然蘊含于上述矩陣之中。若要實現(xiàn)以增值為目的的應急知識挖掘,必須通過概念格上的作業(yè)才可實現(xiàn),因此,根據(jù)表1中隱含著的偏序關(guān)系采用概念格生成軟件LatticeMiner[15]將表1中的形式背景轉(zhuǎn)換成應急知識概念格如圖1所示。
圖1的概念格實質(zhì)上是將表1中的應急知識定域以形式概念分析的方法進行了一次分化與重新整合。在知識系統(tǒng)中,知識分化是從整個知識定域中細分出各種專門的知識[16],在自頂向下遍歷應急知識概念格的過程中,已然實現(xiàn)了對應急知識系統(tǒng)中的應急知識細分。例如節(jié)點[e3,e5\ek3],是指突發(fā)事件“e3”和“e5”在應急活動中共同用到了知識“ek3”(并不是說上兩個突發(fā)事件只需一個知識單元),應急知識“ek3”構(gòu)成了應對突發(fā)事件“e3”和“e5”的一個必要條件。反之,在自底層向上層遍歷應急知識概念格的過程中則實現(xiàn)了對應急知識單元的整合,因為即使是同災源、同類型的突發(fā)事件,在管控處理過程中所應用到的手段和策略也不能保證完全相同,所以各個事件所總結(jié)析出的應急知識單元也并非完全一致。概念格的結(jié)構(gòu)特征能將紛繁眾多的甚至在知識系統(tǒng)中相距甚遠的知識單元進行整合,例如節(jié)點[e3,e5\ek3],概念格中與其直接相連的子節(jié)點包括第二層的節(jié)點[e5\ek3,ek4]和第三層的節(jié)點[e3\ek1,ek2,ek3,ek5],也就是分別將突發(fā)事件“e3”和“e5”在應急處理過程中所涉獵的應急知識加以枚舉。節(jié)點[e3,e〕5\ek3]成為了上述兩個突發(fā)事件的知識交集,通過概念格的數(shù)據(jù)結(jié)構(gòu)能準確的發(fā)現(xiàn)節(jié)點之間的鏈接關(guān)系,從而將應急知識定域以有機的整體形式加以展現(xiàn)。
在明確概念格對于應急知識系統(tǒng)處理的重要作用后,進一步探討基于概念格的應急知識挖掘功能。所謂知識挖掘,是指對某個應急知識論域中具有一定程度上聯(lián)系性的應急知識單元以某一形式集成輸出,其實質(zhì)與數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則挖掘并無二致。而關(guān)聯(lián)規(guī)則挖掘的基礎(chǔ)性工作在于計算事物數(shù)據(jù)庫中項目的頻繁項目集(Frequent Itemsets),經(jīng)典的關(guān)聯(lián)規(guī)則算法諸如“Apriori”或“Hash”等,由于需多次掃描全域數(shù)據(jù)以便將支持度不小于給定閾值的項目進行聚類輸出[17],導致其共有的性能瓶頸問題是算法響應時間過長,而概念格在建格過程中已經(jīng)完成了對定域數(shù)據(jù)的聚類處理,所形成的格上節(jié)點即可被看作所聚得出的類目,所以借助形式概念分析與概念格,能夠壓縮頻繁項目集的識別時間,實現(xiàn)應急知識的快速發(fā)現(xiàn)。
要實現(xiàn)對表1中的應急知識定域增值,只需挖掘其中應急知識單元之間的聯(lián)系規(guī)則,即可達到對應急管理中應對流程和處理思維上盲區(qū)覆蓋的目的,從而為下次同類型突發(fā)事件的應急活動提供借鑒。筆者設(shè)置支持度(Support)=15%,置信度(Confidence)=65%,基于應急知識概念格對表1中的應急知識定域進行挖掘,得出結(jié)果如表2所示。
表2包含了11條有意義的規(guī)則,基本勾勒出應急知識單元之間的關(guān)聯(lián)關(guān)系。一條規(guī)則以如下的方式解讀,以規(guī)則1為例:該規(guī)則中應急知識單元“ek2”被稱為先導(Antecedent),而應急知識“ek4”被稱為后繼(Consequence),表示在表1的所有突發(fā)事件之中,與應急知識單元“ek2”有關(guān)的事件也有33.33%與應急知識單元“ek4”有關(guān),其可信度為66.66%。如此,則為突發(fā)事件案例之間的比對和參照提供了清晰的路徑,無論是應急過程中習得的知識,或者是問題處理過程中應用到的知識,筆者認為與該類型事件高度相關(guān),只要滿足了預置的挖掘條件,就認為具有關(guān)聯(lián)的應急知識單元之間的關(guān)系是穩(wěn)定的強關(guān)系,可以作為增值后的應急知識而被訴求方使用。就此意義而言,未得到挖掘的應急知識單元可被理解為簡單知識,而挖掘后增值的知識被解讀為復雜知識。這里的簡單和復雜不是以知識內(nèi)容來化分,而是從知識的維度出發(fā),而所謂維度就知識的關(guān)聯(lián)因素。獨立出現(xiàn)的應急知識片段是一維的,而以關(guān)聯(lián)關(guān)系的形式出現(xiàn)的應急知識是多維的,維度越高知識的復雜程度越高,應急知識所涉獵的特定因素越多,因此應急知識的價值也就越大。
3.2 面向增值的應急知識挖掘模型
在剖析基于概念格的應急知識挖掘原理并通過模擬數(shù)據(jù)對挖掘過程加以演示后,本文進一步提出基于概念格的應急知識挖掘模型,如圖2所示:endprint
4 實證研究
為了進一步對模型加以演示和驗證,本研究選擇近年我國煤礦業(yè)的突發(fā)性事件作為原始數(shù)據(jù)進行實證研究。2013-2016年間,全國較為重大的煤礦突發(fā)性事件共33起:①貴州金佳煤礦;②黑龍江永盛煤礦;③河北艾家溝煤礦;④黑龍江振興煤礦;⑤貴州馬場煤礦;⑥吉林八寶煤礦;⑦吉林八寶煤礦;⑧吉林慶興煤礦;⑨四川桃子溝煤礦;⑩貴州大山煤礦;湖南司馬沖煤礦;江西曲江煤礦;新疆白楊溝煤礦;云南下海子煤礦;云南紅土田煤礦;陜西大海則煤礦;重慶硯石臺煤礦;貴州新華煤礦;黑龍江安之順煤礦;貴州新田煤礦;新疆米泉沙溝煤礦;貴州松林煤礦;黑龍江興運煤礦;山西姜家灣煤礦;貴州政中煤礦;江西永吉煤礦;黑龍江杏花煤礦;陜西劉家峁煤礦;吉林松樹鎮(zhèn)煤礦;重慶金山溝煤礦;黑龍江景有煤礦;內(nèi)蒙古寶馬煤礦;湖北辛家煤礦。
筆者進一步采集資料,選擇上述煤礦突發(fā)事件的事故原因和現(xiàn)場救援措施作為應急知識單元,以便于進一步研究需要,所得數(shù)據(jù)如表3所示。
基于我國煤炭業(yè)突發(fā)事故與其發(fā)生原因和采取措施的隸屬關(guān)系構(gòu)建起形式背景如表4所示。
進一步按形式背景中蘊含的偏序關(guān)系誘導構(gòu)建出應急知識概念格如圖3所示。
筆者分別設(shè)置支持度(Support)=20%、置信度(Confidence)=80%,支持度(Support)=130%、置信度(Confidence)=50%,進行挖掘,所得出的結(jié)果均過于稀疏,進一步調(diào)整為支持度(Support)=10%、置信度(Confidence)=50%后,挖掘出12條規(guī)則,如表5所示:
觀察表5能夠發(fā)現(xiàn)一些有意義的高維應急知識。例如氣體中毒和煤與瓦斯突出兩種誘因所引發(fā)的礦難事故,通常均采用入井救援的應急策略,其置信度達到了100%,筆者分析也許上述兩種類型的礦難事故,只要攜帶氧氣并且棄絕火種,那么即可保證外部人員進入礦井的安全,而爆炸等類型的事故進入礦井救援危險性過大,容易引發(fā)二次事故,所以上述類型事故對入井救援策略的使用較為慎重。此外,對于應急策略的慣常搭配也能夠在表5中得到體現(xiàn),例如規(guī)則1:采用礦道掘進策略進行救援的案例事項中,有18.18%也同時選擇了入井救援策略,其可信度達到75%,筆者分析極可能是發(fā)生礦難事故后在高度混亂的情況下進入礦井的通道不夠通暢,只能采取掘進的方式來達到下井的目的。
通過概念格和格上作業(yè),將零散的應急知識片段關(guān)聯(lián)到一起,或可對下次同質(zhì)危機事件的應急管理和應急知識的使用產(chǎn)生新的啟發(fā),應急決策主體所面對的應急知識之間也形成了體系,更符合人類的知識習得和復用機制。從此種意義而言,知識之間的關(guān)系也是一種新的知識,能對孤立出現(xiàn)的應急知識起到補充和增值的作用。
5 結(jié) 論
本文所提出的基于概念格的應急知識挖掘模型旨在實現(xiàn)應急知識的增值和增維,通過應急知識概念格的構(gòu)建,可以將散亂無序的應急知識片段整合統(tǒng)驅(qū)在一個體系之下,又通過格上作業(yè),實現(xiàn)對單維知識單元的增維和對隱含在應急知識論域中關(guān)聯(lián)關(guān)系的發(fā)掘,從而將非顯性的應急知識使用慣例加以揭示,進而實現(xiàn)應急知識增值。
未經(jīng)歷過知識挖掘和知識增值處理的應急信息,不過是相關(guān)應急事件的一種雜亂無章的數(shù)據(jù)堆砌,這給應急人員的知識內(nèi)化造成了嚴重阻礙,通過本文所設(shè)計的應急知識增值模型的處理,可以實現(xiàn)應急知識的網(wǎng)絡化表述,使得具有不同知識背景的應急人員可以根據(jù)所面對的問題情景在應急知識網(wǎng)絡上尋得所需的問題求解方案。通過應急知識模型的挖掘作業(yè),可以使得原有的彼此之間孤立的應急知識得到一定程度的關(guān)聯(lián);通過應急知識挖掘模型所發(fā)現(xiàn)的一些處置方案與事故類型之間的慣常匹配規(guī)則能夠較好的為危機應急活動提供量化參照,從而有效對應急決策進行輔助支撐。這并不是說應急人員必須依據(jù)所挖掘出的規(guī)則來行事,這里的規(guī)則是對已發(fā)同類危機事件的高度總結(jié),有助于當次突發(fā)事件的應急人員對以往的應急知識、救災經(jīng)驗和教訓有更加精確的把握,可對救災資源的配置活動提供有效的參考,是針對應急人員的救援方案所提供的有效情報服務。
另外,本文采用真實數(shù)據(jù)對模型進行實證也在一定程度上彌補了應急信息管理研究中的實踐稀缺問題。但由于時間和篇幅限制,本研究的實證部分只從兩個觀測點對突發(fā)事件數(shù)據(jù)中所蘊含的應急知識進行挖掘和增值展示,在接下來的研究中,筆者將進一步探索在多個觀測點中抽取應急知識并進行知識挖掘的可能,從而進一步驗證基于概念格的知識挖掘模型的效用。
參考文獻
[1]陳雪龍,董恩超,王延章.非常規(guī)突發(fā)事件應急管理的知識元模型[J].情報雜志,2011,30(12):22-26.
[2]SMITH E A.The role of tacit and explicit knowledge in theworkplace[J].Journal of Knowledge Management,2013,5(4):311-321.
[3]Wille R.Restructuring Lattice Theory:An Approach Based on Hierarchies of Concept[C].InProceedingsof the 7th InternationalConference on Formal Concept Analysis.Berlin,Heidelberg:Springer-Verlag,2009:314-339.
[4]Hernández J Z,Serrano J M.Knowledge-based models for emergency management systems[J].Expert Systems with Applications,2001,20(2):173-186.
[5]Maio C D,F(xiàn)enza G,Gaeta M,et al.A knowledge-based framework for emergency DSS[J].Knowledge-Based Systems,2011,24(8):1372-1379.endprint
[6]Chen X,Wang Y.A Knowledge Element Based Model Integration Method for Emergency Management[C]// IEEE / Wic / ACM International Conference on Web Intelligence and Intelligent Agent Technology.IEEE,2015:152-155.
[7]蔣勛,蘇新寧,劉喜文.突發(fā)事件驅(qū)動的應急決策知識庫結(jié)構(gòu)研究[J].情報資料工作,2015,36(1):25-29.
[8]宋紹成,高俊峰.基于知識管理的城市公共危機動態(tài)控制策略研究——以吉林市為例[J].情報科學,2013,(10):52-56.
[9]畢強,滕廣青.國外形式概念分析與概念格理論應用研究的前沿進展及熱點分析[J].現(xiàn)代圖書情報技術(shù),2010,(11):17-23.
[10]滕廣青,畢強.基于概念格的數(shù)字圖書館用戶用法細分——數(shù)字圖書館用戶使用方法的關(guān)聯(lián)規(guī)則挖掘[J].現(xiàn)代圖書情報技術(shù),2010,26(3):8-12.
[11]王萍,支鳳穩(wěn),王毅,等.運用概念格分析企業(yè)競爭情報需求[J].現(xiàn)代圖書情報技術(shù),2013,(10):66-72.
[12]田依林,滕廣青,張凡,等.基于概念格的社區(qū)用戶知識服務模型研究[J].情報科學,2011,(8):1201-1204.
[13]王立亞,張春英,劉保相.基于區(qū)間概念格的三支決策動態(tài)策略調(diào)控模型[J].計算機工程與應用,2016,52(24):80-84.
[14]Kang X,Li D,Wang S.A multi-instance ensemble learning model based on concept lattice[J].Knowledge-Based Systems,2011,24(8):1203-1213.
[15]滕廣青,畢強.概念格構(gòu)建工具ConExp與LatticeMiner的比較研究[J].現(xiàn)代圖書情報技術(shù),2010,26(10):17-22.
[16]李喜先,著.知識系統(tǒng)論[M].北京:科學出版社,2011.
[17]毛國君,段立娟,王實,著.數(shù)據(jù)挖掘原理與算法[M].北京:清華大學出版社,2008.endprint