□文/齊耀龍
(河北大學(xué)計算中心 河北·保定)
當(dāng)前,網(wǎng)絡(luò)安全的日益惡化對信息安全造成了嚴重威脅,網(wǎng)絡(luò)安全已經(jīng)成為關(guān)系到國家穩(wěn)定和社會發(fā)展的重大課題。數(shù)據(jù)庫系統(tǒng)安全作為網(wǎng)絡(luò)安全的重要分支,有著顯著的研究意義。
數(shù)據(jù)庫安全評價的核心在于決策信息的制定。在傳統(tǒng)的決策制定過程中,人們試圖從特定的標(biāo)準(zhǔn)化思維模型入手。然而,在實現(xiàn)過程中,如何最小化主觀隨機性,以及對主觀因素模糊理解的不確定性一直困擾著人們。本研究將模糊集和粗糙集理論結(jié)合起來,提出了一個基于模糊粗糙集的數(shù)據(jù)庫安全評價模型。首先,使用模糊集理論對目標(biāo)信息系統(tǒng)進行模糊離散化,然后為了使用特定的信度挖掘數(shù)據(jù)庫安全決策信息,利用粗糙集理論的連接度對數(shù)據(jù)庫安全決策信息進行屬性約減。
(一)數(shù)據(jù)預(yù)處理。在這個階段,使用模糊集對原始數(shù)據(jù)進行處理。原始數(shù)據(jù)主要包括布爾型數(shù)據(jù)、數(shù)值型數(shù)據(jù)、類屬性和空數(shù)據(jù)。這四類數(shù)據(jù)必須離散化,才能用于進一步的聚集處理。
1、空數(shù)據(jù)成員函數(shù)
2、數(shù)值型數(shù)據(jù)成員函數(shù)
3、類屬性成員函數(shù)
4、布爾型數(shù)據(jù)成員函數(shù)
(二)數(shù)據(jù)聚類。首先把數(shù)據(jù)對象分成若干個類別,然后將他們應(yīng)用于不同類型的挖掘規(guī)則。在這個階段,規(guī)則的準(zhǔn)確性可以得到提高,并且算法的時間復(fù)雜度也將會降低。對數(shù)據(jù)庫安全評價信息進行數(shù)據(jù)聚類的步驟定義如下:
1、在域U的元素之間建立模糊相似關(guān)系R。矩陣R的0元素rij:
2、從 R 開始,得到映射 G=(V,E),導(dǎo)出最大生成樹T=(V,TE)。
3、根據(jù)實際問題需要,引入集合λ∈[0,1],T(e)是分支 e 的重量值,T(e)<λ。
聚類分析之后,對單一類別進行分析,以過濾那些含有較少元素的類別,將元素數(shù)量低于閾值的類別刪除。
(三)屬性約簡。對原始數(shù)據(jù)進行聚類之后,就可以對分類數(shù)據(jù)對象進行屬性約簡和強規(guī)則提取了。其具體實現(xiàn)步驟如下:
1、首先,分離系統(tǒng)屬性以建立相關(guān)的條件屬性和決策屬性。
2、然后,使用區(qū)分矩陣和分明函數(shù),得到屬性的約簡集。對區(qū)分矩陣定義如下:
3、通過使用約簡屬性派生規(guī)則集,可以從分明函數(shù)的最小析取范例得到屬性約簡集。
4、刪除頻度小于給定閾值μ0的奇異規(guī)則。
5、保留達到最小支持度μs和最小信任度μc的規(guī)則,將其作為強規(guī)則。
為了測試數(shù)據(jù)庫安全評價模型的能力,課題組基于局域網(wǎng)建立了一個實驗環(huán)境。為了提供更復(fù)雜的網(wǎng)絡(luò)攻擊數(shù)據(jù),使用各種網(wǎng)絡(luò)程序在同一時間對數(shù)據(jù)庫服務(wù)器實施攻擊行為。
(一)對評估樣本數(shù)據(jù)進行預(yù)處理。為了借助網(wǎng)絡(luò)程序?qū)?shù)據(jù)庫系統(tǒng)實施攻擊,課題組選用了典型的網(wǎng)絡(luò)攻擊手段作為安全因子。安全因子集定義為:
表1 數(shù)據(jù)庫安全評價決策表
Ti表示對數(shù)據(jù)庫實施的第i次攻擊,F(xiàn)表示來自局域網(wǎng)的一組攻擊。F中每個元素的取值為0或1,其中0表示攻擊不存在,1表示攻擊存在。根據(jù)上文所述,首先進行數(shù)據(jù)預(yù)處理。然后,將選出的樣本進行數(shù)據(jù)聚類。在本實驗中,課題組選出了一段時間內(nèi)的64個樣本,經(jīng)過數(shù)據(jù)聚類,這些樣本被分成8組,其中一組如表1所示。使用H、N、L表示風(fēng)險程度,其含義相應(yīng)為高風(fēng)險、正常風(fēng)險和低風(fēng)險。(表1)
(二)決策表約簡和規(guī)則提取。接下來對上一步驟中得到的決策表實施約簡。屬性約簡之后,就可以從決策表中提取數(shù)據(jù)庫安全評價規(guī)則了,如表2所示??梢栽谶@個表中清楚地看到數(shù)據(jù)庫安全評價規(guī)則,同時也可以集中精力關(guān)注那些高風(fēng)險攻擊事件。(表2)
表2 屬性約簡后的決策表
本論文提出了一個基于模糊粗糙集的數(shù)據(jù)庫安全評價模型。通過首先執(zhí)行數(shù)據(jù)預(yù)處理和數(shù)據(jù)聚集的方法,然后提取出評價規(guī)則。這個方法不僅能減小數(shù)據(jù)量,還能減小數(shù)據(jù)干擾項。數(shù)據(jù)聚集之后,就可以得到樣本分類知識,并且進行規(guī)則提取。在規(guī)則提取過程中,通過分析奇異規(guī)則、客量度和規(guī)則約束來提高規(guī)則的提取效率和精確度。實驗結(jié)果表明,本文提出的數(shù)據(jù)庫安全評價模型是切實有效的。
[1]S.B.Batsell,N.S.Rao,M.Shankar,Distributed Intrusion Detection and Attack Containment for Organizational Cyber Security,http://www.io-c.ornl.gov/projects/docume nts/containment.pdf.
[2]T.Bass,Intrusion Detection System and Multisensor Data Fusion[J].Communicationsofthe ACM,Vol.43,No.4,2000.
[3]J.Shifflet,A Technique Independent Fusion Model for Network Intrusion Detection,Proceedings of the Midstates Conference on Undergraduate Research in Computer Science and Mathemat-ics,2008.
[4]M.Qiao,Research on Knowledge Discovery and Reasoning Methods Based on Rough Set and Database Technology,Tianjin University,2006.
[5]W.J.Liu,Y.D.Gu,J.Y.Wang,Rough-fuzzy Ideals in Semigroups[J].Fuzzy Systems and Mathematics,2004.3.
[6]K.Chakrabarty,R.Biswas,S.Nanda,F(xiàn)uzziness in rough sets[J].Fuzzy Sets and Systems,2000.