王賢志
摘要:隨著數(shù)據(jù)庫(kù)技術(shù)的快速發(fā)展,數(shù)據(jù)挖掘成為從海量數(shù)據(jù)中發(fā)現(xiàn)有價(jià)值信息的一種有效方法。數(shù)據(jù)挖掘?yàn)槿藗兪褂脭?shù)據(jù)庫(kù)帶來(lái)了方便的同時(shí),也帶來(lái)了許多安全問(wèn)題,其會(huì)導(dǎo)致數(shù)據(jù)庫(kù)系統(tǒng)產(chǎn)生推理和聚集攻擊。本文詳細(xì)的介紹了數(shù)據(jù)挖掘?qū)?shù)據(jù)庫(kù)系統(tǒng)安全帶來(lái)的影響,同時(shí)針對(duì)系統(tǒng)受到的推力和聚集攻擊提出了一種基于歸納和演繹的混合推理策略,防止數(shù)據(jù)庫(kù)發(fā)生信息泄露等安全問(wèn)題。
關(guān)鍵詞:數(shù)據(jù)挖掘;數(shù)據(jù)庫(kù);入侵檢測(cè);推理攻擊
0引言
隨著計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)和信息管理技術(shù)的快速發(fā)展,海量數(shù)據(jù)充斥著人們的生活,嚴(yán)重的影響了人們的工作和學(xué)習(xí),因此,人們迫切的希望能夠找到一種能夠從海量數(shù)據(jù)中發(fā)掘信息的工具,經(jīng)過(guò)諸多計(jì)算機(jī)學(xué)者的不懈努力,人們終于找到了一種能夠發(fā)現(xiàn)數(shù)據(jù)中潛在模式的方法——數(shù)據(jù)挖掘,該方法一經(jīng)發(fā)現(xiàn),便得到了迅速的普及和使用。數(shù)據(jù)庫(kù)作為一種數(shù)據(jù)信息存貯、實(shí)現(xiàn)數(shù)據(jù)操作和共享的管理工具,其能夠有效地維護(hù)數(shù)據(jù)完整性、一致性和安全性,降低數(shù)據(jù)的冗余性,在信息處理過(guò)程中具有重要的作用。數(shù)據(jù)庫(kù)安全研究的主要內(nèi)容是設(shè)法保證數(shù)據(jù)庫(kù)中存貯的數(shù)據(jù)安全,禁止非法用戶的數(shù)據(jù)訪問(wèn)請(qǐng)求,同時(shí)為合法用戶提供高效的數(shù)據(jù)服務(wù)。但是,隨著數(shù)據(jù)挖掘的普及使用,數(shù)據(jù)庫(kù)安全問(wèn)題已經(jīng)成為人們研究的熱點(diǎn),如何能夠滿足用戶需求的情況下,從海量數(shù)據(jù)中提取有用信息,同時(shí)又能保證數(shù)據(jù)提供者的隱私需要,已經(jīng)成為一個(gè)關(guān)鍵問(wèn)題。
1數(shù)據(jù)挖掘提升數(shù)據(jù)庫(kù)安全
1.1數(shù)據(jù)挖掘技術(shù)應(yīng)用于入侵檢查和審計(jì)
入侵檢測(cè)指系統(tǒng)正常運(yùn)行過(guò)程中,一些進(jìn)程試圖破壞系統(tǒng)功能,或者是非法的訪問(wèn)數(shù)據(jù)庫(kù),危害系統(tǒng)安全的行為,入侵檢測(cè)方法包括兩類,分別是基于已知攻擊方法和基于統(tǒng)計(jì)規(guī)律的方法。
為了確保系統(tǒng)行為和監(jiān)控用戶的正常運(yùn)行,數(shù)據(jù)庫(kù)系統(tǒng)在計(jì)算和使用的過(guò)程中能夠產(chǎn)生數(shù)量非常巨大的審計(jì)數(shù)據(jù)。數(shù)據(jù)庫(kù)系統(tǒng)的管理者和擁有者最為關(guān)注的問(wèn)題就是怎樣充分利用產(chǎn)生的極多的審計(jì)數(shù)據(jù)以及依靠這些數(shù)據(jù)衍生出的系統(tǒng)安全管理信息。為了有效的解決上述問(wèn)題,數(shù)據(jù)挖掘應(yīng)運(yùn)而生。眾所周知,數(shù)據(jù)挖掘在審計(jì)安全威脅問(wèn)題和檢測(cè)數(shù)據(jù)庫(kù)的入侵兩個(gè)方面發(fā)揮著無(wú)可替代的作用。利用數(shù)據(jù)挖掘,能夠準(zhǔn)確無(wú)誤的探測(cè)出安全威脅,敏銳的發(fā)現(xiàn)入侵模式,這也是信息安全保障所要求的。為了有效的限制入侵,不僅能夠阻止破壞的進(jìn)一步惡化,而且可以從惡意攻擊中恢復(fù),就需要有一個(gè)精確、高效的入侵檢測(cè)技術(shù)作為保障,確保惡意攻擊能夠被及時(shí)阻止,這也是信息安全保障的前提。同時(shí),具有高質(zhì)量數(shù)據(jù)和強(qiáng)大的恢復(fù)功能,以及對(duì)數(shù)據(jù)惡意攻擊的反擊能力是信息安全保障研究的重中之重。
1.2發(fā)現(xiàn)數(shù)據(jù)庫(kù)中異常數(shù)據(jù)模式
數(shù)據(jù)挖掘工具在數(shù)據(jù)庫(kù)管理系統(tǒng)中發(fā)揮著重要作用,它可以發(fā)現(xiàn)儲(chǔ)存在系統(tǒng)的某個(gè)數(shù)據(jù)出現(xiàn)的異常情況。為了更加簡(jiǎn)單明了的說(shuō)明,現(xiàn)舉例說(shuō)明:?jiǎn)挝荒硞€(gè)員工多次去同一個(gè)地方出差。當(dāng)數(shù)據(jù)挖掘工具發(fā)現(xiàn)這一異常數(shù)據(jù),數(shù)據(jù)挖掘工具會(huì)自動(dòng)生成一個(gè)查詢,即這個(gè)地方有與該員工聯(lián)系非常密切的人,當(dāng)查詢結(jié)果顯示出這個(gè)地方確實(shí)存在與該員工聯(lián)系密切的人時(shí),說(shuō)明該員工的這一行為被發(fā)現(xiàn)。同時(shí),數(shù)據(jù)挖掘工具也可以發(fā)現(xiàn)數(shù)據(jù)庫(kù)中與正常數(shù)據(jù)有偏差的數(shù)值,自動(dòng)生成查詢模式,經(jīng)確認(rèn)無(wú)誤后,系統(tǒng)能夠有效阻止錯(cuò)誤的進(jìn)一步發(fā)展。任何事物都具有兩面性,數(shù)據(jù)挖掘系統(tǒng)也是具有正反面的,在以上的敘述中,我們只認(rèn)識(shí)到它有利的一面。數(shù)據(jù)挖掘工具既然能夠充當(dāng)數(shù)據(jù)庫(kù)系統(tǒng)的保護(hù)者,它也可以被攻擊者當(dāng)做攻擊數(shù)據(jù)庫(kù)系統(tǒng)安全的強(qiáng)大破壞者。
2數(shù)據(jù)挖掘?qū)?shù)據(jù)庫(kù)安全的潛在威脅和解決措施
2.1數(shù)據(jù)挖掘在推理和聚集攻擊中對(duì)數(shù)據(jù)庫(kù)安全造成的危害
數(shù)據(jù)庫(kù)安全面臨著眾多的威脅和攻擊,通過(guò)總結(jié)和分析發(fā)現(xiàn)推理和聚集攻擊是面臨的首要威脅,所謂的推理和聚集攻擊是指當(dāng)用戶在數(shù)據(jù)庫(kù)中實(shí)施查詢,進(jìn)而得到具體的返回信息,之后又從返回信息中推算出用戶無(wú)權(quán)訪問(wèn)的信息。
為了研究出解決這個(gè)威脅的有效辦法,經(jīng)歷了數(shù)十年的研究,雖然得到了一些成效,但是隨著數(shù)據(jù)挖掘工具的出現(xiàn),這個(gè)問(wèn)題對(duì)數(shù)據(jù)庫(kù)安全的威脅又更加嚴(yán)重了。因?yàn)樵跀?shù)據(jù)挖掘工具還沒(méi)有出現(xiàn)之前,任何一個(gè)有推理攻擊企圖的人必須通過(guò)自己的能力對(duì)獲得的數(shù)據(jù)進(jìn)行分析,進(jìn)而發(fā)現(xiàn)有價(jià)值的東西。隨著數(shù)據(jù)挖掘工具的誕生,雖然它可以對(duì)數(shù)據(jù)庫(kù)的查詢結(jié)果進(jìn)行簡(jiǎn)單、快速、高效的智能化數(shù)據(jù)分析和處理,幫助用戶獲取有價(jià)值的信息。但是,也方便了有推理攻擊企圖的人獲得信息,為數(shù)據(jù)庫(kù)安全產(chǎn)生更大的威脅。通常情況下聚集攻擊和推理攻擊都是由系統(tǒng)的合法用戶發(fā)起的。攻擊發(fā)生的詳細(xì)過(guò)程如下:首先,由攻擊者確定具體的推出信息,經(jīng)過(guò)判斷確定推理需要的信息,由此構(gòu)造幾個(gè)相關(guān)查詢,然后利用合法用戶身份登錄進(jìn)入數(shù)據(jù)庫(kù)系統(tǒng),發(fā)出查詢指示獲得系統(tǒng)返回結(jié)果,最后分析獲得的系統(tǒng)響應(yīng),由此就可以順利推斷出攻擊所需的信息。單一的敘述過(guò)程可能會(huì)覺(jué)得復(fù)雜,我們通過(guò)一個(gè)形象的例子來(lái)解釋:假設(shè)某個(gè)企業(yè)的數(shù)據(jù)庫(kù)中儲(chǔ)存著員工的姓名、工作證號(hào)以及月工資,從表1、2可知,員工姓名和收入分開(kāi)存放都是公開(kāi)的,但是當(dāng)兩項(xiàng)信息放在一起時(shí)則需要保密的敏感信息,我們就假設(shè)保密的信息是員工的月收入,由于數(shù)據(jù)庫(kù)系統(tǒng)不允許用戶使用員工姓名獲得員工工資,因此在存放時(shí),信息被分成兩張表來(lái)存放,其中一種是員工的工作證號(hào)和月收入,另外一張則是員工姓名和工作證號(hào)。當(dāng)用戶想獲得某個(gè)指定的員工月收入信息時(shí),可以通過(guò)兩次訪問(wèn)獲得所需信息,然后在獲得的信息做有效結(jié)合就能夠獲得指定員工的月收入信息。
2.2基于推理控制器的數(shù)據(jù)庫(kù)安全技術(shù)
推理攻擊和聚集攻擊的本質(zhì)是計(jì)算機(jī)用戶的應(yīng)用需求的特點(diǎn)造成的,其查詢語(yǔ)義可能導(dǎo)致信息泄露。通常情況下,用戶只需要了解使用計(jì)算機(jī)進(jìn)行處理的用戶需求的應(yīng)用背景,就可以根據(jù)數(shù)據(jù)庫(kù)系統(tǒng)的查詢結(jié)果獲得用戶期望隱藏的數(shù)據(jù)。
為了解決上述問(wèn)題,許多學(xué)者對(duì)其進(jìn)行了研究,本文基于前人的基礎(chǔ),提出了一種基于歸納和演繹邏輯相結(jié)合的防止推理和聚集攻擊的方法,如圖2所示。該方法基于安全約束的概念,在數(shù)據(jù)庫(kù)管理系統(tǒng)中插入了一個(gè)推理引擎模塊,推理引擎采用歸納邏輯,其主要的作用既是進(jìn)行使用歸納規(guī)則,對(duì)用戶查詢的結(jié)果進(jìn)行推理,以便判用戶查詢的數(shù)據(jù)是否違反數(shù)據(jù)庫(kù)系統(tǒng)設(shè)定的安全約束,如果違反了系統(tǒng)安全策略,數(shù)據(jù)庫(kù)系統(tǒng)將會(huì)阻止用戶查詢的數(shù)據(jù)流出系統(tǒng),泄露信息。
推理引擎主要由一個(gè)推理控制器組成,該控制器可以查詢數(shù)據(jù)庫(kù),數(shù)據(jù)庫(kù)系統(tǒng)響應(yīng)該控制器,該控制器可以根據(jù)數(shù)據(jù)庫(kù)系統(tǒng)返回的查詢結(jié)果進(jìn)行歸納,將會(huì)得到一些啟發(fā)規(guī)則,這些規(guī)則可能違反數(shù)據(jù)庫(kù)安全約束,導(dǎo)致系統(tǒng)泄露一些敏感數(shù)據(jù)。通過(guò)對(duì)比,推理控制器能夠發(fā)現(xiàn)是否存在違反安全約束的啟發(fā)規(guī)則,如果存在,其就會(huì)通知數(shù)據(jù)庫(kù)管理系統(tǒng),系統(tǒng)管理員就會(huì)獲得公開(kāi)相關(guān)數(shù)據(jù)導(dǎo)致系統(tǒng)安全信息泄露,阻止系統(tǒng)輸出用戶查詢數(shù)據(jù)。
3結(jié)論
隨著數(shù)據(jù)挖掘技術(shù)的改進(jìn),數(shù)據(jù)挖掘工具對(duì)數(shù)據(jù)庫(kù)安全帶來(lái)了更多的威脅,具有更高的挑戰(zhàn)性,本文提出的方法并不能完全防止數(shù)據(jù)庫(kù)安全信息的泄露,但是,在未來(lái)時(shí)間內(nèi),通過(guò)諸多學(xué)者的共同努力,數(shù)據(jù)庫(kù)安全必將得到長(zhǎng)足發(fā)展,具有更高的安全防護(hù)能力。endprint