• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      自適應(yīng)日志采集間隔時(shí)間動(dòng)態(tài)調(diào)整算法研究

      2017-05-09 16:06:06
      關(guān)鍵詞:日志偏差理想

      劉 必 雄

      (福建農(nóng)林大學(xué)計(jì)算機(jī)與信息學(xué)院, 福州 350002)

      ?

      自適應(yīng)日志采集間隔時(shí)間動(dòng)態(tài)調(diào)整算法研究

      劉 必 雄

      (福建農(nóng)林大學(xué)計(jì)算機(jī)與信息學(xué)院, 福州 350002)

      針對(duì)日志審計(jì)系統(tǒng),分析日志記錄數(shù)量變化規(guī)律及等間隔時(shí)間日志采集策略問(wèn)題,提出一種自適應(yīng)日志采集間隔時(shí)間動(dòng)態(tài)調(diào)整算法。該算法的功能是根據(jù)當(dāng)前采集的日志記錄數(shù)量,計(jì)算出單位時(shí)間內(nèi)產(chǎn)生的日志記錄數(shù)量變化,據(jù)此自動(dòng)調(diào)節(jié)采集間隔時(shí)間。

      日志采集; 等間隔時(shí)間日志;采集策略; 間隔時(shí)間動(dòng)態(tài)調(diào)整算法

      在日志審計(jì)系統(tǒng)的日志采集過(guò)程中,目前多采用等間隔時(shí)間日志采集策略[1-4]。這種方法的不足是,忽略了系統(tǒng)和設(shè)備在各個(gè)時(shí)間段內(nèi)產(chǎn)生的日志記錄數(shù)量差異。當(dāng)采集的日志記錄數(shù)量很少時(shí),會(huì)造成系統(tǒng)資源浪費(fèi);而當(dāng)采集的日志記錄數(shù)量異常龐大時(shí),又給系統(tǒng)帶來(lái)一定的壓力。本次研究將基于日志審計(jì)系統(tǒng)的實(shí)現(xiàn),對(duì)單位時(shí)間內(nèi)日志記錄數(shù)量的變化規(guī)律進(jìn)行分析,探討一種自適應(yīng)日志采集間隔時(shí)間動(dòng)態(tài)調(diào)整算法。該算法可根據(jù)產(chǎn)生的日志記錄數(shù)量變化自動(dòng)調(diào)節(jié)日志采集的間隔時(shí)間。當(dāng)產(chǎn)生的日志記錄較少時(shí),自動(dòng)延長(zhǎng)日志采集的間隔時(shí)間,以節(jié)省系統(tǒng)開(kāi)銷(xiāo);當(dāng)產(chǎn)生的日志記錄較多時(shí),自動(dòng)縮短數(shù)據(jù)采集的時(shí)間間隔,以減少每次采集的日志數(shù)量。

      1 日志采集概念

      在日志審計(jì)系統(tǒng)中,可通過(guò)日志審計(jì)分析結(jié)果發(fā)現(xiàn)網(wǎng)絡(luò)的薄弱環(huán)節(jié),提高網(wǎng)絡(luò)的安全性[5]。在構(gòu)建日志審計(jì)系統(tǒng)時(shí),首先應(yīng)將網(wǎng)絡(luò)中各種設(shè)備和系統(tǒng)的日志數(shù)據(jù)集中在一起,以便進(jìn)行統(tǒng)一管理和分析,因此必須研究網(wǎng)絡(luò)環(huán)境下日志數(shù)據(jù)的采集問(wèn)題。一般情況下,日志審計(jì)系統(tǒng)通過(guò)運(yùn)行在采集節(jié)點(diǎn)上的Agent,以一定的間隔時(shí)間,定期采集新產(chǎn)生的日志數(shù)據(jù)。在日志采集過(guò)程中應(yīng)注意以下問(wèn)題:

      (1) 系統(tǒng)和設(shè)備在單位時(shí)間內(nèi)產(chǎn)生的日志記錄數(shù)量有差異。比如部署某子網(wǎng)的IDS,在0點(diǎn)到7點(diǎn)時(shí)間段內(nèi),單位時(shí)間產(chǎn)生的日志記錄不足400條;而在12點(diǎn)到22點(diǎn)時(shí)間段內(nèi),每個(gè)單位時(shí)間產(chǎn)生的日志記錄有900條以上。由此可見(jiàn),各個(gè)時(shí)間段內(nèi)產(chǎn)生的日志記錄數(shù)量差異較大。

      (2) 有些系統(tǒng)或設(shè)備產(chǎn)生的日志采用了循環(huán)存儲(chǔ)的方法來(lái)記錄,記錄覆蓋的時(shí)間不一致。循環(huán)存儲(chǔ)時(shí),不以時(shí)間為標(biāo)識(shí)而是以日志記錄總量為限制標(biāo)識(shí)。于是,有可能10 min前產(chǎn)生的日志已經(jīng)被新產(chǎn)生的日志覆蓋,而60 min前產(chǎn)生的日志仍然在存儲(chǔ)空間中。

      2 等間隔時(shí)間日志采集策略

      現(xiàn)有的日志審計(jì)系統(tǒng)一般采用等間隔時(shí)間日志采集策略來(lái)采集日志數(shù)據(jù)。這種方法簡(jiǎn)單易行,但是沒(méi)有考慮到系統(tǒng)和網(wǎng)絡(luò)在各個(gè)時(shí)間段內(nèi)所產(chǎn)生的日志記錄數(shù)量變化,在實(shí)際應(yīng)用中有時(shí)無(wú)法滿(mǎn)足系統(tǒng)真實(shí)需求。

      為了便于描述,將t時(shí)刻采集到的日志記錄數(shù)量視為時(shí)間函數(shù)y=f(t)。根據(jù)黑盾IDS在某天內(nèi)產(chǎn)生的17 343條日志記錄,采用等間隔時(shí)間策略對(duì)產(chǎn)生的日志進(jìn)行模擬采集,間隔時(shí)間為30 min,然后通過(guò)平滑曲線(xiàn)將各點(diǎn)連接起來(lái)。 同時(shí),設(shè)置每次采集的日志記錄數(shù)量的理想?yún)⒖贾禐?80條。理想?yún)⒖贾?,是根?jù)采集系統(tǒng)以及日志審計(jì)系統(tǒng)處理能力來(lái)定義,該值還與日志源文件保存的最大日志記錄數(shù)量有關(guān)。此次設(shè)置380條為理想?yún)⒖贾?,是以?shí)驗(yàn)數(shù)據(jù)為基礎(chǔ)。圖1所示為等間隔時(shí)間日志采集曲線(xiàn)。

      從圖1可以看出,在時(shí)間區(qū)間[60,510],產(chǎn)生的日志記錄數(shù)量比較少。系統(tǒng)每次采集的日志記錄數(shù)量都比理想?yún)⒖紨?shù)量少,此時(shí),可以適當(dāng)增加采集間隔時(shí)間,以增加采集的日志記錄數(shù)量。在時(shí)間區(qū)間[1 140,1 230],產(chǎn)生的日志記錄數(shù)量比較大。這時(shí),每次采集的日志記錄數(shù)量超過(guò)理想?yún)⒖紨?shù)量,有可能超過(guò)日志采集及審計(jì)分析系統(tǒng)的處理能力,給系統(tǒng)帶來(lái)一定的負(fù)擔(dān)。

      有效解決以上問(wèn)題的方法是,提高日志采集頻率,縮短采集間隔時(shí)間,減少采集日志記錄數(shù)量。如果設(shè)置的采集間隔時(shí)間很短,系統(tǒng)就需要頻繁地啟動(dòng)采集操作,從而會(huì)增加采集Agent和處理服務(wù)端的系統(tǒng)開(kāi)銷(xiāo);如果設(shè)置的采集間隔時(shí)間很長(zhǎng),系統(tǒng)有時(shí)需要處理大容量的數(shù)據(jù),承擔(dān)一定的負(fù)荷,而且可能導(dǎo)致間隔時(shí)間內(nèi)的日志數(shù)據(jù)被新數(shù)據(jù)覆蓋甚至丟失。

      圖1 等間隔時(shí)間日志采集曲線(xiàn)

      3 自適應(yīng)日志采集間隔時(shí)間動(dòng)態(tài)調(diào)整算法

      在自適應(yīng)日志采集間隔時(shí)間動(dòng)態(tài)調(diào)整算法中,采集間隔時(shí)間是動(dòng)態(tài)變化的。根據(jù)系統(tǒng)或設(shè)備單位時(shí)間內(nèi)產(chǎn)生的日志記錄數(shù)量變化,可動(dòng)態(tài)調(diào)節(jié)日志采集的間隔時(shí)間。這里要解決的問(wèn)題是,在什么情況下改變?nèi)罩静杉拈g隔時(shí)間,以及應(yīng)該采用什么方法來(lái)改變。通常,在日志采集過(guò)程中,如果單位時(shí)間內(nèi)產(chǎn)生的日志記錄數(shù)量變化顯著,就應(yīng)該修改日志采集的間隔時(shí)間,然后再與理想?yún)⒖贾颠M(jìn)行比較,最后決定延長(zhǎng)或縮短采集時(shí)間間隔。

      3.1 日志記錄數(shù)量偏差幅度判斷方法

      在此,采用每次采集到的日志記錄數(shù)量參數(shù)RN與理想?yún)⒖紨?shù)量參數(shù)Ref_Value來(lái)計(jì)算日志記錄偏差幅度。為了量化實(shí)際采集到的日志記錄數(shù)量與理想?yún)⒖紨?shù)量的偏差,將第i次采集到的日志記錄數(shù)量表示為RNi,其中i=1,2,3,…,并作出以下定義:

      定義1 第i次采集點(diǎn)的絕對(duì)偏差定義為:Di=︳RNi-Ref_Value︱,其中i=1,2,3,…。

      不能只是簡(jiǎn)單地根據(jù)絕對(duì)偏差來(lái)判斷偏差幅度。首先,絕對(duì)偏差與審計(jì)系統(tǒng)允許處理的日志記錄數(shù)量有關(guān),系統(tǒng)對(duì)不同類(lèi)型的日志規(guī)定了不同的最大日志記錄數(shù)量。比如,審計(jì)系統(tǒng)規(guī)定防火墻日志數(shù)量為1 000,規(guī)定IDS的日志數(shù)量為100。當(dāng)日志記錄數(shù)量絕對(duì)偏差為100,對(duì)防火墻日志來(lái)說(shuō)是小變化,而對(duì)IDS日志來(lái)說(shuō)則是顯著變化。此外,絕對(duì)偏差還與某時(shí)間段內(nèi)的平均值大小相關(guān)。例如,如果日志記錄數(shù)量在一段時(shí)間內(nèi)平均為100,當(dāng)絕對(duì)偏差值變化為10時(shí),可認(rèn)為這是一個(gè)小變化;但是如果日志記錄數(shù)量在一段時(shí)間內(nèi)平均為10,那么絕對(duì)偏差值變化為10時(shí)則可認(rèn)為數(shù)量發(fā)生了大變化。因此,引進(jìn)了“偏差平均比值”的概念。

      定義3 偏差平均比值定義為:DRi= Di

      從以上定義可以看出,偏差平均比值是一個(gè)大于0的值。在沒(méi)有突變的情況下,該值通常是一個(gè)小于1的小數(shù)。在自動(dòng)調(diào)整算法中,用戶(hù)可以根據(jù)系統(tǒng)需求設(shè)定一個(gè)偏差平均比值臨界閾值。當(dāng)系統(tǒng)完成一次日志采集后,就可以計(jì)算與這次采集相關(guān)的偏差平均比值,然后將該值與預(yù)先設(shè)定的偏差平均比值臨界閾值進(jìn)行比較。如果大于閾值,說(shuō)明單位時(shí)間內(nèi)產(chǎn)生的日志記錄數(shù)量變化大,這樣系統(tǒng)就要調(diào)整當(dāng)前所用的采集間隔時(shí)間,以適應(yīng)系統(tǒng)需求。如果小于閾值,說(shuō)明產(chǎn)生的記錄數(shù)量變化不大,可以繼續(xù)使用原來(lái)的采集間隔時(shí)間。這里需要說(shuō)明一點(diǎn),單位時(shí)間內(nèi)產(chǎn)生的日志記錄數(shù)量變化幅度并不是只和單位時(shí)間內(nèi)產(chǎn)生的記錄數(shù)量相關(guān)。因?yàn)樯婕暗嚼硐雲(yún)⒖贾?,所以,可通過(guò)偏差平均比值來(lái)判斷單位時(shí)間內(nèi)產(chǎn)生的日志記錄數(shù)量變化幅度。

      3.2 自動(dòng)間隔時(shí)間調(diào)整方法

      若某段時(shí)間內(nèi)產(chǎn)生的日志記錄數(shù)量偏差幅度很大,即偏差平均比值超過(guò)設(shè)定的臨界閾值,系統(tǒng)就要調(diào)整采集間隔時(shí)間。根據(jù)當(dāng)前采集的日志記錄數(shù)量RN,如果RN大于理想?yún)⒖贾礡ef_Value,那么就要減少采集間隔時(shí)間,但采集間隔時(shí)間調(diào)整不能小于最小采集間隔時(shí)間;如果RN小于理想?yún)⒖贾礡ef_Value,那么就要增加采集間隔時(shí)間,但采集間隔時(shí)間調(diào)整不能大于最大采集間隔時(shí)間。

      3.3 采集間隔時(shí)間動(dòng)態(tài)調(diào)整算法執(zhí)行流程

      這里給出了采集間隔時(shí)間動(dòng)態(tài)調(diào)整算法執(zhí)行流程(見(jiàn)圖2)。為了方便描述算法,給出以下幾個(gè)定義:

      圖2 自適應(yīng)日志采集間隔時(shí)間動(dòng)態(tài)調(diào)整算法流程

      定義4 日志記錄數(shù)量理想?yún)?shù)(Ref_Value):指審計(jì)系統(tǒng)希望每次收集到的日志記錄數(shù)量,即最佳日志記錄數(shù)量。

      定義5 采集間隔原子時(shí)間(Atom_Time):指自動(dòng)間隔時(shí)間調(diào)整策略中的最小時(shí)間單位。算法中自動(dòng)設(shè)定的系統(tǒng)采集間隔時(shí)間必須是采集間隔原子時(shí)間的整數(shù)倍數(shù)。

      定義6 采集間隔時(shí)間變化步長(zhǎng)(Interval_Step):系統(tǒng)自動(dòng)增加或減少采集間隔時(shí)間時(shí),每次增加或減少的時(shí)值。

      定義7 最大采集間隔時(shí)間(Interval_Max):系統(tǒng)自動(dòng)調(diào)整采集間隔時(shí)間時(shí),可調(diào)整的采集間隔時(shí)間的最大值。

      定義8 最小采集間隔時(shí)間(Interval_Min):系統(tǒng)自動(dòng)調(diào)整采集間隔時(shí)間時(shí),可調(diào)整的采集間隔時(shí)間的最小值。

      4 動(dòng)態(tài)調(diào)整算法實(shí)驗(yàn)

      4.1 臨界閾值參數(shù)的選擇

      臨界閾值的設(shè)置至關(guān)重要。如果閾值設(shè)置太小,那么即使單位時(shí)間內(nèi)日志記錄數(shù)量變化很小也會(huì)導(dǎo)致系統(tǒng)改變采集間隔時(shí)間。不過(guò)這種小變化對(duì)系統(tǒng)的需求影響不大,過(guò)度頻繁地改變采集間隔時(shí)間并不能滿(mǎn)足系統(tǒng)需求。如果閾值設(shè)置太大,就會(huì)導(dǎo)致單位時(shí)間內(nèi)日志記錄數(shù)量變化很大,而系統(tǒng)不能及時(shí)進(jìn)行采集間隔時(shí)間調(diào)整。因此, 需對(duì)黑盾IDS在某天內(nèi)產(chǎn)生的17 343條日志記錄進(jìn)行各種參數(shù)測(cè)試(見(jiàn)表1),然后根據(jù)測(cè)試結(jié)果來(lái)確定最佳臨界閾值。

      表1 系統(tǒng)測(cè)試參數(shù)

      采用表1中的參數(shù)進(jìn)行測(cè)試,并統(tǒng)計(jì)出在不同理想?yún)⒖贾怠⒉煌R界閾值情況下總的采集次數(shù)以及間隔時(shí)間調(diào)整次數(shù),系統(tǒng)測(cè)試結(jié)果見(jiàn)表2。 在不同的參數(shù)下,采集總次數(shù)變化不明顯,而臨界閾值從0.1到0.2的調(diào)整過(guò)程中,間隔時(shí)間調(diào)整次數(shù)變化很大,0.2是臨界值。因此, 采用0.2作為偏差平均比值臨界閾值。

      表2 系統(tǒng)測(cè)試結(jié)果

      4.2 實(shí)驗(yàn)結(jié)果分析

      根據(jù)表1中的參數(shù)進(jìn)行分析,其中理想?yún)?shù)Ref_Value為380,偏差平均值比臨界閾值為0.2。運(yùn)用自適應(yīng)日志采集間隔時(shí)間動(dòng)態(tài)調(diào)整算法,對(duì)IDS在某天內(nèi)產(chǎn)生的17 343條日志記錄進(jìn)行模擬采集,每次采集到的日志記錄數(shù)量變化描述如圖3所示。而圖1是采用等間隔時(shí)間日志采集策略對(duì)同樣的數(shù)據(jù)進(jìn)行模擬采集,時(shí)間間隔為30 min,而且理想?yún)⒖贾狄彩?80。等間隔時(shí)間日志采集策略有48個(gè)采集點(diǎn)。其中有22個(gè)采集點(diǎn)的數(shù)據(jù)值與理想數(shù)據(jù)值偏差比較大,即只有52.6%的采集點(diǎn)在系統(tǒng)理想范圍內(nèi),而自適應(yīng)日志采集間隔時(shí)間動(dòng)態(tài)調(diào)整算法有47個(gè)采集點(diǎn)。從圖3可以看出,采集節(jié)點(diǎn)中有9個(gè)間隔時(shí)間調(diào)整點(diǎn),其中有5個(gè)節(jié)點(diǎn)屬于邊界調(diào)整點(diǎn)。系統(tǒng)穩(wěn)定采集過(guò)程中共有42個(gè)采集點(diǎn),其中4個(gè)采集點(diǎn)數(shù)據(jù)值與理想數(shù)據(jù)值的偏差比較大,即只有90.4%的采集點(diǎn)在系統(tǒng)理想范圍內(nèi)。由此可知,自適應(yīng)日志采集間隔時(shí)間動(dòng)態(tài)調(diào)整算法更能滿(mǎn)足審計(jì)系統(tǒng)的需求。

      圖3 自適應(yīng)日志采集間隔時(shí)間動(dòng)態(tài)調(diào)整算法

      5 結(jié) 語(yǔ)

      通過(guò)本次研究,觀察了網(wǎng)絡(luò)中系統(tǒng)和設(shè)備單位時(shí)間內(nèi)產(chǎn)生的日志記錄數(shù)量的變化規(guī)律,討論了日志審計(jì)系統(tǒng)中等間隔時(shí)間日志采集策略存在的問(wèn)題,提出了一種自適應(yīng)日志采集間隔時(shí)間動(dòng)態(tài)調(diào)整算法。運(yùn)用本算法,可以根據(jù)當(dāng)前采集到的日志記錄數(shù)量,來(lái)計(jì)算單位時(shí)間內(nèi)產(chǎn)生的日志記錄數(shù)量變化,從而預(yù)測(cè)未來(lái)日志系統(tǒng)產(chǎn)生的日志記錄數(shù)量,自動(dòng)判斷是否需要調(diào)節(jié)采集間隔時(shí)間。對(duì)IDS在某天內(nèi)產(chǎn)生的17 343條日志記錄進(jìn)行了模擬采集實(shí)驗(yàn),確定動(dòng)態(tài)調(diào)整算法的參數(shù);然后根據(jù)這些參數(shù)對(duì)IDS的日志進(jìn)行模擬采集,得到了每次采集的日志記錄數(shù)量,并將這些數(shù)據(jù)與等間隔時(shí)間的日志采集策略模擬采集的結(jié)果進(jìn)行比較。在相同理想?yún)⒖贾档那闆r下,日志采集的總次數(shù)相近,等間隔時(shí)間日志采集策略測(cè)試中有一半以上的采集點(diǎn)數(shù)據(jù)值與理想數(shù)據(jù)值偏差較大;而動(dòng)態(tài)調(diào)整算法測(cè)試中除了幾個(gè)間隔時(shí)間調(diào)整點(diǎn)外,其他采集點(diǎn)的數(shù)據(jù)值都與理想數(shù)據(jù)值比較接近。因此,自適應(yīng)日志采集間隔時(shí)間動(dòng)態(tài)調(diào)整算法更能滿(mǎn)足審計(jì)系統(tǒng)的需求。

      [1] ROBERT G A,JONATHAN M,BENJAMIN A,et al.Log analysis of cyber security training exercises[J].Procedia Manufacturing,2015(3):5088-5094.

      [2] JUVONEN A,SIPOLA T.Online anomaly detection using dimensionality reduction techniques for HTTP log analysis[J].Computer Networks ,2015,91:46-56.

      [3] 于靜.基于Web應(yīng)用的日志采集與分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].北京:北京交通大學(xué),2016:31-34.

      [4] 肖東方.基于Hadoop的運(yùn)維日志采集分析平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D].濟(jì)南:山東大學(xué),2016:12-15.

      [5] GORGE M.Making sense of log management for security purposes-an approach to best practice log collection,analysis and management[J].Computer Fraud and Security.2007(5):5-10.

      Research on Self-Adaptive Interval Time Adjusting Algorithm for Log Collection

      LIUBixiong

      (School of Computer and Information, Fujian Agriculture and Forestry University, Fuzhou 350002, China)

      Based on the research and implementation of log audit system, the changing rules of the log record amount from system and device in time unit and the shortcomings of equal-interval log collection algorithm were discussed; and a self-adaptive interval time adjusting algorithm for log collection was proposed. This algorithm adjusts the interval time based on the current log record amount to calculate the changing log record amount in time unit.

      log collection; equal-interval log; collection algorithm; self-adaptive interval time adjustment algorithm

      2016-09-26

      福建省中青年教師教育科研項(xiàng)目“多源異構(gòu)日志實(shí)時(shí)融合分析關(guān)鍵技術(shù)研究”(JA12105)

      劉必雄(1979 — ),男,副教授,研究方向?yàn)榫W(wǎng)絡(luò)安全、計(jì)算機(jī)應(yīng)用。

      TP273

      A

      1673-1980(2017)02-0092-04

      猜你喜歡
      日志偏差理想
      理想之光,照亮前行之路
      金橋(2022年7期)2022-07-22 08:32:10
      一名老黨員的工作日志
      2021款理想ONE
      理想
      你是我的理想型
      花火彩版A(2021年11期)2021-02-08 12:42:52
      扶貧日志
      心聲歌刊(2020年4期)2020-09-07 06:37:14
      如何走出文章立意偏差的誤區(qū)
      兩矩形上的全偏差
      游學(xué)日志
      關(guān)于均數(shù)與偏差
      遂溪县| 闻喜县| 博湖县| 宣汉县| 丹凤县| 赤水市| 峨眉山市| 布拖县| 新密市| 永德县| 湘乡市| 遂昌县| 汉川市| 岳阳县| 汉沽区| 南陵县| 老河口市| 和田市| 大安市| 西乌珠穆沁旗| 隆安县| 泾阳县| 高雄市| 台湾省| 瑞安市| 塘沽区| 石棉县| 高碑店市| 偏关县| 长岭县| 化德县| 通辽市| 盐津县| 陕西省| 永靖县| 兰坪| 彰化市| 高淳县| 芜湖县| 博爱县| 阿尔山市|