• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于機(jī)器學(xué)習(xí)技術(shù)的網(wǎng)絡(luò)安全防護(hù)

      2018-03-30 03:25:32劉金鵬
      網(wǎng)絡(luò)空間安全 2018年9期
      關(guān)鍵詞:機(jī)器學(xué)習(xí)網(wǎng)絡(luò)安全人工智能

      劉金鵬

      摘 要:信息化時(shí)代,互聯(lián)網(wǎng)在社會(huì)生活生產(chǎn)中的地位愈發(fā)重要。網(wǎng)絡(luò)安全事關(guān)社會(huì)穩(wěn)定、國家安全。網(wǎng)絡(luò)安全技術(shù)與機(jī)器學(xué)習(xí)技術(shù)的結(jié)合,為網(wǎng)絡(luò)安全技術(shù)的發(fā)展提供了新的思路和方向,是值得深入探討和研究的。論文旨在針對(duì)現(xiàn)今機(jī)器學(xué)習(xí)技術(shù)在網(wǎng)絡(luò)安全領(lǐng)域的應(yīng)用和研究進(jìn)行介紹。主要探討了循環(huán)神經(jīng)網(wǎng)絡(luò)用于探測(cè)網(wǎng)絡(luò)攻擊數(shù)據(jù),聚類算法用于排查異常輸入, 強(qiáng)化學(xué)習(xí)應(yīng)用于網(wǎng)絡(luò)安全性檢測(cè)的技術(shù)原理,實(shí)現(xiàn)的可行性等內(nèi)容,并對(duì)未來可能的發(fā)展方向做一展望。

      關(guān)鍵詞:網(wǎng)絡(luò)安全;機(jī)器學(xué)習(xí);人工智能

      中圖分類號(hào):TP309 文獻(xiàn)標(biāo)識(shí)碼:A

      Abstract: In the information era, The Internet plays a more important place in our live and our work. The security of the network is concerned with the Social stability and national security. The combination of network security and the Machine Learning technology provides new research directions for the network security protection, which is worthy to be discussed and researched. This article aims at an overview of the application of network security technology based on Machine Learning, and give an outlook on the development of Machine Learning in the future.

      Key words: network security; machine learning; artificial intelligence

      1 引言

      近年來,隨著計(jì)算機(jī)相關(guān)技術(shù)的高速發(fā)展、數(shù)據(jù)量的爆發(fā)式增長,以及計(jì)算機(jī)運(yùn)算能力的逐步提升,基于機(jī)器學(xué)習(xí)技術(shù)的人工智能得到了長足發(fā)展的基礎(chǔ)。基于機(jī)器學(xué)習(xí)的新算法的出現(xiàn),更加推動(dòng)了人工智能應(yīng)用的大爆發(fā)。國家也將人工智能技術(shù)提高到國家發(fā)展戰(zhàn)略的重要高度。2017年國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》(國發(fā)〔2017〕35號(hào)文件),提出了面向2030年我國新一代人工智能發(fā)展的指導(dǎo)思想、戰(zhàn)略目標(biāo)、重點(diǎn)任務(wù)和保障措施,部署構(gòu)筑我國人工智能發(fā)展的先發(fā)優(yōu)勢(shì),加快建設(shè)創(chuàng)新型國家和世界科技強(qiáng)國。目前,人工智能技術(shù)在圖像識(shí)別、自然語言處理、語音翻譯、視頻內(nèi)容識(shí)別等方面都有了實(shí)際的應(yīng)用場(chǎng)景,并取得了良好的效果。因此,探索在網(wǎng)絡(luò)安全領(lǐng)域使用基于機(jī)器學(xué)習(xí)的人工智能技術(shù)具有重要的現(xiàn)實(shí)意義。

      2 概述

      2.1 機(jī)器學(xué)習(xí)與人工智能

      人工智能技術(shù)是一個(gè)較為寬泛的范疇,泛指由人工制造出來的系統(tǒng)所表現(xiàn)出來的智能。通常所說人工智能,是指通過普通電腦實(shí)現(xiàn)的智能,其有很多不同的研究方向和分支。機(jī)器學(xué)習(xí)是人工智能的一個(gè)分支,是實(shí)現(xiàn)人工智能的一種途徑。它以數(shù)據(jù),或者稱為“知識(shí)”為基礎(chǔ),以“學(xué)習(xí)”為手段解決人工智能中的問題。機(jī)器學(xué)習(xí)在近30多年已發(fā)展為一門多領(lǐng)域交叉學(xué)科,涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、計(jì)算復(fù)雜性理論等多門學(xué)科。其最基本的做法,是使用算法來解析數(shù)據(jù)、從中學(xué)習(xí)規(guī)律,然后對(duì)真實(shí)世界中的事件做出決策和預(yù)測(cè)。機(jī)器學(xué)習(xí)與傳統(tǒng)意義上為解決特定任務(wù)而編寫的軟件程序不同。傳統(tǒng)軟件是由程序員使用計(jì)算機(jī)語言來描述給定的輸入與預(yù)期的輸出之間的數(shù)學(xué)或邏輯關(guān)系;而機(jī)器學(xué)習(xí)是用大量的數(shù)據(jù)來“訓(xùn)練”一個(gè)數(shù)學(xué)模型,使其通過各種算法從數(shù)據(jù)中學(xué)習(xí)到給定輸入與預(yù)期輸出之間的關(guān)系,從而能夠?qū)π陆o出的輸入數(shù)據(jù)做出正確的響應(yīng),完成預(yù)期的功能。

      2.2 網(wǎng)絡(luò)攻擊

      自上世紀(jì)80年代互聯(lián)網(wǎng)技術(shù)誕生以來,網(wǎng)絡(luò)為人類提供了工作生活工作的便利。同時(shí),隨著網(wǎng)路技術(shù)的高速進(jìn)步,也伴生著針對(duì)互聯(lián)網(wǎng)的各種網(wǎng)絡(luò)攻擊技術(shù)的發(fā)展。近年來,各類網(wǎng)絡(luò)安全事件和網(wǎng)絡(luò)攻擊事件頻發(fā)。如2016年10月由惡意軟件控制的僵尸網(wǎng)絡(luò)發(fā)起的拒絕服務(wù)(DDoS)攻擊,造成美國東海岸大范圍斷網(wǎng);2017年5月爆發(fā)的勒索病毒軟件,造成全球數(shù)十萬用戶電腦資料被加密。網(wǎng)絡(luò)攻擊已經(jīng)逐步從黑客個(gè)人對(duì)技術(shù)的嘗試性挑戰(zhàn),發(fā)展為帶有明確經(jīng)濟(jì)政治目的的行為。網(wǎng)絡(luò)空間的安全關(guān)系著社會(huì)的穩(wěn)定和國家的安全,因此網(wǎng)絡(luò)安全受到國家、學(xué)術(shù)界及工業(yè)領(lǐng)域的高度重視。

      網(wǎng)絡(luò)攻擊從攻擊目標(biāo)上分類,大致可分為四個(gè)類型:拒絕服務(wù)攻擊(DDoS)、利用型攻擊、信息收集型攻擊(Information Gathering)、假消息攻擊,如表1所述。

      表1所述攻擊方式,雖然大部分都有有效的防御手段,但攻擊技術(shù)每天都在不斷的發(fā)展,即使對(duì)于已知的攻擊方式也有百密一疏的時(shí)候,因此網(wǎng)絡(luò)安全是一個(gè)需要長期重視的課題。

      3 人工智能技術(shù)在網(wǎng)絡(luò)攻擊探測(cè)方面的應(yīng)用場(chǎng)景

      3.1 深度學(xué)習(xí)用于分析網(wǎng)絡(luò)訪問數(shù)據(jù)流

      深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支,它使用由非常多個(gè)神經(jīng)元組成的多層網(wǎng)絡(luò)結(jié)構(gòu)來擬合目標(biāo)函數(shù)。只要神經(jīng)元的個(gè)數(shù)及網(wǎng)絡(luò)的層次足夠多,理論上可以擬合任意函數(shù)。神經(jīng)元是神經(jīng)網(wǎng)絡(luò)中的基本運(yùn)算單元,由線性運(yùn)算和非線性運(yùn)算部分組成。例如,圖1為一個(gè)神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元。

      其中,a1、a2、a3為這個(gè)神經(jīng)元的輸入。他們可能是整個(gè)神經(jīng)網(wǎng)絡(luò)的輸入數(shù)據(jù),也可能是神經(jīng)網(wǎng)絡(luò)中上一層神經(jīng)元的輸出數(shù)據(jù)作為這個(gè)神經(jīng)元的輸入。w1、w2、w3分別為a1、a2、a3的權(quán)重,Z是這個(gè)神經(jīng)元的輸出。他們之間的關(guān)系為:

      g稱為激活函數(shù),實(shí)現(xiàn)非線性變化。如果沒有激活函數(shù),純線性運(yùn)算的神經(jīng)元相互疊加后,依然還是線性運(yùn)算,不具備擬合非線性函數(shù)的能力。常用的激活函數(shù)有Relu、Tanh、Sigmoid等。

      通過多個(gè)神經(jīng)元多層次的疊加所組成的神經(jīng)網(wǎng)絡(luò)模型有較強(qiáng)的擬合能力,但其輸入數(shù)據(jù)之間通常是沒有時(shí)間的先后關(guān)系的。而網(wǎng)絡(luò)中傳輸?shù)臄?shù)據(jù)流,通常與時(shí)間的先后有關(guān)。例如,某個(gè)IP對(duì)80端口的http協(xié)議發(fā)送POST請(qǐng)求是否是一種試探性的攻擊,并不能單獨(dú)從這一次請(qǐng)求的數(shù)據(jù)中確定,通常需要根據(jù)此IP之前的行為來推測(cè)。如果之前曾連續(xù)數(shù)百次向80端口發(fā)送http協(xié)議的POST請(qǐng)求,且POST內(nèi)容相近,則懷疑可能是某種錯(cuò)誤注入或掃描的嘗試。這種需要考慮輸入數(shù)據(jù)的時(shí)序關(guān)系的場(chǎng)景,就較適合使用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)。

      循環(huán)神經(jīng)網(wǎng)絡(luò)將t時(shí)刻的網(wǎng)絡(luò)隱藏層輸出數(shù)據(jù)作為中間數(shù)據(jù),在t+1時(shí)刻連同t+1時(shí)刻的輸入數(shù)據(jù)一同傳送給神經(jīng)網(wǎng)絡(luò),從而實(shí)現(xiàn)t+1時(shí)刻的輸出會(huì)受到t時(shí)刻輸入數(shù)據(jù)影響的效果。以此類推,t+2時(shí)刻的輸出數(shù)據(jù)也受到t+1時(shí)刻及t時(shí)刻的輸入數(shù)據(jù)影響,即,t+n時(shí)刻的輸出取決于t+n時(shí)刻及t+n之前所有輸入的影響,如圖2所示。

      當(dāng)黑客試圖攻擊一臺(tái)服務(wù)器時(shí),經(jīng)常會(huì)對(duì)直接暴露在互聯(lián)網(wǎng)上的服務(wù)器進(jìn)行掃描,以收集必要的信息。例如,對(duì)服務(wù)器的端口進(jìn)行掃描,以獲知服務(wù)器上都開啟了哪些服務(wù),其中是否有可以利用的缺陷或漏洞;或通過向某服務(wù)端口發(fā)送各種請(qǐng)求,分析其響應(yīng)數(shù)據(jù),根據(jù)特征來判斷運(yùn)行該服務(wù)的軟件或操作系統(tǒng)的版本信息,進(jìn)而嘗試通過該系統(tǒng)的某種特殊的漏洞來進(jìn)行攻擊。由于掃描操作的實(shí)質(zhì)還是攻擊者向服務(wù)器發(fā)送合法的請(qǐng)求,通過服務(wù)器的響應(yīng)來判斷或猜測(cè)服務(wù)器的信息。作為服務(wù)器端的軟件,很難將正常用戶的合法請(qǐng)求和攻擊者發(fā)來的用以探知服務(wù)器信息的合法請(qǐng)求區(qū)別開來。

      然而,攻擊者對(duì)服務(wù)器的掃描,必然和普通用戶的訪問是存在差異的。只是很難用編程的方式清晰的描述出這種差異,這時(shí)候,就是最適合深度神經(jīng)網(wǎng)絡(luò)發(fā)揮作用的場(chǎng)景了。此時(shí)可以將網(wǎng)絡(luò)中的數(shù)據(jù)流作為循環(huán)神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)輸入。由于循環(huán)神經(jīng)網(wǎng)絡(luò)的特性,可以很好地根據(jù)接受到的數(shù)據(jù)序列,判斷當(dāng)前的數(shù)據(jù)流屬于什么操作(正常訪問或惡意攻擊),進(jìn)而根據(jù)分類結(jié)果進(jìn)行采取必要的防范措施。

      例如,圖3是使用Nmap工具對(duì)一臺(tái)服務(wù)器掃描的log。

      圖4是從服務(wù)器端看到的數(shù)據(jù)流。

      可以看到,攻擊者依次對(duì)目標(biāo)服務(wù)器的每一個(gè)端口請(qǐng)求連接,然后發(fā)現(xiàn)了一些開啟的端口。這時(shí)使用循環(huán)神經(jīng)網(wǎng)絡(luò),對(duì)這個(gè)過程進(jìn)行學(xué)習(xí)。學(xué)習(xí)后神經(jīng)網(wǎng)絡(luò)將能夠根據(jù)當(dāng)前數(shù)據(jù)的特征,預(yù)測(cè)次操作是正常訪問還是網(wǎng)絡(luò)攻擊。

      例如,發(fā)現(xiàn)某IP地址連續(xù)對(duì)1、2、3、4、5端口發(fā)起連接請(qǐng)求,神經(jīng)網(wǎng)絡(luò)根據(jù)學(xué)習(xí)過的數(shù)萬組數(shù)據(jù)判斷,此IP準(zhǔn)備進(jìn)行網(wǎng)絡(luò)攻擊的概率為5%。(可以簡單理解為:神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)過的數(shù)據(jù)集里,所有掃描過1、2、3、4、5端口的操作中,只有5%在后續(xù)操作中表現(xiàn)為網(wǎng)絡(luò)攻擊,其余都是正常訪問。)進(jìn)而,該IP地址進(jìn)一步掃描完5000個(gè)端口后,神經(jīng)網(wǎng)絡(luò)判斷此IP企圖網(wǎng)絡(luò)攻擊的概率增加到70%。根據(jù)神經(jīng)網(wǎng)絡(luò)給出的概率,管理員可以酌情進(jìn)行干預(yù),如確認(rèn)權(quán)限、延時(shí)響應(yīng)甚至拒絕訪問等。

      3.2無監(jiān)督學(xué)習(xí)用于發(fā)現(xiàn)未知的攻擊方式

      使用有監(jiān)督的深度學(xué)習(xí),雖然可以很好的甄別出攻擊者對(duì)服務(wù)器的攻擊操作,但仍有兩個(gè)缺點(diǎn)。

      第一,有監(jiān)督學(xué)習(xí)需要大量的有標(biāo)記數(shù)據(jù)作為樣本提供給深度學(xué)習(xí)網(wǎng)絡(luò)。而標(biāo)記數(shù)據(jù)的過程需要大量人工參與,涉及到人力和資金投入。如圖5所示,人工標(biāo)記數(shù)據(jù)的過程容易成為整個(gè)工作的瓶頸。

      第二,有監(jiān)督學(xué)習(xí)由于是根據(jù)既往的數(shù)據(jù)歸納總結(jié)規(guī)律,因此必然無法識(shí)別新的攻擊手段,如圖6所示。

      即使對(duì)于已有的網(wǎng)絡(luò)攻擊模式,由于樣本數(shù)量和學(xué)習(xí)時(shí)間及資源的限制,有監(jiān)督學(xué)習(xí)也不可能學(xué)習(xí)到自從互聯(lián)網(wǎng)問世到現(xiàn)在的所有攻擊手段,只能夠針對(duì)常見的、高發(fā)的、危害性較大的攻擊方法進(jìn)行學(xué)習(xí)。因此如果攻擊者使用較為少見的攻擊方式,有可能無法被識(shí)別。

      相對(duì)于有監(jiān)督學(xué)習(xí),無監(jiān)督學(xué)習(xí)模式則沒有上述問題。無監(jiān)督學(xué)習(xí)是指模型直接從無標(biāo)簽的數(shù)據(jù)中歸納總結(jié)規(guī)律的算法,如圖7所示。無監(jiān)督學(xué)習(xí)通常用于完成數(shù)據(jù)的分類,異常數(shù)據(jù)點(diǎn)的檢測(cè)等任務(wù)。常見的無監(jiān)督學(xué)習(xí)算法有主成分分析(PCA)、聚類(Cluster Analysis)、自編碼器(Autoencoder)等。

      以常見的SQL注入攻擊為例。如果程序員在Web開發(fā)時(shí),沒有過濾敏感字符,或過濾規(guī)則不夠完備,導(dǎo)致攻擊者可以通過正常的輸入用戶名、密碼之類的輸入框,輸入通過精心設(shè)計(jì)的字符串,繞過Web界面,直接執(zhí)行數(shù)據(jù)庫或系統(tǒng)的命令,從而獲取服務(wù)器重要信息甚至獲得管理員權(quán)限。

      假設(shè)某網(wǎng)站W(wǎng)eb頁面使用Php語言編寫,其中有頁面根據(jù)用戶名查詢用戶信息。在數(shù)據(jù)庫中查找用戶的語句如下:

      $query = "SELECT * FROM users WHERE username = ",$iName

      其中,$iName是輸入?yún)?shù),通過Post方法傳入,其值為用戶輸入的用戶名。

      對(duì)于一個(gè)正常的用戶操作,輸入用戶名“bob”,最終傳輸給數(shù)據(jù)庫的查詢指令是這樣的:

      SELECT * FROM users WHERE username = bob

      但是如果攻擊者輸入的用戶名為:bob OR 1=1,且網(wǎng)頁沒有做任何過濾,就對(duì)導(dǎo)致最終傳給數(shù)據(jù)庫的查詢指令為:

      SELECT * FROM users WHERE username = bob OR 1=1

      這里,WHERE后面是一個(gè)“或”關(guān)系的兩個(gè)表達(dá)式,任意一個(gè)為真則整體表達(dá)式為真。而1=1是永遠(yuǎn)為真的,這就導(dǎo)致數(shù)據(jù)庫返回了所有用戶的信息,而不只是要查詢的bob用戶。

      那么我們?nèi)绾卫梅潜O(jiān)督學(xué)習(xí)來預(yù)防這樣的攻擊呢?我們先來列出一些用戶可能在這個(gè)頁面輸入的用戶名:

      Kimmy N

      Nancy1992

      Tom

      Linkg_ding

      PolKKND

      Frank

      bob OR 1=1

      ZhangYN

      Cdkids october

      Alice

      Kiya

      當(dāng)這些輸入的用戶名放在一起時(shí),即使沒有相關(guān)專業(yè)知識(shí)的人一眼看過去,也會(huì)感覺到bob OR 1=1這一項(xiàng)與其他項(xiàng)的差異較大。我們根據(jù)類似的原理,使用無監(jiān)督學(xué)習(xí)進(jìn)行孤立探測(cè)排除其中的差異項(xiàng)。

      孤立探測(cè)有多種算法,基于高斯概率模型,基于距離算法,基于聚類的算法等等。我們以聚類算法舉例,聚類算法用來對(duì)數(shù)據(jù)進(jìn)行分類,是一種統(tǒng)計(jì)分析方法。通常將每項(xiàng)數(shù)據(jù)映射為多維空間的點(diǎn),通過迭代計(jì)算質(zhì)心點(diǎn)位置對(duì)所有數(shù)據(jù)盡進(jìn)行分類。例如,二維平面上有n個(gè)數(shù)據(jù)點(diǎn)如圖8所示。

      在圖中任意取兩個(gè)點(diǎn)A和B,計(jì)算每個(gè)數(shù)據(jù)點(diǎn)到點(diǎn)A和點(diǎn)B的歐式距離。距離A點(diǎn)近的分為A類,距離B點(diǎn)近的分為B類,如圖9所示。

      全部分類之后,計(jì)算所有A類點(diǎn)的質(zhì)心點(diǎn)A1,所有B類點(diǎn)的質(zhì)心點(diǎn)B1,移動(dòng)A、B兩點(diǎn),另A=A1.B=B1,然后重復(fù)分類過程。如此迭代n輪之后,A,B兩點(diǎn)將不再移動(dòng),最終分類結(jié)果如圖10所示。藍(lán)色點(diǎn)為一類,紅色點(diǎn)位另一類??梢钥吹剿惴ㄕ_的將兩個(gè)數(shù)據(jù)異常點(diǎn)與其他數(shù)據(jù)區(qū)分開來。以上為聚類算法中較為簡單的K-means聚類。這里為了直觀使用了二維數(shù)據(jù),同理可擴(kuò)展到N維數(shù)據(jù)。在實(shí)際應(yīng)用中,數(shù)據(jù)通常是較大維度的。如何將原始數(shù)據(jù)映射為n維數(shù)據(jù)點(diǎn),也是我們需要仔細(xì)考慮的過程。

      就上面說到的SQL注入攻擊來說,可以將用戶名映射為n維數(shù)據(jù)點(diǎn),然后使用聚類算法,將最新輸入過的1000個(gè)用戶名使用K-means算法分為兩類。(這里1000個(gè)僅為舉例,實(shí)際根據(jù)分類的精準(zhǔn)度和運(yùn)算速度來取合適的值)由于K-means算法的特點(diǎn),分類不會(huì)失敗,無論數(shù)據(jù)分布情況如何,總能分為兩類。我們可以根據(jù)分類后的數(shù)據(jù)情況來判斷,通常情況下,沒有異常數(shù)據(jù)點(diǎn)的話兩類數(shù)據(jù)點(diǎn)的個(gè)數(shù)應(yīng)該大致相同。如果有異常數(shù)據(jù)點(diǎn),則異常點(diǎn)將被分做一類,其余數(shù)據(jù)一類。這樣,我們就可以在沒有任何先驗(yàn)數(shù)據(jù)的前提下,對(duì)攻擊者的注入式攻擊進(jìn)行預(yù)警,而且這種預(yù)警是動(dòng)態(tài)的,他并不關(guān)心什么樣的輸入才是攻擊,而只管找出“和大多數(shù)不一樣”的輸入。

      3.3 強(qiáng)化學(xué)習(xí)對(duì)網(wǎng)絡(luò)安全性的測(cè)試

      強(qiáng)化學(xué)習(xí)是通過構(gòu)建一個(gè)智能體(Agent),使其與環(huán)境(Environment)進(jìn)行交互,并從中學(xué)習(xí)的一種學(xué)習(xí)方式。智能體可以獲得環(huán)境的當(dāng)前狀態(tài),并根據(jù)當(dāng)前狀態(tài)進(jìn)行動(dòng)作(Action)。智能體的動(dòng)作將影響環(huán)境下一時(shí)刻的狀態(tài)。隨著環(huán)境狀態(tài)的改變,智能體將得到反饋(Reward)。如果環(huán)境朝著期望的狀態(tài)改變,智能體將得到正向反饋,反之得到負(fù)反饋。通過與環(huán)境的這種反復(fù)交互,期望智能體最終能夠習(xí)得根據(jù)環(huán)境做出最優(yōu)解的動(dòng)作,以獲得最大回報(bào),如圖11所示。

      Agent可以通過學(xué)習(xí)策略函數(shù)π來獲得在給定狀態(tài)s時(shí),動(dòng)作集上的函數(shù)分布。

      或者也可以學(xué)習(xí)值函數(shù)V,根據(jù)給定狀態(tài)s和動(dòng)作a,獲得未來狀態(tài)優(yōu)良度的評(píng)估,從而間接輔助選擇動(dòng)作a,使得所選擇的a導(dǎo)致未來狀態(tài)向良性發(fā)展。

      學(xué)習(xí)值函數(shù)或策略函數(shù)的實(shí)現(xiàn)方式可根據(jù)實(shí)際情況選擇不同的方法。對(duì)于整體系統(tǒng)較為簡單,狀態(tài)S有限的環(huán)境,可以使用Q-table方式實(shí)現(xiàn)。對(duì)于較復(fù)雜的系統(tǒng),人們將其與機(jī)器學(xué)習(xí)相結(jié)合,使用深度神經(jīng)網(wǎng)絡(luò)來擬合策略函數(shù)或者價(jià)值函數(shù)。強(qiáng)化學(xué)習(xí)常被使用在游戲領(lǐng)域及自動(dòng)化控制領(lǐng)域,如無人車、機(jī)器人等。

      強(qiáng)化學(xué)習(xí)同樣屬于無監(jiān)督學(xué)習(xí)過程,它不需要事先準(zhǔn)備帶有標(biāo)簽的數(shù)據(jù),而是自己從環(huán)境中總結(jié)規(guī)律。這對(duì)于自動(dòng)化控制領(lǐng)域是一個(gè)劣勢(shì),因?yàn)橐獜恼鎸?shí)的物理環(huán)境中學(xué)習(xí),時(shí)間成本會(huì)大大增加。(當(dāng)然現(xiàn)在也在探索使用電腦模擬物理環(huán)境進(jìn)行學(xué)習(xí)的技術(shù),可以一定程度上提高學(xué)習(xí)速度。但由于模擬環(huán)境畢竟與真實(shí)環(huán)境有差異,最終還是需要在真實(shí)環(huán)境中學(xué)習(xí)。)但對(duì)于網(wǎng)絡(luò)安全領(lǐng)域,環(huán)境本身就是數(shù)字化的。網(wǎng)絡(luò)的吞吐量,服務(wù)進(jìn)程運(yùn)行狀態(tài),資源占用等情況,都可以輕易的提供給神經(jīng)網(wǎng)絡(luò)進(jìn)行學(xué)習(xí),學(xué)習(xí)時(shí)間上并沒有比其他學(xué)習(xí)方式有明顯差異。

      強(qiáng)化學(xué)習(xí)已有被用來進(jìn)行網(wǎng)絡(luò)攻擊的案例。從另一方面想,也可以利用強(qiáng)化學(xué)習(xí)來檢測(cè)網(wǎng)絡(luò)的安全性,排查服務(wù)器的漏洞。使用深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行學(xué)習(xí),以服務(wù)器狀態(tài)作為環(huán)境狀態(tài),以攻擊服務(wù)器獲取權(quán)限或影響其正常運(yùn)轉(zhuǎn)作為目標(biāo)進(jìn)行訓(xùn)練。神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的過程,也就是它尋找服務(wù)器漏洞的過程。深度神經(jīng)網(wǎng)絡(luò)可以反復(fù)不停的試探對(duì)目標(biāo)的攻擊,并且,它的試探并不是無目的的遍歷,而是逐步根據(jù)服務(wù)器給出的響應(yīng),總結(jié)規(guī)律,有方向有目標(biāo)的嘗試攻擊目標(biāo)。

      使用強(qiáng)化學(xué)習(xí)的優(yōu)勢(shì)還體現(xiàn)在可以隨著服務(wù)器軟件版本的升級(jí)而隨時(shí)改變自身的攻擊策略,持續(xù)發(fā)揮作用。每次神經(jīng)網(wǎng)絡(luò)的動(dòng)作都會(huì)得到響應(yīng)的反饋,如果服務(wù)器的軟件更新升級(jí),得到的響應(yīng)不同,反饋數(shù)據(jù)也會(huì)不一樣。這將會(huì)導(dǎo)致神經(jīng)網(wǎng)絡(luò)參數(shù)更新,使其自動(dòng)調(diào)整行為以適應(yīng)新的環(huán)境。這避免了有監(jiān)督學(xué)習(xí)中,在數(shù)據(jù)分布特征變化的時(shí)候必須重新訓(xùn)練網(wǎng)絡(luò)的問題。

      4 結(jié)束語

      機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等人工智能技術(shù)已在眾多領(lǐng)域中發(fā)揮作用,深入到我們生活工作的方方面面。同時(shí),我們也看到人工智能技術(shù)現(xiàn)有的一些局限性。例如其可解釋性差,很多時(shí)候雖然可根據(jù)統(tǒng)計(jì)學(xué)原理確定人工智能的預(yù)測(cè)或判斷是有效的,但具體到針對(duì)某一組數(shù)據(jù)的預(yù)測(cè)或判斷,我們難以準(zhǔn)確了解其做出預(yù)測(cè)或判斷的依據(jù)。因此,目前在需要高可靠性的領(lǐng)域,人工智能模型通常只作為參考,而不起決定作用。

      將機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)技術(shù)應(yīng)用在網(wǎng)絡(luò)安全領(lǐng)域,對(duì)于提高網(wǎng)絡(luò)安全性,減少網(wǎng)絡(luò)維護(hù)成本,有著積極的意義。人工智能與各傳統(tǒng)行業(yè)的結(jié)合,已經(jīng)產(chǎn)生出很多可觀的成果。在網(wǎng)絡(luò)安全領(lǐng)域應(yīng)用機(jī)器學(xué)習(xí)技術(shù),必將為網(wǎng)絡(luò)安全技術(shù)帶來新的發(fā)展方向,引領(lǐng)網(wǎng)絡(luò)安全進(jìn)入新的發(fā)展階段。另一方面,應(yīng)用人工智能技術(shù)進(jìn)行網(wǎng)絡(luò)攻擊的手段也已出現(xiàn)。未來,網(wǎng)絡(luò)攻擊與防御將是兩方人工智能技術(shù)的比拼。因此,將機(jī)器學(xué)習(xí)應(yīng)用于網(wǎng)絡(luò)安全中是有益且有必要的,機(jī)器學(xué)習(xí)必將引領(lǐng)網(wǎng)絡(luò)安全技術(shù)獲得長足的進(jìn)步。

      參考文獻(xiàn)

      [1] 周志華,王玨.機(jī)器學(xué)習(xí)及其應(yīng)用2009[M].北京:清華大學(xué)出版社,2009.

      [2] 張蕾,崔勇,劉靜,江勇,吳建平.機(jī)器學(xué)習(xí)在網(wǎng)絡(luò)空間安全研究中的應(yīng)用[J].計(jì)算機(jī)學(xué)報(bào),2018.

      [3] 伊恩·古德費(fèi)洛,約書亞·本吉奧.深度學(xué)習(xí)[M].北京:人民郵電出版社.

      [4] Alpaydin E.Introduction to Machine Learning (Adaptive Computation and Machine Learning)[M].MIT Press,2004.

      猜你喜歡
      機(jī)器學(xué)習(xí)網(wǎng)絡(luò)安全人工智能
      網(wǎng)絡(luò)安全
      2019:人工智能
      商界(2019年12期)2019-01-03 06:59:05
      網(wǎng)絡(luò)安全人才培養(yǎng)應(yīng)“實(shí)戰(zhàn)化”
      人工智能與就業(yè)
      上網(wǎng)時(shí)如何注意網(wǎng)絡(luò)安全?
      數(shù)讀人工智能
      小康(2017年16期)2017-06-07 09:00:59
      基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
      基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
      前綴字母為特征在維吾爾語文本情感分類中的研究
      基于支持向量機(jī)的金融數(shù)據(jù)分析研究
      洮南市| 岳阳县| 临高县| 庆城县| 泌阳县| 平邑县| 云浮市| 开封县| 牡丹江市| 保靖县| 天长市| 札达县| 大洼县| 新龙县| 满洲里市| 饶平县| 来安县| 阿城市| 隆安县| 恩施市| 闵行区| 天柱县| 阜新| 江阴市| 栾川县| 湟源县| 昔阳县| 新乡县| 基隆市| 法库县| 宝山区| 和顺县| 易门县| 饶河县| 鄂托克旗| 永昌县| 合水县| 分宜县| 翁牛特旗| 涞水县| 新营市|