• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      安全使者 解密百度網(wǎng)址安全中心

      2017-05-04 10:51技術(shù)宅
      電腦愛好者 2017年2期
      關(guān)鍵詞:爬蟲網(wǎng)址釣魚

      技術(shù)宅

      平時我們使用百度搜索網(wǎng)站的時候,如果是惡意網(wǎng)站,會經(jīng)常彈出“檢測到××是不安全網(wǎng)址”的提示。這樣預(yù)先防范可以讓我們避開對惡意網(wǎng)站的訪問,而此操作則是借助百度網(wǎng)址安全中心實現(xiàn)的。今天就讓我們一探究竟,看看這個安全中心究竟如何運作,以及對于惡意網(wǎng)站的檢測又用到什么技術(shù)。

      對付惡意網(wǎng)站 常見安全措施有這些

      由于現(xiàn)在大部分威脅都來自網(wǎng)上,現(xiàn)在的惡意網(wǎng)站主要是釣魚網(wǎng)站和暗藏木馬、病毒網(wǎng)站。當(dāng)然前者也大多暗藏木馬、病毒,它的主要威脅是模仿網(wǎng)銀、在線支付等網(wǎng)站,給我們的財產(chǎn)帶來損失;后者則主要通過惡意腳本、代碼等對來訪者進行侵襲。

      對于這些惡意網(wǎng)站的防范,常規(guī)的方法是通過電腦安裝的殺毒軟件等安全軟件進行檢測,這些安全軟件會在我們打開網(wǎng)址進行訪問的時候,在后臺自動對訪問的網(wǎng)址進行檢測,如果是惡意網(wǎng)站則會攔截瀏覽器對其的訪問。這些常規(guī)的防范主要借助殺毒軟件更新的病毒庫進行,但是現(xiàn)在這類網(wǎng)站每天層出不窮,而且使用各種變種、難以查殺的代碼來繞過殺毒軟件的檢測。因此為了更好地保護網(wǎng)民的安全,現(xiàn)在百度、騰訊等公司則使用更為全面、先進的網(wǎng)址安全中心服務(wù)來阻止我們對惡意網(wǎng)站的訪問。如百度網(wǎng)址安全中心會對互聯(lián)網(wǎng)上數(shù)以億計的網(wǎng)站預(yù)先進行檢測,并將可能包含惡意代碼的網(wǎng)站在搜索結(jié)果中進行標(biāo)注,這樣我們在使用百度進行搜索時就可以避免對這類網(wǎng)站的訪問(圖1)。

      安全檢測 厚度網(wǎng)址安全中心背后的技術(shù)

      大家知道現(xiàn)在網(wǎng)上惡意網(wǎng)站非常多,那么百度網(wǎng)址安全中心是怎么對其進行鑒別?其背后又使用了哪些前沿技術(shù)?

      首先對于互聯(lián)網(wǎng)上數(shù)以億計的網(wǎng)頁,百度使用“搜索引擎爬蟲”來進行自動訪問。對于這些惡意網(wǎng)站的訪問,網(wǎng)絡(luò)爬蟲并不是簡單地在網(wǎng)站門口“瞄一眼”(建立網(wǎng)頁快照),因為很多惡意網(wǎng)站存在跳轉(zhuǎn)、加密,簡單的表面訪問并不能發(fā)現(xiàn)這些暗藏的危險因素。爬蟲在訪問這些網(wǎng)站的時候會利用種種技術(shù)手段,把這些異常代碼、跳轉(zhuǎn)等全部記錄下來。

      爬蟲收集到所有網(wǎng)站的信息后會匯總到安全服務(wù)器,接下來就是對收集到的網(wǎng)頁進行安全檢測。網(wǎng)址安全檢測的幕后功臣則是“網(wǎng)址安全檢測引擎”,它會針對不同種類的惡意網(wǎng)址使用不同的方法進行檢測。比如對于惡意掛馬網(wǎng)頁的檢測方式是使用特征代碼進行檢測,百度網(wǎng)址安全中心工程師利用類似“沙盤”的虛擬系統(tǒng)將網(wǎng)頁打開進行測試,如果網(wǎng)址報警,則在搜索引擎數(shù)據(jù)庫中將這個網(wǎng)址標(biāo)注為紅色風(fēng)險頁面,這樣用戶搜索時一看就知道是惡意網(wǎng)頁(圖2)。

      對于惡意網(wǎng)址,百度網(wǎng)址安全中心則使用一種“TF-IDF算法”來進行判定。該算法可以提取網(wǎng)頁內(nèi)表述網(wǎng)頁內(nèi)容的關(guān)鍵詞,找到在這個網(wǎng)頁中頻繁出現(xiàn)但其他網(wǎng)頁中并不普遍的詞匯,如某網(wǎng)址頁面頻繁出現(xiàn)那些粗俗、下流的關(guān)鍵字,則判定其為非法頁面(圖3)。

      對于釣魚網(wǎng)站的鑒別則借助“SIMHASH算法”來判定,該算法把一個網(wǎng)頁內(nèi)容轉(zhuǎn)換成一個64位的“特征字”(類似文件的哈希值),如果兩個內(nèi)容的特征字距離小于規(guī)定值,那么就判定二者相似度極高。比如百度會先將工行網(wǎng)站首頁進行識別并生成特征字,如果爬蟲收集到的某個網(wǎng)址,經(jīng)過“SIMHASH算法”得出的特征字和工行很類似,那么網(wǎng)址安全中心就會將其判定為工行釣魚網(wǎng)站,并在搜索結(jié)果中進行標(biāo)注,從而可以讓大家不去訪問。

      不過除了模仿銀行的釣魚網(wǎng)站,還有相當(dāng)多虛假中獎頁面并沒有模仿元素。對于這類網(wǎng)址,百度安全中心使用“人工智能”技術(shù)進行識別。人工智能的核心是訓(xùn)練機器來模擬人的判斷,從而讓機器擁有類似人工的智能,可以對常見的惡意網(wǎng)頁擁有辨別的能力。如很多虛假的中獎頁面大多具備如下特征:

      網(wǎng)頁中的圖片比例很高,呈現(xiàn)瀑布流狀;

      這類網(wǎng)頁鏈接由于頻繁變動,經(jīng)常是一些和正常網(wǎng)址不一樣的奇怪域名;

      這類網(wǎng)站也會引用大量的外部鏈接。

      這樣工程師把虛假中獎頁面這些特征參數(shù)放到深度學(xué)習(xí)引擎中,機器通過學(xué)習(xí)大量的中獎頁面后就可以自動對爬蟲搜集到的網(wǎng)址進行鑒別,從而實現(xiàn)自動的智能識別

      寫在最后 道高一尺魔高一丈 安全靠大家

      俗話說“道高一尺魔高一丈”。對于百度安全中心推出的各種安全檢測手段,惡意網(wǎng)頁的制作者也不會束手就擒。為了躲避類似百度安全中心的檢測,一些惡意網(wǎng)站將原來頻繁出現(xiàn)的關(guān)鍵字變化為圖片,從而躲過百度對關(guān)鍵字的檢測。對于這種變化,百度網(wǎng)址安全中心則使用OCR識別技術(shù)對圖片文字進行識別,同時生成對應(yīng)的規(guī)則讓機器學(xué)習(xí),這樣通過強大的人工智能技術(shù)可以讓惡意網(wǎng)頁這種變化無所遁形。

      不過現(xiàn)在網(wǎng)絡(luò)安全形式仍然十分嚴峻,類似百度網(wǎng)址安全中心并不能完全保護我們的安全。一方面是安全中心并不能100%檢測到所有的惡意網(wǎng)頁,每天在網(wǎng)上仍然會出現(xiàn)各種各樣的惡意網(wǎng)址:另一方面出于好奇,即使明知是風(fēng)險頁面,很多朋友仍然會主動嘗試打開,這大大增加中招的風(fēng)險。因此要讓自己的電腦更加安全,平時我們就要養(yǎng)成良好的操作習(xí)慣。類似支付寶、網(wǎng)銀等頁面,平時將其官網(wǎng)添加到收藏夾,訪問時通過收藏夾進行打開,這樣可以避免很多釣魚網(wǎng)站的攻擊!

      猜你喜歡
      爬蟲網(wǎng)址釣魚
      2023年6月全宅影音器材編輯推薦
      利用網(wǎng)絡(luò)爬蟲技術(shù)驗證房地產(chǎn)灰犀牛之說
      本刊網(wǎng)址變更通知
      基于Python的網(wǎng)絡(luò)爬蟲和反爬蟲技術(shù)研究
      利用爬蟲技術(shù)的Geo-Gnutel la VANET流量采集
      大數(shù)據(jù)環(huán)境下基于python的網(wǎng)絡(luò)爬蟲技術(shù)
      釣魚
      本刊網(wǎng)址變更通知
      本刊網(wǎng)址更改通知
      湘阴县| 西林县| 乡宁县| 民勤县| 合水县| 陆丰市| 富川| 靖宇县| 金堂县| 凉山| 西藏| 温泉县| 金湖县| 湘潭市| 北碚区| 卓尼县| 徐州市| 福鼎市| 耒阳市| 凉城县| 布尔津县| 淮北市| 绥化市| 杭州市| 辉南县| 西宁市| 临朐县| 德州市| 吉安县| 安泽县| 苗栗市| 修文县| 孝感市| 江西省| 通辽市| 镇沅| 上犹县| 东乡| 永胜县| 景谷| 海南省|