• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      “大數(shù)據(jù)”破案

      2013-07-12 18:49:10阿碧
      檢察風(fēng)云 2013年15期
      關(guān)鍵詞:安全局犯罪分子數(shù)據(jù)挖掘

      文/阿碧

      “大數(shù)據(jù)”破案

      Detect by Big Data

      文/阿碧

      據(jù)英國《衛(wèi)報》和美國《華盛頓郵報》2013年6月6日報道,美國國家安全局和聯(lián)邦調(diào)查局于2007年啟動了一個代號為“棱鏡”(PRISM)的秘密監(jiān)控項目。該項目使得他們可以直接進入網(wǎng)絡(luò)公司的中心服務(wù)器里挖掘數(shù)據(jù)、收集情報。美國安全局前雇員愛德華·斯諾登向媒體透露了這個秘密項目,引起了國際社會的高度關(guān)注?,F(xiàn)在人們關(guān)注的焦點,除了斯諾登最終的去向和命運外,還有“棱鏡門”涉及的核心技術(shù)——數(shù)據(jù)挖掘。

      從大數(shù)據(jù)中尋找破案線索

      在互聯(lián)網(wǎng)時代,警察破案除了用到傳統(tǒng)的檔案、走訪資料、電話記錄等資料外,還會用到互聯(lián)網(wǎng)上出現(xiàn)的信息。所有的這些信息匯集成海量的數(shù)據(jù),這些數(shù)據(jù)如今有了一個更加時髦的身份,那就是“大數(shù)據(jù)”(Big Data)。當然,大數(shù)據(jù)不僅僅是傳統(tǒng)的數(shù)據(jù)資料換了一個“馬甲”那么簡單。大數(shù)據(jù)指的是資料量規(guī)模巨大的資訊,往往在一個較大地域范圍內(nèi)出現(xiàn),這些資訊無法在短時間內(nèi)通過傳統(tǒng)的方法被人們所利用。

      現(xiàn)在,一個犯罪分子要想銷聲匿跡,除非把自己完全絕緣起來。這樣司法機關(guān)掌握的大數(shù)據(jù)無論有多大,都難以查找到犯罪分子的個人電子信息了。但是,在如今這個信息技術(shù)已經(jīng)滲透到生活方方面面的時代,犯罪分子要想不留下任何電子信息,已經(jīng)是幾乎不可能的事情了。比如,就算犯罪分子不上網(wǎng)、不使用手機、不看電視等,總之不和任何信息設(shè)備發(fā)生關(guān)聯(lián),也可能逃脫不了大數(shù)據(jù)的追蹤。因為犯罪分子不可能長期出現(xiàn)在道路、商店、碼頭、車站等公共場所,一旦出現(xiàn),就可能被公共或私人的電子設(shè)備拍攝到。即使犯罪分子長期蝸居在某個偏遠地區(qū)的某幢房屋內(nèi),他也可能被谷歌的街景車拍攝到他從窗口探出的腦袋。

      近期,利用大數(shù)據(jù)成功偵破的有名案例是波士頓連續(xù)爆炸案。2013年4月15日,美國波士頓在舉辦馬拉松賽的過程中發(fā)生連續(xù)炸彈爆炸案,結(jié)果導(dǎo)致3人死亡、183人受傷。在案件發(fā)生后,警方保留了案發(fā)現(xiàn)場附近的所有監(jiān)控錄像以供比對、查找,波士頓警察局的官員稱“仔細查看了所有錄像的每一幀畫面”。然后,警察走訪了事發(fā)地點附近12個街區(qū)的居民,收集可能存在的各種私人錄像和照片,無論他們來自攝像機還是私人的手機。警方還大量收集網(wǎng)上信息,包括像Twitter、Facebook、Youtube等社交媒體上出現(xiàn)的相關(guān)相片、錄像等,而且在這些受眾面廣泛的網(wǎng)站上提出了收集相關(guān)信息的請求。最終,警方從馬拉松賽事沿途錄像中尋覓到嫌疑人的蹤跡,并從錄像中截取出嫌疑人照片,其中包括嫌疑人正面的清晰影像,并結(jié)合其他信息,宣布嫌疑犯為兄弟倆,分別是26歲的塔米爾南·沙尼耶夫和19歲的喬卡·沙尼耶夫。4月19日凌晨,嫌疑人在水鎮(zhèn)(Watertown)與警方發(fā)生槍戰(zhàn),塔米爾南·沙尼耶夫在過程受重傷經(jīng)送醫(yī)不治,喬卡·沙尼耶夫趁亂逃脫。當日晚間,警方利用公共場所的紅外線攝像機,準確定位了嫌疑人的位置,并且迅速包圍。在與警方對峙數(shù)小時后,喬卡·沙尼耶夫投降,追捕行動結(jié)束。

      波士頓連續(xù)爆炸案的偵破工作符合了大數(shù)據(jù)技術(shù)中著名的4V原則:(1)來自各方的巨大的數(shù)據(jù)量(Volume);(2)各種數(shù)據(jù)源(Variety),特別是來自各種社交媒體上的圖像、影像類的非結(jié)構(gòu)化數(shù)據(jù)非常豐富;(3)快速的反應(yīng)(Velocity),在事件發(fā)生數(shù)分鐘之內(nèi),已經(jīng)有大量信息發(fā)布在各種社交媒體上;(4)這些數(shù)據(jù)對偵破工作也很有價值(Value),其社會價值是無法簡單估量的。當然,大數(shù)據(jù)也給偵破工作帶來挑戰(zhàn),如何處理從各個數(shù)據(jù)源收集來的信息就是個難題,包括對信息的真?zhèn)芜M行鑒定,對同一地點不同距離、不同視角、不同清晰度、不同時間的有用信息的綜合利用。

      如何獲取大數(shù)據(jù)

      目前,獲取大數(shù)據(jù)的渠道主要有兩個,一個是電話公司,一個是互聯(lián)網(wǎng)公司。美國安全局就長期從電話運營商處獲取到通話數(shù)據(jù)庫,其中包含大量通話數(shù)據(jù)記錄,例如通話時間與通話時長、相關(guān)電話號碼以及移動設(shè)備本地數(shù)據(jù)等等。這套數(shù)據(jù)庫建立于2001年“911”恐怖襲擊事件后不久,而且得到了多家電信運營商的支持。2006年,《今日美國》稱這套通話數(shù)據(jù)庫是“世界上規(guī)模最大的數(shù)據(jù)庫”。該數(shù)據(jù)庫處理著數(shù)以十億計的電話記錄數(shù)據(jù),有大量的計算機和數(shù)據(jù)分析師處理這些數(shù)據(jù)。

      美國還長期從互聯(lián)網(wǎng)信息中獲取大數(shù)據(jù)。然而,他們目前無法真正捕捉并保存用戶們所產(chǎn)生的全部數(shù)據(jù)。隨著信息技術(shù)的發(fā)展,這兩項艱巨任務(wù)逐漸變得可能起來。由于全球互聯(lián)網(wǎng)的IP地址都由美國的服務(wù)商來提供,這給美國監(jiān)控全世界提供了便利。美國安全局已經(jīng)在海底互聯(lián)網(wǎng)光纖主干上安裝了智能流量分析器,這是一種原理類似于“水龍頭”的分流裝置,可以獲取全球互聯(lián)網(wǎng)上的信息。

      然而,比獲取信息更難的是存儲信息。根據(jù)思科公司的統(tǒng)計,2012年全球互聯(lián)網(wǎng)流量每天達11億GB,這需要110萬個容量為1000GB的硬盤來容納這些數(shù)據(jù)。目前世界上90%以上的數(shù)據(jù)是最近幾年才產(chǎn)生的,而在未來一段時期內(nèi),互聯(lián)網(wǎng)上的數(shù)據(jù)每年將增長50%,從存儲物質(zhì)來看,目前要將互聯(lián)網(wǎng)上的所有信息存儲下來就已經(jīng)無法實現(xiàn),更不要說實際使用這些信息了。當然,從技術(shù)發(fā)展的角度來看,將來是有希望做到把所有的信息都存儲下來,這就是未來的DNA計算機所能做的事情。DNA計算機將利用人工合成的DNA作為存儲介質(zhì)。DNA由4個堿基組成,它們的排列順序千變?nèi)f化,儲存信息的容量相當大。最近,哈佛大學(xué)研究人員將一本大約有5.34萬個單詞的書籍編碼進不到億萬分之一克的DNA微芯片,然后成功利用 DNA 測序裝置來閱讀這本書。這是迄今為止人類使用DNA遺傳物質(zhì)儲存數(shù)據(jù)量最大的一次實驗。

      由于目前DNA存儲還沒有進入實用階段,安全部門和司法部門都只能從相對有限的大數(shù)據(jù)中獲取線索。美國安全局每天所捕捉并保留的數(shù)據(jù)總量,也僅占每天全球互聯(lián)網(wǎng)流量和通話記錄中的一小部分,即那些通過關(guān)鍵詞、關(guān)鍵圖像、關(guān)鍵數(shù)據(jù)等篩選過后的信息。從互聯(lián)網(wǎng)獲取信息還遭遇另外一個難題,那就是密碼問題。往往安全部門希望獲得的信息卻是經(jīng)過加密的,比如恐怖組織和一些黑客會采取很先進的加密技術(shù)來傳輸自己的信息。要破譯這些信息,不僅需要更好的技術(shù),而且投入十分巨大。而且,破譯這些信息需要一定時間,恐怖組織或犯罪分子會利用這個時間差,在相關(guān)部門破譯信息之前,恐怖襲擊或犯罪活動已經(jīng)發(fā)生了。因此,大數(shù)據(jù)時代警方所能利用的線索雖然很多,但是需要警方不斷更新技術(shù),讓自己更好且快速地從這些數(shù)據(jù)中挖掘出有用信息。這些技術(shù)被統(tǒng)稱為“數(shù)據(jù)挖掘”。

      利用數(shù)據(jù)挖掘技術(shù)破案

      在偵破過程中,刑偵人員會對來源不同的各種證據(jù)和線索進行梳理,找出對偵破最有用的證據(jù)和線索。這些對已有資料的梳理、統(tǒng)計、分析工作,就是數(shù)據(jù)挖掘技術(shù)。在司法領(lǐng)域,數(shù)據(jù)挖掘是一項比較古老的方法。在一百多年前,多國司法機構(gòu)就知道建立違法犯罪檔案。一旦某地出現(xiàn)新的違法犯罪活動時,偵破人員會搜索已有的檔案,從中發(fā)現(xiàn)破案的線索。而犯罪學(xué)專家則研究這些檔案,總結(jié)違法犯罪的動機、方式、工具等特征,為預(yù)防犯罪和偵破提供依據(jù)。這些都是較為古老的人工數(shù)據(jù)挖掘方法。到了信息科技時代,數(shù)據(jù)挖掘則以計算機挖掘為主。

      數(shù)據(jù)挖掘的英語名稱是Data Mining,又譯為資料探勘、數(shù)據(jù)采礦。所謂數(shù)據(jù)挖掘,是指從大量不完全、有噪聲、模糊、隨機的數(shù)據(jù)中,通過設(shè)置一定的學(xué)習(xí)算法,提取那些隱含在其中的,然而人們事先不知道卻有潛在用途信息的過程。它是根據(jù)數(shù)據(jù)的微觀特征,發(fā)現(xiàn)其表征的、帶有普遍性的、較高層次概念的知識,是信息優(yōu)勢成為知識優(yōu)勢的基礎(chǔ)工程。數(shù)據(jù)挖掘萌芽于“情報深加工”,其實質(zhì)就是發(fā)現(xiàn)情報背后的情報。在大數(shù)據(jù)時代,數(shù)據(jù)挖掘就是從海量數(shù)據(jù)中尋找到自己需要的信息,我們常用的百度、谷歌等搜索引擎完成的工作也屬于數(shù)據(jù)挖掘的范疇。

      隨著計算機和互聯(lián)網(wǎng)技術(shù)的迅速崛起與普及,人們(當然包括犯罪分子和恐怖分子)已經(jīng)離不開手機、電腦、智能電視等智能終端設(shè)備,不少日常活動基本上都可以數(shù)字化地表示。幾點幾分從家出門,坐什么車花了多長時間到了工作地點。這期間,無論是誰,每發(fā)一次微博和打一次電話,包括經(jīng)緯度在內(nèi)的精確地理位置信息都被記錄在案,而通話記錄在許多年之后仍可以被調(diào)閱查詢??傊谕ㄐ偶夹g(shù)無孔不入的時代,人們的一舉一動都產(chǎn)生了大量的數(shù)據(jù)。而在很多時候,這些原始數(shù)據(jù)就會成為司法部門破案時所需要分析的材料。

      數(shù)據(jù)挖掘是通過分析每個數(shù)據(jù),從大量數(shù)據(jù)中尋找其規(guī)律的技術(shù),主要有數(shù)據(jù)準備、規(guī)律尋找和規(guī)律表示三個步驟。數(shù)據(jù)準備是從相關(guān)的數(shù)據(jù)源中選取所需的數(shù)據(jù)并整合成用于數(shù)據(jù)挖掘的數(shù)據(jù)集;規(guī)律尋找是用某種方法將數(shù)據(jù)集所含的規(guī)律找出來;規(guī)律表示是盡可能以可理解的方式(如可視化)將找出的規(guī)律表示出來。由于人類從來沒有像今天這樣如此依賴網(wǎng)絡(luò)和電子設(shè)備,因此,信息時代眾多的電子蹤跡讓研究每個人、每個群體,甚至整個人類的習(xí)慣成為了可能。

      目前,美國安全局已經(jīng)開始利用數(shù)據(jù)挖掘技術(shù)追蹤恐怖分子和監(jiān)控社會情緒。比如,美國安全局和交通安全局曾經(jīng)基于數(shù)據(jù)挖掘技術(shù),開發(fā)出計算機輔助乘客篩選系統(tǒng)。該系統(tǒng)為美國本土各個機場提供接口,當乘客購買機票時,系統(tǒng)利用乘客提供的信息確定乘客是否是需要額外安全篩選的人員。該系統(tǒng)將乘客購買機票時提供的信息輸入到商用數(shù)據(jù)提供商提供的數(shù)據(jù)庫,這些信息包括全名、地址、電話號碼以及出生日期。商用數(shù)據(jù)庫然后將隱含特殊危險等級的數(shù)字分值傳送給交通安全局。帶有“綠色”分值的乘客將接受“正常篩選”,帶有“黃色”分值的乘客將接受“額外篩選”,而帶有“紅色”分值的乘客將被禁止登機而且還將接受“法律強制性的關(guān)照”。在利用商用數(shù)據(jù)庫信息時,交通安全局聲稱工作人員不會看到用于計算分值的實際信息,也不會保留乘客的信息,以此保障乘客的隱私。

      目前,數(shù)據(jù)挖掘技術(shù)已經(jīng)被用在刑事偵破領(lǐng)域,為破獲一些疑難雜案、保障老百姓的人身和財產(chǎn)安全提供了新的技術(shù)支持。比如,尋找犯罪嫌疑人的人臉識別方法就需要用到數(shù)據(jù)挖掘技術(shù)。警方先通過計算機對嫌疑人進行畫像,然后自動在目標人員數(shù)據(jù)庫中搜索犯罪嫌疑人。不過,人臉識別技術(shù)要高效發(fā)揮破案的作用,前提就是要建立有大級別的人像數(shù)據(jù)庫系統(tǒng)。也就是說,人臉識別的數(shù)據(jù)挖掘是需要建立在大數(shù)據(jù)的基礎(chǔ)之上的。同樣,指紋識別、虹膜識別、掌紋識別、步態(tài)識別等生物識別技術(shù),也需要逐步完善的數(shù)據(jù)庫給予支撐。

      在司法領(lǐng)域,數(shù)據(jù)挖掘技術(shù)分析的對象一般分為兩大類:一類是基于監(jiān)控對象的系統(tǒng),它能夠幫助分析專家跟蹤某個犯罪嫌疑人;另一類是基于行為模式的系統(tǒng),它可以在多種活動方式中搜尋可疑的可能涉及犯罪的行為,或者可能是犯罪分子才會產(chǎn)生的行為?;诒O(jiān)控對象的數(shù)據(jù)挖掘技術(shù)又稱作關(guān)聯(lián)分析法,是司法機構(gòu)重點開發(fā)的技術(shù)。這種方法能利用相關(guān)數(shù)據(jù),在表面上沒有關(guān)系的人或事件之間建立關(guān)聯(lián)。比如,如果某人是犯罪嫌疑人,那么就可以使用關(guān)聯(lián)軟件發(fā)現(xiàn)嫌疑人可能正在影響的其他人,從相關(guān)人那里獲取破案線索。

      重大的案件會用到超級計算機進行數(shù)據(jù)分析

      大數(shù)據(jù)時代的隱憂

      英國牛津大學(xué)網(wǎng)絡(luò)學(xué)院的維克托·爾耶·舍恩伯格教授在其新書《大數(shù)據(jù)時代》書的引言中說:“大數(shù)據(jù)開啟了一次重大的時代轉(zhuǎn)型。就像望遠鏡讓我們能夠感受宇宙,顯微鏡讓我們觀測微生物一樣,大數(shù)據(jù)正在改變我們的生活以及理解世界的方式,成為新發(fā)明和新服務(wù)的源泉,而更多的改變正蓄勢待發(fā)…… ”

      美國政府已將大數(shù)據(jù)視為“未來的新石油”,并將對大數(shù)據(jù)的研究上升為國家意志。在美國的推動下,未來大數(shù)據(jù)之戰(zhàn)的腳步聲也似乎越來越近。

      舍恩伯格在新書中還表示,在大數(shù)據(jù)時代,人們時刻都暴露在“第三只眼”之下:亞馬遜監(jiān)視著我們的購物習(xí)慣;谷歌監(jiān)視著我們的網(wǎng)頁瀏覽習(xí)慣;而微博似乎什么都知道,不僅竊聽到了我們的心思,還能描繪我們的社交關(guān)系網(wǎng)。

      因此,不僅司法機構(gòu)可以利用大數(shù)據(jù)來破案和預(yù)測潛在的犯罪,犯罪分子和犯罪團伙也可以利用大數(shù)據(jù)尋找到可以侵害的對象并實施犯罪。以前不少盜竊大案的犯罪分子往往要實地勘察幾個月甚至數(shù)年,以此來分析某人或某機構(gòu)的習(xí)慣規(guī)律以實施犯罪行為。在大數(shù)據(jù)時代,人們只需要一臺電腦和簡單的黑客手段就可以完成這樣的分析。

      目前,已經(jīng)有不少犯罪團伙通過互聯(lián)網(wǎng)上的海量數(shù)據(jù),利用搜索引擎和密碼破譯等手段挖掘出人們的私人信息和社交關(guān)系,以此實施盜竊、詐騙、敲詐勒索、拐賣兒童等犯罪行為。

      除了可能被犯罪分子偷窺外,政府也可能正在利用大數(shù)據(jù)監(jiān)視我們,黑客也可能侵入到政府的服務(wù)器查看所監(jiān)控到的信息。如果沒有合理的控制和防范措施,人們的隱私和行為模式很可能被政府監(jiān)控人員或網(wǎng)絡(luò)黑客所散布。這正是“棱鏡”項目被泄漏之后,美國國內(nèi)和國際社會反對聲較大的一個重要原因。如果個人網(wǎng)絡(luò)信息保護問題得不到很好的解決,未來因大數(shù)據(jù)和數(shù)據(jù)挖掘引發(fā)的社會矛盾將會越來越多,且會越來越激烈。

      欄目主持人:劉雨濛 lymjcfy@163.com

      猜你喜歡
      安全局犯罪分子數(shù)據(jù)挖掘
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      歐洲食品安全局認為毒死蜱不可能安全地使用
      拜訪朋友
      與誰接頭?
      快樂語文(2018年35期)2018-11-29 21:04:26
      關(guān)于流竄犯罪案件的分析及偵查措施的運用
      歐盟食品安全局:三氯蔗糖無致癌風(fēng)險
      食品與機械(2017年5期)2017-07-05 13:24:36
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      論DNA技術(shù)在森林刑事案件中的應(yīng)用
      法制與社會(2017年4期)2017-03-01 08:57:09
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      北碚区| 榆中县| 额济纳旗| 松阳县| 津南区| 元阳县| 台安县| 临桂县| 乐都县| 广灵县| 杂多县| 五家渠市| 志丹县| 随州市| 确山县| 临海市| 玉山县| 陵水| 浠水县| 平陆县| 东源县| 新化县| 左云县| 藁城市| 龙岩市| 平邑县| 壤塘县| 海伦市| 清远市| 临高县| 德钦县| 区。| 珠海市| 民丰县| 深泽县| 黄浦区| 巴南区| 沂源县| 波密县| 健康| 怀远县|