沈臻懿
作為信息處理的一大利器,人工智能技術(shù)在云計算和大數(shù)據(jù)的驅(qū)動下發(fā)展迅猛,并可從海量數(shù)據(jù)中獲取重要的情報。即使是一些粗看起來較為尋常的開源數(shù)據(jù),在人工智能的“火眼金睛”下亦可從中發(fā)現(xiàn)違法者的蛛絲馬跡。
2021年1月6日,發(fā)生在大洋彼岸的美國“國會山淪陷事件”,令世人為之愕然。正如該國國會歷史學會專家塞繆爾·霍利迪所指出的那樣,這一令人震驚的場面,是自1814年8月英國軍隊襲擊并縱火焚燒美國國會大廈后,國會山在200多年間第一次被“攻陷”。
當時,正值美國國會參眾兩院聯(lián)席會議清點確認拜登當選總統(tǒng)的選舉人團投票結(jié)果之際,大批特朗普的支持者包圍華盛頓國會山,強行闖進國會大廳,攻陷了國會大廈這一美國最具辨識度的建筑。沖擊者在大廈內(nèi)與美國國會警察發(fā)生激烈沖突,樓內(nèi)的議員被緊急疏散,總統(tǒng)選舉計票工作也一度暫停,最終導致包括一名國會山警察在內(nèi)的五人死亡。這些沖擊者在國會大廈內(nèi)打砸、游蕩,大肆掠搶,還破壞了大量藝術(shù)品、家具和文件。
不少現(xiàn)任和前任美國執(zhí)法部門人士坦言,“國會山淪陷事件”實乃美國安保史上最大的失敗,警方從示威者手中收繳了燃燒彈、雷管和槍支等物品。數(shù)千名國民警衛(wèi)隊隊員到場驅(qū)散人群,并對現(xiàn)場進行清理。之后,美國聯(lián)邦調(diào)查局(FBI)展開了針對沖擊者的“全美大搜捕”。據(jù)《紐約時報》報道,涌入華盛頓并包圍國會大廈的人數(shù)雖有數(shù)十萬,但真正沖入大廈內(nèi)的人員僅有數(shù)百人。在茫茫人海中搜尋幾百名沖擊者,無疑是大海撈針。為了能夠?qū)⑵滏i定,F(xiàn)BI的“全美大搜捕”自然需要技術(shù)“加持”。
“國會山淪陷事件”的沖擊者多為美國時任總統(tǒng)特朗普的支持者。此前,由于推特(Twitter)等社交媒體封停特朗普賬號,并封禁諸多可能存在進一步煽動暴力行為風險的關(guān)聯(lián)賬號,特朗普的追隨者旋即將社交軟件帕勒(Parler)作為推特的替代品。帕勒擁有人數(shù)眾多的特朗普支持者、陰謀論者以及右翼極端主義者,發(fā)布的帖子中有著大量煽動暴力的內(nèi)容。其中就包括了不少參與國會山?jīng)_擊的人員和“炫耀”國會山淪陷的帖子。
互聯(lián)網(wǎng)的高度普及,使得各類社交媒體上的開源數(shù)據(jù)成了相關(guān)情報分析的重要來源。帕勒上的這些公開帖子,即是在“國會山淪陷事件”調(diào)查中尤為重要的開源數(shù)據(jù)。面對海量的開源數(shù)據(jù),若是文本信息,通??衫藐P(guān)鍵詞來進行檢索;但對于視頻、圖片或地理坐標等數(shù)據(jù),則需要借助人工智能技術(shù),來準確找尋到所需信息。“國會山淪陷事件”后,谷歌、亞馬遜網(wǎng)絡和蘋果應用商店相繼取消并下架了帕勒。不過,技術(shù)專家通過對帕勒上的開源數(shù)據(jù)挖掘,已獲取了約60TB容量的數(shù)據(jù)信息。其中就包括了帕勒上的每篇公開帖子,以及含100萬個視頻和1.5億張照片在內(nèi)總共4億多個文件。這些文件中都嵌有GPS定位坐標、日期、時間等元數(shù)據(jù)。
較之其他一些社交媒體,帕勒并不會從用戶上傳的數(shù)據(jù)信息中剝離元數(shù)據(jù),這為執(zhí)法人員的案件調(diào)查和分析提供了極為有利的條件。作為信息處理的一大利器,人工智能技術(shù)在云計算和大數(shù)據(jù)的驅(qū)動下發(fā)展迅猛,其可從海量數(shù)據(jù)中獲取重要情報。即使是一些粗看起來較為尋常的開源數(shù)據(jù),在人工智能的“火眼金睛”下亦可以從中發(fā)現(xiàn)潛在風險。此外,通過對開源數(shù)據(jù)的挖掘以及人工智能分析,相關(guān)部門還可開展風險識別、分析、預防等網(wǎng)絡安全方面的工作。
美國“國會山淪陷事件”中,沖擊者在沖進國會大廈的同時,將許多在大廈內(nèi)部拍攝的帶有潛在罪證的視頻和照片上傳帕勒等社交媒體平臺。由于帕勒上的數(shù)據(jù)皆為公開,調(diào)查人員在抓取、捕獲網(wǎng)站平臺上的所有內(nèi)容并進行存檔后,即可從中對元數(shù)據(jù)進行提取,并檢視照片、視頻的設置時間以及特定的GPS坐標,進而有助于執(zhí)法部門確認這些帕勒用戶在事件發(fā)生期間是否就在國會山以及是否參與了此次沖擊。
除了對于已發(fā)生的事件進行調(diào)查外,開源數(shù)據(jù)的挖掘還可用于對即將發(fā)生的犯罪予以預防和制止。比如,某些不法分子為了所謂的“出名”,往往會在犯罪之前將相關(guān)信息發(fā)布在社交媒體上。若相關(guān)部門通過開源數(shù)據(jù)挖掘,并對收集到的信息進行梳理和分析,即可提前制止犯罪的發(fā)生。
“國會山淪陷事件”發(fā)生后,美國聯(lián)邦調(diào)查局在一份聲明中稱,“FBI正在收集2021年1月6日發(fā)生在華盛頓特區(qū)美國國會山及周邊地區(qū)與該事件相關(guān)的數(shù)字信息和情報”。結(jié)合這一事件的調(diào)查進展情況,美國警方陸續(xù)公布了一些涉案人員的照片,其中就包括了可能導致國會山警察布萊恩·斯尼克死亡的嫌疑人照片。據(jù)照片顯示,這名頭戴藍色針織帽、留有灰白胡須、身穿格紋外衣及迷彩長褲、身背雙肩包的男性,因與國會山警察謀殺案有關(guān)已被通緝。結(jié)合另一段視頻資料,該名男子向現(xiàn)場警方人員拋擲了消防滅火器,滅火器從一名警員頭盔上彈起后,擊中了另一名警察,并導致其向后倒地。在這些影像資料的支持下,執(zhí)法部門和技術(shù)專家得以對其中的涉案人員行為進行調(diào)查,并結(jié)合人臉識別技術(shù)鎖定嫌犯。正是在人臉識別技術(shù)的幫助下,美國聯(lián)邦調(diào)查局鎖定了在國會山淪陷當天闖入美國眾議院議長辦公室,并帶走其筆記本電腦的嫌犯。同時,美國警方還在人臉識別技術(shù)和數(shù)字化跟蹤技術(shù)的幫助下,逮捕了一名叫理查德·巴雷特的男子,正是這名被美國媒體稱之為“畢哥”的沖擊者,把腿蹺在眾議院議長辦公桌上的照片在媒體上被一度瘋傳。
沖擊事件中留下的大量數(shù)據(jù)信息,包括現(xiàn)場監(jiān)控、互聯(lián)網(wǎng)信息,甚至是沖擊者的自拍及其“直播”等,都可為執(zhí)法部門通過人臉識別技術(shù)和數(shù)字化跟蹤技術(shù)持續(xù)追查國會山?jīng)_擊人員提供條件。為此,美國執(zhí)法部門連續(xù)發(fā)布公告,呼吁并尋求公眾提供與國會山?jīng)_擊者有關(guān)的信息。自當?shù)貢r間2021年1月6日晚間起,F(xiàn)BI就在其官網(wǎng)、華盛頓分局官方推特以及華盛頓各公交站貼出通告和字幕,并提供了表格鏈接,以接受社會公眾提供的數(shù)字媒體信息。
在互聯(lián)網(wǎng)時代,尤其是各類移動端的即時通信和社交媒體較為普及的時代,全世界已被數(shù)十億的攝像頭、傳感器和微處理器等覆蓋。正是由于數(shù)字信息的特點,美國“國會山淪陷事件”中的各類蛛絲馬跡,才得以成為數(shù)據(jù)信息被留存。因此,對數(shù)字信息以及開源數(shù)據(jù)的挖掘、人臉識別以及數(shù)字化跟蹤等數(shù)字技術(shù)的應用,在此次美國國會山?jīng)_擊者鎖定過程中發(fā)揮出了獨特的作用。
編輯:黃靈? yeshzhwu@foxmail.com