李 寒
美國蘭德公司于2018 年5月發(fā)布報(bào)告《定義國防業(yè)界(defense enterprise)第二代開源情報(bào)》,提出了第二代開源情報(bào)(OSINT)產(chǎn)生的背景與基本定義,并在國防業(yè)界的框架下闡述了第二代開源情報(bào)的內(nèi)容分類、操作周期、使用工具、分析方法、發(fā)展趨勢及未來展望。該報(bào)告論述了開源情報(bào)的優(yōu)勢與劣勢,進(jìn)而引發(fā)關(guān)于開源情報(bào)的幾點(diǎn)思考與啟示。
第二代開源情報(bào)的產(chǎn)生背景與基本定義。隨著互聯(lián)網(wǎng)的日益普及、社交媒體和大數(shù)據(jù)分析的迅速發(fā)展,利用開源情報(bào)來獲取信息的程度大大加深,信息的來源和處理方法日趨復(fù)雜,數(shù)據(jù)的數(shù)量和類型逐步拓寬,開源情報(bào)本身發(fā)生了重大轉(zhuǎn)型。美國家情報(bào)總監(jiān)(DNI)辦公室曾于2011年將開源情報(bào)定義為“將公開數(shù)據(jù)和信息進(jìn)行搜集、利用、分發(fā),用來滿足特定用戶需求的情報(bào)”。鑒于公開情報(bào)的性質(zhì)不斷變化,該報(bào)告建議將當(dāng)前時(shí)期開源情報(bào)的發(fā)展過程定義為第二代開源情報(bào),并把起始時(shí)間追溯至情報(bào)界創(chuàng)建開源中心的2005年。這一年,臉書(Facebook)及油管(YouTube)的相繼問世,以及2006年推特(Twitter)的成立,使得大部分在線內(nèi)容越來越多地源自于互聯(lián)網(wǎng)站、個(gè)人賬戶及社交媒體。由此推測,新一代開源情報(bào)活動是種需要多學(xué)科、多領(lǐng)域、多人員交織融合的情報(bào)工作,旨在給情報(bào)界及國防業(yè)界帶來更多有新意、有價(jià)值的信息與知識。
第二代開源情報(bào)的內(nèi)容分類與操作周期。從紛繁復(fù)雜的海量信息中識別其價(jià)值的重要性不言而喻,為了能夠更好地將開源信息加以整合利用,蘭德公司將第二代開源情報(bào)分為四種類型,即新聞媒體、灰色文獻(xiàn)、長篇社交媒體內(nèi)容和短篇社交媒體內(nèi)容。其中,新聞媒體和灰色文獻(xiàn)屬于機(jī)構(gòu)生成內(nèi)容,長篇社交媒體信息和短篇社交媒體信息屬于個(gè)人生成內(nèi)容。開源情報(bào)的搜集范圍之廣、內(nèi)容體量之大由此可見一斑。
此外,蘭德公司還將開源情報(bào)的操作周期分為收集、處理、開發(fā)和生產(chǎn)四個(gè)步驟。其中,收集是指針對開源信息的獲取,處理是指檢驗(yàn)開源信息的方法,開發(fā)是指識別開源信息的價(jià)值,生產(chǎn)是指將有價(jià)值的信息提供給用戶。
一是收集,指的是識別潛在的、有用的信息并保留上述材料。新聞媒體和灰色文獻(xiàn)的收集相對容易,大多數(shù)內(nèi)容都可在線獲得,相比之下,社交媒體信息在收集階段就要面對很多挑戰(zhàn)。首先,社交媒體信息可能很難獲得完整的、原始的數(shù)據(jù)和圖片,即使能夠獲得完整的數(shù)據(jù)和圖片,也不能作為群體樣本來進(jìn)行參考;其次,由于社交媒體數(shù)據(jù)能夠輕易地包含民眾的信息,情報(bào)機(jī)構(gòu)必須遵循與搜集和存儲信息有關(guān)的嚴(yán)格程序。
二是處理,指的是甄別信息后將其進(jìn)行翻譯與整合,主要用來分析多類型的社交媒體信息。處理可以采取多種形式,包括將原文進(jìn)行翻譯,或?qū)D片和視頻整合為可用的材料。在處理過程中,可以使用相應(yīng)的軟件和程序,以更便捷的方法和更低廉的成本來完成工作內(nèi)容。但與此同時(shí),開源信息中各種俚語、表情符號或圖標(biāo)的使用頻率越來越高,這也在一定程度上加大了處理難度。
情報(bào)學(xué)科的重疊性質(zhì)
三是開發(fā),指的是鑒定、評估可信性以及編寫成文。鑒定需要證實(shí)信息的實(shí)際情況是否如其所說;評估可信性需要判斷所掌握信息的真實(shí)程度;編寫成文需要將搜集的材料整合成完整、有序的內(nèi)容。這些過程對于新聞媒體和灰色文獻(xiàn)來說相對容易,但是對于社交媒體信息卻比較困難,社交媒體用戶可能會故意隱藏其真實(shí)身份,或故意提供虛假信息。
四是生產(chǎn),指的是將信息以可用的形式提供給用戶。開源信息可與秘密情報(bào)進(jìn)行交叉驗(yàn)證,相互融合后形成更為可靠的內(nèi)容,并以書面報(bào)告、口頭簡報(bào)或圖表等形式傳達(dá)給情報(bào)用戶。
第二代開源情報(bào)的使用工具與分析方法。情報(bào)界通常使用商業(yè)現(xiàn)成技術(shù)或工具對開源情報(bào)進(jìn)行分析,特別是對社交媒體數(shù)據(jù)進(jìn)行分析,但大多數(shù)商用現(xiàn)成技術(shù)或工具都是為商業(yè)目的而開發(fā)的——用于廣告宣傳、品牌管理和消費(fèi)分析。這些工具通常可以滿足情報(bào)界一些特定需求,但這些工具往往是針對商業(yè)需求而開發(fā)設(shè)計(jì)的,并不是專門針對情報(bào)界,因此在實(shí)際操作中,對情報(bào)界所產(chǎn)生的效能是非常有限的。社交媒體分析是一個(gè)快速發(fā)展的新興產(chǎn)業(yè),開發(fā)設(shè)計(jì)商業(yè)現(xiàn)成技術(shù)或工具的公司還處在快速變化之中,雖然這些工具可以幫助情報(bào)界掌握大量信息,但這些信息往往也會很快過時(shí),如果僅僅依賴商用現(xiàn)成品技術(shù)或工具進(jìn)行情報(bào)工作,信息的滯后性會使情報(bào)分析判斷存在一定風(fēng)險(xiǎn)。
該報(bào)告還列舉了一些用于社交媒體信息分析的方法,包括語言詞匯分析、社交網(wǎng)絡(luò)分析、地理空間分析等,這些分析方法可以單獨(dú)使用,也可以相互結(jié)合,以便能夠更充分地利用開源情報(bào)的情報(bào)價(jià)值。具體包括:一是語言詞匯分析,語言詞匯分析是所有分析方法中最基礎(chǔ)的內(nèi)容,可以計(jì)算出一個(gè)詞語在特定句子或文章中出現(xiàn)的頻率,并以此判斷用戶的語言偏好和情感傾向,進(jìn)而分析出個(gè)人或群體的思想傾向、價(jià)值觀念、政治立場等,甚至能夠?qū)ξ磥戆l(fā)展趨勢做出預(yù)測;二是社交網(wǎng)絡(luò)分析,社交網(wǎng)絡(luò)分析通過分析社交媒體用戶的信息、評論、互動等情況,搭建社交媒體關(guān)系網(wǎng)絡(luò),分析該用戶及群體在某一事件或領(lǐng)域內(nèi)的影響力;三是地理空間分析,社交媒體平臺用戶通過發(fā)布“地理標(biāo)簽”自動將一篇文章或推文鏈接到指定位置,地理空間分析通常與其他分析方法相結(jié)合,進(jìn)一步分析敏感位置目標(biāo)。
第二代開源情報(bào)的發(fā)展趨勢與未來展望。盡管情報(bào)界已經(jīng)意識到,越來越多有價(jià)值的情報(bào)存在于公共信息領(lǐng)域,但情報(bào)界在充分挖掘第二代開源情報(bào)的發(fā)展?jié)摿Ψ矫嫒匀贿M(jìn)展緩慢,業(yè)界專家希望能夠高效利用數(shù)字革命帶來的大量信息,取得情報(bào)分析的進(jìn)一步發(fā)展。一是密切關(guān)注可能催生的第三代開源情報(bào)。蘭德公司認(rèn)為,近幾年來,技術(shù)專家一直著力研討向第三代互聯(lián)網(wǎng)過渡的問題,第三代互聯(lián)網(wǎng)的機(jī)器處理數(shù)據(jù)、機(jī)器學(xué)習(xí)以及自動推理可能會催生第三代開源情報(bào)。第三代開源情報(bào)的特點(diǎn)或?qū)⒁詸C(jī)器學(xué)習(xí)與自動推理為基礎(chǔ),側(cè)重于情報(bào)收集和情報(bào)分發(fā),進(jìn)一步發(fā)展數(shù)據(jù)加密和拒絕訪問。二是努力加強(qiáng)與私營企業(yè)和學(xué)術(shù)界的交流合作。蘭德公司認(rèn)為,雖然情報(bào)機(jī)構(gòu)與非政府組織的交流合作具有一定挑戰(zhàn)性,但都是可以被克服的。近幾年來,公開信息領(lǐng)域一直也有私營企業(yè)和學(xué)術(shù)界的廣泛參與,情報(bào)機(jī)構(gòu)應(yīng)該與其共享情報(bào)、共同分析,進(jìn)一步加強(qiáng)情報(bào)融合。
開源情報(bào)的優(yōu)勢。信息時(shí)代的開源情報(bào)相較于秘密情報(bào),具有以下優(yōu)勢。一是情報(bào)搜集來源穩(wěn)定,媒介形式廣泛多樣。開源情報(bào)資料來源包括政治、軍事、經(jīng)濟(jì)、人文、地理等各個(gè)領(lǐng)域,具體媒介形式則包括雜志、廣告、博客等,甚至可以利用一些不起眼的細(xì)小信息,如電梯數(shù)據(jù)、地鐵數(shù)據(jù)、披薩餅外賣數(shù)據(jù)等,對其加以分析就能產(chǎn)生重要的情報(bào)產(chǎn)品。
二是情報(bào)獲取成本較低,信息共享頻繁便捷。開源情報(bào)所需的成本較低,在便捷的信息時(shí)代中,想要獲取新聞報(bào)道、期刊雜志、電視廣播等公共來源所提供的免費(fèi)信息易如反掌,各種情報(bào)收集與分析工具也使開源情報(bào)的獲取與利用更加便捷,尤其對于中小型國家來說,可以更為廣泛和迅速地開展情報(bào)工作。與此同時(shí),開源情報(bào)還能夠更輕易地實(shí)現(xiàn)國家間的信息共享、交流與合作,擴(kuò)大情報(bào)信息范圍,提高情報(bào)生產(chǎn)效率。
三是交叉驗(yàn)證辨析真?zhèn)?,填補(bǔ)秘密情報(bào)空白。通過秘密手段獲得的情報(bào)數(shù)量往往是比較少的,開源情報(bào)能夠較快地填補(bǔ)情報(bào)空白,與秘密情報(bào)相互補(bǔ)充,在一定程度上能夠?qū)ζ溥M(jìn)行交叉驗(yàn)證,進(jìn)一步提高了情報(bào)的準(zhǔn)確性。例如,把社交媒體信息與諜報(bào)情報(bào)信息相互印證融合,能夠使人力分析更加深入;把軍事網(wǎng)站公開發(fā)布的消息與技術(shù)偵查信號相互印證融合,能夠使軍事行動分析更加準(zhǔn)確。
開源情報(bào)操作周期
四是非傳統(tǒng)安全問題愈加突顯,公開情報(bào)地位不斷上升?!?·11”恐怖襲擊事件爆發(fā)以后,世界各個(gè)國家所面臨的威脅已不單是傳統(tǒng)安全問題,而是受到傳統(tǒng)和非傳統(tǒng)兩個(gè)方面安全問題的共同威脅。非傳統(tǒng)安全威脅通常是以非政府、非常規(guī)的形式突然出現(xiàn),不受任何規(guī)則和行為的約束,在面對傳統(tǒng)安全問題時(shí),秘密情報(bào)能發(fā)揮主要作用,而在面對非傳統(tǒng)安全問題時(shí),開源情報(bào)則能發(fā)揮其特有作用,逐漸在國家安全情報(bào)工作中起到越來越重要的作用。
開源情報(bào)的劣勢。信息時(shí)代的開源情報(bào)相較于秘密情報(bào),具有以下劣勢。一是來源繁多,關(guān)鍵信息容易遺漏?;ヂ?lián)網(wǎng)上的大部分信息和數(shù)據(jù)都是海量的、碎片的、無規(guī)律的,公開情報(bào)資料中既包含了信號又包含了噪音,增加了“信號與噪音”出現(xiàn)的頻率,容易對情報(bào)分析人員的判斷造成不利于得出正確結(jié)論的干擾。二是內(nèi)容復(fù)雜,可靠性驗(yàn)證難度大?;ヂ?lián)網(wǎng)上的大部分信息和數(shù)據(jù)質(zhì)量參差不齊,其真實(shí)性和有效性需要經(jīng)過大量的、反復(fù)的、多層的交叉驗(yàn)證,甄別難度比較大,虛假信息不僅可以來自敵方,也可以來自己方,如何辨別虛假情報(bào)一直以來都是個(gè)值得研究的問題。
完善情報(bào)機(jī)制及其運(yùn)用。隨著信息逐步實(shí)現(xiàn)全球覆蓋,開源情報(bào)不再局限于單一領(lǐng)域,政治情報(bào)中可能包含著經(jīng)濟(jì)情報(bào)、軍事情報(bào)中可能包含著科技情報(bào),各個(gè)領(lǐng)域的情報(bào)信息相互交織,進(jìn)一步推動情報(bào)融合,在情報(bào)發(fā)展進(jìn)程中發(fā)揮著重要作用。例如,在美國情報(bào)界,國家情報(bào)總監(jiān)負(fù)責(zé)統(tǒng)籌整個(gè)情報(bào)界的情報(bào)整合與分析工作。由此可見,一個(gè)情報(bào)大國或者情報(bào)強(qiáng)國都需要建立專門的情報(bào)統(tǒng)籌機(jī)構(gòu),用來打破各個(gè)部門單位之間的壁壘,這樣既實(shí)現(xiàn)了情報(bào)共享,又減少了技術(shù)和人力資源的浪費(fèi)。
按開源信息類型劃分的開源情報(bào)操作周期組成要素的難度
提升情報(bào)分析人員素質(zhì)。開源情報(bào)的分析體量巨大,包含的信息和數(shù)據(jù)質(zhì)量也都參差不齊,這就要求開源情報(bào)分析人員的業(yè)務(wù)知識、研究能力和綜合素質(zhì)都必須過硬。一是要具有較強(qiáng)的篩選和鑒別能力,對真正有價(jià)值的情報(bào)進(jìn)行提取分析,形成用戶所需的情報(bào)產(chǎn)品。二是要具有較高的辨析真?zhèn)文芰?,保留和整合正確的情報(bào)并依據(jù)這些材料進(jìn)行分析判斷,反之則會出現(xiàn)情報(bào)失誤,造成不可挽回的嚴(yán)重后果。
創(chuàng)新開源情報(bào)工作模式。當(dāng)前對于開源情報(bào)能夠起到的重要作用還未得到普遍共識,大部分仍停留在借鑒外國經(jīng)驗(yàn)的階段,重視的程度較低、投入的研究較少。在當(dāng)今大數(shù)據(jù)時(shí)代的影響下,一是應(yīng)盡快利用院校和研究機(jī)構(gòu)的科研能力及技術(shù)優(yōu)勢,針對開源情報(bào)存在的重點(diǎn)、難點(diǎn)問題積極開展共建項(xiàng)目和專題研究,推動開源情報(bào)由理論向?qū)嵺`的轉(zhuǎn)變。二是結(jié)合當(dāng)前世界發(fā)展形勢,擴(kuò)招開源情報(bào)迫切需求的小語種、軍事情報(bào)學(xué)、計(jì)算機(jī)科學(xué)等專業(yè)人員,提高情報(bào)分析水平和專業(yè)化程度,為開源情報(bào)在多領(lǐng)域提供更廣闊的發(fā)展空間。