魏 驊 丁衛(wèi)華 關(guān) 兆
近年來(lái),世界各國(guó)官方和民間智庫(kù)加大了對(duì)我國(guó)防和軍隊(duì)建設(shè)的研究,其中以美國(guó)尤甚。其投入力量之大、研究范圍之廣、綜合分析之深,前所未有。美研究者通過(guò)對(duì)因特網(wǎng)公開(kāi)資料等開(kāi)源情報(bào)的初步分析,建立大數(shù)據(jù)統(tǒng)計(jì)、分析和預(yù)測(cè)模型,在比較及縱觀性研究基礎(chǔ)上,獲得了大量研究成果,進(jìn)而推動(dòng)本國(guó)國(guó)防理念及技術(shù)應(yīng)用的整體進(jìn)步。通過(guò)觀察美國(guó)海軍戰(zhàn)爭(zhēng)學(xué)院等智庫(kù)對(duì)大數(shù)據(jù)的利用,筆者認(rèn)為,在新形勢(shì)下,我國(guó)防大數(shù)據(jù)建設(shè)應(yīng)全面提升保密意識(shí),優(yōu)先強(qiáng)化對(duì)現(xiàn)有開(kāi)源數(shù)據(jù)的分級(jí)保密,同時(shí)加強(qiáng)我軍在大數(shù)據(jù)分析方面的對(duì)等研究。
近年來(lái),美國(guó)海軍戰(zhàn)爭(zhēng)學(xué)院、海軍分析中心、布魯金斯學(xué)會(huì)、日本防衛(wèi)研究所等智庫(kù)專家學(xué)者頻繁訪華。通過(guò)與相關(guān)學(xué)者的交流發(fā)現(xiàn),美、日等國(guó)在公開(kāi)宣揚(yáng)西太平洋軍事和戰(zhàn)略壓力的同時(shí),以亞太“再平衡”戰(zhàn)略為指引,加快了軍事西進(jìn)對(duì)壘。在軍事智庫(kù)建設(shè)方面,著重于力量建設(shè)和發(fā)展,此舉不僅加強(qiáng)了服務(wù)本國(guó)的軍事理論和應(yīng)用研究,更重要的是為其盟友提供了具有針對(duì)性的戰(zhàn)術(shù)研究和風(fēng)險(xiǎn)研判。
以美國(guó)海軍戰(zhàn)爭(zhēng)學(xué)院的研究為例。為進(jìn)一步加強(qiáng)涉華研究力量,近兩年,該學(xué)院成立了中國(guó)海洋研究中心(CMSI),聚合了海軍戰(zhàn)爭(zhēng)學(xué)院長(zhǎng)期參與對(duì)華研究的專家學(xué)者,同時(shí)邀請(qǐng)?jiān)和鈱W(xué)者參與共同研究,并通過(guò)學(xué)術(shù)期刊《中?!钒葱璋l(fā)布,在按主題重點(diǎn)發(fā)布學(xué)術(shù)研究成果的同時(shí),還開(kāi)展對(duì)相關(guān)領(lǐng)域的回顧性研究。
《中?!纷?008年開(kāi)通網(wǎng)絡(luò)版以來(lái),已陸續(xù)發(fā)布12期,其內(nèi)容主要涉及中國(guó)軍方尤其是海軍的科研創(chuàng)新、人才隊(duì)伍建設(shè)、船舶基地建設(shè)等基礎(chǔ)性、根本性問(wèn)題。其中,運(yùn)用大數(shù)據(jù)搜索分析方法進(jìn)行歸納研究的案例逐漸增多。從該期刊第一期的研究文章《中國(guó)造船業(yè)的全面調(diào)查:商業(yè)發(fā)展與戰(zhàn)略意義》一文中可以看到,作者通過(guò)搜集中國(guó)造船業(yè)的相關(guān)報(bào)道、學(xué)術(shù)文章、官方數(shù)據(jù)等數(shù)據(jù),詳細(xì)繪制出《自1999年起十年間中國(guó)各省份造船能力分布圖》,噸位及標(biāo)注非常詳細(xì)。
國(guó)外智庫(kù)專家普遍表示,中國(guó)目前正在公布越來(lái)越多的數(shù)據(jù),從國(guó)有企業(yè)的上市信息到各類媒體的新聞報(bào)道,無(wú)所不有,這些數(shù)據(jù)對(duì)于他們的研究有直接幫助。美國(guó)海軍戰(zhàn)爭(zhēng)學(xué)院教授肯尼斯·艾倫在其撰寫(xiě)的《解放軍海軍的招聘、教育和訓(xùn)練》一文中,通過(guò)對(duì)《解放軍報(bào)》等媒體、《中國(guó)國(guó)防生》等著作、軍隊(duì)院校及普通高校國(guó)防生班報(bào)考指南、各省教育廳招考信息、百度百科等大量開(kāi)源數(shù)據(jù)的綜合分析、分類整理,完成了有關(guān)我海軍生長(zhǎng)軍官特別是海軍系統(tǒng)國(guó)防生教育訓(xùn)練的全面研究。
經(jīng)調(diào)查了解,艾倫教授通過(guò)長(zhǎng)期的數(shù)據(jù)“清洗”和整合分析,分散獲得中國(guó)所有國(guó)防院校的招生計(jì)劃,對(duì)國(guó)防生招生的數(shù)量和專攻領(lǐng)域、國(guó)防生后續(xù)的分配及訓(xùn)練項(xiàng)目都有了全面系統(tǒng)的認(rèn)識(shí),并通過(guò)表格等形式予以公開(kāi),形成了系統(tǒng)、翔實(shí)且具有極高價(jià)值的分析報(bào)告。
在與美國(guó)海軍戰(zhàn)爭(zhēng)學(xué)院教授吉原恒淑等專家學(xué)者交流過(guò)程中,學(xué)者們向筆者展示了大量利用開(kāi)源數(shù)據(jù)對(duì)我海軍進(jìn)行研究所得的全面、系統(tǒng)的研究成果,研究領(lǐng)域覆蓋國(guó)防生教育體系、近海防務(wù)、大洋戰(zhàn)略等范疇,內(nèi)容多引自我軍地公開(kāi)的招生計(jì)劃、學(xué)術(shù)刊物等素材,通過(guò)建立相關(guān)數(shù)學(xué)模型,利用非結(jié)構(gòu)性海量數(shù)據(jù)分析方法,完成了對(duì)這些數(shù)據(jù)的系統(tǒng)整理,形成了對(duì)我海軍人才培養(yǎng)方向、近海防務(wù)建設(shè)進(jìn)度、海洋戰(zhàn)略等情況詳盡的分析判斷。
數(shù)據(jù)是一種特殊的戰(zhàn)略資源。新形勢(shì)下推進(jìn)國(guó)防大數(shù)據(jù)建設(shè),應(yīng)從根本上轉(zhuǎn)變傳統(tǒng)數(shù)據(jù)觀念。大數(shù)據(jù)的核心是預(yù)測(cè),其精髓在于分析信息時(shí)的三個(gè)轉(zhuǎn)變:一是大數(shù)據(jù)技術(shù)可以處理與某個(gè)問(wèn)題相關(guān)的所有數(shù)據(jù),而不再依賴于隨機(jī)采樣數(shù)據(jù);二是大數(shù)據(jù)更關(guān)注宏觀問(wèn)題,而不是微觀精確度;三是大數(shù)據(jù)更關(guān)注事物之間的相關(guān)關(guān)系,而非因果關(guān)系。
第一個(gè)轉(zhuǎn)變的實(shí)質(zhì),是徹底突破了信息缺乏時(shí)代和信息流通受限制的模擬數(shù)據(jù)時(shí)代給數(shù)據(jù)分析造成的局限,即只能通過(guò)隨機(jī)選擇樣本進(jìn)行采樣分析。隨機(jī)采樣雖有其時(shí)代意義和使用價(jià)值,但實(shí)踐證明,由于實(shí)現(xiàn)采樣的隨機(jī)性非常困難,一旦采樣過(guò)程中存在任何偏見(jiàn),分析結(jié)果就會(huì)相去甚遠(yuǎn)。大數(shù)據(jù)出現(xiàn)后,“樣本即總體”成為可能,前述美國(guó)海軍戰(zhàn)爭(zhēng)學(xué)院艾倫教授的工作即是如此。
第二個(gè)轉(zhuǎn)變的實(shí)質(zhì),是接受了因數(shù)據(jù)量大幅增加可能造成結(jié)果不準(zhǔn)確的現(xiàn)實(shí),同時(shí)還要接受一些混亂甚至錯(cuò)誤的數(shù)據(jù)混入研究數(shù)據(jù)庫(kù)的可能。這個(gè)轉(zhuǎn)變是數(shù)據(jù)發(fā)展趨勢(shì)使然。據(jù)統(tǒng)計(jì),在數(shù)據(jù)發(fā)展過(guò)程中,非結(jié)構(gòu)性數(shù)據(jù)如網(wǎng)頁(yè)和視頻資源,占所有數(shù)據(jù)的95%。由于混亂和錯(cuò)誤數(shù)據(jù)的出現(xiàn),數(shù)據(jù)才真正體現(xiàn)出其完整性。
第三個(gè)轉(zhuǎn)變的實(shí)質(zhì),是顛覆“知其所以然”的傳統(tǒng)觀念。擁有大數(shù)據(jù)技術(shù)后,數(shù)據(jù)分析指向的因果關(guān)系將逐漸被相關(guān)關(guān)系所取代。在某種程度上,研究者利用大數(shù)據(jù)技術(shù),只需得知“會(huì)發(fā)生什么”而不是“為什么會(huì)發(fā)生”,而這正是大數(shù)據(jù)的價(jià)值。比如,谷歌公司曾把5000萬(wàn)條美國(guó)人最頻繁檢索的詞條和美國(guó)疾控中心在2003~2008年間季節(jié)性流感傳播時(shí)期的數(shù)據(jù)進(jìn)行比較,從而預(yù)測(cè)出2009年甲型H1N1流感的爆發(fā)。谷歌聲稱,他們并不依賴特定檢索詞條的語(yǔ)義理解,只關(guān)注特定檢索詞條的使用頻率與流感在時(shí)間和空間上的傳播之間的聯(lián)系。
“看似不起眼的海量分散數(shù)據(jù),一旦被加以整合分析,將能夠形成對(duì)某一學(xué)科及領(lǐng)域十分透徹甚至影響深遠(yuǎn)的研究。”在數(shù)據(jù)日益“開(kāi)源”的當(dāng)下,這席話已不再危言聳聽(tīng)。面對(duì)日益嚴(yán)峻的信息安全危機(jī),要進(jìn)行換位思考,國(guó)防大數(shù)據(jù)科研不僅要加強(qiáng)對(duì)內(nèi)關(guān)鍵數(shù)據(jù)的保護(hù),更要注重對(duì)外數(shù)據(jù)的采集及分析研判。
通過(guò)基層調(diào)研發(fā)現(xiàn),由于數(shù)據(jù)分散搜集、使用和保存,大多數(shù)數(shù)據(jù)管理部門(mén)并未意識(shí)到手中數(shù)據(jù)的重要意義,反而對(duì)數(shù)據(jù)予以公開(kāi)傳播。以國(guó)防生信息為例,雖然國(guó)防生的招生介紹并不屬保密范疇,然而一旦將各高校教務(wù)信息中的招生信息進(jìn)行匯總比對(duì),就可形成對(duì)我軍未來(lái)人才數(shù)量需求、建設(shè)目標(biāo)、能力素質(zhì)、職業(yè)化程度等情況的詳細(xì)分析。
近年來(lái),許多招收國(guó)防生的大專院校為了吸引更多優(yōu)質(zhì)生源,對(duì)國(guó)防生教育訓(xùn)練信息都予以公開(kāi),不僅包括國(guó)防生招收門(mén)類、選拔方案、培養(yǎng)協(xié)議,更細(xì)到平時(shí)訓(xùn)練、教學(xué)內(nèi)容甚至包括學(xué)生個(gè)人簡(jiǎn)介及學(xué)習(xí)感言。類似內(nèi)容“恰巧”成為國(guó)外學(xué)者研究的重點(diǎn)。因此,筆者建議我相關(guān)數(shù)據(jù)管理部門(mén),不僅應(yīng)從本崗位、本機(jī)構(gòu)職責(zé)出發(fā)考慮信息安全,上級(jí)指導(dǎo)單位應(yīng)更全面細(xì)致地考慮研究,站在數(shù)據(jù)使用者的角度“極端化”考量問(wèn)題,同時(shí)建立數(shù)據(jù)分級(jí)管理體系,加強(qiáng)對(duì)分散數(shù)據(jù)的保管和風(fēng)險(xiǎn)研判力度。
目前,國(guó)內(nèi)有關(guān)國(guó)防大數(shù)據(jù)的研究還較為分散,學(xué)者主要依靠?jī)?nèi)部或涉密資料加以研究,在觀念上,比較輕視國(guó)內(nèi)外開(kāi)源數(shù)據(jù)分析;在應(yīng)用上,對(duì)因特網(wǎng)數(shù)據(jù)檢索與分析方法較為陌生。因此,我國(guó)相關(guān)領(lǐng)域研究者應(yīng)加強(qiáng)內(nèi)外研究統(tǒng)籌,在打通內(nèi)部研究渠道的同時(shí),加強(qiáng)本地跨學(xué)科、跨領(lǐng)域、跨區(qū)域的共同研究,強(qiáng)化對(duì)海外資源、信息搜集方法的應(yīng)用和借鑒,全方位提升國(guó)防大數(shù)據(jù)科研的水平和效率。
除了借鑒國(guó)外方法,我國(guó)相關(guān)科研機(jī)構(gòu)也應(yīng)適當(dāng)派遣人員前往海外學(xué)習(xí)參與研究,從而拓展研究領(lǐng)域和思維方式。據(jù)悉,包括美國(guó)國(guó)會(huì)研究服務(wù)部(CRS)、海軍分析中心(CNA)在內(nèi)的美國(guó)官方主要智庫(kù)的對(duì)華研究部門(mén),長(zhǎng)期定向招募華裔研究人員。因此,相關(guān)機(jī)構(gòu)在借鑒國(guó)外智庫(kù)經(jīng)驗(yàn)建立有關(guān)國(guó)家國(guó)別研究中心的基礎(chǔ)上,可以考慮引入具有海外學(xué)習(xí)和工作背景的研究人員。
面對(duì)大數(shù)據(jù)時(shí)代日趨嚴(yán)峻的信息泄露風(fēng)險(xiǎn),我國(guó)各級(jí)信息數(shù)據(jù)管理部門(mén)應(yīng)當(dāng)優(yōu)先對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行分級(jí)保密管理,同時(shí),大力推進(jìn)國(guó)際搜索能力建設(shè),通過(guò)提升信息采集能力,逐步開(kāi)展并強(qiáng)化對(duì)外開(kāi)源數(shù)據(jù)的對(duì)等研究,從而把大數(shù)據(jù)威脅轉(zhuǎn)變?yōu)閲?guó)防利器。
一要篩查涉軍單位開(kāi)源數(shù)據(jù)并分級(jí)管理。因特網(wǎng)和物聯(lián)網(wǎng)解決了數(shù)據(jù)產(chǎn)生問(wèn)題,云計(jì)算解決了數(shù)據(jù)、服務(wù)和計(jì)算資源的共享問(wèn)題。當(dāng)海量數(shù)據(jù)“奔涌”出現(xiàn),傳統(tǒng)的“一刀切”不公開(kāi)和簡(jiǎn)單的物理隔絕等信息保密手段就顯得捉襟見(jiàn)肘。以大數(shù)據(jù)技術(shù)取代傳統(tǒng)保密手段,實(shí)現(xiàn)對(duì)海量數(shù)據(jù)的分級(jí)管理已成為必然趨勢(shì)。以國(guó)防生信息為例,招生數(shù)量和培養(yǎng)方向均可對(duì)學(xué)生、家長(zhǎng)公布,然而具體的培養(yǎng)計(jì)劃、培訓(xùn)內(nèi)容、專業(yè)素質(zhì)及個(gè)人信息都應(yīng)列為保密內(nèi)容。這種“宏觀公開(kāi),具體保密”的做法已經(jīng)在美國(guó)較為通行。比如,著名智庫(kù)蘭德公司針對(duì)兩岸臺(tái)海危機(jī)出臺(tái)的研究報(bào)告《恐怖的海峽?》中應(yīng)用了美軍“聯(lián)合一體化作戰(zhàn)模型”作為研究的重要工具,這個(gè)作戰(zhàn)模型基本反映了美軍在這些戰(zhàn)爭(zhēng)中的作戰(zhàn)思想和戰(zhàn)術(shù)特點(diǎn)。但是,美軍在實(shí)際作戰(zhàn)中極其重視而且大量使用的某些作戰(zhàn)要素,在該報(bào)告使用的“聯(lián)合一體化作戰(zhàn)模型”中,既沒(méi)有任何表達(dá),也沒(méi)有任何戰(zhàn)術(shù)或技術(shù)數(shù)據(jù)。
二要加強(qiáng)國(guó)際搜索能力建設(shè)。目前,國(guó)內(nèi)部分研究者過(guò)分依賴境外搜索服務(wù),其中不乏軍隊(duì)科研機(jī)構(gòu)和軍事院校的相關(guān)人員,大多通過(guò)使用代理服務(wù)器等方式搜索國(guó)外的外文資料并加以研究。由于國(guó)外一些因特網(wǎng)公司已經(jīng)具備強(qiáng)大的大數(shù)據(jù)分析能力,國(guó)內(nèi)研究者對(duì)相關(guān)問(wèn)題搜索所形成的數(shù)據(jù)基礎(chǔ)已經(jīng)成為其研判我軍事科研動(dòng)向的重要依據(jù)。比如,谷歌基于其所有搜索記錄(以每天30億條遞增),對(duì)特定檢索詞條的使用頻率與某些問(wèn)題之間的聯(lián)系進(jìn)行分析,已在公共衛(wèi)生領(lǐng)域取得突破性進(jìn)展。但也必須認(rèn)識(shí)到這一現(xiàn)象存在的隱患:谷歌、雅虎等主流境外搜索引擎看似便捷,但我研究者進(jìn)行搜索時(shí)產(chǎn)生的海量數(shù)據(jù)亦盡在其搜索服務(wù)運(yùn)營(yíng)商掌控之中。因此,建議相關(guān)單位及學(xué)者,除加強(qiáng)對(duì)境外搜索引擎使用的監(jiān)管外,更應(yīng)加強(qiáng)國(guó)內(nèi)外文搜索能力的建設(shè),逐步發(fā)展起能夠滿足國(guó)內(nèi)需求的搜索引擎。
三要加強(qiáng)開(kāi)源數(shù)據(jù)應(yīng)用研究。目前,我國(guó)學(xué)者受限于搜索引擎等工具壁壘,在獲取開(kāi)源數(shù)據(jù)方面存在一定難度,部分學(xué)者特別是社會(huì)科學(xué)領(lǐng)域的學(xué)者,不重視研究領(lǐng)域?qū)I(yè)與技術(shù)的結(jié)合,不重視對(duì)開(kāi)源數(shù)據(jù)的應(yīng)用。如此一來(lái),不僅呈現(xiàn)出技術(shù)與專業(yè)脫節(jié)的現(xiàn)象,而且直接影響到研究質(zhì)量。軍隊(duì)科研機(jī)構(gòu)和院校宜借鑒自然科學(xué)領(lǐng)域開(kāi)源數(shù)據(jù)應(yīng)用經(jīng)驗(yàn),引入成熟研究方法和可靠研究工具,加強(qiáng)開(kāi)源數(shù)據(jù)應(yīng)用研究,提高大數(shù)據(jù)分析研判能力,助推我國(guó)防領(lǐng)域的信息化建設(shè)。