李甲贊 李俊利 張生武
摘 要:對于部隊裝備信息管理而言,其是一種常規(guī)性、整體性、基礎(chǔ)性的工作,在穩(wěn)固與提升部隊作戰(zhàn)水平上有著舉足輕重的作用。近年來,伴隨科技的飛速發(fā)展,部隊信息化水平日漸提升,怎樣優(yōu)化此項工作成為重點研究問題。本文主要圍繞大數(shù)據(jù)的定義和特征展開分析,并提供其在部隊裝備信息管理中的應用措施。
關(guān)鍵詞:大數(shù)據(jù) 部隊 裝備信息管理
一、大數(shù)據(jù)的定義和特征
(一)基本定義
所謂大數(shù)據(jù),又叫做big data(巨量資料),具體是指需要新處置方式才能具備良好觀察力、決策力以及流程完善能力的大量多樣性信息資產(chǎn)。此定義由Kenneth Cook, Victor Mayer Schneiberg最先提出。
(二)主要特征
1.關(guān)于volume
通常情況下,數(shù)據(jù)量是由PB、TB來運算的,數(shù)據(jù)規(guī)模較大,數(shù)據(jù)的內(nèi)在信息與價值和其大小息息相關(guān)。以情報偵查部為例,數(shù)據(jù)儲存量能達到PB層級。
2.關(guān)于varoety
數(shù)據(jù)種類繁雜,具有多樣性,一般包含非結(jié)構(gòu)化與結(jié)構(gòu)化數(shù)據(jù)等。其中前者以準結(jié)構(gòu)化與半結(jié)構(gòu)化數(shù)據(jù)為主[1]。
3.關(guān)于velocity
此速度具有兩種寓意,一種是數(shù)據(jù)量增加的速度較快,根據(jù)IDC(國際數(shù)據(jù)公司)推斷,在世界范圍內(nèi),數(shù)據(jù)會以60%的速度逐年提升;另一種則是數(shù)據(jù)處置速度較快,選用科學合理的大數(shù)據(jù)處置技術(shù),能迅速從眾多不同種類的數(shù)據(jù)中得到有效信息。
4.關(guān)于value
對于價值而言,其同樣有兩種寓意。一種是價值的密度較低,比如在捕獲犯罪人時,在較長時間段的監(jiān)控視頻內(nèi),僅有其現(xiàn)身的幾秒才是有價值的視頻信息;另一種是有著較高的潛在價值,從海量數(shù)據(jù)中能開發(fā)出適用于引導和管理人們生活的正確決策。
5.關(guān)于veracity
對數(shù)據(jù)的真實性與質(zhì)量有著更高的要求
6.關(guān)于variability
數(shù)據(jù)的種類和內(nèi)容變幻莫測,對數(shù)據(jù)的高效處置與管理帶來一定影響。
二、基于大數(shù)據(jù)的部隊裝備信息管理運用
(一)信息管理數(shù)據(jù)的搜集
1.搜集傳感器
在測定物理環(huán)境變量時通常會使用傳感器,其能把這些變量變成能解讀的數(shù)字信號作為備用處置,利用無線或是有線網(wǎng)絡(luò),把信息傳達到數(shù)據(jù)收集點。部隊裝備信息管理工作中形成的數(shù)據(jù)信息,通常源于基站中的巡檢、修理、保障數(shù)據(jù)記載,這些數(shù)據(jù)信息大多數(shù)由傳感器依據(jù)裝備所在的物理環(huán)境的轉(zhuǎn)變來供應的。不僅如此,還能在傳感器測控鏈路中獲得所需數(shù)據(jù)[2]。
2.搜集系統(tǒng)日志
作為利用率最高的數(shù)據(jù)搜集方法,日志形成于信息管理數(shù)據(jù)源之中,用獨特的文件格式記載系統(tǒng)各項活動。大部分在數(shù)字設(shè)施上運作的裝備管理系統(tǒng)均會以系統(tǒng)日志的模式為總臺傳達即時數(shù)據(jù)信息。其中反饋裝備管理慣用的web服務(wù)器日志文件格式主要有三種,分別為拓展日志文件、日志文件以及IIS。而數(shù)據(jù)庫能頂替文本文件儲存日志信息,提升巨量日志庫的搜索效率。
3.搜集互聯(lián)網(wǎng)數(shù)據(jù)
互聯(lián)網(wǎng)數(shù)據(jù)搜集,具體是指采用互聯(lián)網(wǎng)爬蟲技術(shù),完成有準確性、具體性、行業(yè)性的管理數(shù)據(jù)信息獲得。在實際管理過程中,利用互聯(lián)網(wǎng)爬蟲從部隊內(nèi)網(wǎng)中提煉內(nèi)容,且挖掘出所需的數(shù)據(jù)信息,然后為爬蟲供應其所需的URL,結(jié)合其得到的數(shù)據(jù)進行處置。
(二)信息管理數(shù)據(jù)的儲存
所謂數(shù)據(jù)儲存,簡單來講就是把數(shù)據(jù)流和數(shù)據(jù)源在加工進程中形成的臨時文檔或者有待查詢信息的儲存?;诖髷?shù)據(jù)平臺,部隊裝備信息管理工作中存在諸多繁雜數(shù)據(jù),相關(guān)數(shù)據(jù)庫在實時記載不同的數(shù)據(jù)信息,而維修部同時也在儲存修理數(shù)據(jù)。結(jié)合信息管理數(shù)據(jù)容量大、樣式多的特征考慮,通過Hadoop平臺建設(shè)裝備信息管理儲存體系變成目前焦點話題。
1.結(jié)構(gòu)化數(shù)據(jù)
此種數(shù)據(jù)又叫做行數(shù)據(jù),是一種通過二維表構(gòu)造來表述與實現(xiàn)的數(shù)據(jù)。在裝備信息管理中這一數(shù)據(jù)通常是指電磁環(huán)境、天氣條件與地理狀況等等。
在儲存結(jié)構(gòu)化數(shù)據(jù)時,往往會使用以SQL server2014為主的microsoft儲存軟件,和Hadoop系統(tǒng)聯(lián)合建設(shè)儲存體系,攜手建設(shè)數(shù)據(jù)庫,把數(shù)據(jù)置于固定名字的新創(chuàng)數(shù)據(jù)庫里,把新建數(shù)據(jù)庫和過去的數(shù)據(jù)完美銜接在一起,從而實現(xiàn)數(shù)據(jù)的安全儲存。
2.非結(jié)構(gòu)化數(shù)據(jù)
此種數(shù)據(jù)具體是指結(jié)構(gòu)不健全、缺少規(guī)則性、未預設(shè)置的數(shù)據(jù)模型,是一種不適合采用數(shù)據(jù)庫二維表來體現(xiàn)的數(shù)據(jù)。對于裝備信息管理中存在的此種類型數(shù)據(jù)而言,具體是指傳感器搜集到的圖像、視頻等信息。儲存于HDFS中采用的是文件的形式,而且把指向文件的路徑或者鏈路儲存在建設(shè)的HDFS分布式文件體系內(nèi)的HBASE數(shù)據(jù)庫內(nèi)。
(三)信息管理數(shù)據(jù)的剖析
大數(shù)據(jù)分析,主要包括五大內(nèi)容,一是可視化分析;二是數(shù)據(jù)開發(fā)算法;三是預估性分析能力;四是數(shù)據(jù)監(jiān)管與數(shù)據(jù)質(zhì)量;五是語義引擎。
就可視化分析而言,其能對數(shù)據(jù)展開關(guān)聯(lián)剖析,同時生成相關(guān)圖表,讓數(shù)據(jù)直觀的呈現(xiàn)在客戶眼前。
數(shù)據(jù)開發(fā),能從大量數(shù)據(jù)中提煉出潛在的,人們之前不了解的、卻又具有一定價值的知識與信息的過程。
預估性分析能力則是指利用統(tǒng)計學有關(guān)知識,建設(shè)預估機器和模型,結(jié)合之前兩個環(huán)節(jié)得到的結(jié)果對將來發(fā)展進行推測。
數(shù)據(jù)監(jiān)管和數(shù)據(jù)質(zhì)量則是在管理實踐過程中,采用規(guī)范化的流程與用戶來監(jiān)管數(shù)據(jù),能確保接下來的數(shù)據(jù)開發(fā)有序進行。
對于語義引擎而言,是指處置客戶的搜尋關(guān)鍵字,拓展語義寓意進而更加精準的、全方位的完成客戶檢索。
結(jié)論:綜上所述,在部隊裝備信息管理中采用大數(shù)據(jù)技術(shù),不但能適應時代發(fā)展要求,還能提高部隊整體實力??蓮男畔⒐芾頂?shù)據(jù)的搜集、儲存與分析等方面入手,充分發(fā)揮其自身優(yōu)勢和作用。
參考文獻
[1] 王家其,尹承督,樊澤凱.基于大數(shù)據(jù)的部隊裝備信息管理應用[J].兵器裝備工程學報,2017,38(11):99-102.
[2] 何國良,樊延平,徐文超.基于效能仿真的數(shù)字化部隊裝備保障方案多層次評價[J].裝甲兵工程學院學報,2016,30(01):14-20.