袁野
裝備試驗(yàn)領(lǐng)域已經(jīng)產(chǎn)生了海量試驗(yàn)數(shù)據(jù),但大都局限在自產(chǎn)自用,甚者還停留在對(duì)單個(gè)型號(hào)裝備單次試驗(yàn)任務(wù)的分析評(píng)估,裝備試驗(yàn)數(shù)據(jù)工程建設(shè)需求已經(jīng)迫在眉睫。
1引言
元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),其實(shí)質(zhì)是對(duì)潛在信息資源對(duì)象的描述。構(gòu)建元數(shù)據(jù)是大數(shù)據(jù)工程中數(shù)據(jù)標(biāo)準(zhǔn)化的重要活動(dòng),其目的是將數(shù)據(jù)轉(zhuǎn)化為信息,解決數(shù)據(jù)管理和數(shù)據(jù)工程中的實(shí)際問題,為分析應(yīng)用提供數(shù)據(jù)服務(wù)。國(guó)內(nèi)軍事領(lǐng)域?qū)υ獢?shù)據(jù)構(gòu)建的研究雖然有了一些進(jìn)展,但裝備試驗(yàn)領(lǐng)域的元數(shù)據(jù)構(gòu)建仍然需要一些能夠指導(dǎo)工程建設(shè)的針對(duì)性研究。
2裝備試驗(yàn)元數(shù)據(jù)構(gòu)建原則
元數(shù)據(jù)構(gòu)建要針對(duì)裝備試驗(yàn)數(shù)據(jù)的現(xiàn)狀:一是數(shù)據(jù)資源時(shí)空分散,二是數(shù)據(jù)管理起步低,遵循“頂層規(guī)劃,業(yè)務(wù)牽引,底層構(gòu)建,定期修訂”的原則。①頂層規(guī)劃:規(guī)范構(gòu)建流程、規(guī)則,編制核心元數(shù)據(jù)標(biāo)準(zhǔn)和元數(shù)據(jù)描述框架,配發(fā)元數(shù)據(jù)注冊(cè)系統(tǒng)軟件。②業(yè)務(wù)牽引:以業(yè)務(wù)需求驅(qū)動(dòng)構(gòu)建,以維護(hù)數(shù)據(jù)可發(fā)布、可發(fā)現(xiàn)、可管理、可訪問、可理解、可操作和可信賴作為最基本的業(yè)務(wù)目標(biāo),此外還有關(guān)于數(shù)據(jù)關(guān)聯(lián)分析、深度挖掘應(yīng)用的業(yè)務(wù)目標(biāo)。③底層構(gòu)建:在發(fā)布的元數(shù)據(jù)名錄基礎(chǔ)上,授權(quán)數(shù)據(jù)提供方和用戶方根據(jù)業(yè)務(wù)需求對(duì)元數(shù)據(jù)進(jìn)行擴(kuò)展,新建元數(shù)據(jù)元素或元數(shù)據(jù)實(shí)體或代碼表,或者對(duì)現(xiàn)有的進(jìn)行適當(dāng)修改。④定期修訂:建立元數(shù)據(jù)使用頻次統(tǒng)計(jì)規(guī)則,定期對(duì)符合共識(shí)的、常用的元數(shù)據(jù)編制規(guī)范和著錄規(guī)則,提高元數(shù)據(jù)質(zhì)量。
3裝備試驗(yàn)元數(shù)據(jù)構(gòu)建流程
元數(shù)據(jù)本身就是數(shù)據(jù),同樣遵循數(shù)據(jù)的生命周期,如圖1所示。
在數(shù)據(jù)描述階段,需要對(duì)國(guó)內(nèi)外元數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行深入研究分析,制定元數(shù)據(jù)的描述框架,制定構(gòu)建元數(shù)據(jù)的目標(biāo)、原則和范圍,形成注冊(cè)和審核規(guī)則,并整合到元數(shù)據(jù)注冊(cè)軟件系統(tǒng)中。
在數(shù)據(jù)獲取階段,制定元數(shù)據(jù)需求管理計(jì)劃,通過元數(shù)據(jù)注冊(cè)系統(tǒng),從各個(gè)資源對(duì)象的提供方和用戶方收集大量自定義的元數(shù)據(jù)元素和元數(shù)據(jù)實(shí)體。在數(shù)據(jù)處理階段,通過元數(shù)據(jù)注冊(cè)系統(tǒng)集成的統(tǒng)計(jì)分析工具,對(duì)獲取的元數(shù)據(jù)進(jìn)行預(yù)處理,篩選掉不符合規(guī)則的無(wú)效數(shù)據(jù),然后按照業(yè)務(wù)類別分別組織專家會(huì)議,對(duì)第一手元數(shù)據(jù)進(jìn)行審核討論,之后對(duì)審核通過的元數(shù)據(jù)元素整理、編目,形成具有層次結(jié)構(gòu)的元數(shù)據(jù)名錄。
數(shù)據(jù)應(yīng)用階段,通過元數(shù)據(jù)注冊(cè)系統(tǒng)發(fā)布元數(shù)據(jù)名錄,對(duì)不同用戶授權(quán)訪問權(quán)限,數(shù)據(jù)提供方和使用方從中選用合適的元數(shù)據(jù)描述試驗(yàn)數(shù)據(jù)資源對(duì)象,待發(fā)布運(yùn)行一段時(shí)間后最終形成元數(shù)據(jù)規(guī)范和著錄規(guī)則,作為后續(xù)工作的基礎(chǔ)。如果現(xiàn)行的元數(shù)據(jù)描述框架、規(guī)范或者著錄規(guī)則無(wú)法滿足應(yīng)用需求,則進(jìn)入下一個(gè)數(shù)據(jù)生命周期,逐漸完善元數(shù)據(jù)本身和規(guī)范。
4裝備試驗(yàn)元數(shù)據(jù)描述框架
如下表,設(shè)計(jì)了一個(gè)裝備試驗(yàn)元數(shù)據(jù)描述框架,依據(jù)該描述框架,可以生成元數(shù)據(jù)的元數(shù)據(jù)整合到元數(shù)據(jù)注冊(cè)系統(tǒng)中。用戶以此框架創(chuàng)建元數(shù)據(jù),元數(shù)據(jù)注冊(cè)系統(tǒng)以此框架為依據(jù)檢查元數(shù)據(jù)的合規(guī)性。
5結(jié)束語(yǔ)
元數(shù)據(jù)構(gòu)建是一項(xiàng)長(zhǎng)期的活動(dòng),裝備試驗(yàn)數(shù)據(jù)資源對(duì)象的數(shù)據(jù)類型有結(jié)構(gòu)化的測(cè)試測(cè)量數(shù)據(jù),也有非結(jié)構(gòu)化的文檔、圖像、音頻、視頻、模型和軟件等,需要分別編制專門的元數(shù)據(jù)規(guī)范和著錄規(guī)則,如何保證元數(shù)據(jù)質(zhì)量、如何評(píng)估元數(shù)據(jù)質(zhì)量也是需要考慮的問題,這些都還有待后續(xù)具體研究。