溫玉波,黃全中
(國家海洋局南海信息中心,廣東廣州510310)
基于XML的海洋環(huán)境基礎(chǔ)數(shù)據(jù)格式轉(zhuǎn)換的研究
溫玉波,黃全中
(國家海洋局南海信息中心,廣東廣州510310)
針對當(dāng)前海洋科學(xué)研究、海洋預(yù)報、海洋環(huán)境保護(hù)等工作中遇到的海洋環(huán)境基礎(chǔ)數(shù)據(jù)格式不一致的問題,通過對數(shù)據(jù)語義、語法、結(jié)構(gòu)的分析,建立數(shù)據(jù)之間格式轉(zhuǎn)換模型,在此基礎(chǔ)上提出基于可擴(kuò)展標(biāo)記語言(XML)轉(zhuǎn)換模板的數(shù)據(jù)格式轉(zhuǎn)換體系,并以臺站觀測溫鹽數(shù)據(jù)為例,設(shè)計(jì)編寫程序成功實(shí)現(xiàn)數(shù)據(jù)間的格式轉(zhuǎn)換。
海洋環(huán)境數(shù)據(jù);格式轉(zhuǎn)換;元數(shù)據(jù)映射;可擴(kuò)展標(biāo)記語言(XML);數(shù)據(jù)建模
當(dāng)前我國各項(xiàng)海洋事業(yè)高速發(fā)展,作為海洋科學(xué)研究與應(yīng)用的重要基礎(chǔ),海洋環(huán)境基礎(chǔ)數(shù)據(jù)的地位越來越高。然而海洋環(huán)境基礎(chǔ)數(shù)據(jù)的學(xué)科眾多、種類復(fù)雜,數(shù)據(jù)格式和存儲方法差異較大;另一方面海洋環(huán)境基礎(chǔ)數(shù)據(jù)來源不同和中間環(huán)節(jié)缺失,導(dǎo)致海洋環(huán)境信息數(shù)據(jù)的準(zhǔn)確性、完整性、一致性無法得到保證。這些問題加重了海洋科技人員的工作負(fù)擔(dān),阻礙了海洋研究的可持續(xù)發(fā)展。因此,如何解決數(shù)據(jù)格式不一致的問題成為了當(dāng)前研究的重點(diǎn)。
目前國內(nèi)的研究還多集中在海洋數(shù)據(jù)傳輸和數(shù)據(jù)交換等領(lǐng)域:如姬鵬等(2006)構(gòu)建了基于XML的實(shí)時海洋數(shù)據(jù)傳輸網(wǎng)絡(luò)系統(tǒng);秦艷(2009)用XML技術(shù)進(jìn)行海洋數(shù)據(jù)交換;袁立成等(2009)研究了海洋環(huán)境信息存儲與交換的數(shù)據(jù)網(wǎng)格;田友強(qiáng)等(2005)討論了海洋XML數(shù)據(jù)集成系統(tǒng)原型的設(shè)計(jì)與實(shí)現(xiàn)。而對于海洋數(shù)據(jù)格式轉(zhuǎn)換的研究還較少,這主要是由于海洋數(shù)據(jù)種類繁雜、不同時期數(shù)據(jù)標(biāo)準(zhǔn)不一致、沒有形成統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)格式而造成的。目前這方面的研究主要有:夏登文等(2005)分析了海洋數(shù)據(jù)的特點(diǎn),并綜述了XML在海洋信息中的應(yīng)用及其意義,分析適合我國海洋信息的XML應(yīng)用技術(shù);李彥等(2011)利用XML技術(shù)統(tǒng)一數(shù)據(jù)格式定義,說明了XML技術(shù)在應(yīng)對跨學(xué)科、跨平臺的海洋環(huán)境數(shù)據(jù)處理方面具有廣泛的應(yīng)用價值??梢娔壳拔覈诤Q蟓h(huán)境數(shù)據(jù)格式轉(zhuǎn)換領(lǐng)域研究的數(shù)量不足且以理論分析居多,缺乏整體設(shè)計(jì)和真實(shí)案例說明。在當(dāng)前實(shí)際工作中常用的數(shù)據(jù)格式轉(zhuǎn)換方法主要有以下兩方面:
(1)利用記事本、Excel、EditPlus等軟件人工進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換,這種方式對數(shù)據(jù)規(guī)整性要求高,且人工操作效率低下易出錯。
(2)采用定制開發(fā)軟件實(shí)現(xiàn)數(shù)據(jù)格式轉(zhuǎn)換,這在一定程度上實(shí)現(xiàn)數(shù)據(jù)格式轉(zhuǎn)換的高效性和準(zhǔn)確性,提高工作效率。但對于海洋環(huán)境數(shù)據(jù)來說由于其數(shù)據(jù)類型眾多,需對每一類的數(shù)據(jù)單獨(dú)進(jìn)行定制開發(fā),使得軟件無法復(fù)用,造成采用此方法的成本高,性價比低。
基于上述本文通過對數(shù)據(jù)結(jié)構(gòu)和映射關(guān)系的分析,創(chuàng)新性地提出基于XML轉(zhuǎn)換模板的數(shù)據(jù)格式轉(zhuǎn)換體系,實(shí)現(xiàn)海洋環(huán)境基礎(chǔ)數(shù)據(jù)格式間的相互轉(zhuǎn)換。優(yōu)點(diǎn)是:針對不同數(shù)據(jù)類型,只需對模板編程,就可實(shí)現(xiàn)新的映射關(guān)系,而無需對整個軟件架構(gòu)進(jìn)行重構(gòu),降低了成本和工作量。文章最后以臺站觀測溫鹽數(shù)據(jù)為例進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果表明本文所提出的研究方法是可行的。
XML中文意為可擴(kuò)展標(biāo)記語言(Extensible Markup Language),它定義了一套語言標(biāo)記的規(guī)則,可被設(shè)計(jì)用來傳輸或存儲數(shù)據(jù)。
XML語言最大的特點(diǎn)就是復(fù)用性和擴(kuò)展性,使用者可以根據(jù)自己的需要創(chuàng)建相應(yīng)的XML語言,它是可變的、可維護(hù)的。一方面由于它的可擴(kuò)展性使得信息的顯示與處理分離,如果需要改動信息的表現(xiàn)方式,無須改動信息本身,XML文檔制定者可以根據(jù)數(shù)據(jù)自身的邏輯定義文檔結(jié)構(gòu);另一方面XML遵循嚴(yán)格的語法要求,結(jié)構(gòu)清晰,可讀性好,容易編制,便于不同系統(tǒng)之間信息的傳輸。因此,采用XML來描述數(shù)據(jù),就可以很方便的在相同的或是不同的系統(tǒng)中對這些數(shù)據(jù)進(jìn)行互操作。
由于海洋環(huán)境基礎(chǔ)數(shù)據(jù)格式類型繁雜,且它們之間存在大量重復(fù)部分,如何降低重復(fù)數(shù)據(jù)所帶來的工作量,是數(shù)據(jù)格式轉(zhuǎn)化之前所要解決的問題。本文利用了XML的復(fù)用性和擴(kuò)展性來解決這個問題:即先定義好一類海洋要素片段,當(dāng)其它數(shù)據(jù)集也包含此類海洋要素,我們只需要將之前定義好的要素片段加載到數(shù)據(jù)集之后,就可實(shí)現(xiàn)數(shù)據(jù)片段的復(fù)用,降低工作量。
在實(shí)際應(yīng)用中可能存在大量異構(gòu)格式數(shù)據(jù),對于用戶來說這些數(shù)據(jù)無法被快速解析從而造成使用上的困難,數(shù)據(jù)互操作的作用是分析并轉(zhuǎn)換異構(gòu)數(shù)據(jù)間的差異,保證數(shù)據(jù)格式對外的一致性,實(shí)現(xiàn)異構(gòu)格式數(shù)據(jù)的復(fù)用。
數(shù)據(jù)互操作的核心是數(shù)據(jù)格式映射(即格式轉(zhuǎn)換),映射可以是一對一關(guān)系也可以是一對多關(guān)系,從本質(zhì)上來說映射就是將某個數(shù)據(jù)集進(jìn)行拆分,根據(jù)描述含義從另一個數(shù)據(jù)集中找到與之相對應(yīng)的元素,然后根據(jù)新的數(shù)據(jù)格式對數(shù)據(jù)進(jìn)行重構(gòu),以達(dá)到數(shù)據(jù)從一種格式轉(zhuǎn)換為另一種格式的目的。映射的核心是對照關(guān)系表,可以實(shí)現(xiàn)不同數(shù)據(jù)格式互相比較、查詢、校驗(yàn)。因此通過映射能夠?qū)崿F(xiàn)數(shù)據(jù)格式相互轉(zhuǎn)換(圖1)。
圖1 數(shù)據(jù)格式映射
另外可以采用建立標(biāo)準(zhǔn)資源描述框架來實(shí)現(xiàn)數(shù)據(jù)互操作,框架本身并不復(fù)雜,可以由點(diǎn)和線構(gòu)成二元關(guān)系,點(diǎn)與點(diǎn)間由線相連。其中點(diǎn)表示數(shù)據(jù)本身,線表示數(shù)據(jù)的屬性或描述信息,它們間是1對多關(guān)系,即一個點(diǎn)可以連接多條線。通過這樣的簡單的點(diǎn)線我們可以對數(shù)據(jù)對象進(jìn)行描述,甚至通過擴(kuò)展方式還可以對復(fù)雜的數(shù)據(jù)進(jìn)行描述。并且框架本身是可以復(fù)用的,提升我們分析數(shù)據(jù)的效率。
海洋環(huán)境基礎(chǔ)數(shù)據(jù)格式轉(zhuǎn)換體系可分為數(shù)據(jù)預(yù)處理、數(shù)據(jù)質(zhì)量控制、數(shù)據(jù)格式轉(zhuǎn)換3個部分(圖2),其中的核心是數(shù)據(jù)間的映射。經(jīng)過分析我們可以得出圖1所述方法并不完善,原因如下:
(1)可維護(hù)性差。通過大量的實(shí)驗(yàn)證明在現(xiàn)實(shí)數(shù)據(jù)處理與應(yīng)用中,很難找到完全一致的數(shù)據(jù)描述項(xiàng),很多情況下是彼此元素相互混雜,甚至找不到對應(yīng)數(shù)據(jù)描述項(xiàng),需要在建模過程中不斷修改和完善映射關(guān)系,而其中一組映射的改變會導(dǎo)致與其它相關(guān)的映射關(guān)系也需要做相應(yīng)變更,使得整體維護(hù)成本高。
圖2 基于XML轉(zhuǎn)換模板的數(shù)據(jù)格式轉(zhuǎn)換體系
(2)通用性差、效率低。如果數(shù)據(jù)的格式較為復(fù)雜,有眾多的描述信息項(xiàng),需要對這些元素進(jìn)行一一映射,在這過程中存在大量重復(fù)定義,代碼復(fù)用性差,使得最后所需的映射關(guān)系是巨大的。
為了解決上述問題,經(jīng)過分析對比提出二次映射的設(shè)想來對方法進(jìn)行改進(jìn),如圖3所示,這種設(shè)想核心是設(shè)計(jì)一個通用的中間模板,在實(shí)際映射過程中,它以XML轉(zhuǎn)換模板為映射中心,轉(zhuǎn)換格式之間不直接進(jìn)行匹配映射,先是將原格式同中間模板進(jìn)行第一次映射,然后將模板與目標(biāo)格式進(jìn)行二次映射,以此實(shí)現(xiàn)原格式和目標(biāo)格式之間的轉(zhuǎn)換。改進(jìn)后的數(shù)據(jù)格式映射與圖1所述方式相比優(yōu)點(diǎn)有:
(1)后續(xù)易維護(hù)。當(dāng)數(shù)據(jù)格式映射關(guān)系發(fā)生變化,只需要調(diào)整模板,就可實(shí)現(xiàn)新的映射關(guān)系,且由于模板間相互獨(dú)立,對其修改不會影響其它模板的使用。
(2)模板可復(fù)用性。在數(shù)據(jù)格式映射關(guān)系中可能存在大量重復(fù)部分(如數(shù)據(jù)表頭、說明信息等),通過模板定義這部分通用數(shù)據(jù)并在模板間對其引用,可提升代碼的復(fù)用性。
(3)XML具有可擴(kuò)展性和復(fù)用性。采用XML來對數(shù)據(jù)格式進(jìn)行編碼:在制作完成一類數(shù)據(jù)格式模板后,我們以它為基礎(chǔ)進(jìn)行參數(shù)的微調(diào)來匹配其它類型數(shù)據(jù)格式。
(4)程序高效性。在開發(fā)應(yīng)用程序時候只需要對模板編程,而無需關(guān)注具體的數(shù)據(jù)格式,從而提高效率,縮短程序開發(fā)周期。
圖3 改進(jìn)后數(shù)據(jù)格式映射
現(xiàn)以1995年前后臺站觀測溫鹽數(shù)據(jù)格式轉(zhuǎn)換為例,說明其應(yīng)用思路和方法。首先依據(jù)上述理論制定數(shù)據(jù)格式轉(zhuǎn)換結(jié)構(gòu)模型。如圖4所示,結(jié)構(gòu)模型分為3個部分:格式A對應(yīng)1995年前溫鹽數(shù)據(jù),包括數(shù)據(jù)集的基本信息(含元素字段的名稱、類型、順序、起止位置、長度、取值范圍等)、數(shù)據(jù)層次結(jié)構(gòu)、項(xiàng)目信息、其它相關(guān)說明等;格式B對應(yīng)1995年后溫鹽數(shù)據(jù),是最終我們要得到的結(jié)果;轉(zhuǎn)換模板是A→B格式轉(zhuǎn)換依據(jù),它提供A→B數(shù)據(jù)間格式說明和映射關(guān)系。數(shù)據(jù)映射包含結(jié)構(gòu)映射、語法映射、語義映射3方面:
(1)結(jié)構(gòu)映射從整體上描述了數(shù)據(jù)格式轉(zhuǎn)換前后在排列順序、層次結(jié)構(gòu)(行、列、組)等方面的對應(yīng)關(guān)系,解決了數(shù)據(jù)在整體上的排列問題。
(2)語法映射描述了每類元素轉(zhuǎn)換前后在載體、編碼、順序、對齊方式、說明等方面的對應(yīng)關(guān)系,反映了數(shù)據(jù)格式結(jié)構(gòu)規(guī)律本身。
(3)語義映射描述了每類元素轉(zhuǎn)換前后在數(shù)據(jù)類型(數(shù)字型、字符型等)、轉(zhuǎn)換規(guī)則(按照一定規(guī)則對元素進(jìn)行轉(zhuǎn)化)、統(tǒng)計(jì)計(jì)算(按照一定規(guī)則對前后元素內(nèi)容進(jìn)行匯總或、合并、計(jì)算)等方面的對應(yīng)關(guān)系,消除了轉(zhuǎn)換前后在語義方面的沖突。
圖4 臺站觀測溫鹽數(shù)據(jù)格式轉(zhuǎn)換模型
接著通過結(jié)構(gòu)模型生成轉(zhuǎn)換模板,其本質(zhì)就是將抽象的數(shù)據(jù)結(jié)構(gòu)模型表象化,生成簡單易懂的標(biāo)準(zhǔn)化模板。這里將采用XML語言來生成標(biāo)準(zhǔn)化模板,模板可分為結(jié)構(gòu)映射、語法映射、語義映射3部分。模板部分內(nèi)容如下所示:
圖7 95年前后臺站觀測溫鹽數(shù)據(jù)格式轉(zhuǎn)換模板部分內(nèi)容(語義映射)
系統(tǒng)前臺界面采用Microsoft Visual Studio 2008平臺進(jìn)行開發(fā),核心算法采用C++進(jìn)行編程,顯示界面采用操作和顯示分離的設(shè)計(jì)方式,如圖8所示。系統(tǒng)界面布局分為上下兩層,頂部為操作區(qū),橫向排列相關(guān)功能按鈕。功能按鈕下方是顯示區(qū)域,這里又分為兩部分,上半部分為數(shù)據(jù)格式轉(zhuǎn)換基礎(chǔ)信息,包括格式轉(zhuǎn)換類型(即指明從原格式轉(zhuǎn)換為目標(biāo)格式)、當(dāng)前模板、加載文件等;下半部分為數(shù)據(jù)轉(zhuǎn)換實(shí)時監(jiān)控窗口,包括處理狀態(tài)、消耗時間、正在處理數(shù)據(jù)、完成情況等。
圖8 轉(zhuǎn)換程序運(yùn)行截圖
圖8為進(jìn)行批量數(shù)據(jù)格式轉(zhuǎn)換時程序運(yùn)行截圖,正在進(jìn)行1995年前后臺站觀測數(shù)據(jù)格式轉(zhuǎn)換,最終顯示成功完成60個文件的格式轉(zhuǎn)換,共計(jì)使用5 s時間。
通過程序?qū)崿F(xiàn)了數(shù)據(jù)格式轉(zhuǎn)換的可視化和人機(jī)交互,結(jié)果證明利用計(jì)算機(jī)程序高速運(yùn)算能力處理海洋環(huán)境數(shù)據(jù),能夠更加高效的實(shí)現(xiàn)數(shù)據(jù)格式轉(zhuǎn)換。
為驗(yàn)證該程序的實(shí)用性,導(dǎo)入數(shù)據(jù)進(jìn)行實(shí)驗(yàn),圖9所示為臺站觀測溫鹽數(shù)據(jù)原始文件格式(1995年前標(biāo)準(zhǔn)格式),圖10所示為轉(zhuǎn)換后的文件格式(2006年標(biāo)準(zhǔn)海濱觀測規(guī)范格式),經(jīng)過比較可得到以下實(shí)驗(yàn)結(jié)果:
(1)轉(zhuǎn)換后的文件格式完全符合2006年標(biāo)準(zhǔn)海濱觀測規(guī)范格式,包括了文件命名規(guī)則、元素的相對位置和長度、數(shù)據(jù)層次結(jié)構(gòu)等。其中數(shù)據(jù)層次結(jié)構(gòu)是重點(diǎn)難點(diǎn)(注:轉(zhuǎn)換前每行包含2個連續(xù)觀測日數(shù)據(jù),轉(zhuǎn)換后每行只包含1個觀測日數(shù)據(jù)),圖9、圖10所示的實(shí)驗(yàn)結(jié)果表明了數(shù)據(jù)層次結(jié)構(gòu)由轉(zhuǎn)換前的5×2(行數(shù)×每行觀測日數(shù))轉(zhuǎn)變?yōu)檗D(zhuǎn)換后的10×1,完全符合轉(zhuǎn)換后的標(biāo)準(zhǔn)要求。
(2)元素值轉(zhuǎn)換前后保持一致。例如新標(biāo)準(zhǔn)中的海洋觀測臺站代碼長度為4位,而舊標(biāo)準(zhǔn)中的長度為8位,因此需要對臺站代碼進(jìn)行位數(shù)轉(zhuǎn)換,實(shí)驗(yàn)結(jié)果表明臺站代碼在轉(zhuǎn)換前后能保持一致。
(3)元素符合多“補(bǔ)”少“棄”原則(多出的元素用空格補(bǔ)齊位置,缺失的元素直接丟棄)。從實(shí)驗(yàn)數(shù)據(jù)可知轉(zhuǎn)換后數(shù)據(jù)集中多出了表層溫鹽觀測方法和儀器代碼2個元素,由于轉(zhuǎn)換前的數(shù)據(jù)集中沒有這2項(xiàng)元素,因此這里用空格將其所占位置補(bǔ)齊;另外,轉(zhuǎn)換后數(shù)據(jù)集中沒有海面能見度這個元素,因此在轉(zhuǎn)換后將此元素丟棄。
綜合上述實(shí)驗(yàn)結(jié)果可得本次格式轉(zhuǎn)換實(shí)例測試是成功的。
圖9 臺站觀測溫鹽數(shù)據(jù)(轉(zhuǎn)換前)
圖10 臺站觀測溫鹽數(shù)據(jù)(轉(zhuǎn)換后)
本文根據(jù)海洋環(huán)境基礎(chǔ)數(shù)據(jù)格式轉(zhuǎn)換的要求及內(nèi)容,以格式轉(zhuǎn)換的準(zhǔn)確性、高效性、可擴(kuò)展性為評估內(nèi)容,建立了基于XML轉(zhuǎn)換模板的數(shù)據(jù)格式轉(zhuǎn)換體系,并以臺站觀測溫鹽數(shù)據(jù)的格式轉(zhuǎn)換為例驗(yàn)證了數(shù)據(jù)格式轉(zhuǎn)換體系是可行的。轉(zhuǎn)換體系創(chuàng)新之處在于通過設(shè)計(jì)相應(yīng)模板就可將格式轉(zhuǎn)換應(yīng)用范圍擴(kuò)展到其他海洋基礎(chǔ)數(shù)據(jù)類型,不僅能夠高效地實(shí)現(xiàn)數(shù)據(jù)格式轉(zhuǎn)換,而且對海洋環(huán)境基礎(chǔ)數(shù)據(jù)應(yīng)用的相關(guān)規(guī)范制定也有一定的參考和促進(jìn)作用。
另一方面,由于海洋環(huán)境基礎(chǔ)數(shù)據(jù)體系格式結(jié)構(gòu)復(fù)雜、學(xué)科眾多,以至無法對所有格式進(jìn)行分析和模板設(shè)計(jì),這就局限格式轉(zhuǎn)換的應(yīng)用范圍。因此,下一步主要研究方向是利用計(jì)算機(jī)人工智能實(shí)現(xiàn)數(shù)據(jù)類型自動抓取和分析,并將分析結(jié)果加入轉(zhuǎn)換規(guī)則庫,當(dāng)需要對某類數(shù)據(jù)進(jìn)行格式轉(zhuǎn)化時,只要通過查找規(guī)則庫便能自動匹配生成轉(zhuǎn)換模板,從而快速高效的實(shí)現(xiàn)數(shù)據(jù)格式轉(zhuǎn)換。
Williamson H,2002.XML技術(shù)大全.北京:機(jī)械工業(yè)出版社.
陳虹濤,李志俊,2005.元數(shù)據(jù)的標(biāo)準(zhǔn)規(guī)范及其互操作性.情報雜志,(7):94-95.
陳繼香,2004.XML在海洋數(shù)據(jù)服務(wù)領(lǐng)域的應(yīng)用研究.海洋通報,23(2):56-50.
崔新會,何志強(qiáng),2015.基于XML的海洋信息索引服務(wù)系統(tǒng)構(gòu)建研究.艦船科學(xué)技術(shù),(5):148-151.
胡芒谷,2008.基于檢索協(xié)議的元數(shù)據(jù)互操作研究.科學(xué)技術(shù)與工程,8(12):3 201-3 205.
蔣永國,劉克,盧蓮英,等,2009.基于XML的海洋遙感衛(wèi)星數(shù)據(jù)規(guī)范化研究.海洋通報,28(4):9-16.
孔慶杰,宋丹輝,2007.元數(shù)據(jù)互操作問題技術(shù)解決方案研究.情報科學(xué),25(5):754-756.
李彥,王宇飛,王鑫,等,2011.基于XML的海洋環(huán)境數(shù)據(jù)處理技術(shù)研究.海洋通報,30(6):697-701.
劉海行,周玉斌,2004.剖面數(shù)據(jù)的XML格式設(shè)計(jì).海洋科學(xué),28(10):1-5.
劉嘉,2002.元數(shù)據(jù)導(dǎo)論.北京:華藝出版社.
申曉娟,高紅,2006.從元數(shù)據(jù)映射出發(fā)談元數(shù)據(jù)互操作問題.國際圖書館學(xué)刊,(4):51-54.
夏登文,石綏祥,姜巖,等,2005.XML海洋信息應(yīng)用分析.海洋通報,24(1):84-86.
肖瓏,陳凌,馮項(xiàng)云,等,2001.中文元數(shù)據(jù)標(biāo)準(zhǔn)框架及其應(yīng)用.數(shù)字圖書館壇,2001(5):34-37.
袁立成,秦勃,洪鋒,等,2009.海洋網(wǎng)格——海洋環(huán)境信息存儲與交換的數(shù)據(jù)網(wǎng)格.計(jì)算機(jī)應(yīng)用,29(6):188-190.
張明華,黃冬梅,熊中敏,等,2012.多源異構(gòu)海量海洋數(shù)據(jù)綜合管理平臺構(gòu)建研究.海洋科學(xué),36(2):110-115.
張曉林,2002.元數(shù)據(jù)研究與應(yīng)用.北京:圖書館出版社.
Research on the data format conversion of marine environmental data based on Extensible Markup Language
WEN Yu-bo,HUANG Quan-zhong
(The Information Center of South China Sea,State Oceanic Administration,Guangzhou 510310,China)
This article is aimed at solving the problem of marine environmental information data format inconsistencies which appeared in marine science research,marine forecasts,and marine environmental protection work.Conversion model was built by analyzing of metadata semantics,syntax and structure,and the method of format conversion was put forward based on Extensible Markup Language(XML).At last,the article introduces how to design the process to achieve conversion between the two formats by giving an example of marine station observation data.
marine environmental data;heterogeneous data;metadata mapping;Extensible Markup Language(XML);data templates
TP391
A
1001-6932(2017)06-0700-08
10.11840/j.issn.1001-6392.2017.06.013
2016-03-28;
2016-09-27
國家海洋局南海分局局長基金(1344)。
溫玉波(1983-),碩士,工程師,主要從事海洋數(shù)據(jù)分析與應(yīng)用。電子郵箱:wenyupo@163.com。
袁澤軼)