摘要:網(wǎng)絡(luò)信息時(shí)代,網(wǎng)絡(luò)信息數(shù)量膨脹與質(zhì)量良莠不齊之間的矛盾日益凸顯,歸檔網(wǎng)絡(luò)信息價(jià)值判斷標(biāo)準(zhǔn)開始被當(dāng)作解決此矛盾的有效途徑加以研究,而如何充分利用元數(shù)據(jù)對(duì)網(wǎng)絡(luò)信息進(jìn)行精準(zhǔn)描述可以有效解決此矛盾。本文指出了對(duì)歸檔網(wǎng)絡(luò)信息價(jià)值判斷工作面臨的挑戰(zhàn),介紹元數(shù)據(jù)的基本情況,分析元數(shù)據(jù)在歸檔網(wǎng)絡(luò)信息價(jià)值判斷的應(yīng)用,最后,初步提出了歸檔網(wǎng)絡(luò)信息價(jià)值判斷的元數(shù)據(jù)描述的結(jié)論與展望,以供參考。
關(guān)鍵詞:元數(shù)據(jù);網(wǎng)絡(luò)信息;價(jià)值判斷
中圖分類號(hào):G202 文獻(xiàn)識(shí)別碼:A 文章編號(hào):1001-828X(2016)018-000-02
一、歸檔網(wǎng)絡(luò)信息價(jià)值判斷工作面臨的挑戰(zhàn)
(一)網(wǎng)絡(luò)信息資源自身特點(diǎn)帶來(lái)的挑戰(zhàn)
與傳統(tǒng)文獻(xiàn)相比,網(wǎng)絡(luò)信息資源本身具備獨(dú)特性,例如:網(wǎng)絡(luò)信息資源數(shù)量日漸龐大、質(zhì)量良莠不齊;更新速度愈來(lái)愈快;網(wǎng)絡(luò)信息資源壽命日漸縮短;網(wǎng)絡(luò)信息內(nèi)容廣泛,網(wǎng)絡(luò)信息發(fā)布與傳播隨意性大等。因此,歸檔網(wǎng)絡(luò)信息價(jià)值判斷工作面臨更大的困難。
(二)數(shù)字信息環(huán)境改變給歸檔網(wǎng)絡(luò)信息價(jià)值判斷帶來(lái)挑戰(zhàn)
隨著現(xiàn)代數(shù)字化信息技術(shù)的不斷革新,給歸檔網(wǎng)絡(luò)信息價(jià)值判斷帶來(lái)了新的挑戰(zhàn):
1.歸檔網(wǎng)絡(luò)信息價(jià)值必須借助于特定的信息設(shè)備或技術(shù)才能被有效讀取與判斷,其判斷歸檔網(wǎng)絡(luò)信息價(jià)值的技術(shù)方法也日趨復(fù)雜多變,這意味著歸檔網(wǎng)絡(luò)信息價(jià)值判斷的技術(shù)難度不可避免地提高。
2.多種多樣的歸檔網(wǎng)絡(luò)信息價(jià)值判斷標(biāo)準(zhǔn)存在,卻一直未有一個(gè)統(tǒng)一的標(biāo)準(zhǔn)供歸檔網(wǎng)絡(luò)信息價(jià)值判斷使用,也給歸檔網(wǎng)絡(luò)信息價(jià)值判斷工作增加了難度。
二、元數(shù)據(jù)的基本情況介紹
(一)元數(shù)據(jù)的定義理解
當(dāng)前,人們對(duì)元數(shù)據(jù)的定義理解存在明顯差異,也一直沒(méi)有一個(gè)明確的關(guān)于元數(shù)據(jù)統(tǒng)一標(biāo)準(zhǔn)的定義。
元數(shù)據(jù)最普及接受的概念是元數(shù)據(jù)屬于“數(shù)據(jù)的數(shù)據(jù)”,是反映數(shù)據(jù)地址及其關(guān)系的數(shù)據(jù)信息的集合。元數(shù)據(jù)出現(xiàn)在生活中的任何地方,被廣泛應(yīng)用到社會(huì)各個(gè)行業(yè)和領(lǐng)域。每一大類對(duì)象和事物,都能夠被定義為一套元數(shù)據(jù)①。
(二)元數(shù)據(jù)的特點(diǎn)和作用
元數(shù)據(jù)作為一個(gè)重要概念,在數(shù)據(jù)信息管理專業(yè)領(lǐng)域尤其重要。元數(shù)據(jù)的格式標(biāo)準(zhǔn)比較統(tǒng)一、描述方式比較規(guī)范,并且它并不是歸類為平臺(tái)概念,它反而是通過(guò)確定一個(gè)元數(shù)據(jù)模型結(jié)構(gòu),以最標(biāo)準(zhǔn)化的數(shù)據(jù)元素來(lái)表達(dá)最通用的數(shù)據(jù)信息。元數(shù)據(jù)的在管理信息系統(tǒng)專業(yè)領(lǐng)域有著不可替代的重要功能,元數(shù)據(jù)被更為廣泛地應(yīng)用,它具有2個(gè)特點(diǎn):
1.元數(shù)據(jù)獨(dú)立性較強(qiáng),獨(dú)立于與任何平臺(tái),元數(shù)據(jù)本身不受使用任何技術(shù)平臺(tái)任何影響,這便保證了元數(shù)據(jù)的通用性,能幫助其自身效能隨時(shí)隨處得以正常發(fā)揮。
2.元數(shù)據(jù)是生成其它數(shù)據(jù)模型的基礎(chǔ)②。元數(shù)據(jù)的最基本功能是可以有效借用相應(yīng)的代碼生成器和相關(guān)的重要工具生成其它的數(shù)據(jù)代碼或模型信息元數(shù)據(jù),這種數(shù)據(jù)代碼可以直接使用。元數(shù)據(jù)能夠有效描述信息資源,也有利于全面管理網(wǎng)絡(luò)信息資源的每一個(gè)工作環(huán)節(jié),在網(wǎng)絡(luò)信息資源組織方面的作用也十分顯著。
(三)元數(shù)據(jù)應(yīng)用與格式
各個(gè)行業(yè)領(lǐng)域都有各自明顯的特征,近些年來(lái),隨著現(xiàn)代信息技術(shù)的快速革新,根據(jù)各行業(yè)自有的應(yīng)用需求和數(shù)據(jù)特點(diǎn),不同的元數(shù)據(jù)格式在不同行業(yè)有明顯差異。例如:
網(wǎng)絡(luò)資源:Dublin Core(都柏林核心元數(shù)據(jù))、Web Collections網(wǎng)站集合)、CDFCDF(頻道定義格式)。
文獻(xiàn)資料:Dublin Core、MARC(機(jī)讀目錄格式)。
人文科學(xué):TEI Header(文本編碼先導(dǎo)計(jì)劃)。
社會(huì)科學(xué)數(shù)據(jù)集:ICPSR SGML Code Book(政治和社會(huì)研究方面的校際聯(lián)盟)。
博物館與藝術(shù)作品:CDWA(藝術(shù)作品描述目錄)
三、元數(shù)據(jù)描述在歸檔網(wǎng)絡(luò)信息價(jià)值判斷中的應(yīng)用
(一)元數(shù)據(jù)描述對(duì)于歸檔網(wǎng)絡(luò)信息價(jià)值判斷的意義
基于歸檔網(wǎng)絡(luò)信息價(jià)值判斷的元數(shù)據(jù)描述,是指通過(guò)對(duì)每個(gè)歸檔網(wǎng)絡(luò)信息價(jià)值的影響因素進(jìn)行詳細(xì)分析來(lái)判斷網(wǎng)絡(luò)信息是否是具有一定價(jià)值,然后利用元數(shù)據(jù)描述這種有效手段判斷歸檔網(wǎng)絡(luò)信息價(jià)值的標(biāo)準(zhǔn)并只對(duì)符合標(biāo)準(zhǔn)的有價(jià)值的網(wǎng)絡(luò)信息進(jìn)行保存,最終獲得歸檔網(wǎng)絡(luò)價(jià)值最優(yōu)化。
第一,為歸檔網(wǎng)絡(luò)信息保存提供了理論依據(jù)。網(wǎng)絡(luò)信息資源的全面歸檔有利于促進(jìn)社會(huì)和諧發(fā)展,但由于網(wǎng)絡(luò)信息規(guī)模的日益膨脹,網(wǎng)絡(luò)信息要實(shí)現(xiàn)全面歸檔幾乎已成空想;而網(wǎng)絡(luò)信息質(zhì)量的參差不齊導(dǎo)致了全面歸檔的不確定性與歸檔網(wǎng)絡(luò)信息的組織與利用的有效性之間的矛盾。歸檔保存研究對(duì)網(wǎng)絡(luò)信息的篩選一直未收到國(guó)內(nèi)外網(wǎng)絡(luò)信息的保存研究的足夠重視,并且歸檔機(jī)構(gòu)采取的歸檔網(wǎng)絡(luò)信息價(jià)值判斷標(biāo)準(zhǔn)的差異較大,對(duì)歸檔網(wǎng)絡(luò)信息價(jià)值判斷工作不利。面對(duì)網(wǎng)絡(luò)信息的快速更新與數(shù)量規(guī)模膨脹的困境,明確統(tǒng)一的元數(shù)據(jù)標(biāo)準(zhǔn)將是有效提高歸檔網(wǎng)絡(luò)信息價(jià)值判斷工作效率的有效措施。
第二,有助于構(gòu)建科學(xué)系統(tǒng)的歸檔保存體系,節(jié)約經(jīng)濟(jì)成本。目前,網(wǎng)絡(luò)信息數(shù)量日益膨脹,但網(wǎng)絡(luò)信息的質(zhì)量卻參差不齊。在龐大數(shù)量的網(wǎng)絡(luò)信息里,存在數(shù)量不小的虛假和垃圾信息,如果不對(duì)這些垃圾信息進(jìn)行有效判斷與篩選,高質(zhì)量的網(wǎng)絡(luò)信息的利用率將會(huì)大打折扣,導(dǎo)致大量有價(jià)值的網(wǎng)絡(luò)信息資源的浪費(fèi)。元數(shù)據(jù)描述使歸檔網(wǎng)絡(luò)信息價(jià)值的有效判斷成為可能。
(二)元數(shù)據(jù)描述研究述評(píng)
1.國(guó)外研究現(xiàn)狀
國(guó)外在研究元數(shù)據(jù)方面起步較早,理論與實(shí)踐研究都比較豐富,研究已達(dá)到一定水平。總體研究現(xiàn)狀大致如下:
第一,元數(shù)據(jù)研究起源。管理元數(shù)據(jù)是最早的起源。國(guó)外于20世紀(jì)末開始研究網(wǎng)絡(luò)信息管理元數(shù)據(jù),當(dāng)時(shí)研究者意識(shí)到管理元數(shù)據(jù)的研究能幫助提高信息系統(tǒng)在管理層面上的開放性和操作性,最大限度促進(jìn)信息資源的共享。
第二,元數(shù)據(jù)定義與范疇。國(guó)外在研究元數(shù)據(jù)定義方面也比國(guó)內(nèi)早。例如,1998年,美國(guó)Getty 信息研究所在一本關(guān)于元數(shù)據(jù)的研究專著中,Anne J. Gilliland-Swetland提出了較早的定義,即元數(shù)據(jù)是在管理信息資源中利用的元數(shù)據(jù)。
第三,具有代表性的元數(shù)據(jù)方案。國(guó)外具有很多比較有代表性的管理性元數(shù)據(jù)方案。由于國(guó)外一些研究機(jī)構(gòu)在制定元數(shù)據(jù)方案時(shí),缺乏統(tǒng)一協(xié)調(diào),導(dǎo)致國(guó)外現(xiàn)存的管理性元數(shù)據(jù)種類變得比較復(fù)雜且分散性明顯。根據(jù)元數(shù)據(jù)描述對(duì)象的不同,可概括為描述資源或資源集合的管理性元數(shù)據(jù)、描述業(yè)務(wù)流程的管理性元數(shù)據(jù)和三類是描述系統(tǒng)功能的元數(shù)據(jù)以下三類。
2.國(guó)內(nèi)研究現(xiàn)狀
筆者從“中國(guó)期刊全文數(shù)據(jù)庫(kù)”、“中國(guó)博士學(xué)位論文書數(shù)據(jù)庫(kù)”、“中國(guó)優(yōu)秀碩士學(xué)位論文數(shù)據(jù)庫(kù)”中,以“網(wǎng)絡(luò)信息價(jià)值、“網(wǎng)絡(luò)信息”、“網(wǎng)絡(luò)信息價(jià)值+元數(shù)據(jù)”、“網(wǎng)絡(luò)信息+元數(shù)據(jù)” 等為檢索詞,根據(jù)題名、關(guān)鍵詞、摘要等字段進(jìn)行檢索。
我們對(duì)該領(lǐng)域已有的研究成果進(jìn)行比較分析發(fā)現(xiàn),諸多相關(guān)元數(shù)據(jù)研究成果及其工作大多都是基于元數(shù)據(jù)的創(chuàng)建者的手動(dòng)方式角度的研究,主要考慮創(chuàng)建工具的有效性與便利性。總之,從國(guó)內(nèi)相關(guān)文獻(xiàn)調(diào)研的結(jié)果中我們發(fā)現(xiàn),關(guān)于網(wǎng)絡(luò)信息價(jià)值的研究?jī)H有2篇,且發(fā)表時(shí)間都在2011年后;其次,國(guó)內(nèi)對(duì)網(wǎng)絡(luò)信息價(jià)值的相關(guān)研究?jī)?nèi)容也比較狹窄,例如,李宗偉也只是基于BP神經(jīng)網(wǎng)絡(luò)競(jìng)爭(zhēng)對(duì)手的角度來(lái)研究網(wǎng)絡(luò)信息價(jià)值。綜上所述,國(guó)內(nèi)外學(xué)界對(duì)于網(wǎng)絡(luò)信息價(jià)值的研究均存在薄弱環(huán)節(jié),即未達(dá)成與網(wǎng)絡(luò)信息價(jià)值的構(gòu)成要素的統(tǒng)一共識(shí),也始終未制定一個(gè)將價(jià)值與元數(shù)據(jù)有效結(jié)合的方案。
(三)結(jié)論與展望
本文對(duì)元數(shù)據(jù)的定義、作用及特點(diǎn)進(jìn)行了簡(jiǎn)單明了的分析,當(dāng)然,在研究深度上還有待加強(qiáng),研究面也不夠廣。但本文對(duì)元數(shù)據(jù)的功能明確了科學(xué)認(rèn)知,即元數(shù)據(jù)功能十分強(qiáng)大并且應(yīng)用非常廣,被廣泛能作用于所有行業(yè)。因此,元數(shù)據(jù)相關(guān)研究未來(lái)的重點(diǎn)發(fā)展方向是加快研究元數(shù)據(jù)的步伐、拓展研究深度,尤其建議信息資源開發(fā)的團(tuán)隊(duì),要重點(diǎn)提高對(duì)元數(shù)據(jù)的認(rèn)知。關(guān)于歸檔網(wǎng)絡(luò)信息價(jià)值元數(shù)據(jù)描述研究還有許多可以進(jìn)步的地方,例如如何構(gòu)建網(wǎng)絡(luò)信息歸檔保存領(lǐng)域的價(jià)值“本體,如何”將“本體”和元數(shù)據(jù)有機(jī)結(jié)合起來(lái);如何選擇合適的歸檔保存機(jī)構(gòu)實(shí)施項(xiàng)目;如何重點(diǎn)對(duì)歸檔網(wǎng)絡(luò)信息價(jià)值進(jìn)行動(dòng)態(tài)描述等。對(duì)這些后續(xù)問(wèn)題的深入研究之路還很漫長(zhǎng),需要加大研究力度,才能真正實(shí)現(xiàn)歸檔網(wǎng)絡(luò)信息價(jià)值判斷與保存的長(zhǎng)遠(yuǎn)意義。
注釋:
①赫亞玲.DC元數(shù)據(jù)與網(wǎng)絡(luò)信息資源的描述[J].情報(bào)科學(xué),2002,20(10)。
②高沛鑫.論元數(shù)據(jù)及其作用[J].軟件,2014,35(3):201-202。
參考文獻(xiàn):
[1]赫亞玲.DC元數(shù)據(jù)與網(wǎng)絡(luò)信息資源的描述[J].情報(bào)科學(xué),2002,20(10).
[2]劉志.PREMIS保存元數(shù)據(jù)與數(shù)字資源長(zhǎng)期保存研究[D].湘潭大學(xué),2009.
[3]于文斌.網(wǎng)絡(luò)環(huán)境下檔案著錄標(biāo)準(zhǔn)分析—以檔案編碼著錄標(biāo)準(zhǔn)(EAD)為例[D].山東大學(xué),2009.
[4]高沛鑫.論元數(shù)據(jù)及其作用[J].軟件,2014,35(3):201-202.
作者簡(jiǎn)介:向禮花(1985-),女,湖南湘潭人,碩士,貴州師范學(xué)院助教,研究方向:檔案現(xiàn)代信息化。
現(xiàn)代經(jīng)濟(jì)信息2016年18期