保麗娟+++劉虹
摘要:概述云南民族醫(yī)藥文獻(xiàn)數(shù)字化建設(shè)的現(xiàn)狀,根據(jù)云南少數(shù)民族醫(yī)藥文獻(xiàn)的特點,提出云南民族醫(yī)藥文獻(xiàn)數(shù)字化元數(shù)據(jù)方案應(yīng)遵循簡潔準(zhǔn)確性原則、通用性及針對性原則、共享性與互操作性原則、可擴(kuò)展性原則、用戶需求原則等設(shè)計原則。同時,結(jié)合調(diào)查研究,描述了云南民族醫(yī)藥文獻(xiàn)數(shù)字化元數(shù)據(jù)方案的設(shè)計思路。
關(guān)鍵詞:云南??;民族醫(yī)藥文獻(xiàn);元數(shù)據(jù)
doi: 10.3969/j.issn.2095-5707.2014.03.008
Discussion on Metadata Schemes for Yunnan Minority Medical Literature
Bao Lijuan, Liu Hong*
(Yunnan University of Traditional Chinese Medicine, Kunming Yunnan 650500, China)
Abstract: The article overviewed the current situation of digitization of minority medical literature in Yunnan, and proposed that the metadata schemes for Yunnan Minority medical literature should follow the principles of simplicity and accuracy, versatility and pertinence, sharing and interoperability, scalability and user needs according to the characteristics of Yunnan Minority medical literature. At the same time, it also described the design ideas of Yunnan Minority medical literature metadata schemes combining investigation and research.
Key words: Yunnan Province; minority medical literature; metadata
云南民族醫(yī)藥文獻(xiàn)資源是云南各少數(shù)民族在漫長的歷史繁衍中總結(jié)并流傳下來的寶貴醫(yī)藥文化遺產(chǎn),具有珍貴的史料和實用價值。數(shù)字化建設(shè)是長期保存和有效利用這些資料的最佳手段。
1云南民族醫(yī)藥文獻(xiàn)概述
近幾年來,通過政府資助、基金資助、聯(lián)盟資助、中央財政支持地方高校等項目,我省民族醫(yī)藥文獻(xiàn)數(shù)字化工作已經(jīng)起步,并取得了初步的成果,省內(nèi)多個民族醫(yī)藥科研單位先后開展了云南少數(shù)民族醫(yī)藥文獻(xiàn)目錄的研究整理、少數(shù)民族單驗方的研究整理,少數(shù)民族天然藥物的調(diào)查研究以及少數(shù)民族醫(yī)藥文化等多方位的少數(shù)民族醫(yī)藥文獻(xiàn)研究課題,如云南省藥物研究所主持開發(fā)了“云南特色天然藥物共享信息系統(tǒng)”,云南中醫(yī)學(xué)院主持開發(fā)了“云南民族藥物信息系統(tǒng)”、“云南少數(shù)民族醫(yī)藥單驗方數(shù)據(jù)庫”、“云南民族醫(yī)藥肝病單驗方數(shù)據(jù)庫”、“云南地產(chǎn)中草藥(民族
基金項目:云南省哲學(xué)社會科學(xué)規(guī)劃項目(QN2013057)
第一作者:保麗娟,館員,研究方向:中醫(yī)藥信息管理。E-mail: daibaoauto@163.com
*通訊作者:劉虹,教授,研究方向:中醫(yī)藥文獻(xiàn)信息。E-mail: 13700694229@163.com.
藥)數(shù)據(jù)庫”,云南民族大學(xué)主持開發(fā)了“民族藥(傣藥)數(shù)據(jù)庫”等信息系統(tǒng)。這些數(shù)據(jù)庫都是在云南省各少數(shù)民族民間常用的民族藥、單方、驗方等民族醫(yī)藥信息資源進(jìn)行收集整理的基礎(chǔ)上,利用現(xiàn)代信息技術(shù)進(jìn)行數(shù)字化加工存儲。這些數(shù)據(jù)庫提供了方便快捷的檢索查詢功能,生動直觀地反映了云南各少數(shù)民族的醫(yī)藥資源狀況,為政府、企業(yè)、科研單位和醫(yī)藥工作者研究、開發(fā)、保護(hù)和利用云南省的民族醫(yī)藥提供比較全面、完整的信息資料。同時也為珍貴的民族醫(yī)藥資料提供了存儲平臺,對于深入研究少數(shù)民族醫(yī)藥理論和開發(fā)云南特色民族藥物都具有重要的意義。
盡管如此,云南民族醫(yī)藥文獻(xiàn)數(shù)字化工程還處于初期階段,有不少問題需要解決,例如數(shù)據(jù)庫功能結(jié)構(gòu)單一,各數(shù)據(jù)庫相互獨立,有的數(shù)據(jù)庫是基于C/S結(jié)構(gòu)模式開發(fā)的,嚴(yán)重限制了民族醫(yī)藥文獻(xiàn)資源的傳播和共享[1];有些數(shù)據(jù)庫如“云南地產(chǎn)中草藥(民族藥)數(shù)據(jù)庫”和“云南少數(shù)民族醫(yī)藥單驗方數(shù)據(jù)庫”,雖然使用的是同一數(shù)字化平臺,但由于缺乏統(tǒng)一規(guī)范的元數(shù)據(jù)方案指導(dǎo),導(dǎo)致數(shù)據(jù)庫處于各自獨立的狀態(tài),數(shù)據(jù)庫結(jié)構(gòu)和元數(shù)據(jù)元素不盡相同,不能實現(xiàn)資源的整合挖掘,無法發(fā)揮數(shù)據(jù)庫的最大效用。如此參差不齊的元數(shù)據(jù)規(guī)范嚴(yán)重限制了民族醫(yī)藥文獻(xiàn)資源的傳播和共享利用,不利于知識發(fā)現(xiàn)和創(chuàng)新。因而制訂統(tǒng)一規(guī)范的云南民族醫(yī)藥文獻(xiàn)數(shù)字化元數(shù)據(jù)方案是云南民族醫(yī)藥文獻(xiàn)數(shù)字化建設(shè)的首要問題。
2元數(shù)據(jù)及業(yè)內(nèi)研究進(jìn)展
元數(shù)據(jù)(Metadata)是“關(guān)于數(shù)據(jù)的數(shù)據(jù)”[2],元數(shù)據(jù)為多種不同形態(tài)的信息資源提供了統(tǒng)一規(guī)范的描述方法,是文獻(xiàn)數(shù)字化建設(shè)中的重要組成部分,民族醫(yī)藥文獻(xiàn)元數(shù)據(jù)就是對民族醫(yī)藥文獻(xiàn)資源的內(nèi)容、屬性及特征進(jìn)行描述,并對民族醫(yī)藥信息資源進(jìn)行組織、定位和數(shù)據(jù)管理,以便于信息需求者進(jìn)行檢索和利用的一種結(jié)構(gòu)化的數(shù)據(jù)。制訂統(tǒng)一規(guī)范的云南民族醫(yī)藥文獻(xiàn)數(shù)字化元數(shù)據(jù)方案,有助于實現(xiàn)云南各民族醫(yī)藥數(shù)據(jù)庫系統(tǒng)的互操作和民族醫(yī)藥信息資源的共享,達(dá)到民族醫(yī)藥知識發(fā)現(xiàn)和創(chuàng)新以及對民族醫(yī)藥信息資源整合的目的。
目前國內(nèi)還沒有相關(guān)的民族醫(yī)藥文獻(xiàn)元數(shù)據(jù)標(biāo)準(zhǔn),但是關(guān)于中醫(yī)藥文獻(xiàn)的元數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)已經(jīng)取得了很大的突破。由中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所于2012年提出的“Traditional Chinese Medicine Literature Metadata(中醫(yī)文獻(xiàn)元數(shù)據(jù))”作為一項ISO技術(shù)規(guī)范(Technical Specification)得到成功立項,編號為ISO/DTS 17948,經(jīng)過中國、韓國、英國、美國等多國專家的多次會議討論和反復(fù)修改,該標(biāo)準(zhǔn)的草案已于2013年完成[3],目前該標(biāo)準(zhǔn)已進(jìn)入編輯出版階段。該標(biāo)準(zhǔn)的頒布,將會對中醫(yī)藥及民族醫(yī)藥文獻(xiàn)資源數(shù)字化規(guī)范建設(shè)的發(fā)展起到極大的推動作用。
3云南民族醫(yī)藥文獻(xiàn)數(shù)字化元數(shù)據(jù)方案設(shè)計原則
民族醫(yī)藥文獻(xiàn)資源不同于一般的中醫(yī)藥文獻(xiàn)資源,有大量不同類型的民族醫(yī)藥文獻(xiàn)素材,如古籍文獻(xiàn)、論著、民族天然藥物圖譜等傳統(tǒng)文字載體文獻(xiàn)以及各民族在從事醫(yī)療活動中的口碑經(jīng)驗、民間流傳的歌謠和視頻、錄音等非文字載體文獻(xiàn),并且同時存在民族文字文獻(xiàn)和漢字文獻(xiàn)等情況[4],因此,民族醫(yī)藥文獻(xiàn)元數(shù)據(jù)方案應(yīng)該在中醫(yī)藥文獻(xiàn)元數(shù)據(jù)標(biāo)準(zhǔn)的基礎(chǔ)上體現(xiàn)出民族醫(yī)藥文獻(xiàn)的特征,在設(shè)計中應(yīng)遵循以下原則。
3.1簡潔準(zhǔn)確性原則
在元數(shù)據(jù)設(shè)計時應(yīng)考慮各種層次的使用人員,設(shè)計的元數(shù)據(jù)方案應(yīng)簡潔,易于理解和掌握,但要保證描述元數(shù)據(jù)的準(zhǔn)確性,能清楚明了的解釋元數(shù)據(jù)所表示的含義,便于編目人員著錄實踐。例如Dublin Core(都柏林核心元數(shù)據(jù))是國際通用的主要應(yīng)用于網(wǎng)絡(luò)信息資源組織的元數(shù)據(jù)標(biāo)準(zhǔn),DC結(jié)構(gòu)簡單且易于掌握,許多專業(yè)領(lǐng)域的元數(shù)據(jù)框架都是基于DC建立的,但是民族醫(yī)藥文獻(xiàn)有其特殊性,這就需要元數(shù)據(jù)設(shè)計的時候綜合考量各種因素,參考DC元數(shù)據(jù)標(biāo)準(zhǔn)模式,在保證元數(shù)據(jù)簡潔易用的基礎(chǔ)上進(jìn)行準(zhǔn)確性的描述。
3.2通用性及針對性原則
由于云南民族醫(yī)藥文獻(xiàn)資源類型多樣,載體形式不盡相同,所以在設(shè)計元數(shù)據(jù)時應(yīng)保證元數(shù)據(jù)方案的整體通用性,同時也要對不同類型不同載體的文獻(xiàn)元數(shù)據(jù)有針對性的設(shè)計,滿足特殊性資源的特征描述要求。例如DC元數(shù)據(jù)標(biāo)準(zhǔn)是國際通用的元數(shù)據(jù)標(biāo)準(zhǔn),但是它所規(guī)定的15個元素不能完全包含民族醫(yī)藥文獻(xiàn)的一些類型特征,因此有必要借鑒或復(fù)用其他類型的元數(shù)據(jù)標(biāo)準(zhǔn),對某些元數(shù)據(jù)做針對性的設(shè)計,例如多媒體類的文獻(xiàn)資源可以參考多媒體資源描述元數(shù)據(jù)標(biāo)準(zhǔn)MPEG-7等。
3.3共享性與互操作性原則
元數(shù)據(jù)的共享性和互操作性主要體現(xiàn)在對異構(gòu)系統(tǒng)間互操作能力的支持[5],即不僅能支持本元數(shù)據(jù)標(biāo)準(zhǔn)上建立的各相關(guān)應(yīng)用系統(tǒng)所操作,還應(yīng)為其他民族醫(yī)藥資源應(yīng)用系統(tǒng)所操作,便于實現(xiàn)民族醫(yī)藥資源的整合共享。因此,在設(shè)計云南民族醫(yī)藥文獻(xiàn)元數(shù)據(jù)方案的時候應(yīng)保證該元數(shù)據(jù)能準(zhǔn)確表示元素數(shù)據(jù)的前提下,對其進(jìn)行其他系統(tǒng)常用元數(shù)據(jù)的共享和轉(zhuǎn)換,設(shè)計時要充分考慮元數(shù)據(jù)元素的語義定義及元數(shù)據(jù)結(jié)構(gòu)等方面的內(nèi)容。目前,基于語義網(wǎng)格技術(shù)的元數(shù)據(jù)本體模型可以很好的解決不同本體之間的互操作,跨語言、跨文化的互操作,實現(xiàn)數(shù)字資源的共享及知識發(fā)現(xiàn)等[6]。
3.4可擴(kuò)展性原則
云南民族醫(yī)藥文獻(xiàn)資源非常豐富,并且出版物類型和載體類型多樣,整體的元數(shù)據(jù)方案只能提供比較廣泛意義上的描述,對于一些具有民族特色的內(nèi)容不能做到全部描述,但是云南民族醫(yī)藥文獻(xiàn)元數(shù)據(jù)方案要體現(xiàn)出民族醫(yī)藥文獻(xiàn)資源的特征,所以需要在標(biāo)準(zhǔn)元數(shù)據(jù)框架的前提下,根據(jù)不同民族醫(yī)藥文獻(xiàn)資源的特點,擴(kuò)展一些必備的元素或元素值,這就要求所設(shè)計的元數(shù)據(jù)方案具有較好的可擴(kuò)展性。
3.5用戶需求原則
民族醫(yī)藥文獻(xiàn)元數(shù)據(jù)方案設(shè)計的最終目的是能夠最大程度地滿足用戶對民族醫(yī)藥文獻(xiàn)資源的信息需求,因此在制定元數(shù)據(jù)時還需要重點考慮各種不同層次、不同類型的用戶需求。設(shè)計時應(yīng)該從用戶的信息需求和應(yīng)用角度出發(fā),對元數(shù)據(jù)的結(jié)構(gòu)設(shè)計、各字段的設(shè)計及元數(shù)據(jù)語義結(jié)構(gòu)等方面綜合考量制訂,以保證系統(tǒng)對用戶的友好性,提供用戶多層次、多途徑的信息檢索。
4云南民族醫(yī)藥文獻(xiàn)數(shù)字化元數(shù)據(jù)方案設(shè)計思路
4.1資源對象分析
在設(shè)計元數(shù)據(jù)方案之前,需要對云南民族醫(yī)藥文獻(xiàn)資源以及與資源有關(guān)的對象進(jìn)行詳細(xì)的調(diào)查分析,界定云南民族醫(yī)藥文獻(xiàn)資源的范圍,分析各類型文獻(xiàn)資源對象的特點,并調(diào)查各層次各類型使用者的需求。
4.2元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范分析
調(diào)查國內(nèi)外相關(guān)領(lǐng)域已經(jīng)完成的元數(shù)據(jù)標(biāo)準(zhǔn),分析元數(shù)據(jù)內(nèi)容,考慮可以參考借鑒或者復(fù)用的相關(guān)標(biāo)準(zhǔn),避免資源浪費。
4.3建立元數(shù)據(jù)框架
建立云南民族醫(yī)藥文獻(xiàn)元數(shù)據(jù)的整體框架,確定不同類型元數(shù)據(jù)方案各部分之間的相互關(guān)系和規(guī)則。
4.4屬性特征提取
集合民族醫(yī)學(xué)、情報學(xué)、文獻(xiàn)學(xué)、計算機(jī)信息管理等方面的專家一起討論,結(jié)合調(diào)研實際和實證研究,從資源利用的角度提出屬性需求以及云南民族醫(yī)藥文獻(xiàn)資源的特征需求,明確核心元素,以及需要復(fù)用、借鑒、擴(kuò)展的元素。
4.5制定著錄規(guī)則
對不同的文獻(xiàn)資源類型制定相對應(yīng)的著錄規(guī)則以及對元數(shù)據(jù)元素詳細(xì)的描述性著錄細(xì)則,充分體現(xiàn)民族醫(yī)藥文獻(xiàn)的特征,指導(dǎo)民族醫(yī)藥文獻(xiàn)數(shù)字化建設(shè)。
4.6確定置標(biāo)方案
確定云南民族醫(yī)藥文獻(xiàn)元數(shù)據(jù)方案的置標(biāo)方案。目前比較主流的置標(biāo)方案是基于XML/RDF形式的,這種形式的置標(biāo)方案有利于數(shù)據(jù)的長期保存,并且可以實現(xiàn)系統(tǒng)的語義互操作,有利于資源的整合和共享。
5結(jié)語
制訂統(tǒng)一規(guī)范的云南民族醫(yī)藥文獻(xiàn)數(shù)字化元數(shù)據(jù)方案是云南民族醫(yī)藥數(shù)字化信息資源的整合、共享的基礎(chǔ)性工作,為實現(xiàn)民族醫(yī)藥信息資源的深度挖掘、民族醫(yī)藥知識發(fā)現(xiàn)和知識創(chuàng)新提供技術(shù)支持,同時也為其他區(qū)域民族醫(yī)藥資源的數(shù)字化建設(shè)和信息資源整合提供參考和交流。
參考文獻(xiàn)
[1]保麗娟,李永強(qiáng),劉虹.云南少數(shù)民族醫(yī)藥文獻(xiàn)數(shù)字化現(xiàn)狀及思考[J].云南中醫(yī)學(xué)院學(xué)報,2013,36(5):62-64.
[2]Weibel S. The Dublin Core: A Simple Content Description Model for Electronic Resources[J]. Bulletin of the American Society for Information Science and Technology,1997,24(1):9-11.
[3]于彤,崔蒙,李海燕,等.中醫(yī)藥文獻(xiàn)元數(shù)據(jù)標(biāo)準(zhǔn)化研究進(jìn)展[J].中國數(shù)字醫(yī)學(xué),2013,8(7):66-69.
[4]劉虹,陳柏君,羅艷秋.云南少數(shù)民族醫(yī)藥文字文獻(xiàn)述 略[J].云南中醫(yī)學(xué)院學(xué)報,2013,36(3):43-46,48.
[5]陳海燕.CALIS特色數(shù)據(jù)庫信息資源描述與實踐[J].圖書情報論壇,2008(3):48-50.
[6]畢強(qiáng),韓毅.語義網(wǎng)格環(huán)境下基于元數(shù)據(jù)本體的數(shù)字圖書館互操作研究[J].圖書情報工作,2009,53(15):17-20, 82.
(收稿日期:2014-03-20,編輯:魏民)