保麗娟,劉虹
云南中醫(yī)學(xué)院,云南 昆明 650500
云南民族醫(yī)藥文獻(xiàn)元數(shù)據(jù)方案設(shè)計(jì)探討
保麗娟,劉虹*
云南中醫(yī)學(xué)院,云南 昆明 650500
概述云南民族醫(yī)藥文獻(xiàn)數(shù)字化建設(shè)的現(xiàn)狀,根據(jù)云南少數(shù)民族醫(yī)藥文獻(xiàn)的特點(diǎn),提出云南民族醫(yī)藥文獻(xiàn)數(shù)字化元數(shù)據(jù)方案應(yīng)遵循簡(jiǎn)潔準(zhǔn)確性原則、通用性及針對(duì)性原則、共享性與互操作性原則、可擴(kuò)展性原則、用戶需求原則等設(shè)計(jì)原則。同時(shí),結(jié)合調(diào)查研究,描述了云南民族醫(yī)藥文獻(xiàn)數(shù)字化元數(shù)據(jù)方案的設(shè)計(jì)思路。
云南??;民族醫(yī)藥文獻(xiàn);元數(shù)據(jù)
云南民族醫(yī)藥文獻(xiàn)資源是云南各少數(shù)民族在漫長(zhǎng)的歷史繁衍中總結(jié)并流傳下來(lái)的寶貴醫(yī)藥文化遺產(chǎn),具有珍貴的史料和實(shí)用價(jià)值。數(shù)字化建設(shè)是長(zhǎng)期保存和有效利用這些資料的最佳手段。
近幾年來(lái),通過(guò)政府資助、基金資助、聯(lián)盟資助、中央財(cái)政支持地方高校等項(xiàng)目,我省民族醫(yī)藥文獻(xiàn)數(shù)字化工作已經(jīng)起步,并取得了初步的成果,省內(nèi)多個(gè)民族醫(yī)藥科研單位先后開展了云南少數(shù)民族醫(yī)藥文獻(xiàn)目錄的研究整理、少數(shù)民族單驗(yàn)方的研究整理,少數(shù)民族天然藥物的調(diào)查研究以及少數(shù)民族醫(yī)藥文化等多方位的少數(shù)民族醫(yī)藥文獻(xiàn)研究課題,如云南省藥物研究所主持開發(fā)了“云南特色天然藥物共享信息系統(tǒng)”,云南中醫(yī)學(xué)院主持開發(fā)了“云南民族藥物信息系統(tǒng)”、“云南少數(shù)民族醫(yī)藥單驗(yàn)方數(shù)據(jù)庫(kù)”、“云南民族醫(yī)藥肝病單驗(yàn)方數(shù)據(jù)庫(kù)”、“云南地產(chǎn)中草藥(民族藥)數(shù)據(jù)庫(kù)”,云南民族大學(xué)主持開發(fā)了“民族藥(傣藥)數(shù)據(jù)庫(kù)”等信息系統(tǒng)。這些數(shù)據(jù)庫(kù)都是在云南省各少數(shù)民族民間常用的民族藥、單方、驗(yàn)方等民族醫(yī)藥信息資源進(jìn)行收集整理的基礎(chǔ)上,利用現(xiàn)代信息技術(shù)進(jìn)行數(shù)字化加工存儲(chǔ)。這些數(shù)據(jù)庫(kù)提供了方便快捷的檢索查詢功能,生動(dòng)直觀地反映了云南各少數(shù)民族的醫(yī)藥資源狀況,為政府、企業(yè)、科研單位和醫(yī)藥工作者研究、開發(fā)、保護(hù)和利用云南省的民族醫(yī)藥提供比較全面、完整的信息資料。同時(shí)也為珍貴的民族醫(yī)藥資料提供了存儲(chǔ)平臺(tái),對(duì)于深入研究少數(shù)民族醫(yī)藥理論和開發(fā)云南特色民族藥物都具有重要的意義。
盡管如此,云南民族醫(yī)藥文獻(xiàn)數(shù)字化工程還處于初期階段,有不少問(wèn)題需要解決,例如數(shù)據(jù)庫(kù)功能結(jié)構(gòu)單一,各數(shù)據(jù)庫(kù)相互獨(dú)立,有的數(shù)據(jù)庫(kù)是基于C/S結(jié)構(gòu)模式開發(fā)的,嚴(yán)重限制了民族醫(yī)藥文獻(xiàn)資源的傳播和共享[1];有些數(shù)據(jù)庫(kù)如“云南地產(chǎn)中草藥(民族藥)數(shù)據(jù)庫(kù)”和“云南少數(shù)民族醫(yī)藥單驗(yàn)方數(shù)據(jù)庫(kù)”,雖然使用的是同一數(shù)字化平臺(tái),但由于缺乏統(tǒng)一規(guī)范的元數(shù)據(jù)方案指導(dǎo),導(dǎo)致數(shù)據(jù)庫(kù)處于各自獨(dú)立的狀態(tài),數(shù)據(jù)庫(kù)結(jié)構(gòu)和元數(shù)據(jù)元素不盡相同,不能實(shí)現(xiàn)資源的整合挖掘,無(wú)法發(fā)揮數(shù)據(jù)庫(kù)的最大效用。如此參差不齊的元數(shù)據(jù)規(guī)范嚴(yán)重限制了民族醫(yī)藥文獻(xiàn)資源的傳播和共享利用,不利于知識(shí)發(fā)現(xiàn)和創(chuàng)新。因而制訂統(tǒng)一規(guī)范的云南民族醫(yī)藥文獻(xiàn)數(shù)字化元數(shù)據(jù)方案是云南民族醫(yī)藥文獻(xiàn)數(shù)字化建設(shè)的首要問(wèn)題。
元數(shù)據(jù)(Metadata)是“關(guān)于數(shù)據(jù)的數(shù)據(jù)”[2],元數(shù)據(jù)為多種不同形態(tài)的信息資源提供了統(tǒng)一規(guī)范的描述方法,是文獻(xiàn)數(shù)字化建設(shè)中的重要組成部分,民族醫(yī)藥文獻(xiàn)元數(shù)據(jù)就是對(duì)民族醫(yī)藥文獻(xiàn)資源的內(nèi)容、屬性及特征進(jìn)行描述,并對(duì)民族醫(yī)藥信息資源進(jìn)行組織、定位和數(shù)據(jù)管理,以便于信息需求者進(jìn)行檢索和利用的一種結(jié)構(gòu)化的數(shù)據(jù)。制訂統(tǒng)一規(guī)范的云南民族醫(yī)藥文獻(xiàn)數(shù)字化元數(shù)據(jù)方案,有助于實(shí)現(xiàn)云南各民族醫(yī)藥數(shù)據(jù)庫(kù)系統(tǒng)的互操作和民族醫(yī)藥信息資源的共享,達(dá)到民族醫(yī)藥知識(shí)發(fā)現(xiàn)和創(chuàng)新以及對(duì)民族醫(yī)藥信息資源整合的目的。
目前國(guó)內(nèi)還沒有相關(guān)的民族醫(yī)藥文獻(xiàn)元數(shù)據(jù)標(biāo)準(zhǔn),但是關(guān)于中醫(yī)藥文獻(xiàn)的元數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)已經(jīng)取得了很大的突破。由中國(guó)中醫(yī)科學(xué)院中醫(yī)藥信息研究所于2012年提出的“Traditional Chinese Medicine Literature Metadata(中醫(yī)文獻(xiàn)元數(shù)據(jù))”作為一項(xiàng)ISO技術(shù)規(guī)范(Technical Specification)得到成功立項(xiàng),編號(hào)為 ISO/DTS 17948,經(jīng)過(guò)中國(guó)、韓國(guó)、英國(guó)、美國(guó)等多國(guó)專家的多次會(huì)議討論和反復(fù)修改,該標(biāo)準(zhǔn)的草案已于 2013年完成[3],目前該標(biāo)準(zhǔn)已進(jìn)入編輯出版階段。該標(biāo)準(zhǔn)的頒布,將會(huì)對(duì)中醫(yī)藥及民族醫(yī)藥文獻(xiàn)資源數(shù)字化規(guī)范建設(shè)的發(fā)展起到極大的推動(dòng)作用。
民族醫(yī)藥文獻(xiàn)資源不同于一般的中醫(yī)藥文獻(xiàn)資源,有大量不同類型的民族醫(yī)藥文獻(xiàn)素材,如古籍文獻(xiàn)、論著、民族天然藥物圖譜等傳統(tǒng)文字載體文獻(xiàn)以及各民族在從事醫(yī)療活動(dòng)中的口碑經(jīng)驗(yàn)、民間流傳的歌謠和視頻、錄音等非文字載體文獻(xiàn),并且同時(shí)存在民族文字文獻(xiàn)和漢字文獻(xiàn)等情況[4],因此,民族醫(yī)藥文獻(xiàn)元數(shù)據(jù)方案應(yīng)該在中醫(yī)藥文獻(xiàn)元數(shù)據(jù)標(biāo)準(zhǔn)的基礎(chǔ)上體現(xiàn)出民族醫(yī)藥文獻(xiàn)的特征,在設(shè)計(jì)中應(yīng)遵循以下原則。
在元數(shù)據(jù)設(shè)計(jì)時(shí)應(yīng)考慮各種層次的使用人員,設(shè)計(jì)的元數(shù)據(jù)方案應(yīng)簡(jiǎn)潔,易于理解和掌握,但要保證描述元數(shù)據(jù)的準(zhǔn)確性,能清楚明了的解釋元數(shù)據(jù)所表示的含義,便于編目人員著錄實(shí)踐。例如Dublin Core(都柏林核心元數(shù)據(jù))是國(guó)際通用的主要應(yīng)用于網(wǎng)絡(luò)信息資源組織的元數(shù)據(jù)標(biāo)準(zhǔn),DC結(jié)構(gòu)簡(jiǎn)單且易于掌握,許多專業(yè)領(lǐng)域的元數(shù)據(jù)框架都是基于DC建立的,但是民族醫(yī)藥文獻(xiàn)有其特殊性,這就需要元數(shù)據(jù)設(shè)計(jì)的時(shí)候綜合考量各種因素,參考DC元數(shù)據(jù)標(biāo)準(zhǔn)模式,在保證元數(shù)據(jù)簡(jiǎn)潔易用的基礎(chǔ)上進(jìn)行準(zhǔn)確性的描述。
由于云南民族醫(yī)藥文獻(xiàn)資源類型多樣,載體形式不盡相同,所以在設(shè)計(jì)元數(shù)據(jù)時(shí)應(yīng)保證元數(shù)據(jù)方案的整體通用性,同時(shí)也要對(duì)不同類型不同載體的文獻(xiàn)元數(shù)據(jù)有針對(duì)性的設(shè)計(jì),滿足特殊性資源的特征描述要求。例如DC元數(shù)據(jù)標(biāo)準(zhǔn)是國(guó)際通用的元數(shù)據(jù)標(biāo)準(zhǔn),但是它所規(guī)定的15個(gè)元素不能完全包含民族醫(yī)藥文獻(xiàn)的一些類型特征,因此有必要借鑒或復(fù)用其他類型的元數(shù)據(jù)標(biāo)準(zhǔn),對(duì)某些元數(shù)據(jù)做針對(duì)性的設(shè)計(jì),例如多媒體類的文獻(xiàn)資源可以參考多媒體資源描述元數(shù)據(jù)標(biāo)準(zhǔn)MPEG-7等。
元數(shù)據(jù)的共享性和互操作性主要體現(xiàn)在對(duì)異構(gòu)系統(tǒng)間互操作能力的支持[5],即不僅能支持本元數(shù)據(jù)標(biāo)準(zhǔn)上建立的各相關(guān)應(yīng)用系統(tǒng)所操作,還應(yīng)為其他民族醫(yī)藥資源應(yīng)用系統(tǒng)所操作,便于實(shí)現(xiàn)民族醫(yī)藥資源的整合共享。因此,在設(shè)計(jì)云南民族醫(yī)藥文獻(xiàn)元數(shù)據(jù)方案的時(shí)候應(yīng)保證該元數(shù)據(jù)能準(zhǔn)確表示元素?cái)?shù)據(jù)的前提下,對(duì)其進(jìn)行其他系統(tǒng)常用元數(shù)據(jù)的共享和轉(zhuǎn)換,設(shè)計(jì)時(shí)要充分考慮元數(shù)據(jù)元素的語(yǔ)義定義及元數(shù)據(jù)結(jié)構(gòu)等方面的內(nèi)容。目前,基于語(yǔ)義網(wǎng)格技術(shù)的元數(shù)據(jù)本體模型可以很好的解決不同本體之間的互操作,跨語(yǔ)言、跨文化的互操作,實(shí)現(xiàn)數(shù)字資源的共享及知識(shí)發(fā)現(xiàn)等[6]。
云南民族醫(yī)藥文獻(xiàn)資源非常豐富,并且出版物類型和載體類型多樣,整體的元數(shù)據(jù)方案只能提供比較廣泛意義上的描述,對(duì)于一些具有民族特色的內(nèi)容不能做到全部描述,但是云南民族醫(yī)藥文獻(xiàn)元數(shù)據(jù)方案要體現(xiàn)出民族醫(yī)藥文獻(xiàn)資源的特征,所以需要在標(biāo)準(zhǔn)元數(shù)據(jù)框架的前提下,根據(jù)不同民族醫(yī)藥文獻(xiàn)資源的特點(diǎn),擴(kuò)展一些必備的元素或元素值,這就要求所設(shè)計(jì)的元數(shù)據(jù)方案具有較好的可擴(kuò)展性。
民族醫(yī)藥文獻(xiàn)元數(shù)據(jù)方案設(shè)計(jì)的最終目的是能夠最大程度地滿足用戶對(duì)民族醫(yī)藥文獻(xiàn)資源的信息需求,因此在制定元數(shù)據(jù)時(shí)還需要重點(diǎn)考慮各種不同層次、不同類型的用戶需求。設(shè)計(jì)時(shí)應(yīng)該從用戶的信息需求和應(yīng)用角度出發(fā),對(duì)元數(shù)據(jù)的結(jié)構(gòu)設(shè)計(jì)、各字段的設(shè)計(jì)及元數(shù)據(jù)語(yǔ)義結(jié)構(gòu)等方面綜合考量制訂,以保證系統(tǒng)對(duì)用戶的友好性,提供用戶多層次、多途徑的信息檢索。
在設(shè)計(jì)元數(shù)據(jù)方案之前,需要對(duì)云南民族醫(yī)藥文獻(xiàn)資源以及與資源有關(guān)的對(duì)象進(jìn)行詳細(xì)的調(diào)查分析,界定云南民族醫(yī)藥文獻(xiàn)資源的范圍,分析各類型文獻(xiàn)資源對(duì)象的特點(diǎn),并調(diào)查各層次各類型使用者的需求。
調(diào)查國(guó)內(nèi)外相關(guān)領(lǐng)域已經(jīng)完成的元數(shù)據(jù)標(biāo)準(zhǔn),分析元數(shù)據(jù)內(nèi)容,考慮可以參考借鑒或者復(fù)用的相關(guān)標(biāo)準(zhǔn),避免資源浪費(fèi)。
建立云南民族醫(yī)藥文獻(xiàn)元數(shù)據(jù)的整體框架,確定不同類型元數(shù)據(jù)方案各部分之間的相互關(guān)系和規(guī)則。
集合民族醫(yī)學(xué)、情報(bào)學(xué)、文獻(xiàn)學(xué)、計(jì)算機(jī)信息管理等方面的專家一起討論,結(jié)合調(diào)研實(shí)際和實(shí)證研究,從資源利用的角度提出屬性需求以及云南民族醫(yī)藥文獻(xiàn)資源的特征需求,明確核心元素,以及需要復(fù)用、借鑒、擴(kuò)展的元素。
對(duì)不同的文獻(xiàn)資源類型制定相對(duì)應(yīng)的著錄規(guī)則以及對(duì)元數(shù)據(jù)元素詳細(xì)的描述性著錄細(xì)則,充分體現(xiàn)民族醫(yī)藥文獻(xiàn)的特征,指導(dǎo)民族醫(yī)藥文獻(xiàn)數(shù)字化建設(shè)。
確定云南民族醫(yī)藥文獻(xiàn)元數(shù)據(jù)方案的置標(biāo)方案。目前比較主流的置標(biāo)方案是基于XML/RDF形式的,這種形式的置標(biāo)方案有利于數(shù)據(jù)的長(zhǎng)期保存,并且可以實(shí)現(xiàn)系統(tǒng)的語(yǔ)義互操作,有利于資源的整合和共享。
制訂統(tǒng)一規(guī)范的云南民族醫(yī)藥文獻(xiàn)數(shù)字化元數(shù)據(jù)方案是云南民族醫(yī)藥數(shù)字化信息資源的整合、共享的基礎(chǔ)性工作,為實(shí)現(xiàn)民族醫(yī)藥信息資源的深度挖掘、民族醫(yī)藥知識(shí)發(fā)現(xiàn)和知識(shí)創(chuàng)新提供技術(shù)支持,同時(shí)也為其他區(qū)域民族醫(yī)藥資源的數(shù)字化建設(shè)和信息資源整合提供參考和交流。
[1]保麗娟,李永強(qiáng),劉虹.云南少數(shù)民族醫(yī)藥文獻(xiàn)數(shù)字化現(xiàn)狀及思考[J].云南中醫(yī)學(xué)院學(xué)報(bào),2013,36(5):62-64.
[2]Weibel S. The Dublin Core: A Simple Content Description Model for Electronic Resources[J]. Bulletin of the American Society for Information Science and Technology,1997,24(1):9-11.
[3]于彤,崔蒙,李海燕,等.中醫(yī)藥文獻(xiàn)元數(shù)據(jù)標(biāo)準(zhǔn)化研究進(jìn)展[J].中國(guó)數(shù)字醫(yī)學(xué),2013,8(7):66-69.
[4]劉虹,陳柏君,羅艷秋.云南少數(shù)民族醫(yī)藥文字文獻(xiàn)述略[J].云南中醫(yī)學(xué)院學(xué)報(bào),2013,36(3):43-46,48.
[5]陳海燕.CALIS特色數(shù)據(jù)庫(kù)信息資源描述與實(shí)踐[J].圖書情報(bào)論壇,2008(3):48-50.
[6]畢強(qiáng),韓毅.語(yǔ)義網(wǎng)格環(huán)境下基于元數(shù)據(jù)本體的數(shù)字圖書館互操作研究[J].圖書情報(bào)工作,2009,53(15):17-20, 82.
Discussion on Metadata Schemes for Yunnan Minority Medical Literature
Bao Lijuan, Liu Hong*
(Yunnan University of Traditional Chinese Medicine, Kunming Yunnan 650500, China)
The article overviewed the current situation of digitization of minority medical literature in Yunnan, and proposed that the metadata schemes for Yunnan Minority medical literature should follow the principles of simplicity and accuracy, versatility and pertinence, sharing and interoperability, scalability and user needs according to the characteristics of Yunnan Minority medical literature. At the same time, it also described the design ideas of Yunnan Minority medical literature metadata schemes combining investigation and research.
Yunnan Province; minority medical literature; metadata
10.3969/j.issn.2095-5707.2014.03.008
云南省哲學(xué)社會(huì)科學(xué)規(guī)劃項(xiàng)目(QN2013057)
保麗娟,館員,研究方向:中醫(yī)藥信息管理。E-mail: daibaoauto@163.com
*通訊作者:劉虹,教授,研究方向:中醫(yī)藥文獻(xiàn)信息。E-mail: 13700694229@163.com.
2014-03-20,編輯:魏民)