, ,
《醫(yī)學主題詞表》(Medical Subject Headings,MeSH)是美國國立醫(yī)學圖書館編制的主題詞表,是一部規(guī)范化的可擴展的動態(tài)性敘詞表[1],是生物醫(yī)學文獻標引的重要依據(jù)。MeSH詞表定期更新,在一定程度上反映了國外醫(yī)學界對中醫(yī)藥學的理解與認識以及當前專題研究的熱點等。MeSH由主題詞表、副主題詞表、增補概念表、樹形結構表等組成,主題詞表是其主體部分,主題詞能揭示文獻主要研究內(nèi)容并具有動態(tài)性。近年MeSH收錄的中醫(yī)藥學主題詞數(shù)量不斷增加,但沒有按照中醫(yī)藥學科體系和規(guī)律增加中醫(yī)藥學主題詞。目前中醫(yī)藥學主題詞不僅數(shù)量少而且部分概念有些寬泛和有失準確[2],因此在PubMed中檢全與檢準中醫(yī)藥學文獻比較困難。
增補概念表(Supplementary Concept Records,SCRs)中的術語大多直接來自文獻中的詞匯。增補概念是對主題詞的補充與擴展[3],主要用于標引化學物質、藥物、罕見疾病概念等。它沒有樹狀結構號,但是一個增補概念對應一個或多個主題詞,運用更廣闊[4]。SCRs設置了同義詞作為物質名稱(Name of Substance)入口詞(Entry Term),從而使其具有聚類同義詞的功能[5]。SCRs每周更新[4],收錄文獻中新出現(xiàn)專業(yè)術語的速度較主題詞更快,術語量也在不斷增加,至2013年收錄的增補概念已達214 234個[6],對學術論文關鍵內(nèi)容的揭示也更加全面。我們在檢索實踐中,發(fā)現(xiàn)很大一部分中醫(yī)藥尤其是中草藥的概念雖然沒有對應的主題詞,卻體現(xiàn)為增補概念。總之,增補概念具有主題詞的基本特征,覆蓋面廣泛,特別是收錄了大量的中醫(yī)藥術語并且更新迅速,對研究中草藥術語更有意義。
本文通過SCRs與MeSH的映射關系獲取SCRs中相關中草藥術語,多維度分析,發(fā)現(xiàn)了中草藥相關增補概念的現(xiàn)狀及存在的問題。一方面了解了國際上對中草藥的認知情況,為中醫(yī)藥術語規(guī)范化建設提供參考,另一方面探索了在PubMed中有效提高中草藥文獻查全率與查準率的策略。
通過MeSH Browser[7]獲取映射到(Heading Mapped To)中草藥(Drugs, Chinese Herbal)的增補概念869個,檢索時間為2013-11-20。根據(jù)增補概念注釋數(shù)據(jù)及術語來源文獻,對術語進行翻譯和相關信息(國別/地區(qū)、單味藥、中藥提取成分、復方、經(jīng)方與自擬方)標注。經(jīng)方與自擬方包括了方劑的各種劑型,國別/地區(qū)信息以術語來源文獻作者署名的國家或地區(qū)為準。由于術語表達存在差異,為了更好呈現(xiàn)被收錄的國內(nèi)增補概念現(xiàn)狀,對香港、臺灣地區(qū)和中國大陸增補概念分別統(tǒng)計。
總體上看,MeSH中草藥相關增補概念呈現(xiàn)隨時間穩(wěn)步增長的趨勢(圖1),這與近年來中草藥研究受到國際認可與重視、相關研究文獻不斷增長有一定關系。2008年收錄增補概念最多,為269個,這主要與2008年MeSH開始大量收錄來源于中國期刊的增補概念有關。這些期刊包括《中西醫(yī)結合雜志》、《中華男科學》、《南方醫(yī)科大學學報》等,來自《中西醫(yī)結合雜志》的增補概念最多。
圖1 增補概念變化趨勢
從增補概念來源國家/地區(qū)的分布(圖2)來看,排名前5位的分別為中國大陸、日本、臺灣地區(qū)、韓國、香港地區(qū),其他國家/地區(qū)收錄的增補概念數(shù)均在10個以下。來源于中國大陸的增補概念約占69%,但是從使用頻次來看,卻與增補概念只占11%的日本不相上下,而且高使用頻次(60次以上)的增補概念更多來源于日本。一方面是因為日本的漢方研究起步早、成果發(fā)布時間早,其使用的中草藥相關術語成為增補概念的時間較其他國家/地區(qū)早,如“柴胡桂枝湯”1979年成為增補概念,目前被使用138次;另一方面是因為日本研究人員對同一中草藥研究的關注度與認知度比較高,研究也比較集中和系統(tǒng)。
圖2 增補概念來源國家/地區(qū)分布
相關增補概念反映出中草藥研究方向可分為單味藥、中藥提取成分、復方(經(jīng)方、自擬方),其中復方相關增補概念居多,占80%以上。
復方相關增補概念的來源分析表明,我國(包括香港、臺灣地區(qū))中草藥研究多為自擬方,而日韓研究主要集中在經(jīng)方。
此外,日本同一經(jīng)方的研究的文獻數(shù)量往往高于中國大陸。這與日本在開發(fā)研究漢方成藥制劑時多選用我國名醫(yī)典籍中的古方、很少選用現(xiàn)代臨床應用的經(jīng)驗方有關,也與日本漢方業(yè)發(fā)展得到政府政策支持、重視科研及投入等有關[8]。在多種有利因素的促進下,日本漢方業(yè)在國際市場占大量份額,國際認知度高。國內(nèi)自擬方與經(jīng)方研究都較為零散,難以形成規(guī)模,因此認知度較低,無法形成與日韓抗衡的市場競爭力。
2.3.1 增補概念重復收錄
中草藥術語翻譯國際上尚無統(tǒng)一標準,不同國家或地區(qū)的表達習慣與翻譯又存在差異,加之中草藥相關術語往往有拉丁文、漢語拼音、英文、縮寫等不同譯名,所以收錄時未能加以甄別就會導致概念的重復收錄。這一現(xiàn)象在復方相關增補概念中表現(xiàn)得更加突出。以下是增補概念重復收錄的幾種類型。
一是漢語拼音與拉丁文翻譯不同造成重復收錄。同一中草藥往往由于漢語拼音與拉丁文翻譯的差別被視為兩個概念被同時收錄。這種情況常出現(xiàn)在來源不同的概念中,如秦皮-qinpi(臺灣地區(qū))、Cortex Fraxini(中國大陸),四君子湯-si-jun-zi-tang(韓國)、Shikunshi-to(日本),當歸芍藥散-toki-shakuyaku-san(日本)、danggui-shaoyao-san(中國大陸),五虎湯-Goko-to(日本)、Wu-Hu-Tang(中國大陸),桂枝湯-keishi-to(日本)、guizhi decoction(中國大陸),真武湯-shin-bu-to(日本)、zhen-wu-tang(中國大陸);也有來源相同而由翻譯差異造成的,如黃芪-Huang Qi、Radix Astragali seu Hedysari(中國大陸)。
二是劑型翻譯差異或缺省造成重復收錄。復方(經(jīng)方)中通常有湯、散、丸等不同劑型,由于劑型翻譯的差異(如湯劑有tang與decoction兩種譯法)而被視為不同概念,如龍膽瀉肝湯-longdan xiegan decoction(中國大陸)、longdan xiegan tang(臺灣地區(qū)),三拗湯-San-Ao decoction(中國大陸)、san-ao-tang(臺灣地區(qū))。劑型翻譯缺省也會導導致重復收錄,如玉屏風散-yupingfeng(中國大陸)、yu ping feng san(香港),酸棗仁湯-suanzaoren、suanzaorentang(中國大陸),銀翹散-yinqiao、yinqiaosan(中國大陸),大承氣湯-Da-Cheng-Qi(中國大陸)、Da-Cheng-Qi-Tang(中國大陸)等。
三是詞形差異造成重復收錄。如果沒有同義詞的聚類,微小的詞形變化都會導致檢索結果的差異。部分中草藥相關增補概念在漢語拼音中加入“-”或空格形成了詞形的差異,如溫脾湯-wenpi decoction(中國大陸)、wen-pi-tang(日本),人參養(yǎng)榮湯-renshen yangrong decoction(中國大陸)、ren-shen-yang-rong-tang(日本),左金丸-Zuo-Jin-Wan(臺灣)、zuojin(中國大陸),六君子湯-liujunzi(中國大陸)、liu-jun-zi-tang(日本);平胃散-ping wei san(中國大陸)、ping-wei(中國大陸),十全大補湯-shiquandabu(中國大陸)、Shi-Quan-Da-Bu-Tang(中國大陸),一貫煎-yiguanjian decoction(中國大陸)、Yi Guan Jian Decoction(中國大陸),左歸丸-zuogui(中國大陸)、zuo gui wan(中國大陸)等。
四是多種原因造成重復收錄。如四物湯-samultang(韓國)、shimotsu-to(日本)、si-wu decoction(中國大陸)、si-wu-tang(韓國),小柴胡湯-shosaiko-to(日本)、xiaochaihu(中國大陸)、xiaochaihu-tang(中國大陸),茵陳蒿湯-inchinko-to(日本)、yinchenhao(中國大陸)、yin-chen-hao-tang(臺灣地區(qū))、in-chern-hau-tang(中國大陸)。
此外,一些來源中國大陸的增補概念由于細微的差異被視為不同概念重復收錄,如二至天癸顆粒(er'zhi tiangui、erzhi tiangui)[9-10];亦有由于數(shù)字表述不一樣而收錄為不同概念,如冠心2號(guan xin II、guanxin No. 2、guan-xin-er-hao);還有名方翻譯不同而致重復收錄,如片仔癀(pianzihuang,pien tze huang)。
以上重復收錄的增補概念既有來源于不同國家或地區(qū)的,也有來源于同一國家與地區(qū)的。其中來源于中國大陸的術語規(guī)范性不強問題相對其他國家與地區(qū)的更嚴重。在中草藥國際市場上中國制劑所占份額并不高,如果在相關制劑研究與翻譯中不規(guī)范用語,將不利于中草藥的推廣與宣傳。
2.3.2 同義詞聚類不足
增補概念表對同一概念的不同譯名(即同義詞)做了有效的聚類,如八味地黃丸以hachimijiogan為物質名,列 ba-wei-di-huang-wan、bawei dihuang wan、hachimi-jio-gan 、pa-wei-ti-huang-wan、Rehmannia eight formula等同義詞為入口詞(Entry Term),形成同義詞環(huán),有利于文獻集中與檢索。但實際上,增補概念表的同義詞聚類仍存不足,一方面是由于概念重復收錄所致,另一方面是增補概念雖同時收錄同一中草藥的多種不同譯名,但仍有所遺漏,如四物湯雖然收錄了來源于不同國家的4個概念samultang(韓國)、shimotsu-to(日本)、si-wu decoction(中國大陸)、si-wu-tang(日本),但以siwutang、siwu decoction、siwu tang等自由詞檢索仍能查出中國大陸與臺灣地區(qū)的四物湯研究文獻。
就已有的增補概念同義詞聚類來看,來源于日本的增補概念相對規(guī)范,對同一中草藥的揭示也較其他國家或地區(qū)更加豐富,往往既有拉丁文譯名,又有漢語拼音,還有漢方縮名代碼等。如四逆散的物質名為shigyaku-san,同義詞有Si-Ni-San、TJ-35;小柴胡湯的物質名為shosaiko-to,同義詞有sho-saiko-to、shosaiko-toh、TJ-9、TJ9、xiao-chai-hu-tang;人參養(yǎng)榮湯的物質名為ren-shen-yang-rong-tang,同義詞有ninjin-yoei-to、ninjin-youei-to、TJ-108、TJ108。而來自中國大陸的術語卻因沒有同義詞聚類而重復收錄,如黃芪-Huang Qi、Radix Astragali seu Hedysari、一貫煎-yiguanjian decoction、Yi Guan Jian Decoction等。
2.3.3 類方未能整合標引
對于同一方劑的不同劑型或制劑未能整合標引而視為不同概念分別收錄,如六味地黃湯(Liuwei Dihuang Decoction)與六味地黃丸(liu-wei-di-huang wan)、桂枝茯苓膠囊(guizhi-fuling)與桂枝茯苓丸(keishibukuryogan)。
2.3.4 增補概念錯誤收錄
中草藥相關增補概念存在錯誤收錄的情況。如邁普新并不是中草藥而是西藥胸腺肽,研究人員用漢語拼音maipuxin進行表達;芬必得(商品名fenbid)實為布洛芬緩釋膠囊,屬于西藥,但研究人員在文獻中使用其商品名,以致收錄人員將這兩個物質誤認為是中草藥,將其收錄為中草藥相關增補概念。這與我國研究人員在發(fā)文時英文翻譯習慣使用商品名而不習慣使用通用名有關。
SCRs收錄了大量的中草藥術語并逐年增加,對檢索和研究中草藥文獻都起了積極作用。其增補概念雖然大部分源于中國大陸,但同一經(jīng)方對應文獻量并不高于其他國家/地區(qū)的文獻產(chǎn)出,反映出中國大陸的中草藥研究相對零散未形成系統(tǒng),同類經(jīng)方的關注度與認知度差,影響了中國在中草藥國際市場的競爭力。因此,我們一方面要規(guī)范增補概念,另一方面注意使用規(guī)范術語和多種術語。
SCRs對中草藥雖然做了規(guī)范但仍然存在概念重復收錄、同義詞聚類不足、錯誤收錄等問題。
一方面是因為收錄人員缺少中草藥知識或了解不夠深入,未能對相關術語進行必要的內(nèi)涵審核,以完善相關增補概念。建議收錄人員定期對中草藥相關增補概念進行梳理與整合,采取一些措施。如可在中草藥漢語拼音與拉丁文中選取一個作為物質名稱,另一個作為入口詞;針對復方湯、丸、散劑、顆粒的增補概念,采用劑型缺省的譯名作為物質名稱,以避免翻譯不同導致重復收錄;參見《中國中醫(yī)藥主題詞表》對類方的處理方式,如以六味地黃丸做為主題詞,將六味地黃沖劑、六味地黃口服液、六味地黃湯、地黃丸均做為入口詞[11],此法使概念更簡潔、更利文獻聚類與檢索。
另一方面是因為缺乏統(tǒng)一的中草藥翻譯標準以及作者不規(guī)范翻譯,這在中國大陸研究人員身上表現(xiàn)得更加突出。中國研究人員不僅翻譯不規(guī)范甚至隨意、錯誤翻譯,易產(chǎn)生混淆(即同一中草藥有多種譯名或不同表達方式被認為是多種不同的藥物),以致相同主題文獻難以集中,對于提高中草藥在國外的認知度有一定影響,也不利于中草藥的推廣。雖然國內(nèi)有很多文獻論述方劑英譯的問題并探討相關對策,如朱薇等提出中藥方劑名稱英譯應遵循統(tǒng)一性、準確性和簡潔性原則[12],但未受到中草藥研究人員的重視與接受,推進緩慢,始終未有統(tǒng)一規(guī)范或標準,各種亂象未能得到有效的糾正。目前還是需要盡快制定翻譯標準特別是經(jīng)方的翻譯標準,促進規(guī)范用詞,提高國際上對中草藥的認知度。我國中草藥研究人員在發(fā)文之前也應了解已有研究的相關翻譯或通過MeSH(SCRs)進行查詢,以掌握術語的使用情況,運用已有的術語合理地翻譯自己的文獻,盡量保證相關主題概念的一致性,這樣才有利于提高同一中草藥的關注度及形成規(guī)模研究。此外,可在文獻翻譯中附上拉丁文的翻譯以提高文獻的檢出率和研究成果的國際影響,與目前的一些研究銜接與融合。
鑒于中草藥相關增補概念存在的問題不可能在短時間內(nèi)得到糾正,研究人員在利用PubMed檢索中草藥文獻時應注意同一中草藥的多種譯名,采用適當?shù)臋z索策略,如根據(jù)實際情況合理利用增補概念、增補概念的同義詞聚類功能等。如檢索四物湯相關文獻,考慮到samultang(3篇)、shimotsu-to(22篇)、si-wu decoction(13篇)、si-wu-tang(51篇) 4種不同表達方式,使用檢索式“samultang OR shimotsu-to OR si-wu decoction OR si-wu-tang”,檢出83篇;若再加上自由詞siwutang、siwu decoction、siwu tang使用檢索式“samultang OR shimotsu-to OR si-wu decoction OR si-wu-tang OR siwutang OR siwu decoction OR siwu tang”,則檢出129篇。所以,研究人員應關注中草藥術語狀態(tài),以全面了解不同國家與地區(qū)研究的現(xiàn)狀。