孫淑萍 孫玉坤
〔摘 要〕利用維普資訊——中文科技期刊數據庫、美國國立醫(yī)學圖書館的pubmed系統(tǒng),對醫(yī)學文獻中信號通路的檢索方法及應注意的問題進行論述,探討其對醫(yī)學科技查新的影響。
〔關鍵詞〕科技查新;數據庫;信號通路;檢索方法;查全率;查準率
近年來研究發(fā)現,信號轉導通路幾乎參與所有的細胞生命活動,包括細胞代謝、分裂、分化、凋亡等。異常的信號轉導通路在腫瘤細胞的增殖和分化過程中起著重要的調節(jié)作用。分析異常的信號通路,將對癌癥的機理研究提供有益的指導作用。下面以“維普資訊——中文科技期刊數據庫——鏡像站”、“美國國立醫(yī)學圖書館的pubmed系統(tǒng)”為例,就科技項目查新檢索工作中,磷脂酰肌醇-3-激酶/絲蘇氨酸蛋白激酶(PI3K/Akt) 信號通路的檢索方法及應注意的問題,談一些認識和經驗。
1 維普資訊——中文科技期刊數據庫
在諸多的信號轉導途徑中,磷脂酰肌醇-3-激酶/絲蘇氨酸蛋白激酶(PI3K/Akt)通路被認為是癌細胞存活的首要通路,參與細胞生長、增殖、凋亡及遷移的多個過程,有望成為腫瘤治療的新靶點。但磷脂酰肌醇-3-激酶/絲蘇氨酸蛋白激酶(PI3K/Akt)檢索詞全稱過長,且詞中含有“-”和“/”等特殊符號,檢索起來比較困難,很容易造成漏檢。檢索人員在檢索PI3K/Akt時,分別采用幾種不同檢索詞和書寫方式進行檢索,詳見檢索結果對照表,見表1。表1 任意字段PI3K/Akt的不同檢索詞及書寫方式的
結果比較(1989-2012,9月)
序號檢 索 詞命中篇數①磷脂酰肌醇-3-激酶/絲蘇氨酸蛋白激酶152②磷脂酰肌醇3激酶*絲氨酸*蘇氨酸*蛋白激酶11③磷脂酰肌醇?激酶*絲氨酸*蘇氨酸*蛋白激酶11④磷脂酰肌醇3激酶*絲蘇氨酸蛋白激酶8⑤PI3K/Akt381
檢索結果分析:檢索式①命中的152篇文獻,經將檢索式展開,全都是以磷脂酰肌醇命中的文獻,與PI3K/Akt不相關,顯然是錯誤檢索。后發(fā)現維普資訊——中文科技期刊數據庫不識別“-”的半角符號輸入方式,而默認“—”的全角符號輸入方式。檢索式②③④將磷脂酰肌醇-3-激酶/絲蘇氨酸蛋白激酶檢索詞拆分,運用邏輯運算符“*”進行檢索,雖檢索到磷脂酰肌醇3激酶/絲蘇氨酸蛋白激酶的文獻,但相對文獻較少,查全率低。檢索式⑤命中381篇文獻,全部是PI3K/Akt的文獻。
在醫(yī)學文獻中,很多詞都有全稱和縮寫兩種書寫形式。從表1中可以看出,縮寫詞在文獻檢索中起至關重要的作用,忽略縮寫詞,將漏檢很多文獻。尤其是在檢索磷脂酰肌醇—3—激酶/絲蘇氨酸蛋白激酶(PI3K/Akt)這類檢索詞過長,且詞中含有“-”和“/”等特殊符號時,應盡可能選擇檢索式⑤的縮寫詞進行檢索,避免漏檢,提高查全率。
2 美國國立醫(yī)學圖書館的pubmed系統(tǒng)
等進行檢索,均命中6 304篇文獻,全部是PI3K/Akt的文獻。以英文檢索詞進行檢索,檢索式⑤⑥⑦分別命中558、37、518篇文獻,雖檢索到PI3K/Akt的文獻,但相對文獻較少,查全率低。采用邏輯符“AND”的分欄式檢索詞輸入方法,即2個檢索框進行檢索,分別命中1 611篇和2 197篇文獻,檢索式⑧⑨為檢索后系統(tǒng)給出的檢索表達式,除命中PI3K/Akt的文獻外,還命中PI3K/Akt拆分的文獻。
從表2中可以看出,在檢索磷脂酰肌醇-3-激酶/絲蘇氨酸蛋白激酶(PI3K/Akt)這類比較長的檢索詞時,盡量不選擇該信號通路的英文詞進行檢索,以防造成不必要的漏檢。而應選擇該信號通路縮寫詞的不同書寫方式進行檢索,也就是檢索式②③④中的任何一種檢索式,均能提高查全率和查準率。
3 醫(yī)學文獻信號通路的網絡信息資源
互聯網是世界上最大的信息資源網,利用網上資源是獲取有用信息的最快、最有效的途徑。近年來,與信號通路有關的研究正如火如茶,搜集、整理與信號通路有關的信息,對于全面理解生物進行復雜調控機制具有重要意義。但是面對浩如煙海的信息資源,要從中快速、準確地查找出所需的信息,并非易事。下面介紹比較常見的與信號通路密切相關的數據庫。
存放信號通路的數據庫:
《科學》(Science)是美國科學促進會(AAAS)出版的一份學術雜志。信號轉導知識環(huán)境 (stke.sciencemag.org)是一個為研究細胞如何用化學信號相互“交流”提供的一個中心電子信息源。這個生物科學信息網絡對了解從胚胎發(fā)育到癌癥的幾乎全部生物學問題必不可少。STKE提供綜述文章、研究評述、實驗規(guī)程、以及連接圖(Connections Maps)等,該網站的內容被Medline索引[2]3.2 Signaling Gateway(http:∥www.signaling-gateway.org/) Signaling Gateways是加州大學圣地亞哥分校自然信令網關的分子頁面(http:∥www.signaling-gateway.org/molecule)數據庫,提供了超過4000蛋白質參與細胞信號,以及專家撰寫的評論,高度結構化的數據,包括蛋白質相互作用等,這里介紹的信息和數據是免費提供給所有者[3]。
3.3 KEGGIsl(www.genome.jp/kegg)
KEGG(Kyoto Encyclopedia of Genes and Genomes)數據庫是由日本京都大學生物信息中心開發(fā)的,是一個在網絡水平和分子水平系統(tǒng)研究基因功能的數據庫。KEGG數據庫的主要組成部分是各種調控通路的圖表。KEGG數據庫主要以通路的形式儲存關于基因組,生物化學、分子以及細胞生物學的一些研究,并且體現在分子水平或者基因水平的調控關系。另外,KEGG也儲存了大量物種的基因目錄以及全基因組序列信息。這個數據庫每日更新并且是開源的
3.4 Biocarta(http:∥www.biocarta.comD)
BioCarta數據庫是一家生物技術公司它在其公共網站上提供了用于繪制生物學通路的模板??梢杂脕硌芯糠肿踊プ麝P系、富集分析、通路為基礎的研究等。它還提供了包括12萬多個多物種的基因信息的重要資源。Biocarta的主要特點在于它是一個開源的在線平臺,科研工作者可以在線上自主交流,自行繪制所涉及的通路。在Biocarta的通路頁面,基因間的相互關系也以生動的圖表表示出來。與KEGG不同的是,Biocarta以信號轉導通路占主要部分[4]。
綜上所述,在維普資訊——中文科技期刊數據庫、美國國立醫(yī)學圖書館的pubmed系統(tǒng)中,在檢索有關醫(yī)學文獻信號轉導通路時,我們必需考慮該信號通路檢索詞的全稱、簡稱、英文名稱、縮寫詞、特殊符號、希臘字母等不同的書寫方式以及各數據庫默認的檢索表達式,盡量避免漏減,提高查全率。同時還可以利用網上信息資源,獲取與信號通路有關的醫(yī)學文獻。
參考文獻
[1]王立榮.信號通路相關文獻挖掘與分析方法[D].2007-中國科學技術大學:生物醫(yī)學工程 博士學位論文 萬方數據庫
[2]www.labbase.net/News/…5724B3A.html[EB].2009-12-07.
[3]www.signaling-gateway.Org[EB].
[4]王瓊萍.通路分析與調控網絡的分析[EB].www.xumurc.com/main/showNews-9656.html,2012-06-13.
(本文責任編輯:孫國雷)