張 敏
(河南職業(yè)技術(shù)學(xué)院圖書(shū)館,河南 鄭州 450046)
隨著期刊電子化的發(fā)展,期刊全文數(shù)據(jù)庫(kù)的發(fā)展也越來(lái)越快。對(duì)各高校圖書(shū)館而言,電子期刊在采購(gòu)中所占的比重正逐年遞增。如何深入地了解、分析并掌握目前我國(guó)比較有代表性的全文數(shù)據(jù)庫(kù)的特點(diǎn),并對(duì)其進(jìn)行更好地開(kāi)發(fā)和利用,直接決定了高校圖書(shū)館信息服務(wù)水平的高低。
中國(guó)期刊全文網(wǎng)(簡(jiǎn)稱(chēng)“CNKI”)是由清華同方光盤(pán)股份有限公司、光盤(pán)國(guó)家工程研究中心和中國(guó)學(xué)術(shù)期刊(光盤(pán)版)電子雜志社共同研制出版的綜合性全文數(shù)據(jù)庫(kù)。創(chuàng)建于1994年,1996年12月正式發(fā)行,是我國(guó)第一個(gè)連續(xù)出版的大型集成化學(xué)術(shù)期刊全文數(shù)據(jù)庫(kù)。通過(guò)建立鏡像站點(diǎn)、互聯(lián)網(wǎng)遠(yuǎn)程訪問(wèn)(包庫(kù))等方式提供服務(wù)?!?】
中文科技期刊數(shù)據(jù)庫(kù)(簡(jiǎn)稱(chēng)“維普”)由科技部西南信息中心主辦,重慶資訊有限公司制作,收錄了1989年以來(lái)的文獻(xiàn)資料,2001年正式出版發(fā)行。其前身為《中文科技期刊篇名數(shù)據(jù)庫(kù)》,是目前我國(guó)收錄期刊最全的綜合性全文期刊文獻(xiàn)數(shù)據(jù)庫(kù)?!?】
萬(wàn)方數(shù)據(jù)資源系統(tǒng)數(shù)字化期刊(簡(jiǎn)稱(chēng)“萬(wàn)方”)是萬(wàn)方數(shù)據(jù)庫(kù)資源系統(tǒng)三大組成部分之一,由中國(guó)科技信息研究所屬下的北京萬(wàn)方數(shù)據(jù)股份有限公司創(chuàng)辦。它是國(guó)家“九五”重點(diǎn)科技攻關(guān)項(xiàng)目“科技期刊網(wǎng)絡(luò)服務(wù)系統(tǒng)”的組成部分,由萬(wàn)方數(shù)據(jù)網(wǎng)絡(luò)中心具體運(yùn)行。【3】2001年年底數(shù)字化期刊便囊括了我國(guó)所有科技學(xué)術(shù)期刊。
能夠評(píng)價(jià)數(shù)據(jù)庫(kù)資源豐富程度的指標(biāo)有很多,比如收錄期刊的數(shù)量和回溯時(shí)間、覆蓋范圍,它們反映了數(shù)據(jù)庫(kù)的權(quán)威性、完整性,在一定程度上決定著檢索結(jié)果的優(yōu)劣。此外,核心刊的比率代表著數(shù)據(jù)庫(kù)的質(zhì)量,而更新率則體現(xiàn)其收錄文獻(xiàn)的新穎性和及時(shí)性,更新速度越快,時(shí)效性就越高。一般論文發(fā)表在1-2年內(nèi)達(dá)到引文峰值階段,而收錄過(guò)程中造成的時(shí)差則嚴(yán)重影響了文獻(xiàn)資源利用時(shí)效性。在此我們就三種數(shù)據(jù)庫(kù)的上述指標(biāo)進(jìn)行比較(見(jiàn)表1)。
表1 三種全文數(shù)據(jù)庫(kù)的基本情況
比較顯示,以全面為特色的維普幾乎涵蓋全部國(guó)內(nèi)中文出版物,包括具有一定影響且連續(xù)性的非正式發(fā)行刊物。它偏重于地方性期刊和研究方面的論文,內(nèi)容以自然科學(xué)和工程技術(shù)為主(期刊量比“CNKI”多出近50%),但在文史哲方面則幾乎是空白。收錄時(shí)間長(zhǎng),最早可回溯到1989年,較適合用戶(hù)進(jìn)行回溯性檢索,如追溯某一事物發(fā)展脈絡(luò)、某一學(xué)科研究發(fā)展歷程、或以收集資料的豐富性和完整性為檢索目標(biāo)的文獻(xiàn),而以精為特點(diǎn)的CNKI,則重點(diǎn)收錄科學(xué)領(lǐng)域的核心期刊和具有專(zhuān)業(yè)特色的中西文期刊,以及在線工具書(shū)、年鑒、報(bào)紙、標(biāo)準(zhǔn)、專(zhuān)利等豐富的資源,因其更新速度快,更適合用戶(hù)進(jìn)行查新,從事課題跟蹤、定題服務(wù)性質(zhì)的文獻(xiàn)檢索。萬(wàn)方重點(diǎn)收錄科技部論文統(tǒng)計(jì)源的核心期刊,雖然在這三個(gè)庫(kù)中收錄的最少,但核心期刊的比例高,收錄文獻(xiàn)質(zhì)量最高。除期刊外,還有會(huì)議論文、博碩士學(xué)位論文、中外標(biāo)準(zhǔn)、專(zhuān)利及國(guó)內(nèi)科技成果等,類(lèi)型豐富,內(nèi)容以科技信息為主,兼顧人文社會(huì)科學(xué),適合工科或理工科院校使用?!?】
對(duì)于三大數(shù)據(jù)庫(kù)自身特點(diǎn)、收錄范圍及學(xué)科類(lèi)型的差別,我們通過(guò)檢索實(shí)例來(lái)證明一下。在設(shè)定相同檢索入口及限定條件的情況下,分別選擇“題名”、“關(guān)鍵詞”、“著者”和“分類(lèi)”等四個(gè)檢索入口進(jìn)行檢索,得出相應(yīng)的結(jié)果(見(jiàn)表2)。
表2 檢索結(jié)果數(shù)量統(tǒng)計(jì)表
以著者字段的檢索為例,錢(qián)學(xué)森教授是從事物理研究的,他所發(fā)表的論文是科技方面的,在上表中“CNKI”收錄了12篇,“萬(wàn)方”收錄了11篇,而“VIP”收錄了30篇;張靖龍教授是從事文學(xué)研究的,在上表中“CNKI”收錄了22篇,“萬(wàn)方”收錄了2篇,“VIP”收錄了5篇。從這個(gè)對(duì)比中可以看出,三個(gè)數(shù)據(jù)庫(kù)中綜合性最強(qiáng)的是“CNKI”,收錄理工科科技信息文獻(xiàn)最多的是“VIP”。[5]
此外,值得一提的是,三種全文數(shù)據(jù)庫(kù)所收錄的期刊幾乎囊括了國(guó)內(nèi)的核心期刊,出現(xiàn)重復(fù)不可避免。通過(guò)比較“CNKI”和“維普”收錄期刊名錄,得知兩數(shù)據(jù)庫(kù)期刊收錄重復(fù)率約為50%,說(shuō)明兩數(shù)據(jù)庫(kù)互補(bǔ)性很強(qiáng),相互不可替代。而“萬(wàn)方”收錄期刊與這兩個(gè)數(shù)據(jù)庫(kù)的重復(fù)率較高,在80%以上。【6】
數(shù)據(jù)庫(kù)檢索系統(tǒng)的好壞,是評(píng)價(jià)數(shù)據(jù)庫(kù)質(zhì)量高低的一個(gè)非常重要的指標(biāo)。上述三種全文數(shù)據(jù)庫(kù)的檢索系統(tǒng)在檢索方式、檢索入口、檢索技巧等方面各有不同(見(jiàn)表3)。
表3 檢索功能比較
三個(gè)全文數(shù)據(jù)庫(kù)都配備了強(qiáng)大的檢索系統(tǒng),提供了導(dǎo)航檢索、簡(jiǎn)單檢索和復(fù)合檢索等三種檢索方式,其中導(dǎo)航檢索都包括了期刊名稱(chēng)和學(xué)科分類(lèi)兩項(xiàng)功能,讀者不需要輸入具體的檢索詞,就可按照分類(lèi)或期刊名稱(chēng),通過(guò)層層遞進(jìn)的方式,檢索到某一專(zhuān)題下的論文,并按題錄鏈接瀏覽全文。檢索方法的使用可謂通俗易懂、操作簡(jiǎn)便。數(shù)據(jù)庫(kù)檢索選擇的范圍較為靈活,可以選擇一個(gè)或多個(gè)專(zhuān)輯進(jìn)行檢索,并且在同一專(zhuān)輯下,可選擇一個(gè)或多個(gè)專(zhuān)題進(jìn)行檢索。
三個(gè)數(shù)據(jù)庫(kù)都包括篇名、關(guān)鍵詞、文摘、刊名、作者、機(jī)構(gòu)6個(gè)檢索途徑,在主題、分類(lèi)、全文、引文及基金等檢索入口又各有特色,具體表現(xiàn)在以下幾方面:【7】
3.2.1 主題檢索
CNKI提供了主題檢索,在每個(gè)檢索入口提供了檢索詞字典,使用它可以規(guī)范所輸入的檢索詞匯,一個(gè)概念僅用一個(gè)規(guī)范化詞匯來(lái)表達(dá),避免了同義詞、多義詞等現(xiàn)象的出現(xiàn),使檢索更加規(guī)范便捷。隨著科學(xué)技術(shù)的突飛猛進(jìn),新學(xué)科、新技術(shù)層出不窮,當(dāng)主題詞表難以滿(mǎn)足文獻(xiàn)標(biāo)引工作的需要時(shí),關(guān)鍵詞檢索就不可或缺了。相對(duì)而言,維普更傾向于使用關(guān)鍵詞來(lái)做標(biāo)引,以精準(zhǔn)的揭示文獻(xiàn)主題,比較符合人們的檢索習(xí)慣,但由此卻增加了自由選詞、用詞的難度。為彌補(bǔ)這方面的不足,維普在主題標(biāo)引詞基礎(chǔ)上編制了同義詞詞庫(kù)及同名作者庫(kù),有助于相關(guān)文獻(xiàn)的查找提高查全率,或者是通過(guò)限定作者單位提高查準(zhǔn)率。
3.2.2 分類(lèi)檢索
關(guān)鍵詞只是概念的表現(xiàn)形式,不能從整體上反映文獻(xiàn)的內(nèi)容特征,缺少系統(tǒng)性地組織和梳理,也不能體現(xiàn)概念之間的等級(jí)和相關(guān)關(guān)系。而通過(guò)標(biāo)準(zhǔn)化的概念體系及知識(shí)等級(jí)結(jié)構(gòu),分類(lèi)檢索可使用戶(hù)“鳥(niǎo)瞰全局”,并借助相關(guān)的背景知識(shí)實(shí)現(xiàn)對(duì)所需信息的瀏覽、判斷、評(píng)價(jià)和定位?!?】維普、CNKI提供了分類(lèi)檢索。對(duì)于關(guān)鍵詞不規(guī)范的學(xué)科和領(lǐng)域,通過(guò)分類(lèi)號(hào)檢索,可有效彌補(bǔ)篇名、關(guān)鍵詞、文摘等檢索途徑的不足,以便提高文獻(xiàn)的查準(zhǔn)率。
3.2.3 全文檢索
“CNKI”提供了“全文檢索”,對(duì)應(yīng)于“VIP”的“任意字段檢索”。在對(duì)相同檢索詞進(jìn)行檢索時(shí)發(fā)現(xiàn),前者的命中率較高,在一定程度上彌補(bǔ)了主題標(biāo)引缺乏規(guī)范化所帶來(lái)的漏查,有利于提高文獻(xiàn)的查全率,但往往檢出的文獻(xiàn)太多,用戶(hù)難以挑選到合適的文章,該檢索方式適用于前沿性課題或文獻(xiàn)量較少的冷門(mén)課題檢索,“VIP”的“任意字段檢索”是在文章中除正文以外的其他任何部分進(jìn)行檢索,檢出率雖然低于全文檢索,但相對(duì)比較實(shí)用。【9,10】
3.2.4 基金檢索
基金論文是由國(guó)家各級(jí)政府部門(mén)、各類(lèi)基金組織和企事業(yè)單位提供科研經(jīng)費(fèi)而產(chǎn)生的科研論文,普遍具備方法先進(jìn)、學(xué)術(shù)水平高、研究深入等特點(diǎn),能較好地反映該學(xué)科的發(fā)展趨勢(shì)和動(dòng)態(tài)。通過(guò)“基金”途徑查找文獻(xiàn),可獲得某一課題連續(xù)性研究成果。維普、CNKI提供了“基金”檢索。
3.2.5 關(guān)鍵詞檢索
需要注意的是,三大數(shù)據(jù)庫(kù)雖都有關(guān)鍵詞檢索,但功能并不一樣:從數(shù)量上看,CNKI關(guān)鍵詞字段檢索出的文獻(xiàn),實(shí)際上涵蓋了篇名、關(guān)鍵詞及中文文摘三個(gè)字段中出現(xiàn)的該檢索詞的所有文獻(xiàn),也就是說(shuō)其檢索結(jié)果是篇名、關(guān)鍵詞及中文文摘三個(gè)字段結(jié)果的累積,其作用相當(dāng)于維普的“任意字段”;從質(zhì)量上看,CNKI是原文照錄方式,不再進(jìn)行二次加工和補(bǔ)充,而關(guān)鍵詞是由不了解標(biāo)引規(guī)則的作者給的,片面性、隨意性較大,標(biāo)引質(zhì)量難以保證。相比較而言,維普的質(zhì)量較高,因其同義詞庫(kù)是在參考、修改、補(bǔ)充原文作者給出關(guān)鍵詞的基礎(chǔ)上擬定的,經(jīng)過(guò)規(guī)范化加工,標(biāo)引深度得到較好的保證。
通過(guò)對(duì)萬(wàn)方、維普、CNKI三大全文庫(kù)的比較分析,從檢索功能上來(lái)看,三個(gè)數(shù)據(jù)庫(kù)瀏覽方式和檢索方式均呈現(xiàn)出多樣化的特點(diǎn),檢索字段廣、多、專(zhuān),檢索技術(shù)較為先進(jìn),對(duì)檢索結(jié)果的處理也比較全面。但由于各庫(kù)在收錄期刊時(shí),其側(cè)重點(diǎn)、期刊的數(shù)量、品質(zhì)又各自不同,為用戶(hù)的使用帶來(lái)了諸多的不便。個(gè)別時(shí)候用戶(hù)為了查詢(xún)某篇文章要在萬(wàn)方、維普、和CNKI三個(gè)數(shù)據(jù)庫(kù)中分別進(jìn)行查找,使文獻(xiàn)的檢索利用率大大地降低了。若是能把這三大全文數(shù)據(jù)庫(kù)資源整合起來(lái),建立統(tǒng)一的檢索平臺(tái)進(jìn)行瀏覽操作,則用戶(hù)在使用時(shí),既可以實(shí)現(xiàn)單庫(kù)檢索,又能夠?qū)崿F(xiàn)跨庫(kù)檢索,查找起來(lái)就更加便捷了。
[1]http://www.cnki.net.
[2]http://www.tydata.com.
[3]http://www.wanfangdata.com.cn.
[4]曹開(kāi)江.我國(guó)三大全文期刊數(shù)據(jù)庫(kù)醫(yī)學(xué)數(shù)據(jù)質(zhì)量的比較研究[J].圖書(shū)館理論與實(shí)踐,2008(3):25.
[5]韓紅,朱江,王樺等.清華同方(CNKI)與重慶維普(VIP)網(wǎng)絡(luò)版中文期刊全文數(shù)據(jù)庫(kù)的比較研究[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2003(6):62.
[6]陸一.同方、萬(wàn)方、維普全文期刊數(shù)據(jù)庫(kù)網(wǎng)上引文檢索的比較[J].中華醫(yī)學(xué)圖書(shū)情報(bào)雜志,2004(3):59-60.
[7]宋凌云.維普資訊網(wǎng)和萬(wàn)方數(shù)據(jù)資源系統(tǒng)的引文檢索之比較[J].黑龍江科技信息,2008(16):64.
[8]王平南,吳婭娜.國(guó)內(nèi)三大期刊全文數(shù)據(jù)庫(kù)優(yōu)勢(shì)與特色評(píng)述[J].圖書(shū)館,2008(5):89.
[9]陸一.同方、萬(wàn)方、維普全文期刊數(shù)據(jù)庫(kù)網(wǎng)上引文檢索的比較[J].中華醫(yī)學(xué)圖書(shū)情報(bào)雜志,2004(3):59-60.
[10]宋凌云.維普資訊網(wǎng)和萬(wàn)方數(shù)據(jù)資源系統(tǒng)的引文檢索之比較[J].黑龍江科技信息,2008(16):64.