王丹丹
科技論文關(guān)鍵詞使用中存在的問(wèn)題及解決方法
王丹丹
科研工作者在做項(xiàng)目研究或撰寫(xiě)科技論文時(shí),都會(huì)遇到如何確定關(guān)鍵詞的問(wèn)題。例如,若想在檢索系統(tǒng)中搜索相關(guān)課題材料時(shí),首先需要解決的就是分析課題的主題內(nèi)容,確定規(guī)范、通用、能表達(dá)核心概念的關(guān)鍵詞,關(guān)鍵詞確定得當(dāng)與否關(guān)系到檢索結(jié)果的全面性和準(zhǔn)確性。撰寫(xiě)科技論文時(shí),能夠準(zhǔn)確地確定關(guān)鍵詞可以提高論文的被檢率。然而,筆者通過(guò)調(diào)查水利、農(nóng)業(yè)、醫(yī)學(xué)、化學(xué)、電子工程、生命科學(xué)和機(jī)械制造7個(gè)專(zhuān)業(yè)的84位科研人員,發(fā)現(xiàn)占被調(diào)查者67%的高級(jí)職稱的科研人員都比較了解本專(zhuān)業(yè)的敘詞表或?qū)I(yè)名詞表,知道如何去使用這些主題標(biāo)引工具;但其中只有32.1%的高職稱人員表示在確定關(guān)鍵詞時(shí)會(huì)查閱敘詞表或?qū)I(yè)名詞表。而占被調(diào)查者33%的中級(jí)職稱人員之中只有14.3%的科研工作者了解主題標(biāo)引工具,并使用這些工具確定關(guān)鍵詞。所以,總體計(jì)算之后,只有26.2%的被調(diào)查者會(huì)使用受控標(biāo)引方式來(lái)處理關(guān)鍵詞確定問(wèn)題,那么余下的73.8%的科研人員在確定關(guān)鍵詞時(shí)都會(huì)遇到困難或出現(xiàn)各種問(wèn)題以及錯(cuò)誤。
筆者通過(guò)調(diào)查中國(guó)期刊網(wǎng)(CNKI)上的7個(gè)專(zhuān)業(yè)的210篇文章,發(fā)現(xiàn)了以下三個(gè)普遍存在的問(wèn)題。[1]
(一)主題標(biāo)引不夠深入,關(guān)鍵詞外延過(guò)于寬泛
對(duì)于科技論文的檢索者而言,首先,他們希望有效地提高查全率,因?yàn)樯钊胙芯磕骋徽n題時(shí),積累大量的相關(guān)主題文獻(xiàn)是必要的。然而,由于一部分科技論文的撰寫(xiě)者在確定關(guān)鍵詞時(shí),僅對(duì)表達(dá)論文基本主題內(nèi)容的檢索點(diǎn)進(jìn)行了揭示,而忽略了論文中某些組成部分里具有重要檢索價(jià)值的細(xì)小主題概念,所以檢索者如果使用關(guān)鍵詞為限定檢索字段,以細(xì)化專(zhuān)深的主題概念進(jìn)行檢索,則會(huì)漏檢。
因此,為了能夠提高論文的被利用率,科技論文的撰寫(xiě)者在確定關(guān)鍵詞時(shí),應(yīng)認(rèn)真分析論文構(gòu)成單元中所包含的各種主題概念,將那些能夠揭示論文主題又具有重要檢索價(jià)值的詞條逐一加以標(biāo)引和揭示。但是在標(biāo)引過(guò)程中也要注意不能過(guò)度標(biāo)引,因?yàn)槿绻麑⒁恍┪恼轮姓撌龅幕厮菪詢?nèi)容的主題概念提煉為關(guān)鍵詞,將造成檢準(zhǔn)率的降低,此外,在分析主題概念時(shí)應(yīng)注意將表述的字面意思轉(zhuǎn)換為專(zhuān)業(yè)化的隱性概念,以使檢索系統(tǒng)能夠在統(tǒng)一的專(zhuān)業(yè)概念之下有序地集合與組織各種從不同角度論述同一主題的論文資源。如在《奶制品中三聚氰胺含量檢測(cè)的方法》與《辣椒制品中蘇丹紅含量檢測(cè)的方法》兩篇文章中,都隱含著一個(gè)共同的主題,即食品安全。因此,準(zhǔn)確地提煉出字面含義之外的隱含概念,并將其確定為關(guān)鍵詞,對(duì)于檢索者把握某一領(lǐng)域的整體情況是具有重要意義的,而且還可以大大縮短檢索時(shí)間和檢索成本。
(二)關(guān)鍵詞之間的關(guān)系以及內(nèi)涵表述不清
以“病毒對(duì)體弱兒童的侵襲原理分析”為例,若擬定“病毒”作關(guān)鍵詞,則計(jì)算機(jī)領(lǐng)域里的科研人員也有可能誤檢到這篇文章。所以針對(duì)這種情況,不同學(xué)科專(zhuān)業(yè)的科技論文撰寫(xiě)者應(yīng)在關(guān)鍵詞項(xiàng),將一些容易誤解的詞匯或詞組用“限定詞”的方式,加以明確的說(shuō)明,如上述的例子就可以將其轉(zhuǎn)換為“病毒(醫(yī)學(xué))”的方式,這樣就可以避免內(nèi)涵表述不清的現(xiàn)象,提高論文檢索的查準(zhǔn)率。
現(xiàn)在,學(xué)科之間的交叉融合現(xiàn)象較多,而交叉領(lǐng)域里的科技論文數(shù)量也與日俱增,由于其科技含量高,所以對(duì)這類(lèi)論文的需求利用率也在逐漸攀升,然而對(duì)有關(guān)學(xué)科的關(guān)鍵詞確定時(shí),卻經(jīng)常出現(xiàn)字面分拆的現(xiàn)象,如在《生物制藥學(xué)里的不明成分檢測(cè)》一文中,如果作者將學(xué)科關(guān)鍵詞確定為“生物”和“制藥學(xué)”,那么當(dāng)檢索者使用這兩個(gè)詞查檢時(shí)就有可能誤檢到有關(guān)“制藥學(xué)中藥物成品的生物活體實(shí)驗(yàn)”的論文。從上述檢索案例中可以看到關(guān)鍵詞之間的關(guān)系需要用概念分解的方法加以表述,才能避免誤檢現(xiàn)象,因此,通過(guò)概念分析可知上例中的學(xué)科關(guān)鍵詞應(yīng)確定為“生物學(xué)”和“制藥學(xué)”。
(三)關(guān)鍵詞的組配結(jié)果具有二義性,易造成誤檢
以“工業(yè)酒精制造工藝的發(fā)展研究”為例,如果作者將關(guān)鍵詞定為“工業(yè)”“酒精”和“制造工藝”,那么當(dāng)查檢者使用“工業(yè)”和“酒精”在關(guān)鍵詞限定字段內(nèi)進(jìn)行檢索時(shí)就會(huì)同時(shí)將有關(guān)“酒精工業(yè)發(fā)展”方面的論文檢出,但是顯而易見(jiàn),酒精工業(yè)里的酒精是乙醇的成分,而工業(yè)用酒精的成分則是甲醇,二者有明顯區(qū)別,所以為了避免這種誤檢現(xiàn)象的發(fā)生,應(yīng)該使用不容易誤解的完整概念直接作關(guān)鍵詞,或是使用說(shuō)明語(yǔ)的方式,將其表述清楚,例如:上例中就可以直接使用“工業(yè)酒精”或“酒精,工業(yè)用”或“甲醇”作為關(guān)鍵詞。
(一)對(duì)于科研人員、編輯人員要加強(qiáng)主題標(biāo)引教育
教育活動(dòng)可以從不同角度分別展開(kāi)。首先,為了全面提高科技論文寫(xiě)作質(zhì)量以及科研論文的利用率,各高校從學(xué)生本科階段就應(yīng)當(dāng)開(kāi)設(shè)信息組織以及信息檢索課程,使他們?cè)趶氖驴蒲惺聵I(yè)或開(kāi)展科研活動(dòng)之前,就能夠詳細(xì)地了解各種分類(lèi)體系以及主題標(biāo)引工具;通過(guò)大量實(shí)踐使他們具備扎實(shí)的分類(lèi)基礎(chǔ)和較強(qiáng)的主題標(biāo)引能力,并掌握利用多種綜合性或?qū)I(yè)性數(shù)據(jù)庫(kù)的方法,從根本上解決科研論文寫(xiě)作不規(guī)范的問(wèn)題,當(dāng)然,關(guān)鍵詞的確定問(wèn)題也就迎刃而解了。
其次,對(duì)于那些已經(jīng)開(kāi)展科研工作的學(xué)者而言,應(yīng)該尋求一定的途徑使之了解使用規(guī)范敘詞的重要性,盡量避免使用自由標(biāo)引的方式。然而,如何指導(dǎo)這類(lèi)人群學(xué)會(huì)使用詞表或相關(guān)工具為文章確定檢索標(biāo)志?筆者認(rèn)為最有效的教育應(yīng)該由各專(zhuān)業(yè)領(lǐng)域里的核心期刊編輯部共同完成。目前,各高校以及科研院所在評(píng)定科研人員等級(jí)或發(fā)放科研獎(jiǎng)勵(lì)時(shí),都普遍重視SCI來(lái)源期刊、EI來(lái)源期刊、中文核心期刊、CSCD來(lái)源期刊、CSSCI來(lái)源期刊發(fā)文,所以科研人員都在積極地按照各來(lái)源期刊的《征稿簡(jiǎn)則》,撰寫(xiě)符合期刊格式要求和內(nèi)容要求的文章并投稿,所以如果各刊都能在《征稿簡(jiǎn)則》里規(guī)定“作者需按照某專(zhuān)業(yè)敘詞表或使用某工具轉(zhuǎn)換自然語(yǔ)詞為規(guī)范敘詞,如不轉(zhuǎn)換,稿件不予錄用”,那么這些科研人員必定會(huì)嚴(yán)格按照要求自學(xué)敘詞表等工具的使用方法。此外,各專(zhuān)業(yè)的核心期刊也可以共同推舉一位資深編輯,詳細(xì)地講解關(guān)鍵詞的確定方法和注意事項(xiàng),并將此類(lèi)講解刊登在學(xué)術(shù)期刊上,或形成教學(xué)錄像,放置于各專(zhuān)業(yè)領(lǐng)域里的知名網(wǎng)站上,或整合各專(zhuān)業(yè)的講解內(nèi)容集中放置于CNKI、萬(wàn)方、維普、龍?jiān)椿駽ALIS等綜合性文獻(xiàn)數(shù)據(jù)庫(kù)中,以供科研人員根據(jù)自己專(zhuān)業(yè)領(lǐng)域的特點(diǎn)進(jìn)行選擇性學(xué)習(xí)。這種強(qiáng)制性的方式可以迅速地指引科研人員通過(guò)恰當(dāng)?shù)耐緩綄W(xué)會(huì)如何做好主題標(biāo)引。
最后,對(duì)專(zhuān)業(yè)期刊的編輯也要進(jìn)行必要的崗前培訓(xùn)。目前的各個(gè)學(xué)刊在招聘編輯時(shí),大多只考慮專(zhuān)業(yè)背景和學(xué)歷要求、是否有能力編校加工專(zhuān)業(yè)稿件,而較少考慮應(yīng)聘人員的分類(lèi)、主題標(biāo)引能力。例如一些科技期刊的編輯人員就分別來(lái)自于物理、數(shù)學(xué)、化學(xué)等專(zhuān)業(yè),而沒(méi)有一個(gè)是來(lái)自于圖書(shū)、情報(bào)、檔案專(zhuān)業(yè)或編輯出版學(xué)專(zhuān)業(yè)的。從專(zhuān)業(yè)素養(yǎng)的角度而言,后者的審稿能力較強(qiáng),然而就標(biāo)引能力而言,則大多不了解分類(lèi)以及主題標(biāo)引的相關(guān)規(guī)則以及工具。所以,為了提高各刊稿件的標(biāo)引質(zhì)量,編輯人員進(jìn)入崗位之前,應(yīng)該到圖書(shū)館的編目部門(mén)參加一段時(shí)間的編目工作實(shí)際訓(xùn)練,以便掌握各種標(biāo)引工具的使用方法。如果沒(méi)有條件進(jìn)行此類(lèi)實(shí)訓(xùn),也要通過(guò)社內(nèi)“一帶一”的方式,使這些新進(jìn)編輯在老編輯的教導(dǎo)下,迅速了解本刊的主題標(biāo)引規(guī)則或方法。
(二)編輯以及檢索系統(tǒng)應(yīng)逐層、深入地加工關(guān)鍵詞項(xiàng)
以上的分類(lèi)、主題、檢索的普及性教育以及強(qiáng)制性的征稿規(guī)范,可以在很大程度上幫助潛在或顯在的科研人員學(xué)會(huì)正確的主題標(biāo)引規(guī)則,然而,畢竟在確定敘詞時(shí)可能會(huì)出現(xiàn)選詞錯(cuò)誤、詞間關(guān)系處理不恰當(dāng)、某些基本主題因素缺失等現(xiàn)象。所以,編輯首先應(yīng)嚴(yán)格依照綜合性敘詞表或?qū)I(yè)性敘詞表以及相關(guān)的科技名詞規(guī)范,對(duì)作者所提供的中英文關(guān)鍵詞項(xiàng)進(jìn)行核對(duì),并給出修改意見(jiàn)。
其次,檢索系統(tǒng)應(yīng)在錄入科技論文時(shí),對(duì)期刊社編輯加工過(guò)的關(guān)鍵詞進(jìn)行更深入的加工。因?yàn)榇蠖鄼C(jī)檢系統(tǒng)是按照后組式方式進(jìn)行主題標(biāo)引的,所以組配時(shí)可能會(huì)出現(xiàn)并列主題因素的錯(cuò)誤組合,如在《中國(guó)鍛鋼制動(dòng)盤(pán)和美國(guó)粉末冶金閘片的研制工作綜述》一文中,如果簡(jiǎn)單地將“鍛鋼制動(dòng)盤(pán)”“中國(guó)”“粉末冶金閘片”“美國(guó)”直接作為關(guān)鍵詞輸入機(jī)檢文檔,那么該文獻(xiàn)除了可以以“鍛鋼制動(dòng)盤(pán)—中國(guó)”“粉末冶金閘片—美國(guó)”檢出外,還可以以“鍛鋼制動(dòng)盤(pán)—美國(guó)”“粉末冶金閘片—中國(guó)”檢出。后者是該文獻(xiàn)內(nèi)容里所沒(méi)有的虛假信息。因此,在輸入多主題文獻(xiàn)里表示不同成分的關(guān)鍵詞時(shí),可以在相應(yīng)的檢索標(biāo)志之后加聯(lián)號(hào),[2]以表示不同成分之間的關(guān)系,如果以數(shù)字1、2為聯(lián)符,則該文獻(xiàn)可以標(biāo)引為“鍛鋼制動(dòng)盤(pán)1”“中國(guó)1”“粉末冶金閘片2”“美國(guó)2”。這樣就可以根據(jù)聯(lián)號(hào),將有關(guān)文獻(xiàn)檢出,排除多主題因素的虛假組配可能。
此外,檢索系統(tǒng)還可以通過(guò)加職號(hào)的方式對(duì)關(guān)鍵詞進(jìn)行深入加工。職號(hào)可以使主題標(biāo)志的關(guān)系更清晰,因?yàn)榧尤肼毮芊?hào)之后,文獻(xiàn)主題標(biāo)志中的施動(dòng)者、動(dòng)作對(duì)象、部分、性質(zhì)以及操作因素就可以用“E、A、B、C、D”5個(gè)字母確定下來(lái),避免誤檢現(xiàn)象發(fā)生。[3]例如,在《成纖維細(xì)胞激活蛋白對(duì)卵巢癌細(xì)胞增殖、遷徙和侵襲的影響》一文中,主題標(biāo)志里的“成纖維細(xì)胞激活蛋白”是施動(dòng)者,“卵巢癌細(xì)胞”是動(dòng)作對(duì)象,“影響”是與主體因素密切聯(lián)系但沒(méi)有獨(dú)立檢索意義的通用因素,即操作因素。如果在后組式檢索系統(tǒng)中簡(jiǎn)單地使用“成纖維細(xì)胞激活蛋白”“卵巢癌細(xì)胞”“影響”三個(gè)主題詞進(jìn)行標(biāo)引,檢索時(shí),就有可能檢出“成纖維細(xì)胞激活蛋白對(duì)卵巢癌細(xì)胞的影響”和“卵巢癌細(xì)胞對(duì)成纖維細(xì)胞激活蛋白的影響”兩種文獻(xiàn)。所以在將論文輸入檢索系統(tǒng)時(shí),最好可以對(duì)上述三個(gè)主題詞進(jìn)行深入加工,即將其標(biāo)引為:成纖維細(xì)胞激活蛋白E、卵巢癌細(xì)胞A、影響D。這樣在檢索時(shí)就可以避免因?yàn)檫壿嬯P(guān)系錯(cuò)誤而造成的誤檢。雖然這種方法會(huì)增加檢索系統(tǒng)工作人員的標(biāo)引難度,但是如果能有效地使用,將會(huì)提高系統(tǒng)的檢準(zhǔn)率,幫助檢索用戶節(jié)省排除非相關(guān)結(jié)果的時(shí)間。
通過(guò)各種方式、方法提高科研工作人員受控主題標(biāo)引的能力,培養(yǎng)他們規(guī)范主題標(biāo)引活動(dòng)的意識(shí),對(duì)于信息檢索系統(tǒng)按照關(guān)鍵詞項(xiàng)有效組織與聚類(lèi)相似主題文獻(xiàn)具有重要意義,同時(shí),規(guī)范的主題標(biāo)引也有利于提高論文的檢全率或檢準(zhǔn)率。一些科研工作者知道使用綜合性、專(zhuān)業(yè)性敘詞表的益處,但有時(shí)也是迫于沒(méi)有途徑獲取這些主題詞表,而無(wú)法使用做主題標(biāo)引。畢竟高校圖書(shū)館對(duì)于《漢語(yǔ)主題詞表》《中國(guó)分類(lèi)主題詞表》《社會(huì)科學(xué)檢索詞表》以及一些專(zhuān)業(yè)敘詞表的藏書(shū)復(fù)本量較少,所以相對(duì)于數(shù)量頗多的科研工作者而言,它們的作用顯得很??;而且印刷版體積大,也不方便使用,相應(yīng)的電子版則收費(fèi)較多,不利于這些工具的廣泛普及,所以建議國(guó)內(nèi)的這些主題詞表能夠像美國(guó)的《醫(yī)學(xué)標(biāo)題表》(MeSH)一樣進(jìn)入公共領(lǐng)域,免費(fèi)提供下載,以鼓勵(lì)廣大科研人員積極地使用。
[2][3]馬張華.信息組織[M].北京:清華大學(xué)出版社,2008:263-264.
(作者單位:黑龍江大學(xué)信息管理學(xué)院)
方.中國(guó)學(xué)術(shù)期刊
總庫(kù)[DB/OL].(2011-09-01) http://www.cnki.net,2011-09-01.