鄢百其
(武漢科技大學圖書館,湖北武漢430081)
信息檢索策略優(yōu)化分析
鄢百其
(武漢科技大學圖書館,湖北武漢430081)
目前國內高校信息檢索課教學效果較好的方式是以檢索策略為主要內容的案例教學法,但其中還有一些待改進和完善之處。為此,筆者挑選了有代表性的教學案例和檢索示例進行剖析,探討檢索策略的優(yōu)化方法,如檢索概念的取舍、擴檢與縮檢的技巧、相關數據庫的優(yōu)選、檢索效果的分析等,以期為信息檢索課的教學提供參考,促進教學質量的提高,培養(yǎng)大學生的信息素養(yǎng)。
信息檢索課;案例教學;檢索策略;案例分析
信息檢索與利用課程(以下簡稱“信息檢索課”)是高校人才培養(yǎng)、素質教育的重要內容,目的是培養(yǎng)學生的信息獲取與利用能力及創(chuàng)新意識。這是一門綜合性和實踐性很強的課程,也是信息管理領域最具活力的分支學科。由于該課程具有較強的理論性和復雜的實踐性,其講授難度較大,要獲得好的教學效果實屬不易。隨著高校教學體系的改革,許多教師利用各種現代化教學手段,采用多種教學模式進行信息檢索課的教學改革探索,但實際效果并不理想,該課程在一些院校甚至呈現出萎縮之勢[1-3]。為了探討突圍之道,筆者以重慶維普中文科技期刊全文數據庫(以下簡稱“維普期刊庫”)為文獻源,系統收集了近年來國內期刊發(fā)表的有關信息檢索課的文章,以分析高校信息檢索教學中的不足,尋求改進、提高之策。
選用維普期刊庫(2010年6月20日),檢索年限為2007~2010年,用表達式“檢索*(課+教學)”對題名字段檢索,共命中文獻587篇,結果中的課程名稱分別為:信息檢索、信息檢索與利用、文獻檢索、文獻檢索與利用、文獻信息檢索、文獻信息檢索與利用、網絡信息檢索等。利用該數據庫系統基于單漢字索引的模糊檢索功能,便能用簡潔的檢索式達到高網羅度,從而獲得了較為全面的研究資料。
通過逐一瀏覽、篩選、閱讀大量的相關文獻得知,近些年高校有上百萬大學生學習信息檢索課程,其教學內容大多以計算機檢索為主,教學方式多種多樣,如:多媒體在線教學、學導式教學法、互動教學模式、5E(參與、探究、解釋、精制、評價)教學模式、PBL(以問題為基礎的學習)教學法、科研導入教學法、案例教學法,等等,在提高學生學習興趣和教學效率方面有一定的效果,但整體而言,在培養(yǎng)學生獲取與利用信息的能力方面并無明顯提高[1-4]。分析其中原因,卻是因為許多教師實踐經驗不足,信息檢索水平不高,不能科學、合理地構建檢索策略,不能全面、系統地傳授相關技能,因此影響了教學效果??v觀國內信息檢索課教材,信息檢索策略部分也是最薄弱的環(huán)節(jié)。由于高校大學生檢索技能的欠缺,直接影響了信息利用的效果和自身信息素質的提高。
信息檢索課的重點內容是檢索策略的傳授,這關系到學習者的實際動手能力。國外對檢索策略的研究較多,一些國家甚至從中小學就開始講授信息檢索方法,其高校也不時地舉辦以構建最佳檢索策略為目標的計算機信息檢索競賽[5]。在國內高校多年的教學探索實踐中,大家比較認可的是以檢索策略為主要內容的案例教學法,但其中許多還有待改進和完善,必須不斷地深入探討和研究。
信息檢索課的案例教學是以精選的檢索案例為基本素材,使學生進入特定的信息獲取、利用的情境中,運用檢索原理,通過主題分析,提出各種檢索方案,不斷優(yōu)化檢索策略,逐步掌握獲取、利用信息的技能。目前,在國內高校信息檢索案例教學中,檢索案例的選擇有很大的隨意性,檢索策略的調整、優(yōu)化也存在許多問題。由于案例的選擇、設計直接影響到案例教學的質量,因此,所用檢索案例應該有一定的難度、深度和代表性,能夠起到開闊眼界、啟發(fā)思路的效果。在案例教學中,重點是科學、合理地制定檢索策略,這通常不是追求一種正確答案(也難有唯一答案),而是注重引導學生積極思考、大膽質疑、勇于創(chuàng)新;在檢索策略的調整、優(yōu)化中,應遵循“沒有最好,只有更好”的理念,精益求精、力求完善;要以生動的案例分析、演示,激發(fā)學生的興趣,促進其理解消化、獲取經驗、掌握技巧。學生檢索技能和信息意識的明顯提高,才是良好教學效果的明證。
在上述檢索文獻中,通過對一些教學案例的分析、比較,挑選一個思路較清晰、效果較好的教學示范案例——“近視眼手術治療方面的研究成果”[6],在此展開討論。該文作者有一定的檢索經驗,采用了引文珠形增長策略,先使用課題中最專指的概念組面檢索,從多篇命中文獻記錄中選出相關詞,然后補充到提問式中再次檢索,多次重復上述過程,不斷挑選各種檢索詞、修改檢索式,最終查到了較多的相關文獻。本案例中使用的是清華同方的中國期刊全文數據庫(其檢索算符“邏輯與”稱“并且”,“邏輯或”為“或者”),最初采用的檢索提問式為“(題名=近視眼)并且(題名=手術)并且(題名=治療)”,命中27篇文獻。經過多次試檢、瀏覽、選詞,通過減少概念組面、簡化檢索詞、選用高專指度的縮寫詞(LASIK、LASEK、PRK)等方式,反復調整、優(yōu)化檢索策略,最后的檢索提問式為“(題名=近視)并且(題名=術)或者(題名 =LASIK+LASEK+PRK)”,檢索到文獻1 296篇。
這是一個頗具教學價值的典型案例,作者深入細致的主題分析、對引文珠形增長策略的熟練運用、檢索概念的取舍技巧等,給了學習者較大的啟發(fā),其清晰、生動的示范,便于激發(fā)學生的學習興趣,較快地理解和掌握基本檢索方法,從而取得較好的教學效果。
基于教學研討、切磋交流的目的,筆者將上述教學案例所演示的檢索策略作進一步分析,以探討檢索策略優(yōu)化技巧及教學中常見問題的處理。
(1)在檢索式中去掉“治療”一詞是“為了提高查全率和查準率”的說法不妥(這也是國內信息檢索教學中最常見的口誤)。由于查全率和查準率之間存在著一種“互逆”關系,高查全率和高查準率難以同時獲得。因此,在教學中的準確表述應為:在擬定檢索策略時,應根據實際需要,對信息檢索的查全率或查準率有所側重;就本課題而言,為了提高查全率,應該去掉“治療”這一概念組面。
(2)作者通過概念分析,將“手術”簡化為“術”,以便搜索各種關于“近視”的治療術(如準分子激光術、角膜磨鑲術、角膜切削術、角膜塑型術等)。然而,清華中國期刊庫沒有模糊檢索功能(檢索字段采用單漢字索引),它的主要字段是以詞索引為主,其所謂的模糊匹配,只不過是自動切分詞語檢索,并不具備真正意義上的模糊檢索功能;這時,“術”和“近視”的邏輯與組配檢索會產生大量的漏檢[7]。另外,有關“近視”的治療術也有不含“術”字樣的表述,如:飛秒激光、準分子激光、準分子激光不同切削、準分子激光表層切削、人工晶體植入、人工晶狀體植入,等等。因此,可以抽取“激光”、“植入”加入檢索式和“近視”進行邏輯與組配,然后另選用具備模糊檢索功能的相關數據庫(如維普期刊庫等)檢索,便可大幅提高查全率。
(3)上述教學案例選用的數據庫不太合適,其檢索策略的優(yōu)化必須借助于具備模糊檢索功能的數據庫才能達到理想的效果。因此,在教學中,要注重講解如何測試數據庫系統的檢索功能、判定數據庫的質量和索引方式,以便制定相應的檢索策略,保證好的效果。目前國內相關教學、咨詢人員中,極少有人掌握這些方法和技巧。
筆者以維普期刊庫為文獻源(2010年6月20日),全面搜索1995~2010年國內期刊發(fā)表的有關信息檢索策略(相關詞為檢索技巧)的文章,用表達式“檢索策略 +檢索技巧”對題名字段檢索,共命中文獻328篇。通過閱讀、分析收集的相關文獻了解到,國內有關信息檢索策略研究比較薄弱,并存在兩個偏向:一是名不副實,一些所謂討論檢索策略的文章,卻只是對數據庫系統檢索功能的一般性介紹,并不論述檢索策略構建的相關內容;二是紙上談兵,檢索原理、規(guī)則面面俱到,卻不涉及實際的檢索方法、技巧和案例,可操作性不強。能夠深入探討計算機檢索策略、傳授各種真正實用的檢索技巧的論文很少。
這里選擇其中水平較高的研究案例進行分析和討論。舉一個有代表性的檢索實例:“有關‘中國特大城市空氣污染’的課題,它的正確檢索式應為:(中國特大城市+北京+上海+廣州+重慶+武漢+天津+……)*(空氣污染+大氣污染+空氣質量+工業(yè)廢氣+一氧化硫+二氧化硫+一氧化碳+二氧化碳+灰霾+……)”[7]??梢钥闯?檢索者有相當的經驗,采用了“盡可能地簡化邏輯關系,減少概念組面數”的方式,努力選全表達同一概念組面的各檢索詞,盡力提高網羅度,以保障檢索效果;上式覆蓋面較廣,命中文獻較多,效果不錯。但是,若要進一步優(yōu)化檢索策略,還可以這樣分析和處理(選用維普期刊庫):
(1)上式僅用2個概念組面進行組配,較簡潔明了,但也有檢索詞因缺少范圍限制而產生誤檢,如有關二氧化硫對食物、土壤、河流污染的文獻也被誤檢命中。另外,檢索者為了減少概念組面數(可提高查全率),又使用了一些限制過嚴的詞語(中國特大城市、空氣污染、大氣污染、空氣質量、工業(yè)廢氣等),這也會影響檢索效果。例如,對“中國特大城市”一詞,應在概念分析、分解的基礎上再邏輯組配,網羅度更大;若用“中國特大城市”和“(中國+我國+全國+國內)*大城市”,同時對題名字段檢索對比,后者的命中量比前者高幾十倍;命中文獻中的“大城市”(該詞可檢索到:大城市、特大城市、超大城市等),基本上都是國內的特大城市。
(2)對本課題來說,為了提高相關詞選擇的效率,可試用高網羅度的單漢字進行邏輯組配:“市*氣*塵”(相互制約可限定主題范圍,保障查準率),再指定在題名字段進行模糊檢索,由此方便快捷地得知:“市”可查到城市、大城市、特大城市、超大城市、北京市、上海市、蘭州市、成都市……;“氣”可命中大氣、空氣、尾氣、煙氣、廢氣 ……;“塵”可檢索沙塵、浮塵、粉塵、煙塵、飄塵、揚塵、降塵……;試檢命中文獻大都比較切題。由此還發(fā)現了其他一些相關詞(其中“二氧化”可命中:二氧化硫、二氧化碳、二氧化氮……);另外,還可以省略組配后命中率太低的關鍵詞(一氧化硫、一氧化碳、灰霾……)。
(3)顯然,上式列出的16個關鍵詞是檢索者精選的,為了方便比較、說明問題,筆者也只選16個檢索詞來擬定檢索式,其結果如下:
(市+北京+上海+廣州+重慶+武漢+天津)*(大氣+空氣+尾氣)*(塵+污染+質量+顆粒+二氧化+氣溶膠)
式中,用盡可能簡短的概念詞“市、大氣、空氣、塵、污染、質量、顆粒……”來達到高網羅度,以取代各種相關檢索詞繁瑣的羅列,其包容、涵蓋更為全面,效果更佳。將此式和原檢索式同時對“題名或關鍵詞”字段檢索對比,優(yōu)化后的檢索策略效果更好(命中量增加3倍多),其查全率大幅提升,查準率也有所提高;所獲文獻中涉及的城市絕大部分是人口超過100萬的特大城市。
以上,從眾多相關文獻中挑選了2個頗具示范意義的教學案例和檢索示例,以解剖麻雀的方式,細致地討論了檢索策略的優(yōu)化方法,期望能達到舉一反三、觸類旁通的效果,能為信息檢索案例教學提供一定的參考借鑒。
[1]張英敏.高校文獻檢索課存在問題分析與對策研究[J].圖書館學刊 ,2008(4):101-102.
[2]張萍.吉林省高校文獻檢索課現狀分析及發(fā)展對策研究[J].現代情報,2009(4):142-146.
[3]文毅.對西部新院校文獻檢索課改革的幾點思考[J].農業(yè)圖書情報學刊,2008(5):100-102.
[4]張丹.高校信息檢索課教學改革與創(chuàng)新[J].牡丹江大學學報,2009(3):160-161,167.
[5]鄢百其,林凌,金曉祥.網絡信息檢索技巧及析疑[J].武漢科技大學學報:社會科學版,2008(2):103-108.
[6]王丹,李光輝.《信息存儲與檢索》課程案例教學探索[J].安徽中醫(yī)學院學報,2008(4):54-55.
[7]龔國偉.分析檢索課題的方法與技巧研究[J].圖書館工作與研究,2006(4):49-50.
Optimization of information retrieval strategies
Yan Baiqi
(The Library,Wuhan University of Science and Technology,Wuhan 430081,China)
A comparatively good approach to teaching the course of information retrieval is case teaching that focuses on information retrieval strategies.However,this approach has its shortcomings and calls for further improvement.In light of this,the author selected and analyzed representative teaching cases and retrieval examples for the discussion of optimization of information retrieval strategies,including selection of retrieval concepts,techniques of retrieval scope,choice of databases and analysis of retrieval effects.The discussion should be of referential value for the teaching of information retrieval course,and promote the information literacy of college students.
information retrieval class;case teaching;retrieval strategy;case analysis
G252.7;G642
:A
:1009-3699(2011)02-0237-03
[責任編輯 勇 慧]
2010-10-14
湖北省教育科學“十一五”規(guī)劃課題(編號:2009B315).
鄢百其(1955-),男,湖南武岡人,武漢科技大學圖書館研究員,主要從事科技信息咨詢研究.