劉蓓++任亞波
摘 要:隨著網(wǎng)絡(luò)化和數(shù)字化的快速發(fā)展,人們對信息的需求已成為生活中不可或缺的一部分,但如何從這繁雜、龐大的資源庫中快速搜索和提取對自己有價值的信息就成為廣大用戶必須面臨的問題,而信息檢索成為解決這一問題的關(guān)鍵。因此,該文主要圍繞信息檢索展開討論,選擇以立體印刷技術(shù)論文的撰寫為例,從課題分析、檢索工具的選擇、檢索關(guān)鍵詞的確定、檢索過程及結(jié)果輸出、分析、提煉等方面對文獻(xiàn)信息檢索技術(shù)及其應(yīng)用進(jìn)行詳細(xì)介紹。
關(guān)鍵詞:信息檢索 信息分析 信息提煉 立體印刷
中圖分類號:TM63 文獻(xiàn)標(biāo)識碼:A 文章編號:1674-098X(2016)09(c)-0100-02
在新的生活環(huán)境下,每個人都需要從各種各樣的信息源中收集、提煉有用信息,為正確決策提供參考。一方面,人們可以利用網(wǎng)絡(luò)方便、自由、快捷的發(fā)布、查詢信息;但另一個方面,由于網(wǎng)絡(luò)環(huán)境的開放性,信息更新的快速性,使得信息資源出現(xiàn)分散、異構(gòu)、無序的特性,極不利于人們有效開發(fā)和利用這些資源。面對信息急劇增長、技術(shù)不斷更新的新局面,需要我們對信息檢索技術(shù)進(jìn)行深入的研究,從而提高網(wǎng)絡(luò)信息資源的利用率,尤其是科研工作者必須增強獲取、選擇和利用信息的能力。
1 信息檢索概述
信息檢索是將信息按一定的方式組織起來,并根據(jù)信息用戶提交的查詢條件檢索出相關(guān)文檔的過程和技術(shù)。信息檢索涉及數(shù)據(jù)庫技術(shù)、圖書和情報科學(xué)、人工智能、自然語言處理、機器學(xué)習(xí)等眾多知識和學(xué)科領(lǐng)域[1]。信息檢索作為一門學(xué)科,主要研究信息的獲取、表示、存儲、組織和訪問。
1.1 信息檢索的意義
信息檢索是對信息進(jìn)行集中表示、存儲、組織加工、統(tǒng)一管理,使用戶更容易得到所需要的信息,進(jìn)而對信息進(jìn)行加工,根據(jù)分析得出新的思路和方法,實現(xiàn)信息激活和增值。有效的信息檢索可以節(jié)省科技人員的時間,提高工作效率;幫助人們進(jìn)行知識更新;繼承和借鑒前人勞動成果,促進(jìn)科技的快速發(fā)展;協(xié)助管理者做出正確的決策。
1.2 信息檢索的四要素
信息檢索包含四個要素:信息意識、信息源、信息獲取能力、信息利用[2]。信息意識是信息檢索的前提,指人們借助信息系統(tǒng)獲取所需信息所做出的能動反映,使人們對信息的敏感程度、選擇和運用信息能力;信息源是信息檢索的基礎(chǔ),如專著、期刊、報告、學(xué)位論文、會議記錄、專利、標(biāo)準(zhǔn)、統(tǒng)計數(shù)據(jù)、政府出版物、檔案文獻(xiàn)信息等;信息獲取能力是信息檢索的核心,是指人們對信息的了解、查找、整理加工;信息利用是信息檢索的關(guān)鍵,即對信息進(jìn)行有效的加工和利用。
1.3 檢索語言及方法
檢索語言是為溝通文獻(xiàn)標(biāo)引與文獻(xiàn)檢索而編制的人工語言,是連接信息存儲和檢索兩個過程中標(biāo)引人員與檢索人員雙方思路的渠道。檢索語言主要包含分類、主題、代碼和自然四類語言[3]。分類語言是指用各種分類號來進(jìn)行檢索的標(biāo)識,按學(xué)科性質(zhì)進(jìn)行系統(tǒng)排列,包括主題、科學(xué)、圖書和專利分類語言;主題語言是直接以表達(dá)文獻(xiàn)主題的詞語作為檢索標(biāo)識,包括關(guān)鍵詞、標(biāo)題詞、單元次和敘詞語言等;代碼語言是指將事物的某一方面特征用代碼系統(tǒng)來標(biāo)引和排列的檢索語言,例如,分子式索引系統(tǒng);自然語言是指未經(jīng)規(guī)范化處理的檢索語言。
信息檢索包括手工和計算機檢索,常用的檢索方法有拉網(wǎng)法、引文法、順查、逆差和抽查法、排除、限定和合取法。檢索途徑歸為兩大類:一類是用信息的外部特征,如責(zé)任者、題名、某種序號、機構(gòu)名等作為檢索標(biāo)識;另一類是用描述信息內(nèi)容的分類號、關(guān)鍵詞、主題詞等作為檢索標(biāo)識。通常直接輸入檢索字段直接點擊搜索,但需要精確查找目標(biāo)文獻(xiàn)時,要利用高級檢索方式設(shè)置一些查詢條件,如查詢范圍、時間、方式(模糊和精確)、字段邏輯關(guān)系的編輯等。
2 信息檢索流程
信息檢索過程可分為以下步驟:課題的確定——選擇合適的數(shù)據(jù)庫——初步擬定檢索式檢索——調(diào)整檢索策略(考慮準(zhǔn)確性)——命中結(jié)果分析——批量下載——信息分析。下面以立體印刷技術(shù)的相關(guān)資料的搜集為例介紹信息檢索過程。
2.1 檢索工具選擇
對于日常信息的搜索,通常采用百度、谷歌等網(wǎng)站,但對于專業(yè)文獻(xiàn)的檢索則需要專門的數(shù)據(jù)庫,每個數(shù)據(jù)庫都有自己的特點。
(1)館藏書目查詢:書目是將圖書、期刊按一定規(guī)則收錄,并有序編排的檢索工具。通常包含題名、責(zé)任者、主題詞、分類號、索取號、ISBN/ISSN號、出版社等字段,輸入檢索詞即可檢索,大多數(shù)高校圖書館都有自己的館藏書目數(shù)據(jù)庫,檢索、下載。
(2)中國學(xué)術(shù)期刊全文數(shù)據(jù)庫:目前世界上最大且連續(xù)動態(tài)更新的數(shù)據(jù)庫,內(nèi)容覆蓋工程技術(shù)、自然科學(xué)、農(nóng)業(yè)、哲在新的生活環(huán)境下,每個人都需要從各種各樣的信息源中收集、提煉有用信息,為正確決策提供參考。一方面,人們可以利用網(wǎng)絡(luò)方便、自由、快捷的發(fā)布、查詢信息;但另一個方面,由于網(wǎng)絡(luò)環(huán)境的開放性,信息更新的快速性,使得信息資源出現(xiàn)分散、異構(gòu)、無序的特性,極不利于人們有效開發(fā)和利用這些資源。面對信息急劇增長、技術(shù)不斷更新的新局面,需要我們對信息檢索技術(shù)進(jìn)行深入的研究,從而提高網(wǎng)絡(luò)信息資源的利用率,尤其是科研工作者必須增強獲取、選擇和利用信息的能力。
1 信息檢索概述
信息檢索是將信息按一定的方式組織起來,并根據(jù)信息用戶提交的查詢條件檢索出相關(guān)文檔的過程和技術(shù)。信息檢索涉及數(shù)據(jù)庫技術(shù)、圖書和情報科學(xué)、人工智能、自然語言處理、機器學(xué)習(xí)等眾多知識和學(xué)科領(lǐng)域[1]。信息檢索作為一門學(xué)科,主要研究信息的獲取、表示、存儲、組織和訪問。
1.1 信息檢索的意義
信息檢索是對信息進(jìn)行集中表示、存儲、組織加工、統(tǒng)一管理,使用戶更容易得到所需要的信息,進(jìn)而對信息進(jìn)行加工,根據(jù)分析得出新的思路和方法,實現(xiàn)信息激活和增值。有效的信息檢索可以節(jié)省科技人員的時間,提高工作效率;幫助人們進(jìn)行知識更新;繼承和借鑒前人勞動成果,促進(jìn)科技的快速發(fā)展;協(xié)助管理者做出正確的決策。
1.2 信息檢索的四要素
信息檢索包含四個要素:信息意識、信息源、信息獲取能力、信息利用[2]。信息意識是信息檢索的前提,指人們借助信息系統(tǒng)獲取所需信息所做出的能動反映,使人們對信息的敏感程度、選擇和運用信息能力;信息源是信息檢索的基礎(chǔ),如專著、期刊、報告、學(xué)位論文、會議記錄、專利、標(biāo)準(zhǔn)、統(tǒng)計數(shù)據(jù)、政府出版物、檔案文獻(xiàn)信息等;信息獲取能力是信息檢索的核心,是指人們對信息的了解、查找、整理加工;信息利用是信息檢索的關(guān)鍵,即對信息進(jìn)行有效的加工和利用。
1.3 檢索語言及方法
檢索語言是為溝通文獻(xiàn)標(biāo)引與文獻(xiàn)檢索而編制的人工語言,是連接信息存儲和檢索兩個過程中標(biāo)引人員與檢索人員雙方思路的渠道。檢索語言主要包含分類、主題、代碼和自然四類語言[3]。分類語言是指用各種分類號來進(jìn)行檢索的標(biāo)識,按學(xué)科性質(zhì)進(jìn)行系統(tǒng)排列,包括主題、科學(xué)、圖書和專利分類語言;主題語言是直接以表達(dá)文獻(xiàn)主題的詞語作為檢索標(biāo)識,包括關(guān)鍵詞、標(biāo)題詞、單元次和敘詞語言等;代碼語言是指將事物的某一方面特征用代碼系統(tǒng)來標(biāo)引和排列的檢索語言,例如,分子式索引系統(tǒng);自然語言是指未經(jīng)規(guī)范化處理的檢索語言。
信息檢索包括手工和計算機檢索,常用的檢索方法有拉網(wǎng)法、引文法、順查、逆差和抽查法、排除、限定和合取法。檢索途徑歸為兩大類:一類是用信息的外部特征,如責(zé)任者、題名、某種序號、機構(gòu)名等作為檢索標(biāo)識;另一類是用描述信息內(nèi)容的分類號、關(guān)鍵詞、主題詞等作為檢索標(biāo)識。通常直接輸入檢索字段直接點擊搜索,但需要精確查找目標(biāo)文獻(xiàn)時,要利用高級檢索方式設(shè)置一些查詢條件,如查詢范圍、時間、方式(模糊和精確)、字段邏輯關(guān)系的編輯等。
2 信息檢索流程
信息檢索過程可分為以下步驟:課題的確定——選擇合適的數(shù)據(jù)庫——初步擬定檢索式檢索——調(diào)整檢索策略(考慮準(zhǔn)確性)——命中結(jié)果分析——批量下載——信息分析。下面以立體印刷技術(shù)的相關(guān)資料的搜集為例介紹信息檢索過程。
2.1 檢索工具選擇
對于日常信息的搜索,通常采用百度、谷歌等網(wǎng)站,但對于專業(yè)文獻(xiàn)的檢索則需要專門的數(shù)據(jù)庫,每個數(shù)據(jù)庫都有自己的特點。
(1)館藏書目查詢:書目是將圖書、期刊按一定規(guī)則收錄,并有序編排的檢索工具。通常包含題名、責(zé)任者、主題詞、分類號、索取號、ISBN/ISSN號、出版社等字段,輸入檢索詞即可檢索,大多數(shù)高校圖書館都有自己的館藏書目數(shù)據(jù)庫,檢索、下載。
(2)中國學(xué)術(shù)期刊全文數(shù)據(jù)庫:目前世界上最大且連續(xù)動態(tài)更新的數(shù)據(jù)庫,內(nèi)容覆蓋工程技術(shù)、自然科學(xué)、農(nóng)業(yè)、哲學(xué)、醫(yī)學(xué)、人文社會科學(xué)等各個領(lǐng)域??蛇M(jìn)行高級、專業(yè)、跨庫檢索以及期刊導(dǎo)航。
(3)中國優(yōu)秀博碩士論文數(shù)據(jù)庫:目前國內(nèi)相關(guān)資源最完備、連續(xù)動態(tài)更新的高質(zhì)量學(xué)位論文數(shù)據(jù)庫,包含理工、農(nóng)業(yè)、醫(yī)藥、文史哲、法律、教育與社會科學(xué)、電子與信息科學(xué)、經(jīng)濟以及專題文獻(xiàn)等。
(4)外文文摘數(shù)據(jù)庫:既包含單學(xué)科數(shù)據(jù)庫,如CA(化學(xué))、PA(石油)、Georef、Medline等,又包含多學(xué)科綜合數(shù)據(jù)庫,如Dialog、EI、CSA、SCI、IEEE/IET、Spinger等。對于國際化的今天,外文檢索已成為每個考研人員必備的技能。
(5)其他數(shù)據(jù)庫:Google學(xué)術(shù)中文和外文搜索、萬方、維普、知網(wǎng)、專利檢索系統(tǒng)以及標(biāo)準(zhǔn)文獻(xiàn)檢索數(shù)據(jù)庫等。數(shù)據(jù)庫文件普遍采用CAJ和PDF格式,須下載專門的瀏覽器來閱讀。
2.2 檢索詞確定
確定中文檢索詞:設(shè)置與論文名字相關(guān)的檢索詞進(jìn)行檢索,如,立體印刷、3D印刷、立體圖像、立體印刷品;確定英文檢索詞:stereoscopic printing、3D printing、stereoscopic image printing、auto-stereoscopic image
2.3 檢索過程及結(jié)果分析
利用以上介紹的檢索方式以及各個數(shù)據(jù)庫的特點,選用中國知網(wǎng)、Google學(xué)術(shù)、碩博士論文數(shù)據(jù)庫、EI和專利網(wǎng),結(jié)合設(shè)定的檢索詞進(jìn)行文獻(xiàn)檢索,該文例子主要圍繞圖書、期刊、碩博士論文和專利來搜索。為了便于對文獻(xiàn)的管理、引文編排,論文寫作采用EndNote插件建立分類文獻(xiàn)庫。在搜索文獻(xiàn)時注意盡可能將時間設(shè)定在近5年內(nèi),學(xué)位論文搜索優(yōu)先,這樣對研究對象的背景、現(xiàn)狀首先有大概的了解;其次進(jìn)行大量其它文獻(xiàn)的檢索,可以參考論文后的參考文獻(xiàn)、某個領(lǐng)域的專家或數(shù)據(jù)庫連接到的相似文獻(xiàn)等來擴展檢索。無論對于中文還是外文的搜索,不能盲目下載,必須注意文章摘要與目標(biāo)對象是否有關(guān),否則會加大有用文章篩選的工作量。
檢索到的文章由于存在相似性,一定要做好分類,方便快速查找??偟膩砜戳Ⅲw印刷技術(shù)相關(guān)文獻(xiàn)主要涉及人眼視覺理論、光柵成像、立體圖像制作、光柵材料及使用、立體印刷產(chǎn)品質(zhì)量評價和市場分析、立體印刷工藝研究以及相關(guān)設(shè)備制造等。通過以上文章的搜索我們可以對立體印刷有大致的了解,對于寫綜述性的論文可以按照以上點來設(shè)置章節(jié)標(biāo)題,如果要進(jìn)行某一點的深入研究,需要認(rèn)真研讀,將文章的各個點吃透,或進(jìn)一步查閱相關(guān)資料??傊?,文獻(xiàn)檢索不能盲目,初步檢索分析后,再次具有針對性性的進(jìn)行檢索。
3 結(jié)語
該文圍繞信息檢索技術(shù)展開討論,首先,簡單的介紹了信息檢索的含義、目的、意義、檢索要素和方法等,讓大家對此有直觀的認(rèn)識。其次,結(jié)合立體印刷技術(shù)綜述報告的例子,詳細(xì)的闡述了文獻(xiàn)的查找渠道、提煉、分析和總結(jié)過程,對以后工作和學(xué)習(xí)中有效的進(jìn)行信息檢索具有一定的參考價值。
參考文獻(xiàn)
[1] 劉雙魁.信息檢索與利用[M].上海:東南大學(xué)出版社,2010:8.
[2] 祁延莉.信息檢索概論[M].北京:北京大學(xué)出版社,2013:7.
[3] 張金松.基于引文上下文分析的文獻(xiàn)檢索技術(shù)研究[D].大連:大連海事大學(xué),2013:4.