• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      淺議電子信息檢索

      2015-03-26 22:36:05武漢科技大學(xué)圖書館張旭幫
      電子世界 2015年18期
      關(guān)鍵詞:查全率查準(zhǔn)率檢索系統(tǒng)

      武漢科技大學(xué)圖書館 張旭幫

      盡管因特網(wǎng)技術(shù)發(fā)展迅速,人們可免費(fèi)從網(wǎng)上獲取的信息不斷豐富,但就其信息資源的系統(tǒng)性、完整性、可靠性而言,還是難以與大型的商業(yè)化聯(lián)機(jī)檢索系統(tǒng)相匹敵。聯(lián)機(jī)檢索,是指檢索者利用終端設(shè)備,通過遠(yuǎn)程通信線路或網(wǎng)絡(luò),使用一些特定指令和檢索提問式,并采用“人—機(jī)對(duì)話”的方式,對(duì)聯(lián)機(jī)檢索系統(tǒng)的幾個(gè)或幾十個(gè)數(shù)據(jù)庫同時(shí)進(jìn)行搜索的過程。

      美國DIALOG系統(tǒng)是當(dāng)今世界規(guī)模最大的國際聯(lián)機(jī)檢索系統(tǒng),也是運(yùn)作最為成功的商業(yè)化聯(lián)機(jī)數(shù)據(jù)庫系統(tǒng)。其信息容量大、數(shù)據(jù)質(zhì)量高、文獻(xiàn)類型齊全、資料來源可靠、更新速度快、專業(yè)面廣,基本上包括了所有學(xué)科領(lǐng)域。它以功能強(qiáng)大的檢索軟件為支撐,其檢索算符、檢索途徑眾多,查詢搜索方便靈活、快捷簡便,更兼有數(shù)據(jù)庫總索引瀏覽、聯(lián)機(jī)詞典輔助檢索等別具特色的功能;具有其他網(wǎng)絡(luò)數(shù)據(jù)庫系統(tǒng)無可比擬的技術(shù)、資源優(yōu)勢。在實(shí)際利用中,只要使用者的檢索策略得當(dāng),一般都能達(dá)到較高的查準(zhǔn)率和查全率,獲得滿意的效果。

      1 聯(lián)機(jī)信息檢索

      因此,多年來DIALOG系統(tǒng)一直是我國科技查新工作中的主要檢索工具,同時(shí)也是國內(nèi)科技、經(jīng)濟(jì)信息檢索服務(wù)中利用率最高的國際聯(lián)機(jī)檢索系統(tǒng)。在進(jìn)行國際聯(lián)機(jī)檢索時(shí),一般可采取下列幾個(gè)步驟:

      1.1 先試檢摸底

      國際聯(lián)機(jī)檢索前最好先對(duì)相應(yīng)的檢索刊物進(jìn)行手工試檢,或利用因特網(wǎng)搜索相關(guān)信息,了解專業(yè)文獻(xiàn)分布情況,初步估算文獻(xiàn)量,以便確定相應(yīng)的聯(lián)機(jī)檢索方案;手檢(或因特網(wǎng)搜索)摸底有助于準(zhǔn)確地掌握專業(yè)用詞,以提高下一步檢索的準(zhǔn)確性。有時(shí)通過試檢發(fā)現(xiàn),手工檢索或因特網(wǎng)搜索也能滿足信息需求,這時(shí)放棄國際聯(lián)機(jī)檢索,便可節(jié)省不少的費(fèi)用。

      1.2 制定檢索方案

      這是一個(gè)分析課題內(nèi)容,確定主題概念,選擇檢索詞,構(gòu)造提問式的過程。但要注意的是,在國際聯(lián)機(jī)檢索時(shí),我們常用的是一些英文數(shù)據(jù)庫,因此不要想當(dāng)然地使用一些“中式英語”的信息提問?,F(xiàn)以“國外教育管理現(xiàn)代化” 的檢索為例:當(dāng)今發(fā)達(dá)國家的教育管理本身就包含有現(xiàn)代化管理的內(nèi)容,如用“現(xiàn)代化”這個(gè)概念去搜索,既顯得多余,同時(shí)也不符合人家的表述習(xí)慣。

      1.3 選擇合適的數(shù)據(jù)庫

      選擇數(shù)據(jù)庫一般有這幾種方式:①利用數(shù)據(jù)庫一覽表或數(shù)據(jù)庫簡介資料來選擇;②參考與數(shù)據(jù)庫對(duì)應(yīng)的檢索刊物(如“化學(xué)文摘”、“工程索引”、“科學(xué)文摘”……等等)進(jìn)行選擇;③利用檢索系統(tǒng)的索引文檔篩選。例如,在檢索中,若選用的數(shù)據(jù)庫較多,這時(shí)可先利用DIALOG系統(tǒng)的411索引文檔進(jìn)行預(yù)檢掃描,以顯示各數(shù)據(jù)庫的檢索效果,便可確定合適的數(shù)據(jù)庫。

      1.4 準(zhǔn)確填寫聯(lián)機(jī)檢索提問單

      各種國際聯(lián)機(jī)檢索提問單均大同小異,一般有:課題名稱、內(nèi)容簡介、檢索詞、檢索邏輯式、數(shù)據(jù)庫……等等??砂错樞蛞来翁顚?。但對(duì)“輸出要求”項(xiàng),應(yīng)注意以下幾點(diǎn):①國際聯(lián)機(jī)檢索通常采用脫機(jī)打印,以減少聯(lián)機(jī)費(fèi)。②一般情況下,聯(lián)機(jī)檢索中直接指定輸出文獻(xiàn)數(shù)量的方式通常要比限定年代輸出的方式簡便,這既節(jié)省機(jī)時(shí),又能合理地控制文獻(xiàn)量,其效果較好。

      確定了檢索策略,再填寫好檢索提問單,交給聯(lián)機(jī)檢索操作人員,便可以檢索了。

      1.5 聯(lián)機(jī)調(diào)節(jié)

      由于國際聯(lián)機(jī)檢索費(fèi)用較高,因此,在動(dòng)手檢索前,應(yīng)針對(duì)聯(lián)機(jī)檢索過程中可能出現(xiàn)的各種情況(如:命中文獻(xiàn)量太多或太少、檢索結(jié)果為零、不相關(guān)文獻(xiàn)居多等),準(zhǔn)備幾套備用方案,以便隨時(shí)根據(jù)終端屏幕顯示的情況,及時(shí)、有效地進(jìn)行調(diào)節(jié)、修正,不斷完善檢索策略,力爭以最短的時(shí)間、最少的花費(fèi),獲得最佳的檢索效果。

      1.6 分析檢索結(jié)果

      對(duì)檢索結(jié)果進(jìn)行分析、研究,總結(jié)經(jīng)驗(yàn);并根據(jù)篩選出的切題文獻(xiàn)記錄的出處索取原文。

      2 信息檢索效果的評(píng)價(jià)

      計(jì)算機(jī)檢索的效果,既是廣大信息用戶的利益所在,也是專業(yè)檢索人員密切關(guān)注的問題,它還直接影響著檢索系統(tǒng)在信息市場上的競爭能力。通過評(píng)價(jià)數(shù)據(jù)庫系統(tǒng)的檢索質(zhì)量,研究影響檢索效果的各種因素,將有助于我們?cè)谟?jì)算機(jī)信息檢索的實(shí)踐中提高檢索質(zhì)量,改善檢索效果。

      2.1 查全率和查準(zhǔn)率

      衡量檢索效果主要有兩個(gè)標(biāo)準(zhǔn):查全率和查準(zhǔn)率。查全率是指檢出的相關(guān)文獻(xiàn)量與數(shù)據(jù)庫中相關(guān)文獻(xiàn)總量的比率,它反映了相關(guān)文獻(xiàn)被檢出的程度。

      查全率=[檢出相關(guān)文獻(xiàn)量/數(shù)據(jù)庫內(nèi)相關(guān)文獻(xiàn)總量]×100%

      查準(zhǔn)率是指檢出的相關(guān)文獻(xiàn)量與檢出文獻(xiàn)總量的比率,它反映系統(tǒng)拒絕非相關(guān)文獻(xiàn)的能力。

      查準(zhǔn)率=[檢出相關(guān)文獻(xiàn)量/檢出文獻(xiàn)總量]×100%

      英國學(xué)者在分析、研究了大量的有關(guān)數(shù)據(jù)后,提出查全率和查準(zhǔn)率之間存在著一種“互逆相關(guān)”的規(guī)律。也就是說,為了提高查全率而放寬檢索范圍,往往使查準(zhǔn)率下降;要想提高查準(zhǔn)率而縮小檢索范圍,則常使查全率降低。在實(shí)際中,偶爾也會(huì)出現(xiàn)查全率和查準(zhǔn)率同時(shí)達(dá)到很高的值,但這只是極個(gè)別的情況。而查全率和查準(zhǔn)率之間互相制約的現(xiàn)象卻是普遍存在。

      由于高查全率和高查準(zhǔn)率難以同時(shí)獲得,因此在確定檢索目標(biāo)時(shí),應(yīng)對(duì)檢索結(jié)果的查全率和查準(zhǔn)率有所考慮。如果能事先明確優(yōu)先保證查全率或查準(zhǔn)率,將有助于制定相應(yīng)的檢索策略,取得檢索過程中的主動(dòng)權(quán)。對(duì)于工礦企業(yè)從事應(yīng)用研究和工藝流程設(shè)計(jì)的用戶,他們往往只要求檢索的結(jié)果能解決他們的實(shí)際問題,不一定需要很多文獻(xiàn),而要求較高的查準(zhǔn)率。對(duì)于一些從事基礎(chǔ)理論研究或?yàn)樯暾?qǐng)專利而“查新”的用戶,他們往往需要全面、系統(tǒng)地收集某一主題范圍的資料,因此對(duì)查全率要求較高。不同的用戶,根據(jù)從事工作的性質(zhì)不同,以及研究階段的不同,對(duì)查全率和查準(zhǔn)率將有所側(cè)重。在一般的情況下,不必過分地求全求準(zhǔn),以免造成顧此失彼的結(jié)果。

      2.2 影響檢索效果的因素

      計(jì)算機(jī)檢索的效果取決于許多因素,如標(biāo)引質(zhì)量、系統(tǒng)功能、數(shù)據(jù)庫結(jié)構(gòu)及檢索策略等。標(biāo)引的深度是指標(biāo)引一篇文獻(xiàn)所用的標(biāo)識(shí)數(shù)量,標(biāo)引深度越大,則提供的檢索標(biāo)識(shí)就越多,所標(biāo)引的文獻(xiàn)被檢出的概率就越大,查全率也就越高。然而,過度的標(biāo)引又會(huì)引起誤差,影響查準(zhǔn)率。因此,標(biāo)引深度即不宜過淺,也不能過度,問題的關(guān)鍵就是如何才能做到適度標(biāo)引。合理的標(biāo)引必須遵循這樣的原則:正確地選擇標(biāo)識(shí),準(zhǔn)確地表達(dá)文獻(xiàn)的主題概念;全面地揭示主題內(nèi)容,不遺漏有價(jià)值的信息;進(jìn)行合理的取舍,不過量標(biāo)引;保持標(biāo)引的前后一致性。要達(dá)到這些標(biāo)準(zhǔn)是很困難的;在實(shí)際中,標(biāo)引的質(zhì)量主要取決于詞表(主題詞表、標(biāo)題詞表和分類表等)的質(zhì)量和標(biāo)引人員的專業(yè)知識(shí)、工作經(jīng)驗(yàn)以及對(duì)檢索語言的掌握程度等。

      一般來說,受過一定機(jī)檢訓(xùn)練的用戶,常常能夠保證檢索的質(zhì)量。因?yàn)楦鲗I(yè)人員熟悉自己所研究的學(xué)科領(lǐng)域,檢索目的明確;在掌握了必要的機(jī)檢知識(shí)和方法后,就能夠制定較為合理的檢索策略,并能在反饋調(diào)節(jié)中作出準(zhǔn)確地判斷,從而獲得滿意的檢索效果。要達(dá)到這一步,還有待于在各專業(yè)人員中廣泛地普及計(jì)算機(jī)信息檢索知識(shí);同時(shí)也應(yīng)在高校文獻(xiàn)檢索教學(xué)中進(jìn)一步地充實(shí)、完善機(jī)檢的內(nèi)容,使大學(xué)生、研究生掌握一定的檢索技能,以便在今后工作中能夠有效地利用計(jì)算機(jī)檢索這一現(xiàn)代化的信息手段,快速、準(zhǔn)確、全面地獲得相關(guān)信息,緊跟世界科技發(fā)展的新形勢。

      3 結(jié)束語

      國際聯(lián)機(jī)檢索系統(tǒng)擁有龐大的信息資源,所涉及的內(nèi)容包羅萬象,十分豐富。可以說人類從來沒有像今天這樣可以方便地獲取各類的信息。在當(dāng)今信息量極大、通信業(yè)極為發(fā)達(dá)的時(shí)代,掌握信息更加重要。面對(duì)如此巨大的信息海洋,如果不掌握獲取信息的方法和技巧,只能是望洋興嘆!因此,掌握網(wǎng)絡(luò)信息檢索技能,及時(shí)準(zhǔn)確、全面獲取信息,提高鑒別、選擇與利用文獻(xiàn)信息的能力,有利于消化新信息,吸收所需的專門知識(shí),從而更好地從事科研和各種管理活動(dòng),快速獲取成功。

      [1]蔣瑤.淺談關(guān)于網(wǎng)絡(luò)信息檢索的認(rèn)識(shí).大眾文藝:學(xué)術(shù)版,2010(9).

      猜你喜歡
      查全率查準(zhǔn)率檢索系統(tǒng)
      海量圖書館檔案信息的快速檢索方法
      收錄《信號(hào)處理》的檢索系統(tǒng)及數(shù)據(jù)庫
      收錄《信號(hào)處理》的檢索系統(tǒng)及數(shù)據(jù)庫
      本刊被以下檢索系統(tǒng)及數(shù)據(jù)庫收錄
      本刊被以下檢索系統(tǒng)及數(shù)據(jù)庫收錄
      基于詞嵌入語義的精準(zhǔn)檢索式構(gòu)建方法
      大數(shù)據(jù)環(huán)境下的文本信息挖掘方法
      基于深度特征分析的雙線性圖像相似度匹配算法
      中文分詞技術(shù)對(duì)中文搜索引擎的查準(zhǔn)率及查全率的影響
      基于Web的概念屬性抽取的研究
      英德市| 平谷区| 从化市| 加查县| 宁阳县| 汾阳市| 夏邑县| 赤壁市| 和林格尔县| 永胜县| 霍山县| 芷江| 乌兰察布市| 太康县| 大洼县| 鹤山市| 台安县| 巴彦淖尔市| 政和县| 绥阳县| 杭锦旗| 静乐县| 宁城县| 南溪县| 海口市| SHOW| 昌宁县| 万州区| 宁津县| 自治县| 武胜县| 磐石市| 阳春市| 重庆市| 互助| 商南县| 岑巩县| 濮阳县| 民权县| 拉萨市| 安乡县|