• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      網(wǎng)絡(luò)中文信息檢索工具的評價

      2010-08-15 00:54:39王愛玲
      湖北工程學(xué)院學(xué)報 2010年1期
      關(guān)鍵詞:信息檢索搜索引擎網(wǎng)頁

      王愛玲

      (孝感學(xué)院 圖書館,湖北 孝感 432000)

      網(wǎng)絡(luò)中文信息檢索工具的評價

      王愛玲

      (孝感學(xué)院 圖書館,湖北 孝感 432000)

      探討了中文信息檢索工具評價標準,然后以著名的網(wǎng)絡(luò)檢索工具google為例進行了說明。

      檢索工具;中文搜索引擎;評價

      隨著互聯(lián)網(wǎng)上各種信息的急劇增長,網(wǎng)絡(luò)信息檢索工具的地位越來越重要,搜索引擎的數(shù)量、種類有了長足的發(fā)展,特別是隨著網(wǎng)上中文信息日益增多,網(wǎng)絡(luò)中文檢索工具應(yīng)運而生,它們?yōu)閺V大用戶快速、準確地查詢與獲取網(wǎng)上中文信息創(chuàng)造了便利的條件。面對眾多的網(wǎng)絡(luò)中文信息檢索工具,為了幫助用戶有效的選擇,也為了對檢索工具的改進和完善提供參考,本文將探討網(wǎng)絡(luò)中文信息檢索工具的評價標準,并以網(wǎng)絡(luò)中文信息檢索工具google為例加以說明。

      一、中文信息檢索工具的評價標準

      1.索引數(shù)據(jù)庫的構(gòu)成。

      網(wǎng)絡(luò)信息檢索工具的工作原理是通過自動索引程序Robot(或人工)來廣泛搜集網(wǎng)絡(luò)信息資源數(shù)據(jù),經(jīng)過一系列的判斷、選擇、標引、加工、分類、組織等處理后形成供檢索用的數(shù)據(jù)庫,即索引數(shù)據(jù)庫。索引數(shù)據(jù)庫的構(gòu)成是網(wǎng)絡(luò)檢索工具性能優(yōu)劣的基礎(chǔ)。索引數(shù)據(jù)庫的評價指標包括數(shù)據(jù)庫規(guī)模、范圍、標引深度(即全文標引、僅標引網(wǎng)站或網(wǎng)頁的標題、部分文檔內(nèi)容)、更新頻率等指標。

      從用戶角度來說,如果一個網(wǎng)絡(luò)信息檢索工具收錄信息數(shù)量少,或者是專業(yè)不對口,用戶就沒有選擇它的必要。標引深度在這里的作用是對涉及到的信息內(nèi)容本身揭示的全面程度,標引詞越多,對查全率越有幫助;標引詞專指,則有利于提高查準率。網(wǎng)絡(luò)信息是動態(tài)的、變化的,而無論由人還是搜索軟件進行標引,都存在時滯,因此要求網(wǎng)絡(luò)信息檢索工具保持一定的更新頻率,以便及時反映新的信息內(nèi)容。[1]

      2.提供的檢索途徑。

      檢索途徑是指查找文獻的路徑,即檢索入口。搜索引擎提供給用戶的檢索途徑越多越便于用戶使用。檢索途徑包括分類、關(guān)鍵詞、主題、日期、URL、名稱(包括文獻出版物名稱、文章題名、域名、主機名、人名等)、號碼(如標準號、專利號、刊號、書號、報告號、合同號)等途徑,以及上述幾種途徑的組合檢索(如在分類檢索下再進行關(guān)鍵詞或主題詞檢索),并可在結(jié)果中進行查找。另外,隨著Internet的發(fā)展,網(wǎng)絡(luò)信息不再是單純的文本信息,圖像、圖形、音頻、視頻等多媒體信息數(shù)據(jù)量激增,占據(jù)越來越重要的地位,成為網(wǎng)上不可缺少的重要資源。[2]網(wǎng)絡(luò)信息檢索中也就增加了圖像、語音等檢索途徑。不同的用戶會偏愛不同的檢索方式,但分類檢索和關(guān)鍵詞檢索是最重要的檢索方式。

      3.檢索功能。

      網(wǎng)絡(luò)檢索工具所能提供的檢索功能直接影響其檢索效率。網(wǎng)絡(luò)檢索工具除具有諸如布爾邏輯檢索、詞組檢索、截詞檢索、字段檢索、限制檢索、位置檢索之外,還必須具備有一些特殊的檢索功能,如自然語言檢索、多語種檢索、區(qū)分大小寫的檢索。[3]采用自然語言檢索時,用戶可直接采用自然語言中的字、詞或句子作提問式進行檢索,而不需要查檢專門的檢索語言,這樣使檢索變得非常簡單而直接。多語種檢索時,系統(tǒng)可按指定的語種進行檢索并輸出檢索結(jié)果。區(qū)分大小寫的檢索主要針對區(qū)分檢索詞中含有人名、地名等專有名詞與普通詞的檢索。另外,由于中文信息存在編碼不統(tǒng)一問題,所以如果搜索引擎能夠?qū)崿F(xiàn)不同內(nèi)碼之間的自動轉(zhuǎn)換,用戶就能全面檢索大陸及港臺地區(qū)乃至全世界的中文信息。這樣不但可以提高搜索引擎的質(zhì)量,而且會提高查全率。

      4.檢索效果。

      檢索效果的評價指標主要有響應(yīng)時間、查全率、查準率、結(jié)果重復(fù)率和死鏈接等指標。[4]除去網(wǎng)絡(luò)傳輸速度的影響,網(wǎng)絡(luò)信息檢索工具的響應(yīng)速度一般是非常迅速的。網(wǎng)絡(luò)信息檢索工具的查全率與其擁有的信息量有很大關(guān)系,可以說信息占有量的大小是評價其性能的重要指標。網(wǎng)絡(luò)信息檢索工具的查準率除了與其自身信息內(nèi)容的質(zhì)量有關(guān)外,還與檢索要求、檢索策略的選擇關(guān)系密切。但作為網(wǎng)絡(luò)信息檢索工具,重復(fù)鏈接率和死鏈接是兩個非常重要的標準。重復(fù)鏈接率指同一信息內(nèi)容在檢索結(jié)果中的重復(fù)反映程度。產(chǎn)生這個結(jié)果的原因有二:一是網(wǎng)絡(luò)信息內(nèi)容重復(fù)嚴重;二是用戶真正需要的是信息內(nèi)容,而不是信息地址?,F(xiàn)在的網(wǎng)絡(luò)檢索工具,尤其是基于關(guān)鍵詞的網(wǎng)絡(luò)檢索工具,命中結(jié)果的重復(fù)率較高,給用戶查詢信息帶來不便。死鏈接指原來正常,后來失效的鏈接。在用戶瀏覽網(wǎng)站頁面的時候,由于頁面不存在或者被管理員刪除了,服務(wù)器就會給用戶返回來一個錯誤的信息。出現(xiàn)死鏈接時,總有一些搜索結(jié)果點不進去,很讓用戶煩惱,他們很可能會轉(zhuǎn)向使用其他的檢索工具。因此,檢索效果的好壞是影響用戶選擇檢索工具的非常重要因素。

      5.檢索結(jié)果與用戶界面。

      檢索結(jié)果的顯示內(nèi)容與檢索界面是否友好是評價搜索引擎性能的重要指標,檢索結(jié)果的顯示包括檢索結(jié)果統(tǒng)計、檢索結(jié)果顯示格式、檢索結(jié)果排序方式等。檢索工具的結(jié)果是否按相關(guān)性排序,單純排序還是注明排序分值;顯示內(nèi)容形式是注釋還是摘要;輸出數(shù)量選擇,即限定或改變顯示數(shù)量;顯示格式選擇等,通常檢索工具確定相關(guān)性的方法有概率方法、位置方法、分類或聚類方法、摘要方法等。用戶界面的友好性,主要是指有無幫助信息、檢索功能說明、查詢舉例、是否容易掌握、頁面設(shè)計質(zhì)量、主頁的可操作性、交互性、連通性、網(wǎng)頁內(nèi)容是否能快速有效地檢索到等等。

      二、信息檢索工具——google中國

      Google提供了兩大類檢索:基本檢索(Basic Search)和高級檢索(A dvancedSearch)?;緳z索是指在主頁的檢索框中輸入檢索詞。Google查詢簡潔方便,僅需輸入查詢內(nèi)容并敲一下回車鍵 (Enter),或單擊“Google搜索”按鈕即可得到相關(guān)資料。搜索兩個及兩個以上關(guān)鍵字時,Google默認“and”進行查詢,不需要在關(guān)鍵詞之間加上“and”或“+”,返回包含所有關(guān)鍵詞的網(wǎng)頁。如果您想縮小搜索范圍,只需輸入更多的關(guān)鍵詞,只要在關(guān)鍵詞中間留空格就行了。如果要“或”搜索,可以使用大寫[OR]或[I],使用時要與關(guān)鍵詞之間留有空格。如果搜索結(jié)果不包含某些特定信息,即要避免搜索某個詞語,可以在這個詞前面加上一個減號(“-”,英文字符)。但在減號之前必須留一空格。

      1.Google提供的高級檢索功能。

      1)對搜索的網(wǎng)站進行限制;

      2)在某一類文件中查找信息;

      3)將搜索的關(guān)鍵字定位在網(wǎng)頁的“錨”(anchor)鏈點內(nèi);

      4)將搜索的關(guān)鍵字定位在URL鏈接中;

      5)搜索的關(guān)鍵字包含在網(wǎng)頁標題中。[5]

      2.google的長處。

      1)界面簡潔、速度較快。

      搜索引擎在我們?nèi)粘2僮髦械氖褂妙l率非常高,大家使用它的目的都非常明確,就是用它來搜尋需要的內(nèi)容,而不會為搜索引擎的頁面做過多的停留,因此搜索引擎的界面設(shè)計和速度成為我們選擇搜索工具的重要指標,google搜索引擎界面非常簡潔:除了網(wǎng)站LOGO、搜索框和按鈕以及個別功能服務(wù)鏈接外,頁面上就沒有其他多余和花哨的東西了,給人的感覺非常清爽,界面一目了然。Google在檢索速度方面也比較迅速,用戶輸入的任何關(guān)鍵字或信息,都能得到google的快速響應(yīng)。

      2)搜索質(zhì)量和查準率較高。

      Google提供多種檢索功能,各關(guān)鍵詞搜索結(jié)果的相關(guān)性較高,對于用戶所輸入的關(guān)鍵字,它能最大程度地尋求語義上的匹配,搜索結(jié)果較為準確。并且對于搜索結(jié)果列表的處理也很出色。

      3)注重搜索細節(jié)。

      google著力于改善用戶體驗,注重搜索細節(jié),如支持關(guān)鍵詞輸入提示、輸入糾錯、相關(guān)搜索提示等,大大提高了用戶的檢索效率。

      4)搜索結(jié)果展示形式更具人性化。

      返回結(jié)果的顯示形式采用網(wǎng)頁標題(title)和網(wǎng)頁描述(descrip tion)的內(nèi)容為搜索結(jié)果的摘要,直觀明了地展現(xiàn)了目標網(wǎng)頁的主題。并且同時提供了網(wǎng)頁快照、類似網(wǎng)頁和站內(nèi)搜索的鏈接。

      3.Google的不足之處。

      1)沒有網(wǎng)站分類目錄查詢,這令喜好目錄查詢的用戶只能另想他法。

      2)網(wǎng)頁更新速度需要進一步改進。因其數(shù)據(jù)量龐大,數(shù)據(jù)無法及時更新,影響了用戶對信息的時效需求。

      3)無法搜索動態(tài)生成的網(wǎng)頁。

      [1] 楊淑瓊.中文網(wǎng)絡(luò)信息檢索工具的現(xiàn)狀及未來走向[J].情報雜志,2002(6):52-53.

      [2] 宛玲,楊秀丹,杜曉靜.試析中文搜索引擎的評價標準[J].情報科學(xué),2000(1):28-31,38

      [3] 張燕飛,彭燕云.基于WWW中文網(wǎng)絡(luò)信息檢索工具的比較研究[J].江西圖書館學(xué)刊,2003(1):56-59.

      [4] 張莉揚.網(wǎng)絡(luò)檢索工具性能評價標準淺議[J].情報科學(xué),2001(10):1115-1118.

      [5] 李俊萌.搜索引擎 Google檢索功能詳述及評析[J].現(xiàn)代圖書情報技術(shù),2003(S1):66-69.

      Evaluation of Chinese Network Information Retrieval Tool

      Wang Ailing
      (Library,Xiaogan University,Xiaogan,Hubei 432000,China)

      In this paper,the evaluation criteria about Chinese information retrieval tools are discussed firstly,and then the author takes google,which is the famous web search tool,for example to exp lain it.

      search tools;Chinese search engine;evaluation

      G252.7

      A

      1671-2544(2010)增-0008-03

      2010-06-20

      王愛玲(1967— ),女,湖北漢川人,孝感學(xué)院圖書館館員。

      (責(zé)任編輯:陳 鑫)

      猜你喜歡
      信息檢索搜索引擎網(wǎng)頁
      基于CSS的網(wǎng)頁導(dǎo)航欄的設(shè)計
      電子制作(2018年10期)2018-08-04 03:24:38
      基于URL和網(wǎng)頁類型的網(wǎng)頁信息采集研究
      電子制作(2017年2期)2017-05-17 03:54:56
      醫(yī)學(xué)期刊編輯中文獻信息檢索的應(yīng)用
      新聞傳播(2016年18期)2016-07-19 10:12:06
      基于神經(jīng)網(wǎng)絡(luò)的個性化信息檢索模型研究
      網(wǎng)頁制作在英語教學(xué)中的應(yīng)用
      電子測試(2015年18期)2016-01-14 01:22:58
      網(wǎng)絡(luò)搜索引擎亟待規(guī)范
      基于Nutch的醫(yī)療搜索引擎的研究與開發(fā)
      10個必知的網(wǎng)頁設(shè)計術(shù)語
      廣告主與搜索引擎的雙向博弈分析
      教學(xué)型大學(xué)《信息檢索》公選課的設(shè)計與實施
      河南科技(2014年11期)2014-02-27 14:10:19
      高唐县| 海阳市| 扶风县| 北票市| 平谷区| 平利县| 兰西县| 调兵山市| 铁岭县| 海安县| 裕民县| 霍林郭勒市| 呼和浩特市| 东方市| 嫩江县| 云林县| 昭觉县| 雷山县| 兴隆县| 瓮安县| 平远县| 双鸭山市| 佛坪县| 陈巴尔虎旗| 依兰县| 龙井市| 安阳市| 城固县| 镇赉县| 三门县| 云南省| 周宁县| 台州市| 莫力| 齐齐哈尔市| 扬中市| 梅河口市| 阳春市| 搜索| 铜鼓县| 光山县|