• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      圖書(shū)館應(yīng)對(duì)隱蔽網(wǎng)絡(luò)策略探究

      2019-03-18 11:44:28杜小丹
      卷宗 2019年4期
      關(guān)鍵詞:搜索引擎圖書(shū)館

      杜小丹

      摘 要:文章闡述了隱蔽網(wǎng)絡(luò)的定義,介紹了隱蔽網(wǎng)絡(luò)形成的原因,根據(jù)隱蔽網(wǎng)絡(luò)形成的原因進(jìn)行了歸類。著重分析了圖書(shū)館應(yīng)對(duì)隱蔽網(wǎng)絡(luò)信息資源的重要意義,介紹了圖書(shū)館應(yīng)對(duì)隱蔽網(wǎng)絡(luò)的幾種方式。

      關(guān)鍵詞:隱蔽網(wǎng)絡(luò);搜索引擎;圖書(shū)館

      認(rèn)為利用常規(guī)性的方式搜索出的表面層網(wǎng)絡(luò)信息資源占整個(gè)網(wǎng)絡(luò)信息資源的16%,而余下的都是深層次的網(wǎng)絡(luò)信息資源,占比高達(dá)84%。據(jù)Bright Plant 公司研究數(shù)據(jù)表明,互聯(lián)網(wǎng)上有大于5500億份文件,其中隱形內(nèi)容的文檔大約有5000億個(gè),排除格式與數(shù)據(jù)類型不同所造成的差異,也可以看出有形內(nèi)容遠(yuǎn)遠(yuǎn)少于隱形內(nèi)容。隱形網(wǎng)絡(luò)資源不僅數(shù)量巨大而且增長(zhǎng)迅速。隱形網(wǎng)絡(luò)的信息質(zhì)量比較高,但是一般的搜索引擎難以搜索到這些高質(zhì)量的隱蔽網(wǎng)絡(luò)信息資源。特別是受到學(xué)者、學(xué)生、研究者等青睞的學(xué)術(shù)隱蔽網(wǎng)絡(luò)信息資源,更是難以獲取。如何有效應(yīng)對(duì)隱蔽網(wǎng)絡(luò)信息資源是一個(gè)值得研究的課題。

      1 隱蔽網(wǎng)絡(luò)概述

      1.1 隱蔽網(wǎng)絡(luò)定義

      1994年Dr.Jill Ellsworth 第一次在互聯(lián)網(wǎng)領(lǐng)域使用Invisible Web這個(gè)概念,它指的是那些使用常規(guī)搜索引擎很難發(fā)現(xiàn)的信息內(nèi)容[1]。2001年,Gary Price 、Christ Sherman合著了《隱蔽網(wǎng)絡(luò):揭開(kāi)搜索引擎看不到的信息源》,書(shū)中他們把隱蔽網(wǎng)絡(luò)定義為:通過(guò)互聯(lián)網(wǎng)能夠獲取,但由于技術(shù)原因普通搜索引擎不能夠獲取,或者是不作為索引的那部分文件、文本頁(yè)又或者是其他權(quán)威性、高質(zhì)量的信息[2]。在國(guó)外Invisible Web又有Dark Matter、Deep Web或者Dark Net等等說(shuō)法,譯成中文就是“深層網(wǎng)絡(luò)”、“隱蔽網(wǎng)絡(luò)”、“看不見(jiàn)的網(wǎng)絡(luò)”、“黑色網(wǎng)絡(luò)”或者“深網(wǎng)”。

      1.2 隱蔽網(wǎng)絡(luò)的形成原因及類型

      Garry Price, Chris Sherman把隱蔽網(wǎng)絡(luò)分為四類,分別是私人網(wǎng)絡(luò)、不透明網(wǎng)絡(luò)、專有網(wǎng)絡(luò)和真正的不透明網(wǎng)絡(luò)。

      1.2.1 形成原因

      1)技術(shù)原因。網(wǎng)絡(luò)內(nèi)容采用HTML的互聯(lián)網(wǎng)發(fā)展初期,網(wǎng)絡(luò)結(jié)構(gòu)為樹(shù)型目錄式,使用者通過(guò)點(diǎn)擊超鏈接的方式訪問(wèn)網(wǎng)頁(yè)。這種實(shí)現(xiàn)網(wǎng)上數(shù)據(jù)搜集的方式是通過(guò)“蜘蛛spiders”、“爬行者crawlers”等自動(dòng)化軟件進(jìn)入網(wǎng)站、找到那些新建網(wǎng)頁(yè)。隨著技術(shù)的進(jìn)步,目前的網(wǎng)站運(yùn)用新的技術(shù),網(wǎng)絡(luò)內(nèi)容除了HTML外還有聲像、圖片等。常規(guī)搜索引擎對(duì)于聲像、圖片等的索引能力有限,不能處理特殊格式的文件,對(duì)于個(gè)性化的知識(shí)、區(qū)域性的知識(shí)及專業(yè)性的知識(shí)也就更無(wú)能為力。當(dāng)網(wǎng)站注冊(cè)哪個(gè)搜索引擎的時(shí)候,這個(gè)網(wǎng)站會(huì)被這個(gè)搜索引擎搜到。但如果這個(gè)網(wǎng)站含有當(dāng)?shù)財(cái)?shù)據(jù)庫(kù)的很多信息會(huì)限制搜索引擎的搜索功能。數(shù)據(jù)庫(kù)和基于數(shù)據(jù)庫(kù)的網(wǎng)站含有非文本信息、數(shù)據(jù)庫(kù)文檔等,這些文件需要特殊的命令才能夠檢索到,所以這是隱蔽網(wǎng)絡(luò)信息形成的最大的技術(shù)障礙。隱蔽網(wǎng)絡(luò)的核心部分是數(shù)據(jù)庫(kù)內(nèi)容,一般搜索引擎很難跨過(guò)數(shù)據(jù)庫(kù)入口設(shè)置的賬號(hào)、密碼等的提問(wèn)。一些存在數(shù)據(jù)庫(kù)的站點(diǎn)也會(huì)阻礙網(wǎng)絡(luò)蜘蛛在動(dòng)態(tài)網(wǎng)頁(yè)中的行動(dòng)。

      2)非技術(shù)原因。首先網(wǎng)頁(yè)中有復(fù)雜的信息,有用的、無(wú)用的、;科學(xué)的、隨意的,那些未經(jīng)過(guò)論證不知真?zhèn)蔚男畔⒈凰阉髡邫z索到會(huì)有一定的誤導(dǎo)作用。對(duì)于這些繁雜的信息,多數(shù)搜索引擎會(huì)采取一定措施進(jìn)行管理,這種管理有時(shí)候也會(huì)剔除有用的信息,那些有用信息就會(huì)變成隱蔽信息。其次,如若要求搜索引擎對(duì)網(wǎng)絡(luò)中網(wǎng)頁(yè)有較高的索引率,則需要高的成本去進(jìn)行開(kāi)發(fā)和維護(hù)。一般的網(wǎng)絡(luò)公司并不想要索引這些非HTML格式的文件,因?yàn)檫@些文件搜索時(shí)要么需要跟進(jìn)實(shí)時(shí)信息占用很多搜索引擎,要么花費(fèi)很多。目前,只有極少數(shù)的搜索引擎能夠有財(cái)力、物力去維持網(wǎng)頁(yè)覆蓋率,這也造成隱蔽網(wǎng)絡(luò)信息的產(chǎn)生。再者,一些經(jīng)營(yíng)網(wǎng)站的人,把大多數(shù)的內(nèi)容封閉起來(lái),只對(duì)公司內(nèi)部員工或者注冊(cè)的用戶開(kāi)放。這種情況下,即使是最好的搜索引擎也無(wú)法透過(guò)注冊(cè)過(guò)程進(jìn)行搜索[3]。

      1.2.2 類型

      隱蔽網(wǎng)絡(luò)的形成除了技術(shù)原因、經(jīng)濟(jì)原因外,還有知識(shí)產(chǎn)權(quán)方面的原因。根據(jù)隱蔽網(wǎng)絡(luò)形成的原因,本文將隱蔽網(wǎng)絡(luò)以下七種:需密碼或者是注冊(cè)的網(wǎng)站、網(wǎng)上可檢索的數(shù)據(jù)庫(kù)、實(shí)時(shí)數(shù)據(jù)、未被鏈接的網(wǎng)頁(yè)、動(dòng)態(tài)生成的網(wǎng)頁(yè)、部分非HTML格式文件和其他難搜索的信息。

      2 圖書(shū)館開(kāi)發(fā)隱蔽網(wǎng)絡(luò)信息資源的意義

      圖書(shū)館的主要工作是為檢索者提供高質(zhì)量的學(xué)術(shù)信息,隱蔽網(wǎng)絡(luò)信息資源數(shù)量大、發(fā)展快、質(zhì)量高、專業(yè)性強(qiáng)而且成本低廉,這些剛好符合圖書(shū)館對(duì)網(wǎng)絡(luò)信息資源的要求。所以有必要對(duì)隱蔽網(wǎng)絡(luò)信息進(jìn)行開(kāi)發(fā)利用。圖書(shū)館開(kāi)發(fā)隱蔽網(wǎng)絡(luò)資源可以提高其資源的供給能力。自建數(shù)據(jù)庫(kù)與商業(yè)數(shù)據(jù)庫(kù)是目前圖書(shū)館兩種主要的館藏資源,商業(yè)數(shù)據(jù)庫(kù)的使用需要向數(shù)據(jù)庫(kù)提供商繳納巨額費(fèi)用。圖書(shū)館的經(jīng)費(fèi)有限,一般情況下只能購(gòu)買(mǎi)有限的數(shù)據(jù)庫(kù)使用權(quán)和有限的用戶使用額度,特別是外文數(shù)據(jù)庫(kù),只夠幾個(gè)人同時(shí)在線運(yùn)用,而且查找的內(nèi)容往往只有文摘部分。圖書(shū)館的自建數(shù)據(jù)庫(kù)常常是針對(duì)某一個(gè)主題進(jìn)行的,數(shù)量少、建設(shè)時(shí)間長(zhǎng)。這兩種主要的資源并不能滿足檢索者對(duì)資源的需求。不過(guò)隱蔽網(wǎng)絡(luò)信息資源中的大部分?jǐn)?shù)據(jù)庫(kù)是免費(fèi)的,并且信息專業(yè)性強(qiáng),圖書(shū)館如果應(yīng)對(duì)得當(dāng),可以擴(kuò)充館里面的館藏資源,提升信息資源的供給能力,同時(shí)也不用付出高昂的建設(shè)費(fèi)或者使用費(fèi),也可以向讀者提供更多更高質(zhì)量的信息資源。圖書(shū)館應(yīng)對(duì)隱蔽網(wǎng)絡(luò)信息資源可以滿足讀者對(duì)信息資源的深層次需求。讀者的學(xué)習(xí)及科研逐步依賴于網(wǎng)絡(luò)信息資源,要求高質(zhì)量的信息資源、有深度的信息內(nèi)容、針對(duì)問(wèn)題的全面信息、專業(yè)性強(qiáng)且要有相關(guān)性,這些都是傳統(tǒng)的搜索引擎無(wú)法達(dá)到的。某些隱蔽網(wǎng)絡(luò)信息資源的專業(yè)性強(qiáng)的特點(diǎn)可以滿足讀者的一些需求,問(wèn)題是一些讀者并不知道隱蔽網(wǎng)絡(luò)資源的存在,依舊依賴于傳統(tǒng)搜索引擎,再者讀者即使知道也沒(méi)有時(shí)間和精力去專門(mén)搜索。因此圖書(shū)館有責(zé)任通過(guò)對(duì)隱蔽網(wǎng)絡(luò)的信息資源的說(shuō)明和索引讓讀者重新認(rèn)識(shí)網(wǎng)絡(luò)信息資源,為其縮短檢索時(shí)間,提高讀者的檢索質(zhì)量,從而使讀者獲取更深層次的資源信息。圖書(shū)館應(yīng)對(duì)隱蔽網(wǎng)絡(luò)信息可以發(fā)揮館的優(yōu)勢(shì),滿足自身的發(fā)展需求。在網(wǎng)絡(luò)的時(shí)代,信息蘊(yùn)藏著商機(jī),網(wǎng)絡(luò)信息資源的開(kāi)發(fā)利用為傳統(tǒng)信息服務(wù)業(yè)注入新的活力。圖書(shū)館在信息的組織、檢查、建設(shè)數(shù)據(jù)庫(kù)方面具有優(yōu)勢(shì),特別是信息資源的再開(kāi)發(fā)重組等方面,因此,發(fā)掘出隱蔽網(wǎng)絡(luò)中質(zhì)量高但還沒(méi)有引起多數(shù)人重視的信息資源可以使圖書(shū)館資源更具價(jià)值與特色[4]。

      3 圖書(shū)館應(yīng)對(duì)策略

      圖書(shū)館作為信息資源的提供者與利用者,以及信息時(shí)代下網(wǎng)絡(luò)信息資源的組織導(dǎo)航者,已然意識(shí)到隱蔽網(wǎng)絡(luò)信息資源的價(jià)值與潛力。圖書(shū)館可以從以下幾個(gè)方面考慮應(yīng)對(duì)隱蔽網(wǎng)絡(luò)信息資源。

      3.1 圖書(shū)館網(wǎng)站信息結(jié)構(gòu)盡可能平面化

      搜索引擎的搜索深度有限,深層次的網(wǎng)絡(luò)頁(yè)面存在于隱蔽網(wǎng)絡(luò)中不為讀者知道。因此,圖書(shū)館網(wǎng)站信息可以采用平面化的結(jié)構(gòu),盡可能的把網(wǎng)絡(luò)做小。如若內(nèi)容太多,可以通過(guò)建立姐妹站點(diǎn)的分布式方式來(lái)容納資源。

      3.2 圖書(shū)館網(wǎng)絡(luò)信息資源盡可能文本化

      網(wǎng)絡(luò)信息資源的非文本化是隱蔽網(wǎng)絡(luò)形成的原因之一。目前多媒體技術(shù)尚不夠成熟,如要避免使網(wǎng)站中的信息成為隱蔽網(wǎng)絡(luò)信息,最好是將非文本資源文本化:在非文本元素的代碼中運(yùn)用包含關(guān)鍵詞的Alt屬性標(biāo)簽說(shuō)明、盡量少用Flash、減少純圖像網(wǎng)頁(yè)、在URL中列出非文本元素鏈接的文本描述。

      3.3 建立學(xué)科信息資源指引庫(kù)或者隱蔽網(wǎng)絡(luò)的導(dǎo)航

      圖書(shū)館可以組織館員根據(jù)一些重點(diǎn)學(xué)科或者專業(yè),多角度、多途徑的篩選、過(guò)濾、重組分散于某一些學(xué)科中的學(xué)術(shù)隱蔽網(wǎng)絡(luò)資源,從而建立出相應(yīng)的學(xué)科信息資源指引庫(kù)或者是隱蔽網(wǎng)絡(luò)導(dǎo)航,把它放在圖書(shū)館主頁(yè)上面,力圖做到具有專業(yè)性與特色性。

      3.4 將隱蔽網(wǎng)絡(luò)作為讀者教育的一個(gè)內(nèi)容

      美國(guó)蘭格地亞社區(qū)學(xué)院圖書(shū)館曾把隱蔽網(wǎng)絡(luò)當(dāng)作“圖書(shū)館研究指南”講座的開(kāi)聲白;加州大學(xué)開(kāi)設(shè)了隱蔽網(wǎng)絡(luò)教程。這樣做不僅能激發(fā)讀者探索網(wǎng)絡(luò)的好奇心更能提高其網(wǎng)絡(luò)信息搜搜能力。教育的方式多種多樣,可以在教學(xué)過(guò)程中進(jìn)行,也可以結(jié)合一些培訓(xùn)課程,在實(shí)際操作過(guò)程中講解檢索的技巧。圖書(shū)館的教育活動(dòng)除了以講座、報(bào)告、學(xué)術(shù)活動(dòng)進(jìn)行以外,還可以用電子郵件、網(wǎng)頁(yè)留言等方式主動(dòng)向讀者、科研人員推送。

      3.5 提高圖書(shū)館電子資源的可見(jiàn)度

      可以通過(guò)組織統(tǒng)一檢索平臺(tái)或者元搜索引擎實(shí)現(xiàn),具體方法可以有:整合電子資源與OPAC、通過(guò)OPAC檢索其他圖書(shū)館信息。美國(guó)的Texas大學(xué),利用Z39.50協(xié)議連接了二十五所高校圖書(shū)館、六十所公共圖書(shū)館[5]。

      3.6 提供一些網(wǎng)絡(luò)指南

      搜索引擎對(duì)于專業(yè)數(shù)據(jù)庫(kù)無(wú)能為力,檢索者可以“迂回”查找隱蔽網(wǎng)絡(luò)資源,著名搜索引擎比如Google、Yahoo!等提供了查找數(shù)據(jù)庫(kù)的功能[6]。檢索者如要查找某個(gè)主題的信息內(nèi)容,運(yùn)用Google、Yahoo!等先找到有關(guān)于這個(gè)主題的數(shù)據(jù)庫(kù)網(wǎng)址,檢索者再根據(jù)這些數(shù)據(jù)庫(kù)網(wǎng)址進(jìn)入相應(yīng)的主頁(yè),進(jìn)而獲取深層次的隱蔽網(wǎng)絡(luò)信息。這主要是通過(guò)搜索主題詞加database進(jìn)行查找,但這種方式比較費(fèi)用費(fèi)力,搜到的信息可能并不全面。

      3.7 建立隱蔽網(wǎng)絡(luò)專門(mén)目錄

      有很多的公司和網(wǎng)站已經(jīng)開(kāi)始建立新的搜索工具,用來(lái)查找專業(yè)數(shù)據(jù)庫(kù)中的深層信息,致力于發(fā)掘高價(jià)值信息。Http://lii.org/包含可見(jiàn)資源與不可見(jiàn)資源、一萬(wàn)四千多個(gè)網(wǎng)站的有評(píng)注的主題目錄,經(jīng)過(guò)圖書(shū)館員篩選值得信賴。Garry Price, Chris Sherman創(chuàng)辦的Http://www.invisible-web.net/用于檢索Invisible Web資源,該網(wǎng)站價(jià)值高、資源廣博。Http://www.freepint.com/gary/direct.htm擁有龐大數(shù)據(jù)的Invisible Web資源鏈接,用于檢索隱蔽網(wǎng)絡(luò)的權(quán)威網(wǎng)站。Http://www.academicinfo.net是一個(gè)學(xué)術(shù)資源主題指南,提供大學(xué)生研究論文、教授學(xué)習(xí)計(jì)劃的素材。除此之外,F(xiàn)indLaw,Profusion,InfoMine等等都是檢索Invisible Web的指南工具[7]。

      受研究局限性所限,圖書(shū)館應(yīng)對(duì)隱蔽網(wǎng)絡(luò)信息資源的方法還有待補(bǔ)充完善,圖書(shū)館從自身層面做出應(yīng)對(duì)網(wǎng)絡(luò)隱蔽信息的努力,不過(guò)有效的信息資源控制是全面的,從人類整體利益來(lái)看網(wǎng)絡(luò)信息管理應(yīng)該和圖書(shū)館的事業(yè)一樣,實(shí)行終身制,這個(gè)只有政府能夠長(zhǎng)久維持。單個(gè)組織或個(gè)人不能夠很好的解決這一問(wèn)題,應(yīng)從更高的層面著手。

      參考文獻(xiàn)

      [1]梁平,陳紅勤.網(wǎng)絡(luò)信息資源理論與實(shí)踐研究[M].北京:中國(guó)書(shū)籍出版社,2012.

      [2]]劉宏軍,李勝.隱蔽網(wǎng)絡(luò)資源的采集與整合[J].情報(bào)資料工作,2007,(1).

      [3]梁煥平.隱蔽網(wǎng)絡(luò)及其檢索策略研究[J].情報(bào)雜志,2004,(7).

      [4]王子熙.高校圖書(shū)館隱蔽網(wǎng)絡(luò)資源的開(kāi)發(fā)利用[J].新世紀(jì)圖書(shū)館,2007,(2).

      [5]沈健,李文波.隱形網(wǎng)絡(luò):圖書(shū)館應(yīng)用現(xiàn)狀及開(kāi)發(fā)策略[J].圖書(shū)館論壇,2006(5):125-127.

      [6]Gary Price,Chris Sherman[J].Exploring the invisible Web.On-line,2001,25(4):32-34.

      [7]劉雅晴.隱蔽網(wǎng)絡(luò)及其資源檢索策略研究[J].情報(bào)科學(xué),2006,(5).

      猜你喜歡
      搜索引擎圖書(shū)館
      圖書(shū)館
      文苑(2019年20期)2019-11-16 08:52:12
      時(shí)間重疊的圖書(shū)館
      文苑(2018年17期)2018-11-09 01:29:40
      圖書(shū)館
      飛躍圖書(shū)館
      網(wǎng)絡(luò)搜索引擎亟待規(guī)范
      Nutch搜索引擎在網(wǎng)絡(luò)輿情管控中的應(yīng)用
      基于Nutch的醫(yī)療搜索引擎的研究與開(kāi)發(fā)
      去圖書(shū)館
      廣告主與搜索引擎的雙向博弈分析
      知識(shí)漫畫(huà)
      如东县| 阿坝县| 浑源县| 佛山市| 扶余县| 陕西省| 南靖县| 呼图壁县| 叶城县| 大余县| 神池县| 许昌县| 英山县| 禹城市| 永新县| 延庆县| 平和县| 天祝| 锡林浩特市| 嘉禾县| 胶南市| 偃师市| 杨浦区| 界首市| 婺源县| 东明县| 安图县| 开鲁县| 邮箱| 米泉市| 金溪县| 莱西市| 兴业县| 江阴市| 原平市| 寻乌县| 肥乡县| 平顺县| 阜城县| 边坝县| 启东市|