• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      一種基于大數(shù)據(jù)的數(shù)字圖書館高效搜索引擎

      2015-01-09 12:20陳臣陳雙飛
      現(xiàn)代情報(bào) 2014年1期

      陳臣+陳雙飛

      〔摘 要〕本文設(shè)計(jì)

      了一種基于大數(shù)據(jù)的數(shù)字圖書館高效搜索引擎?該搜索引擎可準(zhǔn)確理解讀者的需求,節(jié)省了

      搜索時(shí)間,提高了查詢效率,并能夠減少資源定位時(shí)間,提高檢索查全率?

      〔關(guān)鍵詞〕大數(shù)據(jù);數(shù)字圖書館;

      高效搜索引擎

      DOI:10.3969/j

      .issn.1008-0821.2014.01.011

      〔中圖分類號〕G250.76 〔文獻(xiàn)標(biāo)識碼〕A 〔文章編

      號〕1008-0821(2014)01-0049-03

      A Kind of Efficient Search Engin

      e for Digital Library Based on Big Data

      Chen Chen1 Chen Shuangfei2

      (1.Network Center,Lanzhou University of Finance and Economics,Lanzhou 73002

      0,China;

      2.School of Information Engineering,Lanzhou University of Finance and Economi

      cs,Lanzhou 730020,China)

      〔Abstract〕”BZ〗This paper designed a kind of efficient search engine for digital librar

      y based on big data.It can realize the accurate understanding of the users nee

      ds of information,save search time and improve query efficiency,reduce resource

      locating time and increase retrieval accuracy.

      〔Key words〕big data;digital

      library;efficient search engine

      隨著大數(shù)據(jù)時(shí)代的到來,大數(shù)據(jù)已經(jīng)滲透到圖書館管理?運(yùn)營?服務(wù)和變革過程的每一

      個(gè)環(huán)節(jié),成為關(guān)系圖書館基礎(chǔ)設(shè)施建設(shè)?服務(wù)模式與內(nèi)容變革?讀者個(gè)性化服務(wù)有效性保障

      和可持續(xù)發(fā)展的重要因素?

      圖書館大數(shù)據(jù)環(huán)境具有數(shù)據(jù)量大(Volume)?類型繁多(Variety)?價(jià)值密度低(Value)

      ?處理速度快和時(shí)效高(Velocity)的4個(gè)特征?如何在復(fù)雜的大數(shù)據(jù)環(huán)境中高效搜索?抓

      取?管理和處理價(jià)值數(shù)據(jù),是圖書館準(zhǔn)確配置服務(wù)資源?提高服務(wù)效率與能力?即時(shí)發(fā)現(xiàn)讀

      者個(gè)性化需求,以及增強(qiáng)市場競爭力和用戶滿意度的關(guān)鍵?因此,大數(shù)據(jù)時(shí)代圖書館應(yīng)加強(qiáng)

      以用戶為核心的搜索引擎建設(shè),為圖書館運(yùn)營管理和用戶服務(wù)提供可靠的大數(shù)據(jù)搜索?數(shù)據(jù)

      價(jià)值發(fā)現(xiàn)支持[1]?

      1 大數(shù)據(jù)時(shí)代數(shù)字圖書館數(shù)據(jù)搜索的

      需求與特點(diǎn)

      1.1 讀者的個(gè)性化搜索需求

      大數(shù)據(jù)時(shí)代,以讀者為核心的用戶個(gè)性化需求發(fā)現(xiàn)和數(shù)據(jù)價(jià)值挖掘,成為搜索引擎設(shè)計(jì)與應(yīng)

      用的重要依據(jù)?首先,搜索引擎應(yīng)根據(jù)采集的讀者閱讀行為與個(gè)人特征大數(shù)據(jù)信息,準(zhǔn)確判

      定用戶數(shù)據(jù)搜索的內(nèi)容需求?興趣愛好與價(jià)值特征,確保為讀者提供可定制的個(gè)性化數(shù)據(jù)搜

      索服務(wù)?其次,搜索引擎必須改變依據(jù)用戶輸入“關(guān)鍵字”進(jìn)行數(shù)據(jù)檢索的傳統(tǒng)模式,應(yīng)具

      備用戶語意分析和人機(jī)對話的功能?通過人機(jī)信息交互保證個(gè)性化數(shù)據(jù)搜索內(nèi)容全面?準(zhǔn)確

      ?經(jīng)濟(jì)和可用?第三,搜索引擎應(yīng)準(zhǔn)確跟蹤?分析和判定讀者需求變化,可依據(jù)讀者需求對

      搜索引擎系統(tǒng)參數(shù)?搜索算法和用戶需求進(jìn)行動(dòng)態(tài)調(diào)整,保證搜索引擎的讀者個(gè)性化搜索活

      動(dòng)具有較強(qiáng)的自適應(yīng)能力?

      1.2 搜索引擎依據(jù)讀者需求實(shí)時(shí)優(yōu)化的需求

      圖書館大數(shù)據(jù)環(huán)境除數(shù)據(jù)海量?類型繁多?價(jià)值密度低?處理速度快和時(shí)效高外,還具有數(shù)

      據(jù)結(jié)構(gòu)復(fù)雜和信息更新速度快的特點(diǎn)?因此,圖書館應(yīng)根據(jù)數(shù)據(jù)環(huán)境和讀者搜索需求變化趨

      勢,按照讀者需求對搜索引擎實(shí)時(shí)優(yōu)化,確保搜索引擎安全?高效?可用和經(jīng)濟(jì)?

      首先,圖書館應(yīng)根據(jù)搜索引擎運(yùn)行效率和可用性評估結(jié)果,提高搜索引擎對高數(shù)據(jù)價(jià)值網(wǎng)站

      搜索的頻率和準(zhǔn)確性,保證讀者數(shù)據(jù)搜索過程能夠預(yù)測?控制和搜索效率最優(yōu)?其次,搜索

      引擎在對圖書館和第三方服務(wù)商資源檢索時(shí),須準(zhǔn)確判定所搜索內(nèi)容是否依據(jù)數(shù)據(jù)價(jià)值量和

      讀者需求進(jìn)行自然排序,而不是依靠用戶點(diǎn)擊率和關(guān)鍵詞競價(jià)排名?第三,圖書館應(yīng)根據(jù)讀

      者數(shù)據(jù)搜索習(xí)慣來優(yōu)化網(wǎng)站和大數(shù)據(jù)資源,提高價(jià)值關(guān)鍵詞在搜索引擎的排名,增強(qiáng)搜索引

      擎的易用性[2]?

      1.3 閱讀終端具有移動(dòng)搜索功能需求

      大數(shù)據(jù)時(shí)代,圖書館應(yīng)支持任意讀者可在任何時(shí)間?任何地點(diǎn)以任何方式進(jìn)行閱讀?因此,

      用戶終端的移動(dòng)閱讀和移動(dòng)搜索能力,將會(huì)嚴(yán)重影響讀者的閱讀有效性和滿意度?

      首先,基于網(wǎng)頁的傳統(tǒng)搜索模式因資源數(shù)據(jù)量巨大和檢索過程操作復(fù)雜,并對數(shù)據(jù)傳輸網(wǎng)絡(luò)

      與閱讀終端性能要求高,導(dǎo)致傳統(tǒng)的搜索引擎技術(shù)無法滿足閱讀終端的移動(dòng)搜索需要?其次endprint

      ,基于Web協(xié)議的傳統(tǒng)搜索引擎無法全面索引來自客戶端應(yīng)用和網(wǎng)頁的內(nèi)容,難以直接調(diào)用

      客戶端應(yīng)用程序而有效讀取已檢索數(shù)據(jù)?第三,用戶使用搜索引擎的便捷性?個(gè)性化服務(wù)能

      力?響應(yīng)速度和讀者隱私保護(hù)能力需求,大幅度增強(qiáng)了搜索引擎設(shè)計(jì)與應(yīng)用的難度?

      1.4 以用戶為核心的搜索引擎設(shè)計(jì)需求

      大數(shù)據(jù)時(shí)代,讀者在年齡?文化水平?閱讀需求和閱讀社會(huì)關(guān)系上具有較大差異性?因此,

      不同的讀者具有不同的閱讀與大數(shù)據(jù)搜索需求?圖書館可依據(jù)讀者的不同需求,將讀者劃分

      為不同的用戶群,并提供可定制的個(gè)性化服務(wù)?

      以用戶為核心的搜索引擎設(shè)計(jì),首先,須準(zhǔn)確理解讀者數(shù)據(jù)檢索的個(gè)性化需求,保證所搜索

      的內(nèi)容精確和滿足用戶需求,具有安全?全面?精確和快速的特點(diǎn)?其次,搜索引擎應(yīng)根據(jù)

      所采集的讀者閱讀行為大數(shù)據(jù)信息,準(zhǔn)確預(yù)測?判定和識別用戶的數(shù)據(jù)搜索真實(shí)意圖,并對

      所搜索到的相關(guān)海量數(shù)據(jù)進(jìn)行查找與匹配,以及依據(jù)用戶需求和價(jià)值可用性對已搜索數(shù)據(jù)進(jìn)

      行排序?第三,搜索引擎應(yīng)準(zhǔn)確判斷擬檢索網(wǎng)站?大數(shù)據(jù)庫資源的可信度和用戶相關(guān)性,并

      結(jié)合讀者個(gè)性化搜索需求對圖書館服務(wù)資源?第三方服務(wù)商和相關(guān)網(wǎng)站的可用性進(jìn)行排名,

      利用排名結(jié)果來確定數(shù)據(jù)搜索和內(nèi)容展示的次序,不斷提高搜索引擎的智慧搜索能力[

      3]?

      1.5 搜索引擎應(yīng)具備“機(jī)器學(xué)習(xí)”的智慧功能

      大數(shù)據(jù)時(shí)代,準(zhǔn)確理解讀者數(shù)據(jù)搜索意圖?直接制定與表現(xiàn)搜索策略?可提供場景式對話搜

      索功能,是圖書館智慧搜索引擎的主要特征?

      首先,圖書館應(yīng)實(shí)現(xiàn)搜索引擎“機(jī)器學(xué)習(xí)”的智慧功能?搜索引擎可根據(jù)讀者關(guān)鍵詞輸入和

      用戶語意分析與表現(xiàn),準(zhǔn)確分析?判定和補(bǔ)充讀者的真實(shí)語意,并解決數(shù)據(jù)搜索過程中的多

      文本近義問題?其次,搜索引擎應(yīng)通過“機(jī)器學(xué)習(xí)”過程,實(shí)現(xiàn)圖像數(shù)據(jù)的準(zhǔn)確識別和搜索

      ,并對所搜索數(shù)據(jù)進(jìn)行準(zhǔn)確的內(nèi)容表示?語意判定?圖片分類與存儲(chǔ),為讀者提供“即搜即

      得”的服務(wù)?第三,搜索引擎應(yīng)通過“機(jī)器學(xué)習(xí)”過程,當(dāng)大數(shù)據(jù)平臺(tái)有新的數(shù)據(jù)注入時(shí)進(jìn)

      行自我補(bǔ)充和完善,保持一個(gè)不斷驗(yàn)證和更新的動(dòng)態(tài)數(shù)據(jù)緩存,確保數(shù)據(jù)搜索過程隨著“機(jī)

      器學(xué)習(xí)”的深入,而更加實(shí)時(shí)?精確和具有相關(guān)性?

      2 基于大數(shù)據(jù)的數(shù)字圖書館高效搜索

      引擎設(shè)計(jì)

      2.1 基于讀者個(gè)性化需求的搜索引擎設(shè)計(jì)

      大數(shù)據(jù)時(shí)代,圖書館搜索引擎由搜索器?索引器?檢索器和用戶接口4個(gè)部分組成?搜索過

      程主要通過網(wǎng)絡(luò)爬蟲自動(dòng)獲取網(wǎng)頁內(nèi)容,然后對檢索內(nèi)容進(jìn)行信息提取?建立索引和對原有

      索引庫更新,最后根據(jù)用戶輸入的關(guān)鍵字在索引庫檢索數(shù)據(jù),并將輸出結(jié)果排序后交給發(fā)起

      請求的終端?

      基于讀者個(gè)性化需求的搜索引擎設(shè)計(jì),應(yīng)根據(jù)用戶搜索需求和習(xí)慣,定制具有個(gè)性化特征的

      讀者數(shù)據(jù)搜索模型?當(dāng)不同的用戶輸入相同關(guān)鍵詞時(shí),圖書館搜索引擎會(huì)為不同讀者反饋精

      確?惟一?高價(jià)值和個(gè)性化的數(shù)據(jù)查詢結(jié)果?首先,個(gè)性化的讀者數(shù)據(jù)搜索模型定制,應(yīng)構(gòu)

      建于對所采集的讀者搜索歷史數(shù)據(jù)?讀者網(wǎng)絡(luò)瀏覽記錄?用戶閱讀關(guān)系數(shù)據(jù)?讀者在論壇與

      博客發(fā)表信息分析的基礎(chǔ)上,明確用戶的搜索需求?檢索興趣與習(xí)慣?檢索行為和搜索策略

      之間的關(guān)聯(lián)性,保證搜索過程安全?高效?易控和經(jīng)濟(jì)?其次,搜索引擎應(yīng)根據(jù)讀者需求和

      搜索行為評估數(shù)據(jù),通過構(gòu)建空間向量模型來保證在用戶需求?檢索效率?搜索成本和數(shù)據(jù)

      可用性上的最優(yōu)化配置?第三,搜索引擎須保證大數(shù)據(jù)復(fù)雜環(huán)境下的圖書館管理與讀者閱讀

      需求,應(yīng)具備用戶需求發(fā)現(xiàn)?搜索有效性評估?新信息與熱點(diǎn)發(fā)現(xiàn)?搜索內(nèi)容分析與統(tǒng)計(jì)?

      分類過濾?文檔去重與信息自動(dòng)摘要?數(shù)據(jù)模式自動(dòng)識別與轉(zhuǎn)換等功能[4]?

      2.2 突出搜索引擎的用戶個(gè)性化服務(wù)功能

      大數(shù)據(jù)時(shí)代,圖書館應(yīng)加強(qiáng)搜索引擎的個(gè)性化服務(wù)功能,才能提高讀者在復(fù)雜大數(shù)據(jù)環(huán)境下

      信息檢索的安全性?效率?價(jià)值密度?經(jīng)濟(jì)性和可用性?

      首先,圖書館在搜索引擎檢索算法設(shè)計(jì)中,應(yīng)將讀者數(shù)據(jù)搜索的效率和價(jià)值密度放在首位?

      確保數(shù)據(jù)搜索過程能夠以讀者需求為依據(jù),為與讀者有較高價(jià)值關(guān)聯(lián)性和價(jià)值密度的數(shù)據(jù),

      分配相應(yīng)的搜索和優(yōu)先展示權(quán)重,保證用戶具有較高的搜索體驗(yàn)度?其次,搜索引擎應(yīng)根據(jù)

      讀者數(shù)據(jù)檢索習(xí)慣和愛好,由用戶自主個(gè)性化定制檢索界面和檢索模式?此外,搜索引擎還

      應(yīng)具備較強(qiáng)的人機(jī)對話功能,能夠?yàn)樽x者提供個(gè)性化數(shù)據(jù)搜索推薦服務(wù)?第三,搜索引擎應(yīng)

      通過對讀者閱讀和數(shù)據(jù)檢索行為的準(zhǔn)確分析,更深入?細(xì)致地掌握用戶檢索的需求與過程,

      在保證搜索平臺(tái)開放性和公平性的前提下,降低搜索成本和提高數(shù)據(jù)搜索效率?

      2.3 實(shí)現(xiàn)搜索引擎的智慧搜索功能

      大數(shù)據(jù)時(shí)代,數(shù)據(jù)存儲(chǔ)的模式和表示方式呈現(xiàn)復(fù)雜?多樣化特征,不同讀者在搜索數(shù)據(jù)語意

      表示上具有多樣性?隱性?抽象和基于對話的特點(diǎn)?因此,實(shí)現(xiàn)搜索引擎的智慧搜索功能,

      是明確讀者數(shù)據(jù)搜索意圖和實(shí)現(xiàn)精確查詢的關(guān)鍵?

      首先,圖書館應(yīng)利用分詞技術(shù),根據(jù)用戶服務(wù)信息的類別和表示模式進(jìn)行分類歸檔?當(dāng)讀者

      搜索信息時(shí),可依據(jù)信息所處索引庫的位置,而實(shí)現(xiàn)數(shù)據(jù)的快速?準(zhǔn)確搜索?其次,圖書館endprint

      搜索引擎應(yīng)具備用戶語義發(fā)現(xiàn)?分析和判斷功能,可通過對讀者輸入詞的分析而明確用戶真

      實(shí)意圖,并在索引庫中查詢與用戶搜索目標(biāo)最接近的文檔和數(shù)據(jù)?第三,圖書館應(yīng)根據(jù)大數(shù)

      據(jù)信息庫數(shù)據(jù)?第三方服務(wù)商網(wǎng)站資源?用戶社會(huì)關(guān)系表示,構(gòu)建一個(gè)以讀者為中心的巨大

      信息關(guān)系圖譜?當(dāng)讀者搜索未知數(shù)據(jù)和隱性信息時(shí),可通過“圖譜搜索”檢索出與所搜索內(nèi)

      容相關(guān)的文本?圖片?音頻?視頻和數(shù)據(jù)關(guān)系等信息,確保用戶個(gè)性化搜索數(shù)據(jù)具有全面?

      精確?深度和可靠的特點(diǎn)[5]?

      2.4 確保搜索引擎的有效性評估內(nèi)容全面?易控和可操作

      圖書館應(yīng)量化搜索引擎檢索過程的安全性?效率?檢索價(jià)值密度?用戶相關(guān)性?檢索結(jié)果?

      用戶友好性與交互性等指標(biāo)內(nèi)容,為搜索引擎設(shè)計(jì)與優(yōu)化提供可靠的數(shù)據(jù)支持,保證搜索引

      擎評估具有科學(xué)性?可控性和可操作性?

      根據(jù)大數(shù)據(jù)時(shí)代復(fù)雜數(shù)據(jù)環(huán)境和讀者個(gè)性化檢索需求,搜索引擎評估主要可分為檢索安全可

      靠性?檢索界面友好性?數(shù)據(jù)搜索性能?檢索的輸入與輸出模式4個(gè)方面內(nèi)容?檢索安全可

      靠性主要由搜索引擎系統(tǒng)結(jié)構(gòu)的科學(xué)性?安全健壯性?安全防御能力?用戶隱私保護(hù)性等方

      面組成?檢索界面友好性主要分為用戶可操作性?系統(tǒng)可管與可控性?數(shù)據(jù)搜索成本?用戶

      相關(guān)性?用戶滿意度等?數(shù)據(jù)搜索性能主要分為檢索相關(guān)度?精確度?時(shí)效性?檢索數(shù)據(jù)的

      價(jià)值密度?用戶檢索成本等?檢索的輸入與輸出模式,主要指搜索引擎輸入與輸出界面的友

      好性?語義表現(xiàn)能力?管理與使用復(fù)雜度?用戶交互性?

      2.5 利用搜索引擎檢索規(guī)則來優(yōu)化圖書館大數(shù)據(jù)資源

      圖書館大數(shù)據(jù)環(huán)境具有海量?復(fù)雜?價(jià)值密度低和處理時(shí)效高的特點(diǎn)?因此,如果圖書館不

      依據(jù)搜索引擎運(yùn)行規(guī)則,對管理與服務(wù)大數(shù)據(jù)資源庫進(jìn)行優(yōu)化,將會(huì)導(dǎo)致搜索引擎查詢數(shù)據(jù)

      量巨大?檢索深度與精度不高?成本上升和用戶滿意度下降的情況出現(xiàn)?因此,必須利用搜

      索引擎運(yùn)行規(guī)則對圖書館大數(shù)據(jù)資源進(jìn)行優(yōu)化?

      首先,圖書館應(yīng)認(rèn)真分析搜索引擎的檢索算法和運(yùn)作規(guī)則,并以讀者需求為核心加強(qiáng)大數(shù)據(jù)

      資源庫的科學(xué)和結(jié)構(gòu)化水平,提高所查詢數(shù)據(jù)的價(jià)值密度和用戶相關(guān)性?其次,搜索引擎應(yīng)

      根據(jù)用戶使用有效性評估結(jié)果,依據(jù)讀者閱讀模式?內(nèi)容和需求變化趨勢,及時(shí)調(diào)整搜索引

      擎檢索對象的排名算法,使搜索引擎更適應(yīng)大數(shù)據(jù)復(fù)雜環(huán)境特點(diǎn)和讀者個(gè)性化需求?第三,

      圖書館在網(wǎng)站建設(shè)中,應(yīng)提高網(wǎng)站資源信息結(jié)構(gòu)的科學(xué)性和數(shù)據(jù)可獲取性,主動(dòng)為用戶提供

      具有個(gè)性化特征的站外二次鏈接服務(wù),確保讀者具有更愉悅的用戶檢索體驗(yàn)?

      2.6 突出搜索引擎的移動(dòng)檢索功能

      大數(shù)據(jù)時(shí)代,隨著讀者移動(dòng)閱讀終端智能化和集成度的提高,移動(dòng)檢索將成為個(gè)人閱讀終端

      的主要服務(wù)與閱讀方式?

      首先,讀者移動(dòng)檢索具有無線網(wǎng)絡(luò)數(shù)據(jù)傳輸環(huán)境復(fù)雜?讀者閱讀需求高?數(shù)據(jù)傳輸海量和數(shù)

      據(jù)類型多的特點(diǎn)?因此,圖書館在讀者移動(dòng)閱讀模式保障中,應(yīng)采取搜索代理服務(wù)器和閱讀

      終端的結(jié)構(gòu)模式,當(dāng)搜索代理服務(wù)器接收到移動(dòng)終端發(fā)來的搜索請求后,由搜索代理服務(wù)器

      端完成數(shù)據(jù)的搜索?用戶相關(guān)性分析與評估?數(shù)據(jù)模式轉(zhuǎn)變和加工,并將最終結(jié)果通過無線

      信道傳輸?shù)接脩舳松?此外,用戶閱讀終端的移動(dòng)搜索引擎還應(yīng)和第三方服務(wù)商平臺(tái)結(jié)合,

      支持諸如閱讀論壇與博客管理?讀者群交友和地理位置查詢等增值服務(wù),為讀者提供可定制

      的個(gè)性化移動(dòng)增值服務(wù)?第三,搜索引擎移動(dòng)檢索功能的建設(shè),應(yīng)以貼近讀者實(shí)際需求和增

      強(qiáng)用戶體驗(yàn)為中心,逐漸向語音搜索?場景化搜索?微博搜索等多種模式轉(zhuǎn)變,以提高搜索

      服務(wù)的可用性和趣味性[6]?

      3 結(jié)束語

      隨著大數(shù)據(jù)時(shí)代的到來,圖書館數(shù)據(jù)環(huán)境面臨的安全威脅和復(fù)雜性大幅增加?此外,圖書館

      大數(shù)據(jù)平臺(tái)的高效管理與讀者個(gè)性化閱讀服務(wù)需求,也對大數(shù)據(jù)資源的采集?管理?控制和

      搜索提出了更高要求?

      因此,圖書館管理者必須從讀者個(gè)性化閱讀需求和用戶滿意度保障出發(fā),堅(jiān)持科學(xué)技術(shù)應(yīng)用

      與大數(shù)據(jù)復(fù)雜環(huán)境特點(diǎn)相結(jié)合的原則?同時(shí),在搜索引擎設(shè)計(jì)中應(yīng)保證搜索算法與大數(shù)據(jù)復(fù)

      雜環(huán)境相適應(yīng),搜索引擎應(yīng)用具有安全?高效?智能?經(jīng)濟(jì)和移動(dòng)服務(wù)的特點(diǎn),才能為讀者

      提供具有個(gè)性化特征的大數(shù)據(jù)搜索服務(wù)?

      參考文獻(xiàn)

      [1]中國互聯(lián)網(wǎng)絡(luò)中心.2010年中國搜索引擎用戶行為研究報(bào)告[R].2012

      -02-08.

      [2]尤川川,張桂剛.一種基于大數(shù)據(jù)的有效搜索方法[J].計(jì)算機(jī)科學(xué),2013,40(6):

      183-186.

      [3]葉育鑫,歐陽丹彤.基于語義的主題爬行策略[J].軟件學(xué)報(bào),2011,22(9):2075-20

      88.

      [4]丁軍平,蔡皖東.面向P2P特定信息的爬蟲改進(jìn)技術(shù)[J].計(jì)算機(jī)工程與應(yīng)用,2011,47

      (29):23-26.

      [5]楊藝,周元.基于用戶查詢意圖識別的Web搜索優(yōu)化模型[J].計(jì)算機(jī)科學(xué),2012,39

      (1):264-267.

      [6]王珊,王會(huì)舉,覃雄派,等.架構(gòu)大數(shù)據(jù):挑戰(zhàn)?現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報(bào),2011,3

      4(10):1741-1752.

      (本文責(zé)任編輯:孫國雷)endprint

      搜索引擎應(yīng)具備用戶語義發(fā)現(xiàn)?分析和判斷功能,可通過對讀者輸入詞的分析而明確用戶真

      實(shí)意圖,并在索引庫中查詢與用戶搜索目標(biāo)最接近的文檔和數(shù)據(jù)?第三,圖書館應(yīng)根據(jù)大數(shù)

      據(jù)信息庫數(shù)據(jù)?第三方服務(wù)商網(wǎng)站資源?用戶社會(huì)關(guān)系表示,構(gòu)建一個(gè)以讀者為中心的巨大

      信息關(guān)系圖譜?當(dāng)讀者搜索未知數(shù)據(jù)和隱性信息時(shí),可通過“圖譜搜索”檢索出與所搜索內(nèi)

      容相關(guān)的文本?圖片?音頻?視頻和數(shù)據(jù)關(guān)系等信息,確保用戶個(gè)性化搜索數(shù)據(jù)具有全面?

      精確?深度和可靠的特點(diǎn)[5]?

      2.4 確保搜索引擎的有效性評估內(nèi)容全面?易控和可操作

      圖書館應(yīng)量化搜索引擎檢索過程的安全性?效率?檢索價(jià)值密度?用戶相關(guān)性?檢索結(jié)果?

      用戶友好性與交互性等指標(biāo)內(nèi)容,為搜索引擎設(shè)計(jì)與優(yōu)化提供可靠的數(shù)據(jù)支持,保證搜索引

      擎評估具有科學(xué)性?可控性和可操作性?

      根據(jù)大數(shù)據(jù)時(shí)代復(fù)雜數(shù)據(jù)環(huán)境和讀者個(gè)性化檢索需求,搜索引擎評估主要可分為檢索安全可

      靠性?檢索界面友好性?數(shù)據(jù)搜索性能?檢索的輸入與輸出模式4個(gè)方面內(nèi)容?檢索安全可

      靠性主要由搜索引擎系統(tǒng)結(jié)構(gòu)的科學(xué)性?安全健壯性?安全防御能力?用戶隱私保護(hù)性等方

      面組成?檢索界面友好性主要分為用戶可操作性?系統(tǒng)可管與可控性?數(shù)據(jù)搜索成本?用戶

      相關(guān)性?用戶滿意度等?數(shù)據(jù)搜索性能主要分為檢索相關(guān)度?精確度?時(shí)效性?檢索數(shù)據(jù)的

      價(jià)值密度?用戶檢索成本等?檢索的輸入與輸出模式,主要指搜索引擎輸入與輸出界面的友

      好性?語義表現(xiàn)能力?管理與使用復(fù)雜度?用戶交互性?

      2.5 利用搜索引擎檢索規(guī)則來優(yōu)化圖書館大數(shù)據(jù)資源

      圖書館大數(shù)據(jù)環(huán)境具有海量?復(fù)雜?價(jià)值密度低和處理時(shí)效高的特點(diǎn)?因此,如果圖書館不

      依據(jù)搜索引擎運(yùn)行規(guī)則,對管理與服務(wù)大數(shù)據(jù)資源庫進(jìn)行優(yōu)化,將會(huì)導(dǎo)致搜索引擎查詢數(shù)據(jù)

      量巨大?檢索深度與精度不高?成本上升和用戶滿意度下降的情況出現(xiàn)?因此,必須利用搜

      索引擎運(yùn)行規(guī)則對圖書館大數(shù)據(jù)資源進(jìn)行優(yōu)化?

      首先,圖書館應(yīng)認(rèn)真分析搜索引擎的檢索算法和運(yùn)作規(guī)則,并以讀者需求為核心加強(qiáng)大數(shù)據(jù)

      資源庫的科學(xué)和結(jié)構(gòu)化水平,提高所查詢數(shù)據(jù)的價(jià)值密度和用戶相關(guān)性?其次,搜索引擎應(yīng)

      根據(jù)用戶使用有效性評估結(jié)果,依據(jù)讀者閱讀模式?內(nèi)容和需求變化趨勢,及時(shí)調(diào)整搜索引

      擎檢索對象的排名算法,使搜索引擎更適應(yīng)大數(shù)據(jù)復(fù)雜環(huán)境特點(diǎn)和讀者個(gè)性化需求?第三,

      圖書館在網(wǎng)站建設(shè)中,應(yīng)提高網(wǎng)站資源信息結(jié)構(gòu)的科學(xué)性和數(shù)據(jù)可獲取性,主動(dòng)為用戶提供

      具有個(gè)性化特征的站外二次鏈接服務(wù),確保讀者具有更愉悅的用戶檢索體驗(yàn)?

      2.6 突出搜索引擎的移動(dòng)檢索功能

      大數(shù)據(jù)時(shí)代,隨著讀者移動(dòng)閱讀終端智能化和集成度的提高,移動(dòng)檢索將成為個(gè)人閱讀終端

      的主要服務(wù)與閱讀方式?

      首先,讀者移動(dòng)檢索具有無線網(wǎng)絡(luò)數(shù)據(jù)傳輸環(huán)境復(fù)雜?讀者閱讀需求高?數(shù)據(jù)傳輸海量和數(shù)

      據(jù)類型多的特點(diǎn)?因此,圖書館在讀者移動(dòng)閱讀模式保障中,應(yīng)采取搜索代理服務(wù)器和閱讀

      終端的結(jié)構(gòu)模式,當(dāng)搜索代理服務(wù)器接收到移動(dòng)終端發(fā)來的搜索請求后,由搜索代理服務(wù)器

      端完成數(shù)據(jù)的搜索?用戶相關(guān)性分析與評估?數(shù)據(jù)模式轉(zhuǎn)變和加工,并將最終結(jié)果通過無線

      信道傳輸?shù)接脩舳松?此外,用戶閱讀終端的移動(dòng)搜索引擎還應(yīng)和第三方服務(wù)商平臺(tái)結(jié)合,

      支持諸如閱讀論壇與博客管理?讀者群交友和地理位置查詢等增值服務(wù),為讀者提供可定制

      的個(gè)性化移動(dòng)增值服務(wù)?第三,搜索引擎移動(dòng)檢索功能的建設(shè),應(yīng)以貼近讀者實(shí)際需求和增

      強(qiáng)用戶體驗(yàn)為中心,逐漸向語音搜索?場景化搜索?微博搜索等多種模式轉(zhuǎn)變,以提高搜索

      服務(wù)的可用性和趣味性[6]?

      3 結(jié)束語

      隨著大數(shù)據(jù)時(shí)代的到來,圖書館數(shù)據(jù)環(huán)境面臨的安全威脅和復(fù)雜性大幅增加?此外,圖書館

      大數(shù)據(jù)平臺(tái)的高效管理與讀者個(gè)性化閱讀服務(wù)需求,也對大數(shù)據(jù)資源的采集?管理?控制和

      搜索提出了更高要求?

      因此,圖書館管理者必須從讀者個(gè)性化閱讀需求和用戶滿意度保障出發(fā),堅(jiān)持科學(xué)技術(shù)應(yīng)用

      與大數(shù)據(jù)復(fù)雜環(huán)境特點(diǎn)相結(jié)合的原則?同時(shí),在搜索引擎設(shè)計(jì)中應(yīng)保證搜索算法與大數(shù)據(jù)復(fù)

      雜環(huán)境相適應(yīng),搜索引擎應(yīng)用具有安全?高效?智能?經(jīng)濟(jì)和移動(dòng)服務(wù)的特點(diǎn),才能為讀者

      提供具有個(gè)性化特征的大數(shù)據(jù)搜索服務(wù)?

      參考文獻(xiàn)

      [1]中國互聯(lián)網(wǎng)絡(luò)中心.2010年中國搜索引擎用戶行為研究報(bào)告[R].2012

      -02-08.

      [2]尤川川,張桂剛.一種基于大數(shù)據(jù)的有效搜索方法[J].計(jì)算機(jī)科學(xué),2013,40(6):

      183-186.

      [3]葉育鑫,歐陽丹彤.基于語義的主題爬行策略[J].軟件學(xué)報(bào),2011,22(9):2075-20

      88.

      [4]丁軍平,蔡皖東.面向P2P特定信息的爬蟲改進(jìn)技術(shù)[J].計(jì)算機(jī)工程與應(yīng)用,2011,47

      (29):23-26.

      [5]楊藝,周元.基于用戶查詢意圖識別的Web搜索優(yōu)化模型[J].計(jì)算機(jī)科學(xué),2012,39

      (1):264-267.

      [6]王珊,王會(huì)舉,覃雄派,等.架構(gòu)大數(shù)據(jù):挑戰(zhàn)?現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報(bào),2011,3

      4(10):1741-1752.

      (本文責(zé)任編輯:孫國雷)endprint

      搜索引擎應(yīng)具備用戶語義發(fā)現(xiàn)?分析和判斷功能,可通過對讀者輸入詞的分析而明確用戶真

      實(shí)意圖,并在索引庫中查詢與用戶搜索目標(biāo)最接近的文檔和數(shù)據(jù)?第三,圖書館應(yīng)根據(jù)大數(shù)

      據(jù)信息庫數(shù)據(jù)?第三方服務(wù)商網(wǎng)站資源?用戶社會(huì)關(guān)系表示,構(gòu)建一個(gè)以讀者為中心的巨大

      信息關(guān)系圖譜?當(dāng)讀者搜索未知數(shù)據(jù)和隱性信息時(shí),可通過“圖譜搜索”檢索出與所搜索內(nèi)

      容相關(guān)的文本?圖片?音頻?視頻和數(shù)據(jù)關(guān)系等信息,確保用戶個(gè)性化搜索數(shù)據(jù)具有全面?

      精確?深度和可靠的特點(diǎn)[5]?

      2.4 確保搜索引擎的有效性評估內(nèi)容全面?易控和可操作

      圖書館應(yīng)量化搜索引擎檢索過程的安全性?效率?檢索價(jià)值密度?用戶相關(guān)性?檢索結(jié)果?

      用戶友好性與交互性等指標(biāo)內(nèi)容,為搜索引擎設(shè)計(jì)與優(yōu)化提供可靠的數(shù)據(jù)支持,保證搜索引

      擎評估具有科學(xué)性?可控性和可操作性?

      根據(jù)大數(shù)據(jù)時(shí)代復(fù)雜數(shù)據(jù)環(huán)境和讀者個(gè)性化檢索需求,搜索引擎評估主要可分為檢索安全可

      靠性?檢索界面友好性?數(shù)據(jù)搜索性能?檢索的輸入與輸出模式4個(gè)方面內(nèi)容?檢索安全可

      靠性主要由搜索引擎系統(tǒng)結(jié)構(gòu)的科學(xué)性?安全健壯性?安全防御能力?用戶隱私保護(hù)性等方

      面組成?檢索界面友好性主要分為用戶可操作性?系統(tǒng)可管與可控性?數(shù)據(jù)搜索成本?用戶

      相關(guān)性?用戶滿意度等?數(shù)據(jù)搜索性能主要分為檢索相關(guān)度?精確度?時(shí)效性?檢索數(shù)據(jù)的

      價(jià)值密度?用戶檢索成本等?檢索的輸入與輸出模式,主要指搜索引擎輸入與輸出界面的友

      好性?語義表現(xiàn)能力?管理與使用復(fù)雜度?用戶交互性?

      2.5 利用搜索引擎檢索規(guī)則來優(yōu)化圖書館大數(shù)據(jù)資源

      圖書館大數(shù)據(jù)環(huán)境具有海量?復(fù)雜?價(jià)值密度低和處理時(shí)效高的特點(diǎn)?因此,如果圖書館不

      依據(jù)搜索引擎運(yùn)行規(guī)則,對管理與服務(wù)大數(shù)據(jù)資源庫進(jìn)行優(yōu)化,將會(huì)導(dǎo)致搜索引擎查詢數(shù)據(jù)

      量巨大?檢索深度與精度不高?成本上升和用戶滿意度下降的情況出現(xiàn)?因此,必須利用搜

      索引擎運(yùn)行規(guī)則對圖書館大數(shù)據(jù)資源進(jìn)行優(yōu)化?

      首先,圖書館應(yīng)認(rèn)真分析搜索引擎的檢索算法和運(yùn)作規(guī)則,并以讀者需求為核心加強(qiáng)大數(shù)據(jù)

      資源庫的科學(xué)和結(jié)構(gòu)化水平,提高所查詢數(shù)據(jù)的價(jià)值密度和用戶相關(guān)性?其次,搜索引擎應(yīng)

      根據(jù)用戶使用有效性評估結(jié)果,依據(jù)讀者閱讀模式?內(nèi)容和需求變化趨勢,及時(shí)調(diào)整搜索引

      擎檢索對象的排名算法,使搜索引擎更適應(yīng)大數(shù)據(jù)復(fù)雜環(huán)境特點(diǎn)和讀者個(gè)性化需求?第三,

      圖書館在網(wǎng)站建設(shè)中,應(yīng)提高網(wǎng)站資源信息結(jié)構(gòu)的科學(xué)性和數(shù)據(jù)可獲取性,主動(dòng)為用戶提供

      具有個(gè)性化特征的站外二次鏈接服務(wù),確保讀者具有更愉悅的用戶檢索體驗(yàn)?

      2.6 突出搜索引擎的移動(dòng)檢索功能

      大數(shù)據(jù)時(shí)代,隨著讀者移動(dòng)閱讀終端智能化和集成度的提高,移動(dòng)檢索將成為個(gè)人閱讀終端

      的主要服務(wù)與閱讀方式?

      首先,讀者移動(dòng)檢索具有無線網(wǎng)絡(luò)數(shù)據(jù)傳輸環(huán)境復(fù)雜?讀者閱讀需求高?數(shù)據(jù)傳輸海量和數(shù)

      據(jù)類型多的特點(diǎn)?因此,圖書館在讀者移動(dòng)閱讀模式保障中,應(yīng)采取搜索代理服務(wù)器和閱讀

      終端的結(jié)構(gòu)模式,當(dāng)搜索代理服務(wù)器接收到移動(dòng)終端發(fā)來的搜索請求后,由搜索代理服務(wù)器

      端完成數(shù)據(jù)的搜索?用戶相關(guān)性分析與評估?數(shù)據(jù)模式轉(zhuǎn)變和加工,并將最終結(jié)果通過無線

      信道傳輸?shù)接脩舳松?此外,用戶閱讀終端的移動(dòng)搜索引擎還應(yīng)和第三方服務(wù)商平臺(tái)結(jié)合,

      支持諸如閱讀論壇與博客管理?讀者群交友和地理位置查詢等增值服務(wù),為讀者提供可定制

      的個(gè)性化移動(dòng)增值服務(wù)?第三,搜索引擎移動(dòng)檢索功能的建設(shè),應(yīng)以貼近讀者實(shí)際需求和增

      強(qiáng)用戶體驗(yàn)為中心,逐漸向語音搜索?場景化搜索?微博搜索等多種模式轉(zhuǎn)變,以提高搜索

      服務(wù)的可用性和趣味性[6]?

      3 結(jié)束語

      隨著大數(shù)據(jù)時(shí)代的到來,圖書館數(shù)據(jù)環(huán)境面臨的安全威脅和復(fù)雜性大幅增加?此外,圖書館

      大數(shù)據(jù)平臺(tái)的高效管理與讀者個(gè)性化閱讀服務(wù)需求,也對大數(shù)據(jù)資源的采集?管理?控制和

      搜索提出了更高要求?

      因此,圖書館管理者必須從讀者個(gè)性化閱讀需求和用戶滿意度保障出發(fā),堅(jiān)持科學(xué)技術(shù)應(yīng)用

      與大數(shù)據(jù)復(fù)雜環(huán)境特點(diǎn)相結(jié)合的原則?同時(shí),在搜索引擎設(shè)計(jì)中應(yīng)保證搜索算法與大數(shù)據(jù)復(fù)

      雜環(huán)境相適應(yīng),搜索引擎應(yīng)用具有安全?高效?智能?經(jīng)濟(jì)和移動(dòng)服務(wù)的特點(diǎn),才能為讀者

      提供具有個(gè)性化特征的大數(shù)據(jù)搜索服務(wù)?

      參考文獻(xiàn)

      [1]中國互聯(lián)網(wǎng)絡(luò)中心.2010年中國搜索引擎用戶行為研究報(bào)告[R].2012

      -02-08.

      [2]尤川川,張桂剛.一種基于大數(shù)據(jù)的有效搜索方法[J].計(jì)算機(jī)科學(xué),2013,40(6):

      183-186.

      [3]葉育鑫,歐陽丹彤.基于語義的主題爬行策略[J].軟件學(xué)報(bào),2011,22(9):2075-20

      88.

      [4]丁軍平,蔡皖東.面向P2P特定信息的爬蟲改進(jìn)技術(shù)[J].計(jì)算機(jī)工程與應(yīng)用,2011,47

      (29):23-26.

      [5]楊藝,周元.基于用戶查詢意圖識別的Web搜索優(yōu)化模型[J].計(jì)算機(jī)科學(xué),2012,39

      (1):264-267.

      [6]王珊,王會(huì)舉,覃雄派,等.架構(gòu)大數(shù)據(jù):挑戰(zhàn)?現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報(bào),2011,3

      4(10):1741-1752.

      (本文責(zé)任編輯:孫國雷)endprint

      平谷区| 皮山县| 盐津县| 田东县| 白朗县| 弥勒县| 玉树县| 文水县| 进贤县| 合水县| 红原县| 兰州市| 五寨县| 剑河县| 桐梓县| 冀州市| 潢川县| 丰原市| 中牟县| 斗六市| 新巴尔虎右旗| 沐川县| 闻喜县| 兰西县| 太康县| 泰和县| 任丘市| 无棣县| 商丘市| 浦城县| 衡水市| 泗阳县| 桐庐县| 卢湾区| 定兴县| 清水县| 镶黄旗| 蓝山县| 大姚县| 会同县| 平潭县|