• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于大數(shù)據(jù)的智能檢索系統(tǒng)設計與研究

      2021-01-13 10:11:49傅永梅楊冬梅陳建建
      黑龍江科學 2021年20期
      關鍵詞:檢索系統(tǒng)信息檢索檢索

      陳 銳,傅永梅,楊冬梅,陳建建

      (山東華宇工學院,山東 德州 253000)

      隨著互聯(lián)網(wǎng)技術和計算機技術的不斷發(fā)展,大數(shù)據(jù)概念越來越深入人心。互聯(lián)網(wǎng)信息量飛速增長,人們正處于信息爆炸時代,從龐大的信息中檢索到所需的資源,這是對信息檢索系統(tǒng)最大的挑戰(zhàn)。提高檢索系統(tǒng)的智能化是人們急需解決的問題之一,大數(shù)據(jù)的發(fā)展為智能檢索系統(tǒng)設計提供了新的思路,其有利于我國智能檢索技術的發(fā)展和進步。

      1 智能信息檢索系統(tǒng)存在的問題

      1.1 信息資源過于分散

      信息資源利用過程中存在著信息資源過于分散的問題。互聯(lián)網(wǎng)用戶為了查詢所需的信息,常常瀏覽不同的網(wǎng)站,嘗試各種不同的檢索方式,更換各種檢索關鍵詞,這樣的檢索不具有系統(tǒng)性,無形中降低了檢索效率。而大數(shù)據(jù)的使用和開發(fā),改變了傳統(tǒng)的信息存儲習慣,云端檢索的存在使得網(wǎng)絡用戶能夠借助大數(shù)據(jù)檢索平臺將檢索條件直接進行整合,提高信息檢索的整體性。國內(nèi)外的搜索工具多種多樣,每個搜索引擎的建立基礎各不相同,但是每個搜索引擎也僅能涵蓋網(wǎng)絡資源的30%左右,其中可靠的信息只占很小的一部分,具有較大的局限性。用戶在網(wǎng)絡檢索中需要嘗試使用不同的檢索工具,才能找到自己滿意的信息資源。

      1.2 算法匹配紊亂

      現(xiàn)有的檢索工具大多需要用戶提供足夠準確的檢索詞,利用關鍵詞、規(guī)則與分類讓客戶進行判斷,但是與客戶缺乏充分的互動,不能智能化地詢問和猜測客戶想法。大部分檢索系統(tǒng)都是采用不同的算法來匹配不同檢索詞,這種匹配方式導致系統(tǒng)不同,匹配結果也不相同,與用戶檢索式息息相關。現(xiàn)有的檢索模式是采用集中串行式檢索,檢索效率較低,如果在某個節(jié)點出錯,會導致整個檢索過程受到嚴重影響[1]。

      1.3 人工智能檢索應用性較差

      人工智能簡稱AI,是當前最前沿的科學技術,通過模擬、延伸和擴展,可使檢索系統(tǒng)越來越智能化,涉及社會新聞、文學知識及科學知識等學科,用戶借助信息檢索系統(tǒng)查找信息時,如果系統(tǒng)智能性不夠,會導致信息不具有系統(tǒng)性和完整性。

      2 基于大數(shù)據(jù)的智能檢索系統(tǒng)設計架構

      基于大數(shù)據(jù)的智能檢索系統(tǒng)可分為以下幾部分,即知識存儲系統(tǒng)(知識庫)、知識采集系統(tǒng)、知識處理系統(tǒng)及知識表達系統(tǒng)。

      2.1 知識存儲系統(tǒng)

      知識的保存是信息檢索過程中的重點建設部分,只有足夠的信息存儲量,才能保證信息檢索過程的覆蓋范圍,才能體現(xiàn)信息檢索的全面性和整體性。信息檢索根據(jù)檢索方式可以劃分為3種,即硬件設備檢索、軟件檢索和系統(tǒng)檢索。硬件設備中存儲的信息是所有軟件和系統(tǒng)檢索的根基,只有足夠數(shù)量的存儲量才能保證信息系統(tǒng)的完善性,為用戶提供良好的服務,實現(xiàn)智能系統(tǒng)的開發(fā)和完善。知識的存儲應是有序的、分門別類的,在存儲過程中應重視知識間的關聯(lián)性,在系統(tǒng)分類的基礎上將知識有機關聯(lián)起來,便于用戶對知識的調(diào)用及信息處理。

      2.2 知識采集系統(tǒng)

      為了提高信息檢索系統(tǒng)中知識的豐富性,應注重信息采集工作,要保證信息檢索系統(tǒng)中的知識與時俱進,充分實現(xiàn)知識的更新和補充。知識采集系統(tǒng)主要分為書本知識采集及數(shù)據(jù)知識檢索收集。書本知識采集系統(tǒng)是將書本信息進行掃描,以PDF、Word等數(shù)據(jù)文本形式保存,將前人的經(jīng)驗轉(zhuǎn)為文本數(shù)據(jù),分享給更多的人。數(shù)據(jù)采集系統(tǒng)主要分為以下幾個過程:一是建立鏡像,通過站點鏡像對網(wǎng)站內(nèi)容進行復制,將內(nèi)容復制到系統(tǒng)中,實現(xiàn)采集效率的提高。二是采用智能化的信息監(jiān)控系統(tǒng),保證系統(tǒng)信息的合理性。三是對資源的智能發(fā)現(xiàn),出現(xiàn)新的信息資源后,知識庫中的信息能夠與其進行交換,保證系統(tǒng)能夠自動采集信息。四是智能信息資源的轉(zhuǎn)換,將信息資源進行合理化的加工和分配,形成新的意義[2]。

      2.3 知識處理系統(tǒng)

      在大數(shù)據(jù)環(huán)境下,網(wǎng)絡廣泛普及,智能技術廣泛應用,用戶給軟件授權后生成通信協(xié)議,可使信息檢索順利進行。例如:用戶需要搜索一個信息,但用戶又不太了解這個信息,智能化知識處理系統(tǒng)可以采用模糊處理,根據(jù)用戶之前的生活習慣和檢索習慣,給出與其相關的關鍵詞,并在篩選結果中進行智能化鑒別,除去與搜索主題無關的、無用的信息,這種智能處理技術在多種搜索引擎中及大型數(shù)據(jù)庫中較為常見。智能處理系統(tǒng)的使用雖然處于起步發(fā)展階段,但在多個方面給人們帶來了便利,如在網(wǎng)絡管理方面,智能處理系統(tǒng)可以幫助用戶查找到最合適的網(wǎng)站下載資源,推送功能可使用戶找到最受大眾歡迎的網(wǎng)站,為生產(chǎn)和生活提供幫助。

      知識處理技術主要分為幾個方面:一是信息過濾技術。進行過濾和查詢,對網(wǎng)絡垃圾、病毒等進行防范。在信息過濾技術中增加人工智能,可以使信息過濾更加靈活,體現(xiàn)智能化。二是圖像視頻檢索技術(機器視覺)。將拍攝到的圖像進行處理,轉(zhuǎn)化為圖像信號,并從信號中提取出有用的信息。提取過程中,要充分重視圖像中的主要特征,根據(jù)這些特征采用計算機技術、數(shù)學分析及經(jīng)驗來完成目標檢測、跟蹤、識別和表達。三是自然語言處理技術。它是能夠被人類廣泛識別的語言,智能檢索系統(tǒng)需要將自然語言處理為機器語言,進行加工后再轉(zhuǎn)化為自然語言。應對自然語言加強研究,實現(xiàn)人與機器間的有效互動,使計算機能夠準確判斷出自然語言是否可信,并完成自然語言的加工和理解[3]。

      2.4 知識表達系統(tǒng)

      智能檢索的優(yōu)勢是實現(xiàn)與人的友好交流,一個成熟的智能檢索系統(tǒng)需要充分和人實現(xiàn)智能互動,“想用戶之所想,急用戶之所急”。智能檢索系統(tǒng)不僅要將信息準確完整地搜集出來,還需要將信息科學合理地向用戶進行表達,讓用戶能夠全面了解知識。知識表達系統(tǒng)的建立能夠更好地幫助用戶進行信息劃分和查詢處理,挖掘出更多的信息資源,彌補過去智能處理信息的局限性,提高信息的交互性和流動性[4]。

      3 結語

      大數(shù)據(jù)、云計算等技術被人們廣泛應用于信息檢索中,為互聯(lián)網(wǎng)發(fā)展帶來了巨大的機遇,影響著人們的生產(chǎn)和生活。在這種情況下,智能信息檢索技術改變了過去信息資源分散、算法匹配程度較差的問題,充分實現(xiàn)了信息檢索過程的互動性和智能化,大幅度降低了用戶檢索過程的時間成本。基于大數(shù)據(jù)理念,應加強智能檢索系統(tǒng)的設計工作,促進信息檢索技術的進步,為數(shù)據(jù)中國發(fā)展做出貢獻。

      猜你喜歡
      檢索系統(tǒng)信息檢索檢索
      2019年第4-6期便捷檢索目錄
      收錄《信號處理》的檢索系統(tǒng)及數(shù)據(jù)庫
      信號處理(2018年1期)2018-09-03 07:53:04
      收錄《信號處理》的檢索系統(tǒng)及數(shù)據(jù)庫
      信號處理(2018年5期)2018-06-28 02:16:02
      本刊被以下檢索系統(tǒng)及數(shù)據(jù)庫收錄
      信號處理(2018年4期)2018-06-27 03:34:16
      本刊被以下檢索系統(tǒng)及數(shù)據(jù)庫收錄
      信號處理(2018年3期)2018-06-27 03:30:18
      醫(yī)學期刊編輯中文獻信息檢索的應用
      新聞傳播(2016年18期)2016-07-19 10:12:06
      專利檢索中“語義”的表現(xiàn)
      專利代理(2016年1期)2016-05-17 06:14:36
      基于神經(jīng)網(wǎng)絡的個性化信息檢索模型研究
      教學型大學《信息檢索》公選課的設計與實施
      河南科技(2014年11期)2014-02-27 14:10:19
      公共圖書館信息檢索服務的實踐探索——以上海浦東圖書館為例
      圖書館界(2013年5期)2013-03-11 18:50:29
      洞头县| 孝感市| 法库县| 万安县| 峨山| 平湖市| 江北区| 尚义县| 商南县| 富平县| 民权县| 阆中市| 庄浪县| 洛阳市| 辽宁省| 陆丰市| 宣汉县| 镇安县| 彩票| 中超| 常州市| 黄骅市| 邛崃市| 保山市| 武冈市| 宁安市| 乐亭县| 峨眉山市| 保定市| 皋兰县| 思茅市| 开封市| 宁远县| 盘锦市| 台前县| 洪江市| 南开区| 成武县| 定安县| 平遥县| 祁阳县|