• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      試論數(shù)據(jù)挖掘技術(shù)在Web預(yù)取中的應(yīng)用

      2019-11-15 04:45王志俊
      科技資訊 2019年21期
      關(guān)鍵詞:搜索引擎數(shù)據(jù)挖掘

      王志俊

      摘? 要:近年來,互聯(lián)網(wǎng)的不斷發(fā)展,使人們對數(shù)據(jù)的需求不斷擴(kuò)大,這也使數(shù)據(jù)挖掘技術(shù)成為互聯(lián)網(wǎng)領(lǐng)域中至關(guān)重要的技術(shù),通過數(shù)據(jù)挖掘技術(shù),可使人們從海量信息中篩選出自身所需的有效信息,隨著數(shù)據(jù)挖掘技術(shù)的發(fā)展,其在Web技術(shù)中正發(fā)揮著越來越重要的應(yīng)用價值,尤其是在Web預(yù)取方面,通過數(shù)據(jù)挖掘技術(shù)的運(yùn)用,可使數(shù)據(jù)查詢變得更加準(zhǔn)確,從而實(shí)現(xiàn)Web資源的多方共享。鑒于此,該文便對數(shù)據(jù)挖掘技術(shù)在Web預(yù)取中的應(yīng)用進(jìn)行深入的研究。

      關(guān)鍵詞:數(shù)據(jù)挖掘? Web預(yù)取? 搜索引擎

      中圖分類號:TP391 ? ?文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2019)07(c)-0019-02

      隨著網(wǎng)絡(luò)的普及與應(yīng)用,在Web預(yù)取中運(yùn)用數(shù)據(jù)挖掘技術(shù)已經(jīng)成為互聯(lián)網(wǎng)領(lǐng)域中的一種新型運(yùn)用手段,數(shù)據(jù)挖掘技術(shù)可幫助人們對用戶的訪問模型進(jìn)行查詢,同時還可通過聚類分析以及信息監(jiān)聽等手段來生成與用戶有關(guān)的相關(guān)信息檔案,從而了解用戶在不同頁面中所產(chǎn)生的行為規(guī)律,進(jìn)而為用戶提供更加高效優(yōu)質(zhì)的信息服務(wù)。不過,就目前來看,如何將數(shù)挖掘技術(shù)更加合理地運(yùn)用于Web預(yù)取中,以此最大限度地發(fā)揮數(shù)據(jù)挖掘技術(shù)的作用,仍舊需要進(jìn)一步加以研究與探討。

      1? 數(shù)據(jù)挖掘技術(shù)在Web預(yù)取中的發(fā)展歷程

      現(xiàn)階段,越來越多的搜索引擎企業(yè)都迎來了高速發(fā)展階段,這也使搜索引擎在人們的日常生活中發(fā)揮著越來越重要的作用。據(jù)相關(guān)調(diào)查表明,搜索引擎已經(jīng)成人們在使用互聯(lián)網(wǎng)的重要工具,大部都會作為應(yīng)用工具檢索用戶所需的數(shù)據(jù)。由于搜索引擎企業(yè)眾多,這也使不同的檢索機(jī)制有著很大的區(qū)別,從而造成數(shù)據(jù)查詢結(jié)果多種多樣,因此在使用搜索引擎時,需要結(jié)合信息數(shù)據(jù)的類別及用戶的行為習(xí)慣與實(shí)際需求來確定。在搜索引擎應(yīng)用初期,人們需要解決檢索數(shù)據(jù)結(jié)果的排序問題,部分搜索引擎還要收費(fèi),費(fèi)用投入越大的企業(yè),在網(wǎng)站上的排名就越靠前,這很難達(dá)到用戶的數(shù)據(jù)檢索要求,因此需要對數(shù)據(jù)運(yùn)用相關(guān)性進(jìn)行徹底改變,使與關(guān)鍵詞相近的檢索結(jié)果能夠排在首位,因此對于許多大型網(wǎng)站,相同數(shù)據(jù)通常都會在前端顯示。當(dāng)用戶訪問某個網(wǎng)頁時,往往會點(diǎn)擊鏈接來訪問其他頁面,這時便要預(yù)測用戶的訪問信息,然后根據(jù)預(yù)測結(jié)果來對這些頁面進(jìn)行預(yù)先下載,以此提高用戶對頁面的訪問速度。由此可以看出,在預(yù)取Web中的鏈接時,減少頁面鏈接或采用不同Web服務(wù)器,可使頁面具備更佳的運(yùn)行效果。不過,事實(shí)上許多用戶都不會訪問全部頁面,因?yàn)檫@會對用戶的使用造成一定的影響,并且因用戶是利用流量來進(jìn)行上網(wǎng)的,如果全部訪問,反而會產(chǎn)生大量支出,這勢必會給Interent系統(tǒng)的流量平衡帶來不利影響。而Web預(yù)取則能夠按照特定的排序方式來排序頁面連接,并根據(jù)用戶的訪問概率來預(yù)取對應(yīng)頁面,同時需要考量系統(tǒng)運(yùn)行情況,通過興趣關(guān)聯(lián)數(shù)據(jù)庫來進(jìn)行相應(yīng)的考量。

      2? 數(shù)據(jù)挖掘技術(shù)在Web預(yù)取中的應(yīng)用

      2.1 可提高Web預(yù)取數(shù)據(jù)的準(zhǔn)確性

      由于在互聯(lián)網(wǎng)中分布著海量的信息,因此在海量信息中查找自身所需的有效信息時,即使采用最為高效的搜索引擎,仍舊會在數(shù)據(jù)篩選中出現(xiàn)各種問題,并且,互聯(lián)網(wǎng)所具有的開放性、共享性特點(diǎn),使人們能夠在不同地點(diǎn)、不同時間進(jìn)行隨時隨地的信息傳輸,這也使信息數(shù)據(jù)每時每刻都在海量增長著,而利用搜索引擎,只能對這些海量數(shù)據(jù)中的一部分進(jìn)行篩選,否則反而會對搜索引擎的實(shí)際應(yīng)用效果造成影響。不過,如果在搜索引擎中運(yùn)用數(shù)據(jù)挖掘技術(shù),則可很好地解決該問題。通常來說,數(shù)據(jù)挖掘技術(shù)主要包括3種,分別是內(nèi)容挖掘、結(jié)構(gòu)挖掘以及具有使用記錄的數(shù)據(jù)挖掘,其中尤以內(nèi)容挖掘最為常用。在檢索這些內(nèi)容數(shù)據(jù)時,需要對相應(yīng)的條件進(jìn)行設(shè)置,而且用戶需要對所需數(shù)據(jù)有一定的了解。相比于以往的搜索引擎技術(shù),數(shù)據(jù)挖掘技術(shù)雖然在挖掘速度上不占據(jù)優(yōu)勢,但其卻可以更加全面而準(zhǔn)確地對信息進(jìn)行檢索,并且,通過添加人工智能模塊,還可對這些檢索數(shù)據(jù)實(shí)施相應(yīng)的處理,從而使技術(shù)的智能化水平更高。反之,如果采用以往的搜索引擎技術(shù)對數(shù)據(jù)進(jìn)行檢索,則檢索到的數(shù)據(jù)還要經(jīng)過相應(yīng)的篩選才能使用,但對于數(shù)據(jù)挖掘技術(shù)來說則不同,其可直接利用檢索數(shù)據(jù)。

      2.2 可應(yīng)用于電子商務(wù)領(lǐng)域

      在Web預(yù)取中,由于用戶所需的數(shù)據(jù)不同,因此在運(yùn)用數(shù)據(jù)挖掘技術(shù)時應(yīng)考慮到不同用戶對數(shù)據(jù)的實(shí)際需求。當(dāng)用戶所需數(shù)據(jù)是用于藝術(shù)設(shè)計的,則需要添加和篩選新穎而獨(dú)特的流行元素;如果用戶所需數(shù)據(jù)是用于商業(yè)活動的,則數(shù)據(jù)挖掘技術(shù)的運(yùn)用目為篩選有效的客戶資源。近些年來,互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,使網(wǎng)絡(luò)購物已成為一種新型的購物模式,這也使電子商務(wù)迎來了高速發(fā)展階段,相應(yīng)的,越來越多的企業(yè)開始投入到電子商務(wù)領(lǐng)域中,這也使電子商務(wù)所面臨的市場競爭環(huán)境變得愈發(fā)激烈。在此背景下,企業(yè)要想在電子商務(wù)領(lǐng)域中占據(jù)一席之地,就必須要盡最大努力來對現(xiàn)有的客戶資源進(jìn)行擴(kuò)大,而通過調(diào)查可以了解到,許多用戶在進(jìn)行網(wǎng)絡(luò)購物時,都會利用搜索引擎來查看與搜集自己所需的商品信息。因此,將數(shù)據(jù)挖掘技術(shù)應(yīng)用于電子商務(wù)網(wǎng)站中,可使網(wǎng)站中的商品信息得到有效的優(yōu)化與處理,進(jìn)而使網(wǎng)站能夠滿足不同用戶的購物需求,同時還能根據(jù)這些用戶的需求來對更多潛在的用戶進(jìn)行挖掘。在運(yùn)用數(shù)據(jù)挖掘時,所需數(shù)據(jù)主要來自于兩個方面,一是客戶的歷史購物或?yàn)g覽記錄、客戶基本信息等,二是用戶點(diǎn)擊量。通過以上數(shù)據(jù)可幫助企業(yè)考察用戶的行為,這些數(shù)據(jù)都可從服務(wù)器中獲得。在利用數(shù)據(jù)挖掘技術(shù)時,不需要直接挖掘原始數(shù)據(jù),而是需要先處理這些數(shù)據(jù),例如對數(shù)據(jù)進(jìn)行合并,使不同數(shù)據(jù)庫或文件中的數(shù)據(jù)能夠合并起來,然后從中選擇合適的數(shù)據(jù)進(jìn)行提取與集合,并對這些提取與集合的數(shù)據(jù)進(jìn)行相應(yīng)的清洗與過濾,使數(shù)據(jù)中的不必要信息能夠得以清除,然后利用文件、多媒體等格式來轉(zhuǎn)換這些數(shù)據(jù),以此確保數(shù)據(jù)挖掘格式變得便捷而安全。通過與不同目標(biāo)進(jìn)行結(jié)合,采用多種查詢方式,最后可獲得有價值的數(shù)據(jù),這時便可通過技術(shù)手段的運(yùn)用,對整合數(shù)據(jù)進(jìn)行分析,從而確保數(shù)據(jù)的價值得到可靠保證。數(shù)據(jù)挖掘技術(shù)除了能夠在電子商務(wù)領(lǐng)域中應(yīng)用以外,還可運(yùn)用于其他所有與Web有關(guān)的領(lǐng)域,例如企業(yè)日常運(yùn)營,通常需要設(shè)置一個局域網(wǎng)來便捷內(nèi)部辦公,使企業(yè)網(wǎng)絡(luò)能夠和互聯(lián)網(wǎng)進(jìn)行連接,從而保障企業(yè)和外部的信息暢通,使企業(yè)在發(fā)展中能夠獲得更多有價值的數(shù)據(jù)來提供參考。

      3? 結(jié)語

      總而言之,隨著互聯(lián)網(wǎng)的高速發(fā)展,數(shù)據(jù)增長量不斷擴(kuò)大,這也給人們對信息的檢索帶來很大難度。搜索引擎憑借其準(zhǔn)確、高速的應(yīng)用優(yōu)勢,已經(jīng)成為人們在互聯(lián)網(wǎng)中進(jìn)行數(shù)據(jù)挖掘的重要工具,不過因互聯(lián)網(wǎng)的信息更新速度非???,這會給搜索引擎的運(yùn)用帶來很大影響,因此,將數(shù)據(jù)挖掘技術(shù)運(yùn)用于搜索引擎中,已經(jīng)成為搜索引擎不斷發(fā)展的未來趨勢,通過數(shù)據(jù)挖掘技術(shù)的運(yùn)用,能夠使人們在應(yīng)用搜索引擎時,能夠?qū)崿F(xiàn)對檢索數(shù)據(jù)的直接處理,進(jìn)而使數(shù)據(jù)挖掘效率得到顯著提高。相信在不久的將來,現(xiàn)代化信息技術(shù)的不斷發(fā)展,必將使數(shù)據(jù)挖掘技術(shù)變得更加完善,從而使其在實(shí)際運(yùn)用中發(fā)揮更大的應(yīng)用價值。

      參考文獻(xiàn)

      [1] 謝怡文.試分析數(shù)據(jù)挖掘技術(shù)在Web預(yù)取中的應(yīng)用[J]. 電腦編程技巧與維護(hù),2017(7):66-67,74.

      [2] 白亮.基于Agent技術(shù)的Web個性化數(shù)據(jù)挖掘研究[J].長春師范大學(xué)學(xué)報,2015,34(12):43-46.

      [3] 邢國春,李紫薇.基于J2EE技術(shù)的Web預(yù)取中個性化信息智能挖掘模型研究[J].情報科學(xué),2014,32(9):104-107.

      猜你喜歡
      搜索引擎數(shù)據(jù)挖掘
      Chrome 99 Canary恢復(fù)可移除預(yù)置搜索引擎選項(xiàng)
      數(shù)據(jù)挖掘技術(shù)在內(nèi)河航道維護(hù)管理中的應(yīng)用研究
      世界表情符號日
      數(shù)據(jù)挖掘綜述
      軟件工程領(lǐng)域中的異常數(shù)據(jù)挖掘算法
      基于R的醫(yī)學(xué)大數(shù)據(jù)挖掘系統(tǒng)研究
      網(wǎng)絡(luò)搜索引擎
      基于Lucene搜索引擎的研究
      搜索引擎,不止有百度與谷歌
      圖解免費(fèi)搜索引擎(之上網(wǎng)找歌篇)
      马边| 拜城县| 镶黄旗| 建宁县| 大理市| 昭通市| 金堂县| 临汾市| 峨眉山市| 六安市| 大英县| 彝良县| 恭城| 庆云县| 密云县| 墨竹工卡县| 龙泉市| 日照市| 平远县| 临洮县| 祁阳县| 綦江县| 益阳市| 诏安县| 灵宝市| 刚察县| 新和县| 伊吾县| 唐海县| 涿鹿县| 睢宁县| 威信县| 新兴县| 扶风县| 台前县| 花莲县| 扶风县| 田东县| 乐安县| 闻喜县| 阿拉善右旗|