周瓊
摘 要:在互聯(lián)網應用日益廣泛的今天,Web所涉及的服務越來越廣泛,這使得Web上的信息量不斷增多,大大增加了Web數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)量。此種情況下,依舊采用傳統(tǒng)方式方法來獲取用戶所需信息,需要消耗較多的時間,且難以保證信息的準確性,但基于Web的數(shù)據(jù)挖掘技術的應用,則可以快速的進行數(shù)據(jù)挖掘、數(shù)據(jù)處理、數(shù)據(jù)檢驗、數(shù)據(jù)轉化,進而為用戶提供所需信息。因此,基于Web的數(shù)據(jù)挖掘技術具有較高的應用價值,其目前在電子商務、網絡教育、網站設計等多方面有很好的應用?;诖耍撐膶姆治鰯?shù)據(jù)挖掘技術及基于Web的數(shù)據(jù)挖掘技術展開,就基于Web的數(shù)據(jù)挖掘技術及應用予以研究。
關鍵詞:Web 數(shù)據(jù)挖掘技術 相關研究
中圖分類號:TP391 文獻標識碼:A 文章編號:1674-098X(2016)08(b)-0100-02
在互聯(lián)網技術應用越來越廣泛的情況下,互聯(lián)網已經成為人們日常生活的一部分?;诖?,互聯(lián)網內容不斷增多,信息過載現(xiàn)象日益明顯。此種情況下,為了使人們的生活能夠更加順暢,及時且快速的獲取到所需信息,需要科學、合理的運用基于Web的數(shù)據(jù)挖掘技術,充分發(fā)揮起作用,對數(shù)據(jù)進行深度的挖掘,進而有效地處理和檢驗數(shù)據(jù),在此基礎上將數(shù)據(jù)轉化為完整的信息,供用戶所用[1]。由此看來,在互聯(lián)網內容不斷增多,Web數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)量不斷增多的情況下,基于Web的數(shù)據(jù)挖掘技術的科學、合理應用是非常重要的,可以幫助用戶快速獲取所需信息。
1 數(shù)據(jù)挖掘技術及基于Web的數(shù)據(jù)挖掘技術
1.1 數(shù)據(jù)挖掘技術
數(shù)據(jù)挖掘技術是為了方便人們在大量的數(shù)據(jù)中快速、正確的找到自己想要的信息而應運而生的技術。在現(xiàn)代化的今天,數(shù)據(jù)挖掘技術的應用日益廣泛,尤其是在計算機技術和數(shù)據(jù)特征的支持下所構建的數(shù)據(jù)挖掘系統(tǒng),可以確定數(shù)據(jù)挖掘目標,在此基礎上以數(shù)據(jù)庫為挖掘對象,從中挖掘所需數(shù)據(jù),再對數(shù)據(jù)進行預處理和再加工,進而檢查數(shù)據(jù)的完整性,確定數(shù)據(jù)完整的情況下會將其轉化成可以被理解的信息,供用戶應用。所以,在現(xiàn)代化的今天,人們對信息需求越來越大的情況下,數(shù)據(jù)挖掘技術的研究與應用是非常有意義的[2]。
1.2 基于Web的數(shù)據(jù)挖掘技術
1.2.1 基于Web的數(shù)據(jù)挖掘技術的概述
基于Web的數(shù)據(jù)挖掘技術,簡單來說就是將數(shù)據(jù)挖掘技術應用到Web上。在現(xiàn)代化的今天,Web所涉及的服務越來越廣泛,這使得Web上的信息量不斷增多,此種情況下,有效的利用數(shù)據(jù)挖掘技術,可以對用戶所需信息的相關數(shù)據(jù)挖掘、處理,進而轉化為信息供用戶應用。
1.2.2 基于Web的數(shù)據(jù)挖掘的特點
在Web所涉及業(yè)務越來越廣泛的情況下,Web上的數(shù)據(jù)量不斷增多,直接存在龐大的數(shù)據(jù)庫系統(tǒng)之中。此種情況下,用戶需要使用所需信息,就需要在Web的數(shù)據(jù)庫系統(tǒng)中進行數(shù)據(jù)挖掘,但因數(shù)據(jù)庫系統(tǒng)中的數(shù)據(jù)量較多,利用傳統(tǒng)的方式方法難以快速且準確的找到所需信息。但基于Web的數(shù)據(jù)挖掘技術的應用則不同,其結構模式不嚴格,可以靈活的運用,在數(shù)據(jù)庫系統(tǒng)中進行數(shù)據(jù)挖掘與處理,進而轉化為用戶所需信息。另外,基于Web的數(shù)據(jù)挖掘技術適應Web環(huán)境且在Web上應用,因此在設置Web數(shù)據(jù)挖掘時是結合了Web的實際情況,因此基于Web的數(shù)據(jù)挖掘與Web的特點相貼合,所以,基于Web的數(shù)據(jù)挖掘具有動態(tài)性、異構性、靈活性、有效性等特點[3]。
1.2.3 基于Web的數(shù)據(jù)挖掘的分類
從目前基于Web的數(shù)據(jù)挖掘應用實際情況來看,基于Web的數(shù)據(jù)挖掘主要分為Web結構挖掘、Web內容挖掘及Web訪問挖掘3類。
(1)Web結構挖掘。
Web結構包括不同網頁之間的超鏈接結構和一個頁面內部的樹形結構,以及文檔URL中的目錄路徑結構等。Web結構挖掘的使用,將會把Web表示成一個有向圖,圖中的點對應的是Web的頁面、圖的邊對應的是Web的超級鏈接,此種情況下,可以獲得一個站點的主頁到任意一個定點的最短路徑,進而快速而準確的獲得相關數(shù)據(jù),加之整理與處理,檢驗與轉化,可以為用戶提供高質量的、有效的信息。如Robot到Web站點,將會構成最短路徑,進而快速發(fā)現(xiàn)較多文檔,便于應用;而HITS、PageRank及鏈接結構中增加Web內容信息,在模擬Web站點的拓撲結構,進而設置好Web頁面的等級,如此可以使HITS、PageRank及鏈接結構更加快速地挖掘信息。
(2)Web內容挖掘。
Web內容挖掘是指從Web上的文件內容及其描述信息中獲取潛在的、有價值的知識或模式的過程。從目前Web內容挖掘應用情況來看,其主要包括Web文本挖掘和Web多媒體挖掘,兩者最大的區(qū)分是挖掘對象不同。Web文本挖掘,顧名思義是對Web上大量文檔進行挖掘,挖掘過程中包括文檔集中的內容的總結、分類、關聯(lián)分析及趨勢分析等,以便文檔信息應用中,可以快速進行數(shù)據(jù)挖掘;而Web多媒體挖掘,則是對Web上的音頻、視頻數(shù)據(jù)進行挖掘,對圖片進行預處理[4]。
(3)Web訪問挖掘。
通常情況下,Web訪問挖掘主要應用于網站LOG文件分析之中,挖掘網頁瀏覽數(shù)據(jù)、網站點擊術、獨立IP訪問數(shù)等,以便相關工作人員可以通過數(shù)據(jù)統(tǒng)計了解網站整體運行情況、了解用戶需求等,為更好地設計和運作網站指明方向。
2 基于Web的數(shù)據(jù)挖掘技術的應用研究
事實上,在現(xiàn)代化的今天基于Web的數(shù)據(jù)挖掘技術已經應用到一些領域之中,并且發(fā)揮重要作用。
2.1 電子商務領域
目前基于Web的數(shù)據(jù)挖掘技術在電子商務領域中的應用,主要是:(1)客戶分類和聚類。也就是利用基于Web的數(shù)據(jù)挖掘來挖掘電子商務平臺用戶的訪問數(shù)量、用戶訪問方向等,進而明確用戶的需求、用戶的層次、用戶的共同特征等,從而合理進行用戶分類和聚類。(2)尋找潛在用戶。也就是利用基于Web的數(shù)據(jù)挖掘對用戶訪問數(shù)據(jù)進行挖掘,再利用分類技術對用戶進行分類,找到潛在用戶及其可能產生的需求。(3)保留客戶的駐留時間。對于電子商務的商家來說,用戶停留在平臺上的時間越長,其購買意向就越大,購買的可能性越大。所以,利用基于Web的數(shù)據(jù)挖掘進行用戶在電子商務平臺上駐留時間的數(shù)據(jù)挖掘,可以為電子商務的商家制定戰(zhàn)略決策提供依據(jù)[5]。
2.2 網絡教育領域
在互聯(lián)網技術應用日益廣泛的今天,教育領域也充分認識到互聯(lián)網的應用價值,將其應用到教育中,開展網絡教育,如此可以打破教育教學活動的時間限制和空間限制。在網絡教育日趨成熟的今天,很多教育機構開設網絡教育,使更多的需求者可以獲取知識,同時也可以促進教育機構更好發(fā)展。在教育網絡中應用基于Web的數(shù)據(jù)挖掘,主要是挖掘學生人數(shù)、教學課程點擊率、教學模式選用頻繁度等相關方面的數(shù)據(jù),將其轉化為有價值的信息,為教育機構優(yōu)化調整網絡教育服務創(chuàng)造條件[6]。
3 結語
在互聯(lián)網應用日益廣泛的今天,Web所涉及的服務越來越廣泛,這使得Web上的信息量不斷增多,大大增加了Web數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)量。此種情況下,科學、合理的運用基于Web的數(shù)據(jù)挖掘技術,其可以充分發(fā)揮起作用,對數(shù)據(jù)進行深度的挖掘,進而有效地處理和檢驗數(shù)據(jù),在此基礎上將數(shù)據(jù)轉化為完整的信息,供用戶所用,滿足用戶的應用需求。目前,基于Web的數(shù)據(jù)挖掘技術在電子商務、網絡教育等領域有重要的應用,相信隨著此項技術的不斷完善,將會更加有效、廣泛的應用。
參考文獻
[1] 張嘉豐.淺析基于Web的數(shù)據(jù)挖掘技術[J].數(shù)字技術與應用,2015(11):43.
[2] 于桂賓.基于Web的數(shù)據(jù)挖掘技術及其應用[J].承德石油高等??茖W校學報,2014,16(5):41-43.
[3] 孫興富.基于Web的數(shù)據(jù)挖掘技術及應用問題探討[J].中國新技術新產品,2010(3):21.
[4] 范建中,王福慶.基于Web的數(shù)據(jù)挖掘技術研究與應用[J].電腦編程技巧與維護,2009(12):32-33,42.
[5] 吳穎智.基于Web的數(shù)據(jù)挖掘技術在網絡管理研究與應用[J].沿海企業(yè)與科技,2010(6):38-39,37.
[6] 王晶.基于Web的數(shù)據(jù)挖掘技術研究綜述[J].光盤技術,2011(7):14,31.