張磊
摘 要:在大數(shù)據(jù)時代下,信息數(shù)據(jù)的重要性變得越來越高,各種數(shù)據(jù)收集、處理技術(shù)也因此在網(wǎng)絡(luò)運營管理領(lǐng)域得到了應(yīng)用,而數(shù)據(jù)挖掘技術(shù)則是其中應(yīng)用較為廣泛的一種。本文對數(shù)據(jù)挖掘技術(shù)與網(wǎng)絡(luò)管理分別進行了介紹,同時結(jié)合各領(lǐng)域網(wǎng)絡(luò)管理的實際情況,對數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)運營管理中的應(yīng)用展開了探討,希望能夠?qū)?shù)據(jù)挖掘技術(shù)的有效推廣應(yīng)用起到一定幫助。
關(guān)鍵詞:數(shù)據(jù)挖掘;網(wǎng)絡(luò)運營管理;關(guān)聯(lián)規(guī)則
中圖分類號:TP3 文獻標識碼:A 文章編號:1671-2064(2020)01-0013-02
0 引言
在當前網(wǎng)絡(luò)環(huán)境下,人們的出行、購物、工作等各項活動雖然都會產(chǎn)生大量的數(shù)據(jù),但由于網(wǎng)絡(luò)資源本身具有很強的異構(gòu)性與動態(tài)性,因此傳統(tǒng)網(wǎng)絡(luò)管理技術(shù)往往無法對這些重要數(shù)據(jù)進行有效捕捉,這不僅會影響到網(wǎng)絡(luò)運營管理決策的準確性,同時也會使網(wǎng)絡(luò)運營管理的功能性因此下降,而對數(shù)據(jù)挖掘技術(shù)的運用,則可以通過在網(wǎng)絡(luò)中的數(shù)據(jù)抽取、轉(zhuǎn)換、集成來游戲有效解決這些問題。由此可見,數(shù)據(jù)挖掘?qū)τ诰W(wǎng)絡(luò)管理來說十分關(guān)鍵,對于數(shù)據(jù)挖掘在網(wǎng)絡(luò)管理中應(yīng)用的思考,則是非常具有現(xiàn)實意義的。
1 數(shù)據(jù)挖掘與網(wǎng)絡(luò)運營管理概述
1.1 數(shù)據(jù)挖掘技術(shù)
數(shù)據(jù)挖掘簡單來說就是將數(shù)據(jù)庫(信息庫)中的數(shù)據(jù)提取出來,通過數(shù)據(jù)集成、數(shù)據(jù)歸約、數(shù)據(jù)變換、數(shù)據(jù)清理等一系列步驟對其進行處理,最終抽取出符合需求、具有價值、可被理解與應(yīng)用的數(shù)據(jù),從而為海量數(shù)據(jù)的有效應(yīng)用提供支持。從功能上來看,數(shù)據(jù)挖據(jù)技術(shù)主要可分為分類、估值、預(yù)測、關(guān)聯(lián)規(guī)則、聚集、描述、可視化、復(fù)雜數(shù)據(jù)類型挖掘等幾種功能,由于不同功能在數(shù)據(jù)挖掘方式上存在一定差異因此,通常會被劃分為直接數(shù)據(jù)挖掘與間接數(shù)據(jù)挖掘兩大類。其中直接數(shù)據(jù)挖掘是以可利用數(shù)據(jù)為基礎(chǔ),有針對性的建立數(shù)據(jù)模型,之后依據(jù)數(shù)據(jù)模型對剩余數(shù)據(jù)及特定變量進行描述,如分類、估值、預(yù)測、關(guān)聯(lián)規(guī)則都屬于直接數(shù)據(jù)挖掘中的一種,而間接數(shù)據(jù)挖掘則在建立數(shù)據(jù)模型的同時,用數(shù)據(jù)模型對模糊變量進行描述,主要包括聚集、描述、可視化以及負責數(shù)據(jù)類型挖掘。由于數(shù)據(jù)挖掘技術(shù)是面向應(yīng)用的,因此其不僅能夠以特定數(shù)據(jù)庫為基礎(chǔ),完成數(shù)據(jù)檢索、查詢、調(diào)用等簡單操作,同時如數(shù)據(jù)統(tǒng)計、數(shù)據(jù)分析、數(shù)據(jù)推理、數(shù)據(jù)間關(guān)系確定等,也同樣可以通過對數(shù)據(jù)挖掘技術(shù)的應(yīng)用[1]。
1.2 網(wǎng)絡(luò)運營管理
網(wǎng)絡(luò)管理可以簡單理解為對通信網(wǎng)絡(luò)資源性能、使用情況進行檢測、控制、資源配置、分析、評價、記錄的一系列活動,通過有效的網(wǎng)絡(luò)管理活動,不僅能夠保證網(wǎng)絡(luò)的有效運行,同時也可以使網(wǎng)絡(luò)變得更加高效、安全、穩(wěn)定,因此在網(wǎng)絡(luò)系統(tǒng)中,網(wǎng)絡(luò)運營管理一直都發(fā)揮著極為關(guān)鍵的作用。從功能上來看,ISO定義的網(wǎng)絡(luò)管理功能主要包括配置管理、故障管理、性能管理、安全管理、計費管理幾部分,其中配置管理的主要內(nèi)容是對網(wǎng)絡(luò)配置情況進行的數(shù)據(jù)收集、運行監(jiān)控與調(diào)整,網(wǎng)絡(luò)拓撲結(jié)構(gòu)規(guī)劃、硬件設(shè)備插板配置、重構(gòu)網(wǎng)絡(luò)資源、修改或刪除網(wǎng)絡(luò)資源等,都屬于配置管理的常見內(nèi)容。故障管理是指在硬件設(shè)備與網(wǎng)絡(luò)路徑出現(xiàn)問題后,根據(jù)系統(tǒng)發(fā)出得報警信息來進行分析,以判斷出故障的位置、原因并為故障的有效處理提供支持。性能管理是一項持續(xù)性的管理功能,在網(wǎng)絡(luò)運行過程中,系統(tǒng)會定期收集網(wǎng)絡(luò)資源性能的相關(guān)數(shù)據(jù),并提交給網(wǎng)管中心,網(wǎng)管中心在得到網(wǎng)絡(luò)資源性能測量數(shù)據(jù)后,會判斷出網(wǎng)絡(luò)資源的性能并將這一性能情況作為歷史記錄保存起來,這樣當網(wǎng)絡(luò)運行效率過低或是系統(tǒng)性能出現(xiàn)問題時,就可以根據(jù)這些歷史記錄展開分析,以實現(xiàn)系統(tǒng)性能的有效優(yōu)化。安全管理主要是針對網(wǎng)絡(luò)資源及計算機設(shè)備的非法訪問問題,具體方法是通過對加密機構(gòu)的密鑰進行管理,以實現(xiàn)對網(wǎng)絡(luò)資源及設(shè)備訪問權(quán)限的加密,這樣在為掌握密鑰的情況下,非法訪問行為就可以被及時發(fā)現(xiàn)并制止。計費管理主要是針對各種電信業(yè)務(wù)資費標準,其內(nèi)容相對簡單,主要包括電信用戶業(yè)務(wù)使用情況管理和電信用戶費用管理等。
2 數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)運營管理中的應(yīng)用
2.1 網(wǎng)絡(luò)入侵檢測
網(wǎng)絡(luò)入侵檢測是為針對當前黑客網(wǎng)絡(luò)攻擊、病毒入侵等網(wǎng)絡(luò)信息安全問題所展開的一種網(wǎng)絡(luò)管理活動,在這項網(wǎng)絡(luò)管理活動中,任何可能會損害網(wǎng)絡(luò)系統(tǒng)保密性、完整性、可用性的行為都需要準確識別出來,并及時加以制止,同時還要向系統(tǒng)發(fā)出警報,確定后續(xù)處理方案?,F(xiàn)階段常見的網(wǎng)絡(luò)入侵檢測方法主要可分為異常檢測與誤用檢測兩種方法,二者雖然都是通過從計算機網(wǎng)絡(luò)關(guān)鍵點信息的收集、分析來檢測違法安全策略的入侵行為,但誤用檢測是以攻擊特征為基礎(chǔ),將已知的各種攻擊特征編寫為程序存入到專門的數(shù)據(jù)庫中,之后在通過計算機網(wǎng)絡(luò)關(guān)鍵點信息與攻擊特征信息的對比來進行檢測,如兩種信息匹配度較高,則說明網(wǎng)絡(luò)系統(tǒng)遭受到了攻擊,反之則說明網(wǎng)絡(luò)系統(tǒng)正處于安全狀態(tài)。而異常檢測則是以用戶行為及網(wǎng)絡(luò)資源使用情況為基礎(chǔ),對各種行為與正常行為進行對比分析,如用戶行為與正常行為間的偏離度較高,則說明系統(tǒng)遭到了入侵。這兩種入侵檢測方法雖然都具有著較好的應(yīng)用效果,但也同樣無法識別未知入侵行為、技術(shù)不夠成熟等問題,因此為保證網(wǎng)絡(luò)入侵檢測的有效性,完全可以將數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則、聚類分析應(yīng)用到網(wǎng)絡(luò)入侵檢測中來,對當前檢測方法進行優(yōu)化。例如在誤用檢測中,可以利用關(guān)聯(lián)規(guī)則來識別各種頻繁項目集,之后對項目集的支持度、可行度進行分析,如可行度與支持度小于用戶規(guī)定法制,則說明系統(tǒng)可能會遭到入侵,這樣即便網(wǎng)絡(luò)系統(tǒng)遭到了未知入侵行為攻擊,系統(tǒng)也可以有效識別出來并予以制止。而在異常檢測中,則可以利用反應(yīng)聚類分析來識別數(shù)據(jù)對象的內(nèi)在規(guī)則,將數(shù)據(jù)分布規(guī)律確定下來,并據(jù)此提出相應(yīng)的入侵檢測算法,為入侵檢測提供有效支持。
2.2 網(wǎng)絡(luò)資源應(yīng)用
在互聯(lián)網(wǎng)高度普及的今天,網(wǎng)絡(luò)上的各種數(shù)據(jù)信息、文件資料已經(jīng)在教學、管理等諸多領(lǐng)域中得到了較為廣泛的應(yīng)用,但由于網(wǎng)絡(luò)上的各種資源較多,用戶很難從海量數(shù)據(jù)中找到自己想要的資源,因此針對當前網(wǎng)絡(luò)資源應(yīng)用存在的問題,同樣也可以對數(shù)據(jù)挖掘技術(shù)進行應(yīng)用。以教學資源應(yīng)用為例,面對數(shù)量眾多、良莠不齊的網(wǎng)絡(luò)資源,首先可以利用關(guān)聯(lián)規(guī)則挖掘關(guān)聯(lián)特性,根據(jù)自己想要的網(wǎng)絡(luò)資源來從關(guān)系數(shù)據(jù)庫中提取合適的關(guān)聯(lián)規(guī)則,搜索網(wǎng)絡(luò)上的各種相關(guān)教學資源,并找出其中出現(xiàn)條件概率較高的資源。而在建立學習平臺的情況下,則可以對學生網(wǎng)頁瀏覽情況進行檢測,收集其網(wǎng)絡(luò)瀏覽習慣,并根據(jù)各個網(wǎng)頁的內(nèi)容展開綜合分析,確定學生學習特征以及知識點之間的內(nèi)在聯(lián)系,這樣既可以將網(wǎng)絡(luò)學習資源中的各個知識點連接起來,同時也可以找到符合學生特征與知識認知情況的新學習資源,使學生的個性化學習需求得到滿足。其次,則可以對學生的學習情況、能力情況進行全面收集,之后再根據(jù)模糊集判斷、決策、識別等數(shù)據(jù)處理方法,對學生進行定性的模糊式評價,通過模糊式評價結(jié)果,教師可以獲知學生的學習習慣、學習特性、興趣愛好,進而展開針對性的教學策略推理、學習資源推薦、學習引導(dǎo),以達到分層教學的效果。最后,由于聚類分析能夠?qū)⑾嗨贫容^高的數(shù)據(jù)對象歸為一類,因此在網(wǎng)絡(luò)教學資源的應(yīng)用過程中,還可以基于聚類分析技術(shù)設(shè)計推薦功能,根據(jù)教師已掌握的網(wǎng)絡(luò)教學資源來為其推薦相似度較高的其他教學資源,或是根據(jù)學生的專業(yè)背景、層次信息、所學知識點等信息來篩選出相關(guān)度較高的資料,從而為教學與學生學習提供個性化服務(wù)。
2.3 網(wǎng)絡(luò)故障處理
當前的常規(guī)故障管理主要是通過網(wǎng)絡(luò)設(shè)備運行、流量等信息的收集檢測來判斷網(wǎng)絡(luò)系統(tǒng)是否存在故障,并根據(jù)對故障的識別分析來為故障有效處理提供數(shù)據(jù)支持。在理想狀態(tài)下,網(wǎng)絡(luò)故障發(fā)生后只要能夠被系統(tǒng)檢測出來,系統(tǒng)就可以發(fā)出警報,警告網(wǎng)絡(luò)管理終端進行故障分析、識別與處理,但由于網(wǎng)絡(luò)系統(tǒng)每天檢測到的故障隱患非常,所發(fā)出的故障警報已經(jīng)遠遠超出了網(wǎng)絡(luò)管理平臺的處理能力,因此網(wǎng)絡(luò)管理很難單純依據(jù)警告信息來進行有效的網(wǎng)絡(luò)故障處理。針對這一問題,同樣可以利用關(guān)聯(lián)規(guī)則來對網(wǎng)絡(luò)系統(tǒng)中的不同警報信息進行關(guān)聯(lián)性分析,確定不同警報信息間的關(guān)聯(lián)性,之后從中去除一些關(guān)聯(lián)性較小或完全無關(guān)的警報信息,在將這些信息剔除后,上交網(wǎng)絡(luò)管理平臺的信息數(shù)量大大減少,警報信息的語義表達也會更加明確,平臺處理起來自然也會更加高效。同時,根據(jù)關(guān)聯(lián)性較大的警報信息,網(wǎng)絡(luò)管理平臺還可以快速找出故障的真正原因,并通過故障定位等手段來盡快完成故障處理,恢復(fù)網(wǎng)絡(luò)服務(wù),降低網(wǎng)絡(luò)故障對網(wǎng)絡(luò)用戶的影響。
2.4 網(wǎng)絡(luò)營銷管理
網(wǎng)絡(luò)營銷作為一種依托互聯(lián)網(wǎng)發(fā)展起來的一種營銷模式,其對于客戶的各方面信息數(shù)據(jù)需求非常之大,雖然從目前來看,大數(shù)據(jù)技術(shù)的支持使得很多企業(yè)都能夠可以對用戶在日常生活、工作中產(chǎn)生的相關(guān)數(shù)據(jù)進行收集,并通過對海量數(shù)據(jù)的分析來探究客戶及市場需求,制定針對性的營銷策略。但由于網(wǎng)絡(luò)營銷中涉及的數(shù)據(jù)種類較多、數(shù)量也非常大,因此如何從中提取出有價值的新信息,并將這些新數(shù)據(jù)信息有效應(yīng)用到營銷工作中來,就成為了網(wǎng)絡(luò)營銷的一大難題。針對這一問題,企業(yè)完全可以以數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則為基礎(chǔ),對海量的網(wǎng)絡(luò)營銷數(shù)據(jù)展開關(guān)聯(lián)性分析,確定網(wǎng)絡(luò)營銷數(shù)據(jù)的特點,之后一句數(shù)據(jù)特點展開數(shù)據(jù)篩選、提取、轉(zhuǎn)化,將原本關(guān)聯(lián)性較低的數(shù)據(jù)轉(zhuǎn)化為可利用的營銷數(shù)據(jù),從而為網(wǎng)絡(luò)營銷決策提供支持。
2.5 網(wǎng)站平臺運營
各類網(wǎng)站平臺的運營管理需要對海量數(shù)據(jù)進行處理,因此在這類網(wǎng)絡(luò)管理工作中,數(shù)據(jù)挖掘技術(shù)所能夠發(fā)揮出的作用同樣是非常多樣的。例如在用戶經(jīng)營方面,用戶注冊并登錄網(wǎng)站平臺后,其所有操作信息都會被記錄下來,這時平臺方就可以利用模糊集算法來對用戶瀏覽方式、瀏覽內(nèi)容、操作習慣、不同頁面停留時間等信息來對用戶訪問習慣展開推斷,并根據(jù)其訪問習慣來為期提供個性化服務(wù)(如商品推薦等),或是針對用戶喜好來對網(wǎng)站運營模式進行更新,這樣可以有效提升用戶對網(wǎng)站的好感度,而網(wǎng)站的運營效益也會因此得到提升。另外在一些以商品銷售為主的網(wǎng)站上,由于網(wǎng)站上銷售的商品較多,因此用戶通常會根據(jù)自己想要的商品來進行關(guān)鍵字搜索,以找出網(wǎng)站上所有的該類商品,根據(jù)用戶的這一習慣,網(wǎng)站運營管理部門則可以通過用戶的購物偏好(由模糊集算法確定)來主動為其選取一寫關(guān)鍵詞,并顯示在搜索欄中,這樣用戶在想要查找商品時,就可以從關(guān)鍵詞庫中提取出部分符合其購物偏好的關(guān)鍵詞,為用戶提供提示,這樣就可以使搜索服務(wù)更加個性化,從而幫助用戶購買到更為理想的商品。
3 結(jié)語
總而言之,數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)運營管理中能夠發(fā)揮出十分關(guān)鍵的作用,無論是對網(wǎng)站平臺的運營,還是在網(wǎng)絡(luò)營銷管理工作中,亦或是針對網(wǎng)絡(luò)系統(tǒng)故障的處理,都可以通過對數(shù)據(jù)挖掘技術(shù)的靈活應(yīng)用來解決各種問題,因此未來必須要要對數(shù)據(jù)挖掘技術(shù)基于更高的關(guān)注,并根據(jù)其技術(shù)特點將數(shù)據(jù)挖掘應(yīng)用到更多的網(wǎng)絡(luò)運營管理工作中來。
參考文獻
[1] 馬亭新.數(shù)據(jù)挖掘在通信運營企業(yè)管理中的應(yīng)用[J].信息系統(tǒng)工程,2019(10):50-51.