武煜
【摘要】 數(shù)據(jù)挖掘技術(shù)目前是全球各個(gè)國(guó)家和地區(qū)重點(diǎn)投資研究的重大新技術(shù),更是數(shù)據(jù)庫(kù)系統(tǒng)研究和應(yīng)用領(lǐng)域的熱點(diǎn)之一。移動(dòng)通信領(lǐng)域市場(chǎng)競(jìng)爭(zhēng)日益激烈,中國(guó)的三大運(yùn)營(yíng)商的經(jīng)營(yíng)管理模式開始向“以客戶為中心”的趨勢(shì)發(fā)展,數(shù)據(jù)挖掘技術(shù)顯得尤為重要。本文闡述了數(shù)據(jù)挖掘的相關(guān)知識(shí),并介紹了數(shù)據(jù)挖掘技術(shù)在電信行業(yè)的應(yīng)用現(xiàn)狀。
【關(guān)鍵詞】 數(shù)據(jù)挖掘 概述 應(yīng)用現(xiàn)狀 電信行業(yè)
社會(huì)的發(fā)展和時(shí)代的進(jìn)步給電信行業(yè)帶來(lái)了更加殘酷激烈的競(jìng)爭(zhēng)環(huán)境,移動(dòng)通信產(chǎn)業(yè)的服務(wù)經(jīng)濟(jì)業(yè)態(tài)進(jìn)化逐漸完成。移動(dòng)增值業(yè)務(wù)作為新興市場(chǎng)在基本的移動(dòng)業(yè)務(wù)上為用戶和市場(chǎng)提供了更具針對(duì)性的、可供選擇的業(yè)務(wù),成為了電信行業(yè)的重要組成部分。而數(shù)據(jù)挖掘技術(shù)的應(yīng)用讓移動(dòng)增值業(yè)務(wù)在飛速發(fā)展中找到了擴(kuò)大企業(yè)用戶規(guī)模的有效途徑。
一、數(shù)據(jù)挖掘概述
1、數(shù)據(jù)挖掘。數(shù)據(jù)挖掘是知識(shí)發(fā)現(xiàn)的核心部分,也是利用知識(shí)積累數(shù)據(jù)的高層次形式,它包含了一系列通過(guò)研究數(shù)據(jù)集探索新模式的技術(shù)。數(shù)據(jù)挖掘指的就是從大量的數(shù)據(jù)中篩選出有價(jià)值的知識(shí)的過(guò)程,它能做到高度自動(dòng)化的對(duì)數(shù)據(jù)進(jìn)行分析并歸納性的進(jìn)行推理,挖掘出有價(jià)值的知識(shí)、模型、規(guī)則,預(yù)測(cè)未來(lái)、評(píng)估風(fēng)險(xiǎn)。數(shù)據(jù)挖掘在商業(yè)中的應(yīng)用主要表現(xiàn)為在大型數(shù)據(jù)庫(kù)中搜集有價(jià)值的信息,探索商業(yè)規(guī)律,驗(yàn)證商業(yè)預(yù)測(cè)。數(shù)據(jù)挖掘模式分為預(yù)測(cè)型和描述型兩種。數(shù)據(jù)挖局過(guò)程是不斷反饋,不斷利用分析工具在大量數(shù)據(jù)中挖掘模型的過(guò)程。2、數(shù)據(jù)挖掘算法。在分類數(shù)據(jù)挖掘算法中采用的決策樹算法常為C5.0、CART等,而回歸算法則是邏輯回歸、線性回歸等。決策樹是實(shí)例的分類器,其理論依據(jù)是信息論。決策樹算法的實(shí)質(zhì)是在學(xué)習(xí)的基礎(chǔ)上獲得分類規(guī)則。決策樹的每個(gè)分支就是一個(gè)分類問(wèn)題,樹葉是帶有分類的數(shù)據(jù)分割。決策樹的構(gòu)造方法是自上而下的遞歸構(gòu)造。決策樹算法的缺點(diǎn)主要有過(guò)度擬合問(wèn)題、分類規(guī)則復(fù)雜。作為最基本的回歸算法,線性回歸的研究?jī)?nèi)容是自變量的線性組合對(duì)一個(gè)獨(dú)立因變量的影響。3、數(shù)據(jù)挖掘工具。主流的數(shù)據(jù)挖掘工具可分為數(shù)據(jù)挖掘和統(tǒng)計(jì)分析平臺(tái)、與數(shù)據(jù)庫(kù)集成的數(shù)據(jù)挖掘平臺(tái)、行業(yè)應(yīng)用及解決方案三類。數(shù)據(jù)挖掘平臺(tái)能根據(jù)用戶的商業(yè)經(jīng)驗(yàn)快速建立獨(dú)特的預(yù)測(cè)性模型,并將結(jié)果分享給相關(guān)決策人員,以輔助決策。優(yōu)秀的數(shù)據(jù)挖掘平臺(tái)能為用戶提供成熟、廣泛的數(shù)據(jù)挖掘技術(shù),以便找到適合需求的分析技術(shù),進(jìn)而將商務(wù)問(wèn)題最好的解決。Clementine是一個(gè)優(yōu)良的數(shù)據(jù)挖掘平臺(tái),支持整個(gè)數(shù)據(jù)挖掘過(guò)程及其標(biāo)準(zhǔn)化流程。4、數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)面向主題的數(shù)據(jù)集合,具有集成性、相對(duì)穩(wěn)定性、反映歷史變化等優(yōu)點(diǎn),用于支持管理決策。數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)根據(jù)一定的主題域進(jìn)行組織,主題指的是用戶在利用數(shù)據(jù)倉(cāng)庫(kù)輔助決策時(shí)的關(guān)注重點(diǎn)。數(shù)據(jù)倉(cāng)庫(kù)的集成指的是其在對(duì)原有分散的數(shù)據(jù)庫(kù)中抽取、清理數(shù)據(jù),并在此基礎(chǔ)上加工、匯總、整理相關(guān)數(shù)據(jù),以便消除源數(shù)據(jù)中的不一致性,保證數(shù)據(jù)庫(kù)的全局性。
二、數(shù)據(jù)挖掘技術(shù)在電信行業(yè)的具體應(yīng)用領(lǐng)域
1、業(yè)務(wù)預(yù)測(cè)。業(yè)務(wù)預(yù)測(cè)指的是通過(guò)分析歷史數(shù)據(jù)確定業(yè)務(wù)發(fā)展影響因素,并評(píng)估這些因素的未來(lái)發(fā)展,以便確定大致的未來(lái)業(yè)務(wù)量,并有針對(duì)性的對(duì)預(yù)測(cè)中有價(jià)值的客戶進(jìn)行精確營(yíng)銷。業(yè)務(wù)預(yù)測(cè)是企業(yè)制定發(fā)展計(jì)劃的重要依據(jù)??梢酝ㄟ^(guò)對(duì)比、驗(yàn)證實(shí)際值與預(yù)測(cè)值測(cè)量預(yù)測(cè)的準(zhǔn)確度,以便更加精確的找出相關(guān)因素,改進(jìn)預(yù)測(cè)方法。移動(dòng)運(yùn)營(yíng)商業(yè)務(wù)種類很多,需要進(jìn)行預(yù)測(cè)的場(chǎng)合也很多。如確定市場(chǎng)未來(lái)規(guī)模時(shí)需預(yù)測(cè)移動(dòng)電話客戶的增長(zhǎng)。2、預(yù)測(cè)、控制客戶流失。與爭(zhēng)取一個(gè)新用戶相比,挽留一個(gè)老客戶的代價(jià)明顯更小??蛻舻牧魇c市場(chǎng)份額和營(yíng)業(yè)經(jīng)濟(jì)效益有著直接關(guān)聯(lián),為此,預(yù)測(cè)客戶流失是移動(dòng)運(yùn)營(yíng)商最關(guān)注的一個(gè)重點(diǎn)。客戶流失預(yù)測(cè)的分析對(duì)象已流失的客戶和未流失的客戶??蛻袅魇ьA(yù)測(cè)的工作內(nèi)容即為從分析對(duì)象的自然屬性及行為屬性等屬性中確定流失客戶的特點(diǎn),預(yù)測(cè)客戶未來(lái)一段時(shí)間的流失概率。3、分析客戶呼叫模式??蛻艉艚心J降姆治龉ぷ髂艽龠M(jìn)運(yùn)用商對(duì)客戶喜好的了解,而分析結(jié)果則是移動(dòng)運(yùn)營(yíng)商市場(chǎng)營(yíng)銷活動(dòng)的依據(jù)。運(yùn)營(yíng)商通過(guò)分析客戶呼叫模式能掌握客戶的部分基本特征,如客戶打電話的時(shí)間喜好。這些基本特征在提取后能為客戶差異性分析提供依據(jù)。4、特征識(shí)別大客戶。企業(yè)的大客戶群體是利潤(rùn)的主要來(lái)源,而大客戶資源也是企業(yè)競(jìng)爭(zhēng)力的重要體現(xiàn),更是其他移動(dòng)運(yùn)營(yíng)商的焦點(diǎn)。將大客戶單獨(dú)識(shí)別出來(lái)并有針對(duì)性的制定采取措施可以有效的提高客戶的忠誠(chéng)度,這是移動(dòng)運(yùn)營(yíng)商保持領(lǐng)先的關(guān)鍵。5、管理網(wǎng)絡(luò)資源。通信網(wǎng)的運(yùn)行過(guò)程會(huì)產(chǎn)生大量的運(yùn)行數(shù)據(jù)。挖掘這些運(yùn)行數(shù)據(jù)是早日發(fā)現(xiàn)潛在網(wǎng)絡(luò)故障的有效手段,這對(duì)網(wǎng)絡(luò)利用率的提高功不可沒。數(shù)據(jù)挖掘可以應(yīng)用通信網(wǎng)流量峰值預(yù)測(cè)、故障預(yù)測(cè)、網(wǎng)絡(luò)流量?jī)?yōu)化等方式管理網(wǎng)絡(luò)資源。
小結(jié):數(shù)據(jù)挖掘技術(shù)在移動(dòng)通信領(lǐng)域具有巨大的商業(yè)應(yīng)用價(jià)值,而新興市場(chǎng)移動(dòng)增值業(yè)務(wù)如果能科學(xué)合理的應(yīng)用數(shù)據(jù)挖掘技術(shù)也能獲得良好的收益。但目前數(shù)據(jù)挖掘技術(shù)雖然在移動(dòng)增值業(yè)務(wù)中被應(yīng)用,其實(shí)際過(guò)程中仍存在一些不足之處,亟需改善、解決。
參 考 文 獻(xiàn)
[1]郭勇.簡(jiǎn)述數(shù)據(jù)挖掘技術(shù)在電信客戶分析中的應(yīng)用研究[J].電腦迷,2016,(1):40-40.
[2]梁霄波.電信客戶細(xì)分中基于聚類算法的數(shù)據(jù)挖掘技術(shù)研究[J].現(xiàn)代電子技術(shù),2016,39(15):95-98.
[3]楊逸凡,趙夏.數(shù)據(jù)挖掘在電信客戶流失分析中的應(yīng)用[J].甘肅科技縱橫,2015,44(5):30-33.endprint