侯慧芳,潘潔
(中國(guó)移動(dòng)通信集團(tuán)設(shè)計(jì)院有限公司,北京 100080)
大數(shù)據(jù)背景下運(yùn)營(yíng)商建設(shè)統(tǒng)一DPI系統(tǒng)的思考
侯慧芳,潘潔
(中國(guó)移動(dòng)通信集團(tuán)設(shè)計(jì)院有限公司,北京 100080)
移動(dòng)數(shù)據(jù)流量業(yè)務(wù)逐漸增大,運(yùn)營(yíng)商的經(jīng)營(yíng)模式正在從“話(huà)務(wù)量經(jīng)營(yíng)”向“流量經(jīng)營(yíng)”轉(zhuǎn)變,“大數(shù)據(jù)經(jīng)營(yíng)”將成為運(yùn)營(yíng)商的主要發(fā)展方向。運(yùn)營(yíng)商積極探索DPI技術(shù)對(duì)于大數(shù)據(jù)運(yùn)營(yíng)的價(jià)值和應(yīng)用方向,制定標(biāo)準(zhǔn)的統(tǒng)一DPI系統(tǒng)規(guī)范,為大數(shù)據(jù)運(yùn)營(yíng)提供全面、標(biāo)準(zhǔn)的流量數(shù)據(jù)。系統(tǒng)分析了傳統(tǒng)DPI部署方式存在的弊端,提出建設(shè)統(tǒng)一DPI系統(tǒng)對(duì)推動(dòng)運(yùn)營(yíng)商大數(shù)據(jù)發(fā)展提供的重要基礎(chǔ)數(shù)據(jù)保障作用。
統(tǒng)一DPI;大數(shù)據(jù);電信運(yùn)營(yíng)商
隨著移動(dòng)互聯(lián)網(wǎng)業(yè)務(wù)的快速發(fā)展,數(shù)據(jù)業(yè)務(wù)取代了語(yǔ)音和短信業(yè)務(wù)成為運(yùn)營(yíng)商的收入支柱,運(yùn)營(yíng)商積極探索經(jīng)營(yíng)新模式,從“話(huà)務(wù)量經(jīng)營(yíng)”向“流量經(jīng)營(yíng)”轉(zhuǎn)變,“大數(shù)據(jù)經(jīng)營(yíng)”將成為運(yùn)營(yíng)商的主要發(fā)展方向。國(guó)內(nèi)互聯(lián)網(wǎng)公司已涌現(xiàn)出一批先行者(例如阿里巴巴、百度、騰訊等)積極開(kāi)展大數(shù)據(jù)的研究和開(kāi)發(fā),電信運(yùn)營(yíng)商比互聯(lián)網(wǎng)公司擁有更多的天然優(yōu)勢(shì),因?yàn)殡娦胚\(yùn)營(yíng)商本身掌握了豐富的基礎(chǔ)數(shù)據(jù)資源。
對(duì)用戶(hù)話(huà)單和網(wǎng)絡(luò)信令中的信息進(jìn)行提取分析是大數(shù)據(jù)運(yùn)營(yíng)的基礎(chǔ),而運(yùn)營(yíng)商傳統(tǒng)的 DPI(deep packet inspection)部署方式以系統(tǒng)為單位進(jìn)行建設(shè),存在重復(fù)建設(shè)、重復(fù)存儲(chǔ)、重復(fù)分析以及數(shù)據(jù)格式不標(biāo)準(zhǔn)的弊端,分散的信息形成一個(gè)個(gè)信息“孤島”,不能合成全面完整的用戶(hù)信息[1]。統(tǒng)一 DPI系統(tǒng)對(duì)傳統(tǒng) DPI系統(tǒng)存在的問(wèn)題加以改進(jìn)和規(guī)范,著眼于部署位置合理化、設(shè)備功能規(guī)范化和數(shù)據(jù)格式標(biāo)準(zhǔn)化,為大數(shù)據(jù)運(yùn)營(yíng)提供準(zhǔn)確豐富的基礎(chǔ)數(shù)據(jù),推動(dòng)大數(shù)據(jù)應(yīng)用的建設(shè)發(fā)展。
DPI是一種基于數(shù)據(jù)分組的深度檢測(cè)技術(shù),針對(duì)不同的網(wǎng)絡(luò)應(yīng)用層載荷(例如 HTTP、DNS等)進(jìn)行深度檢測(cè),通過(guò)對(duì)報(bào)文的有效載荷檢測(cè)決定其合法性。DPI設(shè)備通過(guò)對(duì)網(wǎng)絡(luò)關(guān)鍵點(diǎn)的流量和報(bào)文內(nèi)容進(jìn)行檢測(cè)分析,可以根據(jù)事先定義的策略對(duì)檢測(cè)流量進(jìn)行過(guò)濾控制,能完成所在鏈路的業(yè)務(wù)精細(xì)化識(shí)別、業(yè)務(wù)流量流向分析、業(yè)務(wù)流量占比統(tǒng)計(jì)、業(yè)務(wù)占比整形、應(yīng)用層拒絕服務(wù)攻擊、對(duì)病毒/木馬進(jìn)行過(guò)濾和控制P2P的濫用等功能。
傳統(tǒng)DPI設(shè)備以業(yè)務(wù)系統(tǒng)為單位進(jìn)行建設(shè),每個(gè)業(yè)務(wù)系統(tǒng)在同一采集點(diǎn)均建設(shè)了自己的 DPI設(shè)備,并且不同采集點(diǎn)、不同業(yè)務(wù)系統(tǒng)和不同廠(chǎng)商對(duì) DPI設(shè)備采集的數(shù)據(jù)格式并未進(jìn)行統(tǒng)一規(guī)范,造成傳統(tǒng)DPI系統(tǒng)存在重復(fù)采集、重復(fù)存儲(chǔ)、重復(fù)分析和數(shù)據(jù)格式不標(biāo)準(zhǔn)等弊端。
2.1 重復(fù)采集
每個(gè)業(yè)務(wù)系統(tǒng)都建設(shè)了從數(shù)據(jù)采集層到應(yīng)用層的一整套設(shè)備,因此全網(wǎng)DPI系統(tǒng)的數(shù)量就等于全網(wǎng)業(yè)務(wù)系統(tǒng)的類(lèi)別數(shù)量,而在數(shù)量龐大的DPI設(shè)備中,有約70%存在數(shù)據(jù)重復(fù)采集的現(xiàn)象。DPI系統(tǒng)的煙囪式部署,導(dǎo)致了多點(diǎn)建設(shè)DPI位置重復(fù)、同一位置建設(shè)多套DPI功能重復(fù)的問(wèn)題,也給運(yùn)營(yíng)商造成了巨大的投資浪費(fèi)。
2.2 重復(fù)存儲(chǔ)
傳統(tǒng)的DPI系統(tǒng)部署時(shí)存在同一采集點(diǎn)部署多套DPI設(shè)備的情況,當(dāng)同一采集點(diǎn)的不同應(yīng)用系統(tǒng)均需要進(jìn)行數(shù)據(jù)存儲(chǔ)時(shí),數(shù)據(jù)被分別存儲(chǔ)于各個(gè)應(yīng)用系統(tǒng),就會(huì)產(chǎn)生數(shù)據(jù)重復(fù)存儲(chǔ)的現(xiàn)象。而全網(wǎng)的每個(gè)采集點(diǎn)至少都部署了監(jiān)測(cè)系統(tǒng)和管理系統(tǒng),再加上各類(lèi)個(gè)性化應(yīng)用,運(yùn)營(yíng)商重復(fù)存儲(chǔ)的數(shù)據(jù)量會(huì)非常龐大。
2.3 重復(fù)分析
傳統(tǒng)的DPI系統(tǒng)在建設(shè)時(shí)只考慮各應(yīng)用系統(tǒng)自身的數(shù)據(jù)采集需求,不同的應(yīng)用系統(tǒng)可能對(duì)數(shù)據(jù)進(jìn)行了相同方式的采集和分析,只是應(yīng)用系統(tǒng)將分析數(shù)據(jù)進(jìn)行了不同層面的展示,造成了數(shù)據(jù)重復(fù)分析、應(yīng)用重復(fù)開(kāi)發(fā)的問(wèn)題,給運(yùn)營(yíng)商帶來(lái)較大的投資浪費(fèi)。
2.4 數(shù)據(jù)格式不標(biāo)準(zhǔn)
由于不同通信設(shè)備廠(chǎng)商DPI設(shè)備實(shí)現(xiàn)方式不同,導(dǎo)致數(shù)據(jù)呈現(xiàn)未遵循統(tǒng)一格式;以業(yè)務(wù)劃分方式為例,不同廠(chǎng)商對(duì)業(yè)務(wù)劃分顆粒度和歸屬關(guān)系的定義不一致,導(dǎo)致DPI設(shè)備識(shí)別的業(yè)務(wù)命名、定義和數(shù)量均不同。
不同采集位置數(shù)據(jù)格式TLV(類(lèi)型(type)、長(zhǎng)度(length)、值(value))缺乏統(tǒng)一規(guī)劃,難以關(guān)聯(lián),無(wú)法端到端分析;以移動(dòng)用戶(hù)使用微信業(yè)務(wù)為例,傳統(tǒng)煙囪式 DPI部署方式下,若 Gn口和省網(wǎng)出口兩個(gè)位置得到的用戶(hù)信息并不能完全對(duì)應(yīng),就無(wú)法完成用戶(hù)數(shù)據(jù)端到端的分析。
不同業(yè)務(wù)系統(tǒng)定義的業(yè)務(wù)分類(lèi)體系不同,使得不同業(yè)務(wù)系統(tǒng)DPI設(shè)備識(shí)別的基礎(chǔ)數(shù)據(jù)無(wú)法達(dá)成一致。因此,無(wú)論從運(yùn)營(yíng)商業(yè)務(wù)系統(tǒng)本身對(duì)業(yè)務(wù)數(shù)據(jù)分類(lèi)的定義,還是通信設(shè)備廠(chǎng)商的實(shí)現(xiàn)方式,都沒(méi)有做到統(tǒng)一規(guī)范,造成各個(gè)系統(tǒng)輸出信息的字段和格式不完全相同,各字段的內(nèi)容描述和具體取值不完全相同,導(dǎo)致數(shù)據(jù)格式不一致,各說(shuō)各話(huà)。
由于DPI系統(tǒng)煙囪式部署、無(wú)序規(guī)劃、重復(fù)建設(shè),導(dǎo)致在網(wǎng)絡(luò)安全、運(yùn)行維護(hù)、建設(shè)投資和數(shù)據(jù)有效利用等方面存在一系列問(wèn)題,同時(shí)數(shù)據(jù)格式的不一致導(dǎo)致無(wú)法端到端呈現(xiàn)全局?jǐn)?shù)據(jù),難以為大數(shù)據(jù)平臺(tái)提供基礎(chǔ)數(shù)據(jù)。沒(méi)有統(tǒng)一規(guī)劃的DPI發(fā)展模式,在未來(lái)大數(shù)據(jù)時(shí)代將導(dǎo)致大量的投資浪費(fèi)、能力不足等問(wèn)題,需從全網(wǎng)角度對(duì)DPI設(shè)備的部署進(jìn)行統(tǒng)籌規(guī)劃。
為實(shí)現(xiàn)DPI部署位置合理化、設(shè)備功能規(guī)范化、數(shù)據(jù)格式標(biāo)準(zhǔn)化,運(yùn)營(yíng)商對(duì)全網(wǎng)DPI系統(tǒng)進(jìn)行整合,建設(shè)統(tǒng)一DPI系統(tǒng)。統(tǒng)一DPI是指一套DPI設(shè)備對(duì)鏈路上的流量進(jìn)行采集與識(shí)別,并將滿(mǎn)足其他系統(tǒng)所需的流量和分析統(tǒng)計(jì)數(shù)據(jù)分發(fā)給各第三方應(yīng)用系統(tǒng)服務(wù)器。網(wǎng)絡(luò)中各類(lèi)流量管理相關(guān)的應(yīng)用系統(tǒng),主要由DPI設(shè)備和應(yīng)用服務(wù)器組成。其中,DPI設(shè)備負(fù)責(zé)數(shù)據(jù)采集、流量分析統(tǒng)計(jì)、日志合成,應(yīng)用服務(wù)器主要完成對(duì)數(shù)據(jù)的進(jìn)一步分析處理,合理組織和存儲(chǔ)數(shù)據(jù),并進(jìn)行呈現(xiàn)。統(tǒng)一DPI整合了多個(gè)第三方應(yīng)用系統(tǒng)的DPI設(shè)備,通過(guò)DPI復(fù)用為多個(gè)系統(tǒng)提供DPI能力。
3.1 統(tǒng)一位置
運(yùn)營(yíng)商網(wǎng)內(nèi)流量,從用戶(hù)出發(fā),按照接入網(wǎng)、城域網(wǎng)、省網(wǎng)和骨干網(wǎng)的順序在網(wǎng)內(nèi)傳輸,由此,在全網(wǎng)5個(gè)點(diǎn)進(jìn)行數(shù)據(jù)采集,部署DPI設(shè)備可捕捉網(wǎng)內(nèi)流量全貌,如圖1所示。
圖1 統(tǒng)一DPI系統(tǒng)部署位置
同一個(gè)采集點(diǎn)上采用一套統(tǒng)一DPI設(shè)備為多套應(yīng)用系統(tǒng)提供數(shù)據(jù),實(shí)現(xiàn)DPI復(fù)用。通過(guò)減少采集點(diǎn)和DPI設(shè)備數(shù)量,實(shí)現(xiàn)多系統(tǒng)間同一采集點(diǎn)的DPI設(shè)備共享,力爭(zhēng)通過(guò)最少的采集點(diǎn)獲取最全的數(shù)據(jù)。
3.2 統(tǒng)一格式
通過(guò)制定相關(guān)規(guī)范實(shí)現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)化,并確保運(yùn)營(yíng)商各部門(mén)、各省公司采用相同規(guī)范制定數(shù)據(jù)流量的標(biāo)準(zhǔn)日志格式和內(nèi)容,要求各廠(chǎng)商執(zhí)行相同的數(shù)據(jù)標(biāo)準(zhǔn),對(duì)于DPI七層識(shí)別的全部結(jié)果,實(shí)現(xiàn)TLV全字段的統(tǒng)一和對(duì)齊,如圖2所示。
除此之外,制定相關(guān)規(guī)范,規(guī)定統(tǒng)一的業(yè)務(wù)分類(lèi),實(shí)現(xiàn)最細(xì)粒度的統(tǒng)一業(yè)務(wù)劃分規(guī)則,在各采集點(diǎn)、各廠(chǎng)商、各分析系統(tǒng)之間形成通用語(yǔ)言,奠定大數(shù)據(jù)端到端分析的基礎(chǔ)。
3.3 統(tǒng)一功能
按照應(yīng)用系統(tǒng)所需數(shù)據(jù)內(nèi)容和格式的不同,統(tǒng)一DPI系統(tǒng)可提供4種數(shù)據(jù)復(fù)用方式。對(duì)于系統(tǒng)特征庫(kù)特殊、不易整合的應(yīng)用系統(tǒng),可通過(guò)鏈路分光器或統(tǒng)一DPI設(shè)備的分光功能,將光路信號(hào)完整地復(fù)制分發(fā)給應(yīng)用系統(tǒng);對(duì)于明確需要某種報(bào)文的系統(tǒng),統(tǒng)一DPI設(shè)備將全部原始報(bào)文或者經(jīng)過(guò)特定條件過(guò)濾后的部分原始報(bào)文復(fù)制分發(fā)給應(yīng)用系統(tǒng);對(duì)于以分析流量日志為主的應(yīng)用系統(tǒng),統(tǒng)一DPI設(shè)備分析記錄流量的關(guān)鍵信息形成XDR(X data decording)話(huà)單,并將會(huì)話(huà)數(shù)據(jù)按指定格式發(fā)送給應(yīng)用系統(tǒng);對(duì)于需要簡(jiǎn)單明確的統(tǒng)計(jì)指標(biāo)的應(yīng)用系統(tǒng),DPI設(shè)備統(tǒng)計(jì)流量的各項(xiàng)指標(biāo),并將統(tǒng)計(jì)結(jié)果發(fā)送給應(yīng)用系統(tǒng)。統(tǒng)一 DPI系統(tǒng)數(shù)據(jù)復(fù)用方式如圖3所示。
圖2 統(tǒng)一DPI系統(tǒng)數(shù)據(jù)格式規(guī)范化示例
圖3 統(tǒng)一DPI系統(tǒng)數(shù)據(jù)復(fù)用方式
統(tǒng)一DPI系統(tǒng)定位于為上層應(yīng)用提供全面的基礎(chǔ)數(shù)據(jù),除了滿(mǎn)足各類(lèi)應(yīng)用系統(tǒng)所需數(shù)據(jù)的鏡像需求,也能完成一些簡(jiǎn)單的數(shù)據(jù)處理操作,而個(gè)性化、復(fù)雜的數(shù)據(jù)處理則由上層應(yīng)用系統(tǒng)和大數(shù)據(jù)平臺(tái)實(shí)現(xiàn)。統(tǒng)一DPI系統(tǒng)對(duì)流量采集和數(shù)據(jù)解析功能進(jìn)行了統(tǒng)一規(guī)范,打破DPI設(shè)備和上層應(yīng)用系統(tǒng)間的耦合,形成開(kāi)放、標(biāo)準(zhǔn)的DPI設(shè)備體系。
當(dāng)今信息產(chǎn)業(yè)呈現(xiàn)出前所未有的繁榮,新的互聯(lián)網(wǎng)技術(shù)不斷涌現(xiàn)。從傳統(tǒng)互聯(lián)網(wǎng)的PC終端,到移動(dòng)互聯(lián)網(wǎng)的智能手機(jī),再到物聯(lián)網(wǎng)傳感器,技術(shù)革新使數(shù)據(jù)生產(chǎn)能力呈指數(shù)級(jí)提升,而運(yùn)營(yíng)商是用戶(hù)訪(fǎng)問(wèn)互聯(lián)網(wǎng)的管道建設(shè)者,擁有多維度、豐富、持久的互聯(lián)網(wǎng)用戶(hù)數(shù)據(jù),在洞察用戶(hù)方面擁有得天獨(dú)厚的優(yōu)勢(shì),管道中海量的用戶(hù)上網(wǎng)行為數(shù)據(jù)是運(yùn)營(yíng)商可以開(kāi)采的下一個(gè)金礦,而統(tǒng)一 DPI系統(tǒng)正是開(kāi)啟這座“金礦”的鑰匙[2],如圖4所示。
運(yùn)營(yíng)商智能管道中大數(shù)據(jù)應(yīng)用的目標(biāo)是實(shí)現(xiàn)復(fù)合關(guān)聯(lián)、泛在挖掘、快速實(shí)時(shí),把分散在網(wǎng)絡(luò)中各個(gè)環(huán)節(jié)的數(shù)據(jù)匯聚拼接出用戶(hù)的全貌,把握用戶(hù)的真正需求,挖掘潛在用戶(hù)群的行為特征,利用大數(shù)據(jù)洞察人的數(shù)字生活,并及時(shí)地反映到對(duì)用戶(hù)的服務(wù)上[3]。而統(tǒng)一 DPI系統(tǒng)實(shí)現(xiàn)全網(wǎng)數(shù)據(jù)的采集識(shí)別,處于網(wǎng)絡(luò)中的采集層,提供全景化的用戶(hù)數(shù)據(jù),是實(shí)現(xiàn)大數(shù)據(jù)應(yīng)用的第一步。大數(shù)據(jù)應(yīng)用從采集層到應(yīng)用層的整體架構(gòu)如圖5所示。
圖4 統(tǒng)一DPI系統(tǒng)作為用戶(hù)和大數(shù)據(jù)應(yīng)用聯(lián)系的紐帶
圖5 大數(shù)據(jù)應(yīng)用功能實(shí)現(xiàn)架構(gòu)
統(tǒng)一DPI系統(tǒng)的建設(shè)為大數(shù)據(jù)應(yīng)用的發(fā)展奠定了強(qiáng)大的數(shù)據(jù)基礎(chǔ),使運(yùn)營(yíng)商擺脫淪落為單純“管道”的尷尬局面,其提供的全面化、規(guī)范化、系統(tǒng)化的用戶(hù)信息,為大數(shù)據(jù)應(yīng)用提供了精準(zhǔn)的數(shù)據(jù)來(lái)源,提升用戶(hù)體驗(yàn),進(jìn)一步促進(jìn)了大數(shù)據(jù)更好地發(fā)展。
4.1 全面采集,精準(zhǔn)分析
統(tǒng)一DPI系統(tǒng)通過(guò)對(duì)鏈路數(shù)據(jù)一次采集多次復(fù)用,為第三方大數(shù)據(jù)咨詢(xún)業(yè)務(wù)提供數(shù)據(jù)來(lái)源,運(yùn)營(yíng)商可以開(kāi)展一些基于網(wǎng)絡(luò)流量的新業(yè)務(wù),統(tǒng)一DPI系統(tǒng)提供靈活的鏡像方式,將符合特定要求的用戶(hù)、協(xié)議、應(yīng)用的流量鏡像給大數(shù)據(jù)中心和第三方系統(tǒng),以支撐新的業(yè)務(wù)的開(kāi)展,如緩存系統(tǒng)、數(shù)據(jù)挖掘系統(tǒng)、精準(zhǔn)廣告系統(tǒng)、防病毒系統(tǒng)及其他第三方系統(tǒng),如圖6所示。
統(tǒng)一DPI系統(tǒng)通過(guò)對(duì)全網(wǎng)流量的采集,掌握流量整體趨勢(shì),了解網(wǎng)內(nèi)、網(wǎng)間流量流向,重點(diǎn)業(yè)務(wù)/網(wǎng)站流量占比等指標(biāo),通過(guò)流量流向可視實(shí)現(xiàn)熱點(diǎn)應(yīng)用分析;通過(guò)業(yè)務(wù)應(yīng)用/協(xié)議的流量分布及發(fā)展趨勢(shì),ICP、域名、URL排名實(shí)現(xiàn)業(yè)務(wù)熱點(diǎn)洞察;通過(guò)對(duì)用戶(hù)訪(fǎng)問(wèn)日志的采集分析挖掘用戶(hù)特征,了解用戶(hù)網(wǎng)絡(luò)使用情況,分析用戶(hù)流量組成和流向、用戶(hù)興趣和熱點(diǎn)資源,實(shí)現(xiàn)用戶(hù)行為可視化,為個(gè)性化差異服務(wù)提供數(shù)據(jù)支撐;通過(guò)對(duì)網(wǎng)絡(luò)時(shí)延等網(wǎng)絡(luò)質(zhì)量的監(jiān)控,改善用戶(hù)體驗(yàn);通過(guò)檢測(cè)垃圾郵件、僵尸、DDoS網(wǎng)絡(luò)、手機(jī)病毒、惡意網(wǎng)站和不良內(nèi)容,了解安全威脅,實(shí)現(xiàn)安全威脅可視化,為網(wǎng)絡(luò)安全防護(hù)提供支撐。
圖6 統(tǒng)一DPI系統(tǒng)為大數(shù)據(jù)應(yīng)用提供數(shù)據(jù)支撐
4.2 建立網(wǎng)絡(luò)應(yīng)用模型
統(tǒng)一DPI系統(tǒng)為大數(shù)據(jù)中心提供海量用戶(hù)數(shù)據(jù),大數(shù)據(jù)應(yīng)用通過(guò)基于用戶(hù)的上網(wǎng)行為數(shù)據(jù)提取自然人特征,并為其建立包含各種屬性的關(guān)系鏈,基于特征標(biāo)識(shí)庫(kù),對(duì)海量數(shù)據(jù)進(jìn)行行為分類(lèi);挖掘用戶(hù)使用習(xí)慣,創(chuàng)建常規(guī)應(yīng)用模型,實(shí)現(xiàn)用戶(hù)畫(huà)像標(biāo)簽,如圖7所示。
圖7 基于海量數(shù)據(jù)構(gòu)建用戶(hù)模型
以廣告推送為例,如今大數(shù)據(jù)已應(yīng)用于支撐精準(zhǔn)廣告的投放,統(tǒng)一DPI系統(tǒng)實(shí)現(xiàn)網(wǎng)站分析統(tǒng)計(jì)及搜索關(guān)鍵字抓取,提供用戶(hù)上網(wǎng)行為數(shù)據(jù),大數(shù)據(jù)中心結(jié)合強(qiáng)大的數(shù)據(jù)挖掘技術(shù)與行業(yè)知識(shí)庫(kù),對(duì)DPI網(wǎng)元覆蓋區(qū)域的終端用戶(hù)進(jìn)行用戶(hù)行為分析,建立精準(zhǔn)的用戶(hù)畫(huà)像,為信息推送(廣告)服務(wù)平臺(tái)的信息推送策略提供數(shù)據(jù)依據(jù),進(jìn)而結(jié)合用戶(hù)需求,在正確的時(shí)間窗口觸達(dá)用戶(hù),實(shí)現(xiàn)針對(duì)用戶(hù)的精準(zhǔn)營(yíng)銷(xiāo)[1]。
大數(shù)據(jù)中心的構(gòu)建與用戶(hù)上網(wǎng)行為的挖掘分析,除了支撐精準(zhǔn)廣告的推送,未來(lái)在市場(chǎng)調(diào)研、金融征信等領(lǐng)域也有很廣闊的應(yīng)用前景。
4.3 基于統(tǒng)計(jì)數(shù)據(jù)的經(jīng)營(yíng)建議
運(yùn)營(yíng)商基于統(tǒng)一DPI系統(tǒng)提供的統(tǒng)計(jì)數(shù)據(jù),為運(yùn)營(yíng)商提供多樣化經(jīng)營(yíng)建議,在開(kāi)源節(jié)流方面提供數(shù)據(jù)支撐,促進(jìn)業(yè)務(wù)模式創(chuàng)新,實(shí)現(xiàn)業(yè)務(wù)的增值運(yùn)營(yíng),為管道注智,為流量增值。
運(yùn)營(yíng)商針對(duì)用戶(hù)的上網(wǎng)行為,分析用戶(hù)可能的離網(wǎng)傾向,制定營(yíng)銷(xiāo)策略,推送優(yōu)惠信息,提前防止用戶(hù)流失;通過(guò)展現(xiàn)手機(jī)視頻、手機(jī)閱讀、應(yīng)用商店等各類(lèi)應(yīng)用的趨勢(shì)、占比和排名,更好地了解網(wǎng)絡(luò)流量構(gòu)成,為精細(xì)化運(yùn)營(yíng)提供數(shù)據(jù)支撐;通過(guò)分析運(yùn)營(yíng)商傳統(tǒng)語(yǔ)音、短信業(yè)務(wù)和數(shù)據(jù)流量業(yè)務(wù)占比,為運(yùn)營(yíng)商業(yè)務(wù)管控策略提供數(shù)據(jù)依據(jù);通過(guò)精準(zhǔn)分析,實(shí)現(xiàn)終端類(lèi)型可視化,了解終端組成情況,分析手機(jī)終端類(lèi)型、操作系統(tǒng)類(lèi)型、瀏覽器類(lèi)型和對(duì)應(yīng)的流量和用戶(hù)數(shù),為業(yè)務(wù)營(yíng)銷(xiāo)提供數(shù)據(jù)支撐[3]。
除內(nèi)部服務(wù)外,運(yùn)營(yíng)商還可以向行業(yè)用戶(hù)、外部合作伙伴提供數(shù)據(jù)出售、數(shù)據(jù)咨詢(xún)、數(shù)據(jù)能力和數(shù)據(jù)解決方案4種業(yè)務(wù)形態(tài)的數(shù)據(jù)服務(wù)。通過(guò)對(duì)外合作的模式,可融合合作伙伴的數(shù)據(jù)內(nèi)容,根據(jù)合作伙伴和客戶(hù)的需求,將電信的數(shù)據(jù)資產(chǎn)進(jìn)行包裝,向合作伙伴提供數(shù)據(jù)服務(wù),開(kāi)展大數(shù)據(jù)運(yùn)營(yíng)。
目前運(yùn)營(yíng)商在部分省份建設(shè)大數(shù)據(jù)中心,但仍存在跨省、跨域數(shù)據(jù)分析難的問(wèn)題存在,整合跨省、跨域數(shù)據(jù),建設(shè)集團(tuán)層面的統(tǒng)一的大數(shù)據(jù)中心,支撐業(yè)務(wù)流程端到端分析和面向移動(dòng)互聯(lián)網(wǎng)的大數(shù)據(jù)分析仍是未來(lái)大數(shù)據(jù)中心建設(shè)的目標(biāo)。
本文通過(guò)分析運(yùn)營(yíng)商傳統(tǒng)DPI部署方式存在的問(wèn)題,提出在大數(shù)據(jù)應(yīng)用快速發(fā)展的大背景下,運(yùn)營(yíng)商整合全網(wǎng)的DPI資源,建設(shè)統(tǒng)一DPI系統(tǒng)的必要性,同時(shí)對(duì)統(tǒng)一DPI系統(tǒng)在部署位置合理化、數(shù)據(jù)格式規(guī)范化和實(shí)現(xiàn)功能統(tǒng)一化方面做出的改進(jìn)進(jìn)行了闡述,提出統(tǒng)一DPI系統(tǒng)作為實(shí)現(xiàn)大數(shù)據(jù)應(yīng)用第一步的重要作用,其提供的全面化、規(guī)范化、系統(tǒng)化的用戶(hù)信息,保證了運(yùn)營(yíng)商實(shí)現(xiàn)用戶(hù)數(shù)據(jù)的全面采集、精準(zhǔn)分析,幫助運(yùn)營(yíng)商建立網(wǎng)絡(luò)應(yīng)用模型,有效的用戶(hù)統(tǒng)計(jì)數(shù)據(jù)更為運(yùn)營(yíng)商提供了合理的經(jīng)營(yíng)建議。因此,統(tǒng)一DPI系統(tǒng)為大數(shù)據(jù)的應(yīng)用發(fā)展奠定了強(qiáng)大的數(shù)據(jù)基礎(chǔ),是推動(dòng)運(yùn)營(yíng)商大數(shù)據(jù)發(fā)展的重要保障。
[1] 毋毅. 面向通信智能管道運(yùn)維體系的統(tǒng)一DPI網(wǎng)絡(luò)流量大數(shù)據(jù)分析平臺(tái)研究[J]. 信息與電腦, 2016(18): 159-160. WU Y. Research on the big data analysis platform of unified DPI traffic for communication intelligent pipeline operation and maintenance system[J]. China Computer&Communication, 2016(18): 159-160.
[2] 冉萌, 韓玉輝. DPI技術(shù)在移動(dòng)大數(shù)據(jù)中的應(yīng)用[J].郵電設(shè)計(jì)技術(shù), 2016(8): 33-36. RAN M, HAN Y H. Application of DPI technology in mobile in big data[J]. Designing Techniques of Posts and Telecommunications, 2016(8): 33-36.
[3] 殷鵬.智能管道運(yùn)營(yíng)中大數(shù)據(jù)的應(yīng)用分析[J].電信技術(shù), 2013, 1(4): 47-49. YIN P. Analysis of the application of big data in intelligent pipeline operation[J]. Telecommunications Technology, 2013, 1(4): 47-49.
侯慧芳(1986?),女,中國(guó)移動(dòng)通信集團(tuán)設(shè)計(jì)院有限公司工程師、咨詢(xún)?cè)O(shè)計(jì)師,主要研究方向?yàn)閿?shù)據(jù)網(wǎng)絡(luò)。
潘潔(1978?),女,中國(guó)移動(dòng)通信集團(tuán)設(shè)計(jì)院有限公司工程師、高級(jí)咨詢(xún)?cè)O(shè)計(jì)師,主要研究方向?yàn)閿?shù)據(jù)網(wǎng)絡(luò)。
Discussion of constructing unified DPI system by operators in the background of big data
HOU Huifang, PAN Jie
China Mobile Group Design Institute Co., Ltd., Beijing 100080, China
Mobile data traffic increases gradually. Operator’s business model is transferring from “telephone traffic management” to “traffic management”. Big data management will become the main development direction of operators. For big data management,operators explore the value and application of DPI technology and make the unified DPI system standards to offer comprehensive and standard traffic data. The insufficiency of traditional DPI deployment mode was analyzed, and the unified DPI system to offer basic data security for accelerating development of big data was presented.
unified DPI, big data, telecom operator
TN919.5
A
10.11959/j.issn.1000?0801.2017107
2017?03?20;
2017?04?09