中國聯(lián)通研究院 北京 100032
隨著第三代(3G)和第四代(4G)移動通信技術(shù)的快速發(fā)展和網(wǎng)絡(luò)更廣范圍的覆蓋,以及智能終端設(shè)備能力的提升和價格的快速下降,移動互聯(lián)網(wǎng)在中國和全球迅速發(fā)展。表現(xiàn)之一為大量的用戶通過移動設(shè)備接入互聯(lián)網(wǎng)。根據(jù)中國互聯(lián)網(wǎng)信息中心(CNNIC)《第36次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》提供的數(shù)據(jù),截至2015年6月,中國手機網(wǎng)民達到5.94億戶,網(wǎng)民中使用手機上網(wǎng)的人群占比由2014年12月的85.8%提升至88.9%(如圖1所示)。與此相比,通過臺式電腦和筆記本電腦接入互聯(lián)網(wǎng)的比例較2014年底分別下降了2.4和0.7個百分點,電腦端向手機端遷移的趨勢明顯[1]。
移動互聯(lián)網(wǎng)迅速發(fā)展的表現(xiàn)之二為大量的互聯(lián)網(wǎng)應(yīng)用正快速向移動終端側(cè)轉(zhuǎn)移,互聯(lián)網(wǎng)應(yīng)用從面向PC到同時面向PC和移動終端用戶轉(zhuǎn)變,甚至出現(xiàn)了大量主要面向移動終端用戶的應(yīng)用。對CNNIC《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》提供的數(shù)據(jù)進行研究不難發(fā)現(xiàn),用戶通過手機終端使用各類互聯(lián)網(wǎng)應(yīng)用的增長率遠高于所有互聯(lián)網(wǎng)用戶使用應(yīng)用的增長率[1]。
作為移動互聯(lián)網(wǎng)業(yè)務(wù)的承載網(wǎng)絡(luò),對移動網(wǎng)絡(luò),上述表現(xiàn)直接體現(xiàn)在承載數(shù)據(jù)流量的迅速攀升。圖2為2014年10月至2015年9月中國聯(lián)通移動網(wǎng)絡(luò)流量的統(tǒng)計情況(注:2014年10月,流經(jīng)中國聯(lián)通移動網(wǎng)絡(luò)的總流量約為37.98PB,2015年9月約為60.01PB,月均增長5.15%。同期,2014年10月中國聯(lián)通移動用戶數(shù)為2.97747億戶,2015年8月下降989萬戶至2.87858億戶)。隨著國家積極推進“互聯(lián)網(wǎng)+”行動計劃,移動通信網(wǎng)絡(luò)作為國家新一代信息基礎(chǔ)設(shè)施,在國家經(jīng)濟發(fā)展和產(chǎn)業(yè)轉(zhuǎn)型中的地位變得日益重要,如何建設(shè)一個能夠有效支撐“互聯(lián)網(wǎng)+”產(chǎn)業(yè)發(fā)展的優(yōu)質(zhì)移動通信網(wǎng)絡(luò)成為運營商面臨的重要課題。
圖1 中國手機網(wǎng)民規(guī)模及其占網(wǎng)民比例(資料來源:CNNIC)
圖2 中國聯(lián)通移動網(wǎng)絡(luò)流量
當(dāng)前運營商移動網(wǎng)絡(luò)建設(shè)面臨著以下主要問題:
1)移動網(wǎng)絡(luò)資源整體過剩但局部不足,網(wǎng)絡(luò)質(zhì)量與移動互聯(lián)網(wǎng)業(yè)務(wù)需要存在差距。網(wǎng)絡(luò)規(guī)劃設(shè)計與實際移動互聯(lián)網(wǎng)用戶和業(yè)務(wù)分布特征并不能準(zhǔn)確契合,網(wǎng)絡(luò)建設(shè)精準(zhǔn)性和投資有效性亟需提高。
移動網(wǎng)絡(luò)規(guī)劃的核心是無線網(wǎng)絡(luò)規(guī)劃。無線網(wǎng)絡(luò)規(guī)劃需要設(shè)定覆蓋區(qū)域、業(yè)務(wù)量(容量)和業(yè)務(wù)質(zhì)量目標(biāo)。如何確定指定覆蓋區(qū)域的業(yè)務(wù)量?這涉及到覆蓋區(qū)域內(nèi)的用戶數(shù)和每個用戶所需要的業(yè)務(wù)量[2]。用戶數(shù)是一個變化量,跟給定區(qū)域內(nèi)的居住人口、工作人口和流動人口密切相關(guān)。而每用戶所需要的業(yè)務(wù)量則決定于業(yè)務(wù)種類和使用的頻繁程度。不同于以往相對靜態(tài)的話務(wù)模型,移動互聯(lián)網(wǎng)是業(yè)務(wù)創(chuàng)新最為活躍的領(lǐng)域,業(yè)務(wù)類型更加多樣,變化更加頻繁,業(yè)務(wù)受眾更加個性化,影響用戶使用習(xí)慣的因素眾多,使用頻度更加難以預(yù)測。對于業(yè)務(wù)質(zhì)量,不同業(yè)務(wù)的要求也各不相同。面對這樣一個復(fù)雜多變的業(yè)務(wù)環(huán)境,就需要我們對網(wǎng)絡(luò)的業(yè)務(wù)情況有更加細分和精確化的了解,并以此為基礎(chǔ)做最優(yōu)化的資源配置,而不是僅依靠傳統(tǒng)模型做相對靜態(tài)的預(yù)測。
2)以往移動網(wǎng)絡(luò)規(guī)劃及優(yōu)化建設(shè)更多是以網(wǎng)絡(luò)自身的指標(biāo)為核心,而非以用戶體驗為核心。例如,在覆蓋指標(biāo)上,主要考慮覆蓋區(qū)域內(nèi)的參考信號接收功率(RSRP)、接收信號強度指示(RSSI)、參考信號接收質(zhì)量(RSRQ)、參考信號信噪比(RS-SINR)等指標(biāo),并設(shè)定相應(yīng)的目標(biāo)值;在業(yè)務(wù)質(zhì)量指標(biāo)上,在用戶占用一定網(wǎng)絡(luò)資源的條件下,設(shè)定無線接通率、掉線率、系統(tǒng)內(nèi)切換成功率、可接入率、塊差錯率等目標(biāo)值;在容量指標(biāo)上考慮小區(qū)吞吐量、邊緣速率等指標(biāo)[3]。
問題是,這些指標(biāo)只反映了用戶接入無線網(wǎng)絡(luò)的質(zhì)量情況,并不能完全反映用戶使用業(yè)務(wù)的真實感知。如圖3所示,當(dāng)一個用戶在位置A使用業(yè)務(wù)時,他的業(yè)務(wù)訪問路徑是1,當(dāng)用戶在位置B時,他訪問相同業(yè)務(wù)的路徑是2。用戶在位置A和位置B使用業(yè)務(wù)的感知是否有差異?是否滿足用戶的業(yè)務(wù)體驗要求?如果我們將業(yè)務(wù)的CDN節(jié)點擴展到數(shù)據(jù)中心N,使用戶在位置B訪問業(yè)務(wù)通過路徑3,是否會顯著提升用戶的體驗?顯然,單靠網(wǎng)絡(luò)接入指標(biāo)是不能反映用戶使用業(yè)務(wù)的真實情況,因為端到端IP通路的質(zhì)量并不包含在上述指標(biāo)中。
圖3 一個用戶使用移動業(yè)務(wù)的典型場景
如果我們考察用戶使用業(yè)務(wù)過程中位置發(fā)生移動的場景,例如用戶從位置A移動到位置B,那么在其中又伴隨著大量的小區(qū)和基站間切換。我們雖然掌握某個設(shè)備(基站、小區(qū)、MME/S-GW)下的無線網(wǎng)絡(luò)質(zhì)量情況,但并沒有系統(tǒng)完整告訴我們某個用戶使用業(yè)務(wù)的整個時間和空間內(nèi)發(fā)生了什么,用戶的業(yè)務(wù)感知如何。
3)難以精確掌握網(wǎng)絡(luò)運行的整體情況,難以呈現(xiàn)網(wǎng)絡(luò)運行情況的整體視圖。目前運營商移動網(wǎng)絡(luò)管理系統(tǒng)依然存在條塊分割、管理手段分散的情況。條塊分割表現(xiàn)為:針對無線接入網(wǎng)、核心網(wǎng)、傳輸網(wǎng)等,都有各自的專業(yè)網(wǎng)管系統(tǒng);管理手段分散表現(xiàn)為:在對網(wǎng)元設(shè)備的管理上,不同廠商針對自身設(shè)備有各自的網(wǎng)管系統(tǒng),雖然在省分公司和集團公司總部層面建設(shè)了綜合網(wǎng)管系統(tǒng),以期實現(xiàn)“集中管理、集中監(jiān)控、集中維護”,但這樣的“綜合”系統(tǒng)也有幾百套之多,而廠商網(wǎng)管系統(tǒng)則多達千套。在此情況下,不僅缺乏端到端的集中監(jiān)控和集中故障管理能力,并且無法及時和準(zhǔn)確掌握網(wǎng)絡(luò)運行的整體情況。
要解決上述問題,就需要我們擺脫網(wǎng)絡(luò)規(guī)劃建設(shè)及網(wǎng)絡(luò)管理的既有模式,實現(xiàn)變革。
顯然,移動網(wǎng)絡(luò)智能化建設(shè)離不開數(shù)據(jù)的支持。首先,我們需要分析移動網(wǎng)絡(luò)中有哪些數(shù)據(jù)。
圖4描述了運營商現(xiàn)有移動網(wǎng)絡(luò)的架構(gòu)示意[4]。以往,我們從移動網(wǎng)絡(luò)中獲取的數(shù)據(jù)通常有兩個特點:1)來源于網(wǎng)元設(shè)備,如基站、無線網(wǎng)絡(luò)控制器、電路域和分組域核心網(wǎng)設(shè)備等;2)網(wǎng)元生成的數(shù)據(jù)一般是結(jié)果數(shù)據(jù),如用戶計費話單數(shù)據(jù)(Calling Detailed Record,CDR)、網(wǎng)元性能統(tǒng)計數(shù)據(jù)、測量數(shù)據(jù)等,而這些數(shù)據(jù)對網(wǎng)絡(luò)智能化建設(shè)遠遠不夠。
圖4 移動網(wǎng)絡(luò)架構(gòu)
以數(shù)據(jù)業(yè)務(wù)為例,網(wǎng)元生成的用戶流量話單如:話單類型、用戶的MSISDN、用戶的IMSI、用戶設(shè)備的IMEI、接入點名稱(APN)、P-GW/GGSN IP地址、S-GW/SGSN IP地址、流量大小、記錄開始時間、持續(xù)時長、計費標(biāo)識、用戶位置信息、無線接入類型(RAT Type),等等。
這些信息在相關(guān)網(wǎng)元設(shè)備上按照一定的規(guī)則被記錄。對數(shù)據(jù)業(yè)務(wù)而言,通常是用戶的流量積累到一定門限(如5M),或者累計到一定時長(例如30分鐘),生成一條話單。但是用戶在發(fā)生這些流量時的業(yè)務(wù)體驗如何,上述信息并不能告訴我們?nèi)魏未鸢浮@?,用戶在發(fā)起業(yè)務(wù)請求時,初始上下文建立過程中的延時如何?無線接入承載(RAB)建立和變更過程中的時延如何?如果業(yè)務(wù)是網(wǎng)絡(luò)發(fā)起的,網(wǎng)絡(luò)尋呼用戶終端花費了多少時長?用戶使用業(yè)務(wù)期間的上網(wǎng)速率如何?IP層的丟包率如何?TCP的建立時延如何?等等。而這些恰恰是反映用戶業(yè)務(wù)體驗的重要指標(biāo)。
更重要的,對于網(wǎng)絡(luò)建設(shè)而言,我們更關(guān)心那些并沒有成功發(fā)起的呼叫和業(yè)務(wù)請求。而這些在現(xiàn)有網(wǎng)元上僅有統(tǒng)計信息,而沒有針對具體用戶的記錄信息。例如,一個用戶訪問數(shù)據(jù)業(yè)務(wù)失敗,是因為用戶所在地的網(wǎng)絡(luò)質(zhì)量問題,以至于無線資源鏈路無法建立?還是是因為MO(Mobile Originated,移動臺發(fā)起)過程中RAB指派失?。恳嗷蚴荕T(Mobile Terminated,移動臺終止)過程中被叫終端未被尋呼到?等等。準(zhǔn)確發(fā)現(xiàn)和掌握這些問題,并解決這些問題,是網(wǎng)絡(luò)智能化建設(shè)的優(yōu)先課題。
上述這些數(shù)據(jù)都是用戶在接入網(wǎng)絡(luò)和使用業(yè)務(wù)中的“過程”數(shù)據(jù)。在大數(shù)據(jù)時代,我們不僅需要知道事情的結(jié)果,而且更在意事情發(fā)生的過程,我們需要了解用戶和網(wǎng)絡(luò)發(fā)生的一切,并記錄下來。
對應(yīng)上面數(shù)據(jù)業(yè)務(wù)的例子,為了了解用戶的網(wǎng)絡(luò)及業(yè)務(wù)體驗,我們可能需要如下過程數(shù)據(jù):附著/去附著過程數(shù)據(jù)、業(yè)務(wù)請求過程數(shù)據(jù)、尋呼過程數(shù)據(jù)、承載資源建立/修改和釋放過程數(shù)據(jù)、用戶訪問移動互聯(lián)網(wǎng)業(yè)務(wù)應(yīng)用的過程數(shù)據(jù)(訪問的網(wǎng)址、速率、時延等)。
對于“過程”數(shù)據(jù),我們需要回答如下幾個問題。哪些數(shù)據(jù)需要被記錄?如何獲取并記錄這些數(shù)據(jù)?如何存儲和處理這些數(shù)據(jù)?
移動通信網(wǎng)絡(luò)在服務(wù)用戶的過程中產(chǎn)生兩種過程數(shù)據(jù),一種是用戶面數(shù)據(jù),一種是信令面數(shù)據(jù)。用戶面數(shù)據(jù)包括用戶的語音通話數(shù)據(jù)和上網(wǎng)流量數(shù)據(jù)。信令面數(shù)據(jù)是為了保證用戶面數(shù)據(jù)通信而在用戶終端設(shè)備與基站之間,以及網(wǎng)絡(luò)網(wǎng)元設(shè)備之間發(fā)送的控制信號。
顯然,用戶面數(shù)據(jù)是用戶通信的隱私數(shù)據(jù),通信數(shù)據(jù)本身并不是我們需要的。對于用戶面數(shù)據(jù),我們只需要一個概要,即為了分析網(wǎng)絡(luò)流量行為,我們僅需要知道用戶何時、何地、使用什么終端、訪問了哪些應(yīng)用[5],并且在訪問應(yīng)用的過程中,網(wǎng)絡(luò)速率、延遲和抖動等指標(biāo)如何。而信令面數(shù)據(jù)則完整描述了用戶從接入網(wǎng)絡(luò),與網(wǎng)絡(luò)保持連接到使用業(yè)務(wù)過程中發(fā)生的與網(wǎng)絡(luò)交互的一切,這是我們更加需要的過程數(shù)據(jù)。在獲取上述過程數(shù)據(jù)后,我們就可以更好地發(fā)現(xiàn)網(wǎng)絡(luò)中存在的問題,實現(xiàn)網(wǎng)絡(luò)建設(shè)和優(yōu)化設(shè)計的智能化。
一個衍生的問題是,信令面數(shù)據(jù)涉及的接口眾多,如圖4所示。例如,在2G網(wǎng)絡(luò)中就包含空中接口(空口)、Abis、A、Gb、D、Mc等接口;3G網(wǎng)絡(luò)中包含空口、Iubis、Iu-CS、Iu-PS、Gn、Gr等接口;4G網(wǎng)絡(luò)中包含空口、X2、S1-MME、S1-U、S11、S6a、SGs等接口。雖然我們希望采集“所有”的過程數(shù)據(jù),但在現(xiàn)實環(huán)境中,因為實施難度等問題,我們需要根據(jù)應(yīng)用的需求進行折中,例如采集部分接口。
這些過程數(shù)據(jù)存在于哪里呢?它們流經(jīng)了將用戶終端設(shè)備與移動通信網(wǎng)絡(luò)連接起來的無線接入網(wǎng),流經(jīng)了移動通信網(wǎng)絡(luò)各網(wǎng)元之間的接口。這些數(shù)據(jù)被相關(guān)網(wǎng)元處理,但除了少量的加工后的結(jié)果數(shù)據(jù)和統(tǒng)計數(shù)據(jù),絕大部分過程數(shù)據(jù)都并沒有被記錄。那些結(jié)果數(shù)據(jù)和統(tǒng)計數(shù)據(jù)被計費系統(tǒng)和網(wǎng)管網(wǎng)優(yōu)系統(tǒng)所采集。
要記錄上述“過程”數(shù)據(jù)并不是一件簡單的事情,表現(xiàn)為以下4點:1)流程眾多。例如在4G網(wǎng)絡(luò)中,無線網(wǎng)基本信令流程包括隨機接入、尋呼、RRC連接建立、重配置、重建立、釋放、測量等;端到端業(yè)務(wù)建立和釋放流程包括附著、去附著、業(yè)務(wù)請求、專用承載建立、修改和釋放流程等;移動性管理包括跟蹤區(qū)更新、小區(qū)切換、小區(qū)重選等。而每一個流程中又根據(jù)用戶和業(yè)務(wù)的不同狀態(tài)包含眾多子流程。2)每一個流程都涉及諸多網(wǎng)元和接口。例如一次附著,就涉及eNodeB、MME、HSS、S-GW、P-GW等網(wǎng)元以及Uu、S1-MME、S6a、S11、S1-U等多種接口。3)這些過程頻繁發(fā)生,包括用戶使用業(yè)務(wù)期間和未使用業(yè)務(wù)期間。例如用戶終端在空閑狀態(tài)下,就會發(fā)生包括小區(qū)重選、跟蹤區(qū)更新等流程。4)用戶一次業(yè)務(wù)使用是眾多流程的組合。例如,用戶發(fā)起一次分組域業(yè)務(wù)訪問,就可能包含隨機接入、RRC連接建立、RRC重配置、初始上下文建立、創(chuàng)建會話、專用承載建立等流程。
要獲取上述過程數(shù)據(jù),需要考慮以下問題。
1)依托現(xiàn)有網(wǎng)元設(shè)備獲取過程數(shù)據(jù)難以做到。首先網(wǎng)元設(shè)備的核心功能是處理來自接口的服務(wù)請求,實現(xiàn)業(yè)務(wù)邏輯處理,并保存必要的與一個流程相關(guān)的會話信息,以便處理后續(xù)的應(yīng)答和服務(wù)請求。記錄日志雖然很重要,但這本是它的“附屬”功能。如果需要將網(wǎng)元處理的所有輸入和輸出的過程數(shù)據(jù)都記錄下來,顯然會極大增加現(xiàn)有網(wǎng)元的工作負擔(dān),顯著降低它的處理性能。其次,每個網(wǎng)元設(shè)備看到的只是一個局部過程。例如,對MME而言,它并不知道RRC建立過程中發(fā)生了什么,同樣eNodeB也無從知曉S-GW和P-GW之間發(fā)生了什么。因此,要重現(xiàn)一個過程,就需要對多個網(wǎng)元之間的數(shù)據(jù)進行關(guān)聯(lián)。顯然,這也不是現(xiàn)有網(wǎng)元能夠做到的。再次,這些過程數(shù)據(jù)規(guī)模巨大。以當(dāng)前中國聯(lián)通移動網(wǎng)絡(luò)為例,這些過程數(shù)據(jù)每日將有380TB之多。
一個好的方法是,我們可以直接在網(wǎng)元間鏈路上進行采集,獲取全部網(wǎng)元間流經(jīng)的數(shù)據(jù),并通過深度報文檢測(Deep Packet Inspection,DPI)技術(shù)摘取信令面和用戶面數(shù)據(jù)中包含的信息。通過一個集中的設(shè)備獲取上述信息,并進行數(shù)據(jù)之間的關(guān)聯(lián)轉(zhuǎn)換,生成最終的記錄話單。對于信令面數(shù)據(jù)記錄,我們稱之為SDR(Signal Detail Record);對于用戶面數(shù)據(jù)記錄,我們稱之為FDR(Flow Detail Record)。
但DPI不能解決所有問題。有些接口鏈路過于分散,例如Iubis等,通過DPI方式采集實際難以實施。因此,現(xiàn)實的方案也從網(wǎng)元采集必要的數(shù)據(jù),例如在eNodeB上采集Uu口的跟蹤信令數(shù)據(jù)。當(dāng)然這種采集,根據(jù)范圍的不同會增加網(wǎng)元的處理負擔(dān)。
2)應(yīng)該盡量選擇鏈路收斂的地方進行數(shù)據(jù)采集。收斂點可以是網(wǎng)元和物理鏈路。對于用戶面數(shù)據(jù),合理的采集點是Gn接口和S1-U接口,因為這里鏈路最為收斂。對于核心網(wǎng)信令面數(shù)據(jù),語音電路域信令數(shù)據(jù)可以選擇Mc接口,相比Iu-CS和A接口,更為收斂,分組域數(shù)據(jù)可以選擇Iu-PS、Gb、S1-MME、S11等。對于無線側(cè)信令面數(shù)據(jù)采集,較為合理的采集點如上文所說,是BSC、RNC和eNodeB等網(wǎng)元設(shè)備。
3)信令數(shù)據(jù)關(guān)聯(lián)是核心問題。關(guān)聯(lián)表現(xiàn)為需要將同一個接口或者不同接口上傳遞的信令以“會話”的形式集結(jié)起來,并找出它們的時序關(guān)系。通常關(guān)聯(lián)是圍繞用戶的會話進行。由于移動網(wǎng)絡(luò)不同接口上協(xié)議類型的豐富性和多層級,這種關(guān)聯(lián)很多時候會變得復(fù)雜。另外,不同接口對用戶的標(biāo)識有所不同,例如,在用戶終端設(shè)備和無線接入網(wǎng)(Radio Access Network,RAN)之間,通常用RNTI(Radio Network Temporary Identity,無線網(wǎng)絡(luò)臨時標(biāo)識)來標(biāo)識用戶,而在用戶終端設(shè)備和核心網(wǎng)設(shè)備之間,通常用TMSI、P-TMSI、GUTI等標(biāo)識用戶,而在核心網(wǎng)網(wǎng)元之間則用IMSI、MSISDN等標(biāo)識用戶。因此,準(zhǔn)確維護上述標(biāo)識之間的關(guān)系,是數(shù)據(jù)關(guān)聯(lián)所必須的。
過程數(shù)據(jù)量非常巨大,根據(jù)采集范圍、采集方式的不同,每日有數(shù)千億至數(shù)萬億條記錄之多,與此相對應(yīng),每日的數(shù)據(jù)量有數(shù)十TB至數(shù)百TB。處理和存儲這些數(shù)據(jù),顯然是大數(shù)據(jù)系統(tǒng)的范疇。
圖5描述了數(shù)據(jù)采集及預(yù)處理的過程。在需要采集的接口鏈路上進行分光和部署DPI探針,獲取信令和流量信息,從OMC(Operation and Maintenance Center,操作維護中心)設(shè)備上獲取性能管理、配置管理、信令跟蹤數(shù)據(jù)。獲取下來的數(shù)據(jù)通過抽取、轉(zhuǎn)換和數(shù)據(jù)關(guān)聯(lián)(ETL),最終生成信令面數(shù)據(jù)記錄SDR、用戶面數(shù)據(jù)記錄FDR和統(tǒng)計數(shù)據(jù)記錄。上述過程在貼近網(wǎng)絡(luò)的地點進行。生成后的這些數(shù)據(jù)被送往集中的數(shù)據(jù)中心。
圖5 數(shù)據(jù)采集和預(yù)處理
圖6 數(shù)據(jù)存儲和數(shù)據(jù)處理
在數(shù)據(jù)中心,如圖6所示,上述數(shù)據(jù)通過流式計算技術(shù)(如Storm、Spark Streaming等)被即時處理,以便生成實時類結(jié)果數(shù)據(jù),應(yīng)用于監(jiān)控類、實時處理類應(yīng)用。同時,上述數(shù)據(jù)也通常被持久化存儲,如以文件方式存儲于HDFS(Hadoop Distributed File System)之上,或者存儲于HBase等分布式數(shù)據(jù)庫中。對于持久化存儲的數(shù)據(jù),可以通過運行MapReduce或者其他計算任務(wù)的方式,進行數(shù)據(jù)的批量處理,生成結(jié)果數(shù)據(jù)。這些結(jié)果數(shù)據(jù)通常最終被存儲于數(shù)據(jù)庫之中,我們稱之為“服務(wù)數(shù)據(jù)庫”。服務(wù)數(shù)據(jù)庫一般選擇關(guān)系型數(shù)據(jù)庫,如Oracle,MySQL等,以便應(yīng)用通過SQL語句進行交互式查詢或者進一步處理。對于某些特定應(yīng)用場景,也可以對原始記錄數(shù)據(jù)進行查詢檢索。
第2章描述了移動網(wǎng)絡(luò)中的大數(shù)據(jù),以及采集、存儲和處理這些大數(shù)據(jù)的過程。圖7是一個實際系統(tǒng)的例子。在該系統(tǒng)中,從網(wǎng)絡(luò)中采集獲取了電路域呼叫控制信令數(shù)據(jù)、分組域會話管理類信令數(shù)據(jù)、無線接入網(wǎng)切換和承載管理類信令數(shù)據(jù)及測量報告數(shù)據(jù)、移動網(wǎng)絡(luò)移動性管理信令數(shù)據(jù)、基于基站小區(qū)的話務(wù)統(tǒng)計數(shù)據(jù)、用戶面基于流量類型的業(yè)務(wù)質(zhì)量及用戶行為數(shù)據(jù)等。以此為基礎(chǔ),依托大數(shù)據(jù)技術(shù),構(gòu)建集中化的數(shù)據(jù)處理分析系統(tǒng)。
圖7 移動網(wǎng)絡(luò)智能化建設(shè)系統(tǒng)
基于該系統(tǒng),可以實現(xiàn)如下三大目標(biāo)。
1)網(wǎng)絡(luò)可視化。網(wǎng)絡(luò)可視化表現(xiàn)為構(gòu)建統(tǒng)一的網(wǎng)絡(luò)視圖,以便對網(wǎng)絡(luò)的服務(wù)質(zhì)量有更加清晰化、數(shù)據(jù)化的洞察。用戶可以從多個維度,多個視角(全局和局部)觀察網(wǎng)絡(luò)。主要內(nèi)容包括以下3點。
①網(wǎng)絡(luò)質(zhì)量分析。實現(xiàn)對網(wǎng)絡(luò)整體質(zhì)量的評估與分析,包括資源優(yōu)化分析、地理化信息分析、移動性分析與優(yōu)化、無線與核心網(wǎng)聯(lián)合分析與優(yōu)化、無線網(wǎng)絡(luò)覆蓋評估、無線網(wǎng)絡(luò)干擾評估、上下不均衡小區(qū)評估、核心網(wǎng)EPC接入質(zhì)量分析、保持質(zhì)量分析、核心網(wǎng)3G/4G互操作分析、核心網(wǎng)CSFB(Circuit Switched Fallback,電路域回落)分析等。
②業(yè)務(wù)質(zhì)量分析。對影響用戶業(yè)務(wù)體驗感知的關(guān)鍵指標(biāo)進行評估與分析,包括TCP連接建立分析、用戶面DNS解析分析、頁面瀏覽指標(biāo)分析、流媒體業(yè)務(wù)指標(biāo)分析、Email業(yè)務(wù)指標(biāo)分析、下載類業(yè)務(wù)指標(biāo)分析、即時通信類業(yè)務(wù)指標(biāo)分析、業(yè)務(wù)占比分析等。
③網(wǎng)絡(luò)質(zhì)量監(jiān)控。實現(xiàn)對網(wǎng)絡(luò)質(zhì)量的實時和非實時監(jiān)控,包括無線網(wǎng)絡(luò)質(zhì)量監(jiān)控、核心網(wǎng)質(zhì)量監(jiān)控等。指標(biāo)包括接入性能,保持性能、運行性能等,維度包括成功率、時延、速率指標(biāo)等。
2)網(wǎng)絡(luò)規(guī)劃優(yōu)化。網(wǎng)絡(luò)可視化的一個重要目的就是發(fā)現(xiàn)網(wǎng)絡(luò)覆蓋和服務(wù)中的問題,從而提升網(wǎng)絡(luò)規(guī)劃優(yōu)化的科學(xué)性。網(wǎng)絡(luò)規(guī)劃優(yōu)化的核心是無線接入網(wǎng)絡(luò),包括以下4點。
①網(wǎng)絡(luò)簡單擴容。結(jié)合無線資源利用率、用戶數(shù)、用戶體驗速率等,根據(jù)簡單擴容模型預(yù)測并計算各個小區(qū)擴容的系數(shù),通過對擴容系數(shù)進行多個維度的排名,綜合推薦各個區(qū)域需要擴容的小區(qū)。
②網(wǎng)絡(luò)精準(zhǔn)擴容。根據(jù)信令面和用戶面數(shù)據(jù)記錄,以及用戶測量數(shù)據(jù),計算精確的覆蓋地圖、用戶地圖和業(yè)務(wù)地圖,從多維度對區(qū)域進行柵格級評估,計算需要進行擴容的基站小區(qū),并對新建站的站址選擇提出建議。
③網(wǎng)絡(luò)優(yōu)化。根據(jù)網(wǎng)絡(luò)質(zhì)量和業(yè)務(wù)質(zhì)量分析以及監(jiān)控結(jié)果,對包括無線接入網(wǎng)、核心網(wǎng)、IP承載網(wǎng)、公眾寬帶網(wǎng)以及內(nèi)容分發(fā)網(wǎng)絡(luò)(CDN)等進行端到端優(yōu)化,使網(wǎng)絡(luò)性能達到最佳平衡。
④建設(shè)后評估??梢愿鶕?jù)新建或者擴容小區(qū)基站的運行狀況、業(yè)務(wù)量統(tǒng)計、網(wǎng)絡(luò)服務(wù)質(zhì)量、區(qū)域用戶體驗指標(biāo)提升等多維度精確實現(xiàn)網(wǎng)絡(luò)規(guī)劃建設(shè)的后評估。
3)智能業(yè)務(wù)經(jīng)營。隨著用戶業(yè)務(wù)從語音業(yè)務(wù)為中心轉(zhuǎn)向以流量業(yè)務(wù)為中心,如何實現(xiàn)智能化的流量業(yè)務(wù)經(jīng)營就成為運營商關(guān)注的重點課題。信令面和用戶面數(shù)據(jù)記錄的采集和分析處理,可以讓我們更加精準(zhǔn)地對用戶軌跡、業(yè)務(wù)偏好、時間偏好、位置偏好進行分析預(yù)測,并精準(zhǔn)刻畫用戶畫像。此外,還可以從終端、價值區(qū)域等維度進行分析挖掘。分析的結(jié)果除了進行智能業(yè)務(wù)經(jīng)營,還可以作為網(wǎng)絡(luò)規(guī)劃優(yōu)化的輸入,以及用于更加廣泛的公益類及行業(yè)類大數(shù)據(jù)應(yīng)用。
我們正在進入一個移動互聯(lián)的時代。移動通信網(wǎng)絡(luò)作為移動互聯(lián)網(wǎng)的基礎(chǔ)接入和承載網(wǎng)絡(luò),作為國家新一代信息基礎(chǔ)設(shè)施的重要組成部分,在國家經(jīng)濟發(fā)展和產(chǎn)業(yè)轉(zhuǎn)型升級中變得日益重要。
移動網(wǎng)絡(luò)建設(shè)必須擺脫以往粗放的建設(shè)模式,更多地轉(zhuǎn)向“以用戶體驗為中心”,實現(xiàn)網(wǎng)絡(luò)建設(shè)的智能化?!爸悄堋眮碜浴澳P汀?,更來自“數(shù)據(jù)”。移動網(wǎng)絡(luò)蘊含著豐富的數(shù)據(jù)資源,這些數(shù)據(jù)資源不僅包括以往以網(wǎng)管和計費為中心的結(jié)果數(shù)據(jù),更包括用戶接入網(wǎng)絡(luò)和使用業(yè)務(wù)過程中的“過程”數(shù)據(jù)。過程數(shù)據(jù)的獲取和分析挖掘在網(wǎng)絡(luò)智能化建設(shè)中的作用更加重要。
過程數(shù)據(jù)是大數(shù)據(jù),并且是超大規(guī)模數(shù)據(jù)。通過對這些超大規(guī)模數(shù)據(jù)進行處理和分析,我們可以實現(xiàn)網(wǎng)絡(luò)從全局到局部的可視化,可以實現(xiàn)更加精準(zhǔn)的面向用戶和面向業(yè)務(wù)的網(wǎng)絡(luò)規(guī)劃和優(yōu)化建設(shè)。更多地,上述數(shù)據(jù)是一個蘊含黃金的寶庫。利用它,不僅可以服務(wù)于運營商的生產(chǎn)經(jīng)營,還可以構(gòu)建開放生態(tài)環(huán)境的方式,服務(wù)從政府到行業(yè)的各種應(yīng)用[6],以實現(xiàn)科學(xué)評估、科學(xué)預(yù)測和更加個性化的服務(wù)。
參考文獻
[1]中國互聯(lián)網(wǎng)絡(luò)信息中心(C N N I C).第3 6次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告[R/OL].[2016-01-10].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201507/20150722_52624.htm
[2]張傳福,吳偉陵.第三代移動通信系統(tǒng)的網(wǎng)絡(luò)規(guī)劃[J].電子技術(shù)應(yīng)用,2000,(6):4-6
[3]楊春蘭. LTE FDD無線網(wǎng)絡(luò)規(guī)劃研究[D].南京郵電大學(xué),2014
[4]The 3rd Generation Partnership Project (3GPP). 3GPP TS 23.002 V13.2.0: Technical Specification Group Services and System Aspects; Network architecture(Release 13) [S/OL].[2016-01-10].http://www.3gpp.org/DynaReport/23002.htm
[5]王志軍,黃文良.大數(shù)據(jù)在移動用戶上網(wǎng)記錄查詢中的應(yīng)用研究[J].信息通信技術(shù),2013,7(6):29-34
[6]王志軍,黃文良.面向移動互聯(lián)網(wǎng)的業(yè)務(wù)創(chuàng)新生態(tài)環(huán)境研究[J].電信科學(xué),2012(3):1-8