魏宏, 周俊, 李承益
(中國(guó)移動(dòng)通信集團(tuán)設(shè)計(jì)院有限公司,北京 100080)
海量測(cè)試數(shù)據(jù)的場(chǎng)景化指標(biāo)精細(xì)分析研究
魏宏, 周俊, 李承益
(中國(guó)移動(dòng)通信集團(tuán)設(shè)計(jì)院有限公司,北京 100080)
本文提出了一種基于軍事柵格、地理信息的多場(chǎng)景海量數(shù)據(jù)的精細(xì)化分析方法,能夠支持用戶在GIS地圖上自定義測(cè)試場(chǎng)景;同時(shí)基于軍事柵格,將海量測(cè)試數(shù)據(jù)進(jìn)行切割和存儲(chǔ);從而實(shí)現(xiàn)測(cè)試數(shù)據(jù)與測(cè)試場(chǎng)景的關(guān)聯(lián),完成場(chǎng)景化指標(biāo)的精細(xì)化分析。該方法能夠提高場(chǎng)景化分析效率,深度挖掘大數(shù)據(jù)資源,節(jié)約測(cè)試和分析成本。
場(chǎng)景化分析;大數(shù)據(jù);地理信息;軍事柵格
隨著測(cè)試工作的不斷進(jìn)行,各類測(cè)試平臺(tái)上積累了海量的測(cè)試數(shù)據(jù)。針對(duì)海量測(cè)試數(shù)據(jù),如何進(jìn)行深度挖掘,并進(jìn)一步分析各類場(chǎng)景的網(wǎng)絡(luò)性能,評(píng)價(jià)各場(chǎng)景網(wǎng)絡(luò)質(zhì)量的歷史變化趨勢(shì),定位網(wǎng)絡(luò)問(wèn)題,是一個(gè)重要的課題。
同時(shí)隨著移動(dòng)網(wǎng)絡(luò)建設(shè)的不斷深入和細(xì)化,針對(duì)不同的場(chǎng)景進(jìn)行設(shè)計(jì)與優(yōu)化也愈來(lái)愈重要。而無(wú)線環(huán)境中由于各類場(chǎng)景下建筑物類型、地貌特征、用戶量等不盡相同。充分考慮不同場(chǎng)景的覆蓋特性,分析各場(chǎng)景的網(wǎng)絡(luò)性能,才能有針對(duì)性的進(jìn)行網(wǎng)絡(luò)質(zhì)量分析并提出優(yōu)化方案。而傳統(tǒng)的場(chǎng)景化測(cè)試方法為有多場(chǎng)景分析需求時(shí),組織專門的測(cè)試;每個(gè)場(chǎng)景點(diǎn)需要配置一個(gè)單獨(dú)的測(cè)試計(jì)劃,統(tǒng)計(jì)分析時(shí)需要手動(dòng)將測(cè)試計(jì)劃與場(chǎng)景名稱進(jìn)行匹配,從而區(qū)分每次測(cè)試的歸屬場(chǎng)景。該方法不能靈活地基于多場(chǎng)景劃分需求進(jìn)行指標(biāo)統(tǒng)計(jì)、網(wǎng)絡(luò)質(zhì)量分析。
本文提出了一種基于地理信息、軍事柵格的海量數(shù)據(jù)多場(chǎng)景網(wǎng)絡(luò)質(zhì)量挖掘方法,能夠自動(dòng)靈活的匹配并分析海量測(cè)試數(shù)據(jù),提高數(shù)據(jù)分析效率,節(jié)約成本。
MGRS(Military Grid Reference System,軍事柵格參考系)是一種基于通用橫軸UTM(Universal Transverse Mercator,墨卡托投影)的直角坐標(biāo)系,UTM 坐標(biāo)系統(tǒng)使用基于網(wǎng)格的方法表示坐標(biāo)。UTM系統(tǒng)將地球分為60個(gè)區(qū),每個(gè)區(qū)基于橫軸墨卡托投影[1]。基于該參考系,可以將地球表面切割為小柵格區(qū)域,每個(gè)軍事柵格有唯一的編號(hào)。比較常用的軍事柵格精度為25 m、50 m、100 m。本研究中采用25 m精度。
傳統(tǒng)的場(chǎng)景化測(cè)試分析方法不能利用已有的海量測(cè)試結(jié)果,不能執(zhí)行測(cè)試場(chǎng)景與測(cè)試結(jié)果的自動(dòng)匹配。為解決以上問(wèn)題,本文提出了基于柵格的場(chǎng)景化精細(xì)分析方法。將場(chǎng)景進(jìn)行切割,形成柵格化的場(chǎng)景地理信息;同時(shí)基于GPS信息,將海量的測(cè)試參數(shù)劃分在標(biāo)準(zhǔn)軍事柵格內(nèi),使得測(cè)試數(shù)據(jù)與地理維度進(jìn)行關(guān)聯(lián)。采用該方案能夠在更精細(xì)的維度內(nèi)診斷各場(chǎng)景的網(wǎng)絡(luò)問(wèn)題,從而判斷是否需要在區(qū)域內(nèi)進(jìn)行網(wǎng)絡(luò)規(guī)劃或者優(yōu)化。圖1給出了基于地理信息的海量測(cè)試數(shù)據(jù)的場(chǎng)景化精細(xì)分析系統(tǒng)框圖。
圖1 基于地理信息的海量測(cè)試數(shù)據(jù)的場(chǎng)景化精細(xì)分析系統(tǒng)框圖
2.1場(chǎng)景圖層數(shù)字化、查看與修改
2.1.1用戶上報(bào)場(chǎng)景信息
依據(jù)用戶上報(bào)的場(chǎng)景信息,在場(chǎng)景信息數(shù)據(jù)庫(kù)中記錄場(chǎng)景點(diǎn)信息,如表1所示。包含場(chǎng)景一級(jí)分類,場(chǎng)景二級(jí)分類,場(chǎng)景點(diǎn)名稱,場(chǎng)景點(diǎn)位置,場(chǎng)景狀態(tài)。其中,場(chǎng)景一級(jí)分類為場(chǎng)景大類,場(chǎng)景二級(jí)分類為場(chǎng)景大類中對(duì)應(yīng)的多個(gè)場(chǎng)景小類之一。目前系統(tǒng)中對(duì)于場(chǎng)景大類的定義為辦公區(qū)、賓館酒店、商圈、醫(yī)院、居民小區(qū)、校園、交通樞紐、風(fēng)景區(qū)、鐵路、地鐵、公路、鄉(xiāng)鎮(zhèn)、村莊。例如校園為場(chǎng)景一級(jí)分類,中小學(xué)校為該以及分類下對(duì)應(yīng)的場(chǎng)景二級(jí)分類。場(chǎng)景狀態(tài)(0,未數(shù)字化;1,數(shù)字化完成),表示當(dāng)前場(chǎng)景點(diǎn)是否已經(jīng)繪制了地圖,并完成了地理信息數(shù)字化。即用戶需按照表1所示提交場(chǎng)景信息表,多場(chǎng)景分析系統(tǒng)的后臺(tái)將信息存儲(chǔ)在“場(chǎng)景信息數(shù)據(jù)庫(kù)”中。
2.1.2場(chǎng)景圖層?xùn)鸥窕?/p>
該步驟的實(shí)現(xiàn)基于客戶端工具。用戶通過(guò)在GIS地圖上用閉合曲線圈出場(chǎng)景的位置,從而建立場(chǎng)景的地理范圍標(biāo)識(shí)。服務(wù)器接收?qǐng)鼍皥D層,并進(jìn)行場(chǎng)景圖層的柵格化操作,并將其信息存儲(chǔ)在“場(chǎng)景信息數(shù)字化數(shù)據(jù)庫(kù)”中。具體步驟如下:
(1)用戶點(diǎn)擊刷新呈現(xiàn)“已完成場(chǎng)景列表”和“未完成場(chǎng)景列表”,其中,已完成場(chǎng)景為已經(jīng)完成場(chǎng)景—柵格匹配的場(chǎng)景點(diǎn);未完成場(chǎng)景為沒(méi)有提交場(chǎng)景圖層,場(chǎng)景—柵格匹配沒(méi)有完成。
(2)點(diǎn)擊某個(gè)具體的場(chǎng)景點(diǎn),繪制場(chǎng)景地圖。其中,場(chǎng)景地圖要求為閉合曲面。
(3)點(diǎn)擊“提交”,服務(wù)器進(jìn)行場(chǎng)景-柵格匹配運(yùn)算,并存入數(shù)據(jù)庫(kù)。其中,場(chǎng)景—柵格匹配運(yùn)算為將當(dāng)前場(chǎng)景所處的地理區(qū)域進(jìn)行柵格切割,本系統(tǒng)中采用的25 m×25 m的標(biāo)準(zhǔn)軍事柵格切割精度。切割完成后,形成場(chǎng)景點(diǎn)與柵格編號(hào)的一對(duì)多的關(guān)系。并將此關(guān)系存儲(chǔ)在“場(chǎng)景圖層數(shù)字化數(shù)據(jù)庫(kù)”中。從而建立了場(chǎng)景點(diǎn)與地理信息的關(guān)聯(lián)關(guān)系。
表1 用戶上報(bào)場(chǎng)景信息示例表
2.1.3場(chǎng)景圖層修改
對(duì)于場(chǎng)景狀態(tài)為1的場(chǎng)景點(diǎn),支持查看場(chǎng)景圖層并進(jìn)行修改;即,對(duì)于已經(jīng)完成柵格化切割的場(chǎng)景點(diǎn),可以在客戶端上進(jìn)行查看和修改。提交修改時(shí),用戶重新對(duì)該場(chǎng)景點(diǎn)編制閉合曲面,服務(wù)器重新進(jìn)行柵格切割,場(chǎng)景信息數(shù)字化數(shù)據(jù)庫(kù)刪除原有的柵格編號(hào),存儲(chǔ)新修改的柵格編號(hào)。從而建立全新的場(chǎng)景與地理信息的關(guān)聯(lián)關(guān)系。
2.2測(cè)試數(shù)據(jù)柵格化
基于測(cè)試數(shù)據(jù)攜帶的GPS,將海量測(cè)試信息歸集在25 m×25 m的標(biāo)準(zhǔn)軍事柵格中,形成“測(cè)試數(shù)據(jù)柵格統(tǒng)計(jì)數(shù)據(jù)庫(kù)”。其中,該步驟與場(chǎng)景圖層數(shù)字化步驟中的柵格劃分和編號(hào)方案一致。即測(cè)試數(shù)據(jù)柵格統(tǒng)計(jì)數(shù)據(jù)庫(kù)以標(biāo)準(zhǔn)軍事柵格為維度,進(jìn)行測(cè)試信息歸集時(shí),記錄落在柵格范圍內(nèi)的各測(cè)試指標(biāo)采樣點(diǎn)的計(jì)數(shù)值、總和、最大值和平均值等。例如,對(duì)于覆蓋電平RSRP,可以記錄落在柵格內(nèi)的RSRP采樣點(diǎn)計(jì)數(shù)值、RSRP采樣點(diǎn)均值;對(duì)于應(yīng)用層下載速率,可以記錄落在柵格內(nèi)的速率計(jì)數(shù)值、速率均值、速率最大值。
2.3場(chǎng)景化指標(biāo)
多場(chǎng)景精細(xì)化分析的核心在于將場(chǎng)景的地理信息進(jìn)行數(shù)字化,與海量測(cè)試數(shù)據(jù)進(jìn)行關(guān)聯(lián)。從而能夠從測(cè)試數(shù)據(jù)中統(tǒng)計(jì)出不同場(chǎng)景的網(wǎng)絡(luò)性能指標(biāo)。該系統(tǒng)中場(chǎng)景化指標(biāo)包含中國(guó)移動(dòng)、聯(lián)通、電信3個(gè)制式。能夠支持?jǐn)?shù)據(jù)業(yè)務(wù)應(yīng)用層指標(biāo)、話音業(yè)務(wù)應(yīng)用層指標(biāo)以及網(wǎng)絡(luò)性能指標(biāo)的統(tǒng)計(jì)。統(tǒng)計(jì)方法如下。
(1)用戶提交所需分析的場(chǎng)景類型,制定測(cè)試數(shù)據(jù)范圍(包括測(cè)試時(shí)間、測(cè)試級(jí)別、測(cè)試計(jì)劃或者測(cè)試日志等)。
(2)服務(wù)器依據(jù)所提交的篩選信息,查詢各場(chǎng)景所包含的柵格編號(hào)、測(cè)試數(shù)據(jù)所包含的柵格編號(hào),將二者的柵格編號(hào)進(jìn)行匹配。從而查詢出場(chǎng)景范圍的測(cè)試數(shù)據(jù),按照預(yù)定的統(tǒng)計(jì)指標(biāo)計(jì)算方法得出最終的場(chǎng)景統(tǒng)計(jì)指標(biāo)。
場(chǎng)景化指標(biāo)的統(tǒng)計(jì)方法有“基于采樣點(diǎn)”和“基于柵格”兩種方式。
2.3.1基于采樣點(diǎn)的場(chǎng)景化指標(biāo)統(tǒng)計(jì)
基于采樣點(diǎn)的場(chǎng)景化指標(biāo)統(tǒng)計(jì),即:統(tǒng)計(jì)的測(cè)試數(shù)據(jù)的最小粒度為各采樣點(diǎn),將落在場(chǎng)景范圍的全部采樣點(diǎn)綜合考慮,計(jì)算最終指標(biāo)結(jié)果。該計(jì)算方式為傳統(tǒng)的網(wǎng)絡(luò)性能指標(biāo)的統(tǒng)計(jì)方法。
以 “平均RSRP”為例來(lái)說(shuō)明場(chǎng)景指標(biāo)的計(jì)算方法。其中,測(cè)試數(shù)據(jù)柵格預(yù)統(tǒng)計(jì)庫(kù)示例如表2所示。
表2 測(cè)試數(shù)據(jù)柵格預(yù)統(tǒng)計(jì)庫(kù)示例
場(chǎng)景信息數(shù)字化數(shù)據(jù)庫(kù)示例如表3所示。
表3 場(chǎng)景信息數(shù)據(jù)字化數(shù)據(jù)庫(kù)
那么場(chǎng)景1的平均RSRP計(jì)算公式為:
(柵格1 RSRP采樣點(diǎn)求和+柵格2 RSRP采樣點(diǎn)求和+柵格3 RSRP采樣點(diǎn)求和)/(柵格1 RSRP采樣點(diǎn)計(jì)數(shù)+柵格2RSRP采樣點(diǎn)計(jì)數(shù)+柵格3RSRP采樣點(diǎn)計(jì)數(shù))=(-2 699.5-1 325.06-474.438)/(29+17+6)=-86.52 dBm
那么場(chǎng)景2的平均RSRP計(jì)算公式為:
(柵格2 RSRP采樣點(diǎn)求和+柵格4 RSRP采樣點(diǎn)求和)/(柵格2 RSRP采樣點(diǎn)計(jì)數(shù)+柵格4RSRP采樣點(diǎn)計(jì)數(shù))=(-1 325.06-825.625)/(17+10)=-79.66 dBm
2.3.2 基于柵格的場(chǎng)景化指標(biāo)統(tǒng)計(jì)
采用采樣點(diǎn)平均的方式對(duì)網(wǎng)絡(luò)質(zhì)量進(jìn)行評(píng)估時(shí),會(huì)存在由于采樣點(diǎn)分布不均勻?qū)е碌慕y(tǒng)計(jì)偏差。即:如果在網(wǎng)絡(luò)質(zhì)量較好的區(qū)域測(cè)試時(shí)長(zhǎng)較長(zhǎng),那么質(zhì)量較好的采樣點(diǎn)的比例就會(huì)增大,從而提升測(cè)試區(qū)域的指標(biāo)值;反之,如果在質(zhì)量較差的區(qū)域測(cè)試的采樣點(diǎn)過(guò)多,也會(huì)拉低整體網(wǎng)絡(luò)性能。而基于柵格的場(chǎng)景化指標(biāo)統(tǒng)計(jì),首先在柵格范圍內(nèi)進(jìn)行統(tǒng)計(jì)平均,再針對(duì)全部的柵格計(jì)算最終統(tǒng)計(jì)結(jié)果,避免了采樣點(diǎn)分布不均勻帶來(lái)的統(tǒng)計(jì)偏差,能夠客觀地反映網(wǎng)絡(luò)質(zhì)量。以統(tǒng)計(jì)指標(biāo)“平均RSRP”為例說(shuō)明,計(jì)算公式如下:
(柵格1RSRP采樣點(diǎn)求和/柵格1RSRP采樣點(diǎn)計(jì)數(shù)+柵格2RSRP采樣點(diǎn)求和/柵格2RSRP采樣點(diǎn)計(jì)數(shù)+…柵格M RSRP采樣點(diǎn)求和/柵格M RSRP采樣點(diǎn)計(jì)數(shù))/M
其中,M為該場(chǎng)景中的柵格個(gè)數(shù)。
基于客戶端的場(chǎng)景圖層繪制能夠靈活的設(shè)定場(chǎng)景的范圍,而不局限于已有的統(tǒng)計(jì)范圍(省、地市、網(wǎng)格)。例如對(duì)于金融街區(qū)域,假設(shè)可以依據(jù)分析需求將其劃分為南北兩個(gè)場(chǎng)景來(lái)討論,如圖2所示。而在傳統(tǒng)的測(cè)試過(guò)程中,后臺(tái)服務(wù)器所能區(qū)分的最小范圍的場(chǎng)景為包含金融街街道的一個(gè)網(wǎng)格區(qū)域。
用戶將圖2中所示的金融街南、金融街北兩個(gè)場(chǎng)景圖層提交到多場(chǎng)景分析服務(wù)器,服務(wù)器完成軍事化柵格切割;同時(shí)依據(jù)所提交的測(cè)試數(shù)據(jù)范圍,后臺(tái)服務(wù)器將場(chǎng)景信息與測(cè)試數(shù)據(jù)的柵格信息進(jìn)行匹配;對(duì)海量測(cè)試數(shù)據(jù)進(jìn)行統(tǒng)計(jì),進(jìn)而得出兩個(gè)場(chǎng)景的統(tǒng)計(jì)指標(biāo)。表4中給出了基于本文2.3.1中所給出的算法,兩次測(cè)試、兩個(gè)場(chǎng)景的部分統(tǒng)計(jì)指標(biāo)結(jié)果。
圖2 基于多場(chǎng)景分析系統(tǒng)的金融街區(qū)域劃分
表4 金融街北、金融街南場(chǎng)景統(tǒng)計(jì)指標(biāo)
利用該測(cè)試數(shù)據(jù)可以分析“金融街北”、“金融街南”兩個(gè)場(chǎng)景在同一測(cè)試時(shí)間的網(wǎng)絡(luò)性能,也可以單獨(dú)分析每個(gè)場(chǎng)景的歷史測(cè)試對(duì)比結(jié)果。綜合兩次測(cè)試結(jié)果,可以得出結(jié)論:對(duì)于FTP應(yīng)用層下載速率,金融街南場(chǎng)景高于金融街北場(chǎng)景,而對(duì)于同一個(gè)場(chǎng)景兩次測(cè)試的結(jié)果基本相同;對(duì)于FTP應(yīng)用層上傳速率,兩個(gè)場(chǎng)景第二次測(cè)試結(jié)果均優(yōu)于第一次的測(cè)試結(jié)果。
此外,由于對(duì)測(cè)試數(shù)據(jù)進(jìn)行了標(biāo)準(zhǔn)的軍事柵格化處理,使得歷史測(cè)試數(shù)據(jù)能夠以柵格作為更精細(xì)的維度來(lái)進(jìn)行對(duì)比,精確分析出FTP上傳速度變高或者變低的具體區(qū)域。如圖3所示的金融街北區(qū)域,圖中綠色柵格代表第二次測(cè)試的上傳速率高于第一次測(cè)試500 kbit/s的區(qū)域。而紅色區(qū)域?yàn)榈诙螠y(cè)試的上傳速率低于第一次測(cè)試500 kbbit/s的區(qū)域。
圖3 FTP應(yīng)用層上傳速率柵格化對(duì)比圖
傳統(tǒng)的多場(chǎng)景分析需要針對(duì)不同的分析需求,臨時(shí)組織專項(xiàng)測(cè)試。也無(wú)法應(yīng)用路測(cè)平臺(tái)上已有的海量測(cè)試數(shù)據(jù)。本文提出的基于海量數(shù)據(jù)多場(chǎng)景精細(xì)化指標(biāo)分析,能夠?qū)?chǎng)景的地理信息與測(cè)試數(shù)據(jù)的地理信息進(jìn)行自動(dòng)匹配,從而挖掘各類測(cè)試平臺(tái)已有的海量測(cè)試信息,實(shí)現(xiàn)測(cè)試指標(biāo)的自動(dòng)化輸出。也能夠在精細(xì)化的柵格維度內(nèi)分析和定位網(wǎng)絡(luò)問(wèn)題。同時(shí),測(cè)試場(chǎng)景支持隨時(shí)添加和修改,從而能夠快捷的評(píng)估網(wǎng)絡(luò)質(zhì)量,大幅度提升統(tǒng)計(jì)效率,為進(jìn)一步的網(wǎng)絡(luò)優(yōu)化提供依據(jù)。
[1] 湛邵斌, 陳圣波, 李遠(yuǎn)華, 等. 柵格數(shù)據(jù)地理信息系統(tǒng)(Raster GIS)關(guān)鍵技術(shù)分析[J]. 計(jì)算機(jī)應(yīng)用及技術(shù), 2007.
Research on the meticulous analysis of the scenarized indexes of the massive test data
WEI Hong, ZHOU Jun, LI Cheng-yi
(China Mobile Group Design Institute Co., Ltd., Beijing 100080, China)
Currently it has accumulated vast amounts of test data on a variety of test platforms. Based on these data,how to make deeply data mining, utilization, and network performance analysis of different scenarios, is an urgent problem to be solved. This paper presents a meticulous analysis method of multi-scenario based on the military raster and geographic information, which supports user-defi ned test scenarios making on the GIS map. And the massive test data can be cutted and stored based on the military raster. By these,test data can be associated with the test scenarios. Then the meticulous analysis of the scenarized indexes can be done easily. So the method suggested can improve the effi ciency of the scenarized analysis, make a depth big-data mining, and save the cost of the test and analysis.
scenarized analysis; big data; eographic information; military raster
TN929.5
A
1008-5599(2016)09-0081-05
2016-04-14