摘要:5G消息業(yè)務(wù)基于終端原生短信入口,為用戶提供文本、圖片、音頻、視頻、位置、聯(lián)系人等富媒體內(nèi)容的發(fā)送和接收,還可直接在短信界面內(nèi)通過聊天機(jī)器人(chatbot)與服務(wù)提供者進(jìn)行交互,無需下載APP、無需注冊(cè)賬號(hào)登錄即可享受到企業(yè)提供的服務(wù)。然而傳統(tǒng)的5G消息運(yùn)維方式存在效率低、無自動(dòng)化定位工具的不足,為提高5G消息用戶滿意度、滿足高效運(yùn)維需求,本文提出了一種智能定位5G消息問題的新方案,基于日志和信令采集的大數(shù)據(jù)分析方式定位問題,可大幅提升5G消息運(yùn)維效率,提高5G消息客戶滿意度。
關(guān)鍵詞: 5G消息;RCS;大數(shù)據(jù);智能運(yùn)維
一、引言
運(yùn)營(yíng)商傳統(tǒng)的短信因功能簡(jiǎn)單、體驗(yàn)受限,已無法滿足用戶多樣化的需求。當(dāng)5G時(shí)代來臨時(shí),全球運(yùn)營(yíng)商已達(dá)成了廣泛共識(shí):傳統(tǒng)短信業(yè)務(wù)需要升級(jí)到富媒體消息業(yè)務(wù)—業(yè)界稱之為5G消息,5G消息業(yè)務(wù)仍然包含傳統(tǒng)短信,可分為消息業(yè)務(wù)+傳統(tǒng)短信業(yè)務(wù)。5G行業(yè)消息是一種基于GSMA國(guó)際通信標(biāo)準(zhǔn)(RCS)的富媒體消息應(yīng)用,通過提供直達(dá)、便捷、大容量、內(nèi)容豐富的視頻化富媒體信息服務(wù),為客戶帶來全方位的內(nèi)容服務(wù)和溝通價(jià)值。
國(guó)內(nèi)外發(fā)展方面,2020年4月8日,中國(guó)移動(dòng)與中國(guó)電信、中國(guó)聯(lián)通一起,攜手11家合作伙伴共同發(fā)布《5G消息白皮書》,明確了相關(guān)業(yè)務(wù)功能和技術(shù)要求,提出5G消息生態(tài)建設(shè)構(gòu)想。5G消息時(shí)代由此到來。目前全球已有56個(gè)國(guó)家、77家運(yùn)營(yíng)商發(fā)布RCS服務(wù);AT&T、Sprint、沃達(dá)豐、德國(guó)電信、NTT DoCoMo等運(yùn)營(yíng)商均已選擇RCS作為行業(yè)短信的升級(jí)方向。
隨著5G消息的不斷普及,業(yè)務(wù)量不斷增大,用戶使用5G消息出現(xiàn)的問題也逐漸增多。例如,客戶在5G消息業(yè)務(wù)的日常使用中,經(jīng)常遇到終端收不到5G消息、5G消息延時(shí)、終端發(fā)不出5G消息、收到亂碼等問題,而當(dāng)前運(yùn)維模式仍停留在逐個(gè)分析網(wǎng)元日志、跟蹤抓包分析接口信令等人工分析處理海量數(shù)據(jù)定位問題的方式,該方式存在效率低、無自動(dòng)化定位工具等不足,導(dǎo)致維護(hù)人員定位問題需要6小時(shí)以上,傳統(tǒng)的定位方式已無法滿足運(yùn)營(yíng)商側(cè)5G消息的運(yùn)維要求。急需研發(fā)一種快速定位5G消息問題的新方法。
二、5G消息業(yè)務(wù)特點(diǎn)
所謂“5G消息”,并不是5G的消息。它既不是5G特有的功能,也不是5G時(shí)代新開發(fā)出來的業(yè)務(wù),而是以5G作為驅(qū)動(dòng)的短消息。與傳統(tǒng)行業(yè)短信僅支持文本相比,5G行業(yè)消息可發(fā)送更為豐富的多媒體內(nèi)容,個(gè)人用戶還可通過消息攜帶的按鈕、菜單實(shí)現(xiàn)交互。
5G消息可發(fā)送的消息形態(tài)包括文本、圖片、音視頻、地理位置、富媒體卡片等。在單條消息中,可包含一張富媒體卡片,也可包含多張(可滑動(dòng))。富媒體卡片還可攜帶卡片按鈕,為用戶提供上行消息回復(fù)、鏈接跳轉(zhuǎn)、撥打電話等能力。以上每一類消息形態(tài)還可攜帶懸浮菜單,該菜單隨每條下行消息可變,可提供的功能與富媒體卡片按鈕相同。從而使消息類產(chǎn)品由傳統(tǒng)意義的業(yè)務(wù)終點(diǎn)(短信通知)演進(jìn)為業(yè)務(wù)起點(diǎn)(用戶可交互),提升消息價(jià)值。
5G消息具備四種子產(chǎn)品形態(tài),滿足行業(yè)客戶和個(gè)人客戶在信息發(fā)布、宣傳推廣、品牌經(jīng)營(yíng)、客戶服務(wù)等多種場(chǎng)景下的差異化需求。一是個(gè)人客戶的傳統(tǒng)點(diǎn)對(duì)點(diǎn)短信交互。二是文本消息,行業(yè)客戶主動(dòng)下發(fā)文本消息,可視為傳統(tǒng)短信的升級(jí),典型應(yīng)用為驗(yàn)證碼、通知提醒等。三是多媒體消息,行業(yè)客戶主動(dòng)下發(fā)的圖片、音視頻與卡片消息,可視為視頻短信和智能短信的融合升級(jí),典型應(yīng)用為賬單推送、品牌宣傳、旅游推介。四是會(huì)話消息,被個(gè)人用戶上行消息所觸發(fā)的多媒體消息,客戶可根據(jù)業(yè)務(wù)場(chǎng)景和用戶精準(zhǔn)匹配服務(wù),實(shí)現(xiàn)智能交互,典型應(yīng)用為出行購(gòu)票、充值查詢、滿意度調(diào)查、用戶調(diào)研等。
三、5G消息運(yùn)維現(xiàn)狀
(一)5G消息系統(tǒng)架構(gòu)
5G消息系統(tǒng)主要包括5G消息中心(短信中心模塊、消息處理模塊、接入處理模塊)及MaaP平臺(tái)兩個(gè)網(wǎng)元四類VNF,承載全部2/4/5G人網(wǎng)短信,支持5G富媒體消息業(yè)務(wù),并基于終端能力提供對(duì)應(yīng)下發(fā)模式(文本短信或消息)。
(二)當(dāng)前運(yùn)維模式存在的不足
5G消息正式商用后,在5G消息業(yè)務(wù)量呈現(xiàn)增長(zhǎng)趨勢(shì)時(shí),用戶滿意度卻持續(xù)下降,進(jìn)一步統(tǒng)計(jì)分析滿意度情況發(fā)現(xiàn),用戶的意見主要集中在售后服務(wù)項(xiàng)中的問題定位時(shí)長(zhǎng)滿意度差,也就是運(yùn)營(yíng)商的運(yùn)維效率低。
運(yùn)營(yíng)商運(yùn)維模式仍停留在逐個(gè)分析網(wǎng)元日志、跟蹤抓包分析接口信令等人工分析處理海量數(shù)據(jù)定位問題的方式,傳統(tǒng)的定位時(shí)長(zhǎng)平均耗時(shí)6小時(shí),無法滿足高效運(yùn)維要求。
四、5G消息智能定位平臺(tái)架構(gòu)設(shè)計(jì)
(一)設(shè)計(jì)思路
根據(jù)行業(yè)內(nèi)外廠商調(diào)研結(jié)果,研究華為基于智能故障決策樹算法“深”度定位的智能運(yùn)維解決方案,在2G和4G的語音運(yùn)維中引入了大數(shù)據(jù)分析和機(jī)器學(xué)習(xí),不斷訓(xùn)練生成智能故障決策樹,一方面使自動(dòng)化效率更高,另一方面把復(fù)雜的人處理不了的運(yùn)維交給機(jī)器,做到預(yù)防預(yù)測(cè),語音端到端網(wǎng)絡(luò)和投訴問題診斷時(shí)長(zhǎng)從4小時(shí)下降到20分鐘,定位定界效率提升92%,有效提升客戶滿意度。
因此,本文借鑒行業(yè)內(nèi)外智能運(yùn)維思路,通過設(shè)計(jì)5G消息問題智能定位方案,結(jié)合當(dāng)前的IT系統(tǒng),形成端到端的自動(dòng)化分析手段,可大大降低5G消息問題定位的時(shí)長(zhǎng)。
操作時(shí)可通過采集工具獲取5G消息網(wǎng)元日志和接口信令話單,由系統(tǒng)進(jìn)行多維度關(guān)聯(lián)分析,結(jié)合大數(shù)據(jù)模型訓(xùn)練生成的5G消息業(yè)務(wù)質(zhì)量問題迭代庫(kù),定位用戶簽約、終端、短信網(wǎng)關(guān)、5G消息中心、無線網(wǎng)等問題,最終給出診斷結(jié)論和自優(yōu)化措施。
(二)基于日志和信令采集的大數(shù)據(jù)分析定位方案
本文創(chuàng)新采用基于日志和信令采集的大數(shù)據(jù)分析定位方案定位5G消息問題,平臺(tái)架構(gòu)主要考慮數(shù)據(jù)源、平臺(tái)、采集方式、數(shù)據(jù)庫(kù)、定位算法、部署方式六個(gè)方面。具體部署過程如下。
1.數(shù)據(jù)源
數(shù)據(jù)源方面,采用關(guān)鍵接口信令話單和關(guān)鍵網(wǎng)元業(yè)務(wù)話單。梳理5G消息業(yè)務(wù)流程中涉及的關(guān)鍵網(wǎng)元和關(guān)鍵接口。一是對(duì)接ISC、CD、Mc、S1-MME 四大接口,二是對(duì)接vSMSC、消息AS、MaaP、行業(yè)網(wǎng)關(guān)、融合網(wǎng)關(guān)五大網(wǎng)元,確保5G消息關(guān)鍵網(wǎng)元業(yè)務(wù)話單覆蓋率100%,5G消息關(guān)鍵接口信令話單覆蓋率100%。
2.信令平臺(tái)部署
在信令平臺(tái)部署方面,開發(fā)信令平臺(tái)新模塊,支持5G消息網(wǎng)元日志和信令數(shù)據(jù)處理功能,支持5G消息話單解析,包括HTTP、MSRP、SMPP、CMPP等5G消息協(xié)議,確保5G消息話單解析率>98%,5G消息協(xié)議支持度100%,接口數(shù)據(jù)關(guān)聯(lián)率≥98%。
3.部署FTP GET文件采集程序
部署FTP GET文件采集程序方面,從數(shù)據(jù)采集組網(wǎng)設(shè)計(jì),部署數(shù)據(jù)采集網(wǎng)絡(luò),搭建FTP服務(wù),部署FTP數(shù)據(jù)采集程序以及開啟采集數(shù)據(jù)程序的環(huán)節(jié)把控流程,實(shí)現(xiàn)FTP方式采集方式部署,確保數(shù)據(jù)誤碼率<0.1%,數(shù)據(jù)完整性>99%。
4.Hbase數(shù)據(jù)庫(kù)
配置Hbase數(shù)據(jù)庫(kù)方面,為了實(shí)現(xiàn)讀寫速度的最優(yōu)化(最大),使用正交試驗(yàn)法尋找最佳參數(shù)組合。根據(jù)現(xiàn)場(chǎng)技術(shù)論證,影響Hbase數(shù)據(jù)庫(kù)讀寫速度的關(guān)鍵因素包括響應(yīng)IO請(qǐng)求線程數(shù)、數(shù)據(jù)塊緩存內(nèi)存占比和MemStore刷新上限值。在搭建好的Hbase數(shù)據(jù)庫(kù)上配置最優(yōu)數(shù)據(jù)庫(kù)參數(shù)后,進(jìn)行10次5G消息網(wǎng)元業(yè)務(wù)話單和信令接口話單文件的讀寫試驗(yàn),讀寫速率均在10M/s以上>達(dá)標(biāo)值3M/s。
Hbase數(shù)據(jù)庫(kù)最優(yōu)參數(shù)選擇過程如下:
(1)挑因素,選水平,制定因素水平表
根據(jù)現(xiàn)場(chǎng)技術(shù)論證,影響Hbase數(shù)據(jù)庫(kù)讀寫速度的關(guān)鍵因素包括響應(yīng)IO請(qǐng)求線程數(shù)、數(shù)據(jù)塊緩存內(nèi)存占比和MemStore刷新上限值。因素之間的交互作用對(duì)實(shí)驗(yàn)結(jié)果的影響可以忽略,制定因素水平如下:
響應(yīng)IO請(qǐng)求線程數(shù)為10、15、20;數(shù)據(jù)塊緩存內(nèi)存占比為20%、25%、30%;MemStore刷新上限值為128MB、192MB、256MB。
(2)設(shè)計(jì)試驗(yàn)方案和結(jié)果分析
因素?cái)?shù)=3,水平數(shù)=3,自由度之和=6,正交表行數(shù)應(yīng)滿足n≥(6+1)=7,正交表列數(shù)應(yīng)滿足t≥3,所以選擇三水平正交表L9(34)。直接對(duì)比(直接看):直接比較9個(gè)試驗(yàn)的數(shù)據(jù)庫(kù)讀寫速率,發(fā)現(xiàn)試驗(yàn)條件為A3B1C2;直觀分析(算一算),根據(jù)效用Ki計(jì)算結(jié)果,直觀分析發(fā)現(xiàn)的試驗(yàn)好條件為A3B2C2(與直接看不一致)。
(3)設(shè)計(jì)二次試驗(yàn)方案和結(jié)果分析
根據(jù)極差Rj計(jì)算結(jié)果,各因素對(duì)試驗(yàn)結(jié)果的影響程度從重到輕是A>C>B。因素A為最重要因素,且隨著線程數(shù)的增大,結(jié)果逐漸令人滿意,繼續(xù)增大線程數(shù)能否獲得更好的結(jié)果,應(yīng)在第二批試驗(yàn)中重點(diǎn)考查確認(rèn);因素C是較重要因素,選擇試驗(yàn)結(jié)果較好的水平C2;因素B是次要因素,可以根據(jù)節(jié)約硬件計(jì)算資源的原則,選擇水平B1。
根據(jù)因素水平效用趨勢(shì)圖分析,因素A呈單調(diào)遞增趨勢(shì),無峰(谷)值拐點(diǎn),說明還有調(diào)優(yōu)可能。綜上分析,我們初步得到的試驗(yàn)好條件為A3B1C2。
(4)調(diào)優(yōu)實(shí)驗(yàn)
根據(jù)第一批試驗(yàn)結(jié)果分析:
①A.響應(yīng)IO請(qǐng)求線程數(shù)是最重要因素,并存在調(diào)優(yōu)可能,需確認(rèn)繼續(xù)增大能否獲得更好試驗(yàn)結(jié)果;
②C.MemStore刷新上限值是較重要因素,為節(jié)省緩存空間,應(yīng)探討是否有進(jìn)一步減少的可能;
③B.數(shù)據(jù)塊緩存內(nèi)存占比是次要因素,對(duì)試驗(yàn)結(jié)果影響小,不需要調(diào)優(yōu)。
因此,我們選擇響應(yīng)IO請(qǐng)求線程數(shù)和C.MemStore刷新上限值重新制定因素水平表。響應(yīng)IO請(qǐng)求線程數(shù)為20、25、30;MemStore刷新上限值為162MB、192MB、222MB??紤]二因素三水平(不考慮交互作用),因素?cái)?shù)=2,水平數(shù)=3,自由度之和=4,正交表行數(shù)應(yīng)滿足n≥(4+1)=5,正交表列數(shù)應(yīng)滿足t≥2,所以選擇三水平正交表L9(34)開展調(diào)優(yōu)試驗(yàn)。
直接比較9個(gè)試驗(yàn)的數(shù)據(jù)庫(kù)讀寫速率,直接對(duì)比發(fā)現(xiàn)的試驗(yàn)好條件為A1B1;根據(jù)效用Ki計(jì)算結(jié)果,直觀分析發(fā)現(xiàn)的試驗(yàn)好條件為A1B1,說明因素A響應(yīng)IO請(qǐng)求線程數(shù)20個(gè)為最優(yōu),繼續(xù)增大無法提升試驗(yàn)效果,因素B在第一批得到的MemStore刷新上限值減少30MB后,效果更好。
最終,通過正交試驗(yàn)數(shù)據(jù)分析和小批跟蹤試驗(yàn)驗(yàn)證,我們確定數(shù)據(jù)庫(kù)參數(shù)配置的最佳方案為:響應(yīng)IO請(qǐng)求線程數(shù)20個(gè)、數(shù)據(jù)塊緩存內(nèi)存占比20%、MemStore刷新上限值162MB。
6.采用智能故障樹決策樹算法進(jìn)行問題分析定位
一是梳理5G消息存在問題的場(chǎng)景,如5G消息延時(shí)、MO成功率低、終端發(fā)不出5G消息等。二是借鑒專家經(jīng)驗(yàn)庫(kù),窮舉不同場(chǎng)景的問題查處網(wǎng)元、流程和結(jié)果等。三是采用大數(shù)據(jù)的模型進(jìn)行訓(xùn)練;四是生成智能故障決策樹并運(yùn)用。最終,確保問題定位準(zhǔn)確率>=90%。
6.部署基于B/S架構(gòu)的應(yīng)用系統(tǒng)
一是定義網(wǎng)絡(luò)異常問題定位模塊、故障樹關(guān)聯(lián)模塊、單用戶問題定位模塊三個(gè)功能架構(gòu)。其中,網(wǎng)絡(luò)異常問題定位模塊包含根據(jù)首拆接口過濾、根據(jù)拆線網(wǎng)元過濾、根據(jù)拆線狀態(tài)碼過濾及根據(jù)拆線消息類型過濾四個(gè)部分;故障樹關(guān)聯(lián)模塊包括故障樹學(xué)習(xí)生成、故障樹迭代、故障樹關(guān)聯(lián)分析;單用戶問題定位模塊包括單用戶網(wǎng)元話單詳情、單用戶接口話單詳情、問題定界定位查詢。
二是設(shè)計(jì)數(shù)據(jù)流向,從接口信令話單、網(wǎng)元業(yè)務(wù)話單采集解析,到計(jì)算框架(計(jì)算引擎),最后為前臺(tái)WEB界面。
三是接口開發(fā)調(diào)用。四是頁(yè)面設(shè)計(jì)和美化。部署應(yīng)用上線后,檢查話單正常查詢,問題分析定位模塊使用正常,并發(fā)查詢調(diào)用成功率>98%。
五、結(jié)束語
應(yīng)用5G消息智能定位方案后,有效縮短用戶5G消息投訴問題的處理時(shí)長(zhǎng),用戶滿意度明顯提高,有效地提升了客戶感知。同時(shí)實(shí)現(xiàn)跨專業(yè)的高效協(xié)作,解放勞動(dòng)力,高效提高各專業(yè)人員運(yùn)維能力,是運(yùn)維方式的大變革,也為5G消息的進(jìn)一步商用奠定了運(yùn)維基礎(chǔ)。
作者單位:蔡璐宇 中國(guó)移動(dòng)通信集團(tuán)海南有限公司網(wǎng)絡(luò)運(yùn)營(yíng)中心
參? 考? 文? 獻(xiàn)
[1]中國(guó)電信,中國(guó)移動(dòng),中國(guó)聯(lián)通. 5G消息白皮書[EB/OL].(2020-04)[2021-1-20]