徐 丹,張永超
(中國交通通信信息中心,北京 100094)
國際海事衛(wèi)星(Inmarsat)是全球第一個具有全球覆蓋能力的移動衛(wèi)星通信系統(tǒng),早期旨在為海上船舶提供衛(wèi)星通信服務(wù),現(xiàn)已發(fā)展成為提供全球衛(wèi)星移動公眾通信和遇險安全通信的衛(wèi)星通信系統(tǒng),是我國交通運(yùn)輸通信信息網(wǎng)絡(luò)的主要組成部分之一。2008年8月Inmarsat成功發(fā)射第三顆第四代海事衛(wèi)星,支持寬帶業(yè)務(wù)的第四代海事衛(wèi)星框架體系基本形成。第四代海事衛(wèi)星其突出特點(diǎn)是衛(wèi)星功率大幅提高,其終端鏈路等效全向輻射功率(EIRP)為67dbW,并且采用最新頻率復(fù)用技術(shù),支持1個全球波束、19個寬點(diǎn)波束、193個窄點(diǎn)波束,每個窄點(diǎn)波束可含6-8個信道,每個信道帶寬200kHz,信道總數(shù)630個,并且窄點(diǎn)波束可調(diào)整、信道可組合使用。同時引入了公共網(wǎng)絡(luò)的3G技術(shù),采用3GPP標(biāo)準(zhǔn),滿足3G所定義的高達(dá)492kb/s的數(shù)據(jù)帶寬,支持豐富的3G語音、數(shù)據(jù)和視頻傳輸?shù)裙δ堋?013年12月我國新建第四代國際海事衛(wèi)星北京關(guān)口站工程正式開通運(yùn)行,這是第一個國家級第四代海事衛(wèi)星關(guān)口站(以下簡稱“北京SAS站”),北京SAS也建設(shè)了基于3GPP標(biāo)準(zhǔn)的核心網(wǎng)。它實(shí)現(xiàn)了在中國境內(nèi)的所有第四代海事衛(wèi)星終端的語音、數(shù)據(jù)業(yè)務(wù)的全部自主接續(xù),不再轉(zhuǎn)接至國外關(guān)口站進(jìn)行空間接續(xù),這對我國境內(nèi)通信安全和主權(quán)維護(hù)具有重要意義。
自2013年開通以來,北京SAS站累計服務(wù)各類海事衛(wèi)星用戶近10萬,語音業(yè)務(wù)主被叫年均共約4000萬分鐘,數(shù)據(jù)業(yè)務(wù)上下行年均總流量近2T。相對于地面站公眾網(wǎng)絡(luò)通信而言,海事衛(wèi)星具有通信資費(fèi)高、漫游用戶多的特點(diǎn),這意味著對通信話單需要更精確的計算統(tǒng)計和網(wǎng)間結(jié)算,而基于海事衛(wèi)星網(wǎng)絡(luò)全球用戶的通信話單生成與計算均需由Inmarsat組織單方面提供,由于北京SAS站沒有針對本站進(jìn)行話單提取生成的技術(shù),所以在與Innmarsat和電信運(yùn)營商的網(wǎng)間結(jié)算中,均缺乏業(yè)務(wù)量比對核驗(yàn)的機(jī)制,這顯然不符合通信網(wǎng)間結(jié)算的基本要求。此外,由于海事衛(wèi)星網(wǎng)絡(luò)與地面接續(xù)網(wǎng)絡(luò)的復(fù)雜性和衛(wèi)星自身的延時與速率限制,導(dǎo)致用戶對通信話單的調(diào)取回溯需求量較大,同時技術(shù)人員對故障排查等作業(yè)也需要大量通信話單記錄的調(diào)閱。因此研究北京SAS站的通信話單提取與解析技術(shù)、開發(fā)話單分析系統(tǒng)對我國海事衛(wèi)星業(yè)務(wù)的管理價值巨大。
由于第四代海事衛(wèi)星無線網(wǎng)絡(luò)子系統(tǒng)將覆蓋區(qū)域的語音、數(shù)據(jù)業(yè)務(wù)經(jīng)過調(diào)制解調(diào),轉(zhuǎn)變?yōu)?G協(xié)議送到核心網(wǎng)子系統(tǒng)。因此北京SAS站建設(shè)了符合3GPP標(biāo)準(zhǔn)的核心網(wǎng)(CN)。核心網(wǎng)包括電路域CS 和分組域PS兩個部分組成,如圖1所示。
圖1 核心網(wǎng)網(wǎng)元結(jié)構(gòu)
核心網(wǎng)電路(CS)域主要由MSC Server經(jīng)媒體網(wǎng)關(guān)MGW,通過專線與中國國內(nèi)運(yùn)營商國際局和Inmarsat關(guān)口站連接,實(shí)現(xiàn)公眾運(yùn)營商網(wǎng)絡(luò)的PSTN/PLMN語音業(yè)務(wù)與海事衛(wèi)星內(nèi)網(wǎng)話務(wù)互聯(lián)互通。因此MSC Server網(wǎng)元可以輸出全部語音業(yè)務(wù)的通信計費(fèi)日志文件,為語音話單的采集與解析生成提供了必備數(shù)據(jù)源條件。分組域(PS)部分主要包括GGSN節(jié)點(diǎn)和SGSN節(jié)點(diǎn),如圖2所示。
圖2 分組域網(wǎng)絡(luò)結(jié)構(gòu)
GGSN通過數(shù)據(jù)通信網(wǎng)DCN與Inmarsat網(wǎng)絡(luò)實(shí)現(xiàn)網(wǎng)關(guān)接續(xù)。SGSN網(wǎng)元通過無線子系統(tǒng)RAN實(shí)現(xiàn)本地注冊用戶的數(shù)據(jù)服務(wù),并與Inmarsat HLR鑒權(quán)提供服務(wù)。因此SGSN和GGSN網(wǎng)元都將記錄數(shù)據(jù)業(yè)務(wù)會話日志文件。對于本地用戶指話單GGSN 節(jié)點(diǎn)地址為本地節(jié)點(diǎn)的用戶,漫游用戶指GGSN節(jié)點(diǎn)為非本地節(jié)點(diǎn)的用戶。因此本地用戶PS話單從GGSN話單中提取,漫游用戶的PS話單從SGSN話單中提取。通過對核心網(wǎng)網(wǎng)元結(jié)構(gòu)的研究,我們認(rèn)為MSC將提供電路(CS)域話單數(shù)據(jù)源,GGSN和SGSN將提供分組PS(域)話單數(shù)據(jù)源,這為下一步計費(fèi)日志采集打下了基礎(chǔ)。
北京SAS站核心網(wǎng)網(wǎng)元將通過指令按一定時間間隔輸出計費(fèi)日志文件到Server本地。因此可以通過搭建FTP服務(wù)器與客戶端,實(shí)現(xiàn)定時自動下載傳輸各網(wǎng)元輸出的計費(fèi)日志原始話單CDR文件,并進(jìn)行話單文件提取和解析,經(jīng)過話單模板格式形成結(jié)構(gòu)化數(shù)據(jù)存儲到數(shù)據(jù)庫中管理,話單采集解析邏輯結(jié)構(gòu)如圖3所示。
圖3 話單采集解析邏輯結(jié)構(gòu)圖
默認(rèn)日志計費(fèi)CDR文件以的二進(jìn)制ASN.1格式輸出,將網(wǎng)元作為FTP Server,并按權(quán)限設(shè)置FTP 遠(yuǎn)程用戶可以訪問CDR輸出目錄。同時部署一臺CDR采集服務(wù)器作為FTP客戶端,定時采集新產(chǎn)生的CDR文件。根據(jù)一定命名規(guī)則對話單文件進(jìn)行存儲,CDR采集客戶端可以設(shè)置采集網(wǎng)元的路徑、登錄服務(wù)器的認(rèn)證信息和采集時間間隔與頻次等內(nèi)容,并由程序調(diào)度實(shí)現(xiàn)。
北京SAS站核心網(wǎng)網(wǎng)元節(jié)點(diǎn)的計費(fèi)日志文件以二進(jìn)制ASN.1格式截取輸出,要想完成話單的解析和格式化為ASCII碼文本,首先需要進(jìn)行日志文件的格式轉(zhuǎn)化輸出。我們采用核心網(wǎng)的話單格式化轉(zhuǎn)換命令進(jìn)行轉(zhuǎn)換。轉(zhuǎn)化命令包括指定ASN模板文件,轉(zhuǎn)換源文件和輸出文件等參數(shù),在本次研究中我們以XML 標(biāo)準(zhǔn)對轉(zhuǎn)化后的文件進(jìn)行輸出。所以定的模板文件作為所有日志要素的編碼格式聲明。模板定義文件其實(shí)是一個基于WCDMA R8.1/GSM R14.1(CS域)或3GPP(PS域)標(biāo)準(zhǔn)的結(jié)構(gòu)體定義文件,它定義了所有計費(fèi)參數(shù)要素的數(shù)據(jù)位,數(shù)據(jù)類型,取值范圍等結(jié)構(gòu)信息,以MSC的spe文件為例,定義文件描述了呼叫記錄節(jié)點(diǎn)記錄(UMTSGSMPLMNCallDataRecord)的結(jié)構(gòu),GGSN/SGSN定義文件描述了數(shù)據(jù)會話節(jié)點(diǎn)記錄(GGSNPDPRecord/SGSNPDPRecord)的結(jié)構(gòu)。包括相關(guān)話單業(yè)務(wù)字段,如主叫號、被叫號、時長、出入路由、IMSI和IMEI及錯誤代碼,以及海事衛(wèi)星網(wǎng)絡(luò)擴(kuò)展的衛(wèi)星波束等信息。工具命令按模板定義文件對原始話單文件進(jìn)行格式轉(zhuǎn),輸出的文本文件可被軟件程序讀取并解析為結(jié)構(gòu)化文件,至此就完成了話單采集和解析工作。
原始話單文件是基于網(wǎng)元為單位的記錄輸出,但對于通信業(yè)務(wù)來說,一次語音呼叫或數(shù)據(jù)會話往往是不同網(wǎng)元間多路由實(shí)現(xiàn)的通信,因此需要對不同路由的話單需要進(jìn)行合并提取形成一次可計費(fèi)業(yè)務(wù)話單。電路域(CS域)語音綜合話單根據(jù)“下一條呼叫”字段將各個CS話單合并,合并的多條話單中,包含重復(fù)重要字段將取最新一跳路由的值作為總話單的值。對于分組域(PS)話單合并來說,每一次會話由多條話單記錄組成,其中“計費(fèi)ID”是一次會話多條話單記錄的關(guān)聯(lián)字段,將對應(yīng)的原始話單ID寫入合并話單主記錄中,將話單中的IMSI號碼提取,與用戶身份屬性中的IMSI號碼關(guān)聯(lián),將數(shù)據(jù)會話開始時間作為主話單的會話開始時間,從而便于計算時長流量等數(shù)據(jù)。
為了對核心網(wǎng)話單進(jìn)行存儲和數(shù)據(jù)管理,我們構(gòu)建關(guān)系型數(shù)據(jù)庫用于將話單進(jìn)行數(shù)據(jù)入庫存儲,建立了基于CS和PS兩個話單的主表,為每個主表建關(guān)聯(lián)子表用于存儲原始話單,通過SQL語句存入數(shù)據(jù)庫中。數(shù)據(jù)抽取與入庫管理,采取ETL抽取工具制定數(shù)據(jù)抽取流程,如圖4所示,數(shù)據(jù)抽取和入庫流程可以按環(huán)節(jié)設(shè)計不同操作節(jié)點(diǎn),節(jié)點(diǎn)包括觸發(fā)時間,數(shù)據(jù)源和數(shù)據(jù)目標(biāo),數(shù)據(jù)處理腳本以及執(zhí)行事件,抽取工具作為系統(tǒng)服務(wù)運(yùn)行后,可以按各節(jié)點(diǎn)計劃任務(wù)進(jìn)行執(zhí)行完成話單數(shù)據(jù)解析和入庫等數(shù)據(jù)管理。
圖4 話單數(shù)據(jù)采集管理流程圖
隨著第四代海事衛(wèi)星北京關(guān)口站的開通,以及地面核心網(wǎng)絡(luò)的建設(shè),為海事衛(wèi)星在中國區(qū)的通信業(yè)務(wù)接續(xù)和數(shù)據(jù)解析提取提供了可能。通過本次研究,我們突破了海事衛(wèi)星通信網(wǎng)的核心數(shù)據(jù)采集解析技術(shù)瓶頸,解決了海事衛(wèi)星通信網(wǎng)核心話單數(shù)據(jù)的自主采集與解析問題,打破了長期以來僅能依賴Inmarsat獲取數(shù)據(jù)的局面,為自主實(shí)現(xiàn)了海事衛(wèi)星通信業(yè)務(wù)統(tǒng)計、話單計費(fèi)、網(wǎng)間結(jié)算核準(zhǔn)及話務(wù)分析等系統(tǒng)的建設(shè)奠定了技術(shù)基礎(chǔ)。
[1] 北京電信規(guī)劃設(shè)計研究院.第四代國際海事衛(wèi)星北京關(guān)口站工程衛(wèi)星系統(tǒng)部分初步設(shè)計[M].內(nèi)部,2011:204-220.
[2] 黎東敏.關(guān)于愛立信APG43的研究[J].知識經(jīng)濟(jì),2013,12(8).
[3] 吳志鵬.大數(shù)據(jù)時代的電信與互聯(lián)網(wǎng)管理[M].北京:北京郵電大學(xué)出版社,2014:32-56.