• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      終端換機(jī)業(yè)務(wù)分析研究

      2018-10-13 02:21:22李軼群李佳俊王蘊(yùn)實(shí)
      關(guān)鍵詞:換機(jī)數(shù)據(jù)表檔位

      路 瑋,李軼群,李佳俊,王蘊(yùn)實(shí)

      (中國聯(lián)通網(wǎng)絡(luò)技術(shù)研究院,北京 100048)

      0 引言

      隨著移動互聯(lián)網(wǎng)終端不斷增加,目前中國聯(lián)通有將近3億移動業(yè)務(wù)用戶,假設(shè)用戶兩年換一次手機(jī),則平均每年有1.5億用戶換機(jī)量[1],所以換機(jī)市場份額巨大。引入大數(shù)據(jù)挖掘技術(shù)對海量的換機(jī)數(shù)據(jù)進(jìn)行深度挖掘,分析潛在用戶的換機(jī)需求,例如用戶喜歡的終端品牌型號、心理價位、品牌忠實(shí)度等。通過對用戶換機(jī)大數(shù)據(jù)分析,構(gòu)建換機(jī)模型,挖掘出用戶換機(jī)信息,不僅有利于擴(kuò)大用戶市場增加經(jīng)濟(jì)效益,同時還為所在省份提供現(xiàn)網(wǎng)用戶終端使用情況,為網(wǎng)絡(luò)規(guī)劃部署作出參考,推動終端和網(wǎng)絡(luò)之間協(xié)調(diào)發(fā)展。

      1 終端數(shù)據(jù)源分析

      隨著全球及國內(nèi)移動終端產(chǎn)業(yè)鏈發(fā)展[2],終端對網(wǎng)絡(luò)功能實(shí)現(xiàn)影響力越來越大,所以從網(wǎng)絡(luò)側(cè)對終端業(yè)務(wù)進(jìn)行數(shù)據(jù)分析十分必要[3]。數(shù)據(jù)來源包括從省份提取的每月全網(wǎng)出賬用戶終端數(shù)據(jù),體現(xiàn)用戶行為信息;終端TAC庫,體現(xiàn)終端基本屬性信息;終端價格表信息,體現(xiàn)終端價格基本信息。通過上千萬條數(shù)據(jù)記錄及幾十個屬性指標(biāo)[4],展現(xiàn)出用戶換機(jī)行為特性。各數(shù)據(jù)表的關(guān)聯(lián)關(guān)系如圖1所示。

      (1)省份原始數(shù)據(jù)是提取省份每月出賬的終端數(shù)據(jù),包括終端的歸屬地市、終端移動設(shè)備國際識別碼(International Mobile Equipment Identity,IMEI)、用戶編號、國際移動用戶標(biāo)識(International Mobile Subscriber Identity,IMSI)、登錄過4G網(wǎng)絡(luò)附著標(biāo)識、3G網(wǎng)絡(luò)使用標(biāo)識等基本字段信息,其中IMEI設(shè)定為主鍵。

      (2)換機(jī)用戶關(guān)聯(lián)數(shù)據(jù)表是將換機(jī)前后終端數(shù)據(jù)信息整合到一張表中[5],在數(shù)據(jù)整合過程中過濾掉冗余字段,保留有效字段,其中IMEI_pre、TAC_pre表示為換機(jī)前終端的IMEI和TAC信息,IMEI_cur、TAC_cur表示為換機(jī)后終端的IMEI和TAC信息。由于各個終端數(shù)據(jù)表中關(guān)鍵字段不匹配,有的提供TAC信息,有的提供IMSI信息,為了統(tǒng)一處理,需要將TAC信息和IMSI信息進(jìn)行轉(zhuǎn)化,新增TAC字段信息,從IMEI號中提取前7位號碼轉(zhuǎn)化TAC字段。其中IMEI設(shè)定為主鍵。

      (3)終端庫表是終端關(guān)鍵數(shù)據(jù)信息,包括終端TAC號、終端名稱、終端ID、廠家名稱、廠家ID、網(wǎng)絡(luò)類型、創(chuàng)建時間、更新時間等基本字段信息。其中TAC號設(shè)定為主鍵。

      (4)終端價格表是定義不同終端價格檔位基本信息,包括終端ID、終端型號、廠家編碼、廠家名稱,以及終端價格檔位等字段信息。其中終端ID設(shè)為主鍵。數(shù)據(jù)表中將終端價格檔位分為A~E檔,價格上差額1 000 元一個檔位,其中大于等于3 500 為A檔,小于1 000 為E檔,如表1所示。

      圖1 終端數(shù)據(jù)關(guān)聯(lián)圖

      表1 終端價格檔位表

      (5)終端價格關(guān)聯(lián)表是將終端庫表和終端價格表進(jìn)行關(guān)聯(lián),按關(guān)鍵字段終端ID進(jìn)行數(shù)據(jù)合并,將相同終端ID號的終端型號、價格檔位、終端TAC號合并為一個表。其中設(shè)TAC號為主鍵。

      (6)TAC庫數(shù)據(jù)是終端的基本數(shù)據(jù),包括TAC號、終端品牌(Marketing Name)、終端廠商(Manufacturer)、支持的頻段(Bands)、2G標(biāo)識、3G標(biāo)識、4G標(biāo)識、雙卡、設(shè)備類型等基本字段信息。其中設(shè)TAC號為主鍵。

      (7)終端換機(jī)關(guān)聯(lián)表是將終端價格關(guān)聯(lián)表、換機(jī)用戶關(guān)聯(lián)數(shù)據(jù)表、TAC庫表進(jìn)行關(guān)聯(lián)[6-7],按換機(jī)前TAC號和換機(jī)后TAC號為關(guān)鍵字進(jìn)行合并,包含換機(jī)標(biāo)識,換機(jī)前Marketing_Name_pre、Manufacturer_pre、2G標(biāo)識_pre、3G標(biāo)識_pre、4G標(biāo)識_pre、終端檔位_pre,換機(jī)后Marketing_Name_cur、Manufacturer_cur、2G標(biāo)識_cur、3G標(biāo)識_cur、4G標(biāo)識_cur、終端檔位_cur等基本字段信息。換機(jī)是對比同一用戶IMSI號下不同IMEI號的終端信息,如果IMEI_pre=IMEI_cur,則表示沒有換機(jī),換機(jī)標(biāo)識為0;如果IMEI_pre≠IMEI_cur,則表示用戶換機(jī),換機(jī)標(biāo)識為1。其中設(shè)IMSI號為主鍵。

      2 換機(jī)業(yè)務(wù)模型分析

      IBM SPSS Modeler具有豐富的數(shù)據(jù)挖掘算法,支持?jǐn)?shù)據(jù)庫之間的數(shù)據(jù)與模型交換。在數(shù)據(jù)分析時通過數(shù)據(jù)收集、預(yù)處理、模型建立、模型評估等環(huán)節(jié),通過若干節(jié)點(diǎn),建立一條或多條數(shù)據(jù)流,調(diào)整和修改數(shù)據(jù)流中的節(jié)點(diǎn)和參數(shù),完成整個數(shù)據(jù)分析任務(wù)[8]。采用SPSS Modeler進(jìn)行數(shù)據(jù)處理,基礎(chǔ)數(shù)據(jù)流的建立和完善是數(shù)據(jù)業(yè)務(wù)分析的基礎(chǔ)和支撐,可以滿足不同省份的統(tǒng)一業(yè)務(wù)的需求分析。根據(jù)數(shù)據(jù)業(yè)務(wù)數(shù)據(jù)源分析,建立業(yè)務(wù)挖掘模型[9]。終端數(shù)據(jù)流處理過程如圖2所示。

      圖2 終端數(shù)據(jù)流處理過程框架

      圖3 數(shù)據(jù)節(jié)點(diǎn)審核統(tǒng)計

      在數(shù)據(jù)準(zhǔn)備階段,讀取省份當(dāng)月出賬的終端原始數(shù)據(jù)、上個月的出賬終端原始數(shù)據(jù)、TAC庫數(shù)據(jù)以及終端價格檔位數(shù)據(jù)等數(shù)據(jù)信息。瀏覽數(shù)據(jù)內(nèi)容,對數(shù)據(jù)進(jìn)行過濾、確認(rèn)字段存儲類型、讀取數(shù)據(jù)的變量類型等參數(shù)設(shè)置,例如將IMSI號和IMEI號存儲類型從字符串變更為整數(shù)。通過過濾選項(xiàng)卡修改變量名稱,將上個月的數(shù)據(jù)表中的IMEI變量名稱改為IMEI_pre,當(dāng)月的數(shù)據(jù)表中的IMEI變量變更為IMEI_cur。通過數(shù)據(jù)審核可以觀察出統(tǒng)計數(shù)據(jù)中的異常數(shù)據(jù)、極端數(shù)據(jù)[10]。

      對于異常數(shù)據(jù)需要在數(shù)據(jù)預(yù)處理階段進(jìn)行修改或刪除。在數(shù)據(jù)預(yù)處理階段,為了提取有效數(shù)據(jù)的價值,需要提前將缺失和異常數(shù)據(jù)處理干凈,對數(shù)據(jù)進(jìn)行一系列的清洗、轉(zhuǎn)化、加載等[11]。在省份當(dāng)月出賬的終端原始數(shù)據(jù)里只有IMEI碼信息,沒有TAC碼信息,為了同TAC庫進(jìn)行對比分析,需要根據(jù)IMEI信息派生出TAC碼。TAC碼是IMEI碼前六位數(shù)字,代表終端型號。利用函數(shù)intof(‘IMEI號’/1000000)將IMEI值轉(zhuǎn)化為TAC值,通過TAC標(biāo)識,與TAC庫進(jìn)行對比,可以獲得終端基本信息。IMEI是終端唯一識別碼,對于換機(jī)業(yè)務(wù)來說關(guān)注終端換機(jī)前和換機(jī)后終端IMEI對比至關(guān)重要,所以將終端IMEI號作為主鍵,唯一標(biāo)識數(shù)據(jù)表中的每條記錄[12]。在數(shù)據(jù)處理過程中需要將原始數(shù)據(jù)的字段類型進(jìn)行調(diào)整,將IMSI、IMEI字段從實(shí)數(shù)或字符串變更為整數(shù),類型為連續(xù)型。同時過濾參數(shù)字段,保留IMEI號、IMSI號有效字段,剔出用戶編碼等信息。通過對原始數(shù)據(jù)轉(zhuǎn)化、過濾、類型變更、匹配合并等初步處理,可以將數(shù)據(jù)轉(zhuǎn)化為有效數(shù)據(jù)。由省份當(dāng)月原始數(shù)據(jù)表和上個月原始數(shù)據(jù)表合成換機(jī)用戶關(guān)聯(lián)數(shù)據(jù)表,以IMSI標(biāo)識為主鍵,用IMSI關(guān)鍵字段進(jìn)行合并,并對IMEI進(jìn)行去重,保留終端唯一性,IMEI_pre、TAC_pre表示為換機(jī)前終端的IMEI和TAC信息,IMEI_cur、TAC_cur表示為換機(jī)后終端的IMEI和TAC信息。終端庫和終端價格表的對比合并生成終端價格關(guān)聯(lián)表,通過終端ID關(guān)鍵字段,生成以TAC為主鍵,包含終端ID、價格檔位、終端類型等字段的數(shù)據(jù)表。TAC庫中標(biāo)明了終端的屬性,包括該終端品牌、終端型號、支持2G/3G/4G頻段情況、設(shè)備類型、是否是雙卡等信息。用戶終端TAC號同TAC庫中TAC號進(jìn)行匹配可以查出用戶終端包含的屬性,顯示出用戶終端的頻段支持情況。在合并時使用TAC號作為關(guān)鍵字。將TAC庫表、換機(jī)用戶關(guān)聯(lián)數(shù)據(jù)表、終端價格關(guān)聯(lián)表3張表以換機(jī)前TAC_pre為合并字段,生成換機(jī)前終端型號、終端品牌、終端支持2G/3G/4G情況、終端檔位信息;以換機(jī)后TAC_cur為合并字段,生成換機(jī)后終端信號、終端品牌、終端支持2G/3G/4G情況、終端檔位信息[13]。

      模型建立,生成數(shù)據(jù)流;將分析出的結(jié)果匯總,通過表或圖形展現(xiàn)出來[14]。

      3 終端換機(jī)分析結(jié)果

      通過換機(jī)業(yè)務(wù)模型[15]對省份連續(xù)2個月的出賬1 200 萬條的終端數(shù)據(jù)進(jìn)行分析。本文從換機(jī)前后品牌占比、用戶換機(jī)忠誠度、換機(jī)后價格檔位等幾個方面進(jìn)行深入分析。分析結(jié)果如圖4所示。

      圖4 換機(jī)前后品牌TOP10占比統(tǒng)計情況

      換機(jī)前后TOP5品牌均為蘋果、華為、VIVO、魅族、OPPO,其中蘋果換機(jī)減少2.62%,華為換機(jī)減少2.65%, VIVO換機(jī)減少1%,小米換機(jī)增加2.26%,魅族換機(jī)增加1.57%,OPPO換機(jī)增加1.47%[16]。如圖5所示。

      圖5 終端品牌變更統(tǒng)計

      分析可見,蘋果、魅族、OPPO換機(jī)后繼續(xù)使用同款終端品牌占比相對較高,基本在60%~68%左右,華為、VIVO繼續(xù)使用同款終端品牌占比45%,說明用戶對TOP5的終端品牌忠誠度比較高。

      如圖6所示,A檔價格檔位在≥3 500占8.71%,B檔價格檔在[2 500,3 500)占比26.59%,C檔價格檔在[1 500,2 500]占比14.5%,D檔價格檔在[1 000,1 500)占比28.96%,E檔價格檔在(0,1 000)占比21.24%。

      圖6 終端價格檔位百分比

      如圖7所示,統(tǒng)計終端各檔位前5位的品牌型號,其中:

      在A檔價格中,蘋果占27.37%,華為占22.32%,VIVO占19.56%,三星占9.29%,小米占5.5%;

      在B檔價格中,蘋果占29.91%,VIVO占21.63%, 魅族占14.77%,小米占8.49%,華為占7.34%;

      在C檔價格中,VIVO占24.27%, 魅族占16.18%,三星占13.94%,小米占13.21%,華為占10.05%;

      在D檔價格中,VIVO占21.09%, 華為占13.24%,OPPO占5.87%,小米占4.58%,魅族占3.2%;

      在E檔價格中,VIVO占19.76%,魅族占13.36%,OPPO占8.61%,小米占5.55%,華為占5.25%。

      從價格上可以看出,蘋果在高端終端占比較大,VIVO在各個檔位均是最受歡迎的品牌。

      4 結(jié)論

      本文根據(jù)用戶換機(jī)業(yè)務(wù)需求通過大數(shù)據(jù)分析構(gòu)建一個終端換機(jī)模型,利用省份出賬的終端數(shù)據(jù)統(tǒng)計出用戶換機(jī)忠誠度、終端價格檔位占比、終端品牌等信息,挖掘出用戶的潛在的偏愛喜好,找出影響用戶換機(jī)行為的關(guān)鍵因素,對提升市場營銷有很大幫助。

      圖7 終端數(shù)據(jù)流處理過程框架

      猜你喜歡
      換機(jī)數(shù)據(jù)表檔位
      湖北省新冠肺炎疫情數(shù)據(jù)表
      黨員生活(2020年2期)2020-04-17 09:56:30
      基于列控工程數(shù)據(jù)表建立線路拓?fù)潢P(guān)系的研究
      三繞組變壓器運(yùn)行分接頭檔位計算及電壓分析
      智富時代(2018年9期)2018-10-19 18:51:44
      引入分接頭檔位的換流變差動保護(hù)方案研究
      河南科技(2015年2期)2015-02-27 14:20:29
      圖表
      基于單片機(jī)的變壓器檔位監(jiān)測雙輸入BCD編碼器
      基于VSL的動態(tài)數(shù)據(jù)表應(yīng)用研究
      河南科技(2014年24期)2014-02-27 14:19:25
      安化县| 弥勒县| 亳州市| 阳东县| 安多县| 抚宁县| 延边| 武清区| 霸州市| 朝阳市| 寿光市| 治县。| 思茅市| 姚安县| 咸阳市| 彭山县| 宁明县| 桃江县| 连州市| 天柱县| 巫山县| 台山市| 新乡市| 潞城市| 元谋县| 瓦房店市| 阿合奇县| 永善县| 仪陇县| 怀远县| 镇原县| 鄢陵县| 抚松县| 安岳县| 长岭县| 灵宝市| 文安县| 洞头县| 呈贡县| 锡林郭勒盟| 清原|