• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于邏輯回歸算法的A地市家庭寬帶發(fā)展研究

      2017-03-12 08:30鄭曉
      移動通信 2017年2期

      【摘 要】家庭寬帶是電信運營商重點發(fā)展的業(yè)務。根據(jù)A地市中國移動家庭寬帶業(yè)務的相關數(shù)據(jù),分析用戶的通信和上網(wǎng)等行為特點,基于邏輯回歸算法預測A地市的潛在安裝寬帶用戶概率值,為一線城市制定家庭寬帶發(fā)展業(yè)務提供方案。

      【關鍵詞】邏輯回歸 家庭寬帶 中國移動

      doi:10.3969/j.issn.1006-1010.2017.02.016 中圖分類號:F623 文獻標志碼:A 文章編號:1006-1010(2017)02-0079-03

      引用格式:鄭曉. 基于邏輯回歸算法的A地市家庭寬帶發(fā)展研究[J]. 移動通信, 2017,41(2): 79-81.

      1 引言

      家庭寬帶營銷一直是運營商市場的重點業(yè)務。在上海舉辦的MWCS2016(世界移動通信大會上海)上,中國移動執(zhí)行副總裁李慧鏑表示,將大力推動家庭業(yè)務發(fā)展,中國移動計劃2016年新增家庭寬帶用戶1800萬。不難看出,家庭寬帶客戶發(fā)展已成為中國移動省公司重點關注的方向。

      為使模型真正指導營銷,選擇某省A地市中國移動客戶作為研究對象,針對該地市的移動客戶的家庭寬帶業(yè)務的相關數(shù)據(jù)進行分析和挖掘,分析家寬用戶與非家寬用戶的特征,幫助一線營銷人員制定家庭寬帶營銷策略。

      2 A地市潛在家庭寬帶用戶挖掘實踐

      2.1 背景

      據(jù)了解,A地市移網(wǎng)總用戶數(shù)為80萬左右,家庭總戶數(shù)約為60萬(基于該地市移網(wǎng)總用戶數(shù)及家庭成員識別、居住地識別2個基礎模型估算得出),其中移動寬帶覆蓋戶數(shù)為32萬。在移動寬帶覆蓋區(qū)域內(nèi),已安裝移動寬帶戶數(shù)為7萬,異網(wǎng)寬帶戶數(shù)約為10萬,故未被挖掘的潛在寬帶戶數(shù)=移動寬帶覆蓋戶數(shù)-已安裝移動寬帶戶數(shù)-異網(wǎng)寬帶戶數(shù)=15萬,尚有較大的發(fā)展空間。而現(xiàn)階段A地市以普遍撒網(wǎng)的方式營銷,缺少針對性的營銷,營銷進展較為緩慢。因此,通過大數(shù)據(jù)分析建模,以期精準識別營銷目標客戶,實現(xiàn)營銷資源利用率最大化。

      2.2 具體過程

      (1)數(shù)據(jù)挖掘目標。通過對比近期新安裝移動寬帶用戶及未安裝移動寬帶用戶流量使用行為、家庭行為等特征,識別潛在寬帶用戶,預測潛在寬帶用戶安裝寬帶概率值。

      (2)訓練樣本選擇。抽樣的用戶需要滿足以下條件:入網(wǎng)至少三個月、非移動內(nèi)部用戶、用戶居住地被移動寬帶覆蓋。正樣本取2015年12月、2016年1、2月未使用移動寬帶,2016年3月新裝移動寬帶的全量用戶,共0.18萬。負樣本取截止2016年4月未使用移動寬帶用戶。因為數(shù)量較多,把負樣本的濃度降低,以便更好地觀察與分析正樣本的特征,取正負樣本比例為1:6,抽取1.2萬的負樣本。

      (3)變量選擇。涉及的變量主要來源于電信行業(yè)內(nèi)部以及一些上網(wǎng)類屬性,字段分類主要包括基礎屬性、位置信息、用戶消費行為、用戶終端特征、數(shù)據(jù)業(yè)務辦理情況、交往圈情況、家庭成員情況、APP安裝使用情況,共選取了148個初始變量。

      (4)數(shù)據(jù)探索與數(shù)據(jù)處理。業(yè)務知識是數(shù)據(jù)挖掘的核心,這一原則在數(shù)據(jù)探索的過程尤為重要。對變量的相關業(yè)務知識進行詳細了解后,借助ATSER工具,對挖掘變量做由淺入深的數(shù)據(jù)探索。主要通過數(shù)據(jù)質(zhì)量檢查、值分析、統(tǒng)計分析、頻度分析、直方圖分析、相關性分析等方法理解變量。通過構造衍生變量的方式,探索對目標變量影響更大的變量。比如,近三個月月均視頻APP使用次數(shù)空值較多,將其從數(shù)值型變量轉變成分類變量,代表近三個月是否使用視頻類APP。同時通過缺失值、異常值處理、變量標準化等方法對變量進行處理,最終確定模型輸入變量21個。

      (5)算法選擇與模型評估。目前在電信行業(yè)常用的算法包括:決策樹、邏輯回歸、隨機森林、神經(jīng)網(wǎng)絡等?;谝韵滤姆矫嬖騼?yōu)先采用邏輯回歸算法:一是模型輸入變量類型多為數(shù)值型;二是輸出變量為典型的二分類型變量;三是需要輸出客戶新裝寬帶概率指導營銷;四是地市的樣本量較少,而邏輯回歸的優(yōu)勢在于數(shù)據(jù)沒必要滿足正態(tài)分布。

      邏輯回歸模型屬于廣義線性模型(Generalized Linear Model)的一種,是基于Sigmoid函數(shù)的有監(jiān)督分類模型,主要是研究一個因變量和多個自變量之間的多元回歸關系。在邏輯回歸分析中,因變量Y是一個二分類變量,取Y=1和Y=0分別表示新裝家寬的用戶和未裝家寬用戶。影響Y取值的n個自變量x1, x2, …, xn,在這n個自變量的作用下,新裝家寬的條件概率為P=P(Y=1∣x1, x2, …, xn),邏輯回歸方程可表示為:

      zi=a0+a1xi1+a2xi2+…+anxin (1)

      Pi=1/(1+exp(-zi)) (2)

      其中:zi為中間變量參數(shù);

      a0為回歸常數(shù);

      aj為第j個變量的回歸系數(shù)(i、j=1,2, …, n);

      xij為第i個單元中第j個變量的取值,存在新裝家寬取1,否則取0;

      Pi為第i單元中發(fā)生新裝寬帶的概率的回歸預測值(i=1,2, …, n)。

      表1為訓練集的模型效果,表2為測試集的模型效果。不難發(fā)現(xiàn),響應率情況基本保持一致,說明模型沒有過度擬合。同時在選取營銷對象時,建議選取KS值最大對應的用戶進行營銷,因為KS值能最大程度地區(qū)分正負樣本?;跍y試集的模型結果,比未建模時提升2.29倍,效果較好。

      3 營銷策略制定

      在醫(yī)學實驗研究中有對照原則,設立對照組的作用在于提高鑒別能力和結論的說服力。由于營銷資源有限,為提高資源利用率,跨界引用對照原則,設置高度可比性的對照組AB的方式進行試外呼,對比、檢驗模型的應用效果,保證模型的真實有效性。模型組選?。焊怕史謩e在40%~60%、60%~80%、80%~100%的用戶,每個區(qū)間取30%的用戶外呼,概率在20%~40%的用戶,取5%的用戶外呼。同時對照組選取:在2G、3G用戶中隨機抽取5000個與模型組無重復的用戶外呼。

      試外呼的效果如表3所示,模型組的平均意向率是對照組的2.9倍,證明模型應用效果較好。據(jù)此,開展全量營銷,按概率由大到小外呼以保證最優(yōu)營銷。

      4 結論

      以A地市中國移動家庭寬帶業(yè)務數(shù)據(jù)為研究對象,選擇八大類型共148個相關指標,采用邏輯回歸模型預測潛在用戶安裝寬帶概率值,并通過KS值確認模型沒有過度擬合,并運用查全率、查準率、提升度及AB對照組等方法保證模型的真實有效性。為運營商進一步做好營銷活動提供了可依據(jù)的數(shù)據(jù)支撐。

      參考文獻:

      [1] Jiawei Han, Micheline Kamber, Jian Pei. 數(shù)據(jù)挖掘概念與技術[M]. 范明,孟小峰,譯. 3版. 北京: 機械工業(yè)出版社, 2012.

      [2] Mehmed Kantardzic. 數(shù)據(jù)挖掘:概念、模型、方法和算法[M]. 王曉海,吳志剛,譯. 2版. 北京: 清華大學出版社, 2014.

      [3] 王濟川. Logistic回歸模型:方法與應用[M]. 北京: 高等教育出版社, 2001.

      [4] 王燕莉,安世全. 數(shù)據(jù)挖掘技術在移動通信中的應用[J]. 中國數(shù)據(jù)通信, 2004,6(1): 74-77.

      [5] 郭明,鄭惠莉. 基于數(shù)據(jù)挖掘的電信客戶流失分析[D]. 南京: 南京郵電大學, 2005.

      [6] 鄧玉珊. 電信業(yè)潛在寬帶客戶獲取預測研究[D]. 成都: 電子科技大學, 2009.

      [7] 鄒超,姜澄宇. 我國寬帶業(yè)務市場的擴散分析[J]. 蘭州大學學報, 2007,35(6): 144-146.

      [8] Ningtang P, Steinbach M, Kumar V. Introduction to Data Mining[M]. Beijing: Posts&Telecom Press, 2006: 372-374.

      [9] 方芳,劉大有,王新華,等. 電信CRM技術發(fā)展研究[J]. 計算機工程, 2010,36(5): 277-279.

      [10] 徐曉菊. 數(shù)據(jù)挖掘在電信業(yè)中的應用[J]. 統(tǒng)計與咨詢, 2008(3): 33-34.★

      塔河县| 老河口市| 合水县| 平湖市| 华坪县| 顺平县| 饶平县| 淮南市| 德安县| 离岛区| 城步| 内丘县| 大兴区| 神木县| 青岛市| 益阳市| 泸水县| 沁水县| 静乐县| 宣化县| 大足县| 织金县| 高州市| 望城县| 称多县| 蚌埠市| 阿拉善左旗| 玛纳斯县| 千阳县| 东海县| 修武县| 长兴县| 临西县| 诸城市| 遂昌县| 托里县| 钟山县| 卓资县| 梅河口市| 山丹县| 乐平市|