• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      移動通信用戶交際圈研究

      2019-11-12 12:01:33張治高
      電腦知識與技術(shù) 2019年25期
      關(guān)鍵詞:多元線性回歸預(yù)測模型

      張治高

      摘要:電信運(yùn)營商擁有天量的通話詳單和短信詳單,用戶的通話及短信同時(shí)也伴隨著巨大的行為數(shù)據(jù)產(chǎn)生。過對電信運(yùn)營商的移動通信用戶的通話及短信清單,利用多元回歸的預(yù)測模型,建立了穩(wěn)定交往模型。利用最小二乘估計(jì)的方法,通過SPSS軟件計(jì)算出模型的未知參數(shù)。計(jì)算出用戶間穩(wěn)定交往指數(shù),為運(yùn)營商提高存量用戶的忠誠度,減少用戶流失提供了數(shù)據(jù)依據(jù)。

      關(guān)鍵詞:多元線性回歸; 預(yù)測模型;SPSS;交往圈

      中圖分類號:TP393? ? ? ? 文獻(xiàn)標(biāo)識碼:A

      文章編號:1009-3044(2019)25-0305-03

      1 引言

      數(shù)據(jù)挖掘中使用的相關(guān)算法來自大量、不完整、隨機(jī)、模糊中提取有用的數(shù)據(jù)、正確、全面、未知、用戶感興趣的知識等。建立數(shù)學(xué)模型,用來決策支持的模型,提供預(yù)測性決策支持的方法、過程、工具[1]。數(shù)據(jù)挖掘通常是指通過算法從大量數(shù)據(jù)中搜索隱藏在其中的信息的過程。隨著互聯(lián)網(wǎng)時(shí)代的到來和數(shù)據(jù)大爆發(fā),數(shù)據(jù)挖掘技術(shù)普遍而且迫切地應(yīng)用于各個(gè)領(lǐng)域,比如金融、電信、保險(xiǎn)、互聯(lián)網(wǎng)等行業(yè)。它通過運(yùn)用整理、分析、總結(jié)、推理等方法對大量地?cái)?shù)據(jù)進(jìn)行處理,從而對實(shí)際問題進(jìn)行指導(dǎo)和分析,獲得相關(guān)預(yù)測結(jié)果以做出更有利的決策[2]。

      在電信行業(yè),用戶之間的互通行為,一般稱之為交往。這種交往關(guān)系不但可以發(fā)現(xiàn)用戶的交往圈范圍,還可以挖掘競爭對手,為用戶維穩(wěn)、策反營銷提供信息支持。人們總是試圖憑借一個(gè)或者若干個(gè)指標(biāo)衡量兩個(gè)用戶之間的交往密切程度。那么,這個(gè)衡量交往密切程度的指標(biāo),我們統(tǒng)稱之為交往指數(shù)。早期一般通過互通(語音、短信等)次數(shù)、時(shí)長來考察交往情況,效果不理想。原因是人與人之間的相互作用在一段時(shí)間內(nèi)相對穩(wěn)定,但總是在變化;此外,單個(gè)聯(lián)系人的數(shù)量和長期的互操作性不足以表明這種交互是穩(wěn)定的。因此,要想尋找用戶的穩(wěn)定交往群體,必須要從時(shí)間、交往次數(shù)、交往方式和交往時(shí)刻分布等多個(gè)角度來綜合衡量交往的穩(wěn)定性。

      2 算法及相關(guān)軟件介紹

      2.1 多元回歸的預(yù)測模型

      回歸分析是探索變量之間的相關(guān)性和依賴性的有效方法??傮w回歸模型[3]反映了變量間關(guān)系的總體趨勢,線性總體回歸模型形式簡單、參數(shù)的估計(jì)與檢驗(yàn)也相對容易,是最為常見的總體回歸模型。

      2.3 SPSS軟件介紹

      SPSS軟件是目前較為流行的統(tǒng)計(jì)分析軟件,在醫(yī)學(xué)、經(jīng)濟(jì)、教育和通信等相關(guān)領(lǐng)域的應(yīng)用有分廠顯著成果,界面非常友好,能夠非常全面的滿足統(tǒng)計(jì)工作提出的各種個(gè)性化的需求。SPSS軟件包含了統(tǒng)計(jì)學(xué)眾多方面的基本內(nèi)容,且擁有非常強(qiáng)的圖標(biāo)生成功能,有較為理想的交互界面,通過錄入的相關(guān)數(shù)據(jù),就能夠快速得出相應(yīng)的統(tǒng)計(jì)結(jié)果。

      2.4 GBase數(shù)據(jù)庫介紹

      GBase 是南大通用數(shù)據(jù)技術(shù)有限公司研發(fā)的自主品牌的數(shù)據(jù)庫,目前在國內(nèi)具有較高的品牌知名度,符合國家自出創(chuàng)新戰(zhàn)略要求,是國內(nèi)第一事務(wù)處理性能的數(shù)據(jù)庫。GBase 8a 已經(jīng)廣泛運(yùn)用聯(lián)通、移動、電信多個(gè)省的經(jīng)營分析、大數(shù)據(jù)平臺等關(guān)鍵業(yè)務(wù)系統(tǒng)[6]。

      3 建模過程及結(jié)果分析

      3.1 數(shù)據(jù)預(yù)處理

      通過通話詳單與短信詳單作為數(shù)據(jù)基礎(chǔ)進(jìn)行分析,取近三個(gè)月的通話詳單及短信詳單。選取某市運(yùn)營商移網(wǎng)用戶短信和通話記錄詳單,此次數(shù)據(jù)分析以201809、201810、201811三個(gè)月的通話詳單(BSS&CBSS話單)、短信詳單(BSS&CBSS短信)為模型輸入條件,共計(jì)27.8億條。

      通過通話詳單與短信詳單中有需要清理的干擾數(shù)據(jù),sp服務(wù)號碼,個(gè)人及企業(yè)廣告推銷號碼等都需要剔除,否則將影響結(jié)果的正確性。

      在GBase數(shù)據(jù)庫中借助 SQL 語句對原數(shù)據(jù)集進(jìn)行預(yù)處理,主要進(jìn)行了以下步驟:

      (1)服務(wù)和sp廣告推銷號碼剔除:由于這些號碼的開始位數(shù)以及長度有固定的特征,因此可以在GBase數(shù)據(jù)庫中通過長度和key value的查詢將其剔除;

      (2)個(gè)人及企業(yè)廣告推銷號碼過濾:這些號碼的絕大多數(shù)的通話行為是主叫用戶且產(chǎn)生的話務(wù)量異常巨大,與被叫用戶的聯(lián)系只是短期的。此類號碼定義為廣告推銷號碼,它們在形式上與普通客戶號碼沒有區(qū)別,不能通過簡單的數(shù)據(jù)庫條件過濾獲得,所以只能通過號碼的通話特征進(jìn)行甄別過濾。

      3.2 穩(wěn)定交往模型構(gòu)建

      (1)建模方法

      用戶之間的交往越復(fù)雜,隨機(jī)性越強(qiáng)。在電信運(yùn)營商可以獲得的數(shù)據(jù)中,主要是能夠反映用戶親密度的信息發(fā)生的聯(lián)系數(shù)量、聯(lián)系發(fā)生的時(shí)間間隔、聯(lián)系發(fā)生的時(shí)間段以及聯(lián)系發(fā)生的時(shí)間。

      顯然,擁有更多聯(lián)系的用戶之間存在更大的親密關(guān)系。隨著數(shù)量的增長,聯(lián)系的親密度在增加。線性函數(shù)可以大致地刻畫出數(shù)量對親密度的影響程度。

      分析交往圈的交往痕跡,淡化交往形式,以交往軌跡的均勻性確定交往圈的穩(wěn)定性,重點(diǎn)獲取過去三個(gè)月的穩(wěn)定交往圈作為話務(wù)分析的重點(diǎn)交往圈。建立模型:

      (2)計(jì)算月、旬、周、三天、日交往系數(shù)

      用戶的交往系數(shù),也就是用戶間聯(lián)系的可能性,根據(jù)用戶近三個(gè)月歷史通話、短信詳單,抽取3000W用戶詳單數(shù)據(jù)作為訓(xùn)練樣本,取最后一天聯(lián)系結(jié)果,通過SPSS軟件,根據(jù)普通最小二乘法的參數(shù)估計(jì)方法,計(jì)算出模型中的系數(shù),根據(jù)系數(shù)即各窗口的比重,將系數(shù)依據(jù)經(jīng)驗(yàn)修正,得到交往系數(shù)為a=0.4、b=0.32、c=0.16、d=0.08、e=0.04。

      3.3 計(jì)算穩(wěn)定交往指數(shù)

      利用SPSS軟件,根據(jù)穩(wěn)定交往模型計(jì)算穩(wěn)定交往值。輸出穩(wěn)定交往圈清單,如表1。

      3.4 結(jié)果分析

      由實(shí)驗(yàn)結(jié)果得出用戶間的穩(wěn)定交往指數(shù)。為便于量化穩(wěn)定交往指數(shù),用戶交往指數(shù)最高值為10。提高了算法的執(zhí)行效率,為用戶交往圈的快速建立有一定指導(dǎo)意義,尤其是對于10億量級的數(shù)據(jù)。

      基于用戶間穩(wěn)定交往指數(shù)的計(jì)算結(jié)果,將單個(gè)用戶的穩(wěn)定交往指數(shù)結(jié)果求和,計(jì)算得出單個(gè)用戶交往圈的大小,值無上限,值越高代表用戶交往圈越穩(wěn)固廣泛。用戶的交互圈的價(jià)值與用戶的ARPU值(每個(gè)用戶平均貢獻(xiàn)的電信服務(wù)收入的價(jià)值)正相關(guān)。

      4 結(jié)論

      基于多元線性回歸分析原理,應(yīng)用統(tǒng)計(jì)軟件SPSS對電信運(yùn)營商的通話及短信詳單進(jìn)行統(tǒng)計(jì)分析,建立數(shù)學(xué)模型,得出用戶間穩(wěn)定交往指數(shù)。結(jié)果表明,用戶交互圈與ARPU值之間存在正相關(guān)關(guān)系。

      綜上所述,隨著移動通信技術(shù)的發(fā)展,運(yùn)營商擴(kuò)展數(shù)據(jù)挖掘的應(yīng)用,從數(shù)據(jù)挖掘入手,結(jié)合自身發(fā)展實(shí)際,利用數(shù)據(jù)挖掘技術(shù)進(jìn)行科學(xué)的統(tǒng)計(jì)分析,為企業(yè)發(fā)展和決策提供科學(xué)的數(shù)據(jù)參考,促進(jìn)企業(yè)自我發(fā)展目標(biāo)的科學(xué)實(shí)現(xiàn)。

      參考文獻(xiàn):

      [1] 張晴,高廣銀,賈波.數(shù)據(jù)挖掘技術(shù)在超市營銷系統(tǒng)中的應(yīng)用[J].軟件工程,2016,19(05):35-38.

      [2] 張慧,徐勇.數(shù)據(jù)挖掘中SVM模型與貝葉斯模型的比較分析——基于電信客戶的流失分析[J].平頂山學(xué)報(bào),2016,31(2):68-73.

      [3] 郭存芝,杜延軍,李春吉.計(jì)量經(jīng)濟(jì)學(xué)—理論.方法.Eviews 應(yīng)用[M].科學(xué)出版社,2008.

      [4] 冷建飛,高旭,朱嘉平.多元線性回歸統(tǒng)計(jì)預(yù)測模型的應(yīng)用[J].統(tǒng)計(jì)與決策,2016(07):82-85.

      [5] 鄒樂強(qiáng).最小二乘法原理及其簡單應(yīng)用[J].科技信息,2010(23):282-283.

      [6] 王明斌,尹紹宏.淺析從Sybase移植到GBase 8a國產(chǎn)數(shù)據(jù)庫方法[J].科技展望,2016,26(22):17.

      【通聯(lián)編輯:代影】

      猜你喜歡
      多元線性回歸預(yù)測模型
      基于組合模型的卷煙市場需求預(yù)測研究
      基于多元線性回歸分析的冬季鳥類生境選擇研究
      基于神經(jīng)網(wǎng)絡(luò)的北京市房價(jià)預(yù)測研究
      商情(2016年43期)2016-12-23 14:23:13
      我國上市商業(yè)銀行信貸資產(chǎn)證券化效應(yīng)實(shí)證研究
      中國石化J分公司油氣開發(fā)投資分析與預(yù)測模型研究
      云學(xué)習(xí)平臺大學(xué)生學(xué)業(yè)成績預(yù)測與干預(yù)研究
      基于IOWHA法的物流需求組合改善與預(yù)測模型構(gòu)建
      基于預(yù)測模型加擾動控制的最大功率點(diǎn)跟蹤研究
      科技視界(2016年1期)2016-03-30 13:37:45
      九江县| 新闻| 都匀市| 贵德县| 嘉鱼县| 崇明县| 平舆县| 新干县| 余姚市| 荣成市| 西乌珠穆沁旗| 宁化县| 汪清县| 遂溪县| 疏附县| 铜梁县| 梓潼县| 化隆| 大安市| 河间市| 淅川县| 张家界市| 丰台区| 永年县| 文山县| 赫章县| 西安市| 沅陵县| 邢台市| 商城县| 江达县| 凤翔县| 福贡县| 乐业县| 景洪市| 通化县| 南平市| 井陉县| 林周县| 大姚县| 兖州市|