• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于改進(jìn)XGBoost的5G潛客智能識別模型

      2025-02-08 00:00:00柴樺范馨月
      現(xiàn)代電子技術(shù) 2025年3期
      關(guān)鍵詞:套餐運(yùn)營商網(wǎng)格

      摘" 要: 隨著5G基礎(chǔ)設(shè)施的逐步完善及中國廣電作為第四大運(yùn)營商的進(jìn)場,四大運(yùn)營商之間的競爭越來越激烈,對于5G潛在用戶的精準(zhǔn)識別問題成為了四大運(yùn)營商的公共問題。文中從某地市運(yùn)營商的實(shí)際數(shù)據(jù)出發(fā),采用網(wǎng)格搜索方法對XGBoost模型的超參數(shù)進(jìn)行優(yōu)化改進(jìn),建立了5G潛客智能識別模型,并與邏輯回歸、KNN、決策樹、隨機(jī)森林、LightGBM、XGBoost等主流模型進(jìn)行了對比實(shí)驗(yàn)。結(jié)果顯示了改進(jìn)的XGBoost模型的優(yōu)越性,利用SHAP可解釋性模型對特征重要性進(jìn)行排名。研究結(jié)果可對營銷工作效率、運(yùn)營商的5G市場競爭力的提升提供理論依據(jù)。

      關(guān)鍵詞: 5G; 潛在用戶; XGBoost; 隨機(jī)森林; 網(wǎng)格搜索; 特征重要性; SHAP; 營銷策略

      中圖分類號: TN919?34" " " " " " " " " " " " " "文獻(xiàn)標(biāo)識碼: A" " " " " " " " " " " " 文章編號: 1004?373X(2025)03?0167?07

      5G potential customer intelligent identification model based on improved XGBoost

      CHAI Hua, FAN Xinyue

      (Department of Mathematics, School of Mathematics and Statistics, Guizhou University, Guiyang 550025, China)

      Abstract: With the gradual improvement of 5G infrastructure and the entry of China Radio and Television as the fourth largest operator, the competition among the four major operators is becoming increasingly fierce, and the precise identification of potential 5G users has become a public issue for the four major operators. In this paper, the grid search method is used to optimize and improve the hyperparameters of the XGBoost model, and establish a 5G potential customer intelligent identification model on the basis of the actual data of the operators of a certain city. And then, comparative experiments with mainstream models such as logistic regression model, KNN model, decision tree model, random forest model, LightGBM model and XGBoost model are conducted. The results demonstrate the superiority of the improved XGBoost model. The SHAP (Shapley additive explanations) interpretability model is utilized to rank feature importance. The research results of this article can provide theoretical basis for improving marketing efficiency and the 5G market competitiveness of operators.

      Keywords: 5G; potential user; XGBoost; random forest; grid search; feature importance; SHAP; marketing strategy

      0" 引" 言

      智慧城市是建設(shè)數(shù)字中國、智慧社會的核心載體,智慧城市建設(shè)是未來中國城市發(fā)展的必然趨勢,是推動城市治理體系和治理能力現(xiàn)代化的必由之路。我國5G網(wǎng)絡(luò)的商用化進(jìn)程仍然受限于5G網(wǎng)絡(luò)規(guī)模小而發(fā)展緩慢,從而影響智慧城市的構(gòu)建。2024年1月22日,中國聯(lián)通公布了2023年12月份運(yùn)營數(shù)據(jù)。至此,三大運(yùn)營商2023全年的運(yùn)營數(shù)據(jù)均已披露。5G套餐用戶方面,中國移動5G套餐客戶數(shù)累計達(dá)到7.945 03億戶,2023年全年凈增1.8億戶,用戶滲透率率先突破80%;中國電信5G套餐客戶數(shù)累計達(dá)到3.186 6億戶,2023年全年凈增5 070萬戶,用戶滲透率約為78.1%;中國聯(lián)通5G套餐客戶數(shù)累計達(dá)到2.596 38億戶,2023年全年凈增4 691.3萬戶。消費(fèi)不斷增長,5G應(yīng)用向縱深推進(jìn)。5G用戶持續(xù)增長,折射出我國數(shù)字經(jīng)濟(jì)蓬勃向上的發(fā)展活力,數(shù)字產(chǎn)業(yè)規(guī)模穩(wěn)步增長,數(shù)字技術(shù)和實(shí)體經(jīng)濟(jì)融合深入推進(jìn),數(shù)字企業(yè)創(chuàng)新發(fā)展動能不斷增強(qiáng),各行各業(yè)積極擁抱數(shù)字經(jīng)濟(jì)發(fā)展新機(jī)遇,高質(zhì)量發(fā)展有望再上新臺階。文獻(xiàn)[1]基于O域信令數(shù)據(jù)、B域用戶基礎(chǔ)數(shù)據(jù)、MR位置數(shù)據(jù)等進(jìn)行大數(shù)據(jù)分析,預(yù)測全網(wǎng)5G終端非5G套餐用戶中高概率更換為5G套餐的用戶清單。文獻(xiàn)[2]利用隨機(jī)森林算法提升潛在5G用戶的識別率算法,從而預(yù)測用戶未來是否有5G訂閱需求。文獻(xiàn)[3]應(yīng)用LightGBM模型對高緯度、大樣本的5G套餐用戶數(shù)據(jù)集進(jìn)行分類識別,將XGBoost、GBDT、LightGBM三種算法進(jìn)行模型對比,得出LightGBM模型較優(yōu)越。文獻(xiàn)[4]基于預(yù)置DPI探針模塊,采集網(wǎng)絡(luò)質(zhì)量、終端質(zhì)量和用戶行為等多維數(shù)據(jù),識別質(zhì)差用戶,分析用戶側(cè)網(wǎng)絡(luò)質(zhì)量,提取用戶上網(wǎng)數(shù)據(jù),識別并挖掘潛在客戶,解決用戶感知問題,為前端營銷提供潛在客戶分析支撐。文獻(xiàn)[5]為了解決數(shù)據(jù)差異,使用SMOTE進(jìn)行數(shù)據(jù)平衡操作;其次由于SMOTE處理未考慮到類間不平衡,使用SOM+凝聚層次聚類算法來解決此類問題;最后將處理完的數(shù)據(jù)集使用深度神經(jīng)網(wǎng)絡(luò)(DNN)進(jìn)行預(yù)測,實(shí)驗(yàn)結(jié)果表示,使用優(yōu)化后的數(shù)據(jù)集的預(yù)測結(jié)果效果更好。使用DNN預(yù)測優(yōu)化后的數(shù)據(jù)集準(zhǔn)確率和[F1]值達(dá)到了88.97%和86.39%,均優(yōu)于其他處理方法。文獻(xiàn)[6]通過對5G資費(fèi)套餐用戶的畫像分析,采用余弦相似度算法結(jié)合用戶特征就近匹配推薦相應(yīng)的5G資費(fèi)套餐,在實(shí)際數(shù)據(jù)中套餐資費(fèi)開通率提升5%。文獻(xiàn)[7]提出以提升5G駐留比為抓手,利用AARRR規(guī)范化模型,對市場用戶遷轉(zhuǎn)、用戶駐留5G行為進(jìn)行引導(dǎo)。同時,借助RNN循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行用戶行為預(yù)測,明確網(wǎng)絡(luò)優(yōu)化方向,以實(shí)現(xiàn)4G用戶向5G用戶快速遷轉(zhuǎn)。文獻(xiàn)[8]基于農(nóng)業(yè)灌溉系統(tǒng)的通用行為規(guī)律,利用數(shù)據(jù)標(biāo)簽與特征關(guān)聯(lián)度構(gòu)建用戶識別模型,采用密度聚類算法和隨機(jī)森林方法構(gòu)建農(nóng)業(yè)灌溉用戶分類模型,實(shí)現(xiàn)了農(nóng)業(yè)灌溉用戶的精準(zhǔn)識別,準(zhǔn)確率達(dá)到90%以上,為優(yōu)化水資源利用效率提供了重要支撐。文獻(xiàn)[9]構(gòu)建了醫(yī)藥供應(yīng)鏈金融信用風(fēng)險評估體系,利用梯度提升決策樹(GBDT)模型對醫(yī)藥中小企業(yè)信用風(fēng)險進(jìn)行評估,在與其他模型對比中證實(shí)了其在供應(yīng)鏈金融領(lǐng)域的優(yōu)越性和有效性。文獻(xiàn)[10]提出了一種基于行為的用戶異常檢測方案,通過機(jī)器學(xué)習(xí)算法在邊緣計算架構(gòu)中對用戶行為進(jìn)行建模和分類識別,有效提高了邊緣網(wǎng)絡(luò)的安全性,并在實(shí)驗(yàn)中展現(xiàn)了較高的分類準(zhǔn)確率和低誤報率。文獻(xiàn)[11]利用XGBoost算法與隨機(jī)森林算法構(gòu)建了電信客戶流失模型,XGBoost模型對電信流失客戶的識別準(zhǔn)確率優(yōu)于隨機(jī)森林模型。文獻(xiàn)[12]構(gòu)建了XGBoost、ADaBoost、邏輯回歸、隨機(jī)森林4個模型對電信流失用戶進(jìn)行預(yù)測識別,XGBoost模型優(yōu)于其他模型。文獻(xiàn)[13]提出我國智慧城市建設(shè)已進(jìn)入全面提升新階段,更加重視統(tǒng)籌協(xié)調(diào)與集約建設(shè),著重以組織扁平化、數(shù)據(jù)共享化、業(yè)務(wù)協(xié)同化為切入點(diǎn),進(jìn)行一體化推進(jìn)。文獻(xiàn)[14]提出要加強(qiáng)5G行業(yè)標(biāo)桿案例的宣傳和推廣,增強(qiáng)廣大用戶更大范圍地應(yīng)用5G等數(shù)字技術(shù)加快數(shù)字化轉(zhuǎn)型的動力。5G套餐用戶數(shù)的快速增長以及覆蓋面的提升,充分彰顯出我國5G建設(shè)工作的積極成果。隨著5G網(wǎng)絡(luò)正式在中國商用,大量的5G終端涌進(jìn)市場,5G終端占有量日益增長,但其中相當(dāng)一部分5G終端仍然使用的是非5G套餐,精準(zhǔn)預(yù)測5G套餐潛在用戶對5G業(yè)務(wù)發(fā)展具有重要意義。

      基于此,本文根據(jù)某地市運(yùn)營商實(shí)際用戶數(shù)據(jù),利用改進(jìn)的XGBoost模型進(jìn)行5G潛在用戶的識別,并結(jié)合SHAP(SHapley Additive exPlanations)可解釋模型進(jìn)一步解釋特征重要性,針對不同用戶提出建議,提高運(yùn)營商的市場競爭力,模型效果均優(yōu)于其他經(jīng)典算法。預(yù)計2024年5G套餐用戶滲透率將進(jìn)一步提升,5G應(yīng)用的亮點(diǎn)可能會集中在B端市場,隨著5G網(wǎng)絡(luò)建設(shè)的完善,5G用戶規(guī)模將進(jìn)一步擴(kuò)大,各大運(yùn)營商之間也會制定多種套餐和策略,搶抓新用戶,維系老用戶,進(jìn)一步鞏固用戶市場。

      1" 相關(guān)模型

      1.1" XGBoost模型

      XGBoost模型屬于Boosting算法中的一種集成模型,它的主要思想是將多個分類器組合成一個,是對梯度提升算法的改進(jìn),求解損失函數(shù)極值時使用了牛頓法,將損失函數(shù)泰勒展開到二階,另外損失函數(shù)中加入了正則化項。訓(xùn)練時的目標(biāo)函數(shù)由兩部分構(gòu)成,第一部分為梯度提升算法損失,第二部分為正則化項。目標(biāo)函數(shù)如式(1)所示:

      [Obj(t)=i=1nlyi,y(t-1)+ft(xi)+Ω(ft)+C] (1)

      式中:[t]為決策樹的數(shù)量;[y(t-1)]表示保留前面[t]-1輪的模型預(yù)測;[ft(xi)]為一個新的函數(shù);[C]為常數(shù)項。將目標(biāo)函數(shù)進(jìn)行泰勒展開,針對原來的目標(biāo)函數(shù),定義兩個變量如式(2)所示:

      [gi=?y(t-1)l(yi,y(t-1))hi=?2y(t-1)l(yi,y(t-1))] (2)

      目標(biāo)函數(shù)可以改寫為:

      [Obj(t)≈i=1nlyi,y(t-1)+gift(xi)+12hif2t(xi)+Ω(ft)+C] (3)

      模型訓(xùn)練時,目標(biāo)函數(shù)可以用公式(4)表示:

      [Obj(t)=j=1ti∈Ijgiωj+12i∈Ijhi+λω2j+γT] (4)

      定義:

      [Gj=i∈Ijgi," " Hj=i∈Ijhj] (5)

      將式(5)代入式(4)中,得到:

      [Obj(t)=j=1tGjωj+12(Hj+λ)ω2j+γT=-12j=1tG2jHj+λ+γT] (6)

      XGBoost算法在多個方面進(jìn)行優(yōu)化增強(qiáng):一是將損失函數(shù)進(jìn)行二階泰勒展開;二是在目標(biāo)函數(shù)中加入了正則化項;三是采取了Shrinkage and Column Subsampling,Subsampling方法對之前的每一棵樹進(jìn)行了收縮使得后面的樹有更多的優(yōu)化空間,Column Subsampling方法選取部分特征進(jìn)行建樹;四是增加了對缺失值的處理和在迭代過程中內(nèi)部使用交叉驗(yàn)證方法。近年來,XGBoost算法因其優(yōu)越的性能在機(jī)器學(xué)習(xí)領(lǐng)域得到了廣泛應(yīng)用。

      1.2" 改進(jìn)的XGBoost模型

      在機(jī)器學(xué)習(xí)中,模型的性能往往受到其超參數(shù)設(shè)置的影響。不同于模型參數(shù),超參數(shù)不是在訓(xùn)練過程中學(xué)習(xí)得到的,而需要事先設(shè)定。網(wǎng)格搜索通過嘗試參數(shù)網(wǎng)格中的所有可能組合來找到最佳的超參數(shù)設(shè)置,以此提高模型的性能。

      改進(jìn)的XGBoost模型在網(wǎng)格搜索算法的步驟如下:首先,定義一個或多個超參數(shù)的網(wǎng)格,這個網(wǎng)格是一個字典,其中鍵是參數(shù)的名稱,值是嘗試的參數(shù)值的列表;然后,選擇一個機(jī)器學(xué)習(xí)模型來應(yīng)用這些超參數(shù);接下來,選擇一個或多個評分標(biāo)準(zhǔn),用于評估模型的性能,常見的評分標(biāo)準(zhǔn)包括準(zhǔn)確率、召回率、精確率和[F1]分?jǐn)?shù)等。網(wǎng)格搜索可以表示為:

      [params*=arg maxparamsscoremodel(params),X,y] (7)

      式中:params*是使得評分最高的參數(shù)組合;params是待調(diào)優(yōu)的參數(shù)組合;score是評分函數(shù),用于評估模型的性能;model(params)是根據(jù)給定參數(shù)構(gòu)建的模型;[X]是包含訓(xùn)練樣本的矩陣;[y]是包含訓(xùn)練樣本目標(biāo)值的向量。為了對模型性能進(jìn)行穩(wěn)健估計,網(wǎng)格搜索通常與交叉驗(yàn)證結(jié)合使用。交叉驗(yàn)證通過將訓(xùn)練集分成較小的子集,然后在這些子集上訓(xùn)練和驗(yàn)證模型,來評估模型在未知數(shù)據(jù)上的表現(xiàn)。這樣做可以減少過擬合的風(fēng)險,并提供對模型性能的更準(zhǔn)確估計,計算公式如式(8)所示:

      [CV=1Kk=1Kscoremodel,traink,valk] (8)

      式中:CV是交叉驗(yàn)證的評分;[K]是交叉驗(yàn)證的折數(shù);model是待評估的機(jī)器學(xué)習(xí)模型;[traink]是第[k]折的訓(xùn)練集;[valk]是第[k]折的驗(yàn)證集;score是評分函數(shù),用于評估模型驗(yàn)證集上的性能。

      通過遍歷參數(shù)網(wǎng)格中的所有可能組合,對于每一組參數(shù),使用交叉驗(yàn)證來評估模型的性能。最后,在嘗試了所有參數(shù)組合后,選擇表現(xiàn)最好的參數(shù)組合作為最佳參數(shù)。“最好”的標(biāo)準(zhǔn)是基于選擇的評分標(biāo)準(zhǔn)來決定的,本文選擇在交叉驗(yàn)證中準(zhǔn)確率最高的模型作為最佳模型。改進(jìn)XGBoost模型流程圖如圖1所示。

      2" 實(shí)驗(yàn)分析及結(jié)果

      2.1" 數(shù)據(jù)來源

      本文所用數(shù)據(jù)為某地市運(yùn)營商的客戶數(shù)據(jù),該數(shù)據(jù)集包括297 228條客戶數(shù)據(jù),26個特征。數(shù)據(jù)特征集的字段說明如表1所示。

      其中包含203 506條5G用戶數(shù)據(jù),93 722條非5G用戶數(shù)據(jù)。首先刪除“用戶標(biāo)識”字段,根據(jù)本文需要,將“標(biāo)簽”字段設(shè)為目標(biāo)變量,該字段表明用戶是否為5G用戶。經(jīng)檢查,數(shù)據(jù)中部分字段存在較多缺失值,對于缺失值采用眾數(shù)填補(bǔ)的方法進(jìn)行處理,并確定分類變量,數(shù)值變量,目標(biāo)變量。將是否為5G用戶作為目標(biāo)變量,將其他變量中按取值種類進(jìn)行劃分,取值種類小于10種的變量劃分為分類變量,大于10種的劃分為數(shù)值變量。通過卡方檢驗(yàn)進(jìn)行特征選擇,最終選取了22個特征子集。

      2.2" 數(shù)據(jù)分析

      經(jīng)過數(shù)據(jù)預(yù)處理后,根據(jù)全部特征變量,分析各變量與目標(biāo)變量之間的相關(guān)性,結(jié)果如圖2所示??梢园l(fā)現(xiàn),“三個月出賬均值”“出賬收入”“用戶星級為五星級”“套餐月租”為正相關(guān)的前4名特征,其中3個月出賬均值、出賬收入、套餐月租都屬于消費(fèi)行為信息,由圖2可以看出,消費(fèi)行為信息越高的用戶更容易成為5G用戶,因?yàn)榇祟愑脩粝M(fèi)價值高,對新業(yè)務(wù)的接受程度較高。而用戶星級是運(yùn)營商對客戶評定的等級,星級越高,對運(yùn)營商越重要。由圖2可知,用戶星級為5與成為5G用戶有較強(qiáng)的相關(guān)性,因?yàn)橛脩粜羌壴礁?,通常說明該用戶注冊年限時間長而且資費(fèi)水平高且穩(wěn)定,對運(yùn)營商的信任度更高,對于新業(yè)務(wù)的適應(yīng)和接受程度高于其他用戶。

      根據(jù)隨機(jī)森林算法給出的特征重要性如圖3所示??梢钥闯觥疤撞驮伦狻薄俺鲑~收入”“三個月出賬均值”排名前三的特征重要性,這三個特征變量都屬于用戶消費(fèi)行為信息,可以表明5G套餐的推廣應(yīng)該重點(diǎn)關(guān)注消費(fèi)行為信息高且穩(wěn)定的用戶。

      以用戶的平均5G辦理率68%為參考,觀察圖4的柱狀圖,提升5G辦理率的屬性有:流量連續(xù)三個月沒有超套,語音連續(xù)三個月沒有超套,用戶星級為五星級,用戶是合約用戶,用戶是融合用戶,男性5G辦理率略高于女性。

      由此可以發(fā)現(xiàn),語音和流量在沒有三個月連續(xù)超套用戶下辦理率會提高,說明這部分用戶極有可能對自己的套餐較為滿意,消費(fèi)積極性高,更易辦理業(yè)務(wù)。另外,可以發(fā)現(xiàn)簽約會極大提升5G辦理率,可以合理猜測簽約中可能包含綁定5G套餐用戶。

      2.3" 實(shí)驗(yàn)結(jié)果

      混淆矩陣如表2所示。

      采用準(zhǔn)確率(Accuracy)、AUC值、召回率(Recall)、[F1]分?jǐn)?shù)([F1]?Score)作為模型評價指標(biāo)。

      準(zhǔn)確率,即預(yù)測正確的樣本占總體樣本的比例。

      [Accuracy=TP+TN TP+FP+TN+FN] (9)

      召回率為準(zhǔn)確預(yù)測為5G用戶的樣本數(shù)占所有5G用戶樣本數(shù)的比例。

      [Recall=TN TN+FP] (10)

      [F1]分?jǐn)?shù)是精確率和召回率的調(diào)和平均數(shù),最大為1,最小為0。

      [F1?Score=2×Precision?RecallPrecision+Recall] (11)

      本文在前期數(shù)據(jù)預(yù)處理工作的基礎(chǔ)上,采用改進(jìn)XGBoost算法建立5G潛客識別模型。

      采用網(wǎng)格搜索方法對影響XGBoost模型較大的3個超參數(shù)進(jìn)行最優(yōu)值尋找,網(wǎng)格搜索最優(yōu)參數(shù)結(jié)果如表3所示。圖5為通過網(wǎng)格搜索算法尋找最優(yōu)參數(shù)的可視化結(jié)果。

      同時,與邏輯回歸(Logistic Regression)、最近鄰算法(KNN)、決策樹(Decision Tree)、隨機(jī)森林(Random Forest)、輕量的梯度提升機(jī)(LightGBM)、極度梯度提升樹(XGBoost)進(jìn)行實(shí)驗(yàn)結(jié)果對比。將處理后的數(shù)據(jù)按照8∶2進(jìn)行劃分,其中80%作為訓(xùn)練集,20%作為測試集,模型實(shí)驗(yàn)后各項指標(biāo)結(jié)果如表4所示。

      表4中,其他模型的隨機(jī)種子數(shù)為42,其余參數(shù)均為默認(rèn)參數(shù)。從表中結(jié)果可以看出,改進(jìn)的XGBoost在4項評價指標(biāo)中整體均優(yōu)于其他模型,Accuracy、AUC值、Recall、[F1]?Score值分別為87.73%、85.49%、91.54%、91.08%。圖6~圖8分別為基于改進(jìn)的XGBoost模型的5G潛客智能識別模型實(shí)驗(yàn)結(jié)果的混淆矩陣、AUC曲線以及[P?R]曲線圖。

      2.4" 變量重要性和SHAP貢獻(xiàn)分析

      為了進(jìn)一步探究變量對5G潛客用戶識別的影響,通過變量重要性確定主要驅(qū)動因子并采用SHAP分析了各變量對5G潛客用戶識別的貢獻(xiàn)方向,模型的變量重要性如圖9所示。

      SHAP是一種用于解釋機(jī)器學(xué)習(xí)模型預(yù)測的方法,基于合作博弈論中的Shapley值理論,將每個特征對于模型預(yù)測的貢獻(xiàn)進(jìn)行分解,并提供了對模型預(yù)測的直觀解釋。SHAP的基本思想是將每個特征的值作為一個玩家,預(yù)測結(jié)果作為一個聯(lián)盟,然后計算每個特征值對于預(yù)測結(jié)果的貢獻(xiàn)。具體來說,對于每個樣本,SHAP值表示了每個特征值相對于預(yù)測結(jié)果的貢獻(xiàn)程度,正值表示對預(yù)測結(jié)果的正面影響,負(fù)值表示對預(yù)測結(jié)果的負(fù)面影響。圖10是利用SHAP對各變量正向和負(fù)向重要性的可視化結(jié)果。由圖10可知,套餐月租和出賬收入向右傾斜,表示增加這些特征的值會對模型的預(yù)測結(jié)果產(chǎn)生正向影響,即增加這些特征的值會使模型更傾向于預(yù)測更高的輸出值。流量收入向左傾斜,表示增加該特征的值會對模型的預(yù)測結(jié)果產(chǎn)生負(fù)向影響,即增加流量收入的值會使模型更傾向于預(yù)測更低的輸出值。

      可以發(fā)現(xiàn),套餐月租的大小對于5G潛客識別的影響最大,其次是出賬收入,查閱相關(guān)資料可以發(fā)現(xiàn)5G套餐通常比4G套餐費(fèi)用高,一個用戶套餐月租高的用戶屬于高價值用戶,對于成為5G潛客用戶屬于正向反饋。流量收入和上上月流量超套金額、語音收入等重要性也排在前列,語音收入的費(fèi)用大小也說明了用戶的類別。對比之前隨機(jī)森林算法給出的重要性,可以發(fā)現(xiàn)用戶的消費(fèi)行為信息對于挖掘5G潛客用戶具有較大的影響。針對上述結(jié)果,后續(xù)可以根據(jù)用戶分層展開針對性營銷策略,提高5G用戶轉(zhuǎn)化率。

      3" 結(jié)" 論

      本文基于某地市運(yùn)營商的用戶數(shù)據(jù),經(jīng)過數(shù)據(jù)預(yù)處理后,建立了改進(jìn)XGBoost的5G潛客識別模型,并與邏輯回歸、KNN、決策樹、隨機(jī)森林、LightGBM、XGBoost主流模型進(jìn)行實(shí)驗(yàn)結(jié)果對比,驗(yàn)證了改進(jìn)XGBoost模型的優(yōu)越性。實(shí)現(xiàn)將營銷工作集中在最有可能轉(zhuǎn)化的高價值潛在用戶上,降低5G套餐營銷不精準(zhǔn)的可能性,從而提升運(yùn)營商的5G市場競爭力。最后根據(jù)SHAP可解釋性模型,對本文數(shù)據(jù)集進(jìn)行特征重要性分析,發(fā)現(xiàn)套餐月租、出賬收入、流量收入為特征重要性中排名前三的特征。這與實(shí)際業(yè)務(wù)需求相符合,運(yùn)營商相關(guān)部門可以針對不同消費(fèi)人群進(jìn)行用戶畫像,制定合理準(zhǔn)確的營銷策略,制定相應(yīng)的5G套餐產(chǎn)品。但數(shù)據(jù)特征也存在時效性,后續(xù)研究可以考慮結(jié)合時間序列相關(guān)模型進(jìn)行更為精準(zhǔn)的潛客識別。對于潛在用戶的識別根據(jù)數(shù)據(jù)集的格式可以采取更多前沿的技術(shù)方法,通過自然語言處理技術(shù)和推薦算法可以進(jìn)一步細(xì)化用戶類型,提高各類用戶對運(yùn)營商的滿意度。

      注:本文通訊作者為范馨月。

      參考文獻(xiàn)

      [1] 董瑩瑩,葛陽,李坤樹,等.人工智能算法在5G套餐潛在用戶識別中的應(yīng)用[J].江蘇通信,2021,37(6):105?109.

      [2] 張明超.基于隨機(jī)森林的潛在5G用戶預(yù)測分析[J].電子技術(shù),2023,52(10):34?35.

      [3] 力小勇.基于LightGBM算法的5G套餐的潛客識別[J].信息技術(shù)與信息化,2022(1):4?7.

      [4] 徐洋,孫長秋,杜長斌.基于DPI探針技術(shù)識別家庭潛在客戶[J].通信管理與技術(shù),2022(3):29?32.

      [5] 朱軍,烏偉,謝虹銘,等.基于DNN的不平衡5G潛客的識別研究[J].電腦編程技巧與維護(hù),2023(6):116?118.

      [6] 魏國華,郭翔宇,康志強(qiáng).基于大數(shù)據(jù)能力的5G資費(fèi)潛在客戶挖掘方法[J].長江信息通信,2021,34(6):229?232.

      [7] 畢君平.5G用戶遷轉(zhuǎn)方案的協(xié)同研究[J].山東通信技術(shù),2021,41(4):16?18.

      [8] 張晶,馮波,康之增,等.基于海量用電數(shù)據(jù)的農(nóng)業(yè)灌溉用戶識別方法[J].河北電力技術(shù),2023,42(5):90?94.

      [9] 劉平山,曾梓銘.基于GBDT的醫(yī)藥供應(yīng)鏈金融信用風(fēng)險評價[J].會計之友,2021(16):24?31.

      [10] 張偉成,衛(wèi)紅權(quán),劉樹新,等.面向5G MEC基于行為的用戶異常檢測方案[J].計算機(jī)工程,2022,48(5):27?34.

      [11] CHEN H, TANG Q, WEI Y F, et al. Churn prediction model of telecom users based on XGBoost [J]. Journal on artificial intelligence, 2021, 3(3): 115?121.

      [12] JIAO G E, XU H. Analysis and comparison of forecasting algorithms for telecom customer churn [J]. Journal of physics: Conference series, 2021, 1881(3): 032061.

      [13] 趙艷軻.智慧城市發(fā)展八大趨勢[J].軟件和集成電路,2022(z1):24?25.

      [14] 胡世良.5G邁向更高質(zhì)量發(fā)展新階段[J].中國電信業(yè),2023(6):12?15.

      猜你喜歡
      套餐運(yùn)營商網(wǎng)格
      用全等三角形破解網(wǎng)格題
      《加什么不要錢》
      反射的橢圓隨機(jī)偏微分方程的網(wǎng)格逼近
      兒童套餐
      幽默大師(2019年6期)2019-06-06 08:41:42
      重疊網(wǎng)格裝配中的一種改進(jìn)ADT搜索方法
      基于曲面展開的自由曲面網(wǎng)格劃分
      取消“漫游費(fèi)”只能等運(yùn)營商“良心發(fā)現(xiàn)”?
      婚姻是一份套餐
      海峽姐妹(2016年4期)2016-02-27 15:18:28
      老了也要有尊嚴(yán)地吃飯 你家老人需要這套餐具嗎
      第一章 在腐敗火上烤的三大運(yùn)營商
      IT時代周刊(2015年9期)2015-11-11 05:51:43
      萍乡市| 永清县| 三台县| 张家界市| 贵定县| 多伦县| 潍坊市| 南阳市| 佛教| 澄江县| 平谷区| 阿拉善盟| 剑川县| 两当县| 西乌珠穆沁旗| 叙永县| 大同县| 娱乐| 青海省| 汉阴县| 内丘县| 石棉县| 清远市| 南昌市| 云南省| 金乡县| 同江市| 吴江市| 韩城市| 尖扎县| 滨州市| 揭东县| 广州市| 霍林郭勒市| 汪清县| 浪卡子县| 田东县| 广州市| 勐海县| 盐城市| 曲周县|