李超光 劉干 劉博琳
摘要:針對目前投訴量增加,每月上千例投訴,投訴分析工作費時費力的問題,文章研究開發(fā)了基于用戶位置的集中投訴分析可視化報表工具。該研究基于PVthon開發(fā)語言并運用聚類算法,對數(shù)據(jù)進(jìn)行處理,篩選集中投訴位置信息:應(yīng)用PVecharts庫實現(xiàn)集中投訴分析數(shù)據(jù)的地圖可視化、分縣區(qū)、分類型、TOP5投訴熱點大屏效果展示,導(dǎo)出集中投訴問題清單,大大節(jié)約了投訴分析人員的時間,提高工作效率。
關(guān)鍵詞:報表可視化:集中投訴分析:用戶位置分析
中圖分類號:TN929.5
文獻(xiàn)標(biāo)志碼:A
0 引言
在移動網(wǎng)絡(luò)迅猛發(fā)展的當(dāng)下,用戶對4G/5G網(wǎng)絡(luò)的需求急劇增加,由于4G/5G網(wǎng)絡(luò)以及VOLTE網(wǎng)絡(luò)的復(fù)雜性,用戶投訴也有增加趨勢。怎樣實現(xiàn)快速分析用戶投訴并從中提取有價值的數(shù)據(jù)信息,從而定位到用戶問題,快速有效解決用戶問題,改善用戶感知、提升用戶滿意度,成為無線網(wǎng)優(yōu)工程師要考慮的一個現(xiàn)實問題。
1 程序總體設(shè)計思路
鑒于目前日均投訴量多.工作人員進(jìn)行人工投訴分析T作量大,筆者根據(jù)日常投訴記錄表,編寫程序自動分析投訴數(shù)據(jù),從而提取到有價值的數(shù)據(jù)信息和能夠用來給領(lǐng)導(dǎo)匯報和展示的圖表信息。根據(jù)人工對日常投訴分析的特點,結(jié)合日常工作中給領(lǐng)導(dǎo)匯報數(shù)據(jù)的要求,本程序?qū)崿F(xiàn)如下功能:根據(jù)用戶位置分析用戶集中投訴的區(qū)域,了解到用戶的集中需求,有針對性的調(diào)撥資源優(yōu)先處理:用戶位置數(shù)據(jù)的地圖可視化呈現(xiàn),讓數(shù)據(jù)展示更直觀;分縣區(qū)用戶投訴數(shù)據(jù)分析,讓各縣區(qū)能夠了解到自己當(dāng)前問題:投訴分類分析:集中投訴位置的TOP展示:輸出集中投訴問題清單。
為實現(xiàn)以上集中投訴分析的功能,import Tkinter模塊創(chuàng)建程序的圖形用戶界面窗口、下拉菜單、對話框等圖形化組件,通過導(dǎo)入操作就可以打開需要分析的Excel文件。通過鼠標(biāo)點擊菜單欄、按鈕或者彈出對話框的形式來實現(xiàn)人機(jī)互動,從而提升程序使用的交互體驗和程序的易用性,讓投訴分析人員拿到程序就可以使用、不需要花時間去學(xué)習(xí)。
Import numpy和pandas數(shù)據(jù)分析模塊進(jìn)行相關(guān)表格處理和計算。為處理表格、混合數(shù)據(jù)專門設(shè)計的PANDAS非常適合統(tǒng)計投訴分析中的表格結(jié)構(gòu)數(shù)據(jù)。通過對投訴清單數(shù)據(jù)的分析篩選構(gòu)建程序需要的數(shù)據(jù),通過對用戶位置經(jīng)緯度的密度聚類的分析,計算出用戶集中投訴的片區(qū),為數(shù)據(jù)分析提供數(shù)據(jù)支持。
在數(shù)據(jù)處理上P vecharts可謂是為Python的數(shù)據(jù)分析可視化而生。應(yīng)用該庫進(jìn)行集中投訴分析數(shù)據(jù)的可視化處理,可以提供更加直觀的數(shù)據(jù)可視化圖表,能夠高度定制個性化需求報表且有著非常豐富的交互性。在Pvchon中使用該庫可以非常方便地完成程序各種圖表的輸出。其輸出格式有兩種:一種是圖片格式,另一種是Html網(wǎng)頁格式。筆者采用網(wǎng)頁格式,方便圖表的縮放和查看[1]。
筆者通過div+html+P yecharts來實現(xiàn)整個集中投訴可視化大屏效果的展示,輸出集中投訴Excel清單。
程序需要設(shè)置一些容錯機(jī)制,比如使用者沒有導(dǎo)入要分析的Excel表格就進(jìn)行分析操作,則提示請導(dǎo)入表格后再進(jìn)行分析:如果使用者沒有選擇地圖,則提示請從下拉列表選擇地圖后再點擊分析。程序整體架構(gòu)如圖l所示。
2 集中投訴分析可視化方案
2.1 用戶集中投訴位置的數(shù)據(jù)分析
日常投訴中記錄用戶位置信息,對用戶位置信息進(jìn)行分析,找到集中投訴的位置,便于對問題點進(jìn)行跟盯處理。程序采用密度聚類算法計算用戶集中投訴的位置信息。
在進(jìn)行數(shù)據(jù)分析前需要對導(dǎo)入的Excel表進(jìn)行處理,讀取經(jīng)緯度數(shù)據(jù),通過colisc函數(shù)將數(shù)據(jù)轉(zhuǎn)換成列表,再對列表進(jìn)行格式化處理。地球是球形,為了更真實地反映兩點之間的距離,文章采用歐幾里得距離算法計算球面兩點之間的距離。該距離參數(shù)以及從投訴表取到的數(shù)據(jù)被格式化后傳遞給聚類算法進(jìn)行數(shù)據(jù)的處理。
密度聚類又稱“以密度為基礎(chǔ)的聚類”,該算法通過樣本分布的緊密程度來確定聚類結(jié)構(gòu)。密度聚類算法是從樣本密度的方面來考察樣本間的聯(lián)結(jié)性,通過不斷擴(kuò)展其可連結(jié)的聚類簇,得出樣本的聚類結(jié)果。
DBSCAN密度聚類算法是通過一組“鄰域”參數(shù)來描繪樣本分布的緊密程度。其樣本數(shù)據(jù)集中在某特定點的聚類密度是由該點的半徑EPS內(nèi)的點數(shù)估算出來的[2]。具體算法描述如下:
輸入對象是集中投訴位置點數(shù)據(jù)n,聚類鄰域半徑Eps,簇最少點數(shù)MinPts參數(shù);輸出對象是生成符合聚類密度要求的簇的集合[3]。
密度聚類算法最重要的是確定鄰域半徑eps的大小,對每個月投訴數(shù)據(jù)進(jìn)行實際測試,發(fā)現(xiàn)eps=200,也就是聚類鄰域半徑設(shè)置為200 m是比較合適的,最貼近實際。因為投訴人員在記錄投訴位置經(jīng)緯度的時候是有一定的偏差,大概偏差在50 m。如果半徑太小會造成無法聚類,或者聚類的點不全:如果半徑太大會造成聚類過程中將其他的聚類重新聚集,聚類誤差偏大。將簇最少點數(shù)MinPts設(shè)置成兩個,也就是只要有兩個以上的投訴點本研究都認(rèn)為該區(qū)域有重復(fù)投訴或者集中投訴。
本研究引入組號的概念,就是密度聚類分析結(jié)果中的每個簇定義為一個組,給每個組編一個序號,每個組號代表一個集中投訴的區(qū)域,后面的數(shù)據(jù)處理中會引用到這個數(shù)據(jù)。這也是分析結(jié)果中一個非常重要的參數(shù),去重篩選時就以這個組號為依據(jù)進(jìn)行去重數(shù)據(jù)。
密度聚類分析輸出的結(jié)果是字典數(shù)據(jù),為了后面更加便捷地對數(shù)據(jù)進(jìn)行處理,本研究應(yīng)用數(shù)據(jù)集組件DataFrame將字典轉(zhuǎn)換成表格數(shù)據(jù)。
2.2 集中投訴位置地圖可視化呈現(xiàn)
對用戶位置的數(shù)據(jù)分析結(jié)果進(jìn)行地圖呈現(xiàn),能夠更直觀地展現(xiàn)集中投訴的地理分布信息。數(shù)據(jù)的展示要有區(qū)分度,比如投訴位置多的區(qū)域顯示紅色,投訴少的位置顏色相對淺些,能夠突出展示集中投訴位置信息。
Geo組件是Pyecharts庫中用來繪制地理坐標(biāo)系地圖的重要組件,用該組件來實現(xiàn)集中投訴位置的地圖可視化。Geo(width,height)畫出地圖的背景,設(shè)置地圖的基本信息。通過add_coordinate()讀取要在地圖上顯示的集中投訴的位置信息,在這一過程中,最重要的是將通過密度聚類算法得到的經(jīng)緯度信息和集中投訴次數(shù)進(jìn)行格式化處理。套用for循環(huán)將所有點位信息讀取完成。通過geo.a(chǎn)dd()在地圖上加載集中投訴的位置點信息,最后通過geo.render()來生成地圖文件。
地圖類型選擇的是城市地圖,目前只做了河南全省和18個地市的城市地圖列表,通過下拉菜單可以選擇,省公司使用可以選擇河南省地圖,本省其他地市的同事使用,只需要選擇自己的城市名稱就可以使用本工具,簡單方便。暫不含其他省份地市數(shù)據(jù),其他省市使用本工具涉及不同省份的地圖數(shù)據(jù),需要改地圖列表。地圖可實現(xiàn)縮放效果,方便查看具體點位。
對用戶集中投訴位置的地圖呈現(xiàn),可以分析JH{用戶集中投訴區(qū)域,可以很直觀地發(fā)現(xiàn)投訴熱點,如圖2所示。本研究就可以根據(jù)投訴熱點的具體情況,采取相應(yīng)解決措施來提升用戶滿意度。如果集中投訴區(qū)域是網(wǎng)絡(luò)覆蓋不足,那么就可以采取拆閑補盲,傾斜資源進(jìn)行相應(yīng)的補點建設(shè)解決覆蓋問題:如果集中投訴位置是故障引起,那么就可以查找故障的根本原因,制定相應(yīng)的網(wǎng)絡(luò)保障方案,比如更換基站電池保障電力續(xù)航,處理光纜線路隱患保障線路安全;如果是設(shè)備板卡故障則更換備件解決;如果是用戶終端問題則對用戶進(jìn)行詳細(xì)指導(dǎo),避免此類問題再次發(fā)生等。
2.3分縣區(qū)數(shù)據(jù)的玫瑰圖分析呈現(xiàn)
Pie組件可以非常方便地繪制玫瑰圖圖表。為將原始數(shù)據(jù)格式化排序操作,本研究調(diào)用sort_values()函數(shù)來實現(xiàn),排序后的數(shù)據(jù)繪制出玫瑰圖花瓣半徑是遞增的,繪制出的圖表對比效果也更加明顯。
通過opts.InicOpcs()設(shè)置Pie的初始參數(shù),而后.a(chǎn)dd(””,[lisc(z)for z in zip( rose _keys. rose_values)])加載繪制圖表使用的數(shù)據(jù),并設(shè)置rosetype參數(shù)為radius來繪制玫瑰圖。調(diào)用set_series_opt進(jìn)行系列配置,調(diào)用seLglobal_opcs進(jìn)行全局配置,完成包括圖表的ticle、label等信息設(shè)置。對分縣區(qū)數(shù)據(jù)分析,能夠讓各縣區(qū)營業(yè)部直觀看到其區(qū)域內(nèi)集中投訴數(shù)量的多少,玫瑰圖的呈現(xiàn)更具有沖擊力,數(shù)據(jù)對比效果明顯。在數(shù)據(jù)通報中,怎樣讓各縣區(qū)能夠直觀地看到自己當(dāng)前的問題形勢非常重要,俗話說百聞不如一見,即使給相關(guān)人員說再多遍問題的嚴(yán)重性,不如讓他親自看一眼自己的數(shù)據(jù)和問題所在。那么分析分縣區(qū)的數(shù)據(jù)就顯得特別重要,能讓各縣區(qū)看到自己的短板,查漏補缺,有的放矢,需提升網(wǎng)絡(luò)覆蓋、擴(kuò)容及補盲建設(shè),及時修復(fù)故障,改善用戶感知。
2.4 集中投訴位置的TOP呈現(xiàn)
集中投訴位置的TOP5數(shù)據(jù)的呈現(xiàn),采用數(shù)據(jù)列表的方式直接呈現(xiàn)TOP投訴位置數(shù)據(jù),簡單明了.TOP問題的呈現(xiàn)能夠加深閱讀報表者對問題的印象,提醒重點關(guān)注和解決。
在進(jìn)行TOP呈現(xiàn)的過程中,首先對聚類算法輸出的集中投訴數(shù)據(jù)清單運用drop_duplicates函數(shù)進(jìn)行篩選去重;再進(jìn)行排序,取出TOP5清單,并格式化TOP5數(shù)據(jù),使其能夠包含各個集中投訴區(qū)域的重要信息,包括縣區(qū)信息,投訴位置,集中投訴的數(shù)量,將數(shù)據(jù)格式化完成后進(jìn)行輸出。
2.5 集中投訴分類分析
集中投訴分類分析,主要對產(chǎn)生集中投訴的根因進(jìn)行歸類分析,需對集中投訴分類結(jié)果進(jìn)行排序。在P yecharts庫中,bar組件可以實現(xiàn)對集中投訴分類分析結(jié)果進(jìn)行柱狀圖的呈現(xiàn),能夠非常直觀的反應(yīng)集中投訴的原因,包括廣度覆蓋不足、深度覆蓋不足、無室分覆蓋、設(shè)備故障、終端原因等。
2.6 輸出Excel集中投訴清單報表
聚類算法得到的結(jié)果是字典數(shù)據(jù),將字典數(shù)據(jù)通過DataFrame轉(zhuǎn)換成表格數(shù)據(jù),對表格進(jìn)行數(shù)據(jù)格式的整理。為了方便對集中投訴問題的跟蹤處理,輸出Excel報表,包含區(qū)縣,投訴位置,投訴數(shù)量.投訴分類等信息,通過Excel報表能夠查看集中投訴的問題清單,其中[組號]將集中投訴進(jìn)行分組,每一個組代表一個集中投訴的片區(qū)。[TO集中投訴個數(shù)]能夠顯示該片區(qū)集中投訴個數(shù)。
導(dǎo)出集中投訴清單不僅能夠為網(wǎng)絡(luò)建設(shè)提供數(shù)據(jù)支撐,更好地實施精準(zhǔn)投資、精準(zhǔn)建設(shè),把好鋼用在刀刃上;還能夠為故障修復(fù)或者實施考核提供依據(jù),讓考核和提升用戶滿意度工作更有針對性。
3 結(jié)語
用戶投訴能夠客觀反映存在的問題,需要分析產(chǎn)生的深層次原因,制定積極詳盡的方案,推動問題的整改和優(yōu)化,達(dá)到滿意度提升的目的。為踐行“客戶至上、用心服務(wù)的”理念,一方面,要傾聽客戶聲音、反映客觀事實,對存在的問題不避諱、不遮掩;另一方面,要深入剖析問題產(chǎn)生的原因,從管理、流程、支撐等方面提出優(yōu)化建議。聚焦集中投訴熱點,深挖根因,推動網(wǎng)絡(luò)問題閉環(huán),切實改善用戶感知,通過定期對投訴清單進(jìn)行稽核與分析,聚焦無線網(wǎng)絡(luò)熱點投訴區(qū)域。推動集中投訴熱點問題閉環(huán)解決是降壓投訴的重要牽引力。
本程序通過對用戶集中訴分析方法的研究,來提高工作人員對日常投訴分析處理的效率。原來通過mapinfo或谷歌等地圖軟件打點進(jìn)行投訴分析,需要一個熟練的工作人員工作3h以上,才能制作好地圖圖層,分析出集中投訴區(qū)域,形成報表。而使用本工具只需要約5 min就可以完成上述工作,并可以為網(wǎng)絡(luò)建設(shè)、故障修復(fù)、用戶問題解決提供有效的數(shù)據(jù)支撐,大大節(jié)省人力資源,提升用戶滿意度。
參考文獻(xiàn)
[1]曹陽楊.作物種植密度優(yōu)化系統(tǒng)的設(shè)計與實現(xiàn).[D].哈爾濱:東北農(nóng)業(yè)大學(xué),2021:.
[2]劉鳳.K-means算法類簇中心優(yōu)化研究[D].貴陽:貴州大學(xué),2021.
(編輯姚鑫)
[3]李小暢.基于相對密度的聚類算法研究[D].杭州:浙江工業(yè)大學(xué),2011.