• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于聚類方法的航空公司客戶價值分析

      2023-07-14 16:46:21許超
      計算機應用文摘 2023年12期
      關鍵詞:航空公司

      摘要:隨著社會的發(fā)展,互聯(lián)網(wǎng)技術融入各個行業(yè),目前很多公司和企業(yè)的營銷重點不僅是保證產(chǎn)品質量,還更加注重以客戶為中心,以滿足客戶的需求,將客戶作為公司實現(xiàn)利潤增長的重要目標。文章主要根據(jù)客戶細分的方法,利用K-Mcans聚類、DBSCAN聚類、Mcan-Shift聚類分別對客戶進行細分。

      關鍵詞:航空公司;客戶價值分析;K-Mcans聚類

      中圖法分類號:TP311 文獻標識碼:A

      首先,K?Means 聚類將航空公司客戶分為5 類,達到了細分的效果,并且更好地保留了航空公司的客戶,增加了客戶的滿意度,在采取方案時更有針對性,有利于航空公司的未來發(fā)展。其次,DBSCAN 聚類將航空公司客戶分為2 類,即重要客戶和不重要客戶,沒有盡可能地保留客戶,對能夠發(fā)展成重要客戶的沒有進行細分,未達到細分的效果,所以此方法不是最適合的。最后,Mean?Shift 聚類將航空公司客戶分為9類,達到了細分的效果,但是在采取對應策略時會出現(xiàn)重復,所以也不是最好的方法。綜上,K?Means 聚類能夠高效地細分航空公司客戶,對客戶進行分類之后,能夠更有針對性地采取服務,為航空公司提高客戶滿意度,從而吸引更多的客戶,最終給航空公司帶來較大的利益。

      1 數(shù)據(jù)與方法

      1.1 數(shù)據(jù)預處理

      航空公司客戶信息數(shù)據(jù)包括航空公司客戶的姓名、性別、年齡、會員卡號、入會時間、第一次飛行時間、會員卡級別、工作地城市、工作地所在省份、工作地所在國家等,以及客戶的飛行里程數(shù)、航班數(shù)、購買機票金額等,共計61 340 條。由于數(shù)據(jù)殘缺不全,因此不能直接進行數(shù)據(jù)挖掘,數(shù)據(jù)預處理技術則是提高數(shù)據(jù)質量的重要手段。

      所謂數(shù)據(jù)清洗,是指將源數(shù)據(jù)中的“臟”數(shù)據(jù)清洗掉,即清洗掉每一列數(shù)據(jù)中的缺失值或異常值,為之后數(shù)據(jù)的讀取作鋪墊。觀察數(shù)據(jù)可以發(fā)現(xiàn),原始數(shù)據(jù)中有以下幾類數(shù)據(jù):票價為空值、票價為0、年齡大于100、平均折扣率為0、總里程數(shù)為0。由于航空客戶數(shù)據(jù)量大且原始數(shù)據(jù)占比小,因此將其丟棄,達到數(shù)據(jù)清洗的目的。另外,數(shù)據(jù)變換的方式為屬性構造和數(shù)據(jù)標準化。

      通過觀察數(shù)據(jù)可知,航空公司數(shù)據(jù)的每一列數(shù)值差距過大,為1~1 000,會導致偏移,因此通過數(shù)據(jù)標準化將數(shù)據(jù)放縮到[0,1]區(qū)間;屬性構造就是將原有的屬性和新添加的屬性合并,源數(shù)據(jù)中屬性較多,所以選擇與LFRMC 指標相關的5 個屬性,由于原始資料無法直接反映5 個LFRMC 指標,因此要從原始資料中抽?。?個指標。其中,L=LOAD_TIME?FFP_DATE(客戶注冊時間);R=LAST_TO_END(上一個航班時刻);F=FIGHT_COUNT(總的航班數(shù));W=WEIGHTED_SEG_KM(總里程數(shù));M=SUM_YR_1+SUM_YR_2(購買機票總金額),最后達到數(shù)據(jù)變換的目的。

      1.2 聚類模型原理

      聚類分析是指將數(shù)據(jù)按特定的特性進行歸類,即將數(shù)據(jù)接近的分為一組[1] 。由于不同的人群有差異,因此,聚類分析無法用于預測,僅限于對知識的挖掘。

      本節(jié)對K?Means 聚類的基本原理進行了描述,同時對DBSCAN 聚類、Mean?Shift 聚類的基本原理進行了闡述,為后期對客戶價值進行分析作鋪墊。

      1.2.1 K?Means 聚類原理

      對事物進行歸類、歸納和揭示客觀規(guī)律是人們認識與改造世界的常用方法。聚類分析將各種屬性進行區(qū)分,從而使聚類分析能夠較好地處理不能識別的對象。聚類算法的種類繁多,其中最常用的是K?Means 算法。K?Means 算法是一種高效的、能夠有效地處理海量數(shù)據(jù)的方法。實際上,K?Means 算法常常被用來對企業(yè)的客戶進行價值分析。

      K?Means 算法的具體實現(xiàn)步驟如下:首先任選K個樣本點作為初始數(shù)組中心;其次重復迭代;再次根據(jù)樣本點的平均值,重新賦予每個樣本點最近的值;最后更新計算平均值,直到聚類中心不再發(fā)生改變,停止迭代。

      1.2.2 DBSCAN 聚類原理

      DBSCAN 密度聚類是將具有足夠密度的區(qū)域劃分成簇,并且能夠發(fā)現(xiàn)任意形狀的簇。比如,在眾多點中隨機選中1 個點,將該點看作中心點,并以規(guī)定的半徑畫1 個圓,圓內最少包含的樣本點叫做閾值。

      若在指定半徑內有足夠多的樣本點,則圓的圓心轉移到內部樣本點。待圓發(fā)現(xiàn)所圈樣本點數(shù)量少于預先指定的值時,則停止。K?Means 聚類算法只能處理球形的簇,即一個聚成實心的團,具有一定的局限性。

      但在現(xiàn)實中還會出現(xiàn)各種各樣的情況,此時就會用到DBSCAN 密度聚類。

      1.2.3 Mean?Shift 聚類原理

      Mean?Shift 聚類是由均值和偏移組成的[2] ,即有一個點X,周圍有很多點Xi ,計算點X 移動到每個點所需要的偏移量之和,得到平均偏移量。該偏移量包含大小和方向,方向是周圍分布密集的方向。然后點X 往平均偏移量方向移動,再以此為新起點,不斷迭代,直到密度最大處,停止迭代。

      2 基于聚類方法的航空公司客戶分類

      2.1 客戶聚類

      2.1.1 K?Means 聚類

      使用K?Means 聚類算法對客戶數(shù)據(jù)進行客戶分群并將航空公司客戶聚為5 類。如圖1 所示,客戶群1 在所有特征上的值都很小,且在L 處的值最小,說明客戶群1 是新入會員較多;客戶群2 在C 處的值最大,在F,M 處的特征值較小,說明客戶群2 是偏好乘坐高級艙位的客戶群;客戶群3 在F,M 上的值最大,且在特征R 上的值最小,說明客戶群3 頻繁乘機且近期都有乘機記錄;客戶群4 在L 處特征最大,在R 處特征較小,其他特征適中,說明客戶群4 的入會時間較長,飛行頻率也較高,是較有高價值的客戶群;客戶群5 在R 處的值最大,且在L,M,F,C 處的值都相對較小,說明客戶群5 已經(jīng)很久沒乘機。

      2.1.2 DBSCAN 聚類

      使用DBSCAN 聚類對客戶數(shù)據(jù)進行分群,結合清洗后的數(shù)據(jù)以及DBSCAN 聚類,能夠將客戶分為2類[3] 。0 標簽定義為重要客戶,-1 標簽定義為不重要客戶。

      聚類對應標簽為[-1-1-1…-1-1-1];0 標簽的個數(shù)是48 911;-1 標簽的個數(shù)是13 132。

      與K?Means 方法相比,DBSCAN 不需要事先知道要形成的簇類的數(shù)量。并且,與K?Means 方法相比,DBSCAN 可以發(fā)現(xiàn)任意形狀的簇類。但其弊端是如果已知類別數(shù),K?Means 更直接,而DBSCAN 是基于密度的聚類,無法找出中心點。

      2.1.3 Mean?Shift 聚類

      使用Mean?Shift 聚類對客戶數(shù)據(jù)進行分群,結合清洗后的數(shù)據(jù),將客戶分為9 類,分別是重點保持客戶、開發(fā)重點客戶、重點發(fā)展客戶、現(xiàn)有重點客戶、重點挽留客戶、不重點挽留客戶、普通客戶、特殊客戶、低成本客戶。Mean?Shift 算法是基于核密度估計的爬山算法,同樣不需要指定聚類個數(shù),但計算速度較慢。

      2.2 客戶價值分析

      經(jīng)綜合考量,K?Means 聚類將航空公司客戶分為5 大類更為合適。因此,本文定義了5 個層次的客戶類別,即重點保持對象、重點發(fā)展對象、重點挽留對象、普通對象和低成本對象。

      (1)重點保持對象,該客戶群的平均折扣系數(shù)(C)較高(通常是較高的航班艙位),最近一架飛機(R)出發(fā)的時間更短,(F)和(M)的飛行次數(shù)更多,這就是航空公司的寶貴客戶,而且是最適合的客戶。他們?yōu)楹娇展咀龀隽俗畲蟮呢暙I,但是他們的份額卻很少。為了提升客戶的忠誠度和滿意度,使其消費水平最大化,航空公司應該給予他們更多的關注。

      (2)重點發(fā)展對象,他們具有較高的平均減少系數(shù)(C),較短的間隔時間(R),但是較少的航班(F)或總的飛行英里,這些客戶的會員時間(L)有限,是航空公司的潛在客戶。

      (3)重點挽留對象,留住這些具有較高的平均折扣率(C)、航班數(shù)(F)、總里程數(shù)(M)的客戶,他們曾搭乘過但長時間未預訂過的航班時間(R)長。這些客戶的價值有很大的不確定性,因為不同的原因導致不同客戶退出,所以要及時地了解客戶的發(fā)展情況,并與他們保持聯(lián)絡是非常關鍵的。航空公司要根據(jù)客戶近期的消費次數(shù)和使用次數(shù),收集客戶的消費變動情況,制定客戶清單,加強與客戶的聯(lián)絡,采取一定的市場推廣措施,以延長客戶乘坐航班的時間。

      (4)普通對象和低成本對象,這些客戶的航班平均折扣系數(shù)(C)非常低,他們從未乘坐過航班(R)的概率較高,航班數(shù)(F)或總公里數(shù)(M)少,黏附時間(L)短。他們是航空公司的普通客戶和低成本客戶,不需要特別制定服務,按照航空公司日常標準提供服務即可。

      3 結束語

      在對航空公司客戶價值進行分析的過程中,客戶注冊時間、上一個航班時刻、總的航班數(shù)、總里程數(shù)、購買機票總金額都是重要的指標。本文通過K?Means聚類、DBSCAN 聚類、Mean?Shift 聚類將航空公司的客戶群體劃分成不同類型。通過對比發(fā)現(xiàn),將航空公司客戶分為5 類效果更好,其中3 類重點對象對航空公司的發(fā)展具有重要價值,所以可以進行會員升級和里程兌換服務,這不僅增加了趣味性還有效地保留了客戶,同時提高了客戶滿意度,從而給航空公司帶來更大的收益。

      聚類分析的應用較為廣泛,但仍存在不足,如并不是每一個案例都適用,需要具體問題具體分析。另外,此次研究使用的指標不足,只考慮了客戶注冊時間、上一個航班時刻、總的航班數(shù)、總里程數(shù)、購買機票總金額,但是艙位等級等因素也有可能影響航空公司客戶的價值。

      參考文獻:

      [1] 陳方芳,傅仰耿.基于聚類算法識別大型百貨商場客戶價值的RFM 模型[J].景德鎮(zhèn)學院學報,2021,36(3):68?72.

      [2] 劉淑英,鄒燕飛,李紅.基于K?Means 算法的航空公司客戶價值分析[J].數(shù)字技術與應用,2021,39(11):10?12.

      [3] 張?zhí)祆?,包丹文,狄智瑋,等.基于K?means 的航空旅客空間行為模式研究[J].華東交通大學學報,2019,36(5):59?66.

      作者簡介:許超(1994—),碩士,助教,研究方向:人工智能技術。

      猜你喜歡
      航空公司
      航空公司的低成本戰(zhàn)略及其實施對策探討
      IATA上調2021年航空公司凈虧損預測
      大飛機(2021年4期)2021-07-19 04:46:34
      中國航空公司新開義烏直飛符拉迪沃斯托克航線
      伙伴(2020年1期)2020-02-14 07:39:50
      FLIGHTRISK
      航空公司應收賬款壓降的途徑和措施
      航空公司客票直銷的現(xiàn)狀與分析
      中國市場(2016年45期)2016-05-17 05:15:40
      航空公司能力系統(tǒng)協(xié)同度測評模型與應用
      航空公司戰(zhàn)略成本管理研究
      航空公司戰(zhàn)略成本管理分析——以南航為例
      柬埔寨籌組新航空公司
      开远市| 南陵县| 册亨县| 永清县| 易门县| 道真| 仪征市| 比如县| 屏边| 疏附县| 唐山市| 阿城市| 荆门市| 邯郸县| 塘沽区| 航空| 西贡区| 错那县| 化隆| 蓬溪县| 老河口市| 郓城县| 珲春市| 南康市| 普格县| 花垣县| 宁安市| 十堰市| 定远县| 五大连池市| 资中县| 方正县| 尉氏县| 潮安县| 新民市| 简阳市| 乾安县| 防城港市| 衢州市| 陈巴尔虎旗| 彭山县|