• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      大數(shù)據(jù)下基于決策樹算法的企業(yè)客戶關系管理研究

      2022-04-19 14:13:26賴錦柏
      經(jīng)濟研究導刊 2022年9期
      關鍵詞:客戶關系管理數(shù)據(jù)挖掘大數(shù)據(jù)

      賴錦柏

      摘 要:1980年,在阿爾文·托夫勒的著作《第三次浪潮》中作出了如下的預測:未來的世界是被數(shù)據(jù)信息包圍的世界。他將大數(shù)據(jù)形容成“第三次浪潮的華彩樂章”,全新的、將永久改變?nèi)祟愃悸?、生存方式的革新將圍繞數(shù)據(jù)資源展開。正如其所言,時至今日大數(shù)據(jù)的時代已經(jīng)到來,伴隨著大數(shù)據(jù)一起到來的是機器學習、數(shù)據(jù)挖掘和商業(yè)智能在各個領域的運用。同時,大數(shù)據(jù)時代的社會輿情又與傳統(tǒng)的社會輿論有所區(qū)別。在這一背景下,當企業(yè)面臨各類客戶時,如何進行客戶關系管理成了當下的重點研究課題。在數(shù)據(jù)挖掘的各類算法中,決策樹算法是比較優(yōu)秀的一種,通過決策樹算法,能夠幫助企業(yè)更快地定位相關客戶群體,從而進行更優(yōu)決策。

      關鍵詞:大數(shù)據(jù);數(shù)據(jù)挖掘;決策樹算法;客戶關系管理

      中圖分類號:F272? ? ? ? 文獻標志碼:A? ? ? 文章編號:1673-291X(2022)09-0008-03

      一、研究綜述

      (一)大數(shù)據(jù)的定義

      1980年,阿爾文·托夫勒在《第三次浪潮》一書里預測未來的生活是被數(shù)據(jù)信息包圍著的全球,將大數(shù)據(jù)形容成“第三次浪潮的華彩協(xié)奏曲”,人們將緊緊圍繞公共數(shù)據(jù)進行新一輪的技術革命。而隨著大數(shù)據(jù)應用的發(fā)展趨勢,大數(shù)據(jù)的內(nèi)涵又有新的論述。Wiki百科對大數(shù)據(jù)的表述就是指所涉及的數(shù)據(jù)規(guī)模極大到?jīng)]法根據(jù)現(xiàn)階段流行工具軟件,在有效時間內(nèi)采擷、管理方法、解決和梳理有關商業(yè)資訊,進而合理地協(xié)助公司完成運營管理決策提升的總體目標。海外學者Tien James認為大數(shù)據(jù)便是一個專業(yè)名詞,適用于數(shù)據(jù)集,其規(guī)模在現(xiàn)階段除能用專用工具計量檢定的能力以外,對數(shù)據(jù)信息開展搜集、瀏覽、剖析或程序流程運用都可以調(diào)控在有效的時間段內(nèi)。

      (二)大數(shù)據(jù)時代輿論的特征

      隨著大數(shù)據(jù)時代的到來而產(chǎn)生的網(wǎng)絡輿情與傳統(tǒng)的輿情有所不同,但又有著一些相似之處,網(wǎng)絡輿情的形成大致有“沉默的螺旋”“蝴蝶效應”“滾雪球”“群體極化”等幾種傳播學經(jīng)典理論。根據(jù)“沉默螺旋”理論,大多數(shù)人都是受大眾心理的驅(qū)使,盡量避免孤立自己獨特的觀點來面對網(wǎng)絡主流的、即使是未必正確的輿論?!昂钡睦碚搫t是傳統(tǒng)蝴蝶效應的延伸,認為網(wǎng)絡上一些微不足道的輿情都有可能發(fā)展成公眾關注的熱點與焦點。“滾雪球”理論指出,根據(jù)網(wǎng)民的“好奇心”和“關注”,一些問題會從地區(qū)問題轉(zhuǎn)變?yōu)楫a(chǎn)業(yè)問題,甚至向國際問題轉(zhuǎn)變。群體極化理論的觀點是網(wǎng)民在遇到話題時會代入自身的主觀感情從而對問題的看法有所偏頗,而在其他群體成員的認同下,導致了其輿論向極端發(fā)展,進而構成了輿論的非理性,最終影響了整個群體的輿論。

      (三)數(shù)據(jù)挖掘的內(nèi)涵

      數(shù)據(jù)挖掘也叫作資料勘探,其內(nèi)涵是從極其龐雜的數(shù)據(jù)中將埋藏在內(nèi)的具有某些特定關系的相關內(nèi)容進行自動化檢索的進程。數(shù)據(jù)挖掘是以一個全新的角度為立足點,將各種信息技術性開展合理結合,同時結合發(fā)展趨勢而成的能夠?qū)Υ罅康臉I(yè)務流程數(shù)據(jù)信息開展較為系統(tǒng)的剖析和篩選的合理專用工具,主要是協(xié)助企業(yè)從不斷更替并累積起來的數(shù)據(jù)信息中挑選對企業(yè)本身有效的信息,數(shù)據(jù)挖掘?qū)⑵髽I(yè)制定的業(yè)務流程總體目標為根據(jù),對全部商業(yè)服務大環(huán)境中的海量信息開展數(shù)據(jù)分析,從而篩選出對本身有使用價值的數(shù)據(jù)信息,為企業(yè)能夠更好地開展商業(yè)服務、管理決策提出合理的根據(jù)。

      運用數(shù)據(jù)挖掘?qū)A繑?shù)據(jù)信息開展挖掘的分析方法有很多,主要是歸類、多元回歸分析、聚類算法、關聯(lián)規(guī)則、特征分析、轉(zhuǎn)變和誤差值剖析、Web網(wǎng)頁挖掘等,不同的分析方法可以從多角度對數(shù)據(jù)信息開展挖掘,使結果更加精準。

      (四)決策樹算法

      決策樹算法是一種依據(jù)已知的概率,即樣品數(shù)據(jù)具有不同的特性,形成可以用于分析對象的一種算法。數(shù)據(jù)分類算法家族中,決策樹算法都是用于確定決策的經(jīng)典算法。首先,所有數(shù)據(jù)特性都被視為包含所有特性的樹木節(jié)點。統(tǒng)計的如果是一個橫向特性,關于分點數(shù)據(jù)的信息被記錄為純度的基礎,以便將節(jié)點劃分。第二,比較已登記數(shù)據(jù)的特點,確定最佳特點,并找出將數(shù)據(jù)集從樣本中隔開的分界點。最后,決策樹按照這些規(guī)則建立。

      決策樹算法的基本思想是利用屬性選擇度量(ASM)來確保屬性是決策節(jié)點,并將數(shù)據(jù)集分割成更小的子集,使數(shù)據(jù)集被分割成更小的子集,思想是選擇最好的屬性來劃分。通過遞歸,對每一個子集重復這個過程,就滿足了其中一個條件,可以開始構建樹形結構,直到用來劃分數(shù)據(jù)的屬性選擇度量的最佳分割標準集合,它是一種啟發(fā)式算法,也稱為分割規(guī)則。這是因為它有助于確定給定節(jié)點上元組的斷點,其過程如圖1所示。

      用決策樹學習的核心問題之一是特征的區(qū)分。經(jīng)典的三種情況可以得出三種有代表性的決策樹算法。

      同時,決策樹算法可以較好地應對過擬合的風險,可通過“剪枝”來一定程度避免因決策分支過多,以至于把訓練集自身的一些特點當作所有數(shù)據(jù)都具有的一般性質(zhì)而導致的過擬合,進而提高決策樹的泛化能力,而“剪枝”又可以分為先剪枝和后剪枝兩種方案。

      二、模型構建

      (一)指標選擇

      以消費者為對象,對其采用問卷調(diào)查的形式,針對影響消費者對品牌好感度的因素分析,選定的評價指標應力求全面反映消費者對品牌的好感。對品牌評價進行決策樹分析,最終將指標分為:K1,即商品價格;K2,即商品使用壽命;K3,即商品售后;K4,即網(wǎng)絡上該商品的普遍評價;K5,即對該商品的感受。并對10種商品進行商品體驗。其中將K1分為5級:A為0~100元;B為100~300元;C為300~500元;D為500~1 000元;E為1 000元以上;將其他四個評價等級也分為5級,分別為:A為優(yōu)秀(90—100);B為良好(80—90);C為中等(70—80);D為合格(60—70);E為不合格(<60);獲得10種商品評價如表4所示。

      (二)模型構建

      通過表4所示的評價結果,利用ID3算法構成決策樹,部分程序代碼如下:

      Print(Start training)

      Tree=train(train_features,train_labels,list(range(feature_len)))

      Time_3=time.time()

      Print(training cost %f second'%(time_3—time_2))

      Print(Start predicting)

      Tests_predict=predicting(test_features,tree)time_4= time.time()

      Print(predicting cost %f second'%(time_4—time_ 3))

      根據(jù)表4中獲得的質(zhì)量評價結果和建立的決策樹,確定樣本期望信息熵為:

      I(S)=-log2()-log2()-log2()=1.25775996

      對于商品價格K1,存在有Values(K1)=(A,B,C),SA={6,8},|SA|=2,SB={1,2,3,5,9,10},|SB|=6,SC={4,7},|SC|=2,計算獲得商品價格K1條件期望信息,可得到E(K1)=0.758。

      比較樣本的信息熵有:Gain(K1)=I(S)-E(K1)=0.503,同理可得到其他屬性的信息熵分別為Gain(K2)=0.607,Gain(K3)=0.476,Gain(K4)=0.432。

      比較樣本的信息熵有:Gain(K2)>Gain(K1)>Gain(K3)>Gain(K4)??梢钥闯?,樣本中商品使用壽命屬性信息增益具有做大值,因此選擇教學內(nèi)容K2作為根節(jié)點測試屬性,在每個值根節(jié)點創(chuàng)建分支,并基于ID3從根節(jié)點進行進一步細分。若根節(jié)點到當前節(jié)點路徑包含了所有樣本的全部屬性,或?qū)儆谕挥柧殬颖緦?,則算法完成,根據(jù)教學內(nèi)容K2測試屬性建立的決策樹形圖如圖1所示。

      (三)決策結果

      根據(jù)已建立的決策樹可以確定知識的表述形式為:

      if(K2=A),then K5=優(yōu)秀;

      If(K2=B),then K5=良好;

      根據(jù)分析可知,商品使用壽命,即耐用程度K2在商品評價中占主導地位,若商品使用壽命為優(yōu)秀時,獲得的商品評價為優(yōu)秀;若商品使用壽命為良好,則商品評價為良好。因此對商品評價中,商品的質(zhì)量應作為主要的考慮因素,同時兼顧售后等其他樣本。

      結語

      大數(shù)據(jù)時代對企業(yè)的生存帶來了新機遇,也帶來了很多的挑戰(zhàn),如何迎合客戶喜好、如何進行更好的售后服務等等,都是企業(yè)要考慮的問題,但企業(yè)應將顧客對商品耐用程度的需求放在首位,應從如何提高商品壽命,降低次品率考慮。

      數(shù)據(jù)挖掘?qū)τ诂F(xiàn)代企業(yè)而言是一種可以用于分類客戶、進行產(chǎn)品定位等功能的重要輔助工具,其應用領域仍然有很大的開發(fā)空間。因此,研究人員應不斷深入挖掘數(shù)據(jù)挖掘這一實用工具的應用潛力。

      參考文獻:

      [1]? 毛國軍,段立娟,王實.數(shù)據(jù)挖掘原理與算法[M].北京:清華大學出版社,2005.

      [2]? 王玨,周志華,周傲英.機器學習及其應用[M].北京:清華大學出版社,2006.

      [3]? 閆友彪,陳元琰.機器學習的主要策略綜述[J].計算機應用研究,2004,(7):4-10.

      [4]? 王愛平,張功營,劉方.EM算法研究與應用[J].計算機技術與發(fā)展,2009,(9):108-110.

      [5]? 孫志軍,薛磊,許陽明,等.深度學習研究綜述[J].計算機應用研究,2012,(8):2806-2810.

      [6]? 李旭然,丁曉紅.機器學習的五大類別及其主要算法綜述[J].軟件導刊,2019,(7):4-9.

      [7]? 吳玉軒.機器學習算法在金融市場風險預測中的應用[J].信息系統(tǒng)工程,2019,(2).

      [8]? 李赟妮.神經(jīng)網(wǎng)絡模型在銀行互聯(lián)網(wǎng)金融反欺詐中的應用探索[J].金融科技時代,2018,(8):24-28.

      [9]? 王雅靜.銀行個人客戶信用評分模型研究——基于決策樹算法[J].現(xiàn)代商貿(mào)工業(yè),2015,(19):6465.

      [10]? 嚴蔚敏,李冬梅,吳偉民.數(shù)據(jù)結構:C語言版[M].北京:人民郵電出版社,2011.

      [11]? West D.Neural network credit scoring models[J].Computers & Operations Research,2000,(11-12): 1131-1152.

      [12]? Domingosp.The master algorithm:how the quest for the ultimate? learning machine will remake our world[M].England:Reed Business Information Ltd.,2015.

      [13]? Sun H.N.,HU X.G.Attribute Selection for Decision Tree Learning with Class Constraint[J].Chemometrics and Intelligent Laboratory Systems,2017,(163):16-23.

      [14]? KE G.L.,Meng Q.,F(xiàn)inley T.,et al.Light GBM: A Highly Efficient Gradient Boosting Decision Tree//Guyon I,Luxburg U V,Bengio S,et al.,eds.Advances in Neural Information Processing Systems 30.Cambridge,USA:The MIT Press,2017:3149-3157.

      猜你喜歡
      客戶關系管理數(shù)據(jù)挖掘大數(shù)據(jù)
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
      電力與能源(2017年6期)2017-05-14 06:19:37
      中小企業(yè)客戶關系管理實施策略探討
      時代金融(2016年27期)2016-11-25 17:03:10
      數(shù)據(jù)挖掘技術在CRM中的應用
      客戶關系管理課程實踐教學模式初探
      中國市場(2016年35期)2016-10-19 02:58:48
      基于大數(shù)據(jù)背景下的智慧城市建設研究
      科技視界(2016年20期)2016-09-29 10:53:22
      萬科集團住宅產(chǎn)品客戶關系管理探析
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      大悟县| 大关县| 阿图什市| 道孚县| 湘潭市| 白朗县| 华阴市| 延津县| 体育| 讷河市| 贵港市| 察雅县| 乌苏市| 南宁市| 安徽省| 固安县| 蓬溪县| 巴中市| 西平县| 铜山县| 达孜县| 建水县| 苏尼特右旗| 西贡区| 焦作市| 米脂县| 南川市| 双辽市| 藁城市| 远安县| 石泉县| 梅河口市| 旬阳县| 大洼县| 象州县| 繁峙县| 崇文区| 萨嘎县| 新昌县| 静宁县| 蛟河市|