張宏達
(國網(wǎng)浙江省電力公司臺州供電公司,浙江 臺州 318000)
近年來,隨著市場經(jīng)濟的發(fā)展完善,中共中央辦公廳在《關于進一步深化電力體制改革的若干意見》(中發(fā)[2015]9號),明確提出了要完善電力交易機構的市場功能。電力企業(yè)需要順應市場的潮流,為用戶提供更人性化的服務。
根據(jù)智研咨詢發(fā)布的報告,截至2016年12月,我國手機網(wǎng)民規(guī)模達6.95億人,占網(wǎng)民人群的95.1%。由此可見,移動互聯(lián)網(wǎng)在企業(yè)與用戶交互、溝通與交易的渠道上占有越來越重要的地位。
以國家電網(wǎng)公司為例,用戶除了可以通過以往的銀行批扣、營業(yè)廳進行繳費,現(xiàn)在還可以通過掌上電力APP在手機端進行繳費、電量和購電等記錄的查詢。
任何產(chǎn)品都離不開營銷,APP雖然為用戶提供了便利,但要使廣大電力用戶知曉,并且嘗試使用,進而建立起使用習慣,仍然需要進行宣傳推廣。精準營銷是指在精準定位的基礎上,為用戶提供個性化的營銷方案,使得企業(yè)可以降低營銷成本,提高營銷的投資回報。精準營銷建立在現(xiàn)代信息技術手段之上,首先要有大量的反饋數(shù)據(jù)作為基礎,之后通過數(shù)據(jù)挖掘技術發(fā)掘數(shù)據(jù)中蘊含的商業(yè)價值,比如用戶的偏好和行為習慣。
以下研究就建立在臺州電力公司一次全渠道推廣的反饋數(shù)據(jù)之上。活動歷時一個多月,活動目的是以推廣峰谷表為契機提高掌上電力APP、電e寶的注冊綁定量。在推廣的過程中,用戶通過何種渠道進行注冊都會被記錄,包括微信朋友圈、臺州移動和地推,然后與已有的用戶數(shù)據(jù)進行關聯(lián),得到用戶的年齡、性別、所在區(qū)域和用電量等特征,這些數(shù)據(jù)將被用于決策樹的建模。
決策樹是機器學習中的一種分類器算法,它的特點是判斷過程是可見的,這有利于人們理解和發(fā)現(xiàn)影響分類的因素和其中的邏輯。很多分類器算法的結果都沒有這種直觀的展現(xiàn),這也是選擇決策樹算法的原因,利用決策樹算法可以得到更多的信息去理解用戶被渠道影響的原因,有助于分析渠道的效能。
精準營銷的概念由菲利普·科特勒首次提出,他認為采用精準營銷理念的公司的營銷溝通,溝通需要更加精準,在結果上看,溝通的投資回報比較高,并且可以對溝通的結果進行衡量。在營銷傳播計劃制定上,更加注重結果和實際行動,與客戶的溝通更多地以直接方式進行。
在2005年精準營銷的概念被提出之后,Zabin和Brebach補充提出了精準營銷的4R法則,即:正確的顧客、正確的信息、正確的渠道和正確的時機。在正確的時機之下,通過正確的渠道下向正確的顧客傳達正確的信息,從而促使顧客做出有利于企業(yè)的決策。
不少學者對用戶下載APP的意愿、使用的滿意度和喜好等開展過研究。Hee-Woong Kim的研究結果表明,用戶是否愿意下載使用APP的影響因素有口碑、是否有用、APP的評分、使用費用、使用表現(xiàn)、娛樂性和是否容易使用。范宇峰、張燕等人從自我效能理論出發(fā),認為用戶的自我效能感知對用戶是否愿意下載使用APP影響最大,第二大影響因素是APP的娛樂性,影響最小的是是否有用這一性質。趙海平、楊詩姝、鄧勝利等人從雙因素理論出發(fā),從多個方面對用戶是否愿意持續(xù)使用APP和卸載APP的可能性進行了實證研究。
越來越多的傳統(tǒng)企業(yè)不僅直接開發(fā)APP來為用戶提供服務,還在各類非企業(yè)所有的APP上為自己的服務引流宣傳。使用不同APP的用戶屬于不同的群體,往往具有不同的偏好、觀念和習慣,所以通過在不同的APP上傳達不同的信息,來做到精準營銷中的正確的信息。
APP的營銷模式有多種。一是有廣告植入模式,企業(yè)在APP上投放跟自己的產(chǎn)品或服務有關的各種廣告、活動、信息,來對用戶進行引流;二是用戶參與模式,通過H5網(wǎng)頁制作技術制造與用戶的互動,來傳達信息;三是移植模式,四是內容營銷模式。
決策樹分類算法是機器學習領域中的一種監(jiān)督學習算法,它需要具有類標號的數(shù)據(jù)來作為模型學習的訓練集。
決策樹是一種層次結構,由結點和有向邊組成的。樹中有根結點、內部結點和葉結點這3種結點。在決策樹中,葉節(jié)點都會被賦予1個類標號。根結點和內部結點則都包含屬性測試條件,用來區(qū)分具有不同特性的記錄。
歷史數(shù)據(jù)被用作訓練集之前必須經(jīng)過處理,以滿足算法的要求。
(1)將用電量轉化為分類屬性。
具體方法是對用電量進行排序,按排名情況其屬性分別為高、中、低(見表1)。
表1 按用電量排序分類
(2)將谷電量占比轉化為分類屬性。
谷電量占比20%以下的為低,20%—50%為中,50%以上為高(見表2)。
表2 按谷電量占比排序分類
(3)將年齡轉化為分類屬性。
18—30歲為青年,30—45歲為中年,45歲以上為中老年(見表3)。
表3 按年齡排序分類
對數(shù)據(jù)進行預處理之后,要利用數(shù)據(jù)來對模型進行訓練。要從根節(jié)點開始建立決策樹,就必須逐步對結點進行分裂。每一次分裂,其實都是將訓練集中的數(shù)據(jù)進行劃分,算法為了確保每一次的劃分都是最好的選擇,必須確定一個不純性度量,來衡量劃分的效果。
所使用的不純性度量是香農(nóng)熵,公式如下:
式中:xi指類標號;p(xi)指該類在數(shù)據(jù)集中的頻數(shù)。
每次劃分的效果由信息增益ΔI來表示:
ΔI值越高,說明劃分的效果越好。
模型訓練流程詳見圖1:
(1)確定了如何去選擇劃分之后,算法需要解決的是什么時候終止結點繼續(xù)分裂。思路是:結點不斷分裂直到結點所劃分的數(shù)據(jù)集里的元素全部具有相同的類標號。
(2)當所有屬性都已被考慮,無法再進行分裂時,分裂也將停止。結點最終的類標號由結點中的數(shù)據(jù)集的多數(shù)類決定。
(3)為了防止無意義的過度擬合,使得整個決策樹過于龐大,研究中也在信息增益已經(jīng)低于閾值的情況下,提前終止結點的分裂。結點最終的類標號由結點中數(shù)據(jù)集的多數(shù)類決定。
因為決策樹的分支比較繁雜,所以將整個樹在根結點處進行了分割,分別展示。
圖2展示了在根結點對縣公司這一屬性進行分裂后的部分子樹,屬性值分別為臺州黃巖、臺州電業(yè)局、臺州椒江、臺州路橋、臨海、三環(huán)、玉環(huán),它們的葉結點的類都是其他。說明這些縣公司所服務的用戶,無論進一步考慮他們的哪一特征,相應類型的用戶大多數(shù)都選擇了其他渠道來下載注冊APP。
圖1 模型訓練流程
圖2 決策樹1
圖3 展示了從根結點分裂的縣公司屬性為仙居和天臺的子樹。從建立的模型結果可以看出,縣公司仙居所服務的用戶在活動期間沒有辦理峰谷表的多數(shù)都是通過地推渠道來下載APP的,統(tǒng)計結果顯示,縣公司仙居所服務的用戶在活動期間沒有辦理峰谷表的有5 922人,從地推渠道下載APP的就有2 853人??h公司天臺所服務的農(nóng)村用戶,其多數(shù)是通過地推渠道來下載APP的,統(tǒng)計結果顯示,縣公司天臺所服務的農(nóng)村用戶有1 385人,而通過地推渠道下載APP的就有708人。
圖3 決策樹2
圖4 展示了縣公司下屬性值為溫嶺的部分子樹。在所有下載APP的41 313名用戶中,通過其他渠道下載的就有28 607名。從決策樹上可以看出,縣公司為溫嶺、活動期間沒有辦理峰谷電、中老年的用戶更多是通過地推渠道來下載APP。統(tǒng)計結果顯示,縣公司為溫嶺、活動期間沒有辦理峰谷電、中老年的用戶有3 123人,其中通過地推渠道下載APP的有2 396人。
縣公司為溫嶺、活動期間沒有辦理峰谷電、中年、用電類別為城市、繳費方式為其他的用戶更多是通過地推渠道來下載APP。統(tǒng)計結果顯示,縣公司為溫嶺、活動期間沒有辦理峰谷電、中年、用電類別為城市、繳費方式為其他的用戶有46人,其中通過地推方式來下載APP的有25人。
圖5展示了縣公司下屬性值為溫嶺的剩余部分的子樹。通過其他渠道來下載APP仍然是大多數(shù)用戶的選擇。但根據(jù)決策樹的結果,縣公司為溫嶺、活動期間沒有辦理峰谷電、中年、用電類別為農(nóng)村、繳費方式為銀行批扣的用戶更多地通過地推渠道來下載APP。統(tǒng)計結果上,縣公司為溫嶺、活動期間沒有辦理峰谷電、中年、用電類別為農(nóng)村、繳費方式為銀行批扣的用戶有389人,通過地推渠道下載的有252人。
縣公司為溫嶺、活動期間沒有辦理峰谷電、中年、用電類別為農(nóng)村、繳費方式為線上、用電量為高、谷電量占比為低和高的用戶,多是通過地推渠道來下載APP。但是從統(tǒng)計結果上看,這一結論還不能看作一種普遍規(guī)律,因為該類型的用戶人數(shù)總共只有4人,樣本太小,偶然性太大。
此外,從決策樹中可以發(fā)現(xiàn)有一用戶類型多數(shù)是通過微信朋友圈來下載APP的。該用戶類型的特征為:縣公司為溫嶺、活動期間沒有辦理峰谷電、中年、用電類別為農(nóng)村、繳費方式為線上、用電量為低、谷電量占比為低的用戶。但是從統(tǒng)計結果上看,該用戶類型的樣本同樣太小,一共只有2人,所以不具備參考意義。
圖5 決策樹4
此次研究回收的反饋數(shù)據(jù)有41 313條,即41 313人下載了APP。其中,通過其他渠道下載APP的有28 607人,通過地推渠道下載APP的有11 567人,通過臺州移動渠道下載APP的有73人,通過微信朋友圈渠道下載的有101人,通過線上渠道下載的有186人,通過營業(yè)廳下載的有779人(見表4)。
表4 掌上電力APP全渠道推廣統(tǒng)計結果
決策樹算法通過計算信息增量來選擇是否分裂結點,信息增益的閾值被設定為0.05,當無論如何分裂結點都無法使信息增益超過0.05后,結點就不會再分裂了。可以看出,絕大多數(shù)用戶類型都是通過其他渠道來下載APP,其次有一些用戶類型明顯偏向于地推渠道。
偏向于地推渠道的用戶類型包括:縣公司仙居、活動期間沒有辦理峰谷表;縣公司天臺、用電類別是農(nóng)村;縣公司溫嶺、活動期間沒有辦理峰谷電、中老年;縣公司溫嶺、活動期間沒有辦理峰谷電、中年、用電類別為城市、繳費方式為其他;縣公司溫嶺、活動期間沒有辦理峰谷電、中年、用電類別為農(nóng)村、繳費方式為銀行批扣。
對于這些用戶類型,在下一次宣傳推廣活動中可以著重采用地推方式去推廣,會更容易達到效果。
通過從已有數(shù)據(jù)里提煉出一些知識和規(guī)則,并應用到此后的營銷決策當中,有助于提高營銷效果。使用決策樹算法來分析營銷的反饋數(shù)據(jù),從結果上來看,可以很直觀地看到不同的用戶類型所敏感的渠道。
但是此次反饋數(shù)據(jù)的一大特征是,占比最高的渠道同時也是一個意義最模糊的渠道,它包含了除了線上、營業(yè)廳、地推、臺州移動和微信朋友圈以外的所有渠道。如果來源于該渠道的數(shù)據(jù)可以刻畫得更為細致,研究結果將可以披露更多的內容。