楊知玲 方樟填 謝爍爍
【摘 要】目前高校微信平臺日漸增長,各大高校紛紛創(chuàng)立各自的微信公眾號?,F(xiàn)在高校微信公眾平臺已成為高校信息推送的重要媒體,高校微信公眾平臺每次發(fā)送推文的瀏覽量,以及轉(zhuǎn)發(fā)量是衡量高校微信平臺影響力的重要因素,本文通過對微信公眾號和weka數(shù)據(jù)挖掘平臺進行研究,通過對高校微信平臺用戶的使用意愿進行深入詳細分析和挖掘,提出一種基于weka平臺的高校微信平臺用戶行為分析與預(yù)測模型。通過分析決策樹為高校微信平臺的發(fā)展提供參考。
【關(guān)鍵詞】高校;微信平臺;用戶分析;weka
中圖分類號: G206 文獻標識碼: A 文章編號: 2095-2457(2017)29-0025-002
【Abstract】At present, the WeChat platform in colleges and universities is increasing day by day. All major universities have set up their own WeChat public account. Now that the WeChat public platform in colleges and universities has become an important media for pushing information in colleges and universities, the number of times each page is sent by the WeChat public platform in colleges and universities and the forwarding volume is an important factor for measuring the influence of the WeChat platform in colleges and universities. Mining platform for research, through the use of the Weixin University platform users in-depth analysis and mining in depth, based on weka platform for university WeChat platform user behavior analysis and prediction model. By analyzing the decision tree for the development of university WeChat platform to provide a reference.
【Key words】University; WeChat platform; User analysis; Weka
如今,微信公眾平臺帶來的經(jīng)濟利益、精神利益正不斷攀升,使得申請平臺的用戶日益增長,高校也積極開放微信公眾號為高校用戶服務(wù)。在此,我們以華農(nóng)大珠江學(xué)院學(xué)生會的微信公眾號作為研究對象,對其每一次推文發(fā)送后在短時間內(nèi)的點擊量和截取一個時間段以來關(guān)注量的人數(shù)曲線進行分析,挖掘用戶心態(tài),為高校微信公眾號的運營提供借鑒,以提高高校信息傳播的有效性。
1 珠江學(xué)院微信公眾號用戶行為分析
本文采用華南農(nóng)業(yè)大學(xué)珠江學(xué)院微信公眾號平臺導(dǎo)出的數(shù)據(jù),對微信公眾號用戶行為分為用戶對公眾號的關(guān)注行為、用戶閱讀推文的行為和用戶分享推文行三類,并對三種類型行為的特點和產(chǎn)生該行為的原因及動機進行了分析。
1.1 珠江學(xué)院微信公眾號用戶關(guān)注行為
用戶關(guān)注行為是指微信用戶新關(guān)注、取消關(guān)注公眾號,包括新關(guān)注人數(shù)、取消關(guān)注人數(shù)、凈增關(guān)注人數(shù)、累積關(guān)注人數(shù)等數(shù)據(jù)。
2016年7-9月、11月、3月新關(guān)注人數(shù)數(shù)量增加較大。高考志愿填報和錄取、舉辦中國大學(xué)生音樂節(jié)、“十佳歌手”活動恰好是這幾個月份的重要活動,在一定程度上促使學(xué)生關(guān)注公眾號。然而,新關(guān)注人數(shù)能否保持甚至持續(xù)增加是衡量一個公眾號吸引力的重要考量指標。
以2016年6月1日為起始點,取消關(guān)注的人數(shù)在下滑,6月份到7月上旬恰逢畢業(yè)季,部分大四學(xué)生因為即將離校,以及早前一個網(wǎng)絡(luò)投票活動的結(jié)束,這可能是取消關(guān)注人數(shù)多的原因。
從問卷反饋的結(jié)果來看,學(xué)生取消關(guān)注公眾號的最主要原因是推文內(nèi)容無新意,陳乏老舊;對于不符合自身需求的公眾號,同樣會選擇取消關(guān)注。而推文條數(shù)過多,不能有原創(chuàng)作品出現(xiàn)的公眾號,也是取消關(guān)注的主要因素。
1.2 珠江學(xué)院微信公眾號用戶閱讀行為
用戶圖文閱讀行為是指微信用戶打開公眾號推文的行為,反映用戶圖文閱讀行為的統(tǒng)計數(shù)據(jù)有閱讀來源分布、閱讀發(fā)展趨勢,送達人數(shù)和圖文閱讀人數(shù)的比例閱讀方式等。
圖3是截取了部分推文閱讀點贊的統(tǒng)計數(shù)據(jù),可以看到,其中《新生攻略|校園分區(qū)大解說》最為突出,累積閱讀數(shù)、閱讀人數(shù)、分享轉(zhuǎn)發(fā)次數(shù)較高;其余四篇較高閱讀數(shù)的同樣是面向新生的推文。用戶愿意看的推文,是與自身需求密切相關(guān)的內(nèi)容,閱讀次數(shù)和人數(shù)較低的推文則與自身需求關(guān)聯(lián)不緊密,無法引起大部分學(xué)生閱讀興趣。
從調(diào)查問卷的結(jié)果可以看出,大部分用戶點開推文的主要原因是標題吸引,其次原因是推文的描述與發(fā)生在自己身邊有關(guān),因朋友圈有人推薦而閱讀推文也是因素之一。
1.3 珠江學(xué)院微信公眾號用戶分享行為
用戶分享行為是指微信用戶分享一則推文的行為。微信公眾號的用戶是有限的,想要讓推文在網(wǎng)絡(luò)上傳播,利用微信分享推文來引導(dǎo)用戶關(guān)注新微信公眾號是一個重要渠道。
微信消息內(nèi)容與用戶相關(guān)。用戶關(guān)注微信公眾號的目的是希望通過這個平臺獲得自己所需要的各類信息資源。而用戶對于自己感興趣的、與自己利益相關(guān)的信息往往有更高的轉(zhuǎn)發(fā)意愿。分享數(shù)量越高的微信消息內(nèi)容與熱點相關(guān)越密切。學(xué)院的熱點消息很大程度上反應(yīng)了高校用戶的需求,高校微信公眾號推送此類推文時,可以吸引大部分人的興趣,因此有很大的概率被用戶轉(zhuǎn)發(fā)。endprint
2 珠江學(xué)院微信公眾號用戶行為預(yù)測
本文借助weka數(shù)據(jù)挖掘的開源軟件作為工具,采用分類預(yù)測的方法,找出提高用戶閱讀和分享推文,減少取消關(guān)注行為的重要因素。本文采用問卷調(diào)查方法收集原始數(shù)據(jù),共收集209份數(shù)據(jù),其中2/3作為訓(xùn)練集,用于學(xué)習(xí)和構(gòu)建用戶行為模型;1/3作為測試集,作為模型準確性的檢驗。
2.1 推文特征值提取
通過微信后臺數(shù)據(jù)以及問卷調(diào)查的結(jié)果分析,可知微信公眾號中的推文推送時間、類型、特點等與用戶關(guān)注和取消關(guān)注行為、閱讀行為和互動分享行為有一定相關(guān)性。
因此,本文提取影響微信用戶行為的因素作為特征值,如推文閱讀時間、推送方式、微信用戶使用動機。
2.2 用戶行為預(yù)測
在數(shù)據(jù)的預(yù)處理中,本文將一些無用多余的數(shù)據(jù)如序號等數(shù)據(jù)刪除。閱讀時間“sj”這一屬性的屬性值相對較多,對時間進行離散化,將0-6時設(shè)為1,6-9時設(shè)為2,9-12時設(shè)為3……21-24時設(shè)為7。一周推文數(shù)用“TWS”表示,將一周一條設(shè)為a,一周2-3條設(shè)為b,一周4-5條設(shè)為c,一周6-7條設(shè)為d;關(guān)注原因用“gzyy”表示,按選項分別設(shè)為G1,G2,G3,G4,G5;閱讀原因用“YDYY”表示,按選項分別設(shè)為Y1,Y2,Y3,Y4,Y5,Y6,Y7;;推薦原因用“TJYY”表示,按選項分別設(shè)為T1,T2,T3,T4;吸引閱讀原因用“XY”表示,按選項分別設(shè)為X1,X2,X3,X4,X5;對自己是否有幫助用“BZ”表示,“T”表示對自己有幫助,“F”表示對自己沒有幫助。
分類屬性是用戶行為中的取消關(guān)注、閱讀行為和分享互動行為。取消關(guān)注用“QG”表示,按選項分別設(shè)為Q1,Q2,Q3,Q4,Q5,Q6?;映潭扔谩癏D”表示,互動程度由低往高由h1-h5表示。分享互動用“FX”表示,“Y”表示分析,“N”表示不分享。
原始數(shù)據(jù)經(jīng)過處理后,加載到WEAK中,對訓(xùn)練集采用c4.3算法進行學(xué)習(xí),十折交叉驗證測試,運行后得到QG、HD、FX的分類準確率分別為0.89、0.78、0.89。
測試集數(shù)據(jù)進行訓(xùn)練和評估,查看統(tǒng)計信息中測試集的預(yù)測結(jié)果,QG預(yù)測值和實際值都為q2,有181個數(shù)據(jù)被預(yù)測正確,有22個數(shù)據(jù)被預(yù)測錯誤。HD預(yù)測值和實際值都為h3,有159個數(shù)據(jù)被預(yù)測正確,有44個數(shù)據(jù)被預(yù)測錯誤;FX預(yù)測值和實際值分別是Y,有181個數(shù)據(jù)被預(yù)測正確,有22個數(shù)據(jù)被預(yù)測錯誤。
從實驗結(jié)果可以發(fā)現(xiàn)本文提出的微信用戶行為預(yù)測模型是有效的,可以作為預(yù)測微信用戶行為的方法。
通過圖7,筆者看到?jīng)Q策樹的根節(jié)
點是從“SJ”這個因素開始的,分支由“HD”和“YDYY”兩個因素判定,即通過決策樹可以推出最影響高校微信平臺用戶閱讀的因素是“SJ”時間因素,“HD”和“YDYY”是影響高校微信平臺用戶閱讀的主要因素。
(1)時間因素是影響高校微信平臺用戶最主要的因素,用戶更傾向于在21-24時閱讀高校微信平臺推文。
(2)標題吸引是吸引高校微信平臺用戶閱讀的主要因素。
(3)高校微信平臺用戶對微信平臺的互動程度并不滿意。
3 珠江學(xué)院微信公眾號運營建議
(1)高校微信平臺推送時間應(yīng)設(shè)為21-24時。推送時間是影響高校微信平臺用戶最主要的因素,高校在推送文章時應(yīng)在大量用戶閱讀的時間段,這樣才能讓用戶第一時間點擊閱讀。在當天需推送晚上的活動時,可考慮提前做好推送稿,這樣活動結(jié)束后可迅速修改并發(fā)布。
(2)高校微信平臺應(yīng)提高互動能力。運營團隊要通過各種線上、線下的活動獲取新粉絲,獲取新粉絲后要通過運營手段激活用戶,比如話題留言精選點贊數(shù)排名前三可獲贈小禮品、轉(zhuǎn)發(fā)推文可以獲得指定商家發(fā)放的優(yōu)惠券。通過一系列的手段,使部分粉絲選擇存留下來,并且給公眾號帶來人氣。
(3)推送文章時應(yīng)琢磨一個好的標題。微信用戶第一眼看到的是標題,如果標題沒有吸引力的話,那么他們就不會點擊。標題一定要實在,一定要有內(nèi)容,同時也要文章關(guān)鍵詞,然后加上“數(shù)字、疑問、限時明星熱門事件、跨年”這類具有吸引力的詞語。
(4)文章內(nèi)容以幽默和實用性為主。首先,要注重內(nèi)容的實用性和趣味性。具有這兩種特點的內(nèi)容是很多用戶都非常喜歡的。尤其是在生活壓力越來越大的今天,閑暇之余讀一些有趣實用的知識,不但能夠增長見聞,還能給自己帶來快樂。高校微信平臺做微信內(nèi)容時一定要考慮其實用性和趣味性。其次在文章中可適當使用一些網(wǎng)絡(luò)詞語或自我調(diào)侃,提高文章幽默性。
【參考文獻】
[1]李平榮.大數(shù)據(jù)時代的數(shù)據(jù)挖掘技術(shù)與應(yīng)用[D].重慶:重慶三峽學(xué)院學(xué)報,2014.
[2]田野.基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)絡(luò)購物市場問卷調(diào)查數(shù)據(jù)分析[D].遼寧:吉林大學(xué),2014.
[3]趙辰瑋.高校微信公眾號圖文消息閱讀行為研究_以河北大學(xué)青年微信平臺為例[D].新聞知識.2015.
[4]黃煒.基于微信用戶行為的分享預(yù)測模型研究[D].情報理論與實踐.2016.
[5]郭愛芳.微信公眾號持續(xù)關(guān)注度影響因素的實證分析_基于信息特性視角[D].情報雜志.2017.endprint