李春林 孟令爽
摘 要:社區(qū)團(tuán)購由于新冠疫情的出現(xiàn)而得到迅猛的發(fā)展,本文基于新浪微博的評論數(shù)據(jù)對社區(qū)團(tuán)購進(jìn)行輿情分析。統(tǒng)計(jì)話題評論的前50個(gè)關(guān)鍵詞構(gòu)建詞云圖分析得到社區(qū)團(tuán)購對傳統(tǒng)零售行業(yè)會(huì)造成壟斷等負(fù)面影響,不利于市場的正常運(yùn)轉(zhuǎn)。從評論的文本數(shù)據(jù)中提取成對關(guān)鍵詞和權(quán)重?cái)?shù)據(jù)構(gòu)建語義網(wǎng)分析得出:社區(qū)團(tuán)購因其營銷模式而得到媒體的抵制,但社區(qū)團(tuán)購的優(yōu)勢也是不可否認(rèn)的,且消費(fèi)者在一定程度上傾向于把社區(qū)團(tuán)購與滴滴、外賣的發(fā)展作對比。從評論數(shù)據(jù)中抽取前四個(gè)主題,構(gòu)建LDA主題模型得到社區(qū)團(tuán)購的市場現(xiàn)狀、發(fā)展手段擾亂市場、市場潛力價(jià)值、市場競爭性四個(gè)主題,分析得出:社區(qū)團(tuán)購作為“新零售”出現(xiàn)具有很強(qiáng)的市場競爭性,市場潛力巨大,但其發(fā)展手段擾亂市場。社區(qū)團(tuán)購的發(fā)展應(yīng)明確其市場戰(zhàn)略目標(biāo),若可以做到與實(shí)體店和商超等的融合發(fā)展、品牌化發(fā)展,以此達(dá)到共贏,將會(huì)走得越來越遠(yuǎn)。
關(guān)鍵詞:社區(qū)團(tuán)購;詞云圖;語義網(wǎng);LDA主題模型
一、引言
社區(qū)團(tuán)購是社區(qū)內(nèi)居民團(tuán)體的一種購物消費(fèi)行為。從2016年開始小有發(fā)展,到2020年新冠疫情的出現(xiàn),由于其不同于其他零售行業(yè)的運(yùn)營模式——送貨到社區(qū)內(nèi),使得社區(qū)團(tuán)購得到了爆發(fā)式增長,極大地解決了疫情所帶來的購物難問題。社區(qū)團(tuán)購是疫情影響下一種生活趨勢。也正因?yàn)槿绱?,滴滴、美團(tuán)、拼多多、蘇寧、京東各大企業(yè)也紛紛參與進(jìn)來,布局社區(qū)團(tuán)購。根據(jù)艾媒咨詢的調(diào)查數(shù)據(jù)顯示,社區(qū)團(tuán)購在2022年將達(dá)到千億級別的規(guī)模。在如此迅猛的發(fā)展情況下,市場監(jiān)制尚沒有完善的狀態(tài)下,如何更好地規(guī)制社區(qū)團(tuán)購的發(fā)展成為了政府、企業(yè)和人們熱切關(guān)注的問題。
現(xiàn)下的研究方法多側(cè)重于問卷調(diào)查,研究內(nèi)容多側(cè)重于營銷模式和消費(fèi)者行為,如王桂琦(2020)采用問卷調(diào)查的形式提出“去‘微信化,注重APP開發(fā)”、“規(guī)范團(tuán)長管理,“建立內(nèi)容營銷職能部門,探索結(jié)構(gòu)性營銷路徑”等模式優(yōu)化建議與營銷策略。李琪,李欣和魏修建(2020)通過構(gòu)建社區(qū)團(tuán)購消費(fèi)者參與行為理論模型及調(diào)查問卷,統(tǒng)計(jì)分析了消費(fèi)者的社區(qū)團(tuán)購行為。譚濤(2021)作為新事物,野蠻生長與蓬勃發(fā)展往往相伴而生,因此管理部門應(yīng)該加強(qiáng)監(jiān)管約束,守好社區(qū)居民的“菜籃子”,讓其成為便民惠民的利器。本文不同于傳統(tǒng)的問卷調(diào)查或政策分析的形式進(jìn)行研究,而是利用Python從微博中爬取有關(guān)社區(qū)團(tuán)購的話題評論數(shù)據(jù)構(gòu)建詞云圖、語義網(wǎng)和LDA主題模型等進(jìn)行文本分析,提取當(dāng)前社區(qū)團(tuán)購所存在的問題且更多元地了解消費(fèi)者的真實(shí)想法。
二、基于爬蟲技術(shù)的數(shù)據(jù)采集
利用Python編程獲取對應(yīng)話題的鏈接,爬取微博的社區(qū)團(tuán)購話題,并保存到文件中,模擬二維碼登陸微博。登陸過程的語句如:
此過程可以模擬二維碼登陸的過程,并且為掃碼登陸預(yù)留了時(shí)間。然后開始遍歷話題,等待網(wǎng)頁響應(yīng),獲取評論回復(fù),加載更多回復(fù)數(shù)據(jù)的代碼如:
coms_reply_more = html.find_all('div','list_li_v2')
最終獲取評論內(nèi)容、評論回復(fù)、評論時(shí)間、評論昵稱、評論時(shí)間,然后將數(shù)據(jù)保存到文本中。最終爬取了有關(guān)社區(qū)團(tuán)購的9個(gè)熱門微博話題,共計(jì)5000多條,30萬字的文本數(shù)據(jù)。
通過爬取到的評論時(shí)間及評論頻次數(shù)量,繪制如圖1所示的微博熱度演化圖可以看出:從2020年2月份新冠疫情期間,社區(qū)團(tuán)購話題開始顯現(xiàn),到2020年12月份,關(guān)于社區(qū)團(tuán)購的話題熱度持續(xù)居高。社區(qū)團(tuán)購話題熱度所帶來的輿論傾向到底是什么,值得我們深入研究。
三、基于文本挖掘技術(shù)的社區(qū)團(tuán)購微博評論分析
1.基于微博評論詞云圖的社區(qū)團(tuán)購特征分析
本文使用Python中的jieba分詞包對文本進(jìn)行分詞,建立特征詞詞典和停用詞詞典代碼如:
過濾掉停用詞和單字詞,留下對分析有用的詞語,提取了微博評論有關(guān)話題的前50個(gè)關(guān)鍵詞構(gòu)詞云圖,從圖2所示的詞云圖可以看出,以社區(qū)團(tuán)購為核心所衍生出來的詞匯有:買菜、便宜、方便、補(bǔ)貼等詞匯,這些詞匯所體現(xiàn)出來的是目前社區(qū)團(tuán)購給消費(fèi)者所帶來的益處,也是社區(qū)團(tuán)購在新冠疫情期間迅猛發(fā)展的原因。對于資本、壟斷、菜市場、企業(yè)、資本家等詞匯,這些詞所體現(xiàn)的是對傳統(tǒng)零售行業(yè)所帶來的負(fù)面影響,不利于市場的正常運(yùn)轉(zhuǎn),也是政府需要出臺(tái)政策進(jìn)行制約的原因。
圖2 詞云圖
2.基于微博評論語義網(wǎng)的社區(qū)團(tuán)購核心要素分析
在進(jìn)行語義網(wǎng)構(gòu)建的過程中,同樣進(jìn)行分詞處理,并創(chuàng)建詞組統(tǒng)計(jì)組頻,代碼如:
最終將統(tǒng)計(jì)的詞組和組頻保存到文件中。將Python從文本中提取出來的成對關(guān)鍵詞和權(quán)重?cái)?shù)據(jù)導(dǎo)入Cytoscape軟件中構(gòu)建出來的語義網(wǎng)如圖3所示。
圖3 基于詞對的語義網(wǎng)分析
通過語義網(wǎng)可以發(fā)現(xiàn),高頻關(guān)鍵詞的分布呈中心擴(kuò)散特征,以出現(xiàn)頻率最高的企業(yè)為中心節(jié)點(diǎn),以吞并、擾亂、壟斷為二級節(jié)點(diǎn),以市場、互聯(lián)網(wǎng)、菜市場為三級節(jié)點(diǎn),通過語義網(wǎng)可以發(fā)現(xiàn)媒體關(guān)注的焦點(diǎn)。故通過語義網(wǎng)各節(jié)點(diǎn)之間關(guān)聯(lián)度的稀疏程度從如下角度進(jìn)行分析:
(1)從負(fù)面影響來看,以企業(yè)為核心所展現(xiàn)出來的關(guān)鍵詞有:企業(yè)、吞并、擾亂、壟斷。企業(yè)通過補(bǔ)貼、降價(jià)等方式來吸引消費(fèi)者,擾亂、壟斷了市場,造成了實(shí)體店和一些小商小販的經(jīng)營狀況下降,而導(dǎo)致關(guān)閉店面。當(dāng)企業(yè)對整個(gè)市場形成了壟斷之后,所帶來的后果是不言而喻的。
(2)從正面影響來看,以社區(qū)團(tuán)購為核心所展現(xiàn)出來的關(guān)鍵詞有:便宜、方便、喜歡、菜市場、超市。目前大多數(shù)用戶認(rèn)為從社區(qū)團(tuán)購購買生鮮蔬菜是便宜的,購買便捷,這也是社區(qū)團(tuán)購的優(yōu)點(diǎn)。另外可以看出社區(qū)團(tuán)購并沒有直接影響到菜市場,有相對一部分人是喜歡去菜市場買菜的。這與我國人口分布和居住模式有一定關(guān)系的,我國已經(jīng)進(jìn)入老齡化社會(huì)且在我國以老人和孩子同住的情況居多,老年人口占據(jù)買菜的一大群體。
(3)以互聯(lián)網(wǎng)為核心的關(guān)鍵詞有:互聯(lián)網(wǎng)、滴滴、外賣、公司。以互聯(lián)網(wǎng)為載體所興起的產(chǎn)業(yè)如滴滴打車、外賣平臺(tái)等。評論者趨向于與滴滴、外賣的對比來看社區(qū)團(tuán)購的發(fā)展,從這幾大互聯(lián)網(wǎng)產(chǎn)業(yè)中吸取經(jīng)驗(yàn)教訓(xùn)也更加有利于社區(qū)團(tuán)購的發(fā)展、社會(huì)的規(guī)范。
3.基于微博評論LDA主題模型的社區(qū)團(tuán)購主題分析
LDA模型是利用概率生成模型對文本集合進(jìn)行主題分析的無監(jiān)督學(xué)習(xí)方法。假設(shè)話題是單詞的多項(xiàng)分布,文本是話題構(gòu)成的多項(xiàng)分布,特別假設(shè)文本的話題分布的先驗(yàn)分布是狄利克雷分布,話題的單詞分布的先驗(yàn)分布也是狄利克雷分布。在此簡單介紹一下狄利克雷分布,若多元連續(xù)隨機(jī)變量θ=(θ1,θ2,…,θk)的概率密度函數(shù)為
其中θi = 1,θi ≥ 0,αi > 0,則稱隨機(jī)變量θ服從參數(shù)為α的狄利克雷分布。多項(xiàng)分布是廣大學(xué)者所熟知的,不做過多介紹。本文根據(jù)LDA主題模型的原理,構(gòu)建詞頻矩陣,訓(xùn)練LDA模型,代碼如:
構(gòu)建的主題模型如下表所示。
主題1——市場現(xiàn)狀的高頻詞有:補(bǔ)貼、團(tuán)購、價(jià)格、便宜、方便等詞匯,分析看出社區(qū)團(tuán)購的現(xiàn)狀是以補(bǔ)貼、低價(jià)促銷、方便的形式吸引到了消費(fèi)者的眼球;
主題2——發(fā)展手段擾亂市場的高頻詞有:壟斷、資本、菜市場、老百姓等詞匯,分析看出雖然社區(qū)團(tuán)購現(xiàn)階段以其優(yōu)惠的價(jià)格讓部分消費(fèi)者受益,但其低價(jià)促銷行為在不加控制的情況下給部分小店,菜市場帶來了極大的損害,最終損害的仍然是老百姓的利益;
主題3——市場潛力價(jià)值的高頻詞有:價(jià)格、便宜、團(tuán)購、互聯(lián)網(wǎng)、平臺(tái)等詞匯,分析看出社區(qū)團(tuán)購以互聯(lián)網(wǎng)為載體,得益于其平臺(tái)的價(jià)值,節(jié)省了物流成本、供貨成本,并且本身食品是高消耗品,客戶源不斷。因此,社區(qū)團(tuán)購具有非常大的市場潛力;
主題4——市場競爭性的高頻詞有:買菜、壟斷、菜市場、團(tuán)購、老百姓、超市等詞匯,分析看出雖然社區(qū)團(tuán)購有一定的壟斷行為,但由于我國老年人口偏多,菜市場、超市仍然是大多數(shù)老年群體所喜歡的購物場所,這也是社區(qū)團(tuán)購市場需要考慮在內(nèi)的。
四、結(jié)論與建議
傳統(tǒng)零售企業(yè)的增長步調(diào)在逐漸放緩,已經(jīng)滿足不了人們的需求,社區(qū)團(tuán)購作為以社區(qū)為單位的“新零售”出現(xiàn)具有非常強(qiáng)的競爭力。隨著互聯(lián)網(wǎng)的快速發(fā)展,消費(fèi)者能及時(shí)關(guān)注到不同商品價(jià)格,消費(fèi)者變得更加理性,對性價(jià)比、服務(wù)、安全等也更加關(guān)注。以社區(qū)為單位設(shè)立的團(tuán)購,消費(fèi)群體基本固定,這樣能夠方便各位商家去進(jìn)行更加精準(zhǔn)地推薦和維護(hù),而且消費(fèi)者一般都存在一些共性,社區(qū)團(tuán)購能很好的利用客戶黏性增加銷售量。社區(qū)團(tuán)購因其經(jīng)營模式可以就近調(diào)貨,具有物流、供貨源和成本低的優(yōu)勢,并且在一定程度上能解決當(dāng)?shù)夭宿r(nóng)的銷路問題,具有非常好的商業(yè)價(jià)值。
社區(qū)團(tuán)購作為一個(gè)出色的商業(yè)創(chuàng)新模式,其發(fā)展方式卻存在很大不足。它以補(bǔ)貼、低價(jià)促銷、便捷的形式吸引到了消費(fèi)者的眼球,雖然社區(qū)團(tuán)購現(xiàn)階段以其優(yōu)惠的價(jià)格讓部分消費(fèi)者受益,但其低價(jià)促銷行為在不加控制的情況下給超市、實(shí)體店、菜市場等帶來了極大的損害。倘若造成資本壟斷,最終損害的仍然是老百姓的利益,社區(qū)團(tuán)購也必將得到遏制。
隨著人們生活水平的提高,安全、健康、品牌成為市場關(guān)注的重點(diǎn),現(xiàn)今的消費(fèi)者更加理性,對性價(jià)比也更加關(guān)注,高頻商品成為商家爭奪的重點(diǎn)。因此對于一個(gè)“新零售”產(chǎn)業(yè)來說,若想走的長遠(yuǎn),不能急于求成。綜合上述分析,故提出以下建議:一、明確市場定位。社區(qū)團(tuán)購企業(yè)過度補(bǔ)貼吸引消費(fèi)者,造成行業(yè)壟斷、擾亂市場。因此社區(qū)團(tuán)購的市場競爭和平臺(tái)監(jiān)管需要有效政策的扶持與管制。二、發(fā)展多元化。社區(qū)團(tuán)購在一定程度上可以做到融合發(fā)展,與實(shí)體店、商場、超市、菜市場進(jìn)行合作,以此達(dá)到共贏的目的。三、品牌化。安全、健康、品牌成為廣大消費(fèi)者的關(guān)注重點(diǎn),商品品牌化,打造出屬于社區(qū)團(tuán)購自己的專屬價(jià)值,贏得消費(fèi)者的認(rèn)可,社區(qū)團(tuán)購的發(fā)展才會(huì)走得更加長遠(yuǎn)。
參考文獻(xiàn):
[1]王桂琦.社區(qū)團(tuán)購平臺(tái)消費(fèi)者使用意愿影響因素研究[D].中央民族大學(xué),2020.
[2]李琪,李欣,魏修建.整合SOR和承諾信任理論的消費(fèi)者社區(qū)團(tuán)購研究[J].西安交通大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2020,40(02):25-35.
[3]譚濤.社區(qū)團(tuán)購,行穩(wěn)方能致遠(yuǎn)[N].湘潭日報(bào),2021-03-15(003).
[4]周俊顥,朱巧明,蔣峰,褚曉敏,李培峰.基于語義和主題模型的宏觀篇章關(guān)系識別方法[J/OL].山西大學(xué)學(xué)報(bào)(自然科學(xué)版):1-10[2021-05-04].
[5]胡振華,舒行鋼.基于語義網(wǎng)的社區(qū)團(tuán)購媒體輿論情感傾向分析[J].財(cái)經(jīng)理論與實(shí)踐,2021,42(02):119-124.
[6]Zareie A,Sheikhahmadi A,Jalili M.Identification of influential users in social networks based on usersinterest[J].Information Sciences,2019,493:217-231.
[7]張柳,王晰巍,黃博,劉婷艷.基于LDA模型的新冠肺炎疫情微博用戶主題聚類圖譜及主題傳播路徑研究[J].情報(bào)學(xué)報(bào),2021,40(03):234-244.
[8]肖舒翔.為何美團(tuán)、螞蟻、抖音都潛入社群團(tuán)購?[J].銷售與市場(營銷版),2021(04):21-26.
作者簡介:李春林(1963- ),漢族,河北任縣人,博士,教授,研究方向:市場調(diào)查、數(shù)據(jù)挖掘、文本挖掘