張鐘壬
摘? 要:隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展,越來越多用戶選擇了便捷的網(wǎng)上購物,商品的評論數(shù)也隨之增加。從大量評論中分析出顧客情感對商品的情感態(tài)度,能夠給別的用戶提供購買意見,也能幫助電子商務的商家改進商品缺點,以更好地滿足消費者需求。
關(guān)鍵詞:評論;文本挖掘;分析
我們正在加速進入信息化新時代,互聯(lián)網(wǎng)已經(jīng)成為人們生活的一部分,購物、交通、社交等各方面都和互聯(lián)網(wǎng)產(chǎn)生了緊密聯(lián)系。由于它的方便、快捷等優(yōu)點,網(wǎng)上購物行為成為在人們身上越來越常見了,網(wǎng)上購物的手中人群也在逐漸擴大。研究和分析電子商務的現(xiàn)狀和發(fā)展趨勢,對滿足人民群眾日益增長的對美好生活的需要有著重要作用,正確引導電商的發(fā)展,能夠讓人們擁有一個良好的購物環(huán)境和購物體驗。京東商城是我國最大的網(wǎng)購平臺之一,具有一定的影響力,較受消費者歡迎。人們生活質(zhì)量逐漸提高,榨汁機的身影越來越頻繁的出現(xiàn)在家庭中,具有一定的代表性,因此選擇以京東商城為研究網(wǎng)站,以榨汁機為例進行研究。
1京東商品信息和評論的獲取
1.1京東商品信息的獲取
搜索榨汁機,搜索結(jié)果顯示有1400+件商品,以結(jié)果的第一個商品為例,爬取商品信息,主要包括商品名、店家、價格、評價數(shù)量、商品鏈接等信息,如表1所示。
1.2 商品評論的獲取
利用爬蟲工具可獲取兩種榨汁機商品的評價數(shù)據(jù),由于商品的評價數(shù)量過多,按照評價的默認排序,提取前500條評價進行情感分析,表2是美的榨汁機的部分評價。
是一個非常好的榨汁機,主榨汁機有600毫升,但一般放到400毫升即可,不然會漏出來。榨一次很快,才10秒左右。運動杯在學校也很便攜,關(guān)于聲音,榨汁機都這個響。
2文本挖掘分析
文本挖掘是數(shù)據(jù)挖掘中的一種辦法,指的是從文本數(shù)據(jù)中獲取有價值的信息和知識。利用微詞云可對評價內(nèi)容進行基本的分詞,還可以將結(jié)果可視化。
爬取下來的數(shù)據(jù)中含有點贊數(shù)、評論時間、爬取時間等內(nèi)容,與本次研究關(guān)系不大,可先刪除,留下會員名及評價內(nèi)容等重要信息。將評價內(nèi)容導入微詞云中,根據(jù)動詞、名詞、副詞等詞性,會對評價進行基本的分詞處理。繪制出的詞云圖如圖1所示。
因為是在京東商城以“榨汁機”為關(guān)鍵詞搜索后,點擊美的品牌的商品的評論進行爬取、分析,所以出現(xiàn)了京東、美的、榨汁等詞語。
在圖1中,還可以看到方便、研磨、細膩、不錯、推薦等詞語,說明消費者對此款商品的滿意度較高,聲音、質(zhì)量等體現(xiàn)了消費者對榨汁機關(guān)注的重點方面。說明消費者在購買榨汁機時,質(zhì)量及機器聲音是影響購買的重要因素。
3結(jié)論
通過對京東美的品牌榨汁機評價的爬取,可視化分析商品的信息和評價,可以發(fā)現(xiàn)商品價格、評價等會對消費者的購買行為產(chǎn)生影響。從大量評論中找到商品的優(yōu)點可讓商家更清楚自身優(yōu)勢,不足之處則可改進,以提高產(chǎn)品使用感。同時,對消費者而言,善用評論可以分析出某商品的評價如何,是否值得購買。
參考文獻
[1]? 董利棟.基于商品評價內(nèi)容的文本數(shù)據(jù)挖掘分析——京東手機為例[D].四川:西南財經(jīng)大學,2017.
[2]? 周化,張沁蕙,袁志.基于文本挖掘與語義識別的用戶消費行為分析[J].企業(yè)技術(shù)開發(fā)(學術(shù)版),2016,35(7):7-10. DOI:10.14165/j.cnki.hunansci.2016.19.003.
[3]? 王獻偉.文本情感分析在商品評論中的應用研究——以京東智能冰箱評論為例[D].浙江:浙江工商大學,2018.
[4]? 楊瑞欣.電商空調(diào)產(chǎn)品的評論數(shù)據(jù)情感分析[D].山西:山西大學,2017.