張書月
摘要:電商的興起逐步改變現(xiàn)代人購物的方式,目前,隨著電子商務市場的發(fā)展壯大,競爭壓力也逐漸變大,電商平臺以及商家都面臨極大的競爭壓力。對于電商而言,除了保障產品質量外,如何精準把握用戶的需求是影響自身發(fā)展的關鍵性因素,大數據技術的優(yōu)勢在于可以通過對海量用戶信息數據的挖掘分析,把握用戶的購物體驗以及實際需求,可以為調整和改進營銷策略提供有價值的參考。本文簡要對數據挖掘技術及其優(yōu)勢進行闡述,并具體探討數據挖掘技術在電商情感規(guī)律分析中的應用。
關鍵詞:情感分析;電商;數據挖掘技術;應用
目前,我國的電商經過最初的紅利期之后,基本進入了平穩(wěn)發(fā)展的階段,這一階段由于電商平臺以及商家數量的增加,市場競爭更加激烈,稍有不慎就會被市場淘汰。電商平臺要獲得發(fā)展,其需要吸引更多的商家入駐以及用戶注冊;商家要獲取更高的利潤,則需要提高銷售量。而這些問題歸根結底是要如何準確把握用戶的動向,只有了解用戶的需求才能實現(xiàn)精準營銷,從而才能使電商平臺的用戶數量以及商家的盈利增加。要解決這一問題,就要求電商必須要充分利用獲取的數據資源,從中挖掘出有價值的信息,通過這些信息分析不同用戶的需求,從而為其提供更加優(yōu)質的商品或者服務。
1 數據挖掘技術概述及優(yōu)勢分析
1.1 數據挖掘技術
數據挖掘技術本質上是一種處理數據的技術,是從海量、不完整的、隨機的以及模糊的數據當中,提取出隱含的有價值的知識或者信息[1]。應用數據挖掘技術需要根據數據信息的類型選擇合適挖掘技術,其中比較常用的技術包括統(tǒng)計技術、遺傳算法、連接分析、給予歷史的分析、關聯(lián)規(guī)則、決策樹、回歸分析、概念描述、粗糙集、神經網絡、概念描述以及模糊集等。
1.2 數據挖掘技術的優(yōu)勢分析
近年來,隨著信息產業(yè)的快速發(fā)展,所產生的數據資源呈指數增長,而要將這些數據資源轉化為有價值的知識或者信息,就需要使用某種工具對這些數據資源進行識別與分析。數據挖掘技術就是一種利用多種數據分析工具在大量數據資源中識別有價值信息的技術手段,利用數據挖掘技術可以尋找出數據之間潛在的聯(lián)系,發(fā)掘出其中被忽略的因素,是現(xiàn)階段解決海量數據分析與處理問題的重要技術手段[2]。
電商平臺的用戶信息以及與之相關的數據是電商的主要數據來源,對于電商而言,用戶每天所產生的數據信息規(guī)模極為龐大,其中既包含對電商發(fā)展有價值的數據信息,也有無價值的數據信息,電商要留存這些數據資源需要付出較高的成本,如果無法有效識別這些數據信息當中有價值的部分,無疑會大幅增加電商運營成本,對于電商長期發(fā)展不利[3]。
數據挖掘技術的優(yōu)勢在于可以通過對用戶的購買記錄、訪問時間、瀏覽記錄、瀏覽內容以及在每個商品停留的時間等信息分析出用戶潛在意愿表達以及當下現(xiàn)實需求,從而充分把握用戶需求,制定出針對性的營銷策略。通過這種形式可以將商品瀏覽者轉化為購買者,可以有效提升商品銷售量,并且也有助于優(yōu)化用戶的購物體驗,提高用戶滿足度,增加用戶對于品牌的忠誠度,對于電商平臺長遠發(fā)展有積極作用。此外,對于電商而言,數據挖掘技術可以將原本無價值的數據信息轉化為有價值的資源,不僅可以為營銷活動提供參考以及有價值的建議,同時也能剔除掉其中無用的數據信息,降低電商的運營成本,提高其經濟收益。
2 數據挖掘技術在電商情感規(guī)律分析中的應用
數據挖掘技術是宏觀層面的概念,要具體到實際應用當中,其根據實際需求不同,需要采用不同的挖掘技術,在電商情感規(guī)律分析中一般主要采用關聯(lián)規(guī)則、聚類分析、演化分析以及分類和預測這幾種技術。
2.1 關聯(lián)規(guī)則
如果兩個或者兩個以上的變量中存在著某種規(guī)律性,即稱之為關聯(lián),具體可以分為時序關聯(lián)、因果關聯(lián)以及簡單關聯(lián)。進行關聯(lián)分析的主要目的是尋找數據庫當中隱含的關聯(lián)規(guī)則,由于在分析之前對于數據庫當中數據之間的關聯(lián)性并不清楚,即使了解也存在一定的不確定性,而通過關聯(lián)分析得出的關聯(lián)規(guī)則可信度更高[4]。對電商平臺數據庫中的數據關聯(lián)性進行分析,可以發(fā)掘兩個或者兩個以上商品之間有價值的關聯(lián),比如購物車分析以及購買記錄分析,通過分析可以發(fā)現(xiàn)大部分用戶在購買某種商品的同時也會購買另一種商品,比如購買面包時大概率會購買牛奶。這種關聯(lián)在很大程度上反映出了用戶的消費習慣,如果電商平臺通過關聯(lián)分析明確了用戶的這種消費習慣,就可以有目的的將兩種或者兩種以上商品捆綁銷售,從而增加商品銷售量以及盈利水平。
2.2 聚類分析
這也是數據挖掘技術在實際應用當中比較常用的技術手段之一,其基本原理是將數據集合分為若干類別或者若干簇,并使每個類別或者每個簇當中的數據呈現(xiàn)出最大程度的相似,使不同類別或者不同簇當中的數據呈現(xiàn)明顯的區(qū)別,進而挖掘出數據集當中新穎的、可理解的以及有價值的數據分布。電商平臺中具體的應用主要有兩種,分別是頁聚類與用戶聚類,其中頁聚類是把頁面內容相關網頁構成一個網頁組,一般多用于搜索功能以及幫助功能,當用戶搜索某種商品或者服務時,可以為用戶提供更多的信息或者選擇。用戶聚類是把購物喜好具有相似性的用戶歸到一起,以便有針對性地為用戶提供瀏覽建議或者定制瀏覽內容,以實現(xiàn)精準營銷。聚類分析的價值在于可以為用戶提供更為便捷的搜索服務和瀏覽服務,不僅可以強化廣告效果,同時也能優(yōu)化用戶購物體驗,充分滿足用戶的需求。
2.3 分類和預測
預測也可以稱之為基于歷史的分析,即根據指示經驗尋找數據庫當中相類似的情況,并將與這種情況相關的信息用于在當前的案例當中。預測一般首先會尋找和檔案案例相似的鄰居,然后利用這些鄰居對新數據進行分類和估值,使用預測有三個主要問題,尋找確定的歷史數據;決定表示歷史數據的最有效的方法[5];決定距離函數、聯(lián)合函數和鄰居的數量。在電商平臺中通過對用戶以往購買記錄以及瀏覽記錄的挖掘分析,可以在很大程度上預測用戶在當前階段或者下一階段的購買傾向,從而把握用戶的需求變化,以提供精準的商品或者服務。分析是將數據庫黨總的數據映射至既定的類別上,其可以反映出同類別事物的共同性質以及不同事物的差異性特征,其特點在于可以搭建數據分類模型,將數據庫中的數據進行分類。這種方式多與用戶聚類結合使用,可以精準實現(xiàn)對用戶的分類,不同群體的購買需求存在明顯差異,利用分類模型可以對用戶群體進行進一步的細分,而并不僅僅是以男女或者老幼區(qū)分用戶。用戶細分不僅可以實現(xiàn)精準投放,同時也有助于延伸產業(yè)鏈條。
2.4 演化分析
演化分析主要是描述研究對象或者行為隨著時間推移而變化的規(guī)律或者趨勢,并據此搭建數據模型,演化分析包括序列模式匹配、時間序列數據分析以及給予類似性數據分析。演化分析的核心內容是分析數據之間的因果關系或者時間關系,從在某種程度上預測研究對象下一階段的變化[6]。對于電商平臺而言,可以采用這種方式對用戶的購買記錄進行挖掘分析,以序列模式匹配為例,比如在某個時間區(qū)間,用戶先購買了商品1,隨后購買了商品2,最后又購買了商品3,則商品1、商品2、商品3就形成了一個序列,若這個序列出現(xiàn)的頻率比較高,則表明三者之間存在某種聯(lián)系,基于此,可以預測用戶下一階段的消費意向,進而適時調整營銷策略。
3 基于數據挖掘技術的電商情感分析工作流程
數據挖掘技術是一個相對宏觀的概念,其又可以細分為多種不同的技術,這些技術的應用場景各不相同。在電商情感規(guī)律分析中,針對不同的需求需要采用不同的數據挖掘技術,但是其工作的流程基本一致,大致可以分為四個環(huán)節(jié),分別是數據采集、數據預處理、數據挖掘以及結果顯示,具體如下所述。
首先是數據采集,目前而言數據采集主要分為隱式采集與顯式采集兩種方式,其中隱式采集是采集用戶在瀏覽或者購物過程中留存在數據庫中的相關信息,比如購物記錄、瀏覽記錄等等,不需用戶自行輸入。顯式采集是采集用戶在平臺或者系統(tǒng)中輸入的信息,比如性別、年齡、所處區(qū)域以及商品評價等等,需要用戶自行輸入。
其次是數據預處理,這指的是對采集的數據進行清洗,以解決數據當中存在的冗余、缺值以及數據值不一致等相關問題,以便進行下一步數據挖掘操作。比較常用的數據預處理方法包括數據集成、數據清洗、數據歸約以及數據變換等。經過預處理可以有效提高數據挖掘的準確性。
再次是數據挖掘,此環(huán)節(jié)主要是根據實際需求選擇相應的數據挖掘技術,從海量的數據信息中提取或者識別其中有價值、新穎以及可理解的數據信息,從而分析出用戶當前或者下一階段的購物需求以及用戶的購物體驗變化等。常用的數據挖掘技術包括關聯(lián)規(guī)則、聚類分析、回歸分析、差別分析以及演化分析等。
最后是結果顯示,這一環(huán)節(jié)包含兩方面,一是將數據挖掘的結果進行整理歸納,從中得出對于目前更有價值的信息,以便有針對性的調整當前的營銷策略;二是根據數據挖掘的結果,對用戶進行定向營銷,即選擇恰當的時機以及恰當的方式通過電商平臺向用戶推薦相應的商品或者服務,從而有效,滿足用戶的購物需求,進一步優(yōu)化用戶的購物體驗。
4 結語
綜上所述,合理運用數據挖掘技術,可以實現(xiàn)對海量數據資源的有效利用,可以幫助電商平臺對用戶的情感變化、消費意愿進行分析,進而準確把握用戶的需求,有針對性的調整營銷策略,使用戶獲得良好的購物體驗,并充分滿足用戶需求。這對于電商的長遠發(fā)展具有重要作用。事實上,這會逐步建立良性循環(huán),電商利用數據挖掘技術可以優(yōu)化用戶體驗,吸引更多用戶瀏覽或者購買,在此過程中又會獲得新的數據信息,從這些新的數據信息中又可以發(fā)掘出新的有價值的東西,為電商提供更多價值的信息,最終用戶的購物體驗不斷優(yōu)化,電商收益不斷增加,可以實現(xiàn)雙贏。
參考文獻:
[1] 石國燕,馬坤.淺析數據挖掘在電子商務中的應用——以淘寶網為例[J].大眾投資指南,2018(17):131-132.
[2] 蔣桂黎.基于數據挖掘與智能計算的情感數據分析與心理預警系統(tǒng)[J].電子設計工程,2020,28(7):45-49.
[3] 蘇兵杰,周亦鵬,梁勛鴿.基于XGBoost算法的電商評論文本情感識別模型[J].物聯(lián)網技術,2018,8(1):54-57.
[4] 李涵昱, 錢力, 周鵬飛. 面向商品評論文本的情感分析與挖掘[J].情報科學,2017,35(1):51-55.
[5] 霍紅,張晨鑫.考慮信息熵的在線評論特征觀點詞對購買意愿的影響[J].商業(yè)經濟研究,2018(23):67-72.
[6] 張娜,柳運昌,王若男.基于文本情感分析的社交媒體數據挖掘[J].河南城建學院學報,2019,28(5):74-79.
【通聯(lián)編輯:李雅琪】