殷麗 朱曙旸 史逸興
摘 要:隨著大數(shù)據(jù)技術(shù)的應(yīng)用使得企業(yè)更具有競爭力。本文基于亞馬遜網(wǎng)站的商品數(shù)據(jù),采用灰色關(guān)聯(lián)分析、方差分析、動態(tài)回歸模型,探究評論對消費者行為的影響機理。實證表明:具體的評論內(nèi)容對消費者行為影響較大,同時,專業(yè)人士等易被信賴群體的評價對潛在顧客影響顯著,已有的特定星級評定會引發(fā)后續(xù)相應(yīng)的評論,因此企業(yè)要密切關(guān)注易被信賴群體和低星級評定。本文的模型為企業(yè)提供了一種快速、便捷的決策方法。
關(guān)鍵詞:大數(shù)據(jù);灰色關(guān)聯(lián)分析;方差分析;動態(tài)回歸模型;消費者行為
中圖分類號:F063.2 文獻標(biāo)識碼:A 文章編號:2096-0298(2021)01(b)--04
近年來,隨著在線市場的普及(如淘寶、亞馬遜等),人們購物越來越依賴商品評價與評分,而非傳統(tǒng)的實體店體驗。同時,由于大數(shù)據(jù)等新興技術(shù)的發(fā)展,線上零售企業(yè)也使用這些數(shù)據(jù)來深入了解市場競爭情況,以及產(chǎn)品的未來發(fā)展前景,以便作出最優(yōu)的決策。這些海量的數(shù)據(jù),對于企業(yè)來說無疑是一筆寶貴的隱形財富。線上交易的普及,使得商品評論成為影響消費者選購與否的一大動力,而通過對商品評論的分析,企業(yè)可以有針對性地制定產(chǎn)品的營銷、設(shè)計等策略和更好的經(jīng)營決策。
對于商業(yè)大數(shù)據(jù)挖掘與應(yīng)用方面,Milan Kubina [1]等(2015)建立了大數(shù)據(jù)信息系統(tǒng)模型,為成功利用信息以獲得市場競爭優(yōu)勢奠定了基礎(chǔ);宋杰鯤[2]等(2020)基于大數(shù)據(jù)背景,構(gòu)建了包含產(chǎn)出、能力和資源三方面的企業(yè)競爭情報系統(tǒng)評價(ECIS);陳冬梅[3]等(2020)基于大數(shù)據(jù)和人工智能,探究了數(shù)字化戰(zhàn)略管理的可行性;肖君[4](2014)研究了大數(shù)據(jù)下企業(yè)的成本控制問題。根據(jù)已有的文獻可以發(fā)現(xiàn),大多數(shù)研究仍處于宏觀層面,模型較為復(fù)雜,需要花費較大的時間成本。而本文基于線上購物的數(shù)據(jù),探究消費者星級評定與評論對產(chǎn)品市場的影響,從而為企業(yè)提供快捷的在線銷售策略,以及識別產(chǎn)品的潛在市場。
1 數(shù)據(jù)處理與變量說明
在這里,我們選擇2020年MCM/ICM競賽C題中的數(shù)據(jù),包含亞馬遜市場上出售的微波爐(1615組數(shù)據(jù))、嬰兒奶嘴(18939組數(shù)據(jù))和吹風(fēng)機(11470組數(shù)據(jù))三種產(chǎn)品客戶提供的評分和評論。
為了減少誤差,在進行分析前需要對數(shù)據(jù)進行清洗。對于數(shù)值型數(shù)據(jù),如果是缺失值,由于各個評論數(shù)據(jù)間相互獨立,無法彌補,且極少數(shù)缺失數(shù)據(jù)相較于整個樣本占比很小,可以直接剔除;如果是異常值,可以采用K近鄰法進行校正,以提高結(jié)果的精度。對于文本型數(shù)據(jù),由于數(shù)據(jù)來源于美國,評論主要由字母組成,因此它們之間的關(guān)聯(lián)度大大降低[5],處理過程中需要將大寫轉(zhuǎn)換為小寫,并刪除標(biāo)點和空格等。
對于消費者的行為模式,可以看作買或不買,用購買率量化表示(購買人數(shù)占總樣本比例)。而影響購買率的因素主要是星級評定(從1分~5分,1分代表最低,滿意度最差;5分代表最高,滿意度最高);評論得分(具體的評論信息);幫助等級(他人評價對自己決策的影響程度);是否為Amazon Vine成員(Amazon Vine為亞馬遜發(fā)起的一個評論項目)。以下將通過實證分析判斷這四個因素對消費者行為的影響機理。
2 模型設(shè)計與實證分析
以下將用灰色關(guān)聯(lián)分析、方差分析、動態(tài)回歸模型,探究上述四個因子對消費者行為的作用及其內(nèi)在關(guān)系。
2.1 灰色關(guān)聯(lián)分析
以下采用灰色關(guān)聯(lián)分析法討論消費者行為(可視作購買率B)對星級評定(S),評論得分(P),幫助等級(F),是否為Amazon Vine成員的判斷因子(G)等因素的依賴性。
為比較第k個影響因素下,數(shù)列對參考數(shù)列對的關(guān)聯(lián)系數(shù),其中為分辨系數(shù)。
和分別為兩級最小差及兩級最大差。
定義為序列對參考序列的關(guān)聯(lián)度。
根據(jù)上述灰色關(guān)聯(lián)模型,通過MATLAB得到各因素對采購率的灰色關(guān)聯(lián)度。對于這三種產(chǎn)品,我們發(fā)現(xiàn)評論與購買率之間的灰色關(guān)聯(lián)程度最大,而幫助等級與購買率之間的灰色關(guān)聯(lián)程度最小。例如,嬰兒奶嘴的購買率與評論的灰色關(guān)聯(lián)系數(shù)為0.7503,而幫助等級與購買率之間的灰色關(guān)聯(lián)系數(shù)為0.5175。這說明,具體的評論內(nèi)容對消費者購買決策的影響較大,而幫助等級關(guān)聯(lián)度較小的原因可能是消費者的決策是一個綜合的過程,各個評論間的幫助程度沒有顯著差異。具體數(shù)據(jù)如表1所示。
2.2 方差分析
為了探究是否為Amazon Vine成員對消費者行為的影響,以下進行了方差分析。這里需要說明的是,Amazon Vine是一項邀請亞馬遜最值得信賴的評論者針對新商品發(fā)布他們的看法,以幫助其他買家作出明智的購買決定計劃。亞馬遜會根據(jù)買家針對其在亞馬遜上所購商品發(fā)布的評論是否深刻,邀請買家成為Vine 評論者。而參與該計劃的賣家可以提供免費商品,以便這些選定的 Vine Voice 為其申請的商品發(fā)布買家評論。因此,Amazon Vine也是評論的一個方面。
首先,計算星級評定、評論得分、幫助等級和是否為Amazon Vine成員的相關(guān)矩陣。以嬰兒奶嘴為例,在表2中,括號內(nèi)為相關(guān)系數(shù)的P值。如果P<0.01,相關(guān)系數(shù)可以認為是非常顯著的。如果P<0.05,則認為相關(guān)系數(shù)顯著。
從表2可以看出,Amazon Vine與其他變量的相關(guān)性最小。同時,評論得分與星級評定的相關(guān)性最大,為0.3044。例如,正面評價與高星級評價一致,反之亦然。這符合我們的實際情況,因為評論是評分的具體說明。以下的第三點將對此進行詳細分析。
接下來,采用單因素方差分析研究是否為Amazon Vine成員的判斷因子(G)對星級評定(S),評論得分(P),幫助等級(F)和消費者行為(B)等變量的影響。數(shù)據(jù)通過了常方差檢驗和正態(tài)性檢驗。
我們首先討論判斷指數(shù)(G)的變化對星級評定的影響。
變量S表示星級評定(S)的樣本,當(dāng),即不是Amazon Vine成員時,是的平均值,當(dāng),即是Amazon Vine成員時,是的平均值??偣策x擇了個樣本,其中,的有個,的有個。
為了討論對消費者行為的影響,以是否是Amazon Vine成員為控制變量,研究了各變量的均值。從表3可以清楚地看到,加入Amazon Vine有助于產(chǎn)品在在線市場上取得成功。由于篇幅的限制,在這里列出嬰兒奶嘴的結(jié)果數(shù)據(jù)。通過對另外兩種產(chǎn)品的研究,我們也發(fā)現(xiàn)了相似的規(guī)律。
從表3的結(jié)果可以看出,第一個是0.7987,說明結(jié)果并不顯著。因此,在是否加入Amazon Vine的星級評定上沒有顯著差異。而其他三個都小于0.05,可以說是有明顯的不同。換句話說,成為Amazon Vine的一員對評論得分(P),幫助等級(F)和消費者行為(B)有顯著影響。雖然這是選取國外的數(shù)據(jù),針對的是亞馬遜網(wǎng)站的個例,但不可否認的是這種精選評論的項目對消費者選購本產(chǎn)品仍有顯著的影響。例如淘寶、京東上的星鉆級買家的評價對潛在消費者影響更大。
2.3 動態(tài)回歸模型
為了衡量特定的星級評定是否會引發(fā)更多的評論,將星級評定作為自變量(X)。同時,考慮到評論對消費者決策的幫助程度,得到修正后的評論得分(R),并將其作為因變量(Y)。在之前的研究中,發(fā)現(xiàn)2006年的微波爐數(shù)據(jù)太少,不具有代表性。因此,使用線性插值來彌補。由于動態(tài)回歸中時間序列的平穩(wěn)性不是必要的,因此只檢查它是否是白噪聲。LB測試表明,每個系列都不是白噪聲。通過對序列的相關(guān)系數(shù)和偏相關(guān)系數(shù)的分析,建立了動態(tài)回歸模型。
式中,和分別是t年和t-1年修訂的評論得分(R)的值。是在第1年的星級評定。(i=0,1,2)分別表示常數(shù)項和變量前的系數(shù),且是隨機誤差項。我們引入了以消除其自身的影響,并且的系數(shù) (即)將顯示先前的星級評定對修訂后的評論分數(shù)的影響。由于其他因素間相關(guān)性較低,因此這里沒有采用更多的變量。特別是該模型還可以通過以后的建模結(jié)果來確定,并發(fā)現(xiàn)殘差是白噪聲。
運用MATLAB,可以得到這三種產(chǎn)品的動態(tài)回歸模型,如式7~9所示。
接下來,對殘差序列進行LB檢驗。測試結(jié)果表明,殘差序列為白噪聲序列,即信息已被充分提取。因此,該模型是有效的。
以上結(jié)果顯示,為正數(shù),通過5%顯著性檢驗,說明星級評定對文本評論得分有正向影響。這一結(jié)論與實際情況相符,特定的星級評定會引發(fā)更多類似的評論。例如,客戶在看到一系列高星級的評價后,更可能寫出正面的評價。不過,如果之前的星級評定較低,他們對評論的正面貢獻將低于高星級評定,而且隨后的評論可能不會那么好。這一結(jié)果的主要原因是星級評定對潛在消費者的影響更大,低星級評定會讓顧客氣餒,因為他們下意識地認為產(chǎn)品不好。
最后,利用已有的動態(tài)回歸模型對評審得分進行預(yù)測。2016年吹風(fēng)機、微波爐、嬰兒奶嘴的預(yù)測評論得分分別為-0.0091、 -0.0019、-0.0482,比2015年有所提高。以嬰兒奶嘴為例,其預(yù)測如圖1所示。
3 結(jié)語
本文探究了四個主要因素(星級評定、評論得分、幫助等級、是否為Amazon Vine成員)對消費者行為的影響,并預(yù)測了三種產(chǎn)品的得分。從實證分析中可以看出,具體的評論內(nèi)容對購買率影響較大,同時,專業(yè)人士的評價更能影響潛在消費者,已有的特定星級評定會引發(fā)后續(xù)相應(yīng)的評論。這給予了企業(yè)一個思路,密切關(guān)注專業(yè)人士等容易讓潛在顧客信賴的群體和打低星級評定的用戶,剔除惡意差評后,充分了解消費者的需求,改進相關(guān)產(chǎn)品,以求產(chǎn)品市場的長遠發(fā)展。本文的研究為線上購物產(chǎn)品的銷售策略和前景預(yù)測提供了一種建議,幫助企業(yè)更快地作出決策。
參考文獻
Milan Kubina, Michal Varmus, Irena Kubinova. Use of big data for competitive advantage of company[J].Procedia Economics and Finance,2015(26):561-565.
宋杰鯤,趙志浩,張業(yè)蒙,等.大數(shù)據(jù)背景下企業(yè)競爭情報系統(tǒng)評價研究[J].情報雜志,2020(08).
陳冬梅,王俐珍,陳安霓.數(shù)字化與戰(zhàn)略管理理論——回顧、挑戰(zhàn)與展望[J].管理世界,2020,36(05):220-236+20.
肖君.基于大數(shù)據(jù)的電子商務(wù)企業(yè)供應(yīng)鏈成本控制[J].信息記錄材料,2020(21):95-96.
John H.L.Hansen,Gang Liu. Unsupervised accent classi?cation for deep data fusion of accent and language information[J]. Speech Communication, 2016(78):19-33.