(揚(yáng)州大學(xué) 信息工程學(xué)院,江蘇 揚(yáng)州 225127)
基于BP神經(jīng)網(wǎng)絡(luò)的用戶評論意愿預(yù)測研究
李丹丹,李亞琴,朱雨晴
(揚(yáng)州大學(xué) 信息工程學(xué)院,江蘇 揚(yáng)州 225127)
本文基于BP神經(jīng)網(wǎng)絡(luò)建模、預(yù)測電商平臺用戶評論意愿,測試結(jié)果表明BP網(wǎng)絡(luò)可以很好地用于用戶評論意愿建模和預(yù)測。
BP神經(jīng)網(wǎng)絡(luò);用戶評論;意愿;預(yù)測
隨著web2.0技術(shù)的廣泛應(yīng)用,用戶生成內(nèi)容的網(wǎng)絡(luò)社區(qū)得到了前所未有的快速發(fā)展,但同時我們注意到在電商平臺的用戶往往在購物前樂意參考其他用戶分享的消費(fèi)體驗(yàn),而不愿意主動貢獻(xiàn)自己的購物經(jīng)驗(yàn)。對于電商企業(yè)和電商平臺而言,如何有效識別用戶分享購物體驗(yàn)或消費(fèi)評論背后的動因,具有非常重要的理論和實(shí)踐意義?;诖?,本研究試圖運(yùn)用神經(jīng)網(wǎng)絡(luò)的方法識別預(yù)測用戶評論意愿。
神經(jīng)網(wǎng)絡(luò)模型是一種基于機(jī)器學(xué)習(xí)的非參數(shù)回歸方法,可以較好地處理非線性問題,具有適用面廣,抗噪能力強(qiáng)的特點(diǎn),無需假定變量的分布,適合解決無先驗(yàn)分布假定條件下的預(yù)測問題?,F(xiàn)有研究表明,影響電商平臺用戶在線消費(fèi)評論意愿的因素眾多(如電商平臺技術(shù)因素、用戶心理因素、社會因素、跨文化因素等),運(yùn)用傳統(tǒng)的統(tǒng)計回歸分析方法往往很難達(dá)到預(yù)期的分析目的,而BP神經(jīng)網(wǎng)絡(luò)模型的自身特征和較強(qiáng)的學(xué)習(xí)功能,通過對歷史數(shù)據(jù)樣本的學(xué)習(xí),掌握預(yù)測對象與影響因素之間的函數(shù)映射關(guān)系,能夠較好地達(dá)到評估預(yù)測電商平臺用戶在線消費(fèi)評論意愿傾向的研究目的,同時還可用于分析不同影響因素的重要性程度。本文將集中運(yùn)用神經(jīng)網(wǎng)絡(luò)強(qiáng)有力的學(xué)習(xí)和聯(lián)想泛化能力,在電商平臺用戶在線消費(fèi)評論系統(tǒng)中運(yùn)用BP神經(jīng)網(wǎng)絡(luò)來建模,以甄別不同用戶評論意愿。
1、數(shù)據(jù)預(yù)處理
本文根據(jù)現(xiàn)有相關(guān)研究結(jié)果,以九個影響因素:感知有用性(PU)、感知易用性(PEOU)、互惠(RE)、聲譽(yù)(REP)、社交(SI)、樂于助人(EH)、感知樂趣(FE)、經(jīng)濟(jì)報酬(ER)和評論成本(RC)作為自變量,評論意愿(INT)為因變量,樣本采用用戶評論意愿問卷調(diào)查取得的中美兩國用戶數(shù)據(jù)。在對所有變量相應(yīng)測度項的值取平均后,對數(shù)據(jù)進(jìn)行歸一化(標(biāo)準(zhǔn)化)處理。處理的目的是將輸入輸出數(shù)據(jù)限制在[0,1]區(qū)間內(nèi)。常用的變換式為:
式(2-1)中,Xi表示輸入或輸出數(shù)據(jù),Xmin表示輸入(出)數(shù)據(jù)的最小值,Xmax表示輸入(出)數(shù)據(jù)的最大值。
本文為便于評估電商平臺用戶在線消費(fèi)評論意愿,對評論意愿因變量測度項值取平均后的數(shù)值,重新進(jìn)行了分類和編碼。將用戶評論意愿分為兩類:愿意和不愿意,凡均值小于4的表示不愿意(重新用編碼“0”表示),凡均值大于等于4的表示愿意(重新用編碼“1”表示),數(shù)據(jù)處理后的評論意愿因變量用符號BPint表示。
2、網(wǎng)絡(luò)參數(shù)設(shè)置
(1)網(wǎng)絡(luò)結(jié)構(gòu)。BP神經(jīng)網(wǎng)絡(luò)往往由網(wǎng)絡(luò)結(jié)構(gòu)(神經(jīng)元間的連接)、激活函數(shù)和學(xué)習(xí)規(guī)則決定。本研究以九個影響因素(自變量)為神經(jīng)網(wǎng)絡(luò)的輸入層神經(jīng)元節(jié)點(diǎn),用戶評論意愿(INT)為因變量即目標(biāo)輸出層,輸出層節(jié)點(diǎn)數(shù)為2(本文將評論意愿與否,設(shè)為二值分布),建立用戶在線消費(fèi)評論意愿神經(jīng)網(wǎng)絡(luò)預(yù)測模型。網(wǎng)絡(luò)結(jié)構(gòu)往往較難確定,其中輸入層和輸出層節(jié)點(diǎn)數(shù)根據(jù)影響因素和研究目的確定即可,而隱含層節(jié)點(diǎn)數(shù)的確定則相對較困難,因?yàn)殡[含層神經(jīng)元節(jié)點(diǎn)數(shù)過多可能出現(xiàn)網(wǎng)絡(luò)過度擬合現(xiàn)象,如果神經(jīng)元節(jié)點(diǎn)數(shù)過少的話,則可能出現(xiàn)網(wǎng)絡(luò)無法達(dá)到學(xué)習(xí)收斂性與函數(shù)逼近精度的要求。目前隱含層節(jié)點(diǎn)數(shù)確定常采用試湊法,即從較少的隱含層節(jié)點(diǎn)數(shù)開始,然后逐漸增加節(jié)點(diǎn)數(shù)訓(xùn)練網(wǎng)絡(luò),從中選擇網(wǎng)絡(luò)誤差最小時對應(yīng)的神經(jīng)元節(jié)點(diǎn)數(shù)。在試湊時也可以借助于一些經(jīng)驗(yàn)公式來粗略估計節(jié)點(diǎn)數(shù),常用的幾種估算隱含層神經(jīng)元節(jié)點(diǎn)數(shù)的經(jīng)驗(yàn)公式有:
上式(2-2)、(2-3)和(2-4)中,m為隱含層神經(jīng)元節(jié)點(diǎn)數(shù),n為輸入層神經(jīng)元節(jié)點(diǎn)數(shù),L為輸出層神經(jīng)元節(jié)點(diǎn)數(shù),a為1~10間的常數(shù)。對隱含層數(shù)的確定,通常先考慮設(shè)一個隱含層,當(dāng)一個隱含層的神經(jīng)元節(jié)點(diǎn)數(shù)很多仍不能改善網(wǎng)絡(luò)性能時,才考慮再增加隱含層數(shù)量。本文經(jīng)過多次試驗(yàn),發(fā)現(xiàn)當(dāng)一個隱含層且其神經(jīng)元節(jié)點(diǎn)數(shù)為7時,網(wǎng)絡(luò)具有很好的學(xué)習(xí)收斂效果,并且誤差最小。
根據(jù)現(xiàn)有文獻(xiàn)對電商平臺用戶在線消費(fèi)評論意愿影響因素的研究,結(jié)合BP神經(jīng)網(wǎng)絡(luò)特點(diǎn),本文最終采用快速訓(xùn)練法的網(wǎng)絡(luò)結(jié)構(gòu):輸入層神經(jīng)元節(jié)點(diǎn)數(shù)n為9,一個隱含層,其神經(jīng)元節(jié)點(diǎn)數(shù)m為7,輸出層節(jié)點(diǎn)數(shù)L為2,即9-7-2的網(wǎng)絡(luò)結(jié)構(gòu)。
(2)激活函數(shù)。根據(jù)本研究樣本數(shù)據(jù)特點(diǎn),本文輸入層到隱含層的傳遞函數(shù)采用S型雙曲正切函數(shù)(tanh-sigmoid)。由于本研究的因變量為分類變量,所以隱含層到輸出層的激活函數(shù)選用柔性最大值函數(shù)(Softmax),以柔化輸出值,減小值之間的差。
(3)學(xué)習(xí)規(guī)則。為確保模型的泛化能力,本研究采用調(diào)整的共軛梯度優(yōu)化算法,允許誤差為 (即訓(xùn)練錯誤的最小相對變化),最初學(xué)習(xí)率為0.4。
3、網(wǎng)絡(luò)測試
本文運(yùn)用SPSS神經(jīng)網(wǎng)絡(luò)分析功能中的多層感知器(multilayer perception, MLP)方法評估預(yù)測電商平臺用戶在線消費(fèi)評論意愿。為防止網(wǎng)絡(luò)訓(xùn)練過度,將中國和美國樣本數(shù)據(jù)隨機(jī)分成訓(xùn)練集、測試集和驗(yàn)證集三部分。其中訓(xùn)練集主要用于估計網(wǎng)絡(luò)參數(shù),進(jìn)行網(wǎng)絡(luò)建模,測試集主要用于防止網(wǎng)絡(luò)訓(xùn)練過度,而驗(yàn)證集則用于檢驗(yàn)評估最終網(wǎng)絡(luò)模型。
由于本研究樣本數(shù)據(jù)量相對較少,因此采用批處理的訓(xùn)練方法,以使總誤差最小。相應(yīng)地采用調(diào)整的共軛梯度優(yōu)化算法估計權(quán)重值。中國和美國樣本網(wǎng)絡(luò)訓(xùn)練結(jié)果見表1,對于中國樣本,表1中表明123位愿意發(fā)表評論的受試用戶中有115位分類正確,42位不愿意發(fā)表評論的受試用戶中有28位分類正確,整體上86.7%訓(xùn)練個案分類正確,三部分樣本的錯誤預(yù)測率大致相同(10%左右);而對于美國樣本,64位愿意發(fā)表評論的受試用戶中有56位分類正確,38位不愿意發(fā)表評論的受試用戶中有22位分類正確,整體上76.5%訓(xùn)練個案分類正確,三部分樣本的錯誤預(yù)測率大致相同(20%左右)。
本文基于BP神經(jīng)網(wǎng)絡(luò)預(yù)測電商平臺用戶評論意愿,結(jié)果表明BP網(wǎng)絡(luò)可以很好地用于用戶評論意愿建模和預(yù)測。這對于電商企業(yè)和平臺充分利用和合理激勵用戶參與消費(fèi)評論,從而促進(jìn)商品銷售,具有非常重要的實(shí)踐意義。
[1] 李亞琴.電商平臺用戶在線評論意愿研究[D].南京大學(xué),2016.
[2] (澳)尼格內(nèi)維特斯基.人工智能:智能系統(tǒng)指南(英文版第2版)[M].北京:機(jī)械工業(yè)出版社,2005: 176-188.
[3] 韓力群.人工神經(jīng)網(wǎng)絡(luò)教程[M].北京:北京郵電大學(xué)出版社,2006: 74-75.
(責(zé)任編輯:高 博)
揚(yáng)州大學(xué)2016年大學(xué)生學(xué)術(shù)科技創(chuàng)新基金項目,“社會化商務(wù)平臺用戶在線消費(fèi)推薦意愿研究”,項目編號:20160412;“電商平臺用戶評論意愿影響因素研究”,項目編號:20160443。
李亞琴