胡春華,趙 慧,童小芹,任 劍
(1.湖南工商大學大數(shù)據(jù)與互聯(lián)網(wǎng)創(chuàng)新研究院,湖南 長沙 410205;2.移動商務智能湖南省重點實驗室,湖南 長沙 410205;3.湖南省移動電子商務協(xié)同創(chuàng)新中心,湖南 長沙 410205)
電子商務與商務智能的快速發(fā)展使得消費者進入了一個物品繁多、信息過載的新時代,信息不對稱、選擇困難、時間成本差異等成為影響消費者消費行為的關(guān)鍵因素,推薦系統(tǒng)應運而生[1]。推薦系統(tǒng)是基于消費者以往瀏覽行為的數(shù)據(jù),計算分析消費者的興趣,進而預測消費者喜好和購買意愿的復雜工具[2]。因此推薦系統(tǒng)可以改善消費者網(wǎng)購體驗,提高消費者黏性,從而提高下單轉(zhuǎn)化率和支付轉(zhuǎn)化率。
目前,國內(nèi)外電子商務平臺使用不同推薦系統(tǒng)挖掘消費者興趣和偏好,緩解信息過載的問題。如淘寶Matrix推薦系統(tǒng)[3]構(gòu)建了底紋推薦、首頁熱詞、下拉推薦、搜索發(fā)現(xiàn)等推薦平臺,京東Diviner推薦系統(tǒng)[4],Amazon的Instant推薦系統(tǒng)[5]等。由此可見,電子商務平臺中推薦系統(tǒng)的應用十分廣泛。雖然不同平臺間的推薦系統(tǒng)有一定區(qū)別,平臺也會根據(jù)不同的推薦任務和要求實時更新推薦系統(tǒng),同一平臺的推薦算法也不盡相同。從消費者角度來說,消費者無需了解推薦系統(tǒng)的運作機理就可運用其在平臺上購物。推薦系統(tǒng)的差異性和網(wǎng)絡購買不存在直接關(guān)系,并不直接影響消費者在平臺的整體網(wǎng)購支出[6-7]。因此,本文暫不考慮平臺推薦系統(tǒng)的差異性影響。
Adomavicius等[8]研究了廣義的在線推薦對消費者購買意愿的影響,結(jié)果顯示不論是考慮偏好的推薦,還是有誤差的推薦,對消費者的購買意愿都有同樣的效果。即接受推薦系統(tǒng)在線評級和建議屬于使用了推薦系統(tǒng),不再細分是否為定向推薦和非定向推薦。黃立威等[9]提出許多大型電子商務網(wǎng)站都應用了推薦系統(tǒng)。然而現(xiàn)有的電子商務網(wǎng)站中推薦系統(tǒng)多是面向個體,并不適用于向群體進行推薦。借鑒文獻[8-9]的研究,本文研究的是廣義的、實時更新的推薦系統(tǒng),并不考慮群體差異的消費者個體網(wǎng)購支出的影響。
微軟研究報告指出,Amazon網(wǎng)站30%的頁面瀏覽量來自推薦[10]。Amazon關(guān)閉某一書目推薦后,將使該書目的銷售額下降40%[11]。推薦系統(tǒng)廣泛應用的同時也帶來了巨大的經(jīng)濟效益;除消費者購買商品和服務等消費行為直接創(chuàng)造的經(jīng)濟效益外,使用推薦系統(tǒng)的消費者還可以貢獻流量,Nazerzadeh等[12]和Davis[13]提出可以使用CPA(Cost per action)和CPL(Cost per lead)將流量轉(zhuǎn)化為經(jīng)濟價值,豐富產(chǎn)品附加值;Digg使用了UserCF算法設計上線推薦系統(tǒng)后,該平臺消費者活躍度增加了40%,評論增加了11%,好友數(shù)增加了24%,證明推薦系統(tǒng)應用后能使智能商務網(wǎng)站具有更好的活躍度和實用性。
使用推薦系統(tǒng)對消費者網(wǎng)購有哪些方面的影響,影響是否顯著以及如何有效客觀地評估推薦系統(tǒng)對消費者網(wǎng)購的影響成為頗具挑戰(zhàn)的問題[14]。
從推薦系統(tǒng)對消費者影響因素不同的角度可以將已有研究分為以下三類:
第一類是通過社交信任影響消費者網(wǎng)購。Geng Bingrui等[15]和Guo Taolin等[16]認為社交互動與分享社交化鏈接能幫助消費者尋覓到感興趣的商品,鏈接越豐富,向消費者推薦效果越好。Bach等[17]認為消費者評論為消費者交互、消費者購買提供重要了手段。Xiao和Benbasat[18]研究了有偏見的個性化產(chǎn)品推薦代理,結(jié)果顯示93%的消費者會受推薦影響,對推薦的產(chǎn)品有極高的信任并購買該產(chǎn)品。Chen Yanhong等[19]拓展了沖動、推薦信任對消費者網(wǎng)購的影響。但研究背景限于微信平臺,沒有比較產(chǎn)品或服務類型。張哲宇等[20]認為消費者主動提供的消費評價可信度更高,也更具參考價值。郝玫和馬建峰[21]提出消費者評論的情感可信度指標,從而篩選高可信度的典型評論向消費者進行推薦。尹進等[22]認為不同親密度的朋友提供的推薦信息往往會對消費者有不同影響,越親密的關(guān)系在推薦過程中起到的作用越明顯??紤]消費者交互信任關(guān)系的推薦系統(tǒng)能提升消費者對非目標產(chǎn)品點擊率,降低消費者網(wǎng)購決策時間[23]。
第二類是通過提高消費者滿意度和忠誠度影響消費者網(wǎng)購。Baier和Stüber[24]和Lee和Kwon[25]研究表明推薦購買可以提高消費者對推薦產(chǎn)品的滿意度、購買意向,增強消費實際購買力,增加零售商的銷售額。Zhang等[26]研究表明推薦系統(tǒng)每降低1單位消費者篩選商品的時間成本,可提高9.4%的消費者忠誠度。有學者研究發(fā)現(xiàn)準確率高的推薦系統(tǒng)可能會導致商品服務范圍過小,降低消費者對推薦系統(tǒng)的好感度,應當綜合考慮覆蓋率、召回率等指標[27-29]。綜合考慮消費者社會關(guān)系及用戶影響力的社會模型,對提高召回率、滿意度有一定的優(yōu)勢[30]。Dabholkar和Sheng[31]認為推薦能降低消費者的風險擔憂,消費者使用推薦會獲得更高的滿意度、忠誠度、更高的購買意向。
第三類是通過預測消費者偏好影響消費者網(wǎng)購。Liu Chienliang和Chen Yingchuan[32]提出基于隱變量模型的迭代因子分析方法為消費者提供實時動態(tài)推薦,結(jié)果表明更新速度快的推薦能夠更好地預測消費者偏好,增加購買行為。Sarwar等[33]認為消費者瀏覽到商品的概率和該商品在網(wǎng)站推薦列表的排序具有反向關(guān)系,消費者使用推薦系統(tǒng)更有可能增加計劃外消費。Zhang Qian等[34]提出了CIT(Consistent information transfer)模型,結(jié)果顯示推薦系統(tǒng)能夠預測消費者潛在消費和服務。Fleder和Hosanager[35]認為提高推薦系統(tǒng)多樣性有助于消費者增加購買行為。Schreiner等[36]從消費者性別角度研究得出女性更喜歡基于CF算法的推薦,男性傾向于參考最暢銷產(chǎn)品的推薦。考慮情境化消費者偏好的推薦可以更大程度的滿足群體消費者的個性化需求,促進消費者網(wǎng)購[37]。張立功等[38]認為網(wǎng)絡購物可能造成消費者偏好的不確定性,會使消費者承擔更多的購物風險,降低其購買意愿。朱志國等[39]指出消費者的移動性會改變其興趣點,考慮消費者社交范圍的推薦會提高推薦效果。
綜上所述,國內(nèi)外關(guān)于推薦系統(tǒng)的效應研究大多圍繞推薦系統(tǒng)對智能商務平臺影響等方面,從消費者角度研究的文獻較少;現(xiàn)有對推薦系統(tǒng)影響消費者網(wǎng)購的文獻多為影響因素研究:推薦系統(tǒng)可以通過社交信任、預測消費者偏好、提高消費者忠誠度等來影響消費者網(wǎng)購,研究推薦系統(tǒng)對消費者影響效果評估的文獻較少;推薦系統(tǒng)的研究多集中在如何提高推薦系統(tǒng)的準確性,忽視了推薦系統(tǒng)的新穎性、多樣性、長尾效應、覆蓋率等評價推薦系統(tǒng)的經(jīng)濟效益指標。現(xiàn)有對推薦系統(tǒng)影響消費者行為的研究還處于初級摸索階段。本小組設計實現(xiàn)了面向社交電商環(huán)境的TDA-RBM算法,研究了基于信任和不信任關(guān)系的實值受限玻爾茲曼機推薦,構(gòu)造了信任-不信任監(jiān)督機制,結(jié)果顯示考慮社交信任的推薦對消費網(wǎng)購的推薦效果更優(yōu)[40]。因此本文在團隊成果基礎上,研究使用推薦系統(tǒng)對消費者網(wǎng)購支出的影響,評價推薦系統(tǒng)的經(jīng)濟效益。
本文在消費函數(shù)的基礎上,主要從推薦系統(tǒng)影響消費者網(wǎng)購支出角度展開了研究,提出了待驗證的研究假說:使用推薦系統(tǒng)是否影響消費者在智能商務網(wǎng)站的購物支出。文章使用了消費者層面的微觀調(diào)查數(shù)據(jù),借助相關(guān)理論使用傾向得分匹配法對研究假設進行實證分析,來改善消費者“自選擇”是否使用推薦系統(tǒng)產(chǎn)生的內(nèi)生性。并且使用多種匹配方法、工具變量法進行穩(wěn)健性檢驗,證明了使用推薦系統(tǒng)的消費者比不使用推薦系統(tǒng)的消費者有更高的網(wǎng)購支出。
本研究數(shù)據(jù)來源于消費者調(diào)查問卷,借助國內(nèi)較大的“問卷星”平臺形成網(wǎng)絡鏈接及二維碼。問卷以國內(nèi)經(jīng)常網(wǎng)物的消費者作為研究對象,并分層次納入了不同地域(臺灣、澳門除外)消費者樣本。樣本設置了篩選原則,即消費者必須傾向于網(wǎng)購而不是國內(nèi)實體店購買商品。
該問卷調(diào)查時間為2018年8月-2019年6月,共回收問卷4540份。其中調(diào)查方法1:在微信等社交平臺發(fā)布了電子問卷的網(wǎng)絡鏈接。根據(jù)該程序回收問卷數(shù)據(jù)共計1368份。調(diào)查方法2:通過問卷星的樣本服務發(fā)放問卷,根據(jù)該程序回收問卷數(shù)據(jù)共計3172份。對相關(guān)數(shù)據(jù)進行預處理,將邏輯不符、惡意填寫等不符要求的問卷數(shù)據(jù)作為無效問卷剔除,其中方法1剔除無效問卷325份,有效問卷為1043份;方法2剔除無效問卷1127份,有效問卷為2045份。共回收有效問卷數(shù)據(jù)3088份,回收率為68%。其中,男性占43.04%,女性占56.96%;年齡構(gòu)成分布如下:23歲以下占23.51%,23-28歲占24.97%,28-33歲占23.09%,33-38歲占11.88%,38-43歲占7.55%,43歲以上占9%;受教育程度分布如下:初中及以下占2.4%,高中及專科占19.14%,大學占69.59%,研究生及以上占8.87%。
調(diào)查采用了結(jié)構(gòu)化的問卷調(diào)查,問卷的核心內(nèi)容包括(1)消費者概況,如年齡、性別、消費理念、所在區(qū)域、受教育程度等。(2)消費者收入概況,如主業(yè)是否具有穩(wěn)定收入、月收入數(shù)值區(qū)間等。(3)消費者使用推薦系統(tǒng)的態(tài)度,如使用智能推薦系統(tǒng)的頻數(shù)、對推薦系統(tǒng)的了解程度、對推薦系統(tǒng)的接受程度等。(4)推薦系統(tǒng)的影響,消費者是否選擇使用推薦系統(tǒng)和使用推薦系統(tǒng)后消費者網(wǎng)購次數(shù)變化、網(wǎng)購總額的變化、技術(shù)影響消費的實現(xiàn)方式等。
本文使用SPSS25.0利用Cronbach’s Alpha值來計算信度,由表1可知,α值均大于0.6,說明問卷信度較好。
本文利用因子分析法測量結(jié)構(gòu)效度。由表1可知,KMO值均大于0.6;巴特利特球型檢驗中顯著性水平均小于0.01,說明問卷,適合做因子分析。各主成分的平均方差提取值分別為73.801%、73.933%,說明本文的問卷結(jié)構(gòu)效度較好。
表1 信度和效度分析
綜上,本文的信度和效度都符合數(shù)據(jù)分析的要求。
根據(jù)消費調(diào)查,本文將調(diào)查樣本按照Bejarano等[41]和Maghrabi等[42]提出的自選擇分類方法分為使用推薦系統(tǒng)和不使用推薦系統(tǒng)兩大類。調(diào)查結(jié)果顯示:在3088個消費者樣本中選擇推薦系統(tǒng)的消費者有1853個,占樣本總體60%,沒有選擇推薦系統(tǒng)的消費者有1235個,占樣本總體的40%。其中自選擇的含義為:是否使用推薦系統(tǒng)應用并不是隨機分配給消費者,而是消費者自己選擇使用推薦系統(tǒng)購買或自行搜索購買。本文的自變量T為一個二元變量,表示消費者是否選擇使用推薦系統(tǒng)。當其值為1時代表消費者選擇使用推薦系統(tǒng)購物,值為0時則代表選擇不使用推薦系統(tǒng)購物。本文最關(guān)注的因變量是消費者的網(wǎng)購消費能力,本文分析的因變量受諸多因素影響,如個人收入、所在城市(鄉(xiāng)村)整體消費水平、消費觀念、科技要素,審美變化等,因此在實證分析模型中還考慮了男女成員比例、教育程度、年齡、消費環(huán)境、消費經(jīng)歷等消費者個人信息特征。表2衡量了使用推薦系統(tǒng)網(wǎng)購消費者和未使用推薦系統(tǒng)網(wǎng)購的消費者的基本特征以及兩者差異??砂l(fā)現(xiàn),使用推薦系統(tǒng)的消費者和未使用推薦系統(tǒng)的消費者收入上有一定的差異;同時使用推薦系統(tǒng)的消費者有更高的網(wǎng)購消費支出;不使用推薦系統(tǒng)網(wǎng)購的消費者有更高的平均年齡、更低的受教育程度(t檢驗均在1%水平顯著)。
表2 消費者描述性統(tǒng)計分析
由圖1可見,廣告信息過多、虛假的評論和銷售量是阻礙消費者使用推薦系統(tǒng)的兩大原因,因此推薦系統(tǒng)要著重改善垃圾廣告、虛假買家秀、刷單等問題。由圖2可見,節(jié)約時間、便于找到性價比更高的產(chǎn)品是各年齡段消費者選擇使用推薦系統(tǒng)的主要原因。綜合圖1和圖2,18歲以下消費更加輕率,可以增加好友推薦的商品供其選擇。18-43歲的消費者使用好友推薦較少,更注意隱私保護,因此推薦系統(tǒng)可以減少監(jiān)聽套取隱私,降低消費者疑慮。28歲以上的消費者更注重購買產(chǎn)品的性價比,43歲以上的消費者更節(jié)省時間。因此,推薦系統(tǒng)更應提高推薦的精準性和有效性,方便消費者在短時間內(nèi)找到其喜愛的、性價比高的產(chǎn)品,提高其購買力。
圖1 消費者不使用推薦原因
圖2 消費者使用推薦原因
對消費者接受推薦后更傾向于網(wǎng)購的產(chǎn)品進行描述性統(tǒng)計分析。結(jié)果表明:消費者使用推薦系統(tǒng)主要購買的產(chǎn)品是休閑零食和服裝鞋襪。
僅有8%的消費者傾向于使用推薦購買醫(yī)藥保健產(chǎn)品,消費者使用推薦系統(tǒng)購買醫(yī)藥保健、糧油副食類的意向與年齡成正比。33歲以下的女性消費者更傾向于使用推薦購買洗護彩妝產(chǎn)品。33-43歲的消費者更傾向于使用推薦購買家用電器產(chǎn)品。在43-48歲的消費者中,使用推薦系統(tǒng)購買數(shù)碼產(chǎn)品的占46%,購買辦公產(chǎn)品的消費者僅占4%。
一般來說,顧客忠誠度可用顧客滿意度、重復購買率以及好友推薦率來衡量。如圖4,大多數(shù)的消費者最關(guān)注店鋪中的其他商品,而不是在店鋪中重復購買同一商品和服務,因此推薦系統(tǒng)可多為消費者推薦同一店鋪中互補商品。
圖4 使用推薦系統(tǒng)對消費者忠誠度影響
其次,消費者關(guān)注和在乎好友推薦,并且在各年齡段影響力都比較大。28-43歲的消費者最喜歡將買過的產(chǎn)品向朋友推薦,推薦結(jié)果受社交影響。因此推薦技術(shù)應注重基于社交關(guān)系的推薦。
除此之外,使用推薦后,消費者會更傾向于選擇重復購買、關(guān)注買過的店鋪并將其作為首選店鋪,并且訪問的時間次數(shù)都有所增長。為了提高推薦效果,推薦系統(tǒng)應提高向該消費群體推薦店鋪的質(zhì)量和聲譽。
綜上所述,推薦效果受社交關(guān)系、互補產(chǎn)品、店鋪聲譽等因素影響。
本文將消費者購買力這一定性指標量化為消費者的消費函數(shù)的一部分來反映消費者網(wǎng)購支出關(guān)系。消費函數(shù)中主觀因素和客觀因素都可以影響消費者購買力,其中主觀因素包括消費者的消費習慣、消費心理、社交影響等??陀^因素包括收入水平、行業(yè)規(guī)范、科技創(chuàng)新、推薦系統(tǒng)發(fā)展等。因此可以看出消費者是否使用推薦系統(tǒng)可能會對消費者的消費心理和消費行為產(chǎn)生影響。
消費函數(shù)為:C=α+βy。其中C代表消費支出,y代表消費者收入。α為消費者自發(fā)消費,即消費者結(jié)合自己的剛需決定消費的部分,可以理解為消費者為了生存所需要的固定消費。β為邊際消費傾向,是值在0到1之間的參數(shù),而βy代表的是由收入變化引致的消費。
杜森貝里提出相對收入假說理論,該理論認為消費者會因為消費心理的變化改變自身消費行為。其中最具有代表性的是攀比效應和示范效應。而智能商務環(huán)境中的推薦系統(tǒng)的興起與發(fā)展剛好為消費者提供了消費環(huán)境與技術(shù)支撐。消費者可能會因此更快捷有效的發(fā)掘喜歡的商品、好友推薦的商品。名人使用的具有示范效應商品,可能會觸發(fā)計劃外消費或者超前消費。
杜森貝里提出棘輪理論來進行佐證,該理論認為消費者的消費行為是不可逆的。這種消費行為受許多因素影響,如個人消費習慣、好友間攀比示范、網(wǎng)站推薦等。消費者網(wǎng)購支出最高時期的消費行為對消費者之后的購買行為有重大影響。因此,消費者可能在使用推薦系統(tǒng)后出現(xiàn)提高網(wǎng)購支出以及網(wǎng)購次數(shù)的情況。
本文在消費函數(shù)中考慮推薦系統(tǒng)的技術(shù)效應,則:C=α+βy+λT,此時λ為邊際消費傾向,是值在0到1的參數(shù),T代表一個二元變量,而λT代表的是由推薦系統(tǒng)引致的消費。
因此本文在上述理論基礎上,提出待驗證相關(guān)假設:智能商務環(huán)境中推薦系統(tǒng)對消費者網(wǎng)購支出是否具有積極正向的作用,即在相同的資源條件下,使用推薦系統(tǒng)的消費者是否比未使用推薦系統(tǒng)的消費者有更高的網(wǎng)購支出。
本文使用的方法為傾向得分匹配法(PSM),目的是將推薦系統(tǒng)獨立于其他影響消費者購買力的因素情況,調(diào)查推薦系統(tǒng)的使用對消費者網(wǎng)購支出效應及其穩(wěn)健性。傾向得分匹配法是由Rosenbaum和Rubin[43]首次提出的,該方法可以將消費者多維信息特征降維成一個傾向得分因子,在得分基礎上將使用推薦系統(tǒng)的消費者和未使用推薦系統(tǒng)的消費者進行匹配,分析結(jié)果網(wǎng)購支出差異得出推薦系統(tǒng)對于消費者網(wǎng)購支出的凈效應。鑒于不同匹配方法各有優(yōu)劣,通常采用多種匹配法進行匹配以保證穩(wěn)健性。
傾向得分匹配法優(yōu)點:第一、常用的描述性統(tǒng)計分析的方法會高估使用推薦系統(tǒng)對消費者網(wǎng)購支出的經(jīng)濟效應。第二、傾向得分匹配法可以做到將多個變量降維為一維傾向得分。第三、Wooldridge[44]認為傾向得分匹配法只需要滿足條件獨立性假設和共同支撐兩個前提假設,受限較少,匹配完成度較好,樣本損失率低。第四、Glenn等[45]認為在線測試ABtest必須要求消費者從始至終只能選擇一種方案并產(chǎn)生淘汰機制,傾向得分匹配法能夠很好的保護樣本。
傾向得分匹配法的主要特征是創(chuàng)造隨機試驗條件進行樣本比較。但使用傾向得分匹配法的前提需要滿足兩個假設:
(1)條件獨立分布假設檢驗:我們假設存在一組不受推薦系統(tǒng)影響的可觀測的協(xié)變量X,且消費獨立于推薦系統(tǒng)的使用。在這個假設下,消費者是否使用推薦系統(tǒng)不是預先設定的,而是由消費者自行選擇的,結(jié)果呈隨機分布。在此基礎上比較相同條件稟賦的消費者在使用推薦系統(tǒng)和不使用推薦系統(tǒng)的情況下的網(wǎng)購消費支出差異。
(2)共同支撐假設:假設PSM的傾向得分(Propensity Score)是介于0到1的參數(shù),即同樣具有X特征的消費者會具有使用推薦系統(tǒng)和不使用推薦系統(tǒng)的正向概率。該假設排除了傾向得分的長尾效應,提高了消費者匹配的精度和準度,但是會使消費者匹配樣本減少。Heckman等[46]提出非參數(shù)匹配方法必須是建立在共同支撐的條件下才是有意義且可討論的。因此我們很難避免用一定量的樣本損失來換取匹配質(zhì)量的提高。
選用傾向得分匹配法原因:由于商業(yè)目標最本質(zhì)的性質(zhì)就是平均一個消費者能給經(jīng)濟社會帶來的盈利。因此我們首先考慮分析同一消費者使用推薦系統(tǒng)前后網(wǎng)購支出,以探究推薦系統(tǒng)對經(jīng)濟社會所貢獻的效益。這要求掌握該消費者使用推薦系統(tǒng)前后的數(shù)據(jù),并且控制除消費者是否使用推薦系統(tǒng)外,其他可能影響消費者購買力的因素不變,而該條件控制很難保證準確實現(xiàn)。其次,不同的消費者在年齡、收入、消費觀念等條件方面有很大不同。單獨比較使用推薦系統(tǒng)的消費者與未使用推薦系統(tǒng)的消費者的網(wǎng)購支出是否存在差異,不能保證消費者網(wǎng)購支出提高與使用推薦系統(tǒng)有直接因果效應。所以借鑒Kahneman等[47]運用反事實的情況,即尋找與使用推薦系統(tǒng)的消費者個人基礎信息相似不使用推薦系統(tǒng)的消費者,然后將兩者的網(wǎng)購支出相比較。由于兩者的個人特征相似,所以兩者網(wǎng)購支出差異是使用推薦系統(tǒng)后消費者網(wǎng)購支出的直接技術(shù)效應。
本文借鑒了部分Caliendo和Kopeinig[48]傾向得分匹配法的步驟:在考慮變量的情況下,選擇使用probit或者logit模型分析估算傾向得分;根據(jù)得出的傾向得分將消費者進行匹配,執(zhí)行匹配的方法具體有最近鄰匹配法(Nearest Neighbor Matching Mathod)、核匹配法(Kenel Matching Mathod)和半徑匹配法(Radius Matching Mathod)等;通過比較兩組消費者匹配前后的偏差變化率、Pseudo-R2值等來分析不同匹配方法質(zhì)量的差異;采用“剪枝(Trimming)”理論來檢查假設條件引發(fā)消費者樣本的損失的情況。
傾向得分匹配法中匹配估算消費者是否使用推薦系統(tǒng)的決定方程:
PS(X)=Pr[T=1|X]=E[T|X]
(1)
X定義為影響消費者使用推薦系統(tǒng)的宏觀特征因素,PS定義為使用推薦系統(tǒng)消費者的概率,又稱為傾向得分。通常建立Probit模型,計算每一個消費者的傾向得分,然后將傾向得分作為消費者之間匹配的依據(jù)。
樣本整體的平均技術(shù)效應(ATE)為:
τi=PS·[E(Y1|T=1)-E(Y0|T=1)]+(1-PS)·[E(Y1|T=0)-E(Y0|T=0)]
(2)
PS表示消費者使用推薦系統(tǒng)(T=1)的概率;Y1是消費者使用推薦系統(tǒng)效應;Y0是消費者不使用技術(shù)的效應。方程(2)表示整個樣本的技術(shù)效應為消費者使用推薦系統(tǒng)和不使用推薦系統(tǒng)的加權(quán)平均效應。然而反事實情況E(Y1|T=0)和E(Y0|T=1)是不能直接得出的。在僅考慮使用推薦系統(tǒng)的消費者樣本的情況下,研究消費者樣本的平均技術(shù)效應(ATT),需要構(gòu)造一個反事實E(Y0|T=1)。使用推薦系統(tǒng)的消費者樣本平均技術(shù)效應(ATT)可以表示為:
τATT=E(τ|T=1)=E(Y1|T=1)-E(Y0|T=1)
(3)
基于上述的討論,推薦系統(tǒng)對消費者的平均技術(shù)效應,即ATT的傾向得分匹配評估可以從兩組消費者的網(wǎng)購支出水平的平均差異得到,表示如下:
(4)
采用多種匹配方法可以在一定程度上提高穩(wěn)健性,因此本文分別使用最近鄰匹配法、半徑匹配法和核匹配法進行匹配。
最近鄰匹配的規(guī)則為:
C(i|T=1)
(5)
其中i|T=1代表使用推薦系統(tǒng)的消費者,i|T=0代表未使用推薦系統(tǒng)的消費者,C(i|T=1)為與消費者i|T=1成功匹配的消費者i|T=0的集合,即傾向得分與消費者i|T=1最為近似的消費者集合。
半徑搜索的規(guī)則為:
C(i|T=1)
(6)
r 定義為匹配需要的半徑又被稱為卡尺或者卡鉗,上式為所有消費者滿足傾向得分與既定的消費者i的傾向得分差異小于等于r的集合。經(jīng)過初步匹配,同時參考 Becker和Ichino[49]研究中ATT的計算方法得出公式:
(7)
(8)
與最近鄰匹配法、半徑匹配法原理不同,核匹配法引進了非參數(shù)估計概念。為了對消費者i|T=1進行高質(zhì)量匹配,需要將既定PS值附近的未使用推薦系統(tǒng)網(wǎng)購的消費者加權(quán)運算,權(quán)重與消費者i|T=1和消費者i|T=0的PS值之差相關(guān)。
核匹配方法對應的ATT估算公式為:
(9)
本文實驗采用Stata14.0分析實驗數(shù)據(jù),數(shù)據(jù)包含了消費者的基本信息、支出情況、對推薦系統(tǒng)的態(tài)度以及消費者在推薦系統(tǒng)使用前后消費支出變化。本文對相關(guān)數(shù)據(jù)進行預處理,有效數(shù)據(jù)3088份。
在簡單最小二乘法(OLS)回歸分析中只使用treat變量(OLS1)區(qū)分使用推薦系統(tǒng)的消費者和不使用推薦系統(tǒng)的消費者的情況下影響系數(shù)是顯著的。使用推薦系統(tǒng)的消費者比不使用推薦系統(tǒng)的消費者網(wǎng)購支出高26.6%,如表3所示。
考慮結(jié)果的可解釋性,OLS回歸采用對數(shù)線性模型,對因變量消費者網(wǎng)購支出取對數(shù)。為了提高精準性,在此基礎上加入了控制變量的模型(OLS2),仍然得出相同條件下,使用推薦系統(tǒng)的消費者比不使用推薦系統(tǒng)的消費者網(wǎng)購支出高16.7%,如表3所示。教育程度高低對網(wǎng)購支出有顯著作用,原因可能是教育程度越高的消費者對推薦系統(tǒng)更容易接受,故接受度也就比較高。
表3 兩組消費者OLS分析
Probit主要分析了各變量對消費者使用推薦系統(tǒng)的影響。研究中參與傾向得分估算的特征變量有性別、年齡、教育程度、所在地區(qū)等。從表4中可以看出消費者年齡增與使用推薦系統(tǒng)的概率呈反比,消費者的所在區(qū)域越接近城市,使用推薦系統(tǒng)的可能性越高。女性使用推薦系統(tǒng)的概率明顯高于男性。年輕人更易受到推薦系統(tǒng)的影響。
表4 不同匹配方法的Probit估算結(jié)果
通過對消費者特征變量進行傾向得分估算,可研究使用推薦系統(tǒng)的消費者和不使用推薦系統(tǒng)的消費者的得分平衡性是否滿足條件,在此基礎上使用合格的得分計算最終傾向得分。
ATT是指消費者使用推薦系統(tǒng)對消費者網(wǎng)購支出(對數(shù)形式)的平均效應,即使用推薦系統(tǒng)的消費者與不使用推薦系統(tǒng)的消費者在網(wǎng)購支出上的花費差異。從表5可以看出,不論哪一種匹配方法,結(jié)果都顯示使用推薦系統(tǒng)的消費者與不使用推薦系統(tǒng)的消費者有更高的消費,即推薦系統(tǒng)的技術(shù)效應是正向的。
表5 基于傾向得分匹配法的ATT值
但是不同的匹配方法的ATT結(jié)果略有不同:最鄰近匹配法ATT值為18.4%、卡尺0.001匹配法ATT值為14.7%、卡尺0.01匹配法ATT值為14.9%、卡尺0.1匹配法ATT值為14.7%、核匹配法ATT值為15.9%。匹配方法都滿足顯著性(在1%水平顯著)。
表6從三個衡量匹配質(zhì)量的指標來計算不同匹配方法在匹配前后的數(shù)值變化,在匹配前所有消費者的平均標準偏差值為12.7,匹配后的平均偏差均出現(xiàn)了較大幅度的下降,其中最近鄰匹配法平均標準偏差值降為3.7,下降比例為70.9%。
表6 不同匹配方法的匹配質(zhì)量
使用卡尺匹配方法后,匹配質(zhì)量顯著提高。刻度卡鉗為0.1和0.01時,平均標準偏差值分別降2.1和2.2,下降比例分別83.5%和82.7%。所以卡尺匹配的過程能夠很好地平衡使用推薦系統(tǒng)的消費者和未使用推薦系統(tǒng)的消費者的個體特征。核匹配的質(zhì)量介于最近鄰匹配法和卡尺匹配法之間,平均標準偏差值降為2.2,下降比例為82.7%。除此之外,Pseudo-R2匹配前值為0.019,匹配后各匹配方法下降比例均達到89.5%。核匹配法匹配后值非常小,說明匹配變量在使用推薦系統(tǒng)的消費者和不使用推薦系統(tǒng)的消費者之間沒有分布沒有系統(tǒng)差異。且匹配前t檢驗值為7.78,經(jīng)不同方法匹配后,t檢驗值下降比例均達到43.4%。因此傾向得分匹配法將推薦系統(tǒng)從其他影響消費者的因素中獨立出來,證實了使用推薦系統(tǒng)對消費者網(wǎng)購支出有正向作用這一結(jié)果更有可信度。
圖5為匹配后消費者傾向得分密度分布圖,橫軸代表傾向得分數(shù)值,縱軸代表傾向得分概率密度分布。從圖可以發(fā)現(xiàn),相對于匹配前概率密度分布,匹配后,使用推薦系統(tǒng)的消費者和未使用推薦系統(tǒng)的消費者的密度分布曲線均比未匹配的密度分布更加接近,表明匹配結(jié)果較好。處理前的數(shù)據(jù),處理組呈現(xiàn)出尖峰分布,對照組呈現(xiàn)相對平峰分布,處理組和對照組之間差異較大,而經(jīng)過不同方法的傾向得分匹配處理后的數(shù)據(jù),處理組和對照組之間的差異性得到了較為明顯的調(diào)整,兩個組之間的密度分布更為接近,對于后續(xù)的分析意義更為嚴謹。
圖5 傾向得分密度分布圖
平衡性假設要求匹配后各變量在使用推薦系統(tǒng)的消費者組和不使用推薦系統(tǒng)的消費者組不存在顯著差異。匹配后標準偏差的絕對值越小,匹配效果越好。變量的標準化偏差(% bias)大都小于10%。偏差變化的百分比(%Reduct|bias|)反映的是PSM前后數(shù)據(jù)匹配程度的變化,表明平衡性提升的幅度。表7結(jié)果顯示除性別、教育程度外的其他變量在匹配前的t值都是顯著的,而匹配后均不顯著。樣本中特征變量經(jīng)過傾向得分匹配后,標準偏差明顯減小,其中,年齡、地區(qū)等變量的標準化偏差經(jīng)過匹配后下降幅度都達到80%以上,并且在幾乎所有稟賦
表7 傾向得分匹配法匹配前后平衡性分析
特征變量下,使用推薦系統(tǒng)和不使用推薦系統(tǒng)的差異不再顯著使用推薦和不使用推薦的稟賦特征差異基本得到了消除,表明平衡假設得到驗證,即使用推薦和不使用推薦之間消費支出差異的結(jié)論是可信的。
傾向得分匹配模型中分別使用了最近鄰匹配法、半徑匹配法和核匹配法來估算推薦系統(tǒng)的使用對消費者網(wǎng)購支出的影響。不同匹配方法的在趨勢和大方向上相類似,但結(jié)果有一點差異,如表8所示。最近鄰匹配法和核匹配法的損失情況較少,損失率僅為0.19%,其中最近鄰匹配法的設定是無替換最近鄰匹配。半徑匹配法的樣本損失率較高,損失率受卡鉗設置的影響,卡鉗數(shù)值越小范圍越受限,消費者樣本的損失率越高。由于共同支撐區(qū)域的差異可能會導致半徑匹配法估算結(jié)果相對于其他的匹配方法出現(xiàn)樣本代表性降低的情況。
表8 共同支撐導致的消費者樣本損失統(tǒng)計
為了驗證傾向得分匹配法的實證結(jié)果,本文選擇使用工具變量法進行穩(wěn)健性檢驗,如表9所示。由于樣本中的消費者來自不同的省份和地區(qū),考慮到不同省份城市規(guī)模、金融商業(yè)、文化底蘊等虛擬變量可能與未納入模型的遺漏變量存在相關(guān)性。該變量能影響消費者自主選擇是否使用推薦,又對消費者網(wǎng)購的行為有一定影響。如一、二線城市和三、四線城市會因為經(jīng)濟發(fā)展水平高低、文化素養(yǎng)差異會自選擇是否使用推薦,同時導致消費者網(wǎng)購消費支出數(shù)值不平衡的相關(guān)情況,即內(nèi)生性問題。為了消除內(nèi)生性,我們用工具變量法來研究推薦系統(tǒng)對消費者網(wǎng)購支出的影響效應,引入省份虛擬變量作為城市-農(nóng)村虛擬變量的工具變量。結(jié)果顯示使用推薦系統(tǒng)的消費者比不使用推薦系統(tǒng)的消費者網(wǎng)購支出高16.5%,低于回歸方程的結(jié)果26.6%、16.7%,因此能夠改善高估推薦技術(shù)的效應的弊端,與傾向得分匹配法結(jié)果相近,進一步檢驗了匹配結(jié)果的穩(wěn)健性。
表9 工具變量法分析
推薦系統(tǒng)對消費者的消費方式與網(wǎng)購支出的影響是一個值得研究的問題。本文在消費函數(shù)理論背景下,構(gòu)建了推薦系統(tǒng)對消費者網(wǎng)購支出影響研究框架,提出了待驗證假說,并使用傾向得分匹配法進行假說驗證。
本文調(diào)查了消費者層面的數(shù)據(jù),分析了推薦系統(tǒng)對消費者網(wǎng)購支出的影響。推薦系統(tǒng)對消費者網(wǎng)購支出的影響是復雜的,一般認為推薦系統(tǒng)的進步會有較好的經(jīng)濟價值。在消費者自行選擇是否使用推薦系統(tǒng)的情形下,消費者使用推薦系統(tǒng)的行為是由一系列以個人特征和消費習慣等變量決定的,所以我們使用了傾向得分匹配法來分析評估推薦系統(tǒng)對消費者網(wǎng)購支出的效應。并且本文在推薦系統(tǒng)效應的評估分析上使用了不同的傾向得分匹配方法來計算推薦系統(tǒng)對消費者購買力的經(jīng)濟效應,具體匹配方法不同會產(chǎn)生不同的共同支撐區(qū)域,從而造成消費者樣本損失與匹配質(zhì)量的差異,但樣本損失率均低于2.59%。其中,最近鄰居法與核匹配法中消費者樣本信息損失較少,匹配質(zhì)量欠佳??ǔ咂ヅ浞〞崿F(xiàn)較高的匹配質(zhì)量,代價是會損失較多的消費者樣本信息。
研究結(jié)果表明:使用推薦系統(tǒng)對增加消費者的網(wǎng)購支出具有穩(wěn)健的正向作用。調(diào)查發(fā)現(xiàn),OLS1和OLS2計算出使用推薦系統(tǒng)的消費者比不使用推薦系統(tǒng)的消費者人均網(wǎng)購支出高26.6%和16.7%,使用傾向得分匹配法對消費者匹配后得出結(jié)果僅為14.7%,該結(jié)果能改善描述性統(tǒng)計分析以及最小二乘法高估推薦效應的弊端。除此之外,本文使用工具變量法對傾向得分匹配法的結(jié)果進行進一步的穩(wěn)健性檢驗,得出使用推薦系統(tǒng)的消費者比不使用推薦系統(tǒng)的消費者月人均網(wǎng)購支出高16.5%,與傾向得分匹配法結(jié)果基本相同。得出使用推薦系統(tǒng)對增加消費者的網(wǎng)購支出具有穩(wěn)健的正向作用。
除此之外,推薦系統(tǒng)對消費者網(wǎng)購的影響還可以體現(xiàn)在對消費者網(wǎng)購產(chǎn)品和網(wǎng)購忠誠度方面:推薦系統(tǒng)可以著重向33歲以下的女性消費者推薦洗護彩妝產(chǎn)品、向23-33以及43-48的消費者推薦數(shù)碼產(chǎn)品、向33-43歲的消費者推薦家用電器、向33歲以上和28歲以下的消費者推薦醫(yī)療保健產(chǎn)品、向48歲以上的消費者推薦家居清潔產(chǎn)品;同時在主頁面向各年齡段消費者加大關(guān)于休閑零食和服裝鞋襪的推薦。
推薦技術(shù)應注重向28-43歲的消費者加大基于社交關(guān)系的推薦、向38歲以上的消費者推送重復購買商品鏈接和店鋪信息。商品的價格上升會導致消費者的流失,因此要合理控制價格的短期漲幅,增強消費消費者黏性,除此之外推薦系統(tǒng)要積極改善垃圾廣告、虛假買家秀、刷單、泄露隱私等問題,同時提高推薦系統(tǒng)的新穎性,有助于提高消費者的滿意度和忠誠度。將來可進一步細化分析定向和非定向推薦機制對消費者推薦的采納率影響,著重分析平臺間推薦系統(tǒng)差異對消費者網(wǎng)購支出的具體影響。