■俞越 馬佳欣 周睿玲(北京工商大學(xué)經(jīng)濟(jì)學(xué)院)
自古以來(lái),中國(guó)人民重視一日三餐,中國(guó)菜更是以獨(dú)具特色和種類之豐富而名揚(yáng)海外。隨著經(jīng)濟(jì)進(jìn)步,人民的消費(fèi)水平也日漸增高,在餐飲方面的消費(fèi)投入更多,對(duì)于餐飲服務(wù)的要求也更為精細(xì)。中國(guó)餐飲服務(wù)市場(chǎng)穩(wěn)步快速增長(zhǎng)是有目共睹的,行業(yè)總規(guī)模從2013 到2018 年提升1.32 萬(wàn)億,到2022 年將還將保持高速增長(zhǎng),且細(xì)分市場(chǎng)不斷地增加。同時(shí)餐飲業(yè)的O2O 市場(chǎng)也有較好前景。影響對(duì)于一家店鋪的評(píng)分的項(xiàng)目很多,例如不同的經(jīng)營(yíng)時(shí)長(zhǎng),不同的菜系分類,不同地理位置,這些都對(duì)顧客的評(píng)價(jià)都會(huì)產(chǎn)生影響。
通過(guò)對(duì)于相關(guān)論文的閱讀,陳燕(2016)[1]利用層次分析法,得到影響餐飲消費(fèi)者購(gòu)買行為的四大因素:個(gè)人、商家、網(wǎng)絡(luò)、其它。進(jìn)而細(xì)分為14 個(gè)子因素,得出結(jié)論即企業(yè)選址應(yīng)該確定餐飲企業(yè)城市定位,環(huán)境定位如周邊居民收入定位,注重維護(hù)企業(yè)聲譽(yù),注重特色,注重和消費(fèi)者間網(wǎng)絡(luò)溝通;關(guān)于餐飲消費(fèi)行為特征分析,岳子靜[2]基于美團(tuán)網(wǎng)數(shù)據(jù),探究用戶的菜系偏好以及各菜系的傳播與發(fā)展情況;吳麗云[3]以大眾點(diǎn)評(píng)網(wǎng)為例,分析了餐飲消費(fèi)者的網(wǎng)絡(luò)評(píng)論內(nèi)容,發(fā)現(xiàn)不同消費(fèi)水平的消費(fèi)者消費(fèi)偏好有明顯差異,餐飲消費(fèi)者最關(guān)注的前五位要素是:食物、環(huán)境、服務(wù)、價(jià)格和便利性;任彬[4]從性別、地區(qū)、時(shí)間三個(gè)維度對(duì)微博用戶的飲食習(xí)慣特色進(jìn)行了交叉分析,展示了飲食表達(dá)特色的分析結(jié)果。在消費(fèi)行為的研究方面,莊巖[5]從農(nóng)村居民旅游消費(fèi)行為和旅游消費(fèi)結(jié)構(gòu)對(duì)農(nóng)村居民的旅游消費(fèi)進(jìn)行了研究;蔡曉梅[6]從飲食消費(fèi)頻率、時(shí)段分布和消費(fèi)持續(xù)時(shí)長(zhǎng)三方面分析了廣州居民在外飲食消費(fèi)行為的時(shí)間特征;在飲食消費(fèi)行為的空間分布上, 提出了不同類型飲食消費(fèi)行為的圈層分布圖和高低檔次飲食消費(fèi)行為的空間帶狀圖。
這些研究從城市差異、消費(fèi)者飲食偏好差異、餐飲店鋪環(huán)境差異做了分析,還對(duì)飲食消費(fèi)時(shí)段分布等做了分析,給予讀者分析問(wèn)題的多種視角,對(duì)于一些干擾情況,比如確定是否是因?yàn)槟骋粋€(gè)變量造成了被解釋變量有一定差距,還未非常明白地確認(rèn),對(duì)這些因素進(jìn)行排除相互干擾的工作也還未做,本文意在通過(guò)PSM 模型減少干擾度,進(jìn)一步探索不同菜系之間、不同消費(fèi)水平之間的打分差異,并利用半徑匹配法、最近鄰匹配法、核匹配法三種方法檢驗(yàn)匹配效果,發(fā)現(xiàn)顧客的菜系偏好,為店鋪決策帶來(lái)更多結(jié)論。
本文將繁華地區(qū)樣本作為處理組、非繁華地區(qū)樣本作為對(duì)照組,并運(yùn)用PSM 方法展開分析,具體方法如下。
匹配變量用logit 模型來(lái)回歸以確定,根據(jù)AUC 的值可以判斷出是否具有較好的擬合程度。一般而言,當(dāng)我們利用Logit 模型求出選擇的匹配變量,AUC 大于等于0.8 代表有較好的匹配效果。
在考察是否為老店、是否繁華以及什么菜系這些不同的角度帶來(lái)店鋪評(píng)價(jià)打分差異時(shí)的一個(gè)關(guān)鍵性問(wèn)題是,對(duì)一個(gè)店鋪而言只能分析其中一種變量,即為典型的反事實(shí)因果推斷分析框架。Rosenbaum & Rubin(1983)[8]提出了傾向性得分匹配(Propensity Score)方法,通過(guò)找到與處理組(Treated Group)主要特征盡可能相似的控制組(Comparison Group),比較兩者之間的差異效應(yīng),從而更加客觀的評(píng)價(jià)不同身份帶來(lái)的影響差異與效果。傾向性得分被定義為:
其中,X為自變量的多維向量,是一系列可能影響店鋪評(píng)價(jià)打分的變量;D是指標(biāo)變量,取值1 表示為處理組店鋪,取值0 表示對(duì)照組店鋪。理論上,如果我們可以獲得傾向性得分的估計(jì)量(average treatment effect on the treated)則為處理組受到的平均處理效應(yīng) (Becker & Ichino, 2002),如下:
其中,Y1i和Y0i分別為處理組與對(duì)照組店鋪潛在的被顧客評(píng)價(jià)打分所具有的潛在偏好因素。
本文的數(shù)據(jù)主要來(lái)源于北京大學(xué)開放研究數(shù)據(jù)平臺(tái)的“大眾點(diǎn)評(píng)網(wǎng)餐廳口碑?dāng)?shù)據(jù)”[17],其中包含3124 條大眾點(diǎn)評(píng)網(wǎng)廣州站美食分類下多種類型餐飲店店家評(píng)價(jià)和評(píng)論信息。
餐廳的口碑得分是本研究的目標(biāo)變量,主要包括等4 種口碑得分。分類變量主要包括是否老店(營(yíng)業(yè)時(shí)長(zhǎng)大于1000 天的被定義為老店,小于1000 天的為非老店)及各種菜系(包括川菜、粵菜、粥粉面、西餐、日本料理)。相關(guān)的匹配變量包括區(qū)域類別(分為白云區(qū)、海珠區(qū)、天河區(qū)、越秀區(qū)等4 個(gè)區(qū)域)、星級(jí)店鋪評(píng)價(jià)人數(shù),高質(zhì)量店鋪評(píng)價(jià)人數(shù)、推薦率、照片數(shù)、是否可團(tuán)購(gòu)等變量。
表1 對(duì)評(píng)分類指標(biāo)進(jìn)行統(tǒng)計(jì)分析
表1 對(duì)餐廳的觀測(cè)值、均值、標(biāo)準(zhǔn)偏差、最大、最小值進(jìn)行了分析。在3124 個(gè)觀測(cè)值中,餐廳的平均評(píng)分等級(jí)為3.83,其標(biāo)準(zhǔn)偏差小于其余各變量(口味、環(huán)境、服務(wù)),說(shuō)明評(píng)分等級(jí)相對(duì)較為集中。其中餐廳評(píng)級(jí)的最高等級(jí)為5 級(jí),最小值為2 級(jí)。餐廳口味的評(píng)分均值為7.78,標(biāo)準(zhǔn)差大于餐廳評(píng)級(jí)這一變量。值得一提的是,口味打分、環(huán)境打分、服務(wù)打分的最大值都是9.3。餐廳服務(wù)的平均水平在7.79 分左右,其標(biāo)準(zhǔn)偏差在0.75 左右,數(shù)據(jù)的離散程度在4 個(gè)變量中是最大的,其最小值為5.1 分。餐廳服務(wù)質(zhì)量評(píng)分的均值是7.68 左右,標(biāo)準(zhǔn)差僅次于“服務(wù)”這一變量的標(biāo)準(zhǔn)差,其最小值為5.6,是四個(gè)變量中最大的。
我們選取是否為繁華區(qū)為被解釋變量(繁華地區(qū)為實(shí)驗(yàn)組,非繁華地區(qū)為對(duì)照組),區(qū)域類別(分為白云區(qū)、海珠區(qū)、天河區(qū)、越秀區(qū)等4 個(gè)區(qū)域)、星級(jí)店鋪評(píng)價(jià)人數(shù)、高質(zhì)量店鋪評(píng)價(jià)人數(shù)、推薦率、照片數(shù)、是否可團(tuán)購(gòu)等變量做為解釋變量,運(yùn)用logit 模型展開匹配變量的選擇,具體結(jié)果見表2。
表2 匹配變量的篩選
根據(jù)Sturmer,Joshi,Glynn,Avorn,Rothman and Schneeweiss(2006)的研究[9],當(dāng)AUC 達(dá)到0.8 時(shí),匹配效果是比較良好的,從表中可見,模型1-3 的AUC 均達(dá)到了0.845 以上,匹配效果良好。另外,在模型1、模型2 中,可團(tuán)購(gòu)、營(yíng)業(yè)時(shí)間為2-3 年均不顯著,為此,本文選擇模型3 作為最終的匹配結(jié)果。
為了檢驗(yàn)?zāi)P? 的匹配效果,我們還進(jìn)一步做了匹配前后的核密度圖,這里僅用半徑匹配法為例來(lái)展示匹配效果,具體見圖1。
圖1 匹配前后核密度圖對(duì)比
從圖中可以看出,在匹配前對(duì)照組和實(shí)驗(yàn)組的概率分布圖還存在明顯差異,而完成匹配后,對(duì)照組和實(shí)驗(yàn)組的概率分布已經(jīng)很接近了,匹配效果良好。
為了獲取更穩(wěn)健的結(jié)果,本文分別運(yùn)用最近鄰匹、半徑匹配、核匹配等三種匹配方法估計(jì)不同繁華區(qū)域?qū)Σ惋嬈髽I(yè)口碑得分的平均處理效果(ATT),結(jié)果見表3。
首先,我們對(duì)全樣本進(jìn)行分析,從表3 可以看到,三種匹配方法下,處理組(繁華地區(qū))和控制組(非繁華地區(qū))的服務(wù)評(píng)分均呈現(xiàn)出顯著的差異,繁華地區(qū)較非繁華地區(qū)高出0.101-0.126 分;而在菜品評(píng)分,環(huán)境打分方面,繁華地區(qū)與非繁華地區(qū)的ATT 不存在顯著差異。
接著,我們進(jìn)一步按營(yíng)業(yè)天數(shù)分類,探討繁華地區(qū)與非繁華地區(qū)在總評(píng)分、菜品打分、服務(wù)打分和環(huán)境打分等方面的ATT 差異,見表3。對(duì)于營(yíng)業(yè)天數(shù)大于1000 天的店鋪,不存在顯著的差異。對(duì)于營(yíng)業(yè)天數(shù)小于1000 天的店鋪有顯著的差異,尤其是對(duì)于服務(wù)的評(píng)分方面,繁華地區(qū)與非繁華地區(qū)相比高出0.068-0.167 分。
最后,我們還根據(jù)不同菜系分類,探討繁華地區(qū)與非繁華地區(qū)在總評(píng)分、 等方面的ATT 差異,見表4。
由表4,所用方法順序與表4 相同,菜品類型分別是川菜、日式料理、西餐、粵菜、粥粉面。對(duì)于不同菜品來(lái)說(shuō),是繁華地區(qū)與非繁華地區(qū)對(duì)四項(xiàng)評(píng)分類指標(biāo)的打分沒有顯著影響。處理組(繁華地區(qū))和控制組(非繁華地區(qū))的總評(píng)分,以及服務(wù)評(píng)分均在日式料理呈現(xiàn)一定差異,這表明日式料理的服務(wù)評(píng)分可能與店鋪地理位置有關(guān)系。西餐方面,繁華地區(qū)和非繁華地區(qū)在服務(wù)評(píng)分有一定的差異。粵菜的環(huán)境和服務(wù)評(píng)分,粥粉面的環(huán)境評(píng)分,都和店鋪開設(shè)在繁華地區(qū)與否有很大關(guān)系。
由本文得到如下結(jié)論:(1)日式料理的服務(wù)評(píng)分可能與店鋪地理位置有關(guān)系,開店地理位置需仔細(xì)考慮;(2)繁華地區(qū)和非繁華地區(qū)的服務(wù)評(píng)分均呈現(xiàn)出顯著的差異;營(yíng)業(yè)天數(shù)小于1000 天的店鋪對(duì)于服務(wù)的評(píng)分方面有顯著的差異。參考文獻(xiàn)
表3 全樣本、不同營(yíng)業(yè)天數(shù)類別的ATT估計(jì)值
表4 菜系為分類的ATT檢驗(yàn)
[1]陳燕.餐飲消費(fèi)者購(gòu)買行為影響因素探討[J].商業(yè)經(jīng)濟(jì)研究,2016(1):36-38.
[2]岳子靜,章成志,周清清.利用在線評(píng)論挖掘用戶飲食偏好——以北京地區(qū)為例[J].圖書館論壇,2017,37(3):108-115.
[3]吳麗云,陳方英.基于網(wǎng)絡(luò)評(píng)論內(nèi)容分析的餐飲消費(fèi)者行為研究[J].人文地理.2015(5):147-152.
[4]任彬.基于微博的用戶飲食特色及表達(dá)習(xí)慣分析[D].哈爾濱:哈爾濱工業(yè)大學(xué),2005.
[5]莊巖,毛曉東.中國(guó)農(nóng)村居民旅游消費(fèi)行為與消費(fèi)結(jié)構(gòu)分析.改革與戰(zhàn)略[J].2017(9):114-116.
[6]蔡曉梅,賴正均.廣州居民在外飲食消費(fèi)行為的時(shí)空間特征研究[J].人文地理,2008,101(3):79-84.
[7]司倩楠,2018,"大眾點(diǎn)評(píng)網(wǎng)餐廳口碑?dāng)?shù)據(jù)",http://dx.doi.org/10.18170/DVN/EB6KJ1, 北京大學(xué)開放研究數(shù)據(jù)平臺(tái),V1.
[8]Estimating the impact of antenatal care visits on institutional delivery in India: A propensity score matching analysis.
[9]Sturmer, Joshi, Glynn, Avorn, Rothman and Schneeweiss.2006.10.1016/j.jclinepi.2005.07.004.