• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      葡萄酒消費者偏好度調(diào)查研究

      2020-10-21 07:27:58郭夢笛趙小山
      關(guān)鍵詞:因變量葡萄酒變量

      郭夢笛,趙小山

      (天津職業(yè)技術(shù)師范大學(xué)理學(xué)院,天津300222)

      “回歸”統(tǒng)計方法最初由英國生物學(xué)家、統(tǒng)計學(xué)家高爾頓提出,經(jīng)過一段時間的發(fā)展,出現(xiàn)了最小二乘回歸、分位數(shù)回歸、定序回歸等一系列回歸方法。其中,定序回歸模型從提出到現(xiàn)在也經(jīng)過了一定時期的發(fā)展。陳素敬[1]采用均值比較、相關(guān)分析與定序Logit回歸的方法探討了殘疾人福利三角與主觀幸福感存在群類型分化;王晨[2]采用單因素影響分析、定序回歸方法對二手車保值率進行分析;楊蕊嵐[3]運用因子分析和定序回歸模型對云端用戶行為可信性進行了評估,進一步確保云端平臺的安全;繆宇環(huán)[4]采用非參數(shù)檢驗與定序回歸對我國過度教育現(xiàn)狀及其影響因素進行了分析,發(fā)現(xiàn)學(xué)歷、公司規(guī)模等對教育過度現(xiàn)象有著顯著影響;王存同等[5]運用Tobit 模型與定序回歸探究了退休是導(dǎo)致個體健康水平降低的重要因素;姚萱等[6]運用多因素logistic 回歸分析探究了社會人口、健康狀況、知曉情況是居民社區(qū)服務(wù)利用的重要影響因素;楊威等[7]運用回歸分析方法為在體育社會學(xué)中的應(yīng)用提供方法指導(dǎo)。目前,在國際上Sader 等[8]提出以排名的形式合并相關(guān)的評價可以增強定序回歸模型的有效性;Zhu 等[9]提出了合成少數(shù)類過采樣技術(shù)處理非平衡定序回歸問題,該方法在平均絕對誤差方面優(yōu)于典型的過采樣算法;Wu 等[10]得到了不同的影響煤炭事故發(fā)生的因素會產(chǎn)生不同程度的煤炭事故,而管理因素導(dǎo)致更高水平的煤炭事故的結(jié)論;Juliana 等[11]通過定序回歸模型發(fā)現(xiàn)在相同實驗條件下,不同菌株的生物膜階段存在差異,序列回歸模型可以用于預(yù)測腸道鏈球菌生物膜階段與溫度等因素相互作用的關(guān)系。汪宏玲[12]運用方差分析、logistic 定序回歸研究了年齡等因素對消費者口感偏好的影響,可在獲取了消費者年齡等信息的條件下預(yù)測消費者的口感偏好。在進行消費者意愿的研究過程中,左妹華等[13]通過建立logistic 預(yù)測模型,發(fā)現(xiàn)將屬性與具體產(chǎn)品進行匹配并推薦給消費者可擴大在線平臺的購買轉(zhuǎn)化率;胡琴心[14]利用K-means 聚類方法和logistic 回歸發(fā)現(xiàn)離退休人員的生態(tài)消費水平最高。本文采用消費者對于某一種類型的葡萄酒的打分累計得分來判斷消費者的偏好度,運用赤池信息量準則(AIC 信息準則)對數(shù)據(jù)進行定序化處理,采用統(tǒng)計學(xué)中的經(jīng)典回歸模型——定序回歸模型對實際案例進行分析,研究消費者喜好程度的主要影響因素,得出相應(yīng)的結(jié)論,從而可以引導(dǎo)實際的商品銷售過程。

      1 商品的數(shù)據(jù)特征

      在進行研究時,選取的數(shù)據(jù)一般有2 種:實際的交易過程中產(chǎn)生的數(shù)據(jù)和實驗數(shù)據(jù)。在交易過程中,為了解消費者滿意度,通常根據(jù)一線客服人員的直接詢問和經(jīng)驗來進行判斷,在一線客服人員進行詢問時,會發(fā)現(xiàn)這種方式消耗大量的時間成本和精力,市場的龐大、數(shù)據(jù)的復(fù)雜性、各種環(huán)境之間的干擾因素使研究難以開展,所以研究人員研究出了另一種方式來控制變量的干擾因素,即實驗數(shù)據(jù)。實驗數(shù)據(jù)就是在一定的環(huán)境下控制其他的變量因素,只研究所需要的因變量指標(biāo)的一種數(shù)據(jù)。實驗數(shù)據(jù)發(fā)現(xiàn)與因變量相關(guān)的關(guān)系一般是因果關(guān)系,在實驗數(shù)據(jù)的收集過程中存在不足,那就是有時實驗數(shù)據(jù)的獲取是高度簡化的過程,控制了無關(guān)變量的影響,但有時卻與實際環(huán)境相去甚遠。在數(shù)據(jù)的選取過程中,運用八爪魚數(shù)據(jù)收集器在京東官網(wǎng)上收集數(shù)據(jù),選取200 個關(guān)于葡萄酒類型的數(shù)據(jù)。在瀏覽數(shù)據(jù)時發(fā)現(xiàn)數(shù)據(jù)當(dāng)中有許多缺失數(shù)據(jù),其中葡萄酒口味的缺失數(shù)據(jù)45 個,葡萄酒容量的缺失數(shù)據(jù)40 個,進出口的缺失數(shù)據(jù)26 個,葡萄酒類別的缺失數(shù)據(jù)32 個,葡萄酒包裝的缺失數(shù)據(jù)32 個,所以樣本中平均缺失數(shù)據(jù)35 個,因此刪除35 個缺失多的數(shù)據(jù),得到了本文所需的165 個數(shù)據(jù)。由于數(shù)據(jù)有缺失,需要填補缺失數(shù)據(jù)。填補缺失數(shù)據(jù)的方法為在網(wǎng)頁上查詢葡萄酒的類型,再填上所需填補的內(nèi)容。

      在數(shù)據(jù)的收集過程中,為了了解消費者是否滿意商家生產(chǎn)出的商品,從而促使企業(yè)生產(chǎn)出更能讓消費者滿意的商品,在這里讓消費者對商品的滿意程度進行打分,對于一般的線性模型來說,需要消費者對產(chǎn)品的偏好度打出一個連貫的得分,最好得分的分布應(yīng)是正態(tài)分布。但這在實際操作過程中是不可實現(xiàn)的,在實際操作過程中,如果對消費者的調(diào)查是復(fù)雜的,那么長時間的詢問會讓消費者失去配合的興趣,從而導(dǎo)致調(diào)查數(shù)據(jù)的失真。所以在這里采用消費者對于某一種類型的葡萄酒的累計得分來進行判斷。在觀察消費者的累計打分時,由于分數(shù)的復(fù)雜性和多變性,不易看出消費者對哪一種類的葡萄酒偏好比較多,所以本文把累計得分劃分為5 個區(qū)間,相應(yīng)地對應(yīng)喜歡的5 個等級,分別為:無所謂、一般喜歡、比較喜歡、十分喜歡、最喜歡。而由于葡萄酒的種類特別多,在這里進行研究時可以把葡萄酒分為3 大類,分別為:紅葡萄酒、白葡萄酒和其他類型的葡萄酒。

      在邏輯回歸中,所要求的指標(biāo)取值也是只有2 個可能,不適用于目前所要研究的數(shù)據(jù),所以需要一種專門的模型。而定序回歸分析是解決消費者偏好度這一實際問題的常用方法。在使用定序回歸模型時,常用的因變量的取值已經(jīng)不適用,這時需要一種特殊的、專門為定序模型所設(shè)置的因變量的取值,即定序指標(biāo)。

      在進行定序回歸分析前首先要對搜集的數(shù)據(jù)進行定序處理。定序尺度常用幾個自然數(shù)表示數(shù)據(jù)的等級,雖然定序數(shù)據(jù)僅僅代表不同的等級,不能表現(xiàn)出各個等級與等級間的“空間距離”,但是通過進行定序數(shù)據(jù)的處理,可以把離散的隨機數(shù)據(jù)轉(zhuǎn)化為定序的潛變量數(shù)據(jù)。在本文中采集的影響消費者偏好度的因素有葡萄酒的類別、價格、商品毛重、商品容量、進出口、口味與包裝這 7 個因素,分別定義為 X1、X2、X3、X4、X5、X6、X7。通過觀察這些因素可以有以下的劃分:由于紅葡萄酒與白葡萄酒的數(shù)量多,其他種類的葡萄酒數(shù)目少,所以定義紅葡萄酒為0,白葡萄酒為1,其他為2;在進出口類型中劃分為進口葡萄酒與國產(chǎn)葡萄酒,定義進口為0,國產(chǎn)為1;將商品毛重分為4 個區(qū)域:0~3 kg 為1,3~6 kg 為 2,6~9 kg 為 3,9 kg 以上為 4;葡萄酒的價格定義為:0~150 元為 1,150~300 元為 2,300~450 元為 3,450~600 元為 4,600 元以上為 5;葡萄酒的容量定義為:750 mL 為1,其他為0;葡萄酒的口味定義為:半干型為1,半甜型為2,干型為3,甜型為4,其他為5;葡萄酒的包裝定義為:瓶裝為1,禮盒裝為2,箱裝為3,其他為4。在挑取自變量時運用AIC 信息準則對自變量進行分析與選擇。

      在進行變量選擇時,首先對數(shù)據(jù)進行多元線性回歸分析。通過R 程序?qū)?shù)據(jù)進行分析,可得到回歸方程的系數(shù)沒有通過顯著性檢驗。接下來用逐步回歸的方法進行變量的選擇。在逐步回歸過程中,運用AIC信息準則,當(dāng) X1、X2、X3、X4、X5、X6、X7作為回歸方程的系數(shù)時,AIC 的值為170.66。去掉X6時回歸方程的AIC 為167.68,去掉X7時回歸方程的AIC 為167.71。由于去掉X6使得AIC 達到最小,而且去掉X6之后AIC 的值均增加,逐步回歸分析終止,得到最優(yōu)的回歸方程。去掉X6進行回歸分析,發(fā)現(xiàn)回歸系數(shù)的顯著性水平有所提高,X3、X7的顯著性水平仍然不理想,再進行逐步回歸分析優(yōu)化。去掉X7后AIC 的值從167.68增加到了167.82,是所有變量中AIC 的值增加最少的。去掉X7進行多元分析發(fā)現(xiàn)所有的檢驗均為顯著。由此自變量選取了 X1、X2、X3、X4、X5。

      本文消費者的累計評價得分可以用喜歡程度的等級來進行表示,將喜歡程度等級劃分為5 個等級,第1 等級為無所謂,用1 表示;第2 等級為一般喜歡,用2 表示;第3 等級為比較喜歡,用3 表示;第4 等級為十分喜歡,用 4 表示;第 5 等級為最喜歡,用 5表示。這里表示的消費者喜歡程度的等級為所需的因變量。在數(shù)據(jù)選擇完畢后,需標(biāo)準化處理數(shù)據(jù),并進行簡單的分析整理。評價指標(biāo)對消費者偏好度的影響如表1 所示。

      表1 評價指標(biāo)對消費者偏好度的影響

      在每個評價等級的類別上對每個影響因素的均值進行分析。由表1 可以看出,隨著評價等級的增加,也就是隨著人們對商品喜好程度的增加,每種影響因素的均值都穩(wěn)定在一定范圍之內(nèi)。對于商品容量這一影響因素來說,隨著喜好程度的增加,商品的容量逐步減小,這一現(xiàn)象估計是在現(xiàn)實商品銷售過程中,商人為了增加利潤,對消費者滿意的商品進行饑餓營銷;在進出口的均值中可以看出“十分喜歡”的進出口的均值最大,在價格的均值中也可看出對于“十分喜歡”等級的商品的價格最高,這一現(xiàn)象從側(cè)面反映出了價格也是影響喜歡程度的重要因素。

      2 模型介紹

      定序數(shù)據(jù)的回歸分析模型多采用多特質(zhì)多方法模型,這種模型多運用于心理學(xué)研究。然而這種方法在運用時只考慮了個體判斷閾值的等級之間的差別,在運用過程中忽略了不同個體之間的動機。因此,本文采用一種能夠分析定量數(shù)據(jù)的統(tǒng)計模型——定序回歸模型。

      在數(shù)據(jù)分析時,首先要進行模型的選取。為此選取一般的定序因變量回歸模型[15]。解釋變量X =(1,X11,X12,X13,X2,…,X5)′,對應(yīng)的的回歸系數(shù)為 β =(β0,β11,β12,β13,β2,…,β5)′,其中 β0是截距項。然后再定義:X′β=β0+β11X11+β12X12+β13X13+β2X2+…+β5X5。同0-1 邏輯回歸一樣,直接定義Y=X′β+ε 是不適用的,因為X′β+ε 為任意取值的數(shù)值,而Y 為離散型的定性的指標(biāo),因變量Y 為消費者對于商品的偏好程度,而在消費者對產(chǎn)品進行打分時,內(nèi)心會有一個更加精確的產(chǎn)品的偏好,該偏好在進行偏好度調(diào)查時沒有被直觀顯示,是潛在的一種喜好程度,而且這種喜好是連續(xù)的。消費者對于不同類型的相近產(chǎn)品喜好度是相近的,當(dāng)消費者進行產(chǎn)品的選擇購買時就會出現(xiàn)左右為難的情況。最后假設(shè)用M 來表示消費者潛在的偏好,可以由分數(shù)顯示出來。當(dāng)消費者對某一產(chǎn)品更加喜歡時,累計得分就會越高。對應(yīng)地,當(dāng)M 取值特別低時,消費者對某一產(chǎn)品的偏好度就會低。在數(shù)學(xué)上,可以假設(shè)

      式中:c1-c4為4 個喜好程度劃分的的閾值,需要根據(jù)數(shù)據(jù)進行分析,然后預(yù)測評估,c1= 1 500;c2=3 000;c3=4 500;c4=6 000。

      若潛在變量M 為連續(xù)變量,則假設(shè)M 為一個普通的線性模型:M=X′β+ε。假設(shè)ε 服從一個均值為0,方差為1 的標(biāo)準正態(tài)分布,方差為σ 時,則重新定義一個新的殘差得到回歸系數(shù)為潛在變量為因此 var=1 則回歸系數(shù) β 是不成立的。因此選取方差為1 的模型進行求解。

      假設(shè) ε~N(0,1),能夠得出的各個取值 Y 的條件概率。假如Y = 2 時

      P(Y = 2|X)= P(c1≤M < c2)= P(c1-X′β≤ε <c2-X′β)= Φ(c2-X′β)- Φ(c1-X′β);

      假如Y = 3 時

      P(Y = 3|X)= P(c2≤M < c3)= P(c2-X′β≤ε <c3-X′β)= Φ(c3-X′β)- Φ(c2-X′β),……,能夠得到Y(jié) 的條件概率如下

      其中Φ(t)代表的是一個標(biāo)準正態(tài)分布的分布函數(shù),式(2)即為 PROBIT 回歸模型。

      同0-1 變量邏輯回歸與普通的線性回歸類似,對于PROBIT 回歸模型來說研究的是回歸系數(shù)β。對于一個給定的解釋變量Xj,βj=0,在給定其余解釋變量的條件下,該指標(biāo)對于解釋條件概率pk(X′β)沒有影響,因此對于解釋變量條件概率pk(X′β)沒有幫助,對于解釋定序變量Y 也就沒有任何幫助。若βj>0,在給定其余解釋變量數(shù)值恒定時,指標(biāo)Xj的上升就會帶來條件概率的下降,也就是說,因為Y 值取值偏小的可能性小,Y 的取值有可能變得更大。從一方面看,Y 的取值與指標(biāo)是“正相關(guān)”的關(guān)系。若βj<0,在給定其他解釋變量不變的情況下,指標(biāo)Xj的增加會帶來解釋變量條件概率pk(X′β)的增加。因而Y 取值偏小的可能性升高,也就是說Y 的取值有可能變得更小。從另一方面看,Y 的取值與指標(biāo)是“負相關(guān)”的關(guān)系。

      用(Yj,Xj)代表第j 個個體的數(shù)據(jù),其中Yj是因變量,Xj=(Xj1,Xj2,…,Xjp)′是對應(yīng)的解釋變量,那么 Yj與Xj的聯(lián)合似然函數(shù)為β,c)}I(Yj=k),c=(c1,c2,c3,c4)′,對公式做對數(shù)變換后,得到對數(shù)似然函數(shù)為極大化對數(shù)似然函數(shù)得到極大似然估計,為該估計量是相合一致的無偏估計,而且該估計是極限正態(tài)。為每個系數(shù)的估計差做判斷,計算與系數(shù)相對應(yīng)的 p-值,假設(shè)檢驗 H0:βj=0,H1:βj≠0。

      單獨檢驗多水平因素,對比以下模型。

      模型 1 X′β=β0+β11X11+β12X12+β13X13+β2X2+… +β5X5

      模型 2 X′β=β0+β2X2+… +β5X5

      把模型1 與模型2 的離差分別記作DEV1、DEV2。模型1 比模型2 靈活,因此DEV1<DEV2。若原假設(shè)= 0 為真,DEV2-DEV1的值不會特別大。在樣本量足夠大的情況下,服從自由度為df=3 的卡方分布。因此可近似計算出模型全局檢驗的p-值,并以此為依據(jù),對葡萄酒品牌這個因素的顯著性有所判斷。

      評價指標(biāo)的極大似然估計如表2 所示。在表2中,商品毛重、白葡萄酒和其他類別的葡萄酒的參數(shù)估計為正,高度顯著,白葡萄酒的極大似然估計最大,說明白葡萄酒在葡萄酒消費市場中所占的比例最高,具有明顯的產(chǎn)品優(yōu)勢;5 個解釋變量的標(biāo)準誤差均在0~0.3,其中價格的標(biāo)準誤差最小,這也說明價格的數(shù)據(jù)分析更貼合實際。T 統(tǒng)計量在-4~4 之間取值;葡萄酒類別、價格、容量、進出口、商品毛重的p-value 均小于 0.05,所以拒絕原假設(shè),因此 X1、X2、價格、容量、進出口、商品毛重均對消費者對于葡萄酒偏好度的影響是顯著的。價格(X2)是最重要的,因為它對應(yīng)的極大似然估計最大(0.6),這說明了價格對于消費者的重要性。

      表2 評價指標(biāo)的極大似然估計

      3 預(yù)測評估

      Yi為消費者的未知偏好,Xi為某一葡萄酒的各種屬性,分析數(shù)據(jù)建立定序回歸模型,計算得到極大似然估計將此估計用于未來數(shù)據(jù),對其因變量的各種取值的概率估計為

      此概率量化了消費者各種偏好的可能,若偏好程度k 可能性越大,預(yù)測= k。由此定義預(yù)測=把消費者偏好概率預(yù)測pk為最大,定序變量只有 2 個取值的條件下,定義極小化判斷錯誤概率

      考慮加權(quán)錯誤判斷概率WMCR,對稀有樣本給予更大權(quán)重,豐富樣本給予更小權(quán)重,定義WMCR =以加權(quán)錯誤判斷概率為標(biāo)準,產(chǎn)生的預(yù)測為

      極小化MCR 的預(yù)測結(jié)果如表3所示。

      表3 極小化MCR 的預(yù)測結(jié)果

      表3 中,完全準確的預(yù)測樣本量為80;總預(yù)測樣本為165;相應(yīng)的整體錯誤判斷率MCR =(165-80)/165=0.52。

      4 結(jié) 語

      定量數(shù)據(jù)在指標(biāo)評價體系中比較常見,在消費者模型中通常建立定序回歸模型,并對解釋變量及響應(yīng)變量作出解釋,對消費者偏好度作出預(yù)測。本文研究了葡萄酒的類別、價格、容量、商品毛重、進出口對于葡萄酒消費者偏好度的影響程度,可以看出價格與喜好程度有很大的關(guān)聯(lián),商品的價格很大程度上影響了消費者的喜好。消費者更傾向于價格在450~600 元之間的葡萄酒。由于數(shù)據(jù)來源于京東商城,消費者群體年齡、性別等影響消費者購買力的數(shù)據(jù)對于本文來說是未知的,而且消費者的偏好度與消費者的購買水平無法等同,接下來的工作會更詳細地考慮評價指標(biāo),如年齡、性別以及消費者對葡萄酒的了解程度等。因此,完善理論研究進而進行實際意義的指導(dǎo)是下一步研究的重點。

      猜你喜歡
      因變量葡萄酒變量
      調(diào)整有限因變量混合模型在藥物經(jīng)濟學(xué)健康效用量表映射中的運用
      中國藥房(2022年7期)2022-04-14 00:34:30
      自制的葡萄酒為啥愛“上頭”?
      抓住不變量解題
      也談分離變量
      適應(yīng)性回歸分析(Ⅳ)
      ——與非適應(yīng)性回歸分析的比較
      十款葡萄酒與十塊石頭
      收藏界(2018年3期)2018-10-10 05:34:08
      偏最小二乘回歸方法
      法國葡萄酒何以譽滿天下
      中國商界(2017年4期)2017-05-17 04:36:48
      SL(3,3n)和SU(3,3n)的第一Cartan不變量
      分離變量法:常見的通性通法
      临沭县| 额敏县| 东安县| 洛扎县| 连南| 西充县| 嘉义市| 丹阳市| 阜南县| 宝清县| 莱芜市| 盐山县| 蛟河市| 奉新县| 高台县| 凭祥市| 正镶白旗| 元阳县| 文成县| 泸州市| 温宿县| 绥化市| 大悟县| 滕州市| 伽师县| 故城县| 曲阜市| 镇康县| 博湖县| 五峰| 东城区| 高清| 屯昌县| 岐山县| 霍林郭勒市| 绥德县| 吉隆县| 临澧县| 定南县| 横峰县| 建始县|