李紅霞
(重慶工商大學(xué) a.管理學(xué)院;b.電子商務(wù)及供應(yīng)鏈重慶市重點實驗室,重慶 400067)
?
基于主成分logistic回歸模型的餐飲商務(wù)信息意識研究*
李紅霞a,b
(重慶工商大學(xué) a.管理學(xué)院;b.電子商務(wù)及供應(yīng)鏈重慶市重點實驗室,重慶 400067)
摘要:數(shù)據(jù)挖掘技術(shù)日趨成熟,廣泛應(yīng)用于金融、地產(chǎn)、投資、評估等各個領(lǐng)域。數(shù)據(jù)挖掘技術(shù)亦可應(yīng)用于餐飲業(yè),為其經(jīng)營決策做出分析。其他領(lǐng)域的數(shù)據(jù)挖掘的成功案例也可以引用到餐飲行業(yè)中。本文對餐飲人士在餐飲商務(wù)中是否具備信息意識、對信息意識的重視程度進行調(diào)查,利用數(shù)據(jù)挖掘中主成分分析和logistic回歸處理和分析收集來的數(shù)據(jù),從而說明數(shù)據(jù)挖掘在餐飲業(yè)管理中的重要意義,反映餐飲人士信息意識狀況。利用數(shù)據(jù)挖掘技術(shù)對餐飲商務(wù)資訊進行管理勢必提高企業(yè)效率和盈利水平,促進餐飲業(yè)健康穩(wěn)定的發(fā)展。
關(guān)鍵詞:數(shù)據(jù)挖掘;餐飲商務(wù);主成分分析;logistic回歸;信息意識
引言
近年來,數(shù)據(jù)挖掘引起了信息產(chǎn)業(yè)界的極大關(guān)注,其主要原因是存在大量數(shù)據(jù),可以廣泛使用,并且迫切需要將這些數(shù)據(jù)轉(zhuǎn)換成有用的信息和知識。數(shù)據(jù)挖掘是從大量數(shù)據(jù)中挖掘出隱含的、先前未知的、對決策有價值并能被人們所理解的模式(知識)的高級數(shù)據(jù)處理過程(胡家聲,2012)[1]。數(shù)據(jù)挖掘的任務(wù)主要是關(guān)聯(lián)分析、聚類分析、分類、預(yù)測、時序模式和偏差分析等。數(shù)據(jù)挖掘技術(shù)日趨成熟,廣泛應(yīng)用于金融、地產(chǎn)、投資、評估等各個領(lǐng)域。數(shù)據(jù)挖掘技術(shù)亦可應(yīng)用于餐飲業(yè),為其經(jīng)營決策做出分析。其他領(lǐng)域的數(shù)據(jù)挖掘的成功案例也可以引用到餐飲行業(yè)中。
我國現(xiàn)有各類飯店、餐館數(shù)量龐大,可是,據(jù)相關(guān)調(diào)查顯示,大部分餐館對于信息化管理水平的運用仍處在初級摸索階段。許多餐飲管理者,由于缺乏對先進管理理念的理解,以及對信息化的認(rèn)識和意識不夠,再加上目光短淺舍不得投入,致使餐館的管理,至今仍停留在一個比較原始和落后的水平上,餐館的發(fā)展因此很受限。在科技飛速發(fā)展的今天,餐飲管理者也應(yīng)當(dāng)與時俱進,不斷提高自己對信息化管理的先進意識,只有這樣,才能使餐館在競爭中不斷發(fā)展和前進。本文對大中型餐飲企業(yè)進行了餐飲商務(wù)問卷調(diào)查,并進行數(shù)據(jù)挖掘,以研究餐飲老板以及餐飲職業(yè)經(jīng)理人等餐飲人士在餐飲商務(wù)中是否具備信息意識,對信息意識的重視程度以及信息意識在企業(yè)戰(zhàn)略角度上的影響。
數(shù)據(jù)挖掘技術(shù)日趨成熟,廣泛應(yīng)用于金融、地產(chǎn)、投資、評估等各個領(lǐng)域,尤其在國內(nèi),數(shù)據(jù)挖掘理論被運用到多個領(lǐng)域進行了研究,如國內(nèi)學(xué)者黃解軍[2](2004)基于數(shù)據(jù)挖掘進行了電子商務(wù)的策略研究,他將數(shù)據(jù)挖掘運用在企業(yè)資源計劃、客戶關(guān)系管理、產(chǎn)品數(shù)據(jù)管理、商業(yè)信用評估等方面,有利于促進企業(yè)開拓市場,優(yōu)化企業(yè)資源,提高企業(yè)的經(jīng)營效率和管理水平。而后姚淼[3](2009)介紹了數(shù)據(jù)挖掘在電子商務(wù)中的運用,將關(guān)聯(lián)分析、序列模型分析、分類分析、聚類分析應(yīng)用在電子商務(wù)營銷、電子商務(wù)網(wǎng)站系統(tǒng)和安全、客戶管理、網(wǎng)絡(luò)廣告等方面,通過對電子商務(wù)過程中的各種數(shù)據(jù)和信息的挖掘,為商務(wù)活動的具體實施提供決策基礎(chǔ),使得電子商務(wù)能夠真正的更快、更好、更高效地發(fā)展。劉紅光[4](2011)則定性描述了數(shù)據(jù)挖掘在網(wǎng)絡(luò)信息資源管理中的應(yīng)用,主要包括優(yōu)化組訓(xùn)方法及教學(xué)訓(xùn)練手段、合理設(shè)置教學(xué)訓(xùn)練內(nèi)容、轉(zhuǎn)變學(xué)院學(xué)習(xí)行為模式、科學(xué)評價教學(xué)訓(xùn)練效果、改進信息化教育訓(xùn)練系統(tǒng),提出讓技術(shù)真正與教育訓(xùn)練整合在一起,對提高軍事教育訓(xùn)練的質(zhì)量和效益意義深遠。不僅在國內(nèi),國外同樣有學(xué)者將數(shù)據(jù)挖掘運用在各種商業(yè)行為中,取得了豐碩的成果。滕廣青、毛英爽[5](2005)從商業(yè)機構(gòu)和非營利組織兩大領(lǐng)域出發(fā),總結(jié)和分析了國外近年來數(shù)據(jù)挖掘技術(shù)在零售、金融、電信、電子商務(wù)、工業(yè)生產(chǎn)和生物與醫(yī)學(xué)、天文與氣象、地理與環(huán)保等領(lǐng)域的應(yīng)用,并發(fā)現(xiàn)隨著數(shù)據(jù)挖掘的迅猛發(fā)展,其被運用的領(lǐng)域數(shù)量和在各種領(lǐng)域的運用次數(shù)逐年上升??梢婋S著數(shù)據(jù)挖掘技術(shù)應(yīng)用范圍的不斷擴展,人類社會的方方面面幾乎都會涉及數(shù)據(jù)挖掘。盡管數(shù)據(jù)挖掘原本是作為一項技術(shù)出現(xiàn)的,但由于數(shù)據(jù)挖掘本身獨有的理念給人們處理解決各類問題都提供了一個新的思路和方法,在這一點上,數(shù)據(jù)挖掘一定程度上等同于一種方法論,在未來的一段時期里必將對人類生產(chǎn)生活產(chǎn)生重大影響。
數(shù)據(jù)挖掘技術(shù)已經(jīng)發(fā)展到了一定的程度,其不僅運用在金融、電子商務(wù)、地產(chǎn)、投資等熱門行業(yè),還被運用在餐飲業(yè)的各個方面。周大興[6](2012)將數(shù)據(jù)分析應(yīng)用在餐飲企業(yè)經(jīng)營中,以小南國和至味館兩個餐飲公司為實例,建立成本回歸模型,對餐飲企業(yè)的場地、能源成本、人力資源進行了研究。數(shù)據(jù)挖掘運用在餐飲企業(yè)的經(jīng)營策略中,運用關(guān)聯(lián)規(guī)則和聚簇分析,研究了影響顧客點菜的因素,并且對顧客進行了分類,從而有利于企業(yè)決策者作決策(孔令娟,2012;付婷,2015)[7,8]。本文通過調(diào)查問卷,收集餐飲企業(yè)的管理數(shù)據(jù),涉及菜品的形式、服務(wù)、采購、經(jīng)營,等等。為了從海量數(shù)據(jù)中挖掘信息,本文基于數(shù)據(jù)挖掘中的主成分分析的logistic回歸模型,定性研究餐飲商務(wù)信息意識,分析了餐飲的各種商務(wù)信息對決策者進行決策的影響。因此,餐飲數(shù)據(jù)挖掘技術(shù)就是在這些信息中查找到有效的信息用來幫助監(jiān)管部門及投資部門進行有效監(jiān)督和投資管理,可以幫助餐飲管理者分析客戶以往的需求趨勢并預(yù)測未來。
一、研究方法
(一)主成分分析
設(shè)模型樣本數(shù)n,X=(X1,X2,…,Xm)T是一個m維隨機向量,是問卷中每個問題調(diào)查者的選項,m是選取的題目的個數(shù)。主成分可以從n×m矩陣的特征向量來推算,令λ是相應(yīng)的特征值,∏是相應(yīng)的特征向量,則第k個主成分等于
(1)
Yk的方差以及Yk和Yl之間的協(xié)方差等于
(2)
(3)
要使得式(2)最小,求解可得到其特征根。由于特征值λ1≥λ2≥…≥λk…≥λm都是非負數(shù),因此求得其特征向量。再將其代入式(1)就可以求解主成分。如果在模型自變量過多的情況下,假如較少的k個主成分就能夠解釋原始變量的大部分方差,就說明這k個主成分可以在原始信息丟失很少的情況下對原有數(shù)據(jù)進行替換,并且這k個主成分之間是不相關(guān)的。
(二)二項logistic回歸模型
在餐飲企業(yè)是否重視商務(wù)信息的研究中,因變量是二分類的,且其取值是在0—1之間的,違背了一般線性回歸的基本前提假設(shè)。因此,本文采取logit轉(zhuǎn)換,使其取值在整個實數(shù)集內(nèi),采用二項logistic回歸方法研究餐飲企業(yè)是否重視商務(wù)信息與各主成分之間的關(guān)系。因此,本文建立的二項logistic回歸方程為:
(4)
其中P是餐飲企業(yè)重視餐飲商務(wù)信息的概率,上式右邊表示餐飲企業(yè)重視餐飲商務(wù)信息的分類值。其中F1,F(xiàn)2…,F(xiàn)k是餐飲企業(yè)重視餐飲商務(wù)信息的解釋變量(本文中即每個主成分),β0為常數(shù)項,β1,β2…βk是解釋變量的logit系數(shù)。
二、實證分析
(一)數(shù)據(jù)來源及其描述
1.數(shù)據(jù)來源
調(diào)查的方式主要是實體問卷調(diào)查和網(wǎng)絡(luò)問卷調(diào)查。實體問卷調(diào)查對象主要是重慶市江北區(qū)和渝北區(qū)域內(nèi)的大中型的中餐店、西餐廳、咖啡茶藝廳和快餐店美食街;網(wǎng)絡(luò)調(diào)查主要在認(rèn)識的餐飲老板和一些餐飲人士交流群里面,請大家參與調(diào)查。本文采用隨機抽樣方法發(fā)放問卷116份,其中有效問卷100份,有效百分比達86.21%。
2.調(diào)查數(shù)據(jù)的描述統(tǒng)計分析
(1)調(diào)查用戶特征
在100份有效樣本中,有45%的中餐廳、20%的茶藝廳和咖啡廳、13%的西餐廳以及22%的其他類型。其中,所調(diào)查的管理者大多數(shù)都從事了該行業(yè)5年以上,占總調(diào)查人數(shù)的74%,僅有20%的管理者從事該行業(yè)還不到1年,這也可以充分說明此次調(diào)查的可信度。
圖1 調(diào)查餐廳分布餅圖
(2)調(diào)查對象對餐飲商務(wù)信息重要度認(rèn)識的基本態(tài)度分布
在調(diào)查中,有66%的餐飲企業(yè)應(yīng)用了餐飲管理軟件,另外34%的餐飲企業(yè)并未采用餐飲管理軟件。我們還發(fā)現(xiàn),所調(diào)查的餐飲企業(yè)管理人員中,有55%的人經(jīng)常關(guān)注政府發(fā)布的與餐飲相關(guān)的政策,40%的人偶爾關(guān)注,仍然有5%的人根本不關(guān)注政府發(fā)布的與餐飲相關(guān)的政策。除此之外,我們還發(fā)現(xiàn)仍然有10%的餐飲企業(yè)不知道采用信息化技術(shù)管理餐館的作用。
(二)主成分分析
問卷調(diào)查數(shù)據(jù)各問題從不同方面說明了餐飲企業(yè)對商務(wù)信息的重視程度,由于問題數(shù)目過多,用一般的二項logistic回歸模型會產(chǎn)生指標(biāo)的多重共線性問題,因此,本文應(yīng)用主成分分析法,將各個指標(biāo)的影響分配到5個主成分上,不僅達到了降維的效果,還很好地解決多重共線性的問題。
表1 主成分分析各因子解釋原有變量總方差的情況
從表1可以看出,前五個主成分對模型的解釋程度就超過了80%,這意味著它們包含了企業(yè)是否重視商務(wù)信息指標(biāo)中的大部分信息。在綜合考慮各主成分對餐飲企業(yè)是否重視商務(wù)信息的經(jīng)濟意義以及各種統(tǒng)計量的基礎(chǔ)上,本文將五個主成分作為二項logistic回歸模型的自變量。從表2可以得到各個變量在5個因子上的載荷。
表2 因子載荷矩陣
提取方法:主成分
a. 已提取了 5 個成分
(三)結(jié)合主成分分析的logistic回歸分析
從上述主成分分析過程得到五個主成分的因子得分值,并將其作為本文二項logistic回歸模型的因變量,問卷調(diào)查中問題2的統(tǒng)計數(shù)據(jù)作為因變量進行模型擬合,得到擬合結(jié)果如下表3和表4(在這里由于篇幅的原因僅選取了步驟三的擬合數(shù)據(jù))。
表3 二項logistic回歸模型擬合優(yōu)度分析
從擬合優(yōu)度上看,表3步驟三剔除變量的Cox的R方值以及Nagelkerke的R方值分別為0.494和0.684,一定程度上說明模型擬合效果不錯;表4中步驟三剔除變量后保留了第一、第四和第五個主成分,從表中可以看出各變量的顯著性p值均很小,可以達到擬合要求。根據(jù)表2,將第一、第四以及第五個主成分分別定義為:餐飲行業(yè)信息的了解程度、培訓(xùn)和相關(guān)政策的了解以及企業(yè)內(nèi)部戰(zhàn)略發(fā)展分析工作。
表4 二項logistic分析結(jié)果
a. 在步驟 1 中輸入的變量: FAC1_1, FAC2_1, FAC3_1, FAC4_1, FAC5_1
從表4可以得出第一個主成分和第五個主成分對企業(yè)是否關(guān)注商務(wù)信息有正影響,而第四個主成分對其產(chǎn)生負的影響。從影響大小上看,第一主成分的影響力最大,第五主成分次之,而第四主成分最小。
其logistic表達式可表示為:
(5)
其中p代表餐飲企業(yè)注重商務(wù)信息的概率,而1-p代表其不注重商務(wù)信息的概率。
三、結(jié)論及建議
(一)二項logistic回歸模型在餐飲商務(wù)信息意識研究方面的意見和展望
本文選用logistic回歸模型,將其應(yīng)用在餐飲商務(wù)信息意識的影響因素分析上。選用該模型有兩大優(yōu)勢:一是Logistic回歸模型能夠很好地解決非線性問題,且可以解決多個自變量的問題,確定各自變量對因變量的影響強度,模型相對較成熟,準(zhǔn)確度較高。二是該模型不要求變量服從多元正態(tài)分布,適用范圍更廣。另外,對于決策者是否有餐飲商務(wù)信息意識這一定性因變量,用二項logistic模型恰好得以運用,從文章的結(jié)論也可見其擬合效果較好。
(二)實證結(jié)論和意見
從二項logistic模型分析的結(jié)論來看,第一和第五個主成分,即餐飲行業(yè)信息的了解程度和企業(yè)內(nèi)部戰(zhàn)略發(fā)展分析工作兩個方面,其參數(shù)分別是3.522和1.016,相對其他因素來說,其值較大,說明這二者對餐飲商務(wù)信息意識會產(chǎn)生較大的影響。同時,這兩個參數(shù)對應(yīng)的Wals統(tǒng)計量的值較大,其p值較小,則應(yīng)該拒絕原假設(shè),即認(rèn)為該因素的作用較為顯著,說明餐飲行業(yè)信息的了解程度和企業(yè)內(nèi)部戰(zhàn)略發(fā)展分析工作兩個要素對餐飲商務(wù)信息意識的影響大且顯著。而第四個因素,即培訓(xùn)和相關(guān)政策的了解方面,其參數(shù)數(shù)值較小且不顯著,說明該要素對餐飲商務(wù)信息意識的影響小且不顯著。因此,本文建議餐飲業(yè)管理者或者決策者:首先,應(yīng)該重視搜集并了解餐飲行業(yè)信息,作為該行業(yè)的一分子,了解行業(yè)宏觀發(fā)展?fàn)顩r和發(fā)展趨勢,有利于企業(yè)自身定位,一方面可以以其他發(fā)展較好的企業(yè)為參考,另一方面可以看準(zhǔn)形勢發(fā)展,提高商務(wù)信息意識,將有利于本企業(yè)的未來發(fā)展;其次,企業(yè)內(nèi)部戰(zhàn)略發(fā)展分析也是餐飲商務(wù)信息的一個重要方面,了解企業(yè)自身的經(jīng)營狀況,將有助于企業(yè)在行業(yè)中的定位,提高商務(wù)信息意識,從主觀方面找到發(fā)展中存在的根本問題;再次,建議充分利用企業(yè)經(jīng)營過程中的信息數(shù)據(jù),實現(xiàn)餐飲管理信息化,使用餐飲管理軟件,不但可以提高餐飲企業(yè)日常管理的工作效率,還可以將現(xiàn)有的數(shù)據(jù)進行自動整合,并以此為依據(jù),幫助企業(yè)管理者作出科學(xué)、嚴(yán)密、 精細化的戰(zhàn)略決策,其優(yōu)點在于錯誤少且信息快、準(zhǔn)而全。也就是說,餐飲管理軟件不單單是操作層面上的作用,應(yīng)慢慢地轉(zhuǎn)向戰(zhàn)略層面的管理作用;最后,應(yīng)該重視對企業(yè)雇員的培養(yǎng),包括素質(zhì)的提高和技能的提升等,可以通過各種形式的員工培訓(xùn)來實現(xiàn),更可以在招聘雇員時以多種方式招賢納才,如招聘海報、報紙、人才市場、網(wǎng)絡(luò)招聘,等等,這是餐飲商務(wù)信息意識提高的一個重要體現(xiàn)。
[參考文獻]
[1] 古家聲.數(shù)據(jù)挖掘在壽險客戶分析中的應(yīng)用[D].華南理工大學(xué),2012.
[2] 黃解軍,萬幼川.基于數(shù)據(jù)挖掘的電子商務(wù)策略[J].計算機應(yīng)用與軟件,2004,21(7):12-13.
[3] 姚淼.數(shù)據(jù)挖掘在電子商務(wù)中的應(yīng)用[J].圖書情報論壇,2009(1):56-58.
[4] 劉紅光.數(shù)據(jù)挖掘在網(wǎng)絡(luò)信息資源管理中的應(yīng)用[J].中國信息技術(shù)教育,2011(18):55-57.
[5] 滕廣青,毛英爽.國外數(shù)據(jù)挖掘應(yīng)用研究與發(fā)展分析[J].統(tǒng)計研究,2005(12):68-70.
[6] 周大興.數(shù)據(jù)分析在餐飲企業(yè)經(jīng)營中的應(yīng)用[D].上海交通大學(xué)碩士論文,2012.
[7] 孔令娟.數(shù)據(jù)控制在連鎖餐飲業(yè)中的研究和應(yīng)用[D].南京理工大學(xué),2012.
[8] 付婷.大數(shù)據(jù)在餐飲行業(yè)的應(yīng)用研究[J].中國商貿(mào),2015(15):147-149.
(責(zé)任編校:朱德東)
Research on the Catering Business Information Consciousness Based on Logistic Regression Model of Principal Component Analysis
LI Hong-xiaa,b
(a.ChongqingKeyLaboratoryofElectronicCommerceandSupplyChainSystem;b.SchoolofManagement,ChongqingTechnologyandBusinessUniversity,Chongqing400067,China)
Abstract:Data mining technology has become increasingly mature and has been widely used in financial, real estate, investment, evaluation, banks and other fields. Data mining techniques can be applied to the catering industry to make analysis of its business decisions. Data mining in the field of other successful cases can also refer to the catering industry. This article has carried out the survey on whether the dining people in the restaurant business had information awareness and the extent the people emphasized information awareness. Principal component analysis and logistic regression in data mining process are used to analyze the collected data so as to illustrate the important value of data mining in the catering industry management and to reflect the restaurant information awareness of the dining people. Using data mining technology on food and beverage business information management is bound to improve business efficiency and profit level and to promote the healthy and stable development of the catering industry.
Key words:data mining; catering business; principal component analysis; logistic regression; information awareness
doi:10.3969/j.issn.1672- 0598.2016.04.008
[收稿日期]2016-01-21
[基金項目]重慶市教委科學(xué)技術(shù)項目(KJ1400631);重慶市教育規(guī)劃項目(2014-GX-092);重慶市企業(yè)管理研究中心開放基金項目;重慶市教委人文社會科學(xué)項目(14SKH07)。
[作者簡介]李紅霞(1976—),女,研究生,重慶工商大學(xué)管理學(xué)院副教授,電子商務(wù)及供應(yīng)鏈系統(tǒng)重慶市重點實驗室研究員,主要從事信息管理研究。
中圖分類號:F719.3
文獻標(biāo)志碼:A
文章編號:1672- 0598(2016)04- 0056- 06