呂露 林家欽
一、引言
校園一卡通系統(tǒng)以學校校園網(wǎng)為載體進行建設,是集身份識別、校內消費、校務管理、金融服務為一體的新型數(shù)字化校園核心應用,它不僅是數(shù)字化校園系統(tǒng)的重要的有機組成部分之一,是數(shù)字化校園的基礎工程,是教育信息化建設的基礎支撐點之一,也是學?!皵?shù)字化校園”建設的切入點。校園卡可以作為就餐卡、借書卡、上機卡、醫(yī)療收費卡、洗澡卡、購物卡、門禁卡、乘車卡等。隨著數(shù)字化校園的迅速發(fā)展,國內外很多高校具備了比較成熟的“校園卡”網(wǎng)絡設施,校園卡時刻都會產(chǎn)生大量的數(shù)據(jù),隱藏著對高校管理有用的消費規(guī)則和信息。
校園卡作為數(shù)字化校園建設的主要載體,通過數(shù)據(jù)挖掘技術從中挖掘出隱含信息是極其有價值的。以上海大學為例,除開寒暑假和國定節(jié)假日,在校期間平均每日的學生食堂刷卡消費達六萬余次,金額在40萬左右。龐大的數(shù)據(jù)背后隱藏著很多有規(guī)律有價值的信息,有了消費流水信息,我們就能從中獲取學生消費偏好、消費水平,通過數(shù)據(jù)挖掘,提供食堂管理建議,提高食堂管理效率,更好地為全校師生服務。
二、研究思路
高校食堂作為廣大師生在校期間用餐的主要提供,安全可口的菜品、良好的用餐環(huán)境和便捷的服務是食堂管理工作的主要任務。為了分析現(xiàn)階段食堂的服務水平,本文將運用商業(yè)智能工具,根據(jù)食堂流水數(shù)據(jù)包含的信息,結合學校數(shù)據(jù)庫的學生信息,考慮從消費人員類型、消費時間、空間等多個角度去分析食堂消費數(shù)據(jù)。
因此,在數(shù)據(jù)收集時,學生信息表收集有包含性別和年級的字段,食堂消費流水表收集包含有區(qū)分消費時間的字段,食堂設備表包含將每一筆消費對應到具體食堂的字段。按照數(shù)據(jù)挖掘的過程,本文研究分為數(shù)據(jù)選取,數(shù)據(jù)預處理、數(shù)據(jù)分析和建模、結果分析和改進四個階段。
三、食堂學生消費數(shù)據(jù)挖掘應用
(一)數(shù)據(jù)選取
2017年上海大學所有食堂消費金額及刷卡次數(shù)的時間序列圖如圖1所示。
從圖1中可以看到有3個明顯特征:1、寒暑假和國慶中秋長假期間,食堂刷卡次數(shù)和金額明顯減少;2、除去寒暑假,以一周為周期,呈現(xiàn)出周末刷卡次數(shù)和金額明顯少于周一至周五的規(guī)律,經(jīng)查實,主要由于很多本地學生周末不在校,只有部分食堂在周末開放;3、除去節(jié)假日和寒暑假,食堂總體消費的數(shù)據(jù)整體比較平穩(wěn),起伏不大。
根據(jù)上述分析,本文選取了2017年9月11日(本學年開學時間)至2017年11月30日中周一至周五,共計54天的食堂消費流水數(shù)據(jù)。
(二)數(shù)據(jù)預處理
第一步,選取各個表中的有用字段。
1、選取的食堂消費流水表的字段有:持卡人姓名、學/工號、刷卡日期、刷卡時間、金額、食堂消費終端POS機;
2、選取的人員信息表的字段有:姓名、學/工號、性別、持卡人員類型、身份證號碼;
3、選取的食堂設備表的字段有:食堂消費終端POS機、食堂、校區(qū)、座位數(shù)。
第二步,數(shù)據(jù)清理和轉換。將食堂消費流水表中這54天的數(shù)據(jù)篩選出來,選取消費數(shù)據(jù),去除里面的充值數(shù)據(jù),刷卡時間改為數(shù)值格式,通過數(shù)值區(qū)間選取來區(qū)分早中晚餐。
第三步,建立相關字段的關聯(lián)關系,如圖2所示。
(三)數(shù)據(jù)分析和建模
本文主要采用FineBI商業(yè)智能產(chǎn)品來進行食堂數(shù)據(jù)的挖掘分析。為了達到從消費人員類型、消費時間、空間等多個角度去分析食堂消費數(shù)據(jù)的目的,下面從四個方面去進行數(shù)據(jù)挖掘。
1、早、中、晚三餐分別最受學生歡迎的食堂
本文根據(jù)選取的時間區(qū)間內的每個食堂的所有POS機刷卡次數(shù)之和來定義該食堂受歡迎程度,次數(shù)越多說明學生更喜歡在該食堂就餐。為了便于分析,統(tǒng)一將上午10點之前的消費認為屬于早餐,10點至下午3點的消費認為屬于中餐,下午3點之后的消費認為屬于晚餐。篩選出消費主體為在校本科生和研究生的消費記錄,部分結果展示在表1。
結果顯示有以下幾點特征:1、益新食堂在早、中、晚都排名第一;2、中餐和晚餐前十名的餐廳相同,只是排序上有差別,說明總體來看,學生在中餐和晚餐上的餐廳選擇上主要集中在這幾個食堂3、早餐和晚餐有多功能餐廳、能量小站、服務站點這些店面的消費,說明早、晚餐有部分同學可能由于上課原因、個人原因等,會選擇不在食堂消費,而是在這種學校便利餐廳解決,中餐時間學生則更傾向去食堂就餐;4、中餐刷卡次數(shù)要多于早餐和晚餐,說明早餐和晚餐不在食堂就餐的學生人數(shù)要多于中餐。
2、男、女生分別最喜歡的食堂
分析對象為在校本科生和研究生,在選取將食堂消費流水表于人員信息表中的學號字段做關聯(lián),在性別欄對結果進行分別展示,部分結果展示在表2。
結果顯示有以下幾點特征:1、益新食堂在男、女都排名第一;2、男生刷卡總次數(shù)多于女生,說明男生比女生更傾向于在食堂就餐;3、男女刷卡次數(shù)最多的前五個食堂中有4個相同,說明總體上,男女在選擇的上有相似性;4、女生比男生更偏愛爾美一樓、爾美二樓、得月這三個食堂、而男生比女生更偏愛益新、吾馨。其中爾美二樓和得月食堂是學校食堂中價位偏高、種類更豐富的食堂,益新和吾馨食堂是更偏向大眾化的食堂。
3、不同年級學生分別最喜歡的食堂
考慮到研究生在校時間不穩(wěn)定,對分析結果會造成偏差,這部分的分析針對本科生展開,部分結果展示在表3。
結果顯示有以下幾點特征:1、大四刷卡次數(shù)顯著少于其他三個年級,刷卡總次數(shù)不到大一的一半,說明可能由于校外實習,課程較少,大四學生在食堂消費次數(shù)就少很多;2、大一學生在益新食堂的消費要明顯高于其他三個年級;3、各年級食堂消費次數(shù)排名相似性低,說明各年級學生的喜好有一定差異。
4、食堂早、中、晚餐高峰期客流量分析
這部分的分析不限制人員類型,所有持卡人員刷卡記錄都要被考慮在內。根據(jù)觀察,早餐高峰期在7:00-8:00,中餐高峰期在11:30-12:30,晚餐高峰期在17:00-18:00。為了便于客流量分析比較,將刷卡次數(shù)與座位數(shù)之比作為一個度量參數(shù),將此參數(shù)稱作食堂坐席率,記為α,那么,坐席率越大,說明食堂越擁擠。
通過FineBI中加入計算指標α,得到食堂坐席率的折線圖分析,結果顯示有以下幾點特征:1、益新食堂三餐在高峰期都達到擁擠程度;2、有些食堂不提供早餐,因此早餐座位利用率為0;中餐和晚餐高峰都達到嚴重擁擠的食堂,經(jīng)了解,這些食堂的特點是座位數(shù)少,造成了座位利用率α值高。
(四)結果分析和改進
據(jù)了解,益新食堂處在學生宿舍區(qū)與教學樓之間,位于學校中心地帶。而益新食堂在四部分的分析中刷卡次數(shù)和人數(shù)的統(tǒng)計都占據(jù)大部分的比例,這充分說明,食堂的地理優(yōu)勢會直接影響學生的選擇。那么根據(jù)這個分析結果,學校在擴建食堂上可以考慮在學生的宿舍樓和教學樓的必經(jīng)之路上,同時這些食堂的安全和服務水平要得到有效管理。
另外,對于三餐中出現(xiàn)早、晚餐有部分學生不吃或在校外吃,還有部分同學早餐和晚餐會選擇去便利店消費而不會去食堂的這種情況,校方可以思考早餐和晚餐在服務方式和菜品上有所創(chuàng)新來吸引學生,并可通過微信推送菜品營養(yǎng)分析數(shù)據(jù)給學生。
通過區(qū)分學生性別的分析,男生在食堂的選擇上地理位置好的食堂會很大程度影響他們的選擇,而女生在食堂的選擇上除了食堂地理位置的影響,比男生更追求食堂的口感和品質。這個分析結果可用于食堂管理區(qū)分男女喜好提供特色服務。
最后,針對食堂擁擠可以采取相關策略,可以從兩方面考慮:一是在幾個嚴重擁擠的食堂增加座位數(shù),通過推送給學生食堂實時擁擠程度的情況,讓學生可以提前靈活選擇就餐食堂;二是,管理開發(fā)智能結算功能,集成射頻讀寫裝置、讀卡器、顯示屏等多個設備,實現(xiàn)結算區(qū)餐具的批量快速識別,學生自主完成核對和支付,提高結算效率和準確性。這樣,便可極大緩解高峰期的排隊時間浪費,菜品和座位的供應不足。另外,對于三餐都不擁擠的食堂,可以深入了解原因,提高服務質量,合理分配資源。
四、結語
分析高校食堂的消費不僅僅是通過數(shù)據(jù)分析結果為食堂的管理服務水平提供建議,同時也可從中找到信息來讓學校發(fā)現(xiàn)學生的行為習慣,幫助學生解決問題。例如,根據(jù)食堂數(shù)據(jù)的挖掘分析,學??梢钥紤]查找連續(xù)3天以上不在學校食堂就餐的學生,長時間有早餐或中餐或晚餐不在學校吃的學生,分別了解原因,了解他們的需求,幫助他們解決困難。