李珊珊+焦寶臣+曲申+張瑋+楊陽+張四海
摘 要:本文以一卡通數(shù)據(jù)庫交易流水?dāng)?shù)據(jù)為研究對象,系統(tǒng)地對師生的消費(fèi)習(xí)慣和行為規(guī)律進(jìn)行探討。采用Matlab2015b和Origin9.0對數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)清洗、一致性檢驗、格式化、相關(guān)信息統(tǒng)計等。在對539376條食堂交易流水?dāng)?shù)據(jù)進(jìn)行詳細(xì)分析后,給出了本科生、碩士、博士和教工的整體就餐情況;討論了師生在工作日和節(jié)假日不同的就餐規(guī)律;研究了在快餐和美食廣場兩種不同業(yè)態(tài)商戶的就餐規(guī)律;最后分析了新校區(qū)搬遷對本部食堂的影響。
關(guān)鍵詞:一卡通;數(shù)據(jù)挖掘;交易流水;消費(fèi)數(shù)據(jù)
中圖分類號:TP392 文獻(xiàn)標(biāo)志碼:B 文章編號:1673-8454(2018)03-0077-04一、引言
校園一卡通系統(tǒng)是智慧校園的重要組成部分[1-5],是學(xué)校信息化建設(shè)的重要基礎(chǔ)。目前,人們更多地集中在如何建設(shè)和運(yùn)營一卡通系統(tǒng),而對于系統(tǒng)中沉淀的大量消費(fèi)、行為數(shù)據(jù),通常缺乏有效的分析、整理和利用。隨著一卡通應(yīng)用的不斷擴(kuò)展,校園一卡通已由最初的小額消費(fèi)卡,變?yōu)閷W(xué)生證、借閱證、門禁卡、考勤卡、公交卡,甚至能夠應(yīng)用于學(xué)籍注冊、自助文印、學(xué)費(fèi)繳納、體育場館預(yù)定、體能測試等場景[6-8]??梢哉f,一卡通已成為數(shù)字化校園生活最重要的載體和最直觀的體現(xiàn)。
隨著時間的推移,一卡通系統(tǒng)里累積了大量消費(fèi)和行為數(shù)據(jù)。對一卡通數(shù)據(jù)進(jìn)行深度分析,特別是基于大數(shù)據(jù)理論,從大量復(fù)雜、無序的原始數(shù)據(jù)中提取有價值的信息,找出數(shù)據(jù)之間的關(guān)聯(lián),具有非常重要的意義[9-12]。
本文首先對南開大學(xué)一卡通系統(tǒng)進(jìn)行了簡介,然后,以食堂交易流水?dāng)?shù)據(jù)為研究對象,采用抽樣的方法對師生的消費(fèi)模式和行為規(guī)律進(jìn)行研究。在對539376條交易流水?dāng)?shù)據(jù)分析后發(fā)現(xiàn),本科生的食堂就餐比例最高,在一層快餐和二層美食廣場的就餐比例分別高達(dá)68.57%和77.88%;教工的就餐比例最低,分別為5.33%和4.55%;師生在工作日和節(jié)假日的就餐習(xí)慣有較大差異,節(jié)假日食堂就餐人數(shù)顯著減少,時間更為分散,用餐高峰更為平緩;對于快餐和美食廣場這兩種不同業(yè)態(tài)的商戶,師生就餐規(guī)律有較大差異,分別對其進(jìn)行詳細(xì)分析;最后探討了新校區(qū)搬遷對本部食堂的影響。研究發(fā)現(xiàn),搬遷前,食堂工作日午餐高峰時段人數(shù)偏多,F(xiàn)1、F2時段(11:00-12:00)的平均刷卡次數(shù)高達(dá)3706次,易發(fā)生擁擠現(xiàn)象;搬遷后,F(xiàn)1、F2時段平均刷卡次數(shù)減少為2373次。新校區(qū)搬遷有效緩解了食堂就餐擁擠的狀況。搬遷后,雖然師生總?cè)藬?shù)減少了一半,但高峰時段就餐人數(shù)只減少了約1/3,這表明改善食堂就餐環(huán)境會吸引更多師生在食堂就餐。對一卡通數(shù)據(jù)進(jìn)行深入研究,有助于學(xué)校實時掌握師生的行為規(guī)律、給出有效的趨勢預(yù)測、優(yōu)化資源配置,對學(xué)校相關(guān)管理部門進(jìn)行科學(xué)決策具有重要意義。
二、南開大學(xué)一卡通系統(tǒng)簡介
南開大學(xué)一卡通系統(tǒng)始建于2007年,系統(tǒng)經(jīng)歷了多年的發(fā)展和不斷完善。圖1給出了南開大學(xué)一卡通系統(tǒng)的網(wǎng)絡(luò)拓?fù)鋱D。它是一個運(yùn)行在一卡通專用網(wǎng)絡(luò)上、基于C/S架構(gòu)的多應(yīng)用集成系統(tǒng)。按照系統(tǒng)功能,可以劃分為數(shù)據(jù)層、平臺層、網(wǎng)絡(luò)層和應(yīng)用層。數(shù)據(jù)層是一卡通系統(tǒng)的數(shù)據(jù)存儲中心。對內(nèi),它為一卡通系統(tǒng)提供基礎(chǔ)數(shù)據(jù)支持;對外它負(fù)責(zé)與全校統(tǒng)一數(shù)據(jù)中心進(jìn)行交互和同步,并為教務(wù)、人事、學(xué)工等系統(tǒng)提供預(yù)留接口,從而實現(xiàn)未來與各個系統(tǒng)數(shù)據(jù)庫的對接。平臺層是一卡通系統(tǒng)的運(yùn)營管理中心,它包括電子支付和身份認(rèn)證兩大平臺。一卡通專網(wǎng)為系統(tǒng)數(shù)據(jù)的傳輸和交互提供專用通道。
應(yīng)用層是一卡通系統(tǒng)中最復(fù)雜、最貼近用戶的一層,它為用戶提供各種應(yīng)用服務(wù)。具體包括充值系統(tǒng)、消費(fèi)支付系統(tǒng)、身份認(rèn)證系統(tǒng)以及其他第三方應(yīng)用系統(tǒng)。南開大學(xué)一卡通充值系統(tǒng)能夠為師生提供現(xiàn)金充值、銀行圈存轉(zhuǎn)賬、網(wǎng)絡(luò)、手機(jī)APP四種充值方式,方便廣大師生的使用。消費(fèi)支付系統(tǒng)支持在食堂、超市、浴室等場所的刷卡消費(fèi),同時還支持圖書逾期的自動扣款,網(wǎng)費(fèi)繳納以及自助文印扣款等應(yīng)用。身份認(rèn)證系統(tǒng)包括所有需要身份識別的場景,包括宿舍/學(xué)院的門禁系統(tǒng)、圖書館的通道機(jī)系統(tǒng)、考試、車輛管理等場景。其他應(yīng)用系統(tǒng)指的是在物理上使用一卡通卡片進(jìn)行操作,而實際產(chǎn)生的數(shù)據(jù)不回傳至一卡通數(shù)據(jù)庫的系統(tǒng)。這種系統(tǒng)通過弱耦合或不耦合的方式與一卡通系統(tǒng)連接,間接應(yīng)用一卡通的卡片信息。這類應(yīng)用包括學(xué)生成績單、在籍證明的自助打印、體能測試、體育館場地預(yù)定、自助洗衣等等。隨著10年來的建設(shè)和不斷完善,南開大學(xué)一卡通系統(tǒng)已經(jīng)形成了以專用網(wǎng)絡(luò)為基礎(chǔ),以一卡通平臺系統(tǒng)為核心,具有相當(dāng)安全性、健壯性和擴(kuò)展性的應(yīng)用系統(tǒng)。
三、數(shù)據(jù)分析和結(jié)果
1.預(yù)處理——時間離散化
南開大學(xué)全校共有師生34771人,其中學(xué)生29830人,教職員工4941人。每天產(chǎn)生的消費(fèi)交易流水?dāng)?shù)據(jù)在5萬條左右,一年的數(shù)據(jù)量有幾千萬條,數(shù)據(jù)文件在10Gb以上。我們采用抽樣的方法對一卡通食堂消費(fèi)產(chǎn)生的交易流水?dāng)?shù)據(jù)進(jìn)行詳細(xì)分析。南開大學(xué)本部共有三個學(xué)生食堂,其中第二學(xué)生食堂是規(guī)模最大、業(yè)態(tài)最全、產(chǎn)生交易流水?dāng)?shù)量最多的食堂。因此我們選取該食堂的數(shù)據(jù)進(jìn)行分析。共提取了539,376條交易流水?dāng)?shù)據(jù),其中包括2015年4月的317,662條和2016年4月的221,714條。
數(shù)據(jù)處理采用Matlab2015b和Origin9.0。首先對一卡通系統(tǒng)導(dǎo)出的數(shù)據(jù)文件進(jìn)行預(yù)處理,將數(shù)據(jù)轉(zhuǎn)化為符合要求的CSV文件,采用Matlab編程進(jìn)行數(shù)據(jù)清洗。包括格式化數(shù)據(jù),檢查數(shù)據(jù)一致性,清除無用數(shù)據(jù),去掉學(xué)生姓名、電話、身份證號等敏感信息等操作。方便對數(shù)據(jù)做進(jìn)一步的統(tǒng)計分析。
為研究學(xué)生的消費(fèi)習(xí)慣和規(guī)律,我們首先對時間進(jìn)行離散化處理,每半小時為一個時段,一天24個小時共分為48個時段。因為食堂的營業(yè)時間是從早6:00至晚21:00,我們僅對這期間的30個時間段進(jìn)行統(tǒng)計。為研究方便,我們用字母編號來代表每個時間段。表1給出了將食堂營業(yè)時間離散化后,字母編號和相應(yīng)時間段的關(guān)系。
這樣,以每半個小時為一個時段,統(tǒng)計每個時段刷卡交易次數(shù),制作次數(shù)分布表和次數(shù)分布圖,就可以對師生在食堂的消費(fèi)情況進(jìn)行詳細(xì)分析。
2.整體消費(fèi)情況分析
南開大學(xué)二食堂一層為普通快餐,二層為美食廣場,兩層的業(yè)態(tài)、經(jīng)營模式和營業(yè)時間都有所不同。因此我們對兩層的數(shù)據(jù)分別進(jìn)行統(tǒng)計分析。
圖2給出了不同身份群體在食堂刷卡消費(fèi)所占的比例??梢钥闯?,本科生在食堂就餐的比例最大,一層為68.57%,二層為77.88%。碩士和博士在食堂就餐的比例接近,且在一層就餐的比例更大。而教工在食堂就餐的比例最低。這主要是因為教工群體總?cè)藬?shù)較少,且很多住在學(xué)校附近的教工會選擇回家吃飯。表2給出了本科生、碩士、博士和教工在食堂的平均消費(fèi)??梢钥闯?,在食堂一層不同身份的消費(fèi)群體平均消費(fèi)非常接近,在6.03元-6.43元之間。在二層美食廣場,本科生的平均消費(fèi)最低,為9.35元;碩士和博士的平均消費(fèi)接近,分別為10.32元和10.64元;教工的平均消費(fèi)最高,為11.12元。
3.基于時段的食堂消費(fèi)數(shù)據(jù)分析
前面我們已經(jīng)將食堂交易流水信息按照發(fā)生時間進(jìn)行離散化。統(tǒng)計不同時段食堂消費(fèi)的刷卡次數(shù),能夠讓我們清晰的看到食堂的就餐曲線圖,找到每日的就餐高峰,分析食堂資源配置是否合理。
圖3給出了食堂一層在不同時段刷卡的次數(shù)分布圖。其中橫坐標(biāo)為時段,字母編號和時間段的對應(yīng)關(guān)系如表1所示;縱坐標(biāo)為在某一時間段內(nèi)的平均刷卡次數(shù),該值為2015年4月份30天刷卡的平均值??梢钥闯觯谥形绾屯砩戏謩e出現(xiàn)兩個用餐高峰,中午為11:00-12:00(F1,F(xiàn)2時段),晚上為17:00-18:00(L1,L2時段)。午餐的用餐高峰更加尖銳,說明中午師生用餐更加集中,更容易發(fā)生擁擠。交易次數(shù)最多的時段為11:00-11:30,共刷卡1327次。晚上的用餐高峰較為平緩,說明師生晚上就餐較為分散。刷卡次數(shù)最多的時段為17:00-17:30,共刷卡798次,遠(yuǎn)少于中午高峰時段的刷卡次數(shù)。
圖3同時也給出了每個時間段刷卡次數(shù)的標(biāo)準(zhǔn)差。可以看到,在用餐高峰,刷卡次數(shù)的標(biāo)準(zhǔn)差非常大。說明師生每天的刷卡次數(shù)有較大差異。這主要是由于工作日和節(jié)假日用餐人數(shù)和用餐時間會有較大差別。因此有必要分別對工作日和節(jié)假日的消費(fèi)數(shù)據(jù)進(jìn)行討論。
圖4給出了食堂一層工作日和節(jié)假日的消費(fèi)數(shù)據(jù)??梢钥闯?,兩條曲線發(fā)生顯著分裂,高峰時段刷卡次數(shù)數(shù)值有較大差異,且兩組數(shù)據(jù)的標(biāo)準(zhǔn)差顯著減少,這說明節(jié)假日和工作日的消費(fèi)數(shù)據(jù)的確存在很大差距。由圖可知,節(jié)假日和工作日的刷卡次數(shù)分布具有相同的趨勢,在中午和晚上都同樣出現(xiàn)了兩個用餐高峰。中午刷卡次數(shù)最多的時段都為11:00-11:30,其中工作日平均刷卡次數(shù)為1567次;節(jié)假日平均刷卡次數(shù)為769次,約為工作日的一半。晚上刷卡次數(shù)最多的時段為17:00-17:30,其中工作日平均刷卡次數(shù)為912次;節(jié)假日平均刷卡次數(shù)為532次,同樣約為工作日的一半。因此節(jié)假日的用餐人數(shù)更少,用餐高峰更為平緩,不會出現(xiàn)人多擁擠的情況。食堂可以少準(zhǔn)備一些食材,或關(guān)閉部分窗口,以提高資源利用率。
對于二層美食廣場,我們同樣給出區(qū)分工作日和節(jié)假日的刷卡次數(shù)分布圖。如圖5所示,與一層快餐類似,二層美食廣場節(jié)假日和工作日不同時段的刷卡次數(shù)分布具有相同的趨勢,同樣在中午和晚上出現(xiàn)兩個用餐高峰。中午刷卡次數(shù)最多的時段為11:30-12:00,比一層晚半個小時,其中工作日平均刷卡次數(shù)為680次;節(jié)假日平均刷卡次數(shù)為423次,約為工作日的2/3。而在13點(diǎn)以后,節(jié)假日就餐人數(shù)略多于工作日。工作日晚上刷卡次數(shù)最多的時段為17:00-17:30,日均刷卡次數(shù)為535次;而節(jié)假日晚上用餐高峰較為平緩,在17:00-17:30,17:30-18:00,18:00-18:30三個時段的刷卡次數(shù)比較接近,分別為386,395和372次。這說明師生的晚餐時間更為分散,因此不會出現(xiàn)人多擁擠的情況。同樣,在18點(diǎn)以后,節(jié)假日就餐人數(shù)也要略多于工作日??傮w來說二層美食廣場節(jié)假日的就餐人數(shù)只是略少于工作日,對商戶沒有顯著影響。
接下來討論師生在不同業(yè)態(tài)商戶的就餐規(guī)律。圖6給出了工作日二食堂一層快餐和二層美食廣場的刷卡次數(shù)對比圖。由圖可知,在用餐高峰,一層的刷卡次數(shù)遠(yuǎn)大于二層美食廣場。一層的用餐高峰更加尖銳,說明一層用餐更加集中。二層用餐高峰相對平緩,這說明二層用餐時間相對分散。在午餐時間,一層刷卡次數(shù)峰值出現(xiàn)在11:00-11:30,超過12:30刷卡次數(shù)急劇減小。而二層美食廣場,在13:00-13:30平均刷卡次數(shù)仍然超過100次。這說明二層美食廣場采取單點(diǎn)現(xiàn)做的方式,延長營業(yè)時間,能夠為錯過用餐時間,或想錯峰就餐的師生更好的提供餐飲服務(wù)。這能夠有效的緩解就餐高峰壓力。晚間就餐情況也出現(xiàn)類似的趨勢,一層18:30以后就餐人數(shù)非常少,而二層美食廣場直到21點(diǎn)仍有人刷卡就餐。
最后,我們想討論校區(qū)搬遷對食堂就餐人數(shù)的影響。南開大學(xué)于2015年9月開始部分搬遷到新校區(qū)。搬遷師生的數(shù)量約為師生總數(shù)的一半。統(tǒng)計2015年4月和2016年4月食堂工作日每個時段的平均刷卡次數(shù)(包括一層和二層),如圖7所示。從圖中可以看出,雖然本部有約一半的師生搬遷到新校區(qū),但由于食堂就餐環(huán)境的改善,高峰時段就餐擁擠狀況的緩解,食堂的就餐人數(shù)并沒有減少為原來的一半。搬遷前,食堂午餐高峰時段F1,F(xiàn)2(11:00-12:00)的平均刷卡次數(shù)為3706次;搬遷后,刷卡次數(shù)變?yōu)?373次,人數(shù)減少了約1/3。搬遷前,晚餐L1、L2時段(17:00-18:00)的平均刷卡次數(shù)為2378次,搬遷后變?yōu)?481次,同樣減少了約1/3。這說明搬遷后,由于本部食堂環(huán)境改善,就餐擁擠情況得到了有效緩解,使得一部分之前在校外就餐的師生重新選擇在食堂就餐。
四、總結(jié)和展望
一卡通系統(tǒng)猶如一臺日夜不停的采礦機(jī),采集的數(shù)據(jù)就好比大量粗礦石,等待我們?nèi)闹刑釤捊鹱?。原始?shù)據(jù)都是孤立和無序的,需要采用科學(xué)合理的算法構(gòu)建數(shù)學(xué)模型,找到數(shù)據(jù)之間的關(guān)聯(lián)。在此基礎(chǔ)上,如果能進(jìn)一步開發(fā)出一套有效的決策支撐系統(tǒng),將會為校領(lǐng)導(dǎo)和相關(guān)部門的科學(xué)決策提供非常有力的數(shù)據(jù)支撐。這些工作值得我們付出大量時間和精力去深入研究。
參考文獻(xiàn):
[1]許鑫.南京大學(xué)數(shù)字化校園建設(shè)架構(gòu)[J].中國教育信息化,2002(8): 44-45.
[2]徐為民,徐兵,朱顯靈.校園一卡通和數(shù)字化校園[J].中國教育信息化, 2002(1):50-51.
[3]蘇文勝,馬千軍.基于數(shù)字化校園的校園一卡通構(gòu)建[J].武漢理工大學(xué)學(xué)報(信息與管理工程版),2005,27(1): 99-101.
[4]顧金娣,席琳琳.校園一卡通系統(tǒng)的應(yīng)用與思考[J].上海第二工業(yè)大學(xué)學(xué)報,2005,22(3): 71-76.
[5]張升平. 數(shù)字化校園之校園一卡通的建設(shè)[J].重慶工商大學(xué)學(xué)報:自然科學(xué)版,2008,25(1): 56-59.
[6]李淑娟,周偉強(qiáng),宓泳.如何實現(xiàn)校園一卡通高效的運(yùn)行管理探索[J].實驗技術(shù)與管理,2011,28(6): 7-10.
[7]張九娟.校園“一卡通”在學(xué)校管理中的應(yīng)用研究[J].高校后勤研究,2014(2).
[8]王彬,劉群.校園卡系統(tǒng)的現(xiàn)狀[J].才智, 2015(31).
[9]李珊娜.基于校園一卡通平臺的數(shù)據(jù)挖掘應(yīng)用研究[J].鐵路計算機(jī)應(yīng)用,2010,19(6): 55-58.
[10]張兵兵,王建,張建威.數(shù)據(jù)挖掘在校園一卡通系統(tǒng)中的應(yīng)用初探[J].數(shù)理醫(yī)藥學(xué)雜志,2009,22(5): 572-575.
[11]陳鋒.基于校園一卡通系統(tǒng)的高校用戶就餐消費(fèi)行為分析與數(shù)據(jù)挖掘.中國教育信息化,2014(5): 47-49.
[12]薛黎明,欒維新,李志淮.數(shù)據(jù)挖掘在校園一卡通消費(fèi)數(shù)據(jù)分析中的應(yīng)用[D].中國高等教育學(xué)會教育信息化分會第十二次學(xué)術(shù)年會論文集, F, 2014.
(編輯:王曉明)