• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于校園一卡通數(shù)據(jù)的用戶行為分析

      2019-08-31 07:02李陳依宿漢辰劉嘉青毛羽哲王澤坤李順
      中文信息 2019年8期
      關鍵詞:校園一卡通數(shù)據(jù)可視化數(shù)據(jù)挖掘

      李陳依 宿漢辰 劉嘉青 毛羽哲 王澤坤 李順

      摘 要:在當下的大數(shù)據(jù)時代,數(shù)據(jù)挖掘應用十分廣泛,對于校園一卡通數(shù)據(jù)的研究也更為廣泛。本文以國際關系學院一年內的圖書館、食堂和浴室的一卡通刷卡記錄為例,對學生的用戶行為進行分析,為師生日常生活提供科學建議,為學校提出設施優(yōu)化建議以提升校園生活質量。

      關鍵詞:校園一卡通 數(shù)據(jù)挖掘 數(shù)據(jù)可視化 關聯(lián)規(guī)則挖掘 用戶行為分析

      中圖分類號:TP311文獻標識碼:A文章編號:1003-9082(2019)08-0-02

      一、引言

      校園一卡通是記錄師生行為軌跡、消費特點、行為偏好的有效信息集成系統(tǒng),為師生提供信息化智慧校園服務的同時也存儲了海量信息,對這些數(shù)據(jù)進行挖掘分析可以為教學、后勤和管理等多個領域做出十分有益的貢獻。本文基于隱去學生個人屬性信息的校園一卡通數(shù)據(jù),涉及圖書借還記錄、餐飲消費和淋浴記錄等,以數(shù)據(jù)分析為背景,得出學生總體的用戶行為畫像,涵蓋多維度多層次并實現(xiàn)了數(shù)據(jù)可視化。對同學們日常生活做合理規(guī)劃并提出有效建議,同時向學校相關部門提出改進意見,旨在提高校園生活質量,完善校園基礎設施。

      二、數(shù)據(jù)分析流程

      我們的數(shù)據(jù)分析流程分為四步:

      1.數(shù)據(jù)采集:經過與學校有關部門的協(xié)商,我們采集到2017~2018年度包括消費時間、地點、金額的食堂、浴室數(shù)據(jù)和包括借還書情況的圖書館數(shù)據(jù);

      2.數(shù)據(jù)處理與可視化:我們對拿到的數(shù)據(jù)利用Python、Excel的VBA等進行數(shù)據(jù)預處理,并用Python、Echarts和IBM Cognos對數(shù)據(jù)進行可視化展示;

      3.數(shù)據(jù)分析:我們基于可視化的圖表對各部分數(shù)據(jù)進行分析,用Weka對圖書館借還書數(shù)據(jù)進行關聯(lián)規(guī)則挖掘。通過描繪師生校園軌跡、行為習慣與偏好,為師生提出科學的行為建議,并對學校各部門提出設施優(yōu)化建議;

      4.成果展示:我們將最終的結論結合可視化圖表做成網(wǎng)頁發(fā)布在Github上。

      接下來我們將分別對圖書館、食堂和浴室數(shù)據(jù)進行的分析進行闡述,得出有益的結論。

      三、圖書館數(shù)據(jù)分析

      我們對圖書館的借還書種類、數(shù)量以及時間特點進行分析,并借助Weka按系對每位同學的借書種類進行關聯(lián)規(guī)則挖掘,找出更有可能同時借閱的書籍。

      1.關聯(lián)規(guī)則挖掘

      我們借助Weka應用Apriori和FP-Tree算法,分別根據(jù)如下公式得到最小置信度conf、杠桿率lev、確信度conv和提升度lift,并進行相互驗證:

      其中,P(X)為X項集在總項集中的概率,A、B為借閱書目的項集。conf,conv,lift,lev的值越高,表示A和B項集的關聯(lián)度越高,四種計算方式可以在結果上相互印證。

      根據(jù)關聯(lián)規(guī)則挖掘結果我們發(fā)現(xiàn),由于學校是一所政法類大學,信科學生在借閱計算機類書時往往會借閱文學類、政法類書籍;外院、國經、國政系在借閱本專業(yè)書籍時往往會借閱文學類書籍。本科生鐘愛文學類,研究生則更偏愛政法類和史地類。

      總的來說,政法類書籍往往和史地類一同借閱,哲學宗教類書籍往往和語言文字類一同借閱,而文學類書籍則更易和各類書籍一同被借閱。我們建議借書處據(jù)此來為圖書類別位置的安排做出更為合適便捷的規(guī)劃。

      2.借還書院系、種類和時間特點

      經過數(shù)據(jù)處理和可視化,我們發(fā)現(xiàn)的規(guī)律如下:

      2.1院系上:外院和國政為借還書籍常客(可參考圖2灰色柱狀圖部分);

      2.2種類上:研究生主要借閱政法類書籍,本科生主要借閱文學類、政法類、語言文字類。

      2.3時間上:一年中,本研借書高峰為3月和9月,對應每個學期的開始,而還書數(shù)量則越接近期末越多;教職工借書呈現(xiàn)波動分布,在12月達到高峰,他們往往傾向于在期末把書借回家看,開學歸還。一天中,本研借書高峰約在15點,而教職工借書高峰在10點,反映出不同群體的借書習慣不同。

      3.各院系借還書數(shù)量與種類數(shù)的多維探測

      我們使用IBM Cognos對圖書館的數(shù)據(jù)進行分析,得到如圖2關于各院系借還書數(shù)量與種類數(shù)的統(tǒng)計圖。圖中灰色柱狀圖(對應左縱軸)表示借還書總量,黑色方形(右縱軸)表示借還書種類數(shù),橫軸表各院系。

      我們從本科生到研究生的變化看出,公管借還書廣度明顯增加,故建議公管系學生盡早博覽群書,提升專業(yè)素養(yǎng);法律系相反,借還書深度提升,建議法律系同學多借閱書籍來打好專業(yè)基礎;信科系同學借還書量明顯減少,結合實際我們發(fā)現(xiàn)由于信科屬于時新技術,同學們更適合學會利用互聯(lián)網(wǎng)學習時新技術提升專業(yè)技能,建議同學們不要太依賴書本。

      四、食堂數(shù)據(jù)分析

      對于食堂數(shù)據(jù),我們將先根據(jù)各窗口銷量與消費的三維圖對比,向食堂提出菜系安排建議;再分別研究同學們的就餐時間分布和就餐規(guī)律性,為學校、師生提出有益的建議。

      1.就餐菜系偏好

      根據(jù)各窗口銷量與消費的三維對比,我們重點研究了銷量高但消費不低,銷量高且消費低等窗口,和實地考察對應菜系相結合,分析出學生就餐菜系偏好,向食堂提出科學建議。

      銷量最大的是小賣部窗口,其消費水平低;最受學生歡迎的是黃燜雞和中間的基本伙食窗口,由口味和便利性決定;價格高的菜若等待時間長,則容易銷量低;價格相同的菜系,品種越豐富,越受歡迎。

      2.就餐時間和規(guī)律性

      學生就餐時間分布如圖3左,結合學校課程時間安排,我們發(fā)現(xiàn)學生就餐時間和作息規(guī)律與課程時間息息相關,因此我們建議學校通過合理安排課程時間來促進學生的健康作息:

      2.1早餐:主要集中在7:50,在9點和10點會有下課買早餐的小高峰;

      2.2午餐:12:05~12:15為高峰,為第四節(jié)剛下課時間;

      2.3晚餐:18:15~18:35為高峰,為下午課和晚課交鋒的時間。

      建議師生錯峰就餐,建議食堂工作人員在峰值安排夠人手,采取措施避免擁擠。

      根據(jù)圖3右的學生就餐平均方差分布圖并結合研究知,多數(shù)同學就餐較規(guī)律,且都集中在高峰點就餐,由此看出教務處課程安排與食堂規(guī)劃有密切關系,建議學校教務處和食堂部門充分協(xié)調,為學生就餐以及作息規(guī)劃做出更合理的安排,此將有益于學生的身體健康。

      五、浴室數(shù)據(jù)分析

      對于浴室的數(shù)據(jù)分析,我們主要從三個方面進行闡述:不同單位時間內洗澡人數(shù)變化、學生洗澡的插卡及消費習慣和不同位置的噴頭受歡迎程度。

      1.淋浴時間特點

      洗澡人數(shù)高峰的月份為12月,低谷期為5月。原因是夏季宿舍樓淋浴間可以使用,也造成了冬季鍋爐的負擔過大。建議學校將每日浴室開放時間延長,增加宿舍樓淋浴間的開放時間,且在冬天要尤其注意浴室鍋爐的維修和正常運作。

      2.學生淋浴消費特點

      同學們單次洗澡的插卡次數(shù)集中在2~3次,單次插卡的消費金額約0.3~0.9元,故每個同學單次的洗澡消費約為1.5~2.7元,約7.5~13.5分鐘。

      插拔卡過程中卡易失手掉入陰槽和水費是造成同學分類的原因。建議學校設計放卡更保險的校園卡計時收費機并實行分段的計費標準,對單次插卡超過5分鐘的校園卡增加收費力度。

      3.浴室不同噴頭的使用情況

      我們根據(jù)可視化圖表,實地考察浴室噴頭分布,得出了圖4的浴室各噴頭使用頻次分布圖,發(fā)現(xiàn)了男女生在浴室的洗澡偏好特點:

      3.1女浴室:熱門噴頭集中在空間較狹小的區(qū)域,冷門噴頭普遍位置偏僻,私密性和路程是兩大主要因素。

      3.2男浴室:對噴頭的偏愛程度與位置和私密性并無太大關聯(lián),爆熱噴頭主要由于該噴頭出水充裕水溫恒定且隱私性好,冷門噴頭則是大多靠近過道或窗戶,空氣流動大溫度低。

      建議尤其加強男浴室的保暖防風工作,以及對各浴室冷門的噴頭的及時維修檢查。

      結語

      本文以數(shù)據(jù)為驅動,為圖書館書籍放置、食堂菜品優(yōu)化、澡堂維護及課程安排等方面提出合理建議,有助于改善校園設施。同時,同學們可以更直觀地了解大眾校園蹤跡,合理安排校園生活。我們也希望未來能有更多關于校園更全面數(shù)據(jù)挖掘的研究,不斷完善校園規(guī)劃布局,建設更美好的校園。

      參考文獻

      [1]薛黎明,欒維新,李志淮,等.數(shù)據(jù)挖掘在校園一卡通消費數(shù)據(jù)分析中的應用[C] / /中國高等教育學會教育信息化分會:中國高等教育學會教育信息化分會第十二次學術年會論文集,2014:1-8.

      [2]黃剛,劉蓉,劉合富, 等.基于校園一卡通數(shù)據(jù)的人群畫像分析[J].計算機與數(shù)字工程,2018,46(9):1881-1886. DOI:10.3969/j.issn.1672-9722.2018.09.037.

      [3]劉志宏,喻曉旭.基于數(shù)據(jù)挖掘的校園一卡通消費行為分析[J].信息記錄材料,2018,19(12):89-90.

      [4]韓偉,胡西民,付剛, 等.基于校園一卡通系統(tǒng)的餐飲消費數(shù)據(jù)分析[J].江蘇科技信息,2018,35(24):26-29.

      [5]謝康,吳記,肖靜華.基于大數(shù)據(jù)平臺的用戶畫像與用戶行為分析[J].中國信息化,2018(3):100-104.

      [6]廖強.基于關聯(lián)規(guī)則挖掘的WEKA 數(shù)據(jù)挖掘應用[J].計算機光盤軟件與應用,2012(19).

      [7]JiaweiHan, MichelineKamber, JianPei, et al. 數(shù)據(jù)挖掘:概念與技術[M]. 機械工業(yè)出版社, 2012.

      作者簡介:李陳依,女,國際關系學院信息科技學院智能信息處理方向2016級本科生,

      李順,男,2013年博士畢業(yè)于北京大學計算機科學與工程系,現(xiàn)任國際關系學院信息科技學院碩導,副教授,研究方向為數(shù)據(jù)挖掘、大數(shù)據(jù)分析和人工智能。

      猜你喜歡
      校園一卡通數(shù)據(jù)可視化數(shù)據(jù)挖掘
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
      可視化:新媒體語境下的數(shù)據(jù)、敘事與設計研究
      我國數(shù)據(jù)新聞的發(fā)展困境與策略研究
      校園一卡通模式下的校園安全管理
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      维西| 海南省| 榆中县| 曲松县| 来凤县| 富阳市| 南靖县| 兴安盟| 汤阴县| 陕西省| 信丰县| 忻州市| 江川县| 介休市| 江永县| 长治县| 益阳市| 吉木萨尔县| 鄂州市| 德清县| 华蓥市| 沁源县| 芮城县| 博客| 嵊州市| 阳江市| 共和县| 托克托县| 湘西| 唐山市| 句容市| 利津县| 东平县| 黔西县| 南部县| 保靖县| 吉水县| 阳新县| 马边| 吉木乃县| 乌拉特中旗|