• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于一卡通數(shù)據(jù)的高校學(xué)生行為分析與排名預(yù)測(cè)

      2018-05-07 03:27:28甘偉
      現(xiàn)代計(jì)算機(jī) 2018年9期
      關(guān)鍵詞:一卡通視圖學(xué)期

      甘偉

      (四川大學(xué)計(jì)算機(jī)學(xué)院,成都 610065)

      0 引言

      校園一卡通的系統(tǒng)是數(shù)字化校園建設(shè)中必不可少的組成部分和基礎(chǔ)工程[1]。隨著計(jì)算機(jī)應(yīng)用技術(shù)和數(shù)據(jù)庫(kù)安全技術(shù)的發(fā)展,校園一卡通在各大、中、小學(xué)中都有廣泛的應(yīng)用。其中,大學(xué)生的校園一卡通的系統(tǒng)最為成熟,業(yè)務(wù)覆蓋范圍最廣,所涉及的業(yè)務(wù)包括就餐、消費(fèi)、門禁、交通、打印等,且呈現(xiàn)逐年增長(zhǎng)的趨勢(shì)。一個(gè)大學(xué)在校人數(shù)一般為幾千甚至幾萬(wàn)人,每天產(chǎn)生大量的一卡通數(shù)據(jù)[2]。而在這些龐大的數(shù)據(jù)記錄中就隱含著在校大學(xué)生的消費(fèi)水平、行為規(guī)律等[3]。校園一卡通所記錄的數(shù)據(jù)被越來(lái)越多的人關(guān)注,其重要的原因就是這些數(shù)據(jù)可以在一定程度上反映在校大學(xué)生的一些情況。因此,有很多研究人員對(duì)學(xué)生的消費(fèi)記錄做出分析,用來(lái)分析學(xué)生的消費(fèi)水平、為學(xué)校后勤部門提供決策依據(jù)。

      但是目前對(duì)一卡通數(shù)據(jù)的研究大部分都是通過(guò)一些統(tǒng)計(jì)的方法研究一卡通的某些類型的數(shù)據(jù),極少有研究人員結(jié)合可視化技術(shù)[4]交互手段對(duì)一卡通所記錄的信息進(jìn)行全面分析或展示的。本文中采用了可視化技術(shù)對(duì)一卡通數(shù)據(jù)進(jìn)行全面展示,以圖表的形式直觀地幫助用戶理解數(shù)據(jù)、發(fā)現(xiàn)數(shù)據(jù)中隱藏的規(guī)律[5],幫助用戶分析學(xué)生行為。

      1 可視化效果展示及分析

      本文對(duì)數(shù)據(jù)的展示與分析主要利用了三個(gè)視圖。整個(gè)界面如圖1所示,主要分為用螺旋視圖[6]表示的學(xué)生行為視圖,用圓圈表示的學(xué)生信息視圖和用堆疊條形圖表示的學(xué)生消費(fèi)視圖。

      圖1 總視圖

      1.1 學(xué)生行為視圖

      學(xué)生行為視圖展示的是學(xué)生在什么時(shí)間、什么地點(diǎn)發(fā)生了某些特定的行為,這些行為主要包括在食堂就餐、到超市購(gòu)物、圖書館購(gòu)物、教室消費(fèi)、寢室消費(fèi)、打印、乘車等。圖2(a)為螺旋視圖在“周模式”時(shí)的展示情況,用來(lái)顯示每個(gè)學(xué)期學(xué)生的一卡通數(shù)據(jù)記錄,每一圈表示的是一周的一卡通數(shù)據(jù)記錄,通過(guò)用戶交互可以選擇感興趣的記錄類型或模式。圖2(b)為“天模式”下的展示情況,用來(lái)顯示某連續(xù)9天的一卡通數(shù)據(jù)記錄,每一圈表示的是一天的一卡通數(shù)據(jù)記錄,和在“周模式”下有同樣的交互。兩種模式的不同之處在于“天模式”可以對(duì)所要展示的時(shí)期通過(guò)滑動(dòng)條來(lái)選擇,每次展示的只是某個(gè)學(xué)期的部分?jǐn)?shù)據(jù),而且在數(shù)據(jù)映射上用圈的大小代表消費(fèi)金額的多少。

      圖2 不同模式下的學(xué)生行為

      1.2 學(xué)生消費(fèi)視圖

      如圖3(a)所示,展示的是用堆疊條形圖表示的學(xué)生消費(fèi)視圖,用來(lái)展示每個(gè)學(xué)期的消費(fèi)總金額以及各類消費(fèi)金額(顏色與螺旋視圖的映射方案一致)??梢钥吹矫總€(gè)學(xué)期的消費(fèi)以食堂消費(fèi)為主,其次是超市。二三學(xué)期的學(xué)費(fèi)總金額和各項(xiàng)消費(fèi)金額變化不大,都和第一學(xué)期的消費(fèi)有較大的差異。圖3(b)是用一個(gè)圓圈來(lái)展示一個(gè)學(xué)生信息,用來(lái)展示學(xué)生及成績(jī)相關(guān)信息,顏色不做任何映射。每個(gè)圓圈的大小表示該學(xué)生跟上學(xué)期相比成績(jī)變化的大小。當(dāng)鼠標(biāo)懸浮在某個(gè)圓圈上時(shí),所有圓圈的顏色會(huì)發(fā)生變化,紅色的表示學(xué)生上學(xué)期排名上升,藍(lán)色表示該學(xué)生上學(xué)期排名下降。

      圖3 不同模式下的學(xué)生行為

      2 基于多元線性回歸算法的學(xué)生成績(jī)排名預(yù)測(cè)

      2.1 特征提取

      本文先以可視化的方式來(lái)展示一卡通數(shù)據(jù),通過(guò)交互操作發(fā)現(xiàn)學(xué)生去圖書館的次數(shù)、有無(wú)早起吃早飯的習(xí)慣、進(jìn)圖書館的次數(shù)以及借書的數(shù)量對(duì)學(xué)生成績(jī)有較大的影響。因此,本文選取了以上的幾個(gè)特征來(lái)對(duì)學(xué)生的相對(duì)排名做出預(yù)測(cè)。

      在第一次實(shí)驗(yàn)中,利用第一學(xué)期的相對(duì)排名和第二學(xué)期該學(xué)生去圖書館的次數(shù)、吃早飯的次數(shù)(十點(diǎn)之前有食堂刷卡記錄視為早飯記錄)、借書的數(shù)量這些變量為特征訓(xùn)練出一組參數(shù)。在利用這組參數(shù)和第二學(xué)期的排名、第三學(xué)期的同樣的特征預(yù)測(cè)第三學(xué)期的相對(duì)排名時(shí),發(fā)現(xiàn)效果并不是很好。分析其原因,在利用可視化試圖分析學(xué)生行為時(shí),是依據(jù)學(xué)生兩個(gè)學(xué)期行為的變化來(lái)預(yù)測(cè)學(xué)生成績(jī)的升降的。每個(gè)學(xué)生的學(xué)習(xí)行為本身就具有很大的差異性,所以根據(jù)學(xué)生單個(gè)學(xué)期的表現(xiàn)就判斷該學(xué)生成績(jī)的變化是沒(méi)有意義的,而依據(jù)學(xué)生在學(xué)習(xí)行為上的變化(在本文中主要是指和上學(xué)期相比產(chǎn)生的差異)來(lái)判斷學(xué)生成績(jī)的變化才是有意義的。根據(jù)以上分析,又重新選擇了特征,重新選擇的特征為上學(xué)期的相對(duì)排名、和上學(xué)期相比進(jìn)圖書館增加的次數(shù)、吃早飯?jiān)黾拥拇螖?shù)、借書增加的數(shù)量(表 1)。

      表1 特征表

      2.2 成績(jī)排名預(yù)測(cè)結(jié)果

      線性回歸是運(yùn)用統(tǒng)計(jì)學(xué)的方法,來(lái)分析自變量和因變量之間的依賴關(guān)系,并依據(jù)這種關(guān)系進(jìn)行建模的回歸分析。這種模型是目前應(yīng)用的非常廣泛的預(yù)測(cè)模型。在線性回歸模型中,自變量和因變量是一種線性關(guān)系。依據(jù)人們的經(jīng)驗(yàn),上學(xué)期的成績(jī)、本學(xué)期的行為表現(xiàn)和本學(xué)期的學(xué)習(xí)成績(jī)之間是一種線性關(guān)系。例如,去圖書館的次數(shù)少了,可能成績(jī)就有所下降,去圖書館的次數(shù)變得越少,成績(jī)可能就退步得越多。本文選取了四個(gè)特征及存在四個(gè)自變量,來(lái)預(yù)測(cè)學(xué)生相對(duì)排名。因?yàn)?,存在兩個(gè)以上的自變量,所以使用的回歸模型叫多元線性回歸模型。

      將提取的特征導(dǎo)入到IBM SPSS Statistics 20中,選擇線性回歸模型,選取因變量與相應(yīng)的自變量,得出了如表2的結(jié)果:

      表2 線性回歸參數(shù)表a

      a.因變量:rank2

      在非標(biāo)準(zhǔn)化系數(shù)下,就計(jì)算得到了需要的一組參數(shù)。即表明了預(yù)測(cè)模型對(duì)應(yīng)的公式為:

      從這組系數(shù)可以看出,上學(xué)期的成績(jī)排名(rank1)對(duì)這個(gè)學(xué)期(rank2)的影響最大,這個(gè)也符合人類的經(jīng)驗(yàn)。而進(jìn)圖書館的次數(shù)、借閱書籍的次數(shù)與吃早餐的次數(shù)這些對(duì)成績(jī)提高有幫助的因素都會(huì)導(dǎo)致相對(duì)排名的減小,即相對(duì)排名變小。標(biāo)準(zhǔn)化系數(shù)可以用來(lái)反映變量間相對(duì)重要性,但是不能反映在真實(shí)情況下對(duì)結(jié)果的具體影響,因此只是用來(lái)分析變量的重要性。

      t值是t檢驗(yàn)的結(jié)果,它的絕對(duì)值越大表明了該變量對(duì)結(jié)果的影響越顯著。例如,在上圖中可以看出上一學(xué)期的成績(jī)對(duì)應(yīng)的t值最大是33.297,那么該變量對(duì)結(jié)果的影響是最顯著的。sig也是用來(lái)反映變量對(duì)結(jié)果影響的顯著程度的,但是它的數(shù)值的含義是假設(shè)某個(gè)變量對(duì)結(jié)果是沒(méi)有影響的概率。因此,sig的越小表示該變量對(duì)結(jié)果的影響越大。我們默認(rèn)當(dāng)sig小于0.05時(shí),它對(duì)結(jié)果的影響是顯著的,從上圖中我們可以看出只有早餐的次數(shù)是遠(yuǎn)大于0.05的,其他變量對(duì)結(jié)果的影響都是比較大的。因此,可以認(rèn)為得到公式是有效的。

      用以上工作所得到的預(yù)測(cè)公式對(duì)數(shù)據(jù)中第三學(xué)期的學(xué)生相對(duì)排名做出預(yù)測(cè)。預(yù)測(cè)出來(lái)的結(jié)果如表3所示:

      可以看到預(yù)測(cè)的結(jié)果不是整數(shù),且范圍不在1~538之間,即這些數(shù)字只是反映學(xué)生相對(duì)排名的一些指標(biāo),并不能代表學(xué)生的相對(duì)排名。所以,又依據(jù)這個(gè)數(shù)據(jù)從低到高對(duì)學(xué)生進(jìn)行排列,則排列之后的順序就代表了學(xué)生的名次,名次從1依次增大到538,這樣就得到了最后的結(jié)果。

      在預(yù)測(cè)出學(xué)生的相對(duì)排名之后,要對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)定。在本文中是通過(guò)衡量預(yù)測(cè)排名和實(shí)際排名的Spearman相關(guān)性,結(jié)果為[0,1]之間的數(shù)據(jù),數(shù)值越大表示相關(guān)性越大,即排名預(yù)測(cè)的越準(zhǔn)確。假如有n個(gè)學(xué)生的排名,學(xué)生i的實(shí)際排名為ri而該學(xué)生的預(yù)測(cè)排名為 pi,那么Spearman的計(jì)算方式如下:

      利用這個(gè)評(píng)價(jià)指標(biāo)對(duì)處理后的排名預(yù)測(cè)進(jìn)行評(píng)價(jià),算出結(jié)果為0.901。這表明本文中提取的特征和找到的線性回歸模型對(duì)學(xué)生排名預(yù)測(cè)是有很好效果的,實(shí)際排名和預(yù)測(cè)排名差別不是很大。

      3 結(jié)語(yǔ)

      本文針對(duì)學(xué)生的一卡通數(shù)據(jù),對(duì)學(xué)生的行為進(jìn)行分析。利用可視化圖形與交互技術(shù)發(fā)現(xiàn)影響成績(jī)排名的可能因素。再使用SPSS軟件,利用多元線性回歸模型,結(jié)合可視化交互提取的影響成績(jī)變化的變量,對(duì)學(xué)生成績(jī)進(jìn)行預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,可視化交互提取出的特征對(duì)成績(jī)排名的預(yù)測(cè)有很重要的作用。

      表3 初步預(yù)測(cè)結(jié)果

      參考文獻(xiàn):

      [1]張治斌,王艷萍.數(shù)據(jù)挖掘技術(shù)在數(shù)字化校園中的應(yīng)用[J].現(xiàn)代計(jì)算機(jī),2006(12):93-95.

      [2]陳建兵.利用校園一卡通數(shù)據(jù)優(yōu)化高校貧困生認(rèn)定系統(tǒng)[D].電子科技大學(xué),2012.

      [3]李珊娜.基于校園一卡通平臺(tái)的數(shù)據(jù)挖掘應(yīng)用研究[J].鐵路計(jì)算機(jī)應(yīng)用,2010,19(6):55-58.

      [4]陳為,張嵩,魯愛(ài)東.數(shù)據(jù)可視化的基本原理與方法[M].科學(xué)出版社,2013.

      [5]Chen M,Jaenicke H.An Information-Theoretic Framework for Visualization[J].IEEE Transactions on Visualization&Computer Graphics,2010,16(6):1206.

      [6]Weber M,Alexa M,Müller W.Visualizing Time-Series on Spirals.[C]Information Visualization,2001.INFOVIS 2001.IEEE Symposium on.IEEE,2001:7-13.

      猜你喜歡
      一卡通視圖學(xué)期
      新的學(xué)期 新的嘗試
      期末沖刺高二上學(xué)期期末模擬卷
      5.3 視圖與投影
      視圖
      Y—20重型運(yùn)輸機(jī)多視圖
      SA2型76毫米車載高炮多視圖
      八年級(jí)(上學(xué)期)期末測(cè)試題(D)
      基于“一卡通”開發(fā)的員工信息識(shí)別系統(tǒng)
      電子制作(2016年19期)2016-08-24 07:49:44
      向心加速度學(xué)習(xí)一卡通
      向心加速度學(xué)習(xí)一卡通
      伊通| 荣昌县| 锦屏县| 徐汇区| 古田县| 东阳市| 昆山市| 彩票| 宣武区| 固始县| 韩城市| 城步| 华蓥市| 越西县| 盐山县| 右玉县| 广西| 十堰市| 新乡市| 准格尔旗| 澄城县| 林甸县| 临邑县| 葵青区| 塔河县| 廊坊市| 闻喜县| 勃利县| 莱州市| 册亨县| 慈溪市| 德江县| 会泽县| 中方县| 阜城县| 哈巴河县| 临漳县| 明水县| 勐海县| 峨眉山市| 兴业县|