• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于數(shù)據(jù)分析的學(xué)生行為畫像研究

      2021-03-24 11:16:32關(guān)金名
      電腦知識(shí)與技術(shù) 2021年2期
      關(guān)鍵詞:數(shù)據(jù)分析

      關(guān)金名

      摘要:學(xué)生作為學(xué)校教育的主要參與者與受益者,其身體狀況、行為習(xí)慣以及心理健康狀況都會(huì)對(duì)學(xué)生自身的發(fā)展產(chǎn)生重要的影響。從另一角度來(lái)說(shuō),通過(guò)各項(xiàng)數(shù)據(jù)分析對(duì)學(xué)生的行為畫像進(jìn)行研究,可以幫助學(xué)校及時(shí)掌握學(xué)生的行為動(dòng)態(tài),同時(shí)針對(duì)學(xué)生自身存在的不良行為習(xí)慣進(jìn)行糾正,引導(dǎo)學(xué)生養(yǎng)成健康向上的行為習(xí)慣。學(xué)校應(yīng)當(dāng)根據(jù)大數(shù)據(jù)平臺(tái)等作為基礎(chǔ),深入分析學(xué)生行為習(xí)慣,培育良好的學(xué)風(fēng)。該文將對(duì)學(xué)生行為畫像的構(gòu)建以及數(shù)據(jù)處理和分析等環(huán)節(jié)進(jìn)行研究,并對(duì)結(jié)果進(jìn)行評(píng)估,從而為學(xué)生行為畫像分析提出意見(jiàn)和建議。

      關(guān)鍵詞:數(shù)據(jù)分析;學(xué)生行為;畫像研究

      中圖分類號(hào):TP311? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A

      文章編號(hào):1009-3044(2021)02-0024-03

      1 引言

      學(xué)生行為畫像的分析需要基礎(chǔ)數(shù)據(jù)收集、行為標(biāo)簽確定以及行為畫像構(gòu)建等環(huán)節(jié)作為基礎(chǔ),其次進(jìn)行學(xué)生行為畫像的深入分析,采用行為畫像處理以及行為畫像聚類等方法對(duì)數(shù)據(jù)進(jìn)行分析與研究,最終得出正確結(jié)果?;跀?shù)據(jù)分析的學(xué)生行為畫像分析可以幫助學(xué)校樹立優(yōu)秀的學(xué)風(fēng)、校風(fēng),有助于學(xué)生自身的成長(zhǎng)發(fā)展。接下來(lái)將就學(xué)生行為畫像的分析流程進(jìn)行敘述,并就實(shí)例的分析結(jié)果進(jìn)行分析與評(píng)估,通過(guò)對(duì)學(xué)生行為的大數(shù)據(jù)分析,為當(dāng)前高校建設(shè)與學(xué)生發(fā)展盡綿薄之力。

      2 學(xué)生行為畫像的構(gòu)建

      如圖1所示,其為學(xué)生行為畫像構(gòu)建示意圖。在進(jìn)行學(xué)生行為畫像分析之前,需要對(duì)學(xué)生行為畫像進(jìn)行構(gòu)建,此次設(shè)計(jì)以山東某高校學(xué)生為例,針對(duì)學(xué)生在學(xué)校中的基本信息、成績(jī)信息、日常表現(xiàn)以及門禁數(shù)據(jù)等各項(xiàng)信息進(jìn)行收集,并采取合理的數(shù)據(jù)處理分析方法,構(gòu)建基于數(shù)據(jù)分析的學(xué)生行為畫像分析平臺(tái)。在學(xué)生行為畫像構(gòu)建過(guò)程中,需要進(jìn)行學(xué)生基本數(shù)據(jù)信息采集、學(xué)生行為標(biāo)簽化兩個(gè)過(guò)程,只有按照步驟進(jìn)行學(xué)生行為畫像的構(gòu)建,此數(shù)據(jù)才可以代表當(dāng)前高校學(xué)生的實(shí)際狀況以及學(xué)風(fēng)建設(shè)情況。

      第一步需要做的是對(duì)學(xué)生行為畫像進(jìn)行構(gòu)建,首先,技術(shù)人員需要查閱檔案或數(shù)據(jù)收集學(xué)生的信息,包括大學(xué)生基本信息數(shù)據(jù)、大學(xué)生成績(jī)數(shù)據(jù)、大學(xué)生圖書借閱數(shù)據(jù)、大學(xué)生消費(fèi)數(shù)據(jù)以及大學(xué)生門禁數(shù)據(jù)等信息,在收集此類基礎(chǔ)數(shù)據(jù)信息之后,由于學(xué)生行為畫像需要參照一定的標(biāo)準(zhǔn)對(duì)其行為進(jìn)行界定,標(biāo)準(zhǔn)即大學(xué)生行為的標(biāo)簽化,如學(xué)生的學(xué)院、專業(yè)、班級(jí)、姓名、性別、學(xué)號(hào)、學(xué)制、消費(fèi)總額,學(xué)年績(jī)點(diǎn)、綜合測(cè)評(píng)數(shù)據(jù)、圖書借閱次數(shù)、生源地、日均消費(fèi)額、宿舍樓進(jìn)出次數(shù)以及上課缺勤次數(shù)等標(biāo)簽,通過(guò)將學(xué)生的各項(xiàng)行為標(biāo)簽進(jìn)行細(xì)化,學(xué)??梢酝ㄟ^(guò)數(shù)據(jù)顯著觀測(cè)學(xué)生行為的變化,便于技術(shù)人員從細(xì)微的變化中分析學(xué)生的行為。如標(biāo)簽學(xué)習(xí)成績(jī)可以描述為大學(xué)生學(xué)期平均學(xué)習(xí)成績(jī),以成績(jī)段為劃分標(biāo)準(zhǔn),分為不及格、及格、良好、優(yōu)秀四個(gè)級(jí)別。體育成績(jī)大學(xué)生學(xué)期平均體育成績(jī),以成績(jī)段為劃分標(biāo)準(zhǔn),分為不及格、及格、良好、優(yōu)秀四個(gè)級(jí)別;標(biāo)簽借書量可以描述為大學(xué)生學(xué)期借書量,結(jié)合全校學(xué)生的平均借閱量,劃分為較多、一般、較少、太少、無(wú)五個(gè)級(jí)別。標(biāo)簽還書量描述為大學(xué)生學(xué)期還數(shù)量,結(jié)合全校學(xué)生的平均借閱量,劃分為較多、一般、較少、太少、無(wú)五個(gè)級(jí)別。標(biāo)簽消費(fèi)總額可以描述為大學(xué)生學(xué)期總消費(fèi)額度,參考全校學(xué)生的平均消費(fèi)總額,劃分為較多、一般、較少、太少、無(wú)五個(gè)級(jí)別。

      標(biāo)簽日均消費(fèi)描述為大學(xué)生學(xué)期平均每天消費(fèi)額度,參考全校學(xué)生的平均消費(fèi)總額,劃分為較多、一般、較少、太少、無(wú)五個(gè)級(jí)別。

      在學(xué)生行為畫像標(biāo)簽劃定之后,需要進(jìn)行學(xué)生行為畫像的構(gòu)建。按照學(xué)生的信息或檔案數(shù)據(jù)對(duì)上述確定的標(biāo)簽進(jìn)行填寫,如計(jì)算機(jī)學(xué)院、計(jì)算機(jī)科學(xué)與技術(shù)、計(jì)科1802班、李XX、男、18110403022、四年、年消費(fèi)總額10000元、日均消費(fèi)額度50元、學(xué)年績(jī)點(diǎn)專業(yè)第二、綜合測(cè)評(píng)專業(yè)第二、圖書借閱量一般、生源地山東、無(wú)上課缺勤記錄。通過(guò)上述實(shí)例進(jìn)行學(xué)生行為畫像的構(gòu)建,可以幫助學(xué)校全方面地了解學(xué)生的心理和思想狀況,便于對(duì)下一步的學(xué)生工作指明方向[1]。

      3 對(duì)學(xué)生行為畫像的分析

      在對(duì)學(xué)生行為畫像進(jìn)行構(gòu)建之后,需要對(duì)上述數(shù)據(jù)進(jìn)行分析和評(píng)估。而在分析過(guò)程中,可以將分析環(huán)節(jié)分為學(xué)生行為畫像處理和學(xué)生行為畫像聚類兩部分。在對(duì)學(xué)生行為畫像進(jìn)行聚類之前,需要對(duì)第一步收集的學(xué)生信息和標(biāo)簽屬性進(jìn)行處理,由于北京高校的學(xué)生人數(shù)眾多,其行為習(xí)慣與屬性也各不相同,此次設(shè)計(jì)是基于數(shù)據(jù)分析的學(xué)生行為畫像分析,因此,學(xué)生數(shù)據(jù)信息是進(jìn)行評(píng)估的基礎(chǔ),學(xué)生信息在學(xué)院、專業(yè)、班級(jí)、姓名、性別、學(xué)號(hào)等方面不存在數(shù)量等級(jí)差異較大的問(wèn)題,但在日均消費(fèi)額、消費(fèi)總額以及缺勤次數(shù)等方面存在著較大的數(shù)量級(jí)差異。如部分學(xué)生家庭環(huán)境較為優(yōu)越,生活費(fèi)較其他同學(xué)高出很多,如某位同學(xué)學(xué)期消費(fèi)總額為15000元人民幣,而其他同學(xué)學(xué)期消費(fèi)總額大都在5000元左右,因此,在消費(fèi)總額這個(gè)標(biāo)簽處存在數(shù)量級(jí)差異,使得此標(biāo)簽對(duì)整體的貢獻(xiàn)度可以忽略,這就導(dǎo)致后續(xù)的聚類無(wú)法得出真實(shí)的數(shù)據(jù)結(jié)果。技術(shù)人員在學(xué)生行為畫像聚類之前需要對(duì)數(shù)據(jù)信息進(jìn)行歸一化處理,使得各個(gè)標(biāo)簽都擁有與之相對(duì)應(yīng)的貢獻(xiàn)度,即將大學(xué)生的各項(xiàng)標(biāo)簽信息統(tǒng)一映射到[0,1]的區(qū)間內(nèi),如采用線性函數(shù)轉(zhuǎn)換、反正切函數(shù)轉(zhuǎn)換以及數(shù)函數(shù)轉(zhuǎn)換等方法對(duì)其進(jìn)行歸一化,使其呈現(xiàn)相應(yīng)的數(shù)據(jù)效果[2]。下式為轉(zhuǎn)換公式:

      在經(jīng)過(guò)學(xué)生行為畫像處理之后,需要對(duì)標(biāo)簽信息進(jìn)行聚類,聚類的主要含義為針對(duì)學(xué)生的數(shù)據(jù)信息進(jìn)行全方位的對(duì)比與分析,計(jì)算各項(xiàng)標(biāo)簽之間的相似程度,并根據(jù)不同標(biāo)簽之間的相似程度,將相似程度較大的標(biāo)簽歸為一類,這樣一來(lái),可以減少同類型的標(biāo)簽差異,由于聚類缺少相應(yīng)的先驗(yàn)知識(shí),因此聚類不存在監(jiān)督分類,在聚類之后,行為畫像需要滿足三個(gè)條件:①聚類之后的所有集合仍能構(gòu)成全部的行為畫像;②聚類之后兩種不同類別的畫像集合之間幾乎不存在交集;③同一聚類類別中的兩行為畫像的相似程度應(yīng)當(dāng)大于不同聚類類別中行為畫像的相似程度。相似程度也可以表示為最大相似度距離。即同一聚類類別中的最大相似度距離應(yīng)當(dāng)小于不同聚類類別中畫像的最大相似度距離。

      如圖2所示,其為學(xué)生時(shí)間安排示意圖。在經(jīng)過(guò)聚類之后,可以明確把握學(xué)生的行為習(xí)慣,如早飯時(shí)間集中在6:00~8:00之間,由于存在兩個(gè)下課時(shí)間,因此午飯時(shí)間集中在11:30與12:00兩個(gè)時(shí)間段,晚飯時(shí)間集中在18:00左右,打水洗澡時(shí)間在21:00~22:00之間。通過(guò)聚類我們可以看出不同行為畫像之間所存在的隱含的關(guān)系,而學(xué)校可以通過(guò)提取不同的類別信息,對(duì)學(xué)生的不良習(xí)慣進(jìn)行矯正,以確保行為畫像發(fā)揮應(yīng)有的作用。

      如圖3所示,其為K-Means算法流程示意圖。在此階段需要采用K-Means算法對(duì)大學(xué)生行為畫像進(jìn)行分析,算法流程為當(dāng)算法開(kāi)始后,首先輸入行為畫像聚類個(gè)數(shù)K,同時(shí)為中心向量C1、C2...Ck初始化K個(gè)種子,將樣本分配至距離其最近的中心向量,之后確定中心,用各個(gè)聚類的中心向量作為新的中心,檢查是否收斂,若無(wú)法收斂,重復(fù)分組和確定中心的步驟,直至算法收斂,此為K-Means算法的流程,可以幫助尋找不同聚類類別之間隱含的信息,加上前一步的歸一化處理,可以使學(xué)生行為畫像分析更具代表性和說(shuō)服力,從而在學(xué)校發(fā)展中發(fā)揮應(yīng)有的作用[3]。

      4 對(duì)研究結(jié)果的分析與評(píng)估

      在對(duì)行為畫像進(jìn)行構(gòu)建以及處理和聚類之后,需要對(duì)研究結(jié)果進(jìn)行分析和評(píng)估,此次研究以北京某高校機(jī)械學(xué)院的全體學(xué)生作為研究對(duì)象,并對(duì)其構(gòu)建行為畫像,行為畫像構(gòu)建的依據(jù)為學(xué)生的基礎(chǔ)數(shù)據(jù)、消費(fèi)信息、圖書借閱數(shù)據(jù)、上課缺勤次數(shù)以及宿舍門禁次數(shù)等數(shù)據(jù),可以在學(xué)生日常學(xué)習(xí)、生活、思想品德、日常表現(xiàn)等方面對(duì)學(xué)生的行為進(jìn)行畫像,此次研究與學(xué)校教務(wù)系統(tǒng)以及校園一卡通等數(shù)據(jù)系統(tǒng)進(jìn)行合作,收集到有關(guān)學(xué)生的基礎(chǔ)信息以及消費(fèi)數(shù)據(jù),可以較為全面地對(duì)學(xué)生數(shù)據(jù)進(jìn)行分析,在信息收集之后,我們利用數(shù)據(jù)處理方法對(duì)收集到的信息進(jìn)行處理,首先確定行為標(biāo)簽,同時(shí)按照學(xué)生行為標(biāo)簽對(duì)其進(jìn)行描述,描述完成之后,此時(shí)才算完成了行為畫像構(gòu)建前的準(zhǔn)備工作,之后通過(guò)行為畫像處理和聚類對(duì)數(shù)據(jù)信息進(jìn)行分析和評(píng)估,得到較為完善的數(shù)據(jù)處理結(jié)果。最后對(duì)研究結(jié)果進(jìn)行分析與評(píng)估,針對(duì)已經(jīng)構(gòu)建完成的學(xué)生行為畫像,需要考慮數(shù)據(jù)誤差等多種影響因素,如不同標(biāo)簽之間的取值范圍各不相同,對(duì)整體數(shù)據(jù)的貢獻(xiàn)度也會(huì)有差異,為了避免此類問(wèn)題,可以對(duì)標(biāo)簽描述數(shù)據(jù)進(jìn)行歸一化處理,將其取值范圍都固定在[0,1]之間,這樣一來(lái),可以有效調(diào)整數(shù)據(jù)的貢獻(xiàn)度,使數(shù)據(jù)更具說(shuō)服力[4]。

      以學(xué)生日均消費(fèi)額的數(shù)據(jù)分析為例,如圖5所示,其為學(xué)生日均消費(fèi)額統(tǒng)計(jì)圖。此次研究將日均消費(fèi)額分為10元以下、10~30元、30~50元以及50元以上四個(gè)級(jí)別,由聚類結(jié)果可以看出,日均消費(fèi)額30~50元的學(xué)生占39%,50元以上的學(xué)生占32%,10~30元的學(xué)生占21%,10元以下的學(xué)生占8%,這也從側(cè)面說(shuō)明了北京所在地域的消費(fèi)水平,同時(shí)學(xué)生的消費(fèi)觀念也發(fā)生了較大的變化,學(xué)生的消費(fèi)水平在增加。通過(guò)大數(shù)據(jù)的分析,可以幫助學(xué)校準(zhǔn)確把握學(xué)生的行為習(xí)慣以及心理健康狀態(tài),并采取針對(duì)性的措施糾正學(xué)生的不良習(xí)慣,培育良好的學(xué)風(fēng)、校風(fēng),以便學(xué)生更加健康地發(fā)展[5]。

      5 總結(jié)

      學(xué)生行為畫像是基于學(xué)生各類標(biāo)簽,如姓名、日均消費(fèi)額、圖書借閱次數(shù)以及違紀(jì)情況等多方面的信息綜合來(lái)構(gòu)建,構(gòu)建過(guò)程中需要收集學(xué)生的基本信息、教務(wù)系統(tǒng)中的信息以及校園一卡通內(nèi)的數(shù)據(jù),同時(shí)對(duì)數(shù)據(jù)進(jìn)行歸一化處理,采用K-Means算法對(duì)數(shù)據(jù)進(jìn)行聚類,并按照標(biāo)簽的屬性對(duì)其進(jìn)行描述,使學(xué)??梢詼?zhǔn)確把握學(xué)生的心理動(dòng)態(tài)與消費(fèi)情況,幫助學(xué)校更好地制定下一步計(jì)劃,為國(guó)家培養(yǎng)所需要的人才。

      參考文獻(xiàn):

      [1] 董瀟瀟,胡延,陳彥萍.基于校園數(shù)據(jù)的大學(xué)生行為畫像研究與分析[J].計(jì)算機(jī)與數(shù)字工程,2018,46(6):1200-1204,1262.

      [2] 朱梓熙,劉文敏,徐寶焱,等.基于數(shù)據(jù)分析的學(xué)生行為畫像分析[J].中國(guó)教育信息化,2018(23):21-23.

      [3] 張麗娟.基于大數(shù)據(jù)分析的用戶畫像助力精準(zhǔn)營(yíng)銷研究[J].電信技術(shù),2017(1):61-62,65.

      [4] 趙國(guó)亮,陳曉軍,李思奇,等.基于數(shù)據(jù)分析高校學(xué)生自畫像的初探[J].數(shù)字技術(shù)與應(yīng)用,2017(8):233-234,236.

      [5] 石敏,盧丹海,秦婷.基于大數(shù)據(jù)的高校學(xué)生分析與服務(wù)平臺(tái)的研究[J].信息技術(shù),2019,43(2):5-10.

      【通聯(lián)編輯:代影】

      猜你喜歡
      數(shù)據(jù)分析
      電子物證檢驗(yàn)的數(shù)據(jù)分析與信息應(yīng)用研究
      基于matlab曲線擬合的數(shù)據(jù)預(yù)測(cè)分析
      商情(2016年40期)2016-11-28 11:28:07
      分眾媒體趨勢(shì)下場(chǎng)景營(yíng)銷的商業(yè)前景
      商(2016年32期)2016-11-24 17:39:41
      佛山某給水管線控制測(cè)量探討
      科技資訊(2016年18期)2016-11-15 18:05:53
      SPSS在環(huán)境地球化學(xué)中的應(yīng)用
      考試周刊(2016年84期)2016-11-11 23:57:34
      大數(shù)據(jù)時(shí)代高校數(shù)據(jù)管理的思考
      科技視界(2016年18期)2016-11-03 22:51:40
      我校如何利用體育大課間活動(dòng)解決男生引體向上這個(gè)薄弱環(huán)節(jié)
      Excel電子表格在財(cái)務(wù)日常工作中的應(yīng)用
      淺析大數(shù)據(jù)時(shí)代背景下的市場(chǎng)營(yíng)銷策略
      新常態(tài)下集團(tuán)公司內(nèi)部審計(jì)工作研究
      红河县| 平度市| 平乐县| 米脂县| 墨竹工卡县| 八宿县| 天水市| 宁蒗| 太原市| 龙海市| 泌阳县| 枣阳市| 岳普湖县| 闽清县| 二连浩特市| 宝丰县| 张家口市| 桐柏县| 盐源县| 衡东县| 长寿区| 汉阴县| 托里县| 丰台区| 镇康县| 筠连县| 兴义市| 牟定县| 龙州县| 赤壁市| 呼伦贝尔市| 松溪县| 靖州| 开远市| 虹口区| 延长县| 荆州市| 镶黄旗| 湘乡市| 辽宁省| 当雄县|