• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于數(shù)據(jù)分析高校學(xué)生自畫像的初探

      2017-10-30 12:00趙國(guó)亮陳曉軍李思奇吳傲
      關(guān)鍵詞:用戶畫像高校學(xué)生大數(shù)據(jù)

      趙國(guó)亮++陳曉軍++李思奇++吳傲

      摘要:隨著互聯(lián)網(wǎng)和人工智能的發(fā)展,數(shù)據(jù)的價(jià)值越來(lái)越得到廣泛的重視,尤其是高校的數(shù)據(jù)價(jià)值,研究還處于初探期。本文首先對(duì)大數(shù)據(jù)和用戶畫像國(guó)內(nèi)外研究現(xiàn)狀進(jìn)行分析,其次基于高校數(shù)據(jù)進(jìn)行標(biāo)簽化、模型化,設(shè)計(jì)出基于高校的學(xué)生用戶畫像的模型,然后以高校學(xué)生成績(jī)數(shù)據(jù)和消費(fèi)數(shù)據(jù)為例,實(shí)現(xiàn)用戶畫像模型的初步驗(yàn)證,最后總結(jié)圍繞高校學(xué)生自畫像的研究前景,更好挖掘高校數(shù)據(jù)價(jià)值,為后期勤工助學(xué)、愛好培養(yǎng)、社團(tuán)選拔、學(xué)生掛科預(yù)警、學(xué)生未在校預(yù)警等提供參考。

      關(guān)鍵詞:大數(shù)據(jù);用戶畫像;高校學(xué)生;用戶畫像標(biāo)簽化

      中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2017)08-0233-02

      隨著互聯(lián)網(wǎng)的出現(xiàn),信息便逐漸趨向于爆炸的狀態(tài),以不同的形式展示,而這些數(shù)據(jù)蘊(yùn)含巨大的價(jià)值。對(duì)于如此龐大的數(shù)據(jù),可以通過大數(shù)據(jù)技術(shù)精準(zhǔn)地獲取自己想要的數(shù)據(jù),從海量的數(shù)據(jù)中得到一些有用的價(jià)值,用戶畫像就是其中的一種應(yīng)用。

      1 大數(shù)據(jù)和用戶畫像

      大數(shù)據(jù)(big data),指無(wú)法在一定時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合,是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)[1]。

      目前國(guó)內(nèi)外的專家學(xué)者對(duì)大數(shù)據(jù)只是在數(shù)據(jù)規(guī)模上達(dá)成共識(shí),重點(diǎn)對(duì)大數(shù)據(jù)與云計(jì)算、數(shù)據(jù)挖掘,并行計(jì)算和分布式處理等幾個(gè)領(lǐng)域進(jìn)行研究。國(guó)內(nèi)大數(shù)據(jù)技術(shù)的應(yīng)用最先開始的是淘寶、京東等幾大電商的精準(zhǔn)營(yíng)銷,消費(fèi)者的一切行為在企業(yè)面前似乎都將是“可視化”。國(guó)外除在大數(shù)據(jù)的概念上的研究外,重點(diǎn)放在大數(shù)據(jù)分析算法和系統(tǒng)的效率。

      用戶畫像是真實(shí)用戶的虛擬代表,是建立在一系列真實(shí)數(shù)據(jù)之上的目標(biāo)用戶模型[3]。精準(zhǔn)營(yíng)銷其實(shí)就是利用大數(shù)據(jù)技術(shù),對(duì)用戶購(gòu)物數(shù)據(jù)行為進(jìn)行分析,對(duì)購(gòu)物人群貼上標(biāo)簽,進(jìn)行用戶畫像虛擬化,有針對(duì)性地進(jìn)行主動(dòng)推銷。高校用戶畫像由于受制于高校N個(gè)系統(tǒng)數(shù)據(jù)的獨(dú)立性,同時(shí)學(xué)校往往只關(guān)心結(jié)果數(shù)據(jù),對(duì)過程數(shù)據(jù)不重視導(dǎo)致眾多行為數(shù)據(jù)的缺失,導(dǎo)致高校用戶畫像的研究還處于初探期。電子科大將用戶畫像用于掛科預(yù)警、南京理工將大數(shù)據(jù)應(yīng)用于貧困生幫扶,本文將基于西南石油大學(xué)學(xué)生食堂消費(fèi)、開水等數(shù)據(jù)進(jìn)行用戶畫像初探。

      2 高校的用戶畫像設(shè)計(jì)

      高校用戶畫像設(shè)計(jì)主要是數(shù)據(jù)采集以及數(shù)據(jù)標(biāo)簽化兩個(gè)方面。

      2.1 數(shù)據(jù)及數(shù)據(jù)采集

      基于高校的用戶畫像數(shù)據(jù)主要分為靜態(tài)數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù)。靜態(tài)數(shù)據(jù)包括學(xué)生的基本信息,如性別、年齡、專業(yè)年級(jí)、成績(jī)等信息;動(dòng)態(tài)數(shù)據(jù)則包括訪問課程數(shù)據(jù)、寢室門禁及校門門禁刷卡數(shù)據(jù)、澡堂刷卡數(shù)據(jù)、食堂吃飯刷卡數(shù)據(jù)、圖書館進(jìn)出數(shù)據(jù)、圖書館借閱等數(shù)據(jù)。如圖1所示。

      2.2 數(shù)據(jù)標(biāo)簽化

      數(shù)據(jù)標(biāo)簽化就是對(duì)原始數(shù)據(jù)進(jìn)行分析,抽取出相關(guān)的事實(shí)數(shù)據(jù),基于事實(shí)數(shù)據(jù)歸納出標(biāo)簽?zāi)P?,最后抽象出預(yù)測(cè)標(biāo)簽。如圖2所示。

      通過對(duì)采集數(shù)據(jù)的分析,可以給學(xué)生貼上“標(biāo)簽”,將其行為標(biāo)簽化。例如,可以通過圖書館門禁、宿舍門禁、校門門禁以及訪問課程中心次數(shù)給學(xué)生貼上“學(xué)渣”及“學(xué)霸”的標(biāo)簽;通過吃飯時(shí)間及金額、洗澡刷開次數(shù)以及宿舍門禁次數(shù)給學(xué)生貼上“勤勞”及“懶惰”的標(biāo)簽;通過圖書館書籍的瀏覽類別(愛好)、借書次數(shù)可以給學(xué)生貼上一個(gè)“圖書館讀書情況”的標(biāo)簽。

      3 學(xué)生自畫像的初探

      以高校食堂消費(fèi)情況數(shù)據(jù),采用脫敏方式,抽取了西南石油大學(xué)某專業(yè)196名學(xué)生的4169條數(shù)據(jù)。如圖3所示。

      通過分析其食堂吃飯刷卡時(shí)間以及GPA的實(shí)際數(shù)據(jù),繪制了如下散點(diǎn)圖,如圖4所示。

      根據(jù)如圖所示的結(jié)果,可以將學(xué)生用餐時(shí)間劃分為早上,中午和下午三個(gè)小組。對(duì)于早上這一組的數(shù)據(jù)可以劃分為三個(gè)區(qū)間,這一組的數(shù)據(jù)的平均值即為,最大值為,最小值為。然后在至之間再找一個(gè)平均值,在至之間再找一個(gè)平均值,因此三個(gè)區(qū)間分別為早餐用餐時(shí)間早:-,早餐用餐時(shí)間中等:-,早餐用餐時(shí)間晚:-。同理,對(duì)于中午以及下午的兩組用餐時(shí)間數(shù)據(jù)可以劃分出相同的區(qū)間。

      通過早餐、中餐及晚餐三組數(shù)據(jù)的分析,得出三餐吃飯?jiān)绲臅r(shí)間段為:06:18:20-07:31:10,10:02:45-11:33:52,15:16:39-17:44:30;三餐吃飯中等的時(shí)間段為:07:31:10-08:45:56,11:33:52-12:17:35,17:44:30-18:21:35;三餐吃飯晚的時(shí)間段為:08:45:56-09:59:41,12:17:35-13:21:47,18:21:35-22:19:37。

      得出結(jié)果,反饋到對(duì)應(yīng)學(xué)生刷卡數(shù)據(jù)上,并定義吃飯次數(shù)超過1/2為早的則標(biāo)簽該學(xué)生為用餐勤快。同時(shí)可以把該標(biāo)簽與學(xué)生績(jī)點(diǎn)發(fā)生關(guān)聯(lián),探索其中與成績(jī)是否有相關(guān)性。

      4 結(jié)語(yǔ)

      構(gòu)建學(xué)校用戶自畫像的研究,能夠清楚地理解大數(shù)據(jù)在校園中的應(yīng)用以及明白用戶畫像的影響,并且能夠在大數(shù)據(jù)時(shí)代充分利用各種數(shù)據(jù),對(duì)其進(jìn)行大量深層次的挖掘 ,最終讓這些數(shù)據(jù)轉(zhuǎn)化為資產(chǎn),更大地挖掘?qū)W校數(shù)據(jù)價(jià)值,為勤工助學(xué)、愛好培養(yǎng)、社團(tuán)選拔、學(xué)生掛科預(yù)警、學(xué)生未在校預(yù)警等提供參考。

      參考文獻(xiàn)

      [1]王軍,劉金輝.大數(shù)據(jù)的國(guó)內(nèi)外研究現(xiàn)狀及發(fā)展動(dòng)態(tài)分析[J].電子技術(shù)與軟件工程, 2015,(23):200-200.

      [2]卞友江.“大數(shù)據(jù)”概念考辨[J].新聞研究導(dǎo)刊,2013,(5):25-28.

      [3]維克托·邁爾·舍恩伯格.盛揚(yáng)燕,周濤,譯.大數(shù)據(jù)時(shí)代[M].浙江人民出版社,2013.

      [4]王振宇,郭力.基于Hadoop的搜索引擎用戶行為分析[J].計(jì)算機(jī)工程與科學(xué),2011,(04):115-120.endprint

      猜你喜歡
      用戶畫像高校學(xué)生大數(shù)據(jù)
      高校學(xué)生意外傷害事件應(yīng)對(duì)與處理
      關(guān)于高校學(xué)生工作的思考
      阿拉善右旗| 隆林| 怀来县| 南汇区| 额尔古纳市| 皋兰县| 淄博市| 衡东县| 海晏县| 梁河县| 蒙阴县| 莲花县| 武胜县| 任丘市| 车险| 兴文县| 塔河县| 宁武县| 正宁县| 临朐县| 莱州市| 左贡县| 吕梁市| 雅安市| 亚东县| 黄山市| 萝北县| 谷城县| 二连浩特市| 彭水| 天长市| 丰原市| 桦甸市| 视频| 泾阳县| 明溪县| 金山区| 陕西省| 奉节县| 察哈| 和田市|