• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于數(shù)據(jù)挖掘技術(shù)的高校學(xué)生成績研究

      2019-12-01 00:48:21蔣永旺江蘇護(hù)理職業(yè)學(xué)院
      數(shù)碼世界 2019年12期
      關(guān)鍵詞:數(shù)據(jù)挖掘高校學(xué)生數(shù)據(jù)庫

      蔣永旺 江蘇護(hù)理職業(yè)學(xué)院

      所謂數(shù)據(jù)挖掘,是指目的性從大量數(shù)據(jù)中搜索、尋找數(shù)據(jù)信息的過程,在這項(xiàng)技術(shù)中,需將驗(yàn)證驅(qū)動法作用于數(shù)據(jù)中,并默認(rèn)想要搜尋的信息是存在的。在高校管理中,由于辦學(xué)規(guī)模的擴(kuò)大,學(xué)生數(shù)量不斷增長,學(xué)校教務(wù)管理系統(tǒng)中,累積了大量學(xué)生數(shù)據(jù)資源,數(shù)據(jù)挖掘技術(shù)的應(yīng)用,對于提升高校教育管理水平有著積極意義。在素質(zhì)教育背景下,雖然不提倡以成績論英雄的理念,但是成績在一定程度上反映出學(xué)生對于專業(yè)知識和技能的理解掌握程度,可作為學(xué)校教育水平評估的主要依據(jù),應(yīng)用數(shù)據(jù)挖掘技術(shù),展開學(xué)生成績的分析,根據(jù)分析結(jié)果,展開教學(xué)改革,優(yōu)化教學(xué)理念,轉(zhuǎn)變教學(xué)方法,對于高校的可持續(xù)發(fā)展有著積極意義。

      1 數(shù)據(jù)挖掘技術(shù)概念及常用算法分析

      1.1 概念

      數(shù)據(jù)挖掘是從數(shù)量大、種類繁雜的海量數(shù)據(jù)資源中,根據(jù)需求尋找相對應(yīng)數(shù)據(jù)信息的過程。數(shù)據(jù)挖掘是按照業(yè)務(wù)需求理解、數(shù)據(jù)理解、數(shù)據(jù)搜集、建模、模型測評、部署的流程展開的,而且這一流程是迭代式進(jìn)行的。在這項(xiàng)技術(shù)中,工作人員會將分類后的幾個樣本作為模板,來制作模型,并將未分類數(shù)據(jù)按照規(guī)定數(shù)目進(jìn)行分類,建模后,進(jìn)行數(shù)據(jù)挖掘,分類輸出值是非連續(xù)的,然后,再尋找不同數(shù)據(jù)間的聯(lián)系,對數(shù)據(jù)進(jìn)行分組,將相似數(shù)據(jù)分在同一組。

      1.2 常用算法

      目前,在數(shù)據(jù)挖掘技術(shù)應(yīng)用過程中,常用的算法有以下三種:①貝葉斯算法(Bayes)。這是一種典型的不確定性知識的表示、推理方法,在這個原理中,先假設(shè)一個先驗(yàn)概率,在這個假設(shè)下觀察不同數(shù)據(jù)的概率;②決策樹算法(Decision Tree)。這是一種與流程圖相似的樹結(jié)構(gòu),在這種算法中,根據(jù)變量對于數(shù)據(jù)對象的影響,會顯示為不同的樹枝形狀,以此來進(jìn)行數(shù)據(jù)分析預(yù)測,以目標(biāo)變量所產(chǎn)生的影響,制定差異化的分類規(guī)則,適用于探測式的知識發(fā)現(xiàn),展現(xiàn)形式直觀形象,被應(yīng)用于各個領(lǐng)域;③線性回歸算法(Linear Regression)。所謂回歸分析,就是用一個或多個變量的變化,去解釋另一變量變化的方式,萬物都是相關(guān)聯(lián)的,很多參數(shù)都存在相關(guān)性,諸如人類的年齡與身高,商品的成本與生產(chǎn)數(shù)量,商品的銷售額與廣告費(fèi),家庭的收入與支出等,這些參數(shù)存在相關(guān)性,但是相關(guān)關(guān)系是不確定的,可采用線性回歸算法分析。

      2 基于數(shù)據(jù)挖掘技術(shù)的高校學(xué)生成績研究

      近年來,隨著計(jì)算機(jī)、互聯(lián)網(wǎng)等技術(shù)在高校管理中的應(yīng)用,教務(wù)管理基本實(shí)現(xiàn)信息化,在學(xué)校的教務(wù)管理系統(tǒng)數(shù)據(jù)庫中,可查詢到學(xué)生的各類信息,現(xiàn)階段,這些信息的價(jià)值并沒有被充分挖掘出來,信息利用僅停留在查詢、統(tǒng)計(jì)、制作報(bào)表等淺顯階段。以高校學(xué)生成績?yōu)槔?,成績的查詢、打印等,只是最基本的利用途徑,如若能夠?gòu)建成績數(shù)據(jù)庫,利用現(xiàn)代化技術(shù)從中挖掘有效信息,用以評估學(xué)生的學(xué)習(xí)態(tài)度、學(xué)習(xí)效果,評估教學(xué)成果,無論對于學(xué)生的提升,還是學(xué)校的發(fā)展,都有著重要作用。在利用數(shù)據(jù)挖掘技術(shù),展開學(xué)生成績分析時(shí),需歷經(jīng)以下幾個階段:

      (1)數(shù)據(jù)準(zhǔn)備。在數(shù)據(jù)準(zhǔn)備階段,應(yīng)該先提取出可直接處理分析的數(shù)據(jù)信息,在此過程中,技術(shù)人員需根據(jù)所選數(shù)據(jù)挖掘算法的信息使用需求,集成、篩選、處理信息,為接下來的數(shù)據(jù)挖掘工作做好準(zhǔn)備,以提升分析結(jié)果的可信度。值得注意的是,在整個高校學(xué)生成績分析過程中,準(zhǔn)備階段需花費(fèi)較多的時(shí)間。首先,在分析學(xué)生成績時(shí),所提供的數(shù)據(jù)信息,應(yīng)該盡量覆蓋多個學(xué)科,構(gòu)建多個數(shù)據(jù)庫,提升數(shù)據(jù)量,然后再展開數(shù)據(jù)的整理分析,消除數(shù)據(jù)源與源之間的語義模糊性,消除數(shù)據(jù)信息存在的缺陷,將之整理為統(tǒng)一規(guī)范的數(shù)據(jù)格式;其次,由多種源數(shù)據(jù)匯集而成的數(shù)據(jù)合集中,存在大量的無關(guān)數(shù)據(jù),這些數(shù)據(jù)無法提升分析結(jié)果的可靠性,反而會增加數(shù)據(jù)挖掘工作量,需要篩選出去,確保留下來的數(shù)據(jù)都是相關(guān)的數(shù)據(jù);最后,數(shù)據(jù)經(jīng)篩選后,可能存在噪聲問題、不完整問題、數(shù)據(jù)不一致等問題,因此,技術(shù)人員需對數(shù)據(jù)進(jìn)行預(yù)處理,完善補(bǔ)充分析庫內(nèi)的數(shù)據(jù)結(jié)構(gòu),提升分析結(jié)果的可信度和可靠性,而且,為了方便計(jì)算,需要將數(shù)據(jù)庫中屬性字段的信息轉(zhuǎn)換為可識別、可處理的編碼數(shù)據(jù)。

      (2)數(shù)據(jù)挖掘。經(jīng)歷長期的數(shù)據(jù)準(zhǔn)備工作后,即可采取多種數(shù)據(jù)挖掘算法,處理分析數(shù)據(jù)庫中的數(shù)據(jù)信息,發(fā)掘出數(shù)據(jù)間的內(nèi)在聯(lián)系,構(gòu)建知識圖譜。在此過程中,首先,技術(shù)人員應(yīng)該確定數(shù)據(jù)挖掘的目標(biāo),找準(zhǔn)工作定位,然后根據(jù)工作任務(wù)選擇合適的數(shù)據(jù)挖掘算法,構(gòu)建數(shù)據(jù)模型,確定需分析的參數(shù),利用模型挖掘數(shù)據(jù)庫中的相關(guān)參數(shù),尋找目標(biāo)關(guān)聯(lián)規(guī)則、數(shù)據(jù)回歸結(jié)構(gòu),找出可用于評估與分析的模式表達(dá)式。現(xiàn)階段,數(shù)據(jù)挖掘技術(shù)相關(guān)軟件已較成熟,在選擇好數(shù)據(jù)挖掘算法后,后續(xù)工作可自動化完成。以利用數(shù)據(jù)挖掘技術(shù)對學(xué)生的成績進(jìn)行挖掘?yàn)槔?,需采集學(xué)生的基本額信息,比如姓名、學(xué)號、性別、專業(yè)、班級等;然后,在成績方面,通過成績數(shù)據(jù)庫,納入學(xué)生的平時(shí)成績、考試成績以及總評成績;對于此數(shù)據(jù)庫,則由教師基于教學(xué)過程所產(chǎn)生;通過挖掘?qū)W生的各方面成績,了解學(xué)生的綜合素養(yǎng)與薄弱知識點(diǎn),為后續(xù)有針對性、分層教學(xué)提供有效依據(jù)。

      (3)結(jié)果評估與解釋。數(shù)據(jù)挖掘工作完成后,管理人員可根據(jù)所獲得的分析結(jié)果,或者是模式表達(dá)式,來評估、判斷其是否有效,是否與學(xué)生成績分析需求相符合,如若對挖掘結(jié)果不滿意,可更改算法后重新展開數(shù)據(jù)挖掘。值得注意的是,在學(xué)生成績分析挖掘過程中,需采取數(shù)據(jù)轉(zhuǎn)換的方式,比如將學(xué)生的成績分為三個等級:85-100分;65-84分;0-64分;對這三個等級的學(xué)生分?jǐn)?shù),可轉(zhuǎn)換成:優(yōu)、良、差三種轉(zhuǎn)換方式,然后以深直方圖的形式了解各個等級學(xué)生的分布及比重,為后續(xù)展開有針對性的教學(xué)工作提供客觀科學(xué)的參考依據(jù)??傊?,在學(xué)生成績數(shù)據(jù)挖掘分析過程中,為了直觀、形象地了解整體學(xué)生的學(xué)習(xí)情況,需進(jìn)行數(shù)據(jù)轉(zhuǎn)換。

      3 結(jié)語

      綜上所述,所謂大數(shù)據(jù),就是通過常用計(jì)算機(jī)軟件無法實(shí)現(xiàn)高效信息處理、管理的巨量數(shù)據(jù)信息集合。數(shù)據(jù)是一種沒有實(shí)際形態(tài)的東西,看不見也摸不著,但是作為一種信息載體,廣泛分布在人們的日常生活及社會的生產(chǎn)活動中,在這個信息爆炸的時(shí)代,采用大數(shù)據(jù)技術(shù),展開數(shù)據(jù)的收集、儲存、分析、挖掘、應(yīng)用,能夠更好地發(fā)揮信息的利用價(jià)值。而數(shù)據(jù)挖掘技術(shù),則能夠讓人們在海量信息中,挖掘出目標(biāo)信息,應(yīng)用于高校學(xué)生成績分析中,能夠讓學(xué)校管理者通過成績這些海量數(shù)據(jù),看到各班級、專業(yè)、院校的教學(xué)水平,再制定教學(xué)策略,提升辦學(xué)水平。

      猜你喜歡
      數(shù)據(jù)挖掘高校學(xué)生數(shù)據(jù)庫
      高校學(xué)生黨支部建設(shè)及作用發(fā)揮探索
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      高校學(xué)生意外傷害事件應(yīng)對與處理
      活力(2019年19期)2020-01-06 07:37:16
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      數(shù)據(jù)庫
      小議高校學(xué)生違紀(jì)處分制度
      數(shù)據(jù)庫
      數(shù)據(jù)庫
      數(shù)據(jù)庫
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      淮安市| 镇巴县| 张家口市| 威信县| 宜春市| 新和县| 芒康县| 松原市| 株洲县| 漠河县| 甘洛县| 城步| 铁力市| 丰台区| 沂源县| 会东县| 通州区| 泽州县| 青冈县| 当涂县| 咸宁市| 莆田市| 泰和县| 武汉市| 四平市| 黑山县| 榆树市| 东城区| 新宁县| 龙井市| 乌拉特后旗| 永定县| 固镇县| 新昌县| 永泰县| 昭觉县| 兰州市| 嘉鱼县| 汕头市| 禄劝| 郁南县|