• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于數(shù)據(jù)挖掘技術(shù)的高校教學質(zhì)量監(jiān)控研究

      2020-05-11 11:43:41郭欣章鳴嬛吳良陳瑛
      微型電腦應(yīng)用 2020年1期
      關(guān)鍵詞:教學質(zhì)量監(jiān)控數(shù)據(jù)挖掘技術(shù)因子分析

      郭欣 章鳴嬛 吳良 陳瑛

      摘?要: 教學質(zhì)量監(jiān)控是學校進行教學質(zhì)量管理的重要手段,對提高教學質(zhì)量具有重要意義。隨著校園信息化的發(fā)展,高校教務(wù)系統(tǒng)里積存了大量有價值的數(shù)據(jù),但卻沒有被很好的挖掘利用。鑒此提出將數(shù)據(jù)挖掘技術(shù)應(yīng)用到高校教學質(zhì)量監(jiān)控中,使用因子分析法對計算機專業(yè)的學生成績進行綜合評價分析,并提出一種決策樹改良方法對學生成績進行預(yù)測,最后針對文中所提出的方法與其他方法進行了對比分析。結(jié)果表明,

      因子分析法相對于平均分排名法,蘊含了更多的信息量可以提供更加全面的評價,另外其突出重要因素,可以對各方面情況進行合理量化;決策樹改良方法相對于其他成績預(yù)測方法穩(wěn)定性好、準確性高,且過擬合情況少。經(jīng)驗證,這個方法可以在高校教學質(zhì)量監(jiān)控中發(fā)揮一定作用。

      關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù); 教學質(zhì)量監(jiān)控; 因子分析; 決策樹; 聚類

      中圖分類號: TP311??????文獻標志碼: A

      Research on Teaching Quality Monitoring in Universities

      Based on Data Mining Technology

      GUO Xin1, ZHANG Minghuan1, WU Liang2,

      CHEN Ying1*

      Abstract: Monitoring teaching quality is an important means in teaching quality management in schools, and it is of great significance to improve the teaching quality. With the development of campus informatization, a lot of valuable data have been accumulated in the educational administration system of universities, but they have not been well mined and utilized. So this paper puts forward the application of data mining technology to the monitoring of teaching quality in universities. The factor analysis method is used to make a comprehensive evaluation and analysis of the students' achievements in computer major, and a decision tree improvement method is proposed to predict students' achievements. Finally, the methods proposed in this paper are compared with other methods in detail. The results show that factor analysis method contains more information than traditional methods and can provide more comprehensive evaluation. In addition, it highlights important factors and can quantify all aspects of the situation reasonably. Compared with the other methods, the improved method of decision tree has better stability, higher accuracy and less overfitting. It has been proved that the method proposed in this paper can play a certain role

      in the monitoring of teaching quality in universities.

      Key words: Datamining technology; Teaching quality monitoring; Factor analysis; Decision tree;

      Clustering

      0?引言

      教學質(zhì)量是高校生存和發(fā)展的生命線,學校通過教學質(zhì)量監(jiān)控體系發(fā)揮教學信息收集、教學效果評估、教學過程診斷和教學質(zhì)量提高的作用,對課程成績進行監(jiān)控是高校教學質(zhì)量監(jiān)控體系的重要內(nèi)容[1]。近年來高校的校園信息化建設(shè)已經(jīng)日臻成熟,高校教務(wù)系統(tǒng)里積存了大量有價值的成績數(shù)據(jù),但卻沒有被很好的挖掘利用,多數(shù)還停留在數(shù)據(jù)備份、簡單查詢、采用基礎(chǔ)的統(tǒng)計方法進行分析以及使用簡單的圖表進行展示等方式上[2]。數(shù)據(jù)挖掘技術(shù)可以進行數(shù)據(jù)分類和預(yù)測、聚類分析和關(guān)聯(lián)分析等,能夠?qū)?shù)據(jù)進行深層次挖掘,是提高分析和決策能力的重要研究領(lǐng)域[3]。將數(shù)據(jù)挖掘技術(shù)引入教學質(zhì)量監(jiān)控,對現(xiàn)有的成績數(shù)據(jù)進行客觀的分析,并挖掘出有價值的信息,無疑將有助于改進教學措施,提高教學質(zhì)量[4]。

      目前,已有將數(shù)據(jù)挖掘技術(shù)應(yīng)用于教學管理的相關(guān)研究,如文獻[5]研究了基于頻繁模式譜聚類的課程關(guān)聯(lián)分類模型和學生成績預(yù)測算法;文獻[6]提出一種基于K近鄰局部最優(yōu)重建的殘缺數(shù)據(jù)插補方法并結(jié)合隨機森林模型實現(xiàn)了成績預(yù)測;文獻[7]研究如何借助多種預(yù)測和統(tǒng)計手段用本科成績數(shù)據(jù)推測學生在研究生期間的表現(xiàn)。本文在借鑒前人研究經(jīng)驗的基礎(chǔ)上,使用因子分析法對計算機專業(yè)的學生成績進行綜合評價分析,并提出一種決策樹改良方法對學生成績進行預(yù)測,最后針對文中所提出的方法與其他方法進行了詳細的對比分析,從中找到更能促進教學質(zhì)量監(jiān)控的方法。

      1?數(shù)據(jù)采集與預(yù)處理

      本文涉及的所有樣本數(shù)據(jù)均來自我校教務(wù)系統(tǒng),以2018屆186名計算機科學與技術(shù)專業(yè)學生的17門課程的期末考試成績作為研究對象。為了規(guī)范研究數(shù)據(jù)的歸屬權(quán)與保護數(shù)據(jù)所有者的隱私,后續(xù)涉及相關(guān)數(shù)據(jù)時將采用編號等方式進行虛擬化處理。

      由于所研究的數(shù)據(jù)對象是學生多門課程的期末考試成績,所以首先需要將數(shù)據(jù)進行集成,本文利用數(shù)據(jù)庫技術(shù),根據(jù)學生學號的唯一性,將不同課程的成績合并到一個表中。其次,由于缺考或者沒有選課等原因,出現(xiàn)某些課程的成績?yōu)榭罩?另外有部分學生重修某些課程,出現(xiàn)成績重復的現(xiàn)象,所以接下來需要對集成好的數(shù)據(jù)進行清洗,方法如下:

      (1)對于多門課程沒有考試成績的學生數(shù)據(jù)直接刪除記錄;

      (2)對于同一門課程出現(xiàn)多個考試成績的學生數(shù)據(jù)采取其第一次考試的成績記錄;

      (3)針對部分成績空缺的學生數(shù)據(jù)用該課程的平均成績進行填補;

      (4)如果某門課程有多數(shù)學生成績空缺,則認為該課程數(shù)據(jù)異常,將其進行刪除處理。

      對數(shù)據(jù)清洗完成后,為了解決量綱不一致等問題對數(shù)據(jù)進行Z標準化處理。

      2?基于因子分析法的學生成績綜合評價

      本文以教育部計算機科學與技術(shù)教學指導委員會(下文簡稱“教指委”)提出的計算機專業(yè)人才培養(yǎng)的4項基本能力要求為參考依據(jù)(見表2)[8],選取17門專業(yè)必修課成績?yōu)檠芯繉ο?,根?jù)因子分析的基本原理和步驟,對學生成績進行綜合評價。這17門課分別為:計算機組成原理(X1)、計算機電路基礎(chǔ)(X2)、數(shù)據(jù)結(jié)構(gòu)(X3)、計算機網(wǎng)絡(luò)(X4)、離散數(shù)學(X5)、微型機接口技術(shù)(X6)、操作系統(tǒng)(X7)、C++面向?qū)ο蟪绦蛟O(shè)計(X8)、數(shù)據(jù)庫原理與技術(shù)(X9)、算法設(shè)計與分析(X10)、JSP/ASP

      WEB技術(shù)(X11)、JAVA語言程序設(shè)計(X12)、硬件課程設(shè)計(X13)、計算機信息安全(X14)、軟件工程(X15)、程序設(shè)計語言課程設(shè)計(X16)、C程序設(shè)計基礎(chǔ)(X17)。

      2.1?KMO和巴特利特球度檢驗

      KMO和巴特利特球度檢驗的取樣適切性量數(shù)為0.957,根據(jù)統(tǒng)計學家Kaiser給出的標準[9],可以認為數(shù)據(jù)對象適合因子分析。

      2.2?提取公因子

      由因子分析的共同度可知其提取值都介于0.5到0.8之間,可以認為因子基本能解釋各門專業(yè)課的方差。另外,從總方差的解釋情況可看出旋轉(zhuǎn)后第一個因子的方差貢獻率為43.347%,三個因子的累積方差貢獻率為69.916%,即三個因子解釋了原有17個變量的69.916%含義。

      2.3?公因子解釋

      為了使因子變量更具有可解釋性,對因子載荷矩陣進行了最大正交旋轉(zhuǎn),得到旋轉(zhuǎn)后的因子載荷矩陣,如表1所示。

      另外,根據(jù)教指委的指導意見,我們可以把計算機科學與技術(shù)專業(yè)本科生的專業(yè)能力、知識體系和上述17門課程之間的關(guān)系歸納如表2所示。

      結(jié)合表1和表2可以對3個公因子進行解釋:3個因子基本代表了專業(yè)能力培養(yǎng)目標所要求的4種能力,其中F1代表綜合能力、計算思維能力,F(xiàn)2代表算法設(shè)計與分析能力、系統(tǒng)的認知、分析、開發(fā)與應(yīng)用能力,F(xiàn)3代表程序設(shè)計與實現(xiàn)能力,如表3所示。

      2.4?用公因子進行綜合評價

      根據(jù)回歸算法計算出因子得分矩陣,據(jù)此可以得到因子得分函數(shù),鑒于篇幅原因,這里只給出F1因子的得分函數(shù),F(xiàn)2和F3雷同如式(1)。

      F1=0.154X1+0.213X2+0.117X3+0.194X4+0.149X5+0.112X6+0.093X7+0.076X8+0.029X9+0.03X10+0.205X11+0.05X12-0.021X13-0.322X14-0.015X15-0.216X16-0.012X17

      (1)

      學生的綜合表現(xiàn)由公因子反映,可以用公因子計算每個

      學生的成績綜合評分,公因子的權(quán)重取其方差貢獻率,則綜合評分的計算式為式(2)。F=0.574F1+0.072F2+0.054F3

      (2)??計算得到綜合評分之后,可以將其作為對學生成績進行排序和比較分析的依據(jù)。

      3?基于決策樹改良方法的學生成績預(yù)測

      3.1?決策樹改良方法介紹

      決策樹屬于有監(jiān)督式的機器學習方法 [10],本文使用的決策樹算法是C5.0。C5.0算法對數(shù)值變量進行離散化處理時使用的是MDLP(Minimal Description Length

      Principle,即最短描述長度原則)的熵分箱方法,其核心測度指標是信息熵和信息增益[11]。該方法不能按照各門課程考試的難易程度和分箱個數(shù)自定義分箱規(guī)則,不夠靈活,因此本文對其進行改良,先使用Kmeans聚類算法對各門課程的成績數(shù)據(jù)分別進行離散化處理,再進行目標課程成績預(yù)測。

      3.2?確定預(yù)測目標

      本文的預(yù)測目標是通過將教學計劃中的專業(yè)基礎(chǔ)課、專業(yè)核心課按照開課的先后順序進行整理,然后選出較早開設(shè)的課程成績作為解釋變量,來預(yù)測后續(xù)與之相關(guān)的高階專業(yè)課的學習成績,找出有可能掛科的學生,提前對其進行干預(yù),從而達到預(yù)警的目的。例如,將“計算機信息安全”作為預(yù)測目標,綜合考慮開課學期的順序和課程類別,將C程序設(shè)計基礎(chǔ)、操作系統(tǒng)、離散數(shù)學等9門課的成績作為解釋變量,對目標課程成績進行預(yù)測。

      3.3?利用聚類算法進行數(shù)據(jù)轉(zhuǎn)換

      按照前文所述,在使用C5.0算法對目標課程的成績進行預(yù)測之前,要將數(shù)據(jù)進行轉(zhuǎn)換,即采用Kmeans聚類算法對課程成績進行離散化處理。表4顯示的是聚類分析后各等級的聚類中心點情況,如表4所示。部分學生10門課程成績經(jīng)Kmeans聚類算法處理后的樣本分布情況,如表5所示。

      3.4?利用C5.0算法進行預(yù)測分析

      將離散化處理后的數(shù)據(jù)載入SPSS

      Modeler,并調(diào)用C5.0算法對其進行建模,采用十折交叉驗證算法作為模型的評估手段,Boosting算法作為提高預(yù)測準確度的方法,以獲得最佳的樹形結(jié)構(gòu),最終結(jié)果如圖1所示。

      如圖1所示,

      “數(shù)據(jù)庫原理及技術(shù)”是模型的根節(jié)點,可見其是信息熵增益最強的屬性,其次是離散數(shù)學,再次是C程序設(shè)計基礎(chǔ)、數(shù)據(jù)結(jié)構(gòu)等。因此,在9門作為解釋變量的課程中,“數(shù)據(jù)庫原理及技術(shù)”與“離散數(shù)學”對于預(yù)測目標課程“計算機信息安全”的成績的貢獻度最大,對于想取得優(yōu)異成績和預(yù)測結(jié)果較差的學生應(yīng)加強對這兩門課程的學習。另外,我們可以對決策樹進行規(guī)則提取,即沿著決策樹的根節(jié)點到每一個葉節(jié)點的路徑用IFTHEN語句進行表示。由于按照圖1所示的決策樹提取的規(guī)則較多,下面只列出“計算機信息安全”評級為“差”的規(guī)則,如下:

      IF( 數(shù)據(jù)庫原理及技術(shù)=“優(yōu)”or“中”or“良”) AND( 離散數(shù)學=“良”) AND( 數(shù)據(jù)結(jié)構(gòu)=“差”) THEN

      計算機信息安全=“差”

      從規(guī)則中我們可以看出,“數(shù)據(jù)庫原理及技術(shù)”的成績不是預(yù)測“計算機信息安全”是否為“差”的決定因素(從完整的決策樹可以看出其為預(yù)測“計算機信息安全”是否為“優(yōu)”的決定因素),而“離散數(shù)學”和“數(shù)據(jù)結(jié)構(gòu)”學不好,“計算機信息安全”就有可能掛科,因此當“離散數(shù)學”、“數(shù)據(jù)結(jié)構(gòu)”的成績不理想時,就應(yīng)該向相關(guān)學生進行預(yù)警。

      4?分析與討論

      4.1?因子分析與傳統(tǒng)綜合評價方法對比如表6所示。

      (1)因子分析法既可以從整體上對學生成績進行排序,還可以了解每位學生知識掌握情況的細節(jié),知道學生在哪些專業(yè)能力方面得到了較好的發(fā)展而哪些相對薄弱,例如表6中f14011632、f14011507兩名學生F綜合得分近似(分別為第1、2名),但是相比之下f14011632的F1因子得分較高,代表其綜合能力、計算思維相對較強,而F2、F3因子得分較低,代表其算法設(shè)計與分析,系統(tǒng)的認知、分析、開發(fā)與應(yīng)用,程序設(shè)計與實現(xiàn)能力較差,學號為f14011507的學生情況恰好相反。由此可見,相對于傳統(tǒng)的平均分排名法,因子分析法蘊含了更多的信息量,幫助教師引導學生及時調(diào)整學習和發(fā)展的方向。

      (2)由表6還可以看出因子分析與傳統(tǒng)的平均分排名結(jié)果不同,例如f14011632因子分析排名第1,但平均分卻排名第9;而f14011407因子分析排名第11,平均分排名卻達到第2,仔細觀察后不難發(fā)現(xiàn)f14011407各項成績比較均勻,而f14011632的F1因子得分非常突出,這與按平均分排名時各門課的權(quán)重相同,而因子分析法F1的權(quán)重較大的特點相對應(yīng)。由此可見,按平均分排名的傳統(tǒng)方法沒有對課程的重要性進行區(qū)分,而因子分析法突出重要因素,對各方面情況進行了合理量化。

      4.2?決策樹改良方法與其他學生成績預(yù)測方法對比

      下面通過實驗對比三種成績預(yù)測方法的效果,即直接用C5.0算法、經(jīng)傳統(tǒng)方法離散化處理后再用C5.0算法、決策樹改良方法,三者的對照結(jié)果如表7所示。

      其中,傳統(tǒng)的數(shù)據(jù)離散化方法是區(qū)間標記法,即指定一個分數(shù)區(qū)間將其標記為相應(yīng)等級(實驗中將85-100分標記為優(yōu)、70-84分標記為良、60-69分標記為中、0-59標記為差),從而替換連續(xù)的數(shù)值。

      由表7可以看出,決策樹改良方法的估計準確性最高,所生成的決策樹深度最小、葉子節(jié)點數(shù)最少,這表明由其生成的決策樹模型與其他兩種方法相比更加準確且健壯。另外,交叉驗證結(jié)果中決策樹改良方法的標準差也較小,說明其模型的穩(wěn)定性較好,預(yù)測的波動較小[12]。整體上來說,由于決策樹改良方法在對數(shù)據(jù)離散化處理時建立了合理的分箱規(guī)則,對課程本身的考試難度進行了區(qū)分,相對其他兩種方法,其效果更好。

      5?總結(jié)

      本文利用數(shù)據(jù)挖掘技術(shù)對學校教務(wù)系統(tǒng)里的成績數(shù)據(jù)進行了深入地挖掘與剖析。首先對教務(wù)系統(tǒng)中的數(shù)據(jù)進行采集和預(yù)處理,然后利用因子分析法對學生成績進行綜合評價,之后用Kmeans聚類算法+C5.0算法的決策樹改良方法對目標成績進行預(yù)測,最后將上述方法與其他方法進行了對比分析。分析結(jié)果表明:因子分析法相對于傳統(tǒng)方法,其分析結(jié)果更加全面、合理;決策樹改良方法相對于其他預(yù)測方法,穩(wěn)定性好、準確性高,并且生成的決策樹更加健壯,可以盡量避免過擬合現(xiàn)象。但是,由于目前擁有的數(shù)據(jù)有限,結(jié)果可能會存在一定的局限性,后續(xù)將進一步研究。

      參考文獻

      [1]?喬斌.SPSS在計算機課程教學質(zhì)量評估中的應(yīng)用[J].河套學院學報,2013(12):6566.

      [2]?紀連恩,高芳,黃凱鴻,等.面向多主體的大學課程成績相關(guān)性可視探索與分析[J].計算機輔助設(shè)計與圖形學學報,2018,30(1):4456.

      [3]?Jiawei Han, Micheline Kamber 著.數(shù)據(jù)挖掘概念與技術(shù)[M]范明,孟小峰,譯.北京:機械工業(yè)出版社,2007:8695.

      [4]?張?zhí)?基于數(shù)據(jù)挖掘的高校學生成績關(guān)聯(lián)分析研究[D].北京:北京郵電大學,2017.

      [5]?何楚,宋健,卓桐.基于頻繁模式譜聚類的課程關(guān)聯(lián)分類模型和學生成績預(yù)測算法研究[J].計算機應(yīng)用研究,2015,32(10):29302933

      [6]?曹歆雨,曹衛(wèi)權(quán),李崢,等.面向不確定殘缺數(shù)據(jù)的大學生成績預(yù)測方法[J].現(xiàn)代電子技術(shù),2018(6):145149.

      [7]?M Saarela,T K?rkk?inen. Analyzing Student Performance using Sparse Data of Core Bachelor Courses [J]. JEDMJournal of Educational DataMining,2015,75(1):332.

      [8]?教育部高等學校計算機科學與技術(shù)教學指導委員會.高等學校計算機科學與技術(shù)核心課程教學實施方案[M].北京:清華大學出版社,2009:45.

      [9]?Jin Hailiang, Liu Huijie. Research on visualization techniques in data mining[C].2009 International Conference on Computational Intelligence and Software Engineering, 2009.CiSE2009.International Conferenceon. IEEE,2010:131133.

      [10]?商俊燕,陸兵,柏倩然.決策樹C4.5算法在學生成績分析中的應(yīng)用[J].微型電腦應(yīng)用,2015,31(4):4345.

      [11]?Kaur P, Singh M, Josan G S. Classification and prediction based data mining algorithms to predict slow learners in education sector[J].Procedia ComputerScience,2015,57:500508.

      [12]?Ahmed M, Zafar B, Manzoor U. Modeling and predicting students' academic performance using data mining techniques[J].International Journal of Modern Education and Computer Science,2016(8):36.

      (收稿日期: 2019.07.22)

      基金項目:2018年教育部高教司協(xié)同育人項目(201802001049);2018年教育部高教司協(xié)同育人項目(201802111036)

      作者簡介:郭欣(1982),女,講師,碩士,研究方向:數(shù)據(jù)挖掘與分析。

      章鳴嬛(1980),女,副教授,博士,研究方向:計算機應(yīng)用。

      吳良(1955),男,教授,碩士,研究方向:教學質(zhì)量管理。

      通信作者:陳瑛(1968),女,教授,博士,研究方向:數(shù)據(jù)工程。文章編號:1007757X(2020)01000704

      猜你喜歡
      教學質(zhì)量監(jiān)控數(shù)據(jù)挖掘技術(shù)因子分析
      民辦高校教學質(zhì)量管理有效途徑探索
      大學教育(2017年1期)2017-02-13 19:25:16
      基于Web的數(shù)據(jù)挖掘技術(shù)與相關(guān)研究
      完善高職院校教學質(zhì)量監(jiān)控的幾點思考
      求知導刊(2016年30期)2016-12-03 10:46:58
      數(shù)據(jù)挖掘技術(shù)在生物信息學中的應(yīng)用
      數(shù)據(jù)挖掘技術(shù)在CRM中的應(yīng)用
      基于南京地鐵AFC系統(tǒng)的數(shù)據(jù)挖掘
      基于主導產(chǎn)業(yè)視角的戰(zhàn)略性新興產(chǎn)業(yè)識別以及實證研究
      基于SPC技術(shù)的課堂教學質(zhì)量監(jiān)控系統(tǒng)研究
      基于省會城市經(jīng)濟發(fā)展程度的實證分析
      中國市場(2016年33期)2016-10-18 12:16:58
      山東省縣域經(jīng)濟發(fā)展評價研究
      商(2016年27期)2016-10-17 07:17:42
      浪卡子县| 独山县| 舟山市| 株洲市| 永寿县| 阿合奇县| 墨竹工卡县| 肇源县| 大埔县| 阳山县| 承德市| 中牟县| 阜城县| 桓台县| 微山县| 巴中市| 桑植县| 马龙县| 环江| 南郑县| 甘肃省| 定日县| 来宾市| 大荔县| 成都市| 漳浦县| 扎赉特旗| 桃园县| 会同县| 唐河县| 资溪县| 藁城市| 汝南县| 绵阳市| 通榆县| 玛沁县| 南城县| 佛山市| 武夷山市| 杂多县| 丹阳市|