• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于機(jī)器學(xué)習(xí)的學(xué)生學(xué)情預(yù)警方法研究

      2023-11-22 06:03:25曹夢川歐陽儀伍丹杜朋軒
      現(xiàn)代信息科技 2023年19期
      關(guān)鍵詞:線性回歸機(jī)器學(xué)習(xí)

      曹夢川 歐陽儀 伍丹 杜朋軒

      摘? 要:對學(xué)生的學(xué)習(xí)成績進(jìn)行預(yù)測分析,提前預(yù)警學(xué)生可能存在的掛科或成績下降風(fēng)險,從而幫助學(xué)生和教師更好地制定學(xué)習(xí)計劃和提高教學(xué)效率。采集了包括學(xué)生的平時成績、考勤、性別和期末成績等多種因素的數(shù)據(jù),使用線性回歸模型進(jìn)行數(shù)據(jù)建模和預(yù)測分析。研究結(jié)果表明,該模型預(yù)測誤差小,具有實(shí)際應(yīng)用價值。研究成果可為學(xué)生和教師提供有益的參考,以便更好地實(shí)現(xiàn)教育教學(xué)目標(biāo)。

      關(guān)鍵詞:機(jī)器學(xué)習(xí);數(shù)據(jù)建模;預(yù)測分析;線性回歸

      中圖分類號:TP181;TP39? 文獻(xiàn)標(biāo)識碼:A? 文章編號:2096-4706(2023)19-0142-04

      Research on Student Learning Situation Early Warning Method Based on Machine Learning

      CAO Mengchuan, OU Yangyi, WU Dan, DU Pengxuan

      (Ningxia Polytechnic, Ningxia? 750021, China)

      Abstract: This research focuses on predicting and analyzing students' academic performance, gives an early warning of possible risk of failing or declining grades in advance, and helps students and teachers better plan their studies and improve teaching efficiency. The research collects data on various factors including students' regular grades, attendance, gender, and final grades, and uses linear regression models for data modeling and prediction analysis. The results show that the model has small prediction errors and practical application value. The results of this research can provide useful references for students and teachers to better achieve educational and teaching goals.

      Keywords: Machine Learning; data modeling; prediction analysis; linear regression

      0? 引? 言

      學(xué)生成績是評價學(xué)生學(xué)習(xí)成果的重要指標(biāo)之一。然而,現(xiàn)今本科、大專的教育模式與高中、初中的截然不同,因每學(xué)期代課的班級、院系、年級不同,教師很難及時關(guān)注所有學(xué)生的學(xué)習(xí)情況。當(dāng)學(xué)生在學(xué)習(xí)過程中出現(xiàn)學(xué)習(xí)狀態(tài)下滑、成績掉落、有期末掛科風(fēng)險等情況,教師無法及時幫助學(xué)生調(diào)整學(xué)習(xí)狀態(tài),學(xué)生也會因此產(chǎn)生消極的學(xué)習(xí)態(tài)度。因此,如何對學(xué)生學(xué)習(xí)情況進(jìn)行監(jiān)控預(yù)警,及時發(fā)現(xiàn)學(xué)生在學(xué)習(xí)過程中的問題并提供對應(yīng)的幫助,是教育工作者和家長們一直關(guān)注的問題。在這樣的背景下,本文提出了一種使用機(jī)器學(xué)習(xí)對學(xué)生平時成績進(jìn)行數(shù)據(jù)建模以預(yù)警學(xué)生學(xué)習(xí)情況的方法。

      1? 實(shí)現(xiàn)方法

      本次研究采用Python為主要開發(fā)語言,Python擁有眾多可用于數(shù)據(jù)科學(xué)、人工智能、機(jī)器學(xué)習(xí)等領(lǐng)域的開發(fā)庫,可以幫助開發(fā)者更加高效地編寫和構(gòu)建程序,大幅簡化代碼編寫,將重心更多地放在科研中。開發(fā)工具采用Jupyter Notebook;使用Pandas開發(fā)庫進(jìn)行數(shù)據(jù)前期數(shù)據(jù)清洗、特征處理;采用的機(jī)器學(xué)習(xí)算法、二值化、特征縮放、模型構(gòu)建、模型評分、數(shù)據(jù)集劃分等方法來自scikit-learn開發(fā)庫。

      1.1? 流程設(shè)計

      圖1為學(xué)生平時成績預(yù)測模型的實(shí)現(xiàn)流程圖。

      1.2? 原始數(shù)據(jù)集建立

      本文以寧夏職業(yè)技術(shù)學(xué)院軟件學(xué)院2021級100位學(xué)生在2021—2022年第二學(xué)期所學(xué)“數(shù)據(jù)分析與應(yīng)用”課程的歷史數(shù)據(jù)作為原始數(shù)據(jù),采集特征包括學(xué)生的姓名、學(xué)號、性別、年級、期中成績、平時成績、考勤、期末成績、課堂作業(yè)成績。

      1.3? 特征工程

      特征工程是對學(xué)生學(xué)情預(yù)警數(shù)據(jù)建模的第二步,也是最重要的一步,它是指對原始數(shù)據(jù)進(jìn)行特征提取、特征轉(zhuǎn)換和特征選擇等操作,以獲得對建模有用的特征(圖2)。特征工程是建立學(xué)生學(xué)習(xí)成績模型的關(guān)鍵環(huán)節(jié),直接影響模型的準(zhǔn)確性和實(shí)用性。將經(jīng)過特征工程處理后的數(shù)據(jù)集劃分為訓(xùn)練集和測試集,其中訓(xùn)練集占80%,測試集占20%,便于后續(xù)的測試與驗(yàn)證。

      1.3.1? 數(shù)據(jù)清洗

      數(shù)據(jù)清洗是指在對原始數(shù)據(jù)進(jìn)行處理之前,對數(shù)據(jù)進(jìn)行檢查、修改和刪除,以確保數(shù)據(jù)質(zhì)量和準(zhǔn)確性的過程。在本次研究中,首先要檢查學(xué)生信息是否存在缺失值和異常值,如果存在缺失值,需要采用合適的方式對數(shù)據(jù)進(jìn)行處理,例如當(dāng)該學(xué)生的成績出現(xiàn)了空缺值,可采用該名學(xué)生的平均值填充;如果存在異常值,則刪除該數(shù)據(jù)。

      1.3.2? 特征提取

      特征提取是機(jī)器學(xué)習(xí)中的一個重要步驟,其目的是將原始數(shù)據(jù)轉(zhuǎn)換為更具有代表性的特征。在機(jī)器學(xué)習(xí)中,特征是指用于描述數(shù)據(jù)的屬性或特性。良好的特征提取可以幫助機(jī)器學(xué)習(xí)算法更準(zhǔn)確地建立模型,提高預(yù)測和分類的準(zhǔn)確性。本次實(shí)驗(yàn)所收集到的學(xué)生數(shù)據(jù)特征不是全部都可用于訓(xùn)練模型,需要從學(xué)生數(shù)據(jù)中提取有用的特征,將無用特征刪除。實(shí)驗(yàn)進(jìn)行了以下的特征提?。?/p>

      刪除無用特征:在本次研究中,學(xué)生的姓名、學(xué)號、年級對于成績預(yù)警來說沒有任何幫助,需要將其刪除。刪除后特征如表1所示。

      合并特征:將每個學(xué)生的平時成績和課堂作業(yè)成績特征合并為一個平時成績特征,合并比例為平時成績占比60%,課堂作業(yè)成績占比40%;將期中成績和期末成績特征合并成為期末成績特征,合并比例為期中成績占比40%,期末成績占比60%。合并后將原始成績特征刪除。合并后如表2所示。

      1.3.3? 特征編碼

      特征編碼是將數(shù)據(jù)集中的特征轉(zhuǎn)換為機(jī)器學(xué)習(xí)算法可以理解和處理的形式的過程。在機(jī)器學(xué)習(xí)中,算法只能處理數(shù)字化的特征,因此需要將非數(shù)字化的特征轉(zhuǎn)換為數(shù)字化的形式。特征編碼的作用是將非數(shù)字化的特征轉(zhuǎn)換為數(shù)字化的形式,以便機(jī)器學(xué)習(xí)算法可以對其進(jìn)行處理和分析,提高模型的準(zhǔn)確性和效率,從而提高模型的預(yù)測能力。由于學(xué)生的性別特征無法直接被用于模型訓(xùn)練,所以需要將特征二值化,男轉(zhuǎn)換為1,女轉(zhuǎn)換為0。本次研究采用Scikit-learn庫中的Binarizer類對數(shù)據(jù)進(jìn)行二值化。

      1.3.4? 特征縮放

      特征縮放是指將不同特征的取值范圍縮放到相同的區(qū)間內(nèi),常見的縮放方式包括標(biāo)準(zhǔn)化和歸一化。特征縮放提高了模型訓(xùn)練的速度和精度,避免異常值對模型的影響,使模型更容易理解。在本次實(shí)驗(yàn)中各項(xiàng)數(shù)據(jù)之間的差距較大,需要對數(shù)據(jù)進(jìn)行特征縮放,以保證數(shù)據(jù)具有可比性。經(jīng)過多次實(shí)驗(yàn)表明,對特征使用標(biāo)準(zhǔn)化縮放所達(dá)到的模型效果更適用于本次的研究。

      1.3.5? 數(shù)據(jù)集劃分

      由于在模型構(gòu)建的過程中需要不斷地檢驗(yàn)?zāi)P偷臏?zhǔn)確率、檢驗(yàn)?zāi)P偷呐渲眉坝?xùn)練程度、過擬合還是欠擬合等,所以需要將訓(xùn)練數(shù)據(jù)再劃分為兩個部分,一部分用于訓(xùn)練的訓(xùn)練集,另一部分是進(jìn)行檢驗(yàn)的驗(yàn)證集。驗(yàn)證集可以重復(fù)使用,主要用于輔助構(gòu)建模型,調(diào)整模型。在本次實(shí)驗(yàn)中,將處理后的數(shù)據(jù)以8:2的比例劃分訓(xùn)練集和測試集。

      1.4? 模型選擇和構(gòu)建

      模型選擇和構(gòu)建是建模的核心環(huán)節(jié),該環(huán)節(jié)的主要任務(wù)是選擇適合學(xué)生數(shù)據(jù)建模的機(jī)器學(xué)習(xí)模型,不同的模型有不同的假設(shè)和約束條件,可以適用于不同的問題和數(shù)據(jù)集。選擇一個合適的模型可以提高預(yù)測的準(zhǔn)確性和泛化能力,避免過擬合或欠擬合的問題。因此在模型選擇和構(gòu)建過程中,需要考慮模型的準(zhǔn)確性、可解釋性、泛化能力等因素。

      在學(xué)生平時成績數(shù)據(jù)建模中,常用的機(jī)器學(xué)習(xí)模型包括線性回歸模型、決策樹模型、支持向量機(jī)模型和神經(jīng)網(wǎng)絡(luò)模型等。本次研究采用線性回歸模型,下面是模型選擇和構(gòu)建的具體步驟。

      1.4.1? 模型選擇

      線性回歸是一種用于建立變量之間線性關(guān)系的模型,該模型假設(shè)自變量與因變量之間存在線性關(guān)系,即自變量的每一個單位變化都會導(dǎo)致因變量發(fā)生相同的單位變化,同時它的系數(shù)具有可解釋性,可以通過系數(shù)的大小和符號來解釋不同自變量對因變量的影響程度和方向。在學(xué)生成績預(yù)警建模中,因?yàn)閷W(xué)生平時各項(xiàng)學(xué)習(xí)指標(biāo)會影響學(xué)生的期末成績,所以可以使用線性回歸模型來預(yù)測學(xué)生的學(xué)情。線性回歸模型的公式如下:

      y = β0 + β1 x1 + β2 x2 + … + βn xn

      其中,y為因變量,x1、x2、xn為自變量,β0、β2、βn為模型的參數(shù)。

      在本次研究中,模型的線性回歸公式為:

      y = θ0 + θ1 x1 + θ2 x2 + θ3 x3

      其中,x1為平時成績,x2為考勤,x3為性別(0或1),θ0、θ1、θ2、θ3為模型參數(shù),y為期末成績。

      1.4.2? 模型的構(gòu)建

      模型的構(gòu)建分為三個步驟:模型擬合、模型評估和模型應(yīng)用。其中模型擬合的本質(zhì)是求解上述公式的參數(shù)θ0、θ1、θ2、θ3,使用最小二乘法計算預(yù)測值與真實(shí)值的平方差,即可求解模型的參數(shù),公式如下:

      其中,yi為真實(shí)值, 為預(yù)測值。將模型代入上式,得到:

      將上式關(guān)于模型參數(shù)求導(dǎo),得到模型參數(shù)的最優(yōu)解:

      其中, 為模型參數(shù)的最優(yōu)解,x為數(shù)據(jù)集的自變量(考勤、性別、平時成績),y為數(shù)據(jù)集的因變量(期末成績)。將? 帶入公式內(nèi),即可實(shí)現(xiàn)模型擬合。

      在模型擬合之后,需要對模型進(jìn)行評估,以確定模型的準(zhǔn)確性和泛化能力。為了保證實(shí)驗(yàn)的嚴(yán)謹(jǐn),本次研究選擇了選擇3種評估方式對模型進(jìn)行評估,包括均方誤差(Mean Squared Error, MSE)、均方根誤差(Root Mean Squared Error, RMSE)和決定系數(shù)(Coefficient of Determination, R2)。

      均方誤差(MSE)是評估線性回歸模型預(yù)測效果的常用指標(biāo)。它計算的是預(yù)測值與真實(shí)值之間差的平方的平均值。其公式如下:

      其中,yi為第i個樣本的真實(shí)值, 為該樣本的預(yù)測值,m為樣本數(shù)。

      均方根誤差(RMSE)是MSE的平方根,它更直觀地反映了預(yù)測值與真實(shí)值之間的差距。其公式如下:

      決定系數(shù)(R2)是評估線性回歸模型擬合優(yōu)度的指標(biāo),它表示模型能夠解釋樣本數(shù)據(jù)變異性的比例。其取值范圍在0到1之間,越接近1表示模型的擬合效果越好。R2的公式如下:

      其中, 為所有樣本數(shù)據(jù)的平均值。

      表3是采用MSE、RMSE、R2三種評估方式的結(jié)果。

      從表中可以看出,該線性回歸模型在測試集上的MSE為8.48,RMSE為2.91,R2為0.87,說明該模型具有較高的預(yù)測準(zhǔn)確性,可以滿足實(shí)驗(yàn)的初步要求。

      在模型評估之后,即模型應(yīng)用階段,可將學(xué)生平時成績信息帶入模型,模型將預(yù)測學(xué)生的成績通過接口傳入預(yù)警方法中。預(yù)警方法通過對預(yù)測成績進(jìn)行分級,60以下為紅色預(yù)警,70~79為黃色預(yù)警,80~100為綠色預(yù)警,當(dāng)學(xué)生預(yù)測成績處于黃色和紅色預(yù)警階段,證明該名學(xué)生有成績下降和掛科的風(fēng)險。

      綜上所述,模型選擇和構(gòu)建是學(xué)生平時成績數(shù)據(jù)建模的關(guān)鍵環(huán)節(jié)。在選擇模型時,需要考慮模型的準(zhǔn)確性、可解釋性、泛化能力等因素,并根據(jù)實(shí)際需求選擇最合適的模型。在構(gòu)建模型時,需要進(jìn)行模型擬合、模型評估和模型應(yīng)用等步驟,以獲得準(zhǔn)確、穩(wěn)定和可靠的預(yù)測結(jié)果。

      2? 結(jié)果驗(yàn)證分析

      本次結(jié)果驗(yàn)證使用2022級人工智能技術(shù)與應(yīng)用班級28位同學(xué)在2022—2023學(xué)年第一學(xué)期“數(shù)據(jù)分析”課程數(shù)據(jù)進(jìn)行結(jié)果驗(yàn)證,并使用預(yù)測結(jié)果和真實(shí)結(jié)果進(jìn)行對比,以下是其中5位學(xué)生的預(yù)測成績和實(shí)際成績的數(shù)據(jù)對比,結(jié)果如表4所示。

      由表4可得出,學(xué)生的期末成績預(yù)測值與實(shí)際期末成績進(jìn)行對比,預(yù)測的成績與實(shí)際的成績之間的誤差較小,預(yù)測值可有效地反映學(xué)生在學(xué)習(xí)過程中的成績情況,說明該模型具有實(shí)際的應(yīng)用價值,可以為學(xué)生和老師提供有效的成績預(yù)警。通過分析該模型參數(shù)的權(quán)重,發(fā)現(xiàn)學(xué)生的平時成績對于預(yù)測模型的影響最大,考勤和性別的影響相對較小。這也說明了學(xué)生的平時成績是影響學(xué)生成績的重要因素,需要在教學(xué)中重點(diǎn)關(guān)注和提升。

      3? 結(jié)? 論

      通過上述實(shí)驗(yàn)可以看出,基于線性回歸算法構(gòu)建的學(xué)生平時成績預(yù)測模型的預(yù)測準(zhǔn)確率是可以初步滿足學(xué)生學(xué)情預(yù)警的。雖然預(yù)測結(jié)果存在一定的誤差,但整體上預(yù)測結(jié)果與實(shí)際成績的差距較小。在實(shí)際應(yīng)用中,可以使用該模型來進(jìn)行學(xué)生的成績預(yù)警,及時發(fā)現(xiàn)學(xué)生的學(xué)情問題,提供個性化的學(xué)習(xí)建議,及時調(diào)整學(xué)習(xí)態(tài)度,在一定程度上改善學(xué)習(xí)狀態(tài),從而實(shí)現(xiàn)對學(xué)生學(xué)情的監(jiān)測和預(yù)警。未來,可以進(jìn)一步改進(jìn)模型,采用更加復(fù)雜的機(jī)器學(xué)習(xí)算法,如決策樹、隨機(jī)森林等,以提高預(yù)測的準(zhǔn)確性。

      參考文獻(xiàn):

      [1] 王琪,靳瑩.中等教育學(xué)段學(xué)情分析研究述評 [J].教育理論與實(shí)踐,2023,43(2):54-57.

      [2] 魏超.機(jī)器學(xué)習(xí)算法在大學(xué)生綜合素質(zhì)測評預(yù)警中的對比研究 [J].電腦編程技巧與維護(hù),2022(12):127-129.

      [3] 崔爭艷,劉晨晨,孫濱.基于機(jī)器學(xué)習(xí)的MOOC學(xué)習(xí)者棄學(xué)預(yù)測與預(yù)警系統(tǒng)實(shí)現(xiàn) [J].信息與電腦:理論版,2022,34(1):65-67.

      [4] 徐彩鳳.依托TPACK理論,推進(jìn)統(tǒng)計信息化教學(xué)——以“一元線性回歸模型的應(yīng)用”為例 [J].中學(xué)數(shù)學(xué)月刊,2023(3):48-50+63.

      [5] 李治軍,姚蓉.基于主成分分析和多元線性回歸的黑龍江省用水效率研究 [J].水利科技與經(jīng)濟(jì),2023,29(2):60-64.

      [6] 李非.案例分析在統(tǒng)計多元線性回歸預(yù)測模型教學(xué)中的應(yīng)用研究 [J].現(xiàn)代職業(yè)教育,2019(8):86-87.

      [7] 劉學(xué)彥,趙建立,相文楠,等.擬線性回歸預(yù)測模型的穩(wěn)定最小二乘解 [J].數(shù)學(xué)的實(shí)踐與認(rèn)識,2011,41(20):92-97.

      作者簡介:曹夢川(1990—),男,漢族,寧夏銀川人,助教,碩士,研究方向:數(shù)據(jù)分析、人工智能。

      收稿日期:2023-04-09

      基金項(xiàng)目:2022年度職業(yè)教育研究和開放教育綜合改革研究專項(xiàng)課題(XJ202207);2020年寧夏回族自治區(qū)科學(xué)技術(shù)學(xué)會第五批自治區(qū)青年科技人才托舉工程

      猜你喜歡
      線性回歸機(jī)器學(xué)習(xí)
      國道公路養(yǎng)護(hù)管理與規(guī)劃研究
      基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
      基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
      基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
      時代金融(2016年27期)2016-11-25 17:51:36
      前綴字母為特征在維吾爾語文本情感分類中的研究
      基于支持向量機(jī)的金融數(shù)據(jù)分析研究
      投資者情緒與股票市場收益的相互影響分析
      中國市場(2016年18期)2016-06-07 05:12:49
      機(jī)器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
      影響上市公司股票價格的微觀因素分析
      商(2016年13期)2016-05-20 09:12:44
      企業(yè)退休金收支平衡的研究
      科技視界(2016年9期)2016-04-26 12:16:25
      夏河县| 大埔县| 武安市| 台东市| 隆德县| 沙坪坝区| 大渡口区| 洛宁县| 迁安市| 哈巴河县| 调兵山市| 德庆县| 湘潭市| 蒙自县| 沙雅县| 通辽市| 和田县| 武清区| 辽中县| 洪江市| 南京市| 永年县| 深水埗区| 墨江| 叶城县| 深泽县| 镇坪县| 锦屏县| 贵阳市| 翁源县| 临海市| 徐水县| 庆城县| 巴中市| 隆子县| 竹山县| 玉门市| 华宁县| 平遥县| 平原县| 楚雄市|