• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      融合隨機(jī)森林和神經(jīng)網(wǎng)絡(luò)的教學(xué)質(zhì)量分析算法

      2023-08-29 02:05:42駱仕杰韓抒真
      關(guān)鍵詞:教學(xué)信息教學(xué)質(zhì)量特征

      駱仕杰,韓抒真

      (天津工業(yè)大學(xué) 網(wǎng)絡(luò)安全和信息化辦公室,天津 300387)

      1 引 言

      隨著互聯(lián)網(wǎng)推動(dòng)信息化技術(shù)的爆發(fā)式發(fā)展,數(shù)據(jù)的規(guī)模也逐漸擴(kuò)大,由此引發(fā)了缺失數(shù)據(jù)、劣質(zhì)數(shù)據(jù)、數(shù)據(jù)分散等問(wèn)題,因此數(shù)據(jù)治理顯得尤為重要.數(shù)據(jù)治理可以盡可能彌補(bǔ)缺失數(shù)據(jù),清洗劣質(zhì)數(shù)據(jù),還可以有效地歸一和聚合分散的數(shù)據(jù).在高校中,由于學(xué)科多,學(xué)科之間存在一定差異,信息化技術(shù)高速發(fā)展的今天,教學(xué)手段也更靈活多樣,高校教學(xué)質(zhì)量評(píng)估變得相當(dāng)復(fù)雜,如何有效的分析影響教學(xué)質(zhì)量的因素,并且可以盡可能多方面的影響維度進(jìn)行分析,分析的合理有效是一個(gè)頗具挑戰(zhàn)性的問(wèn)題.目前,教學(xué)質(zhì)量為衡量各高校的水平的重要指標(biāo)之一,如何有效地分析研究影響學(xué)校教學(xué)質(zhì)量的原因是提升學(xué)校水平的重要方法.數(shù)據(jù)治理中將學(xué)校的各業(yè)務(wù)數(shù)據(jù)標(biāo)準(zhǔn)統(tǒng)一,提高數(shù)據(jù)質(zhì)量,降低數(shù)據(jù)的冗余性.在更豐富的數(shù)據(jù)中使用數(shù)據(jù)挖掘技術(shù)對(duì)影響教學(xué)質(zhì)量的原因進(jìn)行分析,可以更具體更全面的構(gòu)建分析模型,對(duì)影響教學(xué)質(zhì)量的因素進(jìn)行分級(jí)排序,用更科學(xué)和合理的方式對(duì)現(xiàn)階段影響教學(xué)質(zhì)量的因素進(jìn)行量化分析,可以指導(dǎo)高校制定適合自己學(xué)校的制度和方法來(lái)有效的提升教學(xué)質(zhì)量[1-3].

      教學(xué)質(zhì)量評(píng)估中比較重要的影響因素有教師的信息,因此在教學(xué)質(zhì)量分析模型中需要構(gòu)造好的教師畫(huà)像.國(guó)外學(xué)者Gorrab A等已經(jīng)證實(shí)將社交信息融入進(jìn)去來(lái)構(gòu)造用戶畫(huà)像取得了較好的成效[4].本文采取相似的思路在構(gòu)造師資信息和學(xué)生信息相關(guān)的模型時(shí)融入了學(xué)生和教師的社交信息.國(guó)內(nèi)學(xué)者楊長(zhǎng)春,徐筱等人使用隨機(jī)森林方法在用戶畫(huà)像的構(gòu)建上有很好的突破,但是數(shù)據(jù)維度較為稀疏,并且特征上均為靜態(tài)信息,在特征豐富度上稍有不足[5].本文在用戶的特征上具備了社交信息、評(píng)價(jià)信息等動(dòng)態(tài)信息作為特征,可以在畫(huà)像的構(gòu)造上更加完整.鄂海紅、張文靜等學(xué)者通過(guò)深度神經(jīng)網(wǎng)絡(luò)可以良好的構(gòu)造實(shí)體關(guān)系,教師、學(xué)生和教學(xué)信息之間的信息關(guān)系類似構(gòu)造實(shí)體關(guān)系網(wǎng)絡(luò),因此本文采取了深度神經(jīng)網(wǎng)絡(luò)來(lái)處理學(xué)生信息數(shù)據(jù)模型[6].李恒超等人提出了構(gòu)建用戶畫(huà)像的二級(jí)融合算法,成功在用戶畫(huà)像的構(gòu)建中使用了融合算法.本文將教師和學(xué)生的畫(huà)像信息通過(guò)模型構(gòu)造后引入教學(xué)評(píng)估的融合模型認(rèn)為會(huì)充分發(fā)揮畫(huà)像信息的作用[7].

      快速高效的從開(kāi)放領(lǐng)域中提取出有效的信息并且建立好的實(shí)體關(guān)系作為數(shù)據(jù)挖掘和信息抽取的重要問(wèn)題[8].Feng X,Guo J等人通過(guò)使用雙向神經(jīng)網(wǎng)絡(luò)提取出了信息之間的監(jiān)督關(guān)系,建立了較好的關(guān)系網(wǎng)絡(luò)模型[9].但是僅僅采用雙向神經(jīng)網(wǎng)絡(luò)構(gòu)造的關(guān)系模型的缺點(diǎn)在于如果出現(xiàn)特征維度過(guò)高或者無(wú)用關(guān)系特征過(guò)多,關(guān)系網(wǎng)絡(luò)將會(huì)非常復(fù)雜,導(dǎo)致效果不佳[10,11].本文引入Attention機(jī)制將較好的解決這一問(wèn)題.

      目前國(guó)內(nèi)外針對(duì)教學(xué)質(zhì)量分析的數(shù)據(jù)挖掘研究主要針對(duì)于經(jīng)過(guò)認(rèn)可的影響因素來(lái)構(gòu)建,對(duì)挖掘特征的擴(kuò)展性和延展性略有不足.因此采用深度學(xué)習(xí)模型計(jì)算復(fù)雜的關(guān)系特征的關(guān)聯(lián)規(guī)則,并且使用隨機(jī)森林模型特點(diǎn),讓評(píng)估指標(biāo)更好的通過(guò)權(quán)重來(lái)解釋.充分利用數(shù)據(jù)治理將高校各系統(tǒng)的數(shù)據(jù)匯總的優(yōu)勢(shì),有效的選取影響教學(xué)質(zhì)量的影響因素作為特征,最后將深度神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林模型融合在一起得到最后的教學(xué)質(zhì)量分析模型(RALCA).本模型通過(guò)數(shù)據(jù)挖掘算法和建模的方式更科學(xué)的對(duì)影響教學(xué)質(zhì)量的因素做分析,可以更直觀的得到影響教學(xué)質(zhì)量因素的影響因素,通過(guò)已有的教學(xué)質(zhì)量評(píng)估數(shù)據(jù)實(shí)際分析,可以更好的提高教學(xué)質(zhì)量.

      2 數(shù)據(jù)模型的構(gòu)建

      影響教學(xué)質(zhì)量的因素復(fù)雜多樣,教學(xué)質(zhì)量分析主要和教師、學(xué)生的個(gè)人信息、教學(xué)互動(dòng)信息兩部分信息相關(guān),針對(duì)兩類信息的數(shù)據(jù)特點(diǎn),制定不同的分析方案,選擇適合的數(shù)據(jù)模型進(jìn)行挖掘來(lái)做模型融合前的第一步工作.

      2.1 人物畫(huà)像數(shù)據(jù)模型

      人事系統(tǒng)主要存放在職教師的個(gè)人信息數(shù)據(jù),人事系統(tǒng)中教師的個(gè)人信息具有結(jié)構(gòu)化、可表示性較強(qiáng)的特點(diǎn).師資信息的數(shù)據(jù)來(lái)源于人事系統(tǒng),人事系統(tǒng)中數(shù)據(jù)主要對(duì)教師的教學(xué)水平、科研水平等有較好的表示,因此人事信息對(duì)教學(xué)質(zhì)量評(píng)估的影響有很強(qiáng)的指向性意圖.對(duì)于人事系統(tǒng)的信息,目的是有效的衡量教師的科研能力、組織能力、教學(xué)能力、工作能力等方面.學(xué)生信息數(shù)據(jù)來(lái)源于研究生院系統(tǒng)和教務(wù)系統(tǒng),學(xué)生的信息數(shù)據(jù)包括學(xué)生基本信息和行為信息數(shù)據(jù),兩者類型的數(shù)據(jù)關(guān)系比較復(fù)雜,又涉及到一些學(xué)生基本信息和學(xué)生的行為數(shù)據(jù)有關(guān)聯(lián)的特點(diǎn).已有的決策樹(shù)算法對(duì)特征之間的無(wú)關(guān)聯(lián)性要求較高才能達(dá)到很好的效果,人事系統(tǒng)中的數(shù)據(jù)特征有很多是具有關(guān)聯(lián)性意義的,比如教學(xué)能力和科研能力有一定關(guān)系,組織能力和教學(xué)能力也有一定關(guān)系,所以要對(duì)模型的泛化能力做著重關(guān)注,最終決定選取隨機(jī)森林模型來(lái)構(gòu)建人物畫(huà)像信息方面的數(shù)據(jù).

      隨機(jī)森林模型(Random Forest,簡(jiǎn)稱RF)是一種有監(jiān)督學(xué)習(xí)算法[12].隨機(jī)森林是多個(gè)決策樹(shù)集成到一起而構(gòu)建成的,通過(guò)隨機(jī)性來(lái)構(gòu)建森林,使用“bagging”的方法訓(xùn)練而成,bagging方法即為bootstrap aggregating,采用的是隨機(jī)又放回的選擇訓(xùn)練數(shù)據(jù)然后構(gòu)造分類器,最后通過(guò)組合學(xué)習(xí)到的模型來(lái)增加整體的效果[13,14].

      隨機(jī)森林的算法流程如下:

      1)其中,特征數(shù)量N,通過(guò)有放回的抽樣可以構(gòu)造成(m×n)m×n的抽樣空間假設(shè)存在數(shù)據(jù)集D:

      D={xi1,xi2,…,xin,yi}(i∈[1,m])

      (1)

      2)構(gòu)建決策樹(shù)的學(xué)習(xí)器:對(duì)于每一個(gè)抽樣

      dj={xi1,xi2,…,xik,yi}(i∈[1,m])

      (2)

      生成決策樹(shù),并且記錄每一個(gè)的決策樹(shù)結(jié)果為hj(x);

      3)使用加權(quán)投票法訓(xùn)練C次使得

      (3)

      其中φ即為加權(quán)投票法.

      2.2 教學(xué)信息數(shù)據(jù)模型

      教學(xué)信息數(shù)據(jù)主要以教師和學(xué)生對(duì)教學(xué)情況的評(píng)估為主,因此核心的內(nèi)容是要構(gòu)造教師對(duì)于課堂的講授因素、教師對(duì)課程本身的調(diào)控關(guān)系因素、學(xué)生對(duì)于課堂的接收能力以及學(xué)生對(duì)于課堂的授課方式的評(píng)價(jià)等關(guān)系對(duì)于教學(xué)質(zhì)量的影響.教學(xué)信息數(shù)據(jù)模型目的是為了表示學(xué)生、教師信息和教學(xué)情況信息的關(guān)聯(lián)關(guān)系進(jìn)行較好的表示.深度神經(jīng)網(wǎng)絡(luò)具有對(duì)復(fù)雜關(guān)系解釋性強(qiáng)和對(duì)特征合理強(qiáng)化或者弱化的優(yōu)點(diǎn),在處理關(guān)聯(lián)性較多的這種多維特征、關(guān)系復(fù)雜的問(wèn)題可以有效地對(duì)特征進(jìn)行篩選且較好地解釋特征之間的關(guān)系.近年來(lái),深度學(xué)習(xí)領(lǐng)域中提出的注意力機(jī)制(Attention Mechanism)在面臨一些需要突出關(guān)注的特征弱化無(wú)關(guān)的特征類型的困難任務(wù)中,能有效地提高深度學(xué)習(xí)算法的準(zhǔn)確率[15,16].注意力機(jī)制的思想是在模仿人腦的注意力機(jī)制,人的大腦在接收外界信輸入的時(shí)候,通常是不能將全部的信息進(jìn)行處理的,會(huì)有選擇的進(jìn)行處理,選擇的標(biāo)準(zhǔn)就是將注意力集中在部分關(guān)鍵的信息上,過(guò)濾掉自認(rèn)為不重要的信息,讓自己的注意力更加關(guān)注到關(guān)鍵的部分,從而使得信息處理的效率和準(zhǔn)確率有所提升[17].教學(xué)信息數(shù)據(jù)維度較多,但不是所有的信息都是質(zhì)量分析模型關(guān)注的,比如教學(xué)的師資信息、教學(xué)課程年份等為需要關(guān)注的信息,而教師與學(xué)生的性別、愛(ài)好、社團(tuán)參加經(jīng)歷等為弱化關(guān)注的信息.針對(duì)教學(xué)信息數(shù)據(jù)特征關(guān)注度不同的特點(diǎn),準(zhǔn)備采取注意力機(jī)制和神經(jīng)網(wǎng)絡(luò)結(jié)合的方式作為學(xué)生信息數(shù)據(jù)處理的模型選擇.

      選用注意力機(jī)制與長(zhǎng)短記憶神經(jīng)網(wǎng)絡(luò)(Long Short Term Memory,簡(jiǎn)稱LSTM)進(jìn)行結(jié)合的方法來(lái)構(gòu)造模型.LSTM作為深度神經(jīng)網(wǎng)絡(luò)對(duì)數(shù)據(jù)的抽象關(guān)系表述較好,并且對(duì)學(xué)習(xí)長(zhǎng)期的依賴性的關(guān)系信息有較好的保存能力[18].

      Attention-LSTM模型的計(jì)算過(guò)程如下:

      Ci為不同時(shí)間的壓縮信息,hi為L(zhǎng)STM作為編碼器每一個(gè)step的輸出,yi為輸出hi經(jīng)softmax層后得到的注意力權(quán)重.

      某一時(shí)間間隔為t,將第n個(gè)LSTM編碼器輸出向量記為H:

      H=(h1,h2,…,hn)

      (4)

      其中,Gt為給定時(shí)間間隔t的輸入門(mén)、遺忘門(mén)和輸出門(mén),這些從LSTM輸出的hi經(jīng)過(guò)softmax層后計(jì)算得出注意力機(jī)制的權(quán)重:

      yi=softmax(hi)×[(Gt)×tanh(ci)]

      (5)

      注意力權(quán)重向量記為Y:

      Y=(y1,y2,y3,…,yn)

      (6)

      由上述計(jì)算可得到影響因素的權(quán)重向量表示,得到學(xué)生、教師和教學(xué)信息數(shù)據(jù)的之間的關(guān)系表示.

      3 模型設(shè)計(jì)

      3.1 影響教學(xué)質(zhì)量數(shù)據(jù)分析

      為了更好的完成對(duì)教學(xué)質(zhì)量分析的模型構(gòu)建,首先要對(duì)可以構(gòu)建影響教學(xué)質(zhì)量評(píng)估分析的模型的數(shù)據(jù)因素進(jìn)行分析,在數(shù)據(jù)采集上通過(guò)數(shù)據(jù)治理工具采集了教師信息、學(xué)生信息和教學(xué)信息3部分的數(shù)據(jù).下面將對(duì)這3部分的數(shù)據(jù)具體進(jìn)行分析展示:

      1)教師與學(xué)生信息

      教師的數(shù)據(jù)信息主要來(lái)自人事系統(tǒng),是一些教師的基本信息、科研信息、師資信息等.教學(xué)質(zhì)量評(píng)估中教師的信息作為比較重要的特征信息,表1展示部分教師信息數(shù)據(jù)特征,教師信息數(shù)據(jù)特征總共有178個(gè).

      表1 高校教師信息數(shù)據(jù)特征簡(jiǎn)介

      學(xué)生的數(shù)據(jù)信息主要來(lái)自于研究生院,是學(xué)生的基本信息、授課信息、導(dǎo)師關(guān)系、研究方向、課堂狀態(tài)等.在教學(xué)質(zhì)量評(píng)估分析中,學(xué)生的最終學(xué)習(xí)效果和學(xué)生的研究方向、個(gè)人驅(qū)動(dòng)等方面原因結(jié)合起來(lái)進(jìn)行分析,對(duì)教學(xué)質(zhì)量評(píng)估的分析更客觀和直接,比如生源不同、入學(xué)方式不同等各方面因素均會(huì)體現(xiàn)學(xué)生的學(xué)習(xí)能力、學(xué)習(xí)驅(qū)動(dòng)型等特征,通過(guò)這些特征再進(jìn)一步和學(xué)生的聽(tīng)課狀態(tài)、考試方法、教學(xué)情況結(jié)合起來(lái)分析可以更好的分析影響教學(xué)質(zhì)量的因素.表2展示部分學(xué)生信息數(shù)據(jù)特征,學(xué)生信息數(shù)據(jù)特征總共有112個(gè).

      表2 高校學(xué)生信息數(shù)據(jù)特征簡(jiǎn)介

      2)教學(xué)信息

      教學(xué)信息數(shù)據(jù)是來(lái)源于教務(wù)處系統(tǒng),這個(gè)也是主要教學(xué)質(zhì)量評(píng)估分析的核心數(shù)據(jù)信息內(nèi)容,這部分?jǐn)?shù)據(jù)大多數(shù)是用課堂教學(xué)評(píng)價(jià)的信息,用來(lái)連接教師和學(xué)生的核心數(shù)據(jù).從教師角度分析得到教師課堂教學(xué)特征,包括聽(tīng)課次數(shù)、調(diào)課次數(shù)、提前下課次數(shù)、找人代課次數(shù)、留作業(yè)次數(shù)、隨堂檢驗(yàn)次數(shù)、ppt制作次數(shù)等.從學(xué)生角度分析得到學(xué)生評(píng)價(jià)課堂教學(xué)特征,包括課堂內(nèi)容合理程度、講課的質(zhì)量評(píng)估、授課技巧評(píng)估、教師責(zé)任心、作業(yè)批改認(rèn)真程度、課堂內(nèi)容實(shí)踐意義、課堂氛圍好壞、考試內(nèi)容是否符合教學(xué)等.

      3.2 教學(xué)質(zhì)量分析模型設(shè)計(jì)

      3.2.1 模型融合

      模型的融合的技術(shù)有很多方法,可以通過(guò)回歸算法,例如線性回歸(Linear Regression)、邏輯回歸(Logistic Regression)、Lasso回歸等方法對(duì)特征的權(quán)重重新擬合達(dá)到多個(gè)模型融合的目的.當(dāng)然還有針對(duì)不同類別的數(shù)據(jù)特征設(shè)計(jì)的模型融合算法,例如投票算法(Voting)、排名排序算法(Ranking)、抽樣生成算法(Bagging)、交叉加權(quán)平均算法(Blending)、疊加法(Stacking)等對(duì)多個(gè)模型的輸出進(jìn)行進(jìn)一步的處理得到最終結(jié)果[19].神經(jīng)網(wǎng)絡(luò)concatenate層不僅僅是對(duì)模型信息的一個(gè)疊加或者是排序,而是在保證原有的特征維度基礎(chǔ)上的一個(gè)通道數(shù)的合并,對(duì)特征的信息描述的更加具體.另外由于涉及到教學(xué)質(zhì)量分析的特征維度較高,采用疊加或者排序的方法很容易造成過(guò)擬合,采用神經(jīng)網(wǎng)絡(luò)concatenate層可以有效的避免特征維度較高并且樣本數(shù)量較少的過(guò)擬合情況,在維持原有特征維度的基礎(chǔ)上更加高效進(jìn)行特征的信息聯(lián)合[20].為了讓模型在特征層面進(jìn)行融合,并且可以對(duì)特征進(jìn)行聯(lián)合,最終選取神經(jīng)網(wǎng)絡(luò)concatenate層對(duì)學(xué)生信息模型、教師信息模型和教學(xué)信息模型的輸出層進(jìn)行信息融合.

      3.2.2 教學(xué)質(zhì)量分析模型RALCA的設(shè)計(jì)

      教學(xué)質(zhì)量的影響因素受到學(xué)生、教師信息數(shù)據(jù)和教學(xué)信息數(shù)據(jù)的影響.學(xué)生的信息數(shù)據(jù)主要對(duì)教學(xué)質(zhì)量的影響在于判斷學(xué)生是否認(rèn)真學(xué)習(xí)、學(xué)生的學(xué)習(xí)質(zhì)量如何.

      教師信息數(shù)據(jù)在于課堂教學(xué)的質(zhì)量和授課方法的效果等因素對(duì)教學(xué)質(zhì)量的影響.使用RF模型可以較好的表現(xiàn)學(xué)生、教師自身因素對(duì)于教學(xué)質(zhì)量的影響,生成對(duì)學(xué)生較好表達(dá)的人物畫(huà)像信息特征.教學(xué)信息模型采用循環(huán)神經(jīng)網(wǎng)絡(luò)挖掘教師、學(xué)生信息與教學(xué)特征之間的關(guān)聯(lián)關(guān)系,引入注意力機(jī)制排除一些影響較小的因素,生成稀疏高維度的教師信息特征.使用concatenate方法融合了學(xué)生、教師信息特征和教學(xué)信息特征,然后將融合的特征輸入到一個(gè)全連接層,使用全連接層將學(xué)習(xí)到的特征表示映射到樣本的標(biāo)記空間,將所有的特征整合到一起,對(duì)特征進(jìn)行提純和篩選.最后連接到sigmoid對(duì)影響教學(xué)質(zhì)量的因素進(jìn)行打分,得到影響因素的影響程度得分.提出的RALCA模型如圖1所示.

      圖1 RALCA模型

      如圖1給定n個(gè)影響因素,用pi來(lái)表示影響因素的影響程度,那么所有的影響因素表示為P:

      P={P1,P2,P3,…,Pn}

      (7)

      (8)

      公式(8)為影響因素的影響概率,即為影響因素的影響程度.結(jié)合本文2.1節(jié)隨機(jī)森林模型的人物畫(huà)像輸出和本文2.2節(jié)Attention-LSTM模型的教學(xué)信息和教師、學(xué)生之間的關(guān)系輸出,使用concatenate融合兩個(gè)輸出后,再經(jīng)過(guò)一個(gè)全連接層計(jì)算:

      z=W[ORF,OAttention-LSTM]+c

      (9)

      其中ORF為人物畫(huà)像的影響指數(shù),OAttention-LSTM為Attention-LSTM模型的關(guān)系預(yù)測(cè)結(jié)果,最終pi計(jì)算為:

      (10)

      下面詳細(xì)介紹RALCA模型的融合過(guò)程:

      1)人物畫(huà)像構(gòu)建

      教師的個(gè)人信息和學(xué)生的個(gè)人信息作為影響教學(xué)質(zhì)量的因素通過(guò)隨機(jī)森林中bagging的思想構(gòu)造特征信息之間的分類器,每一個(gè)bagging通過(guò)組合學(xué)習(xí)得到一個(gè)較為綜合的權(quán)重表示的向量.最后得到具有人物信息特征重要性組成的用戶畫(huà)像模型.

      用戶畫(huà)像特征數(shù)量為n,畫(huà)像信息特征的距離表示為:

      L(n)=∑d(k)=iprox2(n,k)

      (11)

      畫(huà)像特征構(gòu)造出多個(gè)決策樹(shù),多個(gè)決策樹(shù)通過(guò)平均相關(guān)系數(shù)來(lái)平衡畫(huà)像特征之間的決策樹(shù),計(jì)算公式如公式(12)所示:

      M(X,Y)=P(Y=Y)-maxP(Y=Z)

      (12)

      其中Y是根據(jù)隨機(jī)向量構(gòu)建的決策樹(shù)的預(yù)測(cè)類別,通過(guò)計(jì)算泛化誤差的關(guān)系,來(lái)平衡計(jì)算各個(gè)決策樹(shù)之間的關(guān)系.

      當(dāng)各個(gè)決策樹(shù)構(gòu)建平衡后,得出用戶畫(huà)像的隨機(jī)森林模型,其中每個(gè)用戶信息特征的影響程度計(jì)算過(guò)程為:

      通過(guò)Gini指數(shù)來(lái)代表特征對(duì)于決策樹(shù)中分類的純度:

      (13)

      其中,K表示有K個(gè)畫(huà)像類別,pnk表示節(jié)點(diǎn)n中類別k所占的比例.因此畫(huà)像特征在節(jié)點(diǎn)n中與相鄰的畫(huà)像特征重要性指數(shù)變化表示為:

      (14)

      因此這個(gè)畫(huà)像特征在第i棵決策樹(shù)的重要性為:

      (15)

      由此可得到在z個(gè)決策樹(shù)組成的隨機(jī)森林中畫(huà)像特征的重要性評(píng)分為:

      (16)

      2)信息關(guān)系表示

      其中教學(xué)信息數(shù)據(jù)模型的LSTM的過(guò)程類似于編碼和解碼,也就是encoder和decoder.此模型中encoder的過(guò)程及將學(xué)生、教師信息和教學(xué)信息轉(zhuǎn)化為一個(gè)類似關(guān)系中間件的東西,decoder的過(guò)程及根據(jù)關(guān)系中間件來(lái)輸出最有可能的信息組合.但是LSTM如果遇到輸入的特征維度非常長(zhǎng)的時(shí)候會(huì)在encoder和decoder的過(guò)程中產(chǎn)生的關(guān)系中間件的表達(dá)不是特別的好,注意力機(jī)制會(huì)較好解決此類問(wèn)題,注意力機(jī)制可以在encoder的過(guò)程中對(duì)每一個(gè)輸入賦予不同的權(quán)重,輸出一個(gè)不同關(guān)系比例的關(guān)系中間件組合,因此decoder的過(guò)程可以根據(jù)這個(gè)比例關(guān)系進(jìn)一步處理,從而達(dá)到較好的關(guān)系解釋效果.自注意力機(jī)制將會(huì)給每一個(gè)關(guān)系信息分配權(quán)重,得到影響因素的關(guān)系權(quán)重表示.

      3)信息融合

      如圖1所示,RALCA模型使用concatenate方法將RF模型構(gòu)造的人物畫(huà)像關(guān)系和Attention-LSTM模型構(gòu)造的人物信息和教學(xué)信息之間的關(guān)系信息融合起來(lái),輸入到全連接層進(jìn)行計(jì)算.

      4)影響程度計(jì)算

      為了輸出教師、學(xué)生信息和教學(xué)信息中影響因素的概率,在全連接層計(jì)算后通過(guò)sigmoid函數(shù)計(jì)算出每一個(gè)影響因素的概率表示,即為影響程度.

      3.3 教學(xué)質(zhì)量模型的分析步驟

      1)根據(jù)3.1中的分析從人事系統(tǒng)、研究生系統(tǒng)、教務(wù)系統(tǒng)中收集相應(yīng)的特征數(shù)據(jù).

      2)對(duì)收集到的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、數(shù)據(jù)預(yù)處理、數(shù)據(jù)特征化的處理.

      3)對(duì)采集到的教師信息特征、學(xué)生信息特征使用隨機(jī)森林的方法構(gòu)造模型,對(duì)教務(wù)系統(tǒng)采集到的教學(xué)信息特征使用基于注意力機(jī)制的雙向神經(jīng)網(wǎng)絡(luò)方法構(gòu)造模型.

      4)將兩部分模型的輸出通過(guò)concatenate方法進(jìn)行融合處理.然后拼接上全連接層對(duì)融合后的特征進(jìn)行提純和篩選,RALCA模型構(gòu)造完成.

      5)通過(guò)初始值、學(xué)習(xí)率、動(dòng)量因子、準(zhǔn)確率、召回率等因素確定融合模型的穩(wěn)定時(shí)刻.

      6)根據(jù)模型的構(gòu)造數(shù)據(jù),對(duì)模型進(jìn)行訓(xùn)練,直到訓(xùn)練到滿足預(yù)先設(shè)置的范圍為止.

      4 數(shù)據(jù)治理中教學(xué)質(zhì)量分析模型的實(shí)例分析

      4.1 實(shí)驗(yàn)分析平臺(tái)

      數(shù)據(jù)治理中教學(xué)質(zhì)量分析模型的構(gòu)建中有深度學(xué)習(xí)和多進(jìn)程訓(xùn)練的模型,因此對(duì)于實(shí)驗(yàn)分析平臺(tái)的性能要求較高,在進(jìn)行模型的訓(xùn)練、驗(yàn)證和實(shí)例分析中采用了如表3所示的1臺(tái)帶顯卡的深度學(xué)習(xí)機(jī)器和如表4所示高性能CPU配置機(jī)器.

      表3 顯卡深度學(xué)習(xí)機(jī)器配置信息

      表4 多進(jìn)程機(jī)器配置信息

      4.2 模型的分析性能評(píng)估對(duì)比

      融合模型的評(píng)估包括各個(gè)部分的模型評(píng)估以及最后的模型融合效果的評(píng)估,針對(duì)教師和學(xué)生數(shù)據(jù)、教學(xué)信息數(shù)據(jù)的模型構(gòu)造將分開(kāi)逐一進(jìn)行評(píng)估,最后的融合效果采取了對(duì)比的方式進(jìn)行最后的評(píng)估.

      4.2.1 人物畫(huà)像數(shù)據(jù)模型評(píng)估

      使用隨機(jī)森林模型原因在于模型的分類綜合穩(wěn)定性和樹(shù)類型模型可以形象的對(duì)特征有一個(gè)權(quán)重的表示,因此對(duì)于教師數(shù)據(jù)的模型主要衡量模型的準(zhǔn)確率、召回率和權(quán)重分布.真陽(yáng)性率和假陽(yáng)性率為衡量分類模型的重要指標(biāo),真陽(yáng)性率=真陽(yáng)性數(shù)量/金標(biāo)準(zhǔn)陽(yáng)性數(shù)量,假陽(yáng)性率=假陽(yáng)性數(shù)量/金標(biāo)準(zhǔn)陰性數(shù)量.ROC曲線是以真陽(yáng)性率為縱坐標(biāo),假陽(yáng)性率為橫坐標(biāo)繪制的曲線,因此ROC曲線可以綜合考量準(zhǔn)確率和召回率的平衡關(guān)系.AUC是ROC曲線下與坐標(biāo)軸圍成的面積,面積值不會(huì)大于1,此數(shù)值主要是ROC曲線面積的一個(gè)數(shù)值計(jì)算.實(shí)驗(yàn)數(shù)據(jù)計(jì)算得到隨機(jī)森林的AUC值可以達(dá)到0.93,因此認(rèn)為隨機(jī)森林模型在教師、學(xué)生數(shù)據(jù)的準(zhǔn)確率和召回率的平衡因素上表現(xiàn)符合預(yù)期.

      如圖2所示,隨機(jī)森林模型的訓(xùn)練后,模型對(duì)特征權(quán)的分布圖來(lái)看,有個(gè)別特征影響較強(qiáng),大多數(shù)特征影響程度均衡在0.2~0.2之間,可見(jiàn)模型對(duì)于權(quán)重的影響程度的擬合度較好,此模型的權(quán)重影響程度符合融合模型第1層的分布.

      圖2 特征影響程度分布散點(diǎn)圖

      如表5所示為畫(huà)像模型構(gòu)造完成后,按照影響程度從高到低排序的部分?jǐn)?shù)據(jù)信息,構(gòu)建用戶畫(huà)像模型用于表示教師對(duì)于教學(xué)的綜合能力評(píng)價(jià),畫(huà)像特征影響程度越高對(duì)于教師的教學(xué)綜合能力評(píng)價(jià)影響程度越高,表5展示的均為正向影響特征,與教學(xué)本身相關(guān)特征4個(gè),無(wú)關(guān)特征2個(gè),可得出學(xué)生綜合評(píng)價(jià)打分與科研成就值均會(huì)對(duì)教師畫(huà)像產(chǎn)生較高的正向影響的結(jié)論,由此可以證明教師在學(xué)生中的影響力和教師的科研能力會(huì)對(duì)教師畫(huà)像構(gòu)建產(chǎn)生正向的較高影響.

      表5 畫(huà)像特征影響程度部分?jǐn)?shù)據(jù)

      4.2.2 教學(xué)信息數(shù)據(jù)模型評(píng)估

      針對(duì)深度神經(jīng)網(wǎng)絡(luò)LSTM和Attention機(jī)制組合的模型,在錄入融合模型前最關(guān)心的是模型是否過(guò)擬合,學(xué)生數(shù)據(jù)比較雜亂繁多,深度學(xué)習(xí)類型的模型更是容易訓(xùn)練過(guò)程中有過(guò)擬合的現(xiàn)象,針對(duì)此問(wèn)題才需訓(xùn)練過(guò)程中使用驗(yàn)證集合交叉驗(yàn)證的方法,并且持續(xù)訓(xùn)練,查看模型的準(zhǔn)確率是否可以持續(xù)提升并且符合預(yù)期.如圖3所示為模型交叉驗(yàn)證訓(xùn)練波動(dòng)圖由,可以看出,不斷的交叉驗(yàn)證在模型的準(zhǔn)確率上確實(shí)有所影響,但是準(zhǔn)確率達(dá)到平穩(wěn)狀態(tài)下的時(shí)候,依舊可以維持在0.91的數(shù)據(jù)附近,符合錄入融合模型預(yù)期.

      圖3 模型交叉驗(yàn)證訓(xùn)練準(zhǔn)確率波動(dòng)圖

      4.2.3 教學(xué)質(zhì)量評(píng)估分析融合模型評(píng)估

      教學(xué)質(zhì)量評(píng)估模型的融合效果好壞決定了教學(xué)質(zhì)量評(píng)估分析的好壞,采用了數(shù)據(jù)治理中的上述教師和學(xué)生數(shù)據(jù)、教學(xué)數(shù)據(jù)兩類模型進(jìn)行融合得到綜合的教學(xué)質(zhì)量評(píng)估模型,選取了LR、SVM、Stacking、concatenate 4種融合技術(shù)作為最后模型融合的方法.通過(guò)實(shí)驗(yàn)對(duì)比分析4種融合后算法的ROC曲線如圖4所示,RALCA模型融合算法的ROC曲線在LR和SVM融合后的算法曲線之上,更接近于點(diǎn)(0,1),顯然采用concatenate方法的RALCA模型融合的AUC值也是最大,故RALCA模型融合的教學(xué)質(zhì)量評(píng)估模型的泛化性能更好.

      圖4 4種融合算法ROC曲線對(duì)比圖

      4種算法分別進(jìn)行了實(shí)驗(yàn),對(duì)4種算法融合的精確率、召回率、P-R調(diào)和均值和AUC值如表6所示.對(duì)4種融合算法的準(zhǔn)確率和召回率進(jìn)行分析:LR屬于回歸模型,準(zhǔn)確率較高,但是召回率表現(xiàn)較差,模型表現(xiàn)并不均衡;SVM作為線性分類,融合效果不佳,雖然召回率比較LR出色一些,但是準(zhǔn)確率太低,預(yù)測(cè)精準(zhǔn)度不高;Stacking融合效果優(yōu)于前兩種方法,但是Stacking融合在效率上較差;RALCA融合模型在召回率和準(zhǔn)確率上表現(xiàn)均不錯(cuò),這表明融合模型的預(yù)測(cè)準(zhǔn)確度保證的前提下也保證了模型預(yù)測(cè)正確的數(shù)量,并且F1值也很高,表明此融合技術(shù)比較傳統(tǒng)的線形和回歸形的融合方法優(yōu)勢(shì)較大.Concatenate方法作為最后的融合技術(shù),使得模型的AUC也達(dá)到了0.96的高數(shù)值,這說(shuō)明模型的綜合泛化性能也是最佳的.綜上,RALCA模型融合算法作為教學(xué)質(zhì)量評(píng)估模型可以有效的對(duì)教學(xué)質(zhì)量的影響因素進(jìn)行分析.

      表6 4種融合算法效果對(duì)比

      5 教學(xué)質(zhì)量評(píng)估的分析

      本實(shí)驗(yàn)采用的數(shù)據(jù)是某高校2019-2020年度的教學(xué)數(shù)據(jù)和相關(guān)的學(xué)生數(shù)據(jù)以及教師數(shù)據(jù),為了對(duì)個(gè)人信息進(jìn)行保護(hù),實(shí)驗(yàn)數(shù)據(jù)為真實(shí)數(shù)據(jù)脫敏后的數(shù)據(jù).對(duì)訓(xùn)練好的教學(xué)質(zhì)量評(píng)估模型中的原始特征影響因素進(jìn)行分析,對(duì)影響權(quán)重的分布進(jìn)行了統(tǒng)計(jì)如圖5所示.通過(guò)圖5可以看出大部分的特征影響程度很小,而影響程度0.15~0.25之間出現(xiàn)了二次波動(dòng)的峰頂,由此可見(jiàn)高頻的有效的特征應(yīng)處于這個(gè)之間,從特征數(shù)量在特征影響程度的分析曲線較為平滑,可見(jiàn)特征的影響程度比較均勻,曲線表現(xiàn)的光滑平穩(wěn),模型特征的影響程度分析也比較可靠,因此通過(guò)這個(gè)模型選取影響印象因素較高的特征進(jìn)行查看可以得出高校近期對(duì)教學(xué)質(zhì)量提升有力的因素.

      圖5 特征影響程度與數(shù)量分析圖

      本實(shí)驗(yàn)選取了影響程度較高的Top10個(gè)影響因素和影響程度繪制如圖6所示.可以發(fā)現(xiàn)大多數(shù)影響較高的特征還是來(lái)自于教學(xué)因素相關(guān),授課技巧、內(nèi)容合理程度、調(diào)課次數(shù)和課堂氛圍對(duì)教學(xué)質(zhì)量的影響較大,這也是在教學(xué)方面提升的比較快的一些方式和方法;同時(shí)教師的資質(zhì)水平也會(huì)對(duì)教學(xué)質(zhì)量有一定的影響,教師的專業(yè)和優(yōu)秀的專家稱號(hào)從側(cè)面也會(huì)給學(xué)生一定的優(yōu)質(zhì)教師影響,會(huì)激勵(lì)學(xué)生更努力的學(xué)習(xí);學(xué)生方面也是學(xué)生的學(xué)科影響較高,文科類型的學(xué)生在教學(xué)質(zhì)量提升上有一定的困難,學(xué)生的入學(xué)成績(jī)也影響較高,可見(jiàn)好的學(xué)習(xí)基礎(chǔ)對(duì)于教學(xué)質(zhì)量的影響也比較突出.

      圖6 Top10影響因素與影響程度圖

      6 結(jié) 論

      影響高校教學(xué)質(zhì)量的因素有很多,如何快速的提升教學(xué)質(zhì)量是當(dāng)前的研究熱點(diǎn).通過(guò)數(shù)據(jù)挖掘算法對(duì)影響高校教學(xué)質(zhì)量的因素進(jìn)行快速的定位和科學(xué)的評(píng)估,可以為學(xué)校更好的分析影響教學(xué)質(zhì)量的影響因素.學(xué)??梢愿鶕?jù)教學(xué)質(zhì)量模型對(duì)影響因素的分析快速定位教學(xué)質(zhì)量的問(wèn)題所在,依據(jù)問(wèn)題有針對(duì)性的制定政策方針制定方針,可以快速提升教學(xué)質(zhì)量.通過(guò)數(shù)據(jù)治理對(duì)學(xué)校數(shù)據(jù)聚合處理的優(yōu)勢(shì),采集到更多方位對(duì)影響教學(xué)質(zhì)量的因素?cái)?shù)據(jù),使用concatenate方法將隨機(jī)森林和注意力機(jī)制的雙向長(zhǎng)段記憶神經(jīng)網(wǎng)絡(luò)進(jìn)行融合,對(duì)模型得到的特征影響度進(jìn)行分析,可以得到對(duì)教學(xué)質(zhì)量影響因素的快速分析,具有十分廣泛的應(yīng)用價(jià)值.

      本次教學(xué)質(zhì)量評(píng)估分析中錄入的信息均為個(gè)人信息、關(guān)系信息等固定信息,高校數(shù)據(jù)治理還可以采集一些人物行為信息,比如課堂學(xué)生行為信息和課堂教師行為信息,解析為可以分析教學(xué)質(zhì)量的結(jié)構(gòu)化信息后錄入模型將對(duì)模型的數(shù)據(jù)特征多樣性進(jìn)行豐富,也可以對(duì)更多的人物行為信息進(jìn)行解釋,指導(dǎo)教師日后的教課行為也可以規(guī)范學(xué)生的聽(tīng)課習(xí)慣.

      猜你喜歡
      教學(xué)信息教學(xué)質(zhì)量特征
      努力改善辦學(xué)條件 不斷提高教學(xué)質(zhì)量
      關(guān)注學(xué)習(xí)過(guò)程 提升教學(xué)質(zhì)量
      甘肅教育(2020年18期)2020-10-28 09:06:20
      提高教學(xué)質(zhì)量,重在科學(xué)管理
      如何表達(dá)“特征”
      不忠誠(chéng)的四個(gè)特征
      抓住特征巧觀察
      數(shù)據(jù)結(jié)構(gòu)課堂上教學(xué)信息反饋機(jī)制研究
      提高語(yǔ)文教學(xué)質(zhì)量的幾點(diǎn)思考
      人間(2015年10期)2016-01-09 13:12:52
      高職數(shù)維專業(yè)教學(xué)信息平臺(tái)建設(shè)研究與實(shí)踐
      線性代數(shù)的應(yīng)用特征
      河南科技(2014年23期)2014-02-27 14:19:15
      株洲市| 扬州市| 建湖县| 秦安县| 盐源县| 湖口县| 霸州市| 横峰县| 平乐县| 修武县| 旅游| 襄城县| 宝应县| 旅游| 昌江| 隆尧县| 抚远县| 揭阳市| 大理市| 天柱县| 柞水县| 安宁市| 山阴县| 株洲市| 绥德县| 荔浦县| 手机| 木兰县| 陇南市| 金乡县| 乌兰县| 江油市| 西宁市| 大埔县| 长兴县| 虎林市| 湘潭市| 宣武区| 吉安市| 宿松县| 武城县|