葉茂華
摘 要:高校一般采用綜合評(píng)定的手段對(duì)教學(xué)質(zhì)量進(jìn)行評(píng)估,評(píng)估結(jié)果不僅有助于教師及時(shí)發(fā)現(xiàn)問題,也能夠?qū)虒W(xué)管理者進(jìn)行管理決策。本文提出了一種改進(jìn)型的關(guān)聯(lián)規(guī)則算法并用于高校教學(xué)評(píng)價(jià)系統(tǒng)中,該算法的運(yùn)用對(duì)高校教學(xué)質(zhì)量的提高與發(fā)展有著重要的積極意義。
關(guān)鍵詞:高校;改進(jìn)型關(guān)聯(lián)規(guī)則;教學(xué)評(píng)價(jià)
DOI:10.16640/j.cnki.37-1222/t.2017.23.242
1 引言
高校一般采用定量評(píng)價(jià)的方法來實(shí)現(xiàn)對(duì)教學(xué)情況的客觀評(píng)價(jià),通過各方面的量化打分來反映教師的實(shí)際教學(xué)情況。目前高校對(duì)評(píng)價(jià)數(shù)據(jù)的發(fā)掘利用仍停留在數(shù)據(jù)表面,僅通過分值的高低采取相應(yīng)的獎(jiǎng)懲措施,對(duì)數(shù)據(jù)背后的潛在規(guī)律缺乏深入的認(rèn)識(shí)和挖掘,導(dǎo)致大數(shù)據(jù)的價(jià)值得不到有效利用,因此利用關(guān)聯(lián)規(guī)則算法對(duì)評(píng)價(jià)結(jié)果進(jìn)行數(shù)據(jù)挖掘,對(duì)高校的管理與決策有著現(xiàn)實(shí)意義。
2 關(guān)聯(lián)規(guī)則算法介紹
關(guān)聯(lián)規(guī)則主要用于發(fā)現(xiàn)事務(wù)各屬性間的潛在聯(lián)系性,為事務(wù)的相關(guān)決策提供有力支持。在高校教學(xué)評(píng)價(jià)系統(tǒng)中,利用關(guān)聯(lián)規(guī)則對(duì)大量的評(píng)價(jià)數(shù)據(jù)進(jìn)行挖掘,能夠發(fā)現(xiàn)諸多潛在的有用價(jià)值。例如在教師隊(duì)伍中具有博士學(xué)位的教師,教學(xué)質(zhì)量為優(yōu)秀的比例最高,因此可以推斷教學(xué)質(zhì)量與教師學(xué)歷有著重要的關(guān)系,高校可以鼓勵(lì)教師進(jìn)修學(xué)習(xí),提高個(gè)人學(xué)歷,進(jìn)而提升高校的教學(xué)水平。
(1)事務(wù)與項(xiàng)。事務(wù)是指描述的對(duì)象,項(xiàng)是指事務(wù)可能具有的屬性,一般采用數(shù)據(jù)集的形式描述事務(wù)與項(xiàng)的關(guān)聯(lián)關(guān)系。如表 1所示,數(shù)據(jù)集的每一行表示一組記錄,對(duì)應(yīng)一個(gè)事務(wù)的描述,每一列表示一種事務(wù)可能存在的屬性,整張數(shù)據(jù)表稱為數(shù)據(jù)庫(kù)的全體事務(wù)集。某一行某一列數(shù)據(jù)為“1”則表示該行所指事務(wù)具備該列所指屬性,數(shù)據(jù)為“0”則表示該事務(wù)不具備該屬性。
(2)數(shù)據(jù)項(xiàng)集。在關(guān)聯(lián)規(guī)則中數(shù)據(jù)項(xiàng)的集合也被稱為數(shù)據(jù)項(xiàng)集,如果某項(xiàng)集共包含k個(gè)項(xiàng),則稱為k-項(xiàng)集,當(dāng)k為0時(shí)為空項(xiàng)集,在項(xiàng)集中任意一個(gè)項(xiàng)都是該數(shù)據(jù)項(xiàng)集的一個(gè)子集。
(3)數(shù)據(jù)項(xiàng)集的支持度。在全體事務(wù)集中某項(xiàng)集X出現(xiàn)的次數(shù)稱為全體數(shù)據(jù)項(xiàng)集對(duì)項(xiàng)集X的支持?jǐn)?shù),進(jìn)一步利用概率值表示該支持?jǐn)?shù),即支持?jǐn)?shù)比上全體事務(wù)集的總項(xiàng)數(shù)即為數(shù)據(jù)項(xiàng)集對(duì)項(xiàng)集X的支持度。
(4)關(guān)聯(lián)規(guī)則。對(duì)于全體事務(wù)數(shù)據(jù)集中不相交的兩項(xiàng)集X與Y,通過表達(dá)式X?Y來表示項(xiàng)集間的關(guān)聯(lián)規(guī)則,并利用規(guī)則支持度(Sup ( X Y) )與規(guī)則可信度(Conf (X Y) )兩個(gè)指標(biāo)來表示項(xiàng)集X與項(xiàng)集Y關(guān)聯(lián)規(guī)則的強(qiáng)度。
3 改進(jìn)型關(guān)聯(lián)規(guī)則挖掘算法介紹
改進(jìn)型關(guān)聯(lián)規(guī)則挖掘方法首先利用關(guān)聯(lián)規(guī)則對(duì)全體事務(wù)數(shù)據(jù)集進(jìn)行預(yù)處理,剔除非頻繁項(xiàng)集的候選子集以減少數(shù)據(jù)處理量;其次對(duì)數(shù)據(jù)庫(kù)進(jìn)行全面的掃描處理,運(yùn)用哈希函數(shù)、分組表等方式對(duì)全體事務(wù)集中的事務(wù)樹進(jìn)行剪枝處理,極大減少了數(shù)據(jù)庫(kù)的掃描時(shí)間,提高了全體事務(wù)集中頻繁項(xiàng)集的提取速度,使得算法的效率得到顯著提高。算法的具體實(shí)施流程如下所述:
(1)產(chǎn)生頻繁2-項(xiàng)集。利用哈希函數(shù)對(duì)全體事務(wù)數(shù)據(jù)庫(kù)進(jìn)行掃描處理,生成頻繁2-項(xiàng)集。
(2)修剪數(shù)據(jù)庫(kù)。通過生成的頻繁2-項(xiàng)集,對(duì)全體事務(wù)數(shù)據(jù)庫(kù)進(jìn)行修剪,剔除非頻繁2-項(xiàng)集的其他無交集項(xiàng)目,減少了待處理的數(shù)據(jù)量,節(jié)約了數(shù)據(jù)的存儲(chǔ)空間。
(3)數(shù)據(jù)分組記錄。根據(jù)數(shù)據(jù)與頻繁2-項(xiàng)集的關(guān)聯(lián)關(guān)系將修剪得到的數(shù)據(jù)分別存入相應(yīng)的分組數(shù)據(jù)表中以待進(jìn)一步處理。
(4)產(chǎn)生候選項(xiàng)目集。從頻繁2-項(xiàng)集開始搜索,通過相鄰層頻繁項(xiàng)集的結(jié)合建立頻繁項(xiàng)樹,并通過剪枝操作對(duì)關(guān)系樹進(jìn)行修剪,最終得到全部候選項(xiàng)目集。
(5)產(chǎn)生頻繁項(xiàng)目集。對(duì)候選項(xiàng)目集的支持度進(jìn)行計(jì)算,若某項(xiàng)集中分組表的支持度均大于等于某一閾值,則該候選項(xiàng)集為頻繁項(xiàng)目集。
4 改進(jìn)型關(guān)聯(lián)規(guī)則挖掘算法在高校教學(xué)評(píng)價(jià)中的具體應(yīng)用
根據(jù)改進(jìn)型關(guān)聯(lián)規(guī)則挖掘算法的具體設(shè)計(jì)要求,并對(duì)現(xiàn)有的教學(xué)評(píng)價(jià)數(shù)據(jù)及各教學(xué)主體的實(shí)際需求進(jìn)行分析,整個(gè)數(shù)據(jù)挖掘分析子模塊工作流程圖如圖1所示。從圖中可以看出,改進(jìn)型關(guān)聯(lián)規(guī)則算法主要通過以下三個(gè)步驟。
第一步數(shù)據(jù)預(yù)處理階段,通過對(duì)收集的教學(xué)評(píng)價(jià)數(shù)據(jù)表進(jìn)行預(yù)處理,將冗余的字段信息進(jìn)行刪除,得到教學(xué)評(píng)價(jià)因素信息表。對(duì)于部分學(xué)生的非正常評(píng)價(jià),可設(shè)置條件進(jìn)行刪除,以避免對(duì)后續(xù)評(píng)價(jià)結(jié)果的影響。
第二步采用關(guān)聯(lián)規(guī)則算法對(duì)頻繁項(xiàng)集進(jìn)行確認(rèn),由于在數(shù)據(jù)表中有些數(shù)據(jù)會(huì)影響到挖掘的結(jié)果,因此需要通過該算法對(duì)影響到挖掘質(zhì)量的相關(guān)信息進(jìn)行處理。例如:對(duì)熟悉教材、內(nèi)容豐富、信息量大等同類評(píng)價(jià)信息可進(jìn)行歸類,設(shè)置最小支持度,將重復(fù)評(píng)價(jià)記錄進(jìn)行刪除,最后再通過該算法對(duì)評(píng)價(jià)信息表中的數(shù)據(jù)進(jìn)行不斷讀取和比較,從而找到所需的頻繁項(xiàng)集,提高了挖掘精度。
第三步推導(dǎo)關(guān)聯(lián)規(guī)則,通過設(shè)置的最小置信度和頻繁項(xiàng)集進(jìn)行關(guān)聯(lián),對(duì)滿足所需條件的關(guān)聯(lián)規(guī)則進(jìn)行推導(dǎo)和確認(rèn)。
5 小結(jié)
挖掘教學(xué)評(píng)價(jià)數(shù)據(jù)中的潛藏信息,對(duì)提高教師的教學(xué)能力、指導(dǎo)高校進(jìn)行教學(xué)改革以及提升辦學(xué)實(shí)力都有著重要的作用。本文主要對(duì)關(guān)聯(lián)規(guī)則算法所存在的弊端,提出了一種改進(jìn)型的關(guān)聯(lián)規(guī)則算法,通過該算法能夠較好的解決高校教學(xué)評(píng)價(jià)的提取與分析效率,具有一定的應(yīng)用價(jià)值。
參考文獻(xiàn):
[1]陳正權(quán).關(guān)聯(lián)規(guī)則挖掘算法及其在職校教學(xué)評(píng)價(jià)系統(tǒng)中的應(yīng)用研究[D].蘇州大學(xué),2015:21-23.
[2]王偉.關(guān)聯(lián)規(guī)則中的Apriori算法的研究與改進(jìn)[D].中國(guó)海洋大學(xué),2016:10-12.
[3]張麗梅.提升高校教師教學(xué)質(zhì)量評(píng)價(jià)工作的探討[J].內(nèi)蒙古財(cái)經(jīng)學(xué)院學(xué)報(bào)(綜合版),2015:
12-15.endprint