胡健 王理江
摘要:在當(dāng)代大學(xué)教育中,學(xué)生選課系統(tǒng)中存在的缺乏個(gè)性化課程推薦、選課效率較低的問題,本文針對(duì)這個(gè)問題結(jié)合數(shù)據(jù)挖掘技術(shù)對(duì)選課建立了選課推薦系統(tǒng)模型,使得學(xué)生在選課中有更多的參考,在一定程度上減少了學(xué)生選課的盲目性。
關(guān)鍵詞:選課;數(shù)據(jù)挖掘;推薦系統(tǒng)
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.3969/j.issn.1003-6970.2016.04.028
0 引言
隨著教育改革的推進(jìn)選課制度已在高校普及多年,為了滿足學(xué)生的個(gè)性化需求,根據(jù)上課時(shí)間、學(xué)習(xí)興趣、任課老師以及學(xué)習(xí)進(jìn)程等各方面的需求選擇適合自己的課程,課程的自選使得學(xué)生的自由空間更大且學(xué)習(xí)效率明顯提升。選課制度作為高校教學(xué)管理制度改革內(nèi)容的一部分同時(shí)也是學(xué)分制的重要內(nèi)容,選課制度的設(shè)計(jì)及實(shí)施過程都需結(jié)合大學(xué)生教育理念。改革開放的到來更是為教育吹來了春風(fēng),教育體制也突破了傳統(tǒng)模式,開始實(shí)行選課制和學(xué)分制。然而多數(shù)高校在選課制度實(shí)施過程中普遍存在課程結(jié)構(gòu)設(shè)置不合理、選課方式不完善、選課指導(dǎo)體系不健全等問題。學(xué)生不能結(jié)合自身的專業(yè)和興趣進(jìn)行選課,選課缺乏目的性和針對(duì)性;選課制度不利于學(xué)生的個(gè)性發(fā)展,也不能為學(xué)生以后的工作帶來良好的指導(dǎo),從而出現(xiàn)了專業(yè)與職位不對(duì)口的現(xiàn)象。有鑒于此,本文將數(shù)據(jù)挖掘中的個(gè)性化推薦技術(shù)應(yīng)用于選課系統(tǒng)中,根據(jù)學(xué)生自身的狀況、學(xué)習(xí)需求以及興趣偏好等,為學(xué)生提供個(gè)性化課程推薦平臺(tái),從而避免學(xué)生選課的盲目性和跟風(fēng)現(xiàn)象,提高了課程資源的利用率和選課質(zhì)量。
1 我國(guó)高校選課制度的現(xiàn)狀
隨著選課制在高校的普及,教育也逐漸走向網(wǎng)絡(luò)化和信息化,在這樣一個(gè)計(jì)算機(jī)網(wǎng)絡(luò)普及的時(shí)代自然選課過程也趨于網(wǎng)絡(luò)化。受到傳統(tǒng)觀念及學(xué)年制的影響,選課制度在運(yùn)行過程中還存在一定的缺陷,另外在新教學(xué)觀念的實(shí)施和高素質(zhì)人才的培養(yǎng)中選課制也沒有體現(xiàn)其優(yōu)勢(shì),具體原因有下幾個(gè)方面:
1.1 目前實(shí)施的選課制不利于學(xué)生的個(gè)性發(fā)展
隨著社會(huì)對(duì)人才專業(yè)需求的多樣化,傳統(tǒng)的人才培養(yǎng)模式已無法滿足社會(huì)發(fā)展需求,同時(shí)也抑制了學(xué)生的個(gè)性化發(fā)展。選課制的實(shí)行使得學(xué)生可根據(jù)自身的興趣愛好選擇合適的課程、任課教師以及學(xué)習(xí)時(shí)間,各種自由的選擇使得的個(gè)性特征得到滿足,從而提高了學(xué)生的學(xué)習(xí)積極性。
1.2 沒有實(shí)現(xiàn)真正的選課
盡管有部分學(xué)校允許學(xué)生選擇跨專業(yè)、跨年級(jí)的課程,但在教師資源、上課時(shí)間以及場(chǎng)地資源等影響下,學(xué)生仍無法選擇自己喜歡的課程,時(shí)間及資源上的沖突使得學(xué)生在自主選課上受到了一定的限制,對(duì)于比較熱門的課程,當(dāng)選課人數(shù)較多資源有限時(shí),課程就會(huì)被刪除,自主選課無法充分發(fā)揮其作用。隨著高校不斷擴(kuò)招,教師資源越來越匱乏,學(xué)生的選擇范圍有限。
1.3 選課工作實(shí)施不到位
選課指導(dǎo)也是一個(gè)很重要的環(huán)節(jié),特別是新生由于對(duì)課程了解不深,因此很容易出現(xiàn)盲目選課現(xiàn)象。部分學(xué)生了為了選擇簡(jiǎn)單易學(xué)的知識(shí)而不顧自身發(fā)展,隨意性的選課對(duì)教學(xué)質(zhì)量造成了很大的影響,同時(shí)也脫離了選課制實(shí)行的初衷。針對(duì)這個(gè)問題本文提出了利用數(shù)據(jù)挖掘技術(shù)篩選歷史選課數(shù)據(jù)中隱藏的、有用的知識(shí),作為指導(dǎo)學(xué)生選課的依據(jù),該課題的提出對(duì)高校教學(xué)管理改革有著重要的現(xiàn)實(shí)意義。
2 數(shù)據(jù)挖掘與個(gè)性化推薦系統(tǒng)
數(shù)據(jù)挖掘是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識(shí)的過程。它是一門交叉學(xué)科,集成了許多學(xué)科中成熟的工具和技術(shù),包括統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫(kù)技術(shù)、機(jī)器學(xué)習(xí)、模型識(shí)別、人工智能等。數(shù)據(jù)挖掘技術(shù)已經(jīng)有了很好的應(yīng)用,例如銷售、銀行、電信、保險(xiǎn)、交通等領(lǐng)域。數(shù)據(jù)挖掘所能解決的典型商業(yè)問題包括:數(shù)據(jù)庫(kù)營(yíng)銷、客戶群體劃分、背景分析、交叉銷售等市場(chǎng)分析行為,以及客戶流失性分析、客戶信用記分、欺詐發(fā)現(xiàn)等。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于教育中,也是這些技術(shù)發(fā)展的必然。個(gè)性化推薦是數(shù)據(jù)挖掘中一項(xiàng)非常有用的技術(shù),它是20世紀(jì)90年代被作為一個(gè)獨(dú)立的概念提出來,近些年有了迅速的發(fā)展,得益于Web2.0技術(shù)的成熟。有了這個(gè)技術(shù),用戶不再是被動(dòng)的獲取信息,而是成為獲取信息這個(gè)過程中的主動(dòng)參與者。它在商業(yè)領(lǐng)域大獲成功,在一個(gè)實(shí)際的推薦系統(tǒng)中需要推薦的產(chǎn)品可能會(huì)有上萬種,甚至更多,例如Amazon,eBay,YouTube等,用戶的數(shù)目也會(huì)非常巨大。準(zhǔn)確、高效的推薦系統(tǒng)可以挖掘用戶潛在的消費(fèi)傾向,為眾多的用戶提供個(gè)性化服務(wù)。協(xié)同過濾系統(tǒng)是目前應(yīng)用最為廣泛,也是效果最好的個(gè)性化推薦系統(tǒng)。協(xié)同過濾(Colaborative Filtering)這個(gè)概念由Goldberg等在1992年提出,并應(yīng)用于Tapestry系統(tǒng)。目前主要有兩類協(xié)同過濾推薦算法:基于用戶的協(xié)同過濾推薦算法和基于項(xiàng)目的協(xié)同過濾推薦算法。
3 學(xué)生個(gè)性化選課推薦系統(tǒng)的研究
本文采用的是基于用戶的協(xié)同過濾算法,在高校選課系統(tǒng)中融入該算法可幫助學(xué)生根據(jù)自身的興趣愛好選擇與自身發(fā)展最為貼近的課程、學(xué)習(xí)量及任課教師,個(gè)性化選課推薦系統(tǒng)的運(yùn)用使得高校選課機(jī)制更為完善。在推薦系統(tǒng)內(nèi)建立評(píng)價(jià)矩陣,對(duì)學(xué)生在選課過程中的主要因素進(jìn)行描述,如興趣愛好、專業(yè)、學(xué)習(xí)程度、選課記錄和老師評(píng)價(jià)等,算法根據(jù)學(xué)生這些信息對(duì)其行為進(jìn)行分析,并建立相應(yīng)的學(xué)生項(xiàng),通過與評(píng)價(jià)矩陣中的項(xiàng)進(jìn)行對(duì)比找出相似度最高的選課記錄,并向該學(xué)生進(jìn)行課程推薦。由此可見,個(gè)性化高校選課推薦系統(tǒng)模型主要分為評(píng)價(jià)矩陣、搜索最近鄰居和課程推薦三個(gè)部分。
3.1 建立評(píng)價(jià)矩陣
根據(jù)專業(yè)、愛好、選課記錄、學(xué)習(xí)程度等信息收集歷史選課數(shù)據(jù),若直接從教務(wù)系統(tǒng)中選取,則需對(duì)數(shù)據(jù)進(jìn)行清洗和轉(zhuǎn)化,從而形成協(xié)同過濾算法學(xué)生選課評(píng)價(jià)矩陣。
在上述矩陣中Rij的中的i代表的是學(xué)生,j代表的是項(xiàng)目,R代表的是評(píng)價(jià)。Rij的取值范圍通常在[0,5]這個(gè)區(qū)間范圍內(nèi),分值的大小與評(píng)價(jià)的高低成正比。
3.2 搜索最近鄰居
將目標(biāo)學(xué)生與評(píng)價(jià)舉證中所有學(xué)生的相似度進(jìn)行對(duì)比,找出相似度最高的一組并建立相應(yīng)的最近鄰居集合,在基于用戶的寫通過率算法中這步是很難關(guān)鍵的,相似度的具體算法如下所示:
在上述公式中sim(Um,Ui),代表目標(biāo)學(xué)生與矩陣學(xué)生的相似度,y代表兩者共同評(píng)價(jià)過的項(xiàng)目,Ra,y,和Ri,y表示a學(xué)生和i學(xué)生對(duì)y項(xiàng)目的評(píng)價(jià),Ra和Ri表示項(xiàng)目評(píng)價(jià)平均值。
3.3 產(chǎn)生推薦
根據(jù)評(píng)價(jià)結(jié)果和推薦算法產(chǎn)生推薦,具體推薦算法如下所示:
sim(a,n)表示相似度,Rn,i表示項(xiàng)目評(píng)分Ra和Rn表示項(xiàng)目評(píng)價(jià)平均值。該算法主要是針對(duì)用戶評(píng)價(jià)項(xiàng)目較多的情況,對(duì)于個(gè)別評(píng)價(jià),結(jié)果可能就沒那么準(zhǔn)確。
4 結(jié)束語
本文基于協(xié)同過濾算法的個(gè)性化高校選課推薦系統(tǒng)是根據(jù)學(xué)生的興趣愛好、學(xué)習(xí)程度和專業(yè)等信息進(jìn)行相似度計(jì)算,然后再根據(jù)相似度的高低推薦相應(yīng)的課程。但是該算法存在“冷啟動(dòng)”問題,即在沒有學(xué)生的歷史數(shù)據(jù)作為參考和分析的基礎(chǔ)下是無法實(shí)現(xiàn)選課推薦的。高校個(gè)性化選課推薦系統(tǒng)的使用可有效提高學(xué)生的學(xué)習(xí)興趣以及學(xué)校的教學(xué)質(zhì)量,幫助學(xué)生科學(xué)合理的選擇合適的課程,為學(xué)生的個(gè)性化發(fā)展提供有效的學(xué)習(xí)方式。