葉根梅 吳志霞
摘要:針對(duì)目前大多高校網(wǎng)絡(luò)教學(xué)平臺(tái)教學(xué)資源呈現(xiàn)單一、不能根據(jù)學(xué)習(xí)者的學(xué)習(xí)軌跡進(jìn)行內(nèi)容推薦的弊端,研究關(guān)聯(lián)規(guī)則和Apriori算法,以及Apriori算法在網(wǎng)絡(luò)教學(xué)平臺(tái)中的應(yīng)用。運(yùn)用關(guān)聯(lián)規(guī)則挖掘獲取學(xué)習(xí)內(nèi)容相關(guān)的頁(yè)面集合,從而一定程度地優(yōu)化網(wǎng)站結(jié)構(gòu),并對(duì)學(xué)習(xí)者進(jìn)行個(gè)性化內(nèi)容推薦服務(wù),提高學(xué)習(xí)者的網(wǎng)絡(luò)平臺(tái)學(xué)習(xí)體驗(yàn)。
關(guān)鍵詞:關(guān)聯(lián)規(guī)則 Apriori 網(wǎng)絡(luò)教學(xué)
中圖分類號(hào): TP434? ? ?文獻(xiàn)標(biāo)識(shí)碼:A? ? ? 文章編號(hào):1009-3044(2019)01-0017-02
1 背景
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,各大高校陸續(xù)構(gòu)建自己的網(wǎng)絡(luò)教學(xué)平臺(tái),以實(shí)現(xiàn)學(xué)習(xí)資源數(shù)字化、教學(xué)方式網(wǎng)絡(luò)化、學(xué)習(xí)方式多元化的網(wǎng)絡(luò)教學(xué)方式。但是,目前高校的網(wǎng)絡(luò)教學(xué)平臺(tái)普遍存在網(wǎng)絡(luò)資源呈現(xiàn)單一化特征,網(wǎng)站不能根據(jù)學(xué)習(xí)者的學(xué)習(xí)行為提供個(gè)性化的內(nèi)容推薦服務(wù)。因此,在教學(xué)平臺(tái)中,加入基于關(guān)聯(lián)規(guī)則的個(gè)性化內(nèi)容推薦對(duì)提升學(xué)生的學(xué)習(xí)體驗(yàn)和效果很有意義。
2 關(guān)聯(lián)規(guī)則挖掘
關(guān)聯(lián)規(guī)則挖掘最早用來(lái)發(fā)現(xiàn)超市交易數(shù)據(jù)中商品之間的關(guān)聯(lián)[1],近幾年在網(wǎng)站和移動(dòng)應(yīng)用的個(gè)性化推薦系統(tǒng)中,如電子商務(wù)、新聞網(wǎng)站、社交等領(lǐng)域被廣泛應(yīng)用。通過(guò)關(guān)聯(lián)規(guī)則挖掘可以發(fā)現(xiàn)事務(wù)之間的聯(lián)系,提升信息篩選的效率,對(duì)于決策者和用戶來(lái)說(shuō),具有現(xiàn)實(shí)的意義,因此,關(guān)聯(lián)規(guī)則挖掘也作為數(shù)據(jù)挖掘一個(gè)重要的課題和方法被廣泛研究和應(yīng)用。
3 關(guān)聯(lián)規(guī)則在高校網(wǎng)絡(luò)教學(xué)平臺(tái)中的應(yīng)用
3.1 網(wǎng)絡(luò)教學(xué)平臺(tái)的關(guān)聯(lián)規(guī)則挖掘功能模型
網(wǎng)絡(luò)教學(xué)平臺(tái)中要實(shí)現(xiàn)學(xué)習(xí)者因人而異、按需學(xué)習(xí)的內(nèi)容自動(dòng)推薦功能,運(yùn)用關(guān)聯(lián)規(guī)則,可建立如下功能模型,如圖1所示。
參照《WEB挖掘技術(shù)在網(wǎng)絡(luò)教學(xué)中的應(yīng)用研究》和精品課程論文。
在該模型中,服務(wù)器端記錄用戶訪問(wèn)信息并存儲(chǔ)用戶日志數(shù)據(jù),包括用戶在教學(xué)平臺(tái)中的訪問(wèn)內(nèi)容和行為,如頁(yè)面瀏覽內(nèi)容和時(shí)間、訪問(wèn)路徑、超鏈接的點(diǎn)擊行為等。對(duì)這些數(shù)據(jù)進(jìn)行收集、預(yù)處理和規(guī)范化,構(gòu)成事務(wù)集,再運(yùn)用關(guān)聯(lián)規(guī)則挖掘技術(shù),挖掘出有價(jià)值的網(wǎng)頁(yè)集合,從而明確學(xué)習(xí)者的學(xué)習(xí)興趣和需求,根據(jù)關(guān)聯(lián)規(guī)則結(jié)果進(jìn)行個(gè)性化內(nèi)容推薦,方便學(xué)習(xí)者快速發(fā)現(xiàn)自己需要的學(xué)習(xí)內(nèi)容[2]。
3.2 關(guān)聯(lián)規(guī)則挖掘算法--Apriori算法
Apriori算法是關(guān)聯(lián)規(guī)則最成熟的算法,因其數(shù)據(jù)要求低、推導(dǎo)相對(duì)簡(jiǎn)單,使其得到廣泛應(yīng)用。
設(shè)I={i1,i2,…,im},是m個(gè)不同的項(xiàng)目的集合, 長(zhǎng)度為m的項(xiàng)集I稱為m-項(xiàng)集,T={T1,T2,…Tn}是與任務(wù)相關(guān)的事務(wù)的集合,每個(gè)事務(wù)Ti都是項(xiàng)集I的一個(gè)子集。假定X,Y均為項(xiàng)集,均是T的非空子集,且X和Y的交集不為空,則表示X和Y是相關(guān)聯(lián)的項(xiàng)集,項(xiàng)集X在某一事務(wù)中出現(xiàn),會(huì)導(dǎo)致Y以某一概率也會(huì)出現(xiàn)[3]。將蘊(yùn)含表達(dá)式X=>Y稱作T中的關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則的強(qiáng)弱通過(guò)指標(biāo)支持度和置信度來(lái)衡量。事務(wù)集T中項(xiàng)目集X出現(xiàn)的次數(shù)count(X)與事務(wù)集T中事務(wù)總數(shù)|T|的百分比,稱作項(xiàng)目集X的支持度support(X),可通過(guò)以下計(jì)算公式獲得:
support(X)=[count(X)|T|]*100%
相應(yīng)地,關(guān)聯(lián)規(guī)則X=>Y的支持度support(X=>Y)的計(jì)算公式如下:
support(X=>Y)=[count(X?Y)|T|]*100%
事務(wù)集T中X、Y同時(shí)出現(xiàn)的次數(shù)與事務(wù)集T中項(xiàng)目集X出現(xiàn)的次數(shù)的百分比,稱作關(guān)聯(lián)規(guī)則X=>Y的置信度confidence(X=>Y),可通過(guò)以下計(jì)算公式獲得:
confidence(X=>Y)= [supportX?Y supportX]*100%
最小支持度minsup和最小置信度minconf是用戶設(shè)定的衡量支持度和置信度的一個(gè)閾值,如果關(guān)聯(lián)規(guī)則X=>Y的支持度support(X=>Y)和置信度confidence(X=>Y)大于等于用戶定義的最小支持度minsup和最小置信度minconf,則稱X=>Y為強(qiáng)關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則挖掘的目的就是找出強(qiáng)關(guān)聯(lián)規(guī)則。同時(shí),對(duì)于項(xiàng)目集X,如果support(X)>= minsup,則X為頻繁項(xiàng)集。
3.3 運(yùn)用Apriori算法挖掘關(guān)聯(lián)規(guī)則
運(yùn)用Apriori算法實(shí)施數(shù)據(jù)挖掘主要分為兩步:
首先,找出事務(wù)數(shù)據(jù)庫(kù)中所有大于等于指定的最小支持度的頻繁項(xiàng)集,然后根據(jù)指定的最小置信度找出需要的關(guān)聯(lián)規(guī)則。
針對(duì)高校網(wǎng)絡(luò)教學(xué)課程,學(xué)生訪問(wèn)網(wǎng)站不同頁(yè)面時(shí),其訪問(wèn)信息都將在網(wǎng)頁(yè)路徑中體現(xiàn)出來(lái)。 如用戶訪問(wèn)http://localhost:8080/course/s20.php,然后又訪問(wèn)http://localhost:8080/course/s23.php,并在這些頁(yè)面及其子頁(yè)面停留了一定的時(shí)間,表示用戶學(xué)習(xí)了頁(yè)面分別為s20.php和s23.php的兩門課程及其對(duì)應(yīng)的知識(shí)點(diǎn)資源。將用戶在網(wǎng)站訪問(wèn)期間的頁(yè)面路徑暫存在用戶會(huì)話文件中,當(dāng)用戶離開(kāi)網(wǎng)站時(shí),將該信息作為用戶學(xué)習(xí)日志記錄表中的一條記錄保存起來(lái)。然后,對(duì)事務(wù)數(shù)據(jù)庫(kù)進(jìn)行預(yù)處理,運(yùn)用Apriori算法挖掘?qū)W生學(xué)習(xí)網(wǎng)絡(luò)課程的訪問(wèn)日志,找出學(xué)生頻繁訪問(wèn)的知識(shí)點(diǎn)頁(yè)面所在的網(wǎng)頁(yè)路徑,基于學(xué)生頻繁訪問(wèn)的網(wǎng)頁(yè)路徑,找出頻繁項(xiàng)集,進(jìn)而進(jìn)行個(gè)性化內(nèi)容推薦[4]。
按照上述步驟,這里,抽取5個(gè)學(xué)生對(duì)網(wǎng)絡(luò)教學(xué)平臺(tái)課程訪問(wèn)信息,表1記錄了其訪問(wèn)網(wǎng)站的網(wǎng)頁(yè)路徑。
假設(shè)最小支持度minsup為3,最小置信度minconf為70%。Fk表示頻繁k-項(xiàng)集的集合,Ck表示產(chǎn)生FK項(xiàng)集的候選項(xiàng)集,算法的處理步驟如下:
對(duì)置信度進(jìn)行計(jì)算:
confidence(s3=>s4)=4/5=80%
confidence(s3=>s5=4/5=80%
confidence(s4=>s5)=3/4=75%
由此可見(jiàn),{s3 s4 s5}是學(xué)習(xí)者訪問(wèn)頻率較高的一種網(wǎng)頁(yè)組合,因此可以通過(guò)建立超鏈接的方式對(duì)這些頁(yè)面進(jìn)行關(guān)聯(lián),或者將該關(guān)聯(lián)規(guī)則存儲(chǔ)到關(guān)聯(lián)規(guī)則表中,提供學(xué)習(xí)者的訪問(wèn)效率,實(shí)現(xiàn)網(wǎng)絡(luò)教學(xué)平臺(tái)的個(gè)性化推薦功能。
4 結(jié)束語(yǔ)
在高校網(wǎng)絡(luò)教學(xué)平臺(tái)中引入關(guān)聯(lián)規(guī)則,優(yōu)化網(wǎng)站課程結(jié)構(gòu),實(shí)現(xiàn)一定程度的教學(xué)內(nèi)容的個(gè)性化推薦,提升學(xué)習(xí)者的學(xué)習(xí)體驗(yàn),對(duì)高校網(wǎng)絡(luò)教學(xué)平臺(tái)的建設(shè)具有非?,F(xiàn)實(shí)的意義。
參考文獻(xiàn):
[1] 王濤偉, 楊愛(ài)民. 加權(quán)關(guān)聯(lián)規(guī)則研究及其在個(gè)性化推薦系統(tǒng)中的應(yīng)用[J]. 鄭州大學(xué)學(xué)報(bào): 理學(xué)版, 2007(2): 65-69.
[2] 梁燕紅. WEB挖掘技術(shù)在網(wǎng)絡(luò)教學(xué)中的應(yīng)用研究[J]. 信息技術(shù)與信息化, 2017(9): 128.
[3] 盧小華, 劉靜. Apriori算法在網(wǎng)絡(luò)教學(xué)平臺(tái)自動(dòng)推薦學(xué)習(xí)資源功能中的應(yīng)用[J]. 現(xiàn)代工業(yè)經(jīng)濟(jì)和信息化,2016(15): 101-102.
[4] 于華. 網(wǎng)站結(jié)構(gòu)優(yōu)化方案的設(shè)計(jì)與實(shí)現(xiàn)[J]. 現(xiàn)代計(jì)算機(jī), 2017(20): 82-84.