楊楨 從傳鋒
摘 要: 針對傳統(tǒng)網(wǎng)絡(luò)教育方向選取方法在向用戶推薦網(wǎng)絡(luò)教育方向中存在選取方法不準(zhǔn)確,用戶滿意度低的問題,提出基于大數(shù)據(jù)的網(wǎng)絡(luò)教育方向選取方法。采用基于本體樹的個性化網(wǎng)絡(luò)教育方向推薦算法構(gòu)建學(xué)生特征行為概念本體樹和網(wǎng)絡(luò)教育資源特征概念本體樹,對不同網(wǎng)絡(luò)教育資源本體樹的關(guān)聯(lián)度進(jìn)行計算。給出算法流程模型圖,該算法實現(xiàn)過程中將網(wǎng)絡(luò)教育資源的特征概念與數(shù)據(jù)庫中的網(wǎng)絡(luò)教育資源進(jìn)行相似度匹配,實現(xiàn)學(xué)生用戶對網(wǎng)絡(luò)教育資源的個性化選擇,將學(xué)生用戶偏好相似度運用到網(wǎng)絡(luò)教育方向選取過程中,有利于實現(xiàn)網(wǎng)絡(luò)教育方向的個性化選取。實驗結(jié)果說明,所提方法可為用戶選取正確的網(wǎng)絡(luò)教育方向,具有較高的準(zhǔn)確率和召回率,用戶滿意度高。
關(guān)鍵詞: 大數(shù)據(jù); 網(wǎng)絡(luò)教育; 方向選??; 特征概念; 本體樹; 相似度
中圖分類號: TN911?34; TP391 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2018)15?0087?05
Research on network education direction selection method based on big data
YANG Zhen, CONG Chuanfeng
(Foreign Trade and Business College of Chongqing Normal University, Chongqing 401520, China)
Abstract: The traditional network education direction selection method is inaccurate to recommend the network education direction for users, and has low user satisfaction. Therefore, a network education direction selection method based on big data is put forward. The personalized network education direction recommendation algorithm based on ontology tree is adopted in the method to construct the ontology trees of students behavior concept and network education resources characteristic concept, and calculate the correlation degree of different network education resource ontology trees. The diagram of algorithm flow model is given. The similarity matching is performed for the characteristic concept of network education resources and network education resources in database in the process of algorithm implementation to realize the personalized selection of student user for network education resources. The preference similarity of student user applied to the selection process of the network education direction is conducive to the realization of personalized selection of the network education direction. The experimental results show that the proposed method can select the correct network education direction for users, and has high accuracy and recall rate, and high user satisfaction.
Keywords: big data; network education; direction selection; feature concept; ontology tree; similarity
隨著科學(xué)技術(shù)的發(fā)展,互聯(lián)網(wǎng)和教育也在逐漸互相融合,網(wǎng)絡(luò)教育已成為社會進(jìn)步的發(fā)展趨勢。將大數(shù)據(jù)技術(shù)運用到網(wǎng)絡(luò)教育中能逐步完善教育體系改革[1],革新傳統(tǒng)教育在教學(xué)中存在時間及空間局限的問題,運用大數(shù)據(jù)技術(shù)處理海量的教學(xué)資源,對相關(guān)資源進(jìn)行整合可提高網(wǎng)絡(luò)教育資源的利用效率。傳統(tǒng)平均值的網(wǎng)絡(luò)教育方向選取方法存在選取結(jié)果用戶滿意度低、選取方法不當(dāng)?shù)膯栴},本文提出基于大數(shù)據(jù)的網(wǎng)絡(luò)教育方向選取方法,實現(xiàn)用戶對網(wǎng)絡(luò)教育方向的精確選取。
本文基于大數(shù)據(jù)的網(wǎng)絡(luò)教育方向選取方法,采用基于本體樹的個性化網(wǎng)絡(luò)教育方向推薦算法,實現(xiàn)網(wǎng)絡(luò)教育方向的準(zhǔn)確選取。本文方法利用本體樹對學(xué)生用戶和網(wǎng)絡(luò)教育資源采取本體描述,得到學(xué)生行為概念和網(wǎng)絡(luò)教育資源特征概念本體樹,將數(shù)據(jù)挖掘算法運用其中,將用戶需要的內(nèi)容推送給用戶,實現(xiàn)網(wǎng)絡(luò)教育方向的個性化推薦。分別對學(xué)生用戶和網(wǎng)絡(luò)教育資源進(jìn)行本體樹構(gòu)建,可以得到用戶對網(wǎng)絡(luò)教育資源的選擇結(jié)果,再根據(jù)學(xué)生用戶對網(wǎng)絡(luò)教育資源的需求將與其相類似的網(wǎng)絡(luò)教育資源推薦給學(xué)生用戶。同樣的網(wǎng)絡(luò)教育資源特征概念本體樹也會尋找網(wǎng)絡(luò)資源間的聯(lián)系[2],方便學(xué)生對網(wǎng)絡(luò)教育方向進(jìn)行選擇。
在大數(shù)據(jù)環(huán)境下,學(xué)生用戶在對網(wǎng)絡(luò)教育資源A進(jìn)行搜索時,學(xué)生特征行為概念本體樹會將與網(wǎng)絡(luò)教育資源A相關(guān)的教學(xué)資源推薦給學(xué)生用戶,根據(jù)學(xué)生用戶的學(xué)習(xí)方式和學(xué)習(xí)時間推送適當(dāng)?shù)木W(wǎng)絡(luò)教育資源。本文采用OWL本體構(gòu)建方法構(gòu)建學(xué)生特征行為概念本體樹對學(xué)生學(xué)習(xí)的特征進(jìn)行描述[3],并對學(xué)生行為本體樹的相似度進(jìn)行計算。圖1為學(xué)生特征行為概念本體樹。
網(wǎng)絡(luò)教育資源可以采用網(wǎng)絡(luò)教育資源特征概念本體樹描述,網(wǎng)絡(luò)教育資源特征對應(yīng)概念本體樹相應(yīng)的特征概念節(jié)點[4]。本文采用OWL本體樹構(gòu)建方法對網(wǎng)絡(luò)教育資源本體樹進(jìn)行構(gòu)建,將每一種網(wǎng)絡(luò)教育資源都描述成網(wǎng)絡(luò)資源教育本體樹,對不同網(wǎng)絡(luò)教育資源本體樹的關(guān)聯(lián)度進(jìn)行計算。圖2為網(wǎng)絡(luò)教育資源特征概念本體樹。
學(xué)生用戶對網(wǎng)絡(luò)教學(xué)資源A進(jìn)行搜索時,可以采用網(wǎng)絡(luò)教育資源特征概念本體樹將網(wǎng)絡(luò)教育資源的特征概念與數(shù)據(jù)庫中的網(wǎng)絡(luò)教育資源進(jìn)行相似度匹配[5],將匹配結(jié)果從大到小進(jìn)行排列構(gòu)成網(wǎng)絡(luò)教育資源列表,用于學(xué)生用戶選取適合自己的網(wǎng)絡(luò)教育方向,根據(jù)自己學(xué)習(xí)行為尋找適合的網(wǎng)絡(luò)教育資源類型,最后將網(wǎng)絡(luò)教育資源列表和適合學(xué)生的網(wǎng)絡(luò)教育資源方向推薦給用戶,實現(xiàn)學(xué)生用戶對網(wǎng)絡(luò)教育資源的個性化選擇[6]。圖3為算法流程模型圖。
1) 計算特征概念節(jié)點相似度
[S=S1,S2,…,Sn]表示所有特征概念節(jié)點集合,特征概念節(jié)點個數(shù)為[n],特征概念節(jié)點[Si]和[Sj]之間的相似度用[L(Si,Sj)]表示,本文對特征概念節(jié)點相似度的計算公式如下:
[L(Si,Sj)=Distance(Si,Sj)+α?α?d(Si)+d(Sj)CE(Si,Sj)×2?Dep?maxd(Si)-d(Sj)] (1)
式中:[Distance(Si,Sj)]為特征概念節(jié)點[Si]和[Sj]間的最短距離和;特征概念節(jié)點[Si]和[Sj]在本體樹中的位置用[d(Si)+d(Sj)]表示;最短路徑的條數(shù)用[CE(Si,Sj)]表示;[α]為常數(shù),可取任意值。
利用式(1)能夠得到本體樹特征概念節(jié)點的相似度。學(xué)生用戶對網(wǎng)絡(luò)教育資源的需求和網(wǎng)絡(luò)教育資源方向都在不斷地更新和完善,取任意的用戶需求和網(wǎng)絡(luò)教育資源對其進(jìn)行相似度計算,[Ri=a1,a2,…,an]和[Rj=b1,b2,…,bn]為任意網(wǎng)絡(luò)資源特征集合,則[Ri]和[Rj]的相似度計算過程為:
[Sim(Ri,Rj)=αL(a1,b1)+βL(a2,b2)+…+γL(an,bn)] (2)
式中的[L(a1,b1)]通過式(1)計算得出,[α]和[β]均為與特征概念節(jié)點相對應(yīng)的相似度計算權(quán)重。
2) 算法描述
輸入:待搜索網(wǎng)絡(luò)教學(xué)資源A
輸出:個性化的網(wǎng)絡(luò)教育方向
步驟1:學(xué)生用戶對需要搜索的網(wǎng)絡(luò)學(xué)習(xí)資源A進(jìn)行分析,并對學(xué)生用戶特征節(jié)點概念本體樹實施構(gòu)建,建立學(xué)生特征行為概念本體樹。
步驟2:將搜索的網(wǎng)絡(luò)教育資源A的特征概念節(jié)點與網(wǎng)絡(luò)教育資源數(shù)據(jù)庫實施相似度匹配。
步驟3:將相似度輸出結(jié)果進(jìn)行相似度大小排列,并根據(jù)學(xué)生用戶的學(xué)習(xí)習(xí)慣,輸出學(xué)生用戶對網(wǎng)絡(luò)教育資源可接受的難易度。
步驟4:對學(xué)生用戶可接受的網(wǎng)絡(luò)教育資源進(jìn)行篩選,確定最終輸出結(jié)果。
步驟5:將確定的網(wǎng)絡(luò)教育方向推薦給學(xué)生用戶,并根據(jù)學(xué)生用戶的滿意度結(jié)果對網(wǎng)絡(luò)教育方向的推薦結(jié)果進(jìn)行修改。
將學(xué)生用戶的偏好相似度用于基于大數(shù)據(jù)的網(wǎng)絡(luò)教育選取過程中,有利于實現(xiàn)網(wǎng)絡(luò)教育方向的個性化推薦。將每位學(xué)生用戶的偏好矩陣EQ視為[n]維向量,通過計算[n]維向量中余弦夾角的方法,得到學(xué)生用戶對本文基于大數(shù)據(jù)的網(wǎng)絡(luò)教育方向選取方法的偏好相似度[7]。學(xué)生用戶[ui]和[uj]的偏好向量分別為[ui=(eqi1,eqi2,…,eqin)]和[uj=(eqj1,eqj2,…,eqjn)],對學(xué)生用戶的偏好相似度計算公式為:
[rsij=cos(ui,uj)ui×ujui×uj=k=1neqikeqjkk=1neq2ikk=1neq2jk] (3)
利用式(3)計算學(xué)生用戶對網(wǎng)絡(luò)教育方向選取的偏好相似度 [8],得到學(xué)生用戶偏好相似度系數(shù)RS,是對角線為1的對稱矩陣。
[RS=1rs12…rs1nrs211…rs2n????rsk1rsk2…1] (4)
假設(shè)每個網(wǎng)絡(luò)教育方向都有幾個學(xué)生用戶對其進(jìn)行評價反饋[9],將第[d]個學(xué)生用戶對第[i]個網(wǎng)絡(luò)教育方向的第[j]個網(wǎng)絡(luò)教育資源的評價記作[Qdij],已知學(xué)生用戶的偏好相似度為[EQt(eqt1,eqt2,…,eqti)],采用式(3)計算當(dāng)前學(xué)生用戶的偏好相似度與[k]個學(xué)生用戶的偏好相似度[RSt(rst1,rst2,…,rsti)],記作:
[SUM1=i=1neqti, SUM2=i=1krsti] (5)
第[i]個網(wǎng)絡(luò)教育方向的偏好相似度的總和為:
[Qti=d=1krskdSUM2j=1neqtjSUM1Qdij] (6)
先按照學(xué)生用戶的偏好相似度計算公式對網(wǎng)絡(luò)教育方向進(jìn)行偏好相似度求值,得到學(xué)生用戶偏好相似度系數(shù)RS,相似度高的評價結(jié)果具有較高的參考價值。通過式(6)可以得出所有網(wǎng)絡(luò)教育方向的偏好相似度的總和[10],記作[Ft=(Qt1,Qt2,…,Qtm)],該結(jié)果反映了學(xué)生用戶對網(wǎng)絡(luò)教育方向偏愛的個性化數(shù)值,針對學(xué)生用戶的網(wǎng)絡(luò)教育方向推薦列表,向其進(jìn)行專屬的個性化網(wǎng)絡(luò)教育方向推薦。
實驗為了檢測不同用戶對網(wǎng)絡(luò)教育方向選取方法推薦的網(wǎng)絡(luò)教育資源的主觀感受,通過用戶滿意度調(diào)查問卷評估不同方法的用戶滿意度情況。調(diào)查問卷中包括四種情況:
情況1:推薦的網(wǎng)絡(luò)教育資源都非常符合我的興趣,是我想找的;
情況2:推薦的網(wǎng)絡(luò)教育資源大部分滿足我的興趣;
情況3:推薦的教育資源很多不滿足我的興趣;
情況4:不知道為什么會推薦這些資源給我,我不感興趣。
實驗隨機選擇某大學(xué)的100名學(xué)生,發(fā)放100份調(diào)查問卷,回收100份調(diào)查問卷,統(tǒng)計學(xué)生對本文方法以及傳統(tǒng)平均值網(wǎng)絡(luò)教育方向選取方法推薦的各項情況的勾選次數(shù),結(jié)果用圖4描述。
分析圖4可得,用戶對本文方法的情況1和情況2的勾選次數(shù)更多,說明本文方法推薦給用戶的網(wǎng)絡(luò)教育資源更滿足用戶的興趣度;用戶對傳統(tǒng)平均值選取方法的情況3和情況4的勾選次數(shù)更多,說明傳統(tǒng)平均值選取方法推薦給用戶的網(wǎng)絡(luò)教育資源無法滿足用戶的興趣度。相對于傳統(tǒng)平均值選取方法,本文方法推薦結(jié)果具有更好的效果。
實驗通過準(zhǔn)確率檢測本文基于大數(shù)據(jù)網(wǎng)絡(luò)教育方向選取方法的預(yù)測用戶行為的查準(zhǔn)率,通過離線實驗得到方法的準(zhǔn)確率,同時實施定量運算。將為用戶選取的網(wǎng)絡(luò)教育資源基于用戶是否感興趣以及方法是否為該用戶實施準(zhǔn)確選取進(jìn)行分析,能夠劃分成圖5描述的4種狀態(tài)。
圖5中范圍[R1]是用戶感興趣同時方法為其推薦的,[R2]是用戶不感興趣但方法為其推薦的,[R3]是用戶感興趣但方法沒有選取的,[R4]是用戶不感興趣但方法沒有選取的。準(zhǔn)確率是選取列表中用戶感興趣的教育資源占據(jù)為其選取的教育資源的比例,也就是圖5的上端,網(wǎng)絡(luò)教育資源選取的準(zhǔn)確率為:
[Precision=R1R1+R2] (7)
召回率是評估選取方法預(yù)測用戶行為的查全率,其用于描述方法為用戶推薦出的網(wǎng)絡(luò)教育資源占數(shù)據(jù)庫內(nèi)全部用戶可能感興趣教育資源的比重,是圖5中的左半部分,網(wǎng)絡(luò)教育方向選取方法選取結(jié)果的召回率為:
[Recall=R1R1+R3] (8)
實驗采用的數(shù)據(jù)集來自于某大學(xué)英語、化學(xué)、物理、數(shù)學(xué)和計算機的網(wǎng)絡(luò)教育資源庫,面向每種網(wǎng)絡(luò)資源隨機選擇50位用戶,分別采用準(zhǔn)確率運算公式以及召回率運算公式,運算本文方法以及傳統(tǒng)平均值選取方法下50位用戶在不同類型教育資源下的平均準(zhǔn)確率和平均召回率,結(jié)果分別用表1,表2描述。
對比分析表1和表2能夠看出,本文方法對不同類型教育資源選取的準(zhǔn)確率以及召回率都高于傳統(tǒng)平均值選取方法,說明本文方法能夠向用戶推薦出高質(zhì)量的網(wǎng)絡(luò)教育資源,提高網(wǎng)絡(luò)教育方向選取的準(zhǔn)確度和穩(wěn)定度。
用戶的滿意度是評估網(wǎng)絡(luò)教育方向選取方法是否滿足用戶需求的關(guān)鍵參數(shù)。實驗分別采用本文方法和傳統(tǒng)平均值選取方法為用戶實施網(wǎng)絡(luò)教育方向選取服務(wù),基于用戶對選取結(jié)果滿意度的評估,從兩個方面實施分析: 各網(wǎng)絡(luò)教育方向選取服務(wù)用戶對請求過的4門網(wǎng)絡(luò)教育課程的教育服務(wù)滿意度平均值如圖6a)所示;每門課程教育服務(wù)的全部用戶滿意度平均值如圖6b)所示。
對比分析圖6a)和圖6b)可得,無論是用戶請求過的全部網(wǎng)絡(luò)教育方向選取服務(wù)的滿意度均值,還是每門課程網(wǎng)絡(luò)教育服務(wù)的滿意度均值,采用本文方法的用戶滿意度都高于平均值選取方法。
本文提出基于大數(shù)據(jù)的網(wǎng)絡(luò)教育方向選取方法。實驗結(jié)果表明,相比傳統(tǒng)的平均值選取方法,本文方法提高了用戶對選取結(jié)果的滿意度,增強了網(wǎng)絡(luò)教育資源的應(yīng)用價值。
參考文獻(xiàn)
[1] 彭飛霞.MOOC時代遠(yuǎn)程教育品牌營銷與擴散:兼論教育大數(shù)據(jù)的調(diào)節(jié)作用[J].成人教育,2016,36(3):41?46.
PENG Feixia. Brand marketing and diffusion of distance education in the MOOC era: on the adjusting function of macro educational data adult [J]. Education, 2016, 36(3): 41?46.
[2] 鄧?yán)颦?,肖秋根,李中寧,?基于大數(shù)據(jù)分析的計算機網(wǎng)絡(luò)課程自適應(yīng)學(xué)習(xí)系統(tǒng)構(gòu)建[J].計算機工程與科學(xué),2016,38(z1):276?280.
DENG Liqiong, XIAO Qiugen, LI Zhongning, et al. Construction of an adaptive learning system of computer network course based on big data analysis [J]. Computer engineering and science, 2016, 38(S1): 276?280.
[3] 趙夢龍,唐鄭熠,萬良,等.大數(shù)據(jù)分析中基于MapReduce的空間權(quán)重創(chuàng)建方法研究[J].計算機應(yīng)用研究,2016,33(7):2068?2070.
ZHAO Menglong, TANG Zhengyi, WAN Liang, et al. Research on construction method of spatial weights based on MapReduce in analysis of big data [J]. Application research of computers, 2016, 33(7): 2068?2070.
[4] 黃麗霞,蔣永福,傅榮賢.基于新建構(gòu)主義的高校信息素質(zhì)教育模式研究[J].圖書情報工作,2014,58(7):35?39.
HUANG Lixia, JIANG Yongfu, FU Rongxian. Research on college information literacy education model based on new constructivism learning theory [J]. Library and information service, 2014, 58(7): 35?39.
[5] 張長海.基于批判性思維和創(chuàng)造力的我國大學(xué)生信息素養(yǎng)教育模式研究[J].中國圖書館學(xué)報,2016,42(4):102?116.
ZHANG Changhai. An information literacy education model of undergraduates in China based on critical thinking and creativity [J]. Journal of library science in China, 2016, 42(4): 102?116.
[6] 李青,任一姝.教師數(shù)據(jù)素養(yǎng)能力模型及發(fā)展策略研究[J].開放教育研究,2016,22(6):65?73.
LI Qing, REN Yishu. Research on teacher data literacy competency model and development strategy in smart education [J]. Education research, 2016, 22(6): 65?73.
[7] 陳琦,鄧娜.青少年本土優(yōu)秀傳統(tǒng)文化教育模式探究:以紹興市為例[J].圖書館論壇,2014,34(4):49?53.
CHEN Qi, DENG Na. Exploration on the educational pattern of local fine traditional culture for teenagers: taking Shaoxing City as an example [J]. Library tribune, 2014, 34(4): 49?53.
[8] 唐濤.基于大數(shù)據(jù)的網(wǎng)絡(luò)輿情分析方法研究[J].現(xiàn)代情報,2014,34(3):3?6.
TANG Tao. Research on method of Internet public opinion analysis based on big data [J]. Modern information, 2014, 34(3): 3?6.
[9] 艾小平,董澤芳.“四元多維”教師教育模式的理論建構(gòu)與運行策略[J].教育科學(xué),2014,30(1):43?49.
AI Xiaoping, DONG Zefang. The theory construction and the operation strategy on "quaternary subjects and multi?dimensional" model of teachers′ education [J]. Education science, 2014, 30(1): 43?49.
[10] 馮登國,張敏,李昊.大數(shù)據(jù)安全與隱私保護(hù)[J].計算機學(xué)報,2014,37(1):246?258.
FENG Dengguo, ZHANG Min, LI Hao. Big data security and privacy protection [J]. Chinese journal of computers, 2014, 37(1): 246?258.