程允麗 賈瀟宇
摘要:本文圍繞大數(shù)據(jù)環(huán)境下個(gè)性化教育資源推薦系統(tǒng)的構(gòu)建及關(guān)鍵技術(shù)研究展開(kāi),設(shè)計(jì)一個(gè)可以處理PB級(jí)教育資源的個(gè)性化推薦系統(tǒng)架構(gòu),并基于此架構(gòu)實(shí)現(xiàn)一個(gè)教育資源個(gè)性化推薦系統(tǒng)。主要設(shè)計(jì)一種基于內(nèi)容與基于協(xié)同過(guò)濾相結(jié)合的混合推薦算法,在滿(mǎn)足推薦新穎性要求的同時(shí)也解決了推薦系統(tǒng)的冷啟動(dòng)問(wèn)題。研究一個(gè)彈性的、可靠的、高性能的可以存儲(chǔ)、處理PB級(jí)數(shù)據(jù)并可進(jìn)行實(shí)時(shí)推薦的個(gè)性化推薦系統(tǒng)架構(gòu),研究個(gè)性化推薦引擎,數(shù)據(jù)預(yù)處理及數(shù)據(jù)挖掘模型構(gòu)建,對(duì)實(shí)現(xiàn)的推薦系統(tǒng)進(jìn)行相關(guān)功能及性能驗(yàn)證,確定系統(tǒng)的可用性有重要的意義。
關(guān)鍵詞:大數(shù)據(jù)、教育資源、推薦系統(tǒng)、技術(shù)研究
1. 研究的主要內(nèi)容框架
項(xiàng)目研究的主要內(nèi)容是設(shè)計(jì)一個(gè)可以處理PB級(jí)教育資源的個(gè)性化推薦系統(tǒng)架構(gòu),并基于此架構(gòu)實(shí)現(xiàn)一個(gè)教育資源個(gè)性化推薦系統(tǒng)。個(gè)性化推薦系統(tǒng)建設(shè)時(shí)整體邏輯結(jié)構(gòu)內(nèi)部建設(shè)兩個(gè)子系統(tǒng)同時(shí)與外部另外兩個(gè)系統(tǒng)協(xié)作,即內(nèi)部的分類(lèi)樹(shù)子系統(tǒng)、個(gè)性化推薦Web子系統(tǒng)及外部的資源共享平臺(tái)、統(tǒng)一登錄系統(tǒng)相互協(xié)作實(shí)現(xiàn)系統(tǒng)功能。系統(tǒng)功能設(shè)計(jì)及應(yīng)用總體架構(gòu)如圖1所示:
MapReduce是一個(gè)分布式計(jì)算框架,最早由Google公司提出,因可以在上千臺(tái)廉價(jià)服務(wù)器組成的分布式集群中處理海量數(shù)據(jù)而被熟知,廣泛應(yīng)用于大數(shù)據(jù)處理。本項(xiàng)目采用的是HadoopMapReduce,是一個(gè)廣泛使用的開(kāi)源MapReduce實(shí)現(xiàn),其MapReduce詳細(xì)執(zhí)行過(guò)程如圖2所示。
3. 研究重點(diǎn)難點(diǎn)
(1)構(gòu)建基于三維矩陣的數(shù)學(xué)模型。建立基于三維矩陣的數(shù)學(xué)模型。將得到的數(shù)據(jù)的每個(gè)屬性定義為空間中的一個(gè)維度,從而構(gòu)成一個(gè)N維空間。
(2)基于協(xié)同進(jìn)化思想的關(guān)聯(lián)規(guī)則分析方法。采用改進(jìn)的遺傳算法和粒子群算法對(duì)兩個(gè)種群同時(shí)進(jìn)行迭代,彌補(bǔ)遺傳算法早熟收斂和后期收斂速度慢的缺陷,有效地搜索出高質(zhì)量的關(guān)聯(lián)規(guī)則。
4. 研究技術(shù)路線(xiàn)
課題圍繞大數(shù)據(jù)環(huán)境下個(gè)性化教育資源推薦系統(tǒng)的構(gòu)建及關(guān)鍵技術(shù)研究展開(kāi),在對(duì)現(xiàn)有研究成果進(jìn)行梳理分析的前提下,立足于實(shí)踐發(fā)展需要,采用以下幾種研究方法,從多角度對(duì)個(gè)性化教育資源推薦系統(tǒng)的構(gòu)建的應(yīng)用,結(jié)合數(shù)據(jù)預(yù)處理技術(shù)、個(gè)性引擎推薦、數(shù)據(jù)挖掘技術(shù)等問(wèn)題及對(duì)策展開(kāi)探討。
(1)三維矩陣數(shù)學(xué)模型
將所有矩形按照一定規(guī)則組合形成一個(gè)包含所有信息的三維矩陣即我們建立的數(shù)學(xué)模型。三維矩陣數(shù)學(xué)模型如下圖3所示。
本課題圍繞大數(shù)據(jù)環(huán)境下個(gè)性化教育資源推薦系統(tǒng)的構(gòu)建及關(guān)鍵技術(shù)研究展開(kāi),在對(duì)現(xiàn)有研究成果進(jìn)行梳理分析的前提下,立足于實(shí)踐發(fā)展需要,從多角度對(duì)個(gè)性化教育資源推薦系統(tǒng)的構(gòu)建的應(yīng)用,結(jié)合數(shù)據(jù)預(yù)處理技術(shù)、個(gè)性引擎推薦、數(shù)據(jù)挖掘技術(shù)等問(wèn)題及對(duì)策展開(kāi)探討。設(shè)計(jì)了一個(gè)可以處理PB級(jí)教育資源的個(gè)性化推薦系統(tǒng)架構(gòu),以面向大數(shù)據(jù)的可拓?cái)?shù)據(jù)挖掘技術(shù)作為研究對(duì)象,旨在為大數(shù)據(jù)時(shí)代下的數(shù)據(jù)分析技術(shù)、數(shù)據(jù)提取技術(shù)以及可拓?cái)?shù)據(jù)挖掘技術(shù)打下理論基礎(chǔ),并最終建設(shè)一個(gè)基于可拓?cái)?shù)據(jù)挖掘技術(shù)的教育資源個(gè)性推薦系統(tǒng)。
參考文獻(xiàn)
[1]基于大數(shù)據(jù)的個(gè)性化自適應(yīng)在線(xiàn)學(xué)習(xí)分析模型及實(shí)現(xiàn)[J]. 姜強(qiáng),趙蔚,王朋嬌,王麗萍. ?中國(guó)電化教育. 2018(01)
[2]獲取教育大數(shù)據(jù):基于xAPI規(guī)范對(duì)學(xué)習(xí)經(jīng)歷數(shù)據(jù)的獲取與共享[J]. 顧小清,鄭隆威,簡(jiǎn)菁. ?現(xiàn)代遠(yuǎn)程教育研究. 2017(05)
[3]一種基于Kademlia的全分布式爬蟲(chóng)集群方法[J]. 黃志敏,曾學(xué)文,陳君. ?計(jì)算機(jī)科學(xué). 2018(03)
[4]大數(shù)據(jù)與智慧教育[J]. 柯清超. ?中國(guó)教育信息化. 2018(24)
[5]面向大數(shù)據(jù)的開(kāi)源推薦系統(tǒng)分析[J]. 米可菲,張勇,邢春曉,蔚欣. ?計(jì)算機(jī)與數(shù)字工程. 2018(10)
基金項(xiàng)目
(1)2019年1月,主持廣東省特色創(chuàng)新項(xiàng)目(人文社科)--《新工科背景下創(chuàng)新人才培養(yǎng)模式研究》(2018GWTSCX054),已順利開(kāi)展;
(2)2019年5月,主持《新工科背景下高職院校大數(shù)據(jù)專(zhuān)業(yè)建設(shè)與創(chuàng)新人才培養(yǎng)模式研究(GDYJSKT19-13)》廣東省高等教育學(xué)會(huì)高職高專(zhuān)云計(jì)算與大數(shù)據(jù)專(zhuān)業(yè)委員會(huì)項(xiàng)目,已順利開(kāi)展;