吳俊爽 韓琴琴 劉誠(chéng)偉
【摘 要】 本論文針對(duì)海量移動(dòng)學(xué)習(xí)資源元數(shù)據(jù)的分散,難以檢索的難題,提出基于自組織特征映射網(wǎng)絡(luò) ()SOM的移動(dòng)學(xué)習(xí)資源元數(shù)據(jù)聚類萃取算法,該算法將傳統(tǒng)的數(shù)據(jù)庫(kù)元數(shù)據(jù)進(jìn)行合理的量化處理,形成表征移動(dòng)學(xué)習(xí)元數(shù)據(jù)的四元組(資源編號(hào),科目等級(jí),學(xué)科等級(jí),資源相似度),并且根據(jù)用戶需求,通過(guò)調(diào)整權(quán)值四元組后三個(gè)個(gè)關(guān)鍵字所占比例,實(shí)現(xiàn)擴(kuò)大或者縮小范圍。最終利用 Matlab以高中物理的移動(dòng)學(xué)習(xí)元數(shù)據(jù)為例實(shí)現(xiàn)該算法的仿真,進(jìn)行多賦值聚類,其聚類萃取資源的準(zhǔn)確度較高,能夠滿足一般用戶對(duì)該移動(dòng)學(xué)習(xí)資源的需求。
【關(guān)鍵詞】移動(dòng)學(xué)習(xí) 元數(shù)據(jù)萃取 神經(jīng)網(wǎng)絡(luò) 自組織特征映射網(wǎng)絡(luò) ()SOM
【中圖分類號(hào)】 O453【文獻(xiàn)標(biāo)識(shí)碼】 A【文章編號(hào)】1672-5158(2013)07-0024-02
1 研究背景介紹
移動(dòng)學(xué)習(xí)是指依托目前比較成熟的無(wú)線移動(dòng)網(wǎng)絡(luò)、因特網(wǎng)以及多媒體技術(shù),學(xué)生和教師通過(guò)利用目前較為普遍使用的無(wú)線設(shè)備(如手機(jī)、PDA、筆記本電腦等)來(lái)更為方便靈活地實(shí)現(xiàn)交互式碎片式教學(xué)活動(dòng),以及教育、科技方面的信息交流。 [1]隨著移動(dòng)互聯(lián)網(wǎng)設(shè)施基礎(chǔ)逐步完善和移動(dòng)互聯(lián)網(wǎng)產(chǎn)品的層出不窮,移動(dòng)學(xué)習(xí)的優(yōu)點(diǎn)越來(lái)越被人們關(guān)注。目前國(guó)內(nèi)很多家高校和公司都加入了移動(dòng)學(xué)習(xí)的研究,并且取得了比較好的成果。[2][3]本論文提出的自組織神經(jīng)網(wǎng)絡(luò)算法來(lái)對(duì)移動(dòng)學(xué)習(xí)元數(shù)據(jù)數(shù)據(jù)庫(kù)進(jìn)行高效的聚類萃取,從而使得資源更加結(jié)構(gòu)化,相關(guān)性更強(qiáng),方便用戶檢索。
2 基于自組織特征映射網(wǎng)絡(luò) ()SOM的元數(shù)據(jù)挖掘模型
2.1 自組織競(jìng)爭(zhēng)神經(jīng)網(wǎng)絡(luò)的知識(shí)介紹
由于移動(dòng)學(xué)習(xí)資源的數(shù)據(jù)量比較大,每個(gè)數(shù)據(jù)量包含的信息較多,并且存在學(xué)科交叉問(wèn)題,故在進(jìn)行移動(dòng)學(xué)習(xí)資源元數(shù)據(jù)萃取分類時(shí),必須通過(guò)對(duì)這一客觀事件的反復(fù)觀察、分析和比較,自形查找出其內(nèi)在的規(guī)律,并且對(duì)具有內(nèi)在聯(lián)系特征的事物進(jìn)行正確的歸類。
2.2 移動(dòng)學(xué)習(xí)資源元數(shù)據(jù)量化
即是建立移動(dòng)學(xué)習(xí)資源元數(shù)據(jù)語(yǔ)義關(guān)系(同義)的知識(shí)庫(kù)。移動(dòng)學(xué)習(xí)資源元數(shù)據(jù)語(yǔ)義關(guān)系知識(shí)庫(kù),采用 WordNet的基本思想,利用關(guān)系表示詞匯語(yǔ)義,使用同義詞集代表概念,并且在概念間建立不同的關(guān)系指針,表達(dá)不同的語(yǔ)義關(guān)系。[4]本文提出語(yǔ)義知識(shí)庫(kù)的結(jié)構(gòu),包含:科目編號(hào),學(xué)科等級(jí),<章節(jié)號(hào)——章節(jié)主要內(nèi)容關(guān)鍵詞四個(gè)部分。
2.3利用自組織競(jìng)爭(zhēng)神經(jīng)網(wǎng)絡(luò)進(jìn)行移動(dòng)學(xué)習(xí)資源的元數(shù)據(jù)聚類萃取
⑴數(shù)據(jù)預(yù)處理及網(wǎng)絡(luò)初始化
1. 數(shù)據(jù)預(yù)處理
由于進(jìn)行資源聚類時(shí),用戶可能會(huì)關(guān)注與關(guān)鍵字密切的資源,或者更可能像搜索與該關(guān)鍵詞相關(guān)章節(jié)內(nèi)容的介紹,故該論文又設(shè)定一個(gè)元數(shù)據(jù)量化資源組的權(quán)值函數(shù):
(0.75,0.15,0.1)1(0.5,0.45,0.15)2(0.45,0.45,0.1)3
式中 ( , )w i j表示輸入層的 i神經(jīng)元和映射層的 j神經(jīng)元之間的權(quán)值
⑷選擇和權(quán)值向量的距離最小的神經(jīng)元
計(jì)算并選擇是輸入向量和權(quán)值向量的距離最小的神經(jīng)元,如: ( )d j為最小,稱其為勝出神經(jīng)元,記為 *j,并給出其鄰接神經(jīng)元集合。
⑸權(quán)值的學(xué)習(xí)
勝出神經(jīng)元和位于其鄰接神經(jīng)元的權(quán)值,按下式更新:
⑹是否達(dá)到預(yù)先設(shè)定的要求
如達(dá)到要求則算法結(jié)束;否則,返回到步驟(2)。進(jìn)行下一輪的學(xué)習(xí)。
3 仿真結(jié)果及算法評(píng)價(jià)
由上表可以清晰的看出:組1為 (1, 2,3),組4為 (4),組10為(5),組30為 (6),組36組 (7,8, 9,10),40組 (11)。其分組的正確率高達(dá):85.1%。
由上述的仿真結(jié)果,該論文得出結(jié)論改進(jìn)后的自組織競(jìng)爭(zhēng)神經(jīng)網(wǎng)絡(luò)算法能夠進(jìn)行有效的自適應(yīng)分類,從而高效的進(jìn)行關(guān)鍵字元數(shù)據(jù)萃取的功能。但它仍存在一些問(wèn)題,第一,學(xué)習(xí)速度的選擇使其不得不在學(xué)習(xí)速度和最終權(quán)值向量的穩(wěn)定性之間進(jìn)行折中;第二,有,一個(gè)神經(jīng)元的初始值向量離輸入向量太遠(yuǎn)以至于它從未在競(jìng)爭(zhēng)中獲勝,也從未得到學(xué)習(xí),這將形成毫無(wú)用處的“死”神經(jīng)元。
4 結(jié)束語(yǔ)
目前,很多高校和公司開發(fā)出了移動(dòng)學(xué)習(xí)(尤其是智能手機(jī))的應(yīng)用軟件,并且提出較好的處理移動(dòng)學(xué)習(xí)資源的處理方法[6],為用戶的碎片式學(xué)習(xí)和隨時(shí)隨地學(xué)習(xí)提供了一個(gè)良好的環(huán)境。本論文提出的算法,很適合應(yīng)用在這些碎片資源和微型學(xué)習(xí)資源的萃取,并且可以為這些應(yīng)用系統(tǒng)或軟件提供大量的聚類資源,從而使得用戶能夠獲得更好的用戶體驗(yàn)。
參考文獻(xiàn)
[1] http://baike.baidu.com/view/3003454.htm百度百科 移動(dòng)學(xué)習(xí)2012-12-7
[2] 葉成林 徐福蔭 許駿 移動(dòng)學(xué)習(xí)研究綜述 電化教育研究 2004 No.3
[3] 陳偉超 國(guó)內(nèi)移動(dòng)學(xué)習(xí)研究現(xiàn)狀及發(fā)展建議[J].中國(guó)電力教育,2009 No.9
[4] 詞匯語(yǔ)義知識(shí)庫(kù)淺述 劉興林 福建電腦 2009 No.9
[5] MATLAB神經(jīng)網(wǎng)絡(luò)應(yīng)用設(shè)計(jì) 張德豐 機(jī)械工業(yè)出版社 2009-01-01
[6]趙剛,楊宗凱Learning Resource Adaptation and Delivery Framework for Mobile Learning. 35th ASEE/IEEE Frontiers in Education Conference. October(10)19-22,2005