肖年志+郭儉
摘 要:隨著學(xué)習(xí)平臺向智能化、自適應(yīng)學(xué)習(xí)方向的發(fā)展,對學(xué)習(xí)者學(xué)習(xí)特征、資源特征的精確把握程度決定了平臺智能化的程度。較為傳統(tǒng)的方法是使用人工(包括眾籌)的方法進行資源特征的標注;本文從大數(shù)據(jù)分析的角度,提出了基于使用行為大數(shù)據(jù)分析的資源特征模型的構(gòu)建思路,并初步討論了多個子模型的構(gòu)建方法。
關(guān)鍵詞:基礎(chǔ)教育;自適應(yīng)學(xué)習(xí);資源評價;關(guān)聯(lián)
中圖分類號:G434 文獻標志碼:A 文章編號:1673-8454(2018)03-0042-04
一、課題的提出
隨著基礎(chǔ)教育信息化的推進,基礎(chǔ)教育資源平臺面臨著從簡單的資源集成平臺向自適應(yīng)學(xué)習(xí)系統(tǒng)的轉(zhuǎn)變。蘇州園區(qū)教育局于2016年建成的易加互動學(xué)習(xí)平臺通過近一年的推廣使用,集結(jié)了“17000+”原創(chuàng)微課。隨著課件、題目資源建設(shè)的進一步到位,平臺的資源集成功能已經(jīng)實現(xiàn)。但是,面對數(shù)量日益增加的海量資源,基于師生對平臺的使用數(shù)據(jù),構(gòu)建更加智能化的自適應(yīng)學(xué)習(xí)平臺,成為下一步建設(shè)的重點。
自適應(yīng)學(xué)習(xí)系統(tǒng),意味著系統(tǒng)可以根據(jù)學(xué)習(xí)者個性和學(xué)習(xí)行為特征,提供個性化的學(xué)習(xí)路徑和適宜的學(xué)習(xí)資源。從其實現(xiàn)的路徑來看,實現(xiàn)資源的個性化推送是關(guān)鍵環(huán)節(jié)。以往基于資源的推送研究往往基于孤立的簡單算法,例如基于內(nèi)容的推送、基于關(guān)聯(lián)規(guī)則的推送等。但是,由于學(xué)習(xí)資源有其自身的特點,例如知識的關(guān)聯(lián)性,學(xué)習(xí)的場景化、資源類型多等,因此,實現(xiàn)自適應(yīng)的學(xué)習(xí)資源推送,必須建立相應(yīng)的資源特征庫,以便系統(tǒng)通過對相關(guān)資源特征的提取,進行快速有效的推送。
本文旨在研究通過使用大數(shù)據(jù)分析的方法,對平臺上各種與資源有關(guān)的用戶行為進行分析與理論研究,挖掘出其中蘊涵的對資源價值的評價傾向性,找到資源間隱含的關(guān)聯(lián)關(guān)系,建立相應(yīng)的資源特征庫,以助平臺進一步向智能化方向進化。
二、章節(jié)式教學(xué)的特點
面向基礎(chǔ)教育的教學(xué)平臺,其學(xué)習(xí)資源的組織與學(xué)校教學(xué)高度關(guān)聯(lián),因此,在資源的組織上表現(xiàn)出鮮明的特點。首先,其教學(xué)內(nèi)容表現(xiàn)出高度組織化。通常與教材的章節(jié)保持著高度的一致性,反映了基于學(xué)科邏輯和學(xué)生學(xué)習(xí)邏輯綜合考慮的知識結(jié)構(gòu)化的需求。章節(jié)的設(shè)置,充分考慮了知識的邏輯關(guān)系和學(xué)習(xí)者的認知規(guī)律。在具體的內(nèi)容組織上,既有強調(diào)上下位關(guān)系的層次結(jié)構(gòu),又有強調(diào)并列組合關(guān)系的組合結(jié)構(gòu)。其次,同樣的知識內(nèi)容,基于不同的學(xué)習(xí)目標達成,就可能有不同的資源形式?;灸繕耍ㄖR、理解、應(yīng)用)和高層次目標(分析、評價、創(chuàng)造)對學(xué)習(xí)資源有著不同的承載要求。此外,從學(xué)習(xí)資源具體應(yīng)用來看,基礎(chǔ)教育領(lǐng)域?qū)W生的學(xué)習(xí),通常需要按照學(xué)校教學(xué)進度,與課堂教學(xué)保持同步。例如,學(xué)生的個體學(xué)習(xí)主要發(fā)生在課前的自主預(yù)習(xí)和課后的作業(yè)練習(xí)。因此,自主學(xué)習(xí)的場景因素成為我們考慮學(xué)習(xí)資源特征時必須考慮的重要維度。
基于以上分析,我們認為,作為自適應(yīng)學(xué)習(xí)最基本引擎的資源特征庫,可以考慮以下需求:
(1)資源依賴于教材章節(jié)
資源必須有明確的教材章節(jié)性質(zhì),即一個資源綁定一個或者多個教材章節(jié)。鑒于教材章節(jié)從數(shù)據(jù)結(jié)構(gòu)上一般而言是樹結(jié)構(gòu)的,故綁定的章節(jié),需要盡可能是樹枝上的最終分叉節(jié)點。
(2)資源依賴于特定的場景
每一個資源,都是為了特定的場景而制作出來的,資源需要有明確的場景特性。在一個教材章節(jié)內(nèi)部,有些資源是面向課前先學(xué)這一場景的,此時資源一般難度較低,主要用于滿足認知層級分類上的識記與理解。
(3)資源難易度適中
資源對學(xué)習(xí)者來說有點難而又不太難,是價值最高的,有點難是有挑戰(zhàn)性,不讓人掉以輕心;不是太難,是自己主觀能動努力一下就能有收獲,能夠享受到學(xué)習(xí)的樂趣。而學(xué)習(xí)者千差萬別,資源需要有復(fù)雜的難易等級,以滿足不同層次學(xué)生的需求。
(4)資源是優(yōu)質(zhì)的
優(yōu)質(zhì)的資源能使學(xué)習(xí)難度曲線降低,提升學(xué)生的學(xué)習(xí)樂趣與成就感,滿足快樂教與學(xué)的目的。
(5) 資源間是關(guān)聯(lián)的
學(xué)習(xí)一般都是基于多個資源的學(xué)習(xí),資源與資源之間有種種關(guān)聯(lián),有時間先后關(guān)系的,有相似關(guān)系的,資源模型需要重點描述資源間的關(guān)聯(lián)關(guān)系。推薦引擎通過對關(guān)聯(lián)資源的引用,來計算出一個學(xué)生具體的學(xué)習(xí)路徑。
三、智慧教學(xué)的資源模型
基于前述智慧學(xué)習(xí)推薦引擎的需求,我們認為需要從如下幾個方面來構(gòu)建資源模型:
1.資源的場景特性
學(xué)習(xí)平臺支持的常見的教與學(xué)場景有課前預(yù)習(xí)、課堂互動、課后鞏固、單元加強、考前沖刺。雖然該五類場景有較為明顯的知識逐漸加深的因素,但是一個資源未必只用于其中的一個場景,還可以根據(jù)其他的因素考慮,被用于多個場景。比如:一道題目,可以用于課后鞏固,用于檢測學(xué)習(xí)效果;它也可以用于后續(xù)章節(jié)的課前預(yù)習(xí)檢測環(huán)節(jié),達到檢測掌握是否牢固等目的。
作為一種屬性,資源的場景特性,可以是系統(tǒng)運營要求的,強制共享者在分享資源之前進行顯式的標注,不標注不能進行共享。此種方式依賴人力標注,一方面有可能標注得不夠全面,另一方面標注所耗費的人力巨大,故一般未必能夠形成常態(tài)化的操作。而通過資源在具體的課程使用情況的分析,可以得出具體的場景。如:
?誗課前任務(wù)單可以認為是課前預(yù)習(xí)環(huán)節(jié),其所使用的資源均自動帶有課前預(yù)習(xí)場景特性;
?誗課堂任務(wù)單或者教師備課的課堂素材所包含的資源,可以歸類到課堂互動環(huán)節(jié);
?誗課后任務(wù)單或者課后練習(xí)中所使用到的資源,可以歸并到課后鞏固環(huán)節(jié);
?誗橫跨多個小章節(jié)的練習(xí)作業(yè)或者學(xué)習(xí)任務(wù),可以認為是單元加強所需而產(chǎn)生的學(xué)習(xí)使用行為;
?誗從時間上判斷資源需所屬的章節(jié)有較大的跨度,并且資源難度相對較高,可以用于考前沖刺環(huán)節(jié)。
資源場景特性的自動識別與隱性標注,是在用戶無感知的情況下進行的,不會因此而受到教師用戶的阻撓,對平臺的推廣使用非常有益。
通過對資源在各種場景中的使用行為的分析,能夠得出一個資源的章節(jié)及場景使用屬性:
?誗教材章節(jié)編碼;
?誗場景編碼;
?誗以教材章節(jié)和場景為單位出現(xiàn)的次數(shù);
?誗學(xué)生學(xué)習(xí)匯總情況,如微課資源的平均觀看時間、覆蓋度;題目資源的答題平均用時、正確率等信息。
隨后,在其他教師用戶使用時,平臺可以結(jié)合教師當前的具體場景,使用一定的算法,推薦最符合該場景的資源列表,或者資源的詳細信息里輔以上述分析得出的匯總及分析信息,幫助教師判斷,選用最合適的資源。
2.資源的難易度
學(xué)生認知基礎(chǔ)不同、認知能力不同,使用同一份資源進行學(xué)習(xí)與測試往往效果會不同,分層式學(xué)習(xí)是最近幾年教學(xué)與信息化結(jié)合后出現(xiàn)的新做法,特點是學(xué)生分層,如分為提高、普通、薄弱,資源也分層,分別對應(yīng)于學(xué)生的三個分層。典型的一個做法是一份測試題,教師進行了分層設(shè)置,除了一部分所有人都需要答的題之外,設(shè)定另外一部分題目,比如30%左右的題量,按照難中易三個層次布置,分發(fā)給學(xué)生作答。學(xué)習(xí)能力強的作答其中共通部分及較難的題目;學(xué)習(xí)能力一般的作答其中共通部分及一般難度的;學(xué)習(xí)能力較弱的,作答其中共通部分及簡單的題目。分層式教學(xué)對學(xué)習(xí)的促進作用已經(jīng)得到廣泛驗證。分層教學(xué),依賴的主要就是資源的難易度特性。
資源的難易度,可以是教師用戶或者資源供應(yīng)商主動標注提供的;而在大數(shù)據(jù)時代,通過對各種數(shù)據(jù)進行分析匯總,來智能取得難度信息是比較可行的一種做法。
我們把難度分為5個等級,分別為極易、易、一般、難、極難。
資源的難易度,需要綜合如下幾個方面:
(1)資源使用場景所包含的難易度信息
根據(jù)布魯姆六層認知論,我們可以把平臺所支持的5種場景與前5層進行對應(yīng),并根據(jù)該流程分別設(shè)定難易度,即:
如表1所示,考慮到課前課中課后會隨著課堂主題變化而不一樣,故我們針對一個場景設(shè)定了多個難易度值。資源在不同的場景里面出現(xiàn),基于上表的規(guī)則把難易度設(shè)定到該資源的難易度等級列表里面去,并以二維數(shù)組的形式保存:
[場景編碼,難易度編碼],[場景編碼,難易度編碼]……
※保存場景編碼的目的是日后根據(jù)需要,進行算法精度的調(diào)校時,能夠基于此信息重新計算所對應(yīng)的難易度信息。
(2)學(xué)生群體的認知能力信息
學(xué)生的學(xué)習(xí)能力有差別。一個班級作為一個群體,在每一個班級均會出現(xiàn)優(yōu)良中差的等級;在一個學(xué)校,一般也可以把班級分為ABC(尖子班、普通班、薄弱班)三個等級;在一個區(qū)域,也可以將學(xué)校進行橫向的等級劃分,分為名校、普通校、薄弱校等。不同級別的群體,所需要的資源難易度不同;資源分配給各班級群體使用時該群體的等級比例也可以作為資源難易度判斷的數(shù)據(jù)來源。
我們一般將班級群體分為5個等級:優(yōu)、優(yōu)良、一般、較弱、薄弱,與資源的難易度正好一致。
(3)資源使用完畢后學(xué)生群體的反饋
如前所述,當一個普通班級在作答完畢一份練習(xí)后的統(tǒng)計數(shù)據(jù)表現(xiàn)出來平均分數(shù)過低,系統(tǒng)可以據(jù)此認為該練習(xí)的難易度等級較高。不同的群體,在資源學(xué)習(xí)或者題目檢測以后所反饋的信息(正確率等)也需要根據(jù)這個群體的認知等級進行二次處理。
基于上述分析,一個資源,可以通過使用學(xué)生群體的等級特性及使用后的反饋來進行難易度的補償修正。
(4)關(guān)聯(lián)使用時的難易度信息
在日常的教學(xué)過程中,教師一般會把難易度相等的多個資源組合以后形成任務(wù)單發(fā)放給學(xué)生學(xué)習(xí)或者作答。即一個資源和其他資源組合用于教學(xué)時,這個資源的難易度可以從這個組合內(nèi)部其他資源的難易度來衡量。我們可以采用組合難易度的標準偏差來衡量,并對超出偏差閾值的資源進行難易度的修正。
3.基于使用行為分析的優(yōu)劣評價
以往,對資源的評價使用如排名、專家評審等方式進行,該類評價以主觀評價為主,較易受到人為因素的干擾。到了大數(shù)據(jù)時代,我們可以基于對資源的各種使用行為進行分析,挖掘其中所蘊涵的對資源評價的信息,形成資源的客觀評價。由于是基于數(shù)據(jù)的評價,數(shù)據(jù)量越大,受人為干擾的因素越小,客觀性也越有保障。
當前,在線學(xué)習(xí)平臺對資源的使用,主要會發(fā)生如下多種行為,行為及評價的方法簡單列舉如下:
(1)觀看:可以從觀看的覆蓋率、觀看次數(shù)、學(xué)校分散性、觀看熱度等方面進行評價;
(2)點贊:點贊數(shù)越高,評價越高;
(3)收藏:收藏數(shù)越高,評價越高;
(4)引用:實際的使用行為,引用數(shù)越高,評價越高;
(5)下載:同引用類似,下載數(shù)越高,評價越高;
(6)評論:可以通過文本情感分析技術(shù)進行分析,算出好感度來進行評價;
(7)投訴:一般是比較負面的評價;
(8)追蹤使用:前述都是對單個資源單獨的評價,追蹤使用是分析多個關(guān)聯(lián)性的資源,通過找到其共性,在共性內(nèi)尋找差異,并形成客觀的評價;
(9)跨時段使用:通過追蹤分析每一個資源一段時間內(nèi)的動作變化,來進行橫向的對比與評價;
基于上述9個方面,可以對資源做一個較為全面的評價,生成一個資源評價的七角雷達圖和綜合的評價指數(shù)。
基于用戶行為的資源評價模型,已經(jīng)以微課資源為例,以獨立文章的形式進行了表述,在此不再贅述。
4.資源間的先后順序
資源一般不是獨立使用的,而多以組合形式進行,最常見的場景是各類學(xué)習(xí)任務(wù)當中的“微課+題目”的形式,微課教授知識,題目檢測學(xué)習(xí)效果。本節(jié)和后續(xù)的兩小節(jié)是對資源與資源間關(guān)系的一種描述。
在資源庫中,在同一個細分的類目下還會有較多數(shù)量的資源,以易加互動學(xué)習(xí)平臺上的微課視頻為例,如圖1所示,同一個章節(jié)下有8個微課資源,實際教學(xué)時,8個資源的使用有先后限制,如需先學(xué)完《有趣的乘法計算(一)》才能學(xué)習(xí)《有趣的乘法計算(二)》。
當前的視頻是圍繞教材章節(jié)進行建設(shè)的,如圖1所示,在一個章節(jié)下面其實包含了多個課時的內(nèi)容,教師選用某個章節(jié)的資源時,當前還不能直接選用,還需要再仔細看一下到底是第幾課時的微課,自己能不能直接選用。作為一個智能的推薦引擎,應(yīng)該將這個過程也省掉,要實現(xiàn)貼心的推薦。
資源間先后順序的計算是基于場景的,即從業(yè)務(wù)角度考慮需要計算先后的場景,然后對實際的使用行為數(shù)據(jù)進行分析,找出其間的先后關(guān)系,并標以一個確信度,用于衡量先后關(guān)系的穩(wěn)定性。在碰到相似的使用場景時,基于這些信息進行推薦優(yōu)先度的排序。
我們舉幾個較為常見的場景:
(1)某學(xué)科章節(jié)的一個學(xué)習(xí)任務(wù)單,使用了一個“微課+一套練習(xí)題”。微課和這套練習(xí)題,將會默認形成一個先后關(guān)系。當其他用戶引用了微課后,系統(tǒng)應(yīng)智能地提示是否把經(jīng)常一起使用的、后續(xù)的那套練習(xí)題也引用進來。
(2)一個章節(jié)下面的微課,使用者是按照課時推進使用先后順序的?,F(xiàn)在建設(shè)的微課資源已經(jīng)形成規(guī)模,一個章節(jié)下面有5個以上微課的資源有很多;通過外購的題庫資源,平均每個章節(jié)均有超過100個題目的資源。實際使用時,有部分題目會在第一課時課前使用,有部分題目會在課后使用,有部分題目會在第二課時課前課后使用。這些題目的使用先后關(guān)系,系統(tǒng)都需要收集起來,經(jīng)過計算以后記入資源前驅(qū)后置屬性當中去。
(3)學(xué)生做題目檢測時,系統(tǒng)發(fā)現(xiàn)有一個前置的知識點的掌握程度較低,系統(tǒng)需要從與當前章節(jié)關(guān)聯(lián)的前置微課列表中進行尋找。此時系統(tǒng)需要返回那些屬于前驅(qū)章節(jié)、又是在學(xué)習(xí)了本章節(jié)后使用的那些題目,此類題目優(yōu)先展示給學(xué)生,可能是最滿足其期望的。
資源的前驅(qū)后置順序關(guān)系,在系統(tǒng)中保存為一個二維數(shù)組,每一項需要包含的信息包括前驅(qū)后置資源類型、前驅(qū)后置資源ID、前驅(qū)后置確信度。
5.資源間的相似
當兩個資源的細分類都一致時,我們使用相似性代替其他屬性來進行描述。資源相似來源場景也有多種,舉例如下:
?誗基于資源關(guān)鍵字的比較計算所得,兩個資源擁有越多的關(guān)鍵字,則相似性越高;
?誗資源內(nèi)容的比較,如多題經(jīng)過對題目文本內(nèi)容的語義分析,可以算出一個處于0~1的相似度指數(shù);
章節(jié)知識點的相似性、地域的相似性等因素可以通過其他方式進行計算,可以不列入資源相似性的比較。
資源相似性通過相似資源這一屬性進行描述,包含的信息包括相似資源ID、相似確信度(確信度越大越相似)。
6.資源的聚簇性
資源的相似性,是對同一類型的資源進行的相似度描述;而資源的聚簇性,則是對多種資源可以一起使用這一特征的描述。
一起使用的場景如:
?誗在多個學(xué)習(xí)任務(wù)單中被一起使用;
?誗多個題型的題目在同一份練習(xí)/試卷中被一起使用;
?誗在同一課程中被一起使用;
資源的聚簇特性,使用外鏈的聚簇因子(唯一的ID)進行描述,包含的信息包括:
?誗聚簇資源ID。
?誗聚簇距離,該值為業(yè)務(wù)場景定義的距離,取決于具體的業(yè)務(wù)場景,如同一題在同一個課前學(xué)習(xí)任務(wù)單中被使用的距離要小于在同一課程中其他學(xué)習(xí)任務(wù)單中使用的距離,距離越小,聚簇性質(zhì)越明顯。
?誗聚簇發(fā)生次數(shù),次數(shù)越多,一起使用的傾向越大。
四、結(jié)束語
針對智慧教學(xué),本文提出了適用于智慧教學(xué)智能化推薦場景的資源信息化系統(tǒng)的模型,并提供了一部分的實現(xiàn)思路。
基于行為數(shù)據(jù)分析的資源關(guān)聯(lián)與評價,能夠大大簡化費時費力的資源標注工作,且行為數(shù)據(jù)全部自動收集,用戶無感知,所計算出來的結(jié)果也能夠保證其客觀與公正,是學(xué)習(xí)平臺智能化的基石,也將是下一代學(xué)習(xí)平臺所必須具備的基礎(chǔ)性功能。
基于行為數(shù)據(jù)分析的資源關(guān)聯(lián)與評價,當前研究尚處于起始階段,模型場景、模型參數(shù)均會隨著研究與應(yīng)用的深入得以進化。
參考文獻:
[1]方海光,劉靜,黃榮懷,李玉順.基于學(xué)習(xí)對象化的移動學(xué)習(xí)資源自適應(yīng)引擎的研究[J].中國電化教育,2009(7):51-55.
[2]劉俊.泛在學(xué)習(xí)中學(xué)習(xí)資源自適應(yīng)環(huán)境系統(tǒng)設(shè)計[D].武漢:華中師范大學(xué),2012.
[3]李曉,李浩君.基于片段式資源協(xié)作構(gòu)建的自適應(yīng)移動學(xué)習(xí)系統(tǒng)設(shè)計[J].中國教育信息化,2011(5):38-41.
(編輯:王天鵬)