王萍
(上海大學(xué) 計算中心,上海 200444)
《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010-2020年)》提出:信息技術(shù)對教育發(fā)展具有革命性影響,必須予以高度重視;要加強(qiáng)優(yōu)質(zhì)教育資源開發(fā)與應(yīng)用。虛擬學(xué)習(xí)社區(qū)(VLC)是一種基于網(wǎng)絡(luò)而形成的學(xué)習(xí)型組織,是由計算機(jī)、互聯(lián)網(wǎng)和人所組成的人——機(jī)系統(tǒng),融合了媒體信息、用戶行為和網(wǎng)絡(luò)關(guān)系結(jié)構(gòu)三大要素,是一種復(fù)雜的媒體形態(tài)。
隨著Web技術(shù)的發(fā)展,虛擬學(xué)習(xí)社區(qū)的應(yīng)用形式和應(yīng)用范圍不斷發(fā)展和豐富。在當(dāng)前環(huán)境下,虛擬學(xué)習(xí)社區(qū)呈現(xiàn)出新的特點:大規(guī)模虛擬學(xué)習(xí)社區(qū)發(fā)展成為一個異構(gòu)的信息網(wǎng)絡(luò),其要素類型、互動過程及網(wǎng)絡(luò)關(guān)系變得日益復(fù)雜;同時,虛擬學(xué)習(xí)社區(qū)中蘊(yùn)含了豐富的知識,是一個覆蓋面廣,擴(kuò)展性好,實時性強(qiáng)的知識庫,這些知識隱含在社區(qū)中文本、學(xué)習(xí)者之間的互動和學(xué)習(xí)者與資源之間的交互中。
虛擬學(xué)習(xí)社區(qū)的發(fā)展和特點,要求從學(xué)習(xí)角度和技術(shù)角度對虛擬學(xué)習(xí)社區(qū)做深入研究,同時關(guān)注教育學(xué)、社會學(xué)和技術(shù)科學(xué)的研究方法。對模型構(gòu)建的研究是虛擬學(xué)習(xí)社區(qū)研究中的重要環(huán)節(jié),有助于幫助我們認(rèn)識、分析大規(guī)模虛擬學(xué)習(xí)社區(qū)的要素、結(jié)構(gòu)與關(guān)系,更好地設(shè)計和優(yōu)化虛擬學(xué)習(xí)社區(qū),指導(dǎo)虛擬學(xué)習(xí)社區(qū)的學(xué)習(xí)實踐。
虛擬學(xué)習(xí)社區(qū)模型用于描述社區(qū)的要素、結(jié)構(gòu)與關(guān)系,已有的模型構(gòu)建研究可以劃分為理論模型構(gòu)建和結(jié)構(gòu)模型構(gòu)建兩個層面。
在理論模型的構(gòu)建研究上,Tu和Corry提出了一個三角形理論模型,認(rèn)為虛擬學(xué)習(xí)社區(qū)由教學(xué)的、技術(shù)的和社會互動的三個維度組成,為開展VLC研究提供了指導(dǎo)。[1]Garrison等提出的COI模型提出了在線學(xué)習(xí)社區(qū)的社會存在、認(rèn)知存在和教學(xué)存在三個要素,認(rèn)為這三種要素將影響到網(wǎng)絡(luò)學(xué)習(xí)的效果。[2]馬鳳娟等構(gòu)建了Web2.0環(huán)境下虛擬學(xué)習(xí)社區(qū)的理論模型,描述了虛擬學(xué)習(xí)社區(qū)的組織結(jié)構(gòu)以及知識的流動與存儲。[3]
在結(jié)構(gòu)模型研究上,當(dāng)前研究主要有社會網(wǎng)絡(luò)分析法和復(fù)雜網(wǎng)絡(luò)建模法。近年虛擬學(xué)習(xí)社區(qū)社會網(wǎng)絡(luò)關(guān)系的重要性受到廣泛認(rèn)同,主要使用社會網(wǎng)絡(luò)分析方法定量尋找虛擬學(xué)習(xí)社區(qū)中各角色之間的關(guān)系及其在社區(qū)中的位置。[4]王陸教授對虛擬學(xué)習(xí)社區(qū)的社會網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行了深入研究,證明了虛擬學(xué)習(xí)社區(qū)具有的社會網(wǎng)絡(luò)結(jié)構(gòu)特征,提出虛擬學(xué)習(xí)社區(qū)社會網(wǎng)絡(luò)結(jié)構(gòu)與網(wǎng)絡(luò)教育效果的因果模型。[5]陳向東等以東行記為案例,從網(wǎng)絡(luò)密度、小團(tuán)體、中心性等角度探討了Blog虛擬學(xué)習(xí)社區(qū)的社會網(wǎng)絡(luò)結(jié)構(gòu)。[6]
相對于社會網(wǎng)絡(luò)分析法,復(fù)雜網(wǎng)絡(luò)建模側(cè)重于對網(wǎng)絡(luò)動態(tài)學(xué)的研究,強(qiáng)調(diào)社區(qū)結(jié)構(gòu)的拓?fù)湫再|(zhì)與演化、對社區(qū)的人員和關(guān)系演化過程進(jìn)行很好的建模分析。我們前期研究構(gòu)建了E-learning標(biāo)簽網(wǎng)絡(luò),分析了其所具備的小世界現(xiàn)象和無標(biāo)度特征的復(fù)雜網(wǎng)絡(luò)性質(zhì)。[7]
從虛擬學(xué)習(xí)社區(qū)的研究方法角度分析,當(dāng)前我國對于虛擬學(xué)習(xí)社區(qū)的研究方法相對單一,應(yīng)注重方法的多樣性和先進(jìn)性,豐富虛擬學(xué)習(xí)社區(qū)研究方法。由于VLC是在技術(shù)的基礎(chǔ)上建設(shè)的社區(qū),因此在關(guān)注社會學(xué)研究方法的同時,還需要關(guān)注技術(shù)科學(xué)的研究方法。
社會網(wǎng)絡(luò)分析和復(fù)雜網(wǎng)絡(luò)建模側(cè)重對社區(qū)的關(guān)系結(jié)構(gòu)分析,其分析方法在分析大規(guī)模網(wǎng)絡(luò)時對社區(qū)要素內(nèi)在的語義信息和要素間的語義關(guān)系反映不足。主題模型是復(fù)雜隨機(jī)系統(tǒng)建模的有力工具,其優(yōu)點在于可以有效描述要素的語義信息和要素間的語義關(guān)系,并且可以利用高效的推斷算法進(jìn)行計算,更適合處理大規(guī)模數(shù)據(jù)。
主題模型是一種生成式模型,借鑒了概率圖模型理論和方法,以Latent Dirichlet Allocation(LDA)模型為代表,最初用于文檔分析,主要通過引入隱含語義主題,用來捕捉各種要素之間的隱含語義聯(lián)系。[8]主題模型的主要思想是:認(rèn)為一篇文檔可以理解成是由若干個隱含主題組合形成的,而這些主題由文本中特定詞匯體現(xiàn),如圖1左所示。如一篇關(guān)于“虛擬環(huán)境下的泛在學(xué)習(xí)”的Blog文檔,當(dāng)描述主題“虛擬環(huán)境”時,可能使用“virtual”、“reality”、“3D”、“space”等詞,而“mobile”、“ubiquitous”、“wireless”、“handheld”等詞匯則描述了主題“泛在學(xué)習(xí)”,如圖1右所示。因此可將隱含主題看作是詞的一種概率分布,單個文檔則表示為這些隱含主題特定比例的隨機(jī)混合。
圖1 主題模型的基本思想
主題模型的最初思想是對文本進(jìn)行建模,它給出了一種建模和推理的范式。對主題模型中的參數(shù)賦予相關(guān)的含義,可以將其推廣到多種應(yīng)用需求中,并通過對文本和其他要素信息進(jìn)行聯(lián)合建模,如作者信息、時間信息等,進(jìn)行模型構(gòu)建。
主題模型的建模思想為社會網(wǎng)絡(luò)建模提供了重要思路,基于語義主題,可以實現(xiàn)不同網(wǎng)絡(luò)對象的語義關(guān)聯(lián)。如科研網(wǎng)絡(luò)社區(qū)建模將科研人員、科研論文、科研會議等要素進(jìn)行聯(lián)合建模,社會化標(biāo)簽網(wǎng)絡(luò)建模將標(biāo)簽——用戶——資源、用戶興趣等要素進(jìn)行建模,博客、微博社區(qū)建模對話題、位置等的建模。
虛擬學(xué)習(xí)社區(qū)作為一種異構(gòu)的復(fù)雜知識網(wǎng)絡(luò),其要素類型、互動過程及網(wǎng)絡(luò)關(guān)系具有自身的特點,分析其要素與要素關(guān)聯(lián),使用主題模型進(jìn)行建模研究,將是一種有效的方法。
由于虛擬學(xué)習(xí)社區(qū)的復(fù)雜性,模型構(gòu)建需要能夠準(zhǔn)確表達(dá)虛擬學(xué)習(xí)社區(qū)復(fù)雜系統(tǒng)中的要素與關(guān)系。這一方面要求對虛擬學(xué)習(xí)社區(qū)中各種關(guān)鍵要素和關(guān)系做出準(zhǔn)確的理論分析,另一方面要求將這種關(guān)系以數(shù)學(xué)描述的方式體現(xiàn)在模型中,包括模型要素間的網(wǎng)絡(luò)結(jié)構(gòu)、參數(shù)的設(shè)置等。
我們首先從虛擬學(xué)習(xí)社區(qū)的發(fā)展和演進(jìn)角度,對不同階段虛擬學(xué)習(xí)社區(qū)的類型進(jìn)行了梳理。虛擬學(xué)習(xí)社區(qū)的應(yīng)用形式隨著Web技術(shù)的發(fā)展而演進(jìn),從傳統(tǒng)的萬維網(wǎng)、到社會化萬維網(wǎng)(Web2.0)和語義網(wǎng),每次技術(shù)革新都改變著人類的信息環(huán)境,構(gòu)建著新型的虛擬社會空間。虛擬學(xué)習(xí)社區(qū)的主要類型包括了Web1.0(傳統(tǒng)互聯(lián)網(wǎng))環(huán)境下以學(xué)習(xí)管理系統(tǒng)和論壇為主要形式的VLC、Web2.0(社會化萬維網(wǎng))環(huán)境下以博客、標(biāo)簽、微博等為主要形式的VLC、Web3.0(社會化語義網(wǎng))環(huán)境下以語義本體描述的VLC。
基于對不同類型虛擬學(xué)習(xí)社區(qū)及特征的分析,抽取核心要素,歸納模型構(gòu)建的關(guān)鍵要素與關(guān)系。包括虛擬學(xué)習(xí)社區(qū)人的要素(學(xué)習(xí)者和教師)、內(nèi)容要素(學(xué)習(xí)資源)、網(wǎng)絡(luò)要素(各種要素之間顯性和隱性的關(guān)系)、時序要素(時間信息)、組織要素(所屬院校或課程),并分析虛擬學(xué)習(xí)社區(qū)要素之間的基本依賴關(guān)系。
模型構(gòu)建的核心是引入虛擬學(xué)習(xí)社區(qū)的隱含知識主題,以知識主題為橋梁來表達(dá)虛擬學(xué)習(xí)社區(qū)中基于網(wǎng)絡(luò)化依賴關(guān)系。通過主題分布來表達(dá)和挖掘各種要素之間的隱含語義聯(lián)系,將學(xué)習(xí)者、學(xué)習(xí)資源、網(wǎng)絡(luò)關(guān)系、組織信息等社區(qū)核心要素進(jìn)行聯(lián)合建模。模型的概念描述如圖2所示。
圖2 虛擬學(xué)習(xí)社區(qū)模型的概念描述
使用概率圖方法對模型進(jìn)行形式化描述,圖3是所構(gòu)建虛擬學(xué)習(xí)社區(qū)模型的概率圖。
圖3 虛擬學(xué)習(xí)社區(qū)模型的概率圖描述
模型的實證分析包括模型的實現(xiàn)、數(shù)據(jù)資源庫的建設(shè)和模型的實證分析。其中,數(shù)據(jù)資源庫的建設(shè)策略為:選擇國內(nèi)外典型的虛擬學(xué)習(xí)社區(qū)(論壇型、博客型、微博型),使用網(wǎng)絡(luò)爬蟲、相關(guān)的應(yīng)用程序接口(API)和Web服務(wù)等信息抓取技術(shù)進(jìn)行數(shù)據(jù)集的獲取。實證分析的模型驗證從兩個層面進(jìn)行:一方面從技術(shù)分析角度評價模型的性能與建模效果,另一方面使用問卷調(diào)查方式,對模型分析結(jié)果進(jìn)行人工評測。通過模型的實證分析,對模型進(jìn)行修正與完善。
在虛擬學(xué)習(xí)社區(qū)數(shù)據(jù)量規(guī)?;?、數(shù)據(jù)源多樣化和要素關(guān)系復(fù)雜化的環(huán)境下,知識發(fā)現(xiàn)研究越來越得到研究者的關(guān)注。VLC知識發(fā)現(xiàn)研究的目標(biāo)是通過規(guī)?;淖詣臃治龇椒ǐ@取顯式和隱含的領(lǐng)域知識,為學(xué)習(xí)者提供知識應(yīng)用服務(wù)。知識發(fā)現(xiàn)應(yīng)用研究有助于幫助學(xué)習(xí)者更加有效地獲取學(xué)習(xí)內(nèi)容,理解學(xué)習(xí)者的行為模式,挖掘?qū)W習(xí)資源,構(gòu)建語義本體,進(jìn)行學(xué)習(xí)資源個性化推薦等。
基于主題模型的虛擬學(xué)習(xí)社區(qū)建模方法能夠有效分析與揭示大規(guī)模虛擬學(xué)習(xí)社區(qū)的要素與關(guān)系結(jié)構(gòu),可以得到主題——學(xué)習(xí)者分布,社區(qū)——主題分布等。基于模型分析結(jié)果,可以從多角度對虛擬學(xué)習(xí)社區(qū)進(jìn)行分析,挖掘知識,探索虛擬學(xué)習(xí)社區(qū)知識發(fā)現(xiàn)的新方法,進(jìn)行知識發(fā)現(xiàn)應(yīng)用的具體研究。
下一步研究將進(jìn)行模型的程序?qū)崿F(xiàn)與實證分析,并基于模型進(jìn)行知識發(fā)現(xiàn)應(yīng)用的具體研究,首先進(jìn)行學(xué)習(xí)資源的個性化推薦研究與知識研究。學(xué)習(xí)資源的個性化推薦的目標(biāo)是為不同背景和不同偏好學(xué)習(xí)者的資源需求提供個性化服務(wù),在推薦方法上可以使用基于模型分析的知識主題分布確定學(xué)習(xí)者對于學(xué)習(xí)資源的偏好值。知識演進(jìn)研究的目標(biāo)是探尋社區(qū)知識在時間維度上的動態(tài)性和發(fā)展性,我們擬采用后驗分析方法,基于模型所得到的主題,計算每個時間段中社區(qū)知識主題發(fā)生的概率,分析主題在不同時間段的特點。
[1]C.Tu&M.Corry E-learning communities[J].Quarterly Review of Distance Education,2002(2):207-218.
[2]D.R.Garrison.OnlineCommunityofInquiryReview:Social,Cognitive,and Teaching Presence Issues[J].Journal of Asynchronous Learning Networks,2007(11):61-72.
[3]馬鳳娟.Web2.0環(huán)境下虛擬學(xué)習(xí)社區(qū)模型的構(gòu)建[D].山東師范大學(xué)碩士學(xué)位論文,2008.
[4]高長俊,胡世清.我國虛擬學(xué)習(xí)社區(qū)研究現(xiàn)狀及趨勢分析[J].遠(yuǎn)程教育雜志,2011(4):65-70.
[5]王陸.虛擬學(xué)習(xí)社區(qū)的社會網(wǎng)絡(luò)結(jié)構(gòu)研究[D].西北師范大學(xué),2009.
[6]陳向東,方群,唐輝云.Blog虛擬學(xué)習(xí)社區(qū)的社會網(wǎng)絡(luò)研究——以“東行記”為例[J].電化教育研究,2008(1):40-44.
[6]王萍.基于自由分類法的e-Learning共現(xiàn)標(biāo)簽網(wǎng)絡(luò)分析[J].中國電化教育,2008(11):99-104.
[7]D.M.Blei,A.Y.Ng,M.I.Jordan.Latent Dirichlet Allocation[J].Journal of Machine Learning Research,2003,(3):993-1022.