吳林靜 涂鳳嬌 馬鑫倩 高喻 劉清堂
[摘 ? 要] 學(xué)習(xí)者的協(xié)作會(huì)話數(shù)據(jù)是深入了解其學(xué)習(xí)過(guò)程和認(rèn)知狀態(tài)的一類重要數(shù)據(jù)。但由于自然語(yǔ)言的靈活性和學(xué)習(xí)情境的復(fù)雜性,協(xié)作會(huì)話數(shù)據(jù)分析的自動(dòng)化程度一直不高,難以大規(guī)模應(yīng)用。文章從人工智能視域出發(fā),構(gòu)建了基于人工智能技術(shù)的在線協(xié)作會(huì)話分析概念模型,對(duì)在線協(xié)作會(huì)話分析的理論基礎(chǔ)、基本特征、分析流程和常用方法進(jìn)行了論述,并進(jìn)一步詳細(xì)分析了“基于信息論的知識(shí)貢獻(xiàn)測(cè)量”和“基于語(yǔ)義的協(xié)作會(huì)話學(xué)習(xí)投入自動(dòng)分析”兩個(gè)在線協(xié)作會(huì)話分析典型案例。案例證明了該模型能夠?qū)⑷斯ぶ悄芗夹g(shù)的“可計(jì)算”與教育研究的“可理解”相結(jié)合,為人工智能技術(shù)與協(xié)作會(huì)話分析融合搭建了橋梁,對(duì)在線協(xié)作會(huì)話分析實(shí)踐具有重要的指導(dǎo)和參考價(jià)值。
[關(guān)鍵詞] 在線協(xié)作會(huì)話; 人工智能; 概念模型; 可計(jì)算; 可理解
[中圖分類號(hào)] G434 ? ? ? ? ? ?[文獻(xiàn)標(biāo)志碼] A
[作者簡(jiǎn)介] 吳林靜(1987—),女,湖北松滋人。副教授,博士,主要從事數(shù)據(jù)挖掘、人工智能與教育應(yīng)用研究。E-mail:wlj_sz@126.com。
一、引 ? 言
在線協(xié)作會(huì)話是指以在線學(xué)習(xí)環(huán)境為支撐,學(xué)習(xí)者圍繞一定主題或目標(biāo)以協(xié)同合作的方式展開對(duì)話,通過(guò)討論來(lái)交換想法和彌補(bǔ)差距,最終達(dá)成一致意見或完成某一任務(wù)的過(guò)程。協(xié)作會(huì)話是在線學(xué)習(xí)中師生、生生交流的一種重要手段,有時(shí)甚至是唯一手段[1]。協(xié)作會(huì)話既是了解學(xué)習(xí)者認(rèn)知過(guò)程的重要窗口,也是緩解學(xué)習(xí)孤獨(dú)感、提升學(xué)習(xí)體驗(yàn)的重要策略[2]。因此,開展在線協(xié)作會(huì)話分析,對(duì)于深入診斷學(xué)習(xí)過(guò)程、提升學(xué)習(xí)者學(xué)習(xí)體驗(yàn)、提供個(gè)性化學(xué)習(xí)指導(dǎo)都有著重要的意義和價(jià)值。然而,目前對(duì)于在線協(xié)作會(huì)話的分析仍以人工分析為主,主要依賴教師的個(gè)體經(jīng)驗(yàn)和觀察,難以規(guī)?;腕w系化。其原因在于在線協(xié)作會(huì)話數(shù)據(jù)的主要形式是文本,而文本類數(shù)據(jù)的處理與分析相對(duì)復(fù)雜。在學(xué)習(xí)分析領(lǐng)域,結(jié)構(gòu)化數(shù)據(jù)的處理與分析技術(shù)已經(jīng)相對(duì)成熟,如針對(duì)日志數(shù)據(jù)、行為數(shù)據(jù)、成績(jī)數(shù)據(jù)、里克特量表測(cè)量的問卷調(diào)查數(shù)據(jù)等均已有相對(duì)成熟的分析模型,并得到了廣泛應(yīng)用[3-5]。但對(duì)于文本類的數(shù)據(jù),則主要依靠?jī)?nèi)容分析法進(jìn)行人工分析,難以規(guī)?;妥詣?dòng)化進(jìn)行分析。而近年來(lái),人工智能技術(shù)的迅猛發(fā)展,為緩解這一現(xiàn)象提供了新的契機(jī)和思路。文本分析相關(guān)的自然語(yǔ)言理解技術(shù)和語(yǔ)義分析技術(shù)取得了長(zhǎng)足的進(jìn)步[6-7]。但如何將這些技術(shù)應(yīng)用于協(xié)作會(huì)話分析領(lǐng)域,尚未形成相對(duì)成熟的概念模型。針對(duì)這一問題,本研究從人工智能視域出發(fā),提出了一種在線協(xié)作會(huì)話分析的概念模型,試圖從方法論的角度闡述如何更好地將人工智能技術(shù)融合于協(xié)作會(huì)話分析,從而理解學(xué)習(xí)過(guò)程、提升學(xué)習(xí)體驗(yàn)。該概念模型對(duì)人工智能技術(shù)支持的在線協(xié)作會(huì)話分析的理論基礎(chǔ)、常用方法、分析流程和基本特征進(jìn)行了總結(jié)和概括,并提出多學(xué)科交叉、問題導(dǎo)向、數(shù)據(jù)驅(qū)動(dòng)和情景相關(guān)是該模型的四大典型特征。本研究選擇了兩個(gè)該模型的典型應(yīng)用案例進(jìn)行分析,以闡述模型的應(yīng)用方式并驗(yàn)證其有效性和可用性。
二、文獻(xiàn)綜述
(一)人工智能與學(xué)習(xí)分析技術(shù)
對(duì)學(xué)習(xí)分析技術(shù)的研究和應(yīng)用由來(lái)已久。Siemens給出了學(xué)習(xí)分析技術(shù)的定義:測(cè)量、搜集、分析和報(bào)告關(guān)于學(xué)習(xí)者及其學(xué)習(xí)情境的數(shù)據(jù),以了解和優(yōu)化學(xué)習(xí)和學(xué)習(xí)發(fā)生的情境[8]。從該定義中可以看出,學(xué)習(xí)分析技術(shù)是一種圍繞著數(shù)據(jù)展開的研究方法。目前,學(xué)習(xí)分析技術(shù)已經(jīng)被廣泛地應(yīng)用于學(xué)習(xí)過(guò)程中的各個(gè)環(huán)節(jié),并發(fā)揮了巨大的作用[9-10]。但是,由于數(shù)據(jù)的標(biāo)注與分析工作耗時(shí)耗力,傳統(tǒng)的學(xué)習(xí)分析技術(shù)通常在小規(guī)模數(shù)據(jù)集中開展,不便于大規(guī)模應(yīng)用。人工智能技術(shù)的發(fā)展則為這一現(xiàn)象提供了新的解決思路[11]。人工智能的核心宗旨是“計(jì)算的自動(dòng)化”[12],而這一宗旨正好與學(xué)習(xí)分析大規(guī)模應(yīng)用的需求不謀而合,為學(xué)習(xí)分析的自動(dòng)化開展提供了技術(shù)基礎(chǔ)。人工智能技術(shù)的加持使得大規(guī)模的、密集型的數(shù)據(jù)能夠被快速、高效地分析和處理;而學(xué)習(xí)分析技術(shù)則保證了數(shù)據(jù)的教育和教學(xué)特性可以被理解和應(yīng)用。因此,人工智能技術(shù)和學(xué)習(xí)分析技術(shù)的融合將大大提高學(xué)習(xí)分析的效率,拓展其應(yīng)用范圍和應(yīng)用場(chǎng)景,使得學(xué)習(xí)分析技術(shù)煥發(fā)新的活力。但與傳統(tǒng)的數(shù)據(jù)分析方法相比,當(dāng)前人工智能技術(shù)的可理解性和可解釋性相對(duì)較弱[13-14]。常用的很多人工智能算法,如各種深度神經(jīng)網(wǎng)絡(luò)模型,其參數(shù)復(fù)雜,建模和分析過(guò)程如同黑箱,難以被理解和解釋[15]。因此,人工智能技術(shù)視域下的學(xué)習(xí)分析也有了新的發(fā)展和需求。如何對(duì)學(xué)習(xí)領(lǐng)域的數(shù)據(jù)進(jìn)行建模,從而利用人工智能技術(shù)進(jìn)行分析和挖掘,并保證分析過(guò)程和分析結(jié)果對(duì)于學(xué)習(xí)分析專家和教師具有可理解性和可解釋性,成為人工智能技術(shù)支持的學(xué)習(xí)分析領(lǐng)域發(fā)展所面臨的挑戰(zhàn)之一。
(二)在線協(xié)作會(huì)話分析
對(duì)會(huì)話數(shù)據(jù)的分析是學(xué)習(xí)分析研究的重要組成部分,其原因在于,會(huì)話活動(dòng)是教學(xué)過(guò)程中一種重要的教學(xué)組織形式。根據(jù)會(huì)話環(huán)境的不同,教學(xué)中的會(huì)話可以分為面對(duì)面會(huì)話和在線協(xié)作會(huì)話。面對(duì)面會(huì)話的典型形式即課堂教學(xué)會(huì)話,其研究已經(jīng)持續(xù)了很長(zhǎng)時(shí)間,并取得了豐碩的成果[16-19]。在線協(xié)作會(huì)話的典型形式則是利用各種同步、異步會(huì)話支持軟件支持學(xué)習(xí)者和教師進(jìn)行在線會(huì)話,以實(shí)現(xiàn)問題解決、知識(shí)建構(gòu)等認(rèn)知加工活動(dòng)。與課堂教學(xué)會(huì)話相比,在線協(xié)作會(huì)話情境更加豐富、主題更加多樣、內(nèi)容更為靈活,對(duì)其分析與挖掘也更為復(fù)雜[20]。研究者們嘗試從不同的角度對(duì)在線協(xié)作會(huì)話展開分析。代表性研究如Gunawardena等人提出的知識(shí)建構(gòu)五階段模型[21]、Garrison等人提出的探究社區(qū)模型(Community of Inquiry,COI)[22]、Newman等人提出的批判性思維編碼量表[23]等。這些模型在會(huì)話分析中得到了廣泛的應(yīng)用,并取得了大量的研究成果[24-25]。但這些研究主要通過(guò)手工編碼的方式開展,難以在大規(guī)模的對(duì)話語(yǔ)料中實(shí)現(xiàn),其主要原因在于未能建立起將上述模型與人工智能技術(shù)連接起來(lái)的有效方式和渠道。人工智能技術(shù)強(qiáng)調(diào)分析過(guò)程的自動(dòng)化和可計(jì)算;而會(huì)話分析本身服務(wù)于教育教學(xué),強(qiáng)調(diào)可理解、可應(yīng)用。這兩大研究領(lǐng)域從研究取向上雖然迥異,但可以完美互補(bǔ)。這兩個(gè)領(lǐng)域的結(jié)合,既可以拓展人工智能技術(shù)的應(yīng)用領(lǐng)域,又可以提升教育研究的效率和應(yīng)用范圍。但受限于自然語(yǔ)言本身的靈活性和復(fù)雜性,將人工智能技術(shù)應(yīng)用于在線協(xié)作會(huì)話的自動(dòng)分析尚處于起步階段,有待于進(jìn)一步探索。
鑒于此,本文擬提出一種人工智能技術(shù)支持的在線協(xié)作會(huì)話分析概念模型,整合人工智能技術(shù)分析方法與在線協(xié)作會(huì)話教學(xué)實(shí)踐,為可計(jì)算、可理解的在線協(xié)作會(huì)話分析提供參考和指導(dǎo)。
三、人工智能技術(shù)支持的在線
協(xié)作會(huì)話分析概念模型
(一)協(xié)作會(huì)話分析的重點(diǎn)與難點(diǎn)
與學(xué)習(xí)成績(jī)和問卷數(shù)據(jù)等結(jié)構(gòu)化數(shù)據(jù)相比,協(xié)作會(huì)話數(shù)據(jù)是典型的非結(jié)構(gòu)化數(shù)據(jù)。這一特征決定了協(xié)作會(huì)話數(shù)據(jù)中蘊(yùn)含著更多信息,能夠更全面、更深入地反映學(xué)習(xí)者的認(rèn)知過(guò)程和狀態(tài);但同時(shí),此類數(shù)據(jù)的自動(dòng)化分析難度更高,更多地依賴于人工進(jìn)行分析,且難以大規(guī)模開展。因此,在利用人工智能技術(shù)進(jìn)行協(xié)作會(huì)話的自動(dòng)化分析時(shí),需要注意以下重點(diǎn)和難點(diǎn):
1. 自然語(yǔ)言的復(fù)雜性
自然語(yǔ)言具有很高的自由度和靈活性,學(xué)習(xí)者能夠自由地表達(dá)自己的想法與觀點(diǎn)、深入地與教師和同伴進(jìn)行交流,從而實(shí)現(xiàn)知識(shí)建構(gòu)。但同時(shí),由于自然語(yǔ)言本身的復(fù)雜性,如詞匯邊界的界定(分詞)、歧義性、句法的模糊性、上下文的依賴性等均導(dǎo)致對(duì)自然語(yǔ)言的自動(dòng)化理解難以達(dá)到百分之百的準(zhǔn)確。近年來(lái),隨著詞向量、Bert模型等相關(guān)人工智能技術(shù)的快速發(fā)展,自然語(yǔ)言處理的準(zhǔn)確率得到了進(jìn)一步的提升,為將自然語(yǔ)言處理技術(shù)引入?yún)f(xié)作會(huì)話分析領(lǐng)域提供了技術(shù)基礎(chǔ)。
2. 教育情境的多樣性
在線協(xié)作會(huì)話具有情境多樣性的顯著特征,為其分析增加了難度。情境的多樣性主要體現(xiàn)在兩個(gè)方面:一是協(xié)作會(huì)話本身可能發(fā)生在不同的學(xué)習(xí)情境中,如圍繞某一主題的討論、答疑、協(xié)作完成人工制品、在線辯論等。不同的情境中學(xué)習(xí)者所使用的語(yǔ)言表達(dá)方式存在著顯著差異。二是學(xué)科不同也會(huì)導(dǎo)致協(xié)作會(huì)話的主題內(nèi)容存在顯著差異。人文類學(xué)科、理工類學(xué)科、藝術(shù)類學(xué)科均具有顯著的學(xué)科差異性,在學(xué)科術(shù)語(yǔ)、思辨方式、討論主題等方面存在巨大差異,也為在線協(xié)作會(huì)話的分析帶來(lái)了挑戰(zhàn)。
3. 研究結(jié)論的可解釋性
隨著深度學(xué)習(xí)模型的飛速發(fā)展,人工智能技術(shù)逐漸從探索進(jìn)入實(shí)用階段。但是大部分的深度學(xué)習(xí)模型均存在一個(gè)共同的不足,即模型的可解釋性不強(qiáng)。在教育研究中,可解釋性卻是一個(gè)非常重要的需求。其原因在于,教育研究不僅僅關(guān)注“果”(學(xué)生分類、學(xué)習(xí)成績(jī)等),也關(guān)注“因”(學(xué)習(xí)過(guò)程、學(xué)習(xí)者之間的差異等)。而根據(jù)“果”來(lái)分析“因”則要求模型具有較好的可解釋性,才可能由“果”及“因”,深入了解學(xué)習(xí)過(guò)程,從而為學(xué)習(xí)者提供智能化和個(gè)性化的指導(dǎo)。
(二)在線協(xié)作會(huì)話分析的概念模型
針對(duì)上述在線協(xié)作會(huì)話分析中的重點(diǎn)與難點(diǎn),本文提出了如圖1所示的在線協(xié)作會(huì)話分析概念模型。
該模型的核心是在線協(xié)作會(huì)話的分析流程,主要包括五個(gè)基本步驟:采集(采集原始會(huì)話數(shù)據(jù))、表征(數(shù)據(jù)量化與編碼)、提煉(構(gòu)建核心行為指標(biāo))、分析(分析對(duì)象的教與學(xué)特征)、應(yīng)用(提出教學(xué)改進(jìn)與建議)。每個(gè)步驟都有相應(yīng)的基本特征、常用方法和理論基礎(chǔ)。
1. 采集
在線環(huán)境中,會(huì)話數(shù)據(jù)可以方便快捷地運(yùn)用計(jì)算機(jī)技術(shù)進(jìn)行實(shí)時(shí)采集。目前常用的同步協(xié)作會(huì)話工具如QQ、微信等均具備批量數(shù)據(jù)導(dǎo)出功能,各類異步在線論壇也可以通過(guò)網(wǎng)絡(luò)爬蟲實(shí)現(xiàn)批量數(shù)據(jù)爬取。方便快捷的數(shù)據(jù)采集方式為大規(guī)模的在線協(xié)作會(huì)話分析提供了堅(jiān)實(shí)的數(shù)據(jù)基礎(chǔ)。
2. 表征
在線協(xié)作會(huì)話分析中,原始數(shù)據(jù)是以自然語(yǔ)言呈現(xiàn)的非結(jié)構(gòu)化文本,難以自動(dòng)理解和分析,必須將其轉(zhuǎn)為數(shù)值數(shù)據(jù)以供后續(xù)分析使用,這一過(guò)程被稱為表征。實(shí)現(xiàn)文本數(shù)據(jù)向數(shù)值數(shù)據(jù)轉(zhuǎn)換的方式是對(duì)數(shù)據(jù)進(jìn)行編碼和量化。編碼和量化的核心思想是以問題為導(dǎo)向,即:核心的研究問題決定著數(shù)據(jù)編碼與量化的方式,即:如何對(duì)數(shù)據(jù)進(jìn)行編碼和量化必須根據(jù)研究問題的需求來(lái)進(jìn)行選擇。相關(guān)語(yǔ)言學(xué)理論可以為該步驟提供理論支持。常用的方法則主要包括人工標(biāo)注、計(jì)算機(jī)支持的特征工程等。因此,該步驟可以在人工智能技術(shù)的支持下自動(dòng)或半自動(dòng)實(shí)現(xiàn)。
3. 提煉
提煉是將編碼量化后的特征數(shù)據(jù)進(jìn)一步加工和整理,形成能夠從教和學(xué)的角度解釋的核心行為指標(biāo),即將低層次的語(yǔ)言特征凝練為具有教學(xué)意義的行為特征。這一步是在線協(xié)作會(huì)話分析結(jié)果能夠?qū)崿F(xiàn)可解釋、可理解的重要基礎(chǔ),是數(shù)據(jù)與教學(xué)建立起聯(lián)結(jié)的重要橋梁。這一步驟計(jì)算機(jī)很難自動(dòng)實(shí)現(xiàn),必須要有學(xué)習(xí)分析專家的參與。專家根據(jù)教育學(xué)、認(rèn)知科學(xué)、學(xué)習(xí)分析科學(xué)等領(lǐng)域的相關(guān)理論,建立起圍繞研究問題的核心行為指標(biāo),并定義這些行為指標(biāo)與編碼量化后所形成的特征之間的映射關(guān)系,從而實(shí)現(xiàn)由低級(jí)特征向高級(jí)教學(xué)行為指標(biāo)的轉(zhuǎn)換。
4. 分析
分析指的是根據(jù)定義的核心行為指標(biāo),選擇合適的數(shù)據(jù)分析與挖掘方法,探索學(xué)習(xí)者在教與學(xué)方面的特征,從而發(fā)現(xiàn)潛在的學(xué)習(xí)模式、預(yù)測(cè)可能的學(xué)習(xí)結(jié)果等。常用的分析方法主要包括數(shù)據(jù)統(tǒng)計(jì)、數(shù)據(jù)挖掘算法等。其理論基礎(chǔ)主要依賴于人工智能等相關(guān)領(lǐng)域的基本理論,其過(guò)程則可以依賴于計(jì)算機(jī)技術(shù)自動(dòng)進(jìn)行。但需要注意的是,對(duì)分析結(jié)果的進(jìn)一步解釋需要結(jié)合數(shù)據(jù)發(fā)生的具體教育情境來(lái)進(jìn)行,需要領(lǐng)域?qū)<业闹С帧?/p>
5. 應(yīng)用
應(yīng)用指的是基于分析結(jié)果,向本次研究問題的利益相關(guān)者如教師、教育管理者、學(xué)習(xí)者等提供有效的教學(xué)建議,以期更好地提升教學(xué)效果和教學(xué)體驗(yàn)。該步驟必須依賴于領(lǐng)域?qū)<液蛯W(xué)習(xí)分析專家。領(lǐng)域?qū)<液蛯W(xué)習(xí)分析專家結(jié)合數(shù)據(jù)分析結(jié)果和教育情境中的具體上下文來(lái)給出教學(xué)或管理建議,提升研究結(jié)果的實(shí)踐應(yīng)用價(jià)值。
(三)概念模型的典型特征分析
為了更好地應(yīng)用上述概念模型,本文對(duì)其典型特征進(jìn)行了深入分析,指出該模型的典型特征如下:
1. 多學(xué)科交叉研究
模型強(qiáng)調(diào)在線協(xié)作會(huì)話分析是一個(gè)典型的多學(xué)科交叉的研究領(lǐng)域。對(duì)協(xié)作會(huì)話進(jìn)行編碼和量化涉及語(yǔ)言學(xué)的基本理論,如社會(huì)語(yǔ)言學(xué)、計(jì)算語(yǔ)言學(xué)、語(yǔ)言心理學(xué)、信息論等;構(gòu)建學(xué)習(xí)行為的核心指標(biāo)則涉及教育學(xué)、心理學(xué)、認(rèn)知科學(xué)、腦科學(xué)領(lǐng)域;對(duì)數(shù)據(jù)的分析主要借助于人工智能領(lǐng)域的相關(guān)分析與挖掘方法,涉及統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)的相關(guān)算法;對(duì)研究結(jié)論的解釋與應(yīng)用則依賴于學(xué)習(xí)科學(xué)、認(rèn)知心理學(xué)、教學(xué)系統(tǒng)設(shè)計(jì)等領(lǐng)域的理論與模型。
2. 問題導(dǎo)向的研究
教育教學(xué)問題是開展整個(gè)研究的核心,所有的研究過(guò)程都圍繞著某一確定的研究問題展開。該問題來(lái)源于在線協(xié)作會(huì)話的教學(xué)實(shí)踐,在多學(xué)科交叉研究方法的支持下得到相應(yīng)的研究結(jié)論后,又最終反哺于教育實(shí)踐,幫助教師和教育管理者更好地開展在線協(xié)作會(huì)話活動(dòng)。
3. 數(shù)據(jù)驅(qū)動(dòng)的研究范式
隨著人工智能技術(shù)和自然語(yǔ)言處理技術(shù)的飛速發(fā)展,對(duì)會(huì)話數(shù)據(jù)的自動(dòng)分析和處理已經(jīng)逐步達(dá)到了實(shí)用的程度。在人工智能技術(shù)的幫助下,會(huì)話數(shù)據(jù)可以轉(zhuǎn)化為具有特定意義的數(shù)值數(shù)據(jù),為進(jìn)一步的自動(dòng)化分析和處理提供數(shù)據(jù)基礎(chǔ)。因此,會(huì)話數(shù)據(jù)的分析也從質(zhì)性研究范式逐步轉(zhuǎn)變?yōu)閿?shù)據(jù)驅(qū)動(dòng)的研究范式。
四、在線協(xié)作會(huì)話分析典型應(yīng)用案例
(一)案例1:基于信息論的知識(shí)貢獻(xiàn)測(cè)量
1. 案例的研究問題與情境
本案例選自于Wu Linjing等撰寫的論文[26]。該案例的核心研究問題是如何自動(dòng)測(cè)量學(xué)習(xí)者在線協(xié)作會(huì)話中的知識(shí)貢獻(xiàn)。案例的研究情境是某師范大學(xué)“數(shù)據(jù)庫(kù)原理與應(yīng)用”課程的全體學(xué)生通過(guò)在線論壇圍繞教師發(fā)布的主題進(jìn)行在線討論,以達(dá)到對(duì)特定主題的一致觀點(diǎn)。案例共收集了6個(gè)討論主題下學(xué)生發(fā)表的204個(gè)主題討論帖。
為了探究學(xué)習(xí)者在協(xié)同討論過(guò)程中的知識(shí)貢獻(xiàn)情況,研究者引入了信息論模型中信息熵的概念,對(duì)在線協(xié)作會(huì)話過(guò)程中的話語(yǔ)數(shù)據(jù)進(jìn)行量化和編碼。通過(guò)借鑒信息熵理論中信息量和信息增益的概念,該案例定義了在線協(xié)作會(huì)話中利用信息量和信息增益來(lái)評(píng)價(jià)學(xué)習(xí)者知識(shí)貢獻(xiàn)的核心方法。以該方法為基礎(chǔ),案例進(jìn)一步探索了社區(qū)粒度和個(gè)體粒度的知識(shí)貢獻(xiàn)的分布特征,為教師和學(xué)習(xí)者開展在線協(xié)作會(huì)話活動(dòng)提供建議和參考。
2. 案例的研究流程與方法
該案例的研究流程如圖2所示。
在該案例中,研究者在網(wǎng)絡(luò)爬蟲的支持下,采集了異步在線討論中的全部討論數(shù)據(jù)作為研究的數(shù)據(jù)源。在表征階段,該案例從研究問題出發(fā),以信息論中信息系統(tǒng)的不確定性理論為指導(dǎo),確定了以關(guān)鍵詞的方式作為在線協(xié)作會(huì)話中所傳遞信息的基本表征。確定在線協(xié)作會(huì)話的表征方式之后,案例以知識(shí)建構(gòu)理論和認(rèn)知科學(xué)理論為基礎(chǔ),定義了測(cè)量知識(shí)貢獻(xiàn)的兩個(gè)核心行為指標(biāo):信息量和信息增益,并給出相應(yīng)的計(jì)算方法及其所代表的知識(shí)貢獻(xiàn)的具體意義?;谶@兩個(gè)核心行為指標(biāo),案例進(jìn)一步分析了在線協(xié)作會(huì)話中社區(qū)級(jí)別和個(gè)體級(jí)別的知識(shí)貢獻(xiàn)的特征和模式,以挖掘出協(xié)作會(huì)話數(shù)據(jù)中學(xué)習(xí)者知識(shí)貢獻(xiàn)的分布情況。其中,社區(qū)級(jí)別的知識(shí)貢獻(xiàn)特征通過(guò)函數(shù)擬合和可視化的方式進(jìn)行挖掘;個(gè)體級(jí)別的知識(shí)貢獻(xiàn)特征則通過(guò)聚類分析的方法進(jìn)行挖掘。分析挖掘出數(shù)據(jù)中有價(jià)值的信息之后,這些信息即可應(yīng)用于教育教學(xué)中,幫助教師、研究者和學(xué)習(xí)者識(shí)別出知識(shí)貢獻(xiàn)中的離群點(diǎn),并指導(dǎo)研討話題的組織和干預(yù),促進(jìn)和提升學(xué)習(xí)者的協(xié)同知識(shí)建構(gòu)。
3. 案例的基本結(jié)論
通過(guò)對(duì)在線協(xié)作會(huì)話中學(xué)習(xí)者知識(shí)貢獻(xiàn)的分析,案例繪制了每個(gè)主題隨著討論的不斷深入,其信息量的變化過(guò)程,并通過(guò)對(duì)數(shù)函數(shù)進(jìn)行擬合來(lái)測(cè)量話題的收斂情況。圖3中的子圖(a)和子圖(b)分別展示了兩個(gè)不同話題隨著時(shí)間進(jìn)展其信息量的變化情況。
從圖中可以看出,進(jìn)行對(duì)數(shù)函數(shù)擬合時(shí),圖(a)中的曲線的擬合程度要高于圖(b)中的曲線,具體體現(xiàn)為圖(a)中擬合的對(duì)數(shù)函數(shù)的斜率(0.178)要大于圖(b)的斜率(0.127)。相應(yīng)地,圖(a)中的曲線在會(huì)話后期開始出現(xiàn)逐漸平緩的趨勢(shì),說(shuō)明該話題隨著在線協(xié)作會(huì)話過(guò)程的深入逐漸達(dá)成相對(duì)一致的意見;而圖(b)中的曲線則一直呈現(xiàn)上升的趨勢(shì),意味著該話題尚未達(dá)成相對(duì)一致的意見,仍然處在意見發(fā)散的階段中。
對(duì)學(xué)習(xí)者知識(shí)貢獻(xiàn)的個(gè)體特征的挖掘使用的是聚類分析的方法。根據(jù)學(xué)習(xí)者在在線協(xié)作會(huì)話中知識(shí)貢獻(xiàn)的差異性,學(xué)習(xí)者被聚類為5個(gè)類別:主動(dòng)貢獻(xiàn)者(Active Students)、優(yōu)秀貢獻(xiàn)者(Excellent Students)、自我專注型貢獻(xiàn)者(Self-involved Students)、復(fù)讀機(jī)型貢獻(xiàn)者(Repeaters)和消極貢獻(xiàn)者(Passive Students)。針對(duì)不同類型的學(xué)習(xí)者,教師可以提供更加富有針對(duì)性的建議和指導(dǎo)。
(二)案例2:基于語(yǔ)義的協(xié)作會(huì)話學(xué)習(xí)投入自動(dòng)分析
1. 案例的研究問題與情境
該案例選自于論文“基于語(yǔ)義的在線協(xié)作會(huì)話學(xué)習(xí)投入自動(dòng)分析模型及應(yīng)用研究”[27]。案例的核心研究問題是如何自動(dòng)分析學(xué)習(xí)者在線協(xié)作會(huì)話中的學(xué)習(xí)投入。研究情境是某師范大學(xué)“現(xiàn)代教育技術(shù)”課程的全體學(xué)生在疫情防控期間通過(guò)QQ群進(jìn)行在線討論、答疑和輔導(dǎo)等在線協(xié)作會(huì)話活動(dòng)。在整個(gè)課程學(xué)習(xí)過(guò)程中,學(xué)習(xí)者在QQ群中共發(fā)表有效信息2489條,包含教師發(fā)言294條。
為了探究學(xué)習(xí)者在協(xié)作會(huì)話過(guò)程中的學(xué)習(xí)投入,該案例根據(jù)心理語(yǔ)言學(xué)的基本理論,定義了一系列在線協(xié)作會(huì)話的語(yǔ)義心理特征,為會(huì)話數(shù)據(jù)的量化和表征提供了基礎(chǔ)。完成數(shù)據(jù)的量化表征之后,案例基于學(xué)習(xí)行為投入理論定義了五個(gè)核心的學(xué)習(xí)投入維度,分別為認(rèn)知投入、情感投入、行為投入、社交投入和感知投入;并進(jìn)一步定義了這五個(gè)維度與會(huì)話的語(yǔ)義心理特征之間的映射關(guān)系,從而保證了這些維度的可理解與可計(jì)算。
2. 案例的研究流程與方法
該案例的研究流程如圖4所示。
在案例中,用于支持學(xué)習(xí)者的在線協(xié)作會(huì)話的平臺(tái)是QQ平臺(tái),該軟件提供所有對(duì)話記錄的導(dǎo)出功能,可以方便快捷地進(jìn)行數(shù)據(jù)采集。在數(shù)據(jù)的量化與表征階段,案例以語(yǔ)言心理學(xué)理論為基礎(chǔ),提取會(huì)話文本的語(yǔ)義心理特征和學(xué)習(xí)者的行為特征。其提取方式是由計(jì)算機(jī)自動(dòng)進(jìn)行的,其中語(yǔ)義心理特征通過(guò)文本分析軟件“文心分析系統(tǒng)”自動(dòng)提??;基本行為特征則通過(guò)對(duì)導(dǎo)出的會(huì)話日志文件進(jìn)行自動(dòng)分析和統(tǒng)計(jì)來(lái)獲得。在提煉階段,案例以學(xué)習(xí)分析理論和學(xué)習(xí)投入模型為理論基礎(chǔ),定義了在線協(xié)作會(huì)話中學(xué)習(xí)投入的五大核心維度指標(biāo),分別為認(rèn)知投入、情感投入、行為投入、社交投入和感知投入,并進(jìn)一步定義了此五大核心維度指標(biāo)與語(yǔ)義心理特征和基本行為特征之間的映射關(guān)系。這種映射關(guān)系建立起了人工智能研究范式與教育研究范式之間的橋梁,保證了五大核心維度指標(biāo)既具有明確的教育教學(xué)意義,又可以通過(guò)計(jì)算機(jī)進(jìn)行自動(dòng)識(shí)別和抽取,從而實(shí)現(xiàn)了指標(biāo)的可理解與可計(jì)算?;谠撐宕蠛诵闹笜?biāo),案例進(jìn)一步運(yùn)用聚類分析方法對(duì)學(xué)習(xí)者的學(xué)習(xí)投入模式進(jìn)行了挖掘,并針對(duì)不同的學(xué)習(xí)投入模式提供個(gè)性化的學(xué)習(xí)干預(yù)。
3. 案例的研究結(jié)論
通過(guò)聚類分析,案例挖掘出了五種典型的學(xué)習(xí)投入模式,分別是高投入高產(chǎn)出、高投入中產(chǎn)出、高認(rèn)知投入中產(chǎn)出、中投入中產(chǎn)出和低投入低產(chǎn)出。針對(duì)每種不同的模式,該案例詳細(xì)論述了相應(yīng)學(xué)習(xí)者在學(xué)習(xí)投入上的表現(xiàn)特征,并給出了相應(yīng)的針對(duì)性的教學(xué)策略。如第二類高投入中產(chǎn)出型學(xué)習(xí)者,他們?cè)趯W(xué)習(xí)投入的各維度上均處于較高水平,但學(xué)習(xí)成績(jī)卻略低于優(yōu)秀學(xué)習(xí)者,且在協(xié)作會(huì)話過(guò)程中存在較長(zhǎng)的沉默期。針對(duì)此類學(xué)習(xí)者,相應(yīng)的教學(xué)策略為注重學(xué)習(xí)方法的引導(dǎo),幫助其提升學(xué)習(xí)效率,讓學(xué)習(xí)投入能夠更加有效地轉(zhuǎn)化為學(xué)習(xí)績(jī)效;關(guān)注沉默期,當(dāng)沉默期出現(xiàn)時(shí),注意適當(dāng)提醒并激發(fā)其學(xué)習(xí)興趣。
五、結(jié) ? 語(yǔ)
人工智能技術(shù)為教育研究領(lǐng)域注入了新的活力和機(jī)遇,但如何更好地利用人工智能技術(shù)促進(jìn)在線協(xié)作會(huì)話的分析尚處在起步階段,仍有大量的疑問有待進(jìn)一步探索。本文從人工智能技術(shù)的視角出發(fā),深入分析了在線協(xié)作會(huì)話分析中的重點(diǎn)和難點(diǎn),并進(jìn)一步提出了人工智能技術(shù)支持的在線協(xié)作會(huì)話分析的概念模型。該模型以“可計(jì)算”和“可理解”為核心,詳細(xì)建構(gòu)了在線協(xié)作會(huì)話分析的基本特征、理論基礎(chǔ)、分析流程和常用方法。該模型嘗試搭建人工智能技術(shù)與協(xié)作會(huì)話分析之間的通用性橋梁,以提升協(xié)作會(huì)話分析的效率,為大規(guī)模在線協(xié)作會(huì)話語(yǔ)料的自動(dòng)化分析提供可能。為了說(shuō)明模型的有效性,本文選擇了兩個(gè)應(yīng)用人工智能技術(shù)開展協(xié)作會(huì)話分析的典型案例,從案例的研究問題與情境、研究流程與方法、案例的基本結(jié)論等方面進(jìn)行了詳細(xì)的分析和論述,為概念模型的實(shí)踐應(yīng)用提供了參考。文章也存在一些不足之處,選擇的典型案例的數(shù)量較少,其應(yīng)用范圍仍有待進(jìn)一步拓展。后續(xù)將就模型的進(jìn)一步深化和更為廣泛的應(yīng)用展開探索。
[參考文獻(xiàn)]
[1] ROSE C P. Artificial intelligence: a social spin on language analysis[J]. Nature, 2017, 545(7653): 166-167.
[2] 吳林靜,劉清堂,毛剛,等. 大數(shù)據(jù)視角下的慕課評(píng)論語(yǔ)義分析模型及應(yīng)用研究[J]. 電化教育研究,2017(11):43-48.
[3] 張文梅,祁彬斌,范文翔. 數(shù)據(jù)驅(qū)動(dòng)的教學(xué)行為分析:現(xiàn)狀、邏輯與發(fā)展趨向[J]. 遠(yuǎn)程教育雜志,2021,39(1):84-93.
[4] 黃昌勤,涂雅欣,俞建慧,等.數(shù)據(jù)驅(qū)動(dòng)的在線學(xué)習(xí)倦怠預(yù)警模型研究與實(shí)現(xiàn)[J].電化教育研究,2021,42(2):47-54.
[5] 黃濤,王一巖,張浩,等. 數(shù)據(jù)驅(qū)動(dòng)的區(qū)域教育質(zhì)量分析模型與實(shí)現(xiàn)路徑[J]. 中國(guó)電化教育,2019(8):30-36.
[6] 岳增營(yíng),葉霞,劉睿珩. 基于語(yǔ)言模型的預(yù)訓(xùn)練技術(shù)研究綜述[J]. 中文信息學(xué)報(bào),2021,35(9):15-29.
[7] 江洋洋,金伯,張寶昌. 深度學(xué)習(xí)在自然語(yǔ)言處理領(lǐng)域的研究進(jìn)展[J]. 計(jì)算機(jī)工程與應(yīng)用,2021,57(22):1-14.
[8] SIEMENS G. What are learning analytics[DB/OL]. (2010-08-25)[2022-10-22]. http://www.elearnspace.org/blog/2010/08/25/what-are-learning-analytics/.
[9] 李新,李艷燕,包昊罡,等. 學(xué)習(xí)投入測(cè)評(píng)新發(fā)展:從單維分析到多模態(tài)融合[J]. 電化教育研究,2021,42(10):100-107.
[10] 高喻,吳林靜,王慧敏,等.協(xié)作學(xué)習(xí)中學(xué)習(xí)者自我調(diào)節(jié)學(xué)習(xí)模式挖掘與軌跡分析[J].電化教育研究,2022,43(7):89-96,105.
[11] 陳雅云, 郭勝男,馬曉玲,等. 數(shù)智融合時(shí)代學(xué)習(xí)分析技術(shù)的演進(jìn)、貢獻(xiàn)與展望——2021學(xué)習(xí)分析與知識(shí)國(guó)際會(huì)議(LAK)評(píng)述[J]. 遠(yuǎn)程教育雜志,2021,39(4): 3-15.
[12] WING J M. Computational thinking[J]. Communications of the ACM, 2006, 49(3): 33-35.
[13] 何華燦. 重新找回人工智能的可解釋性[J]. 智能系統(tǒng)學(xué)報(bào),2019,14(3):393-412.
[14] 陳德旺,蔡際杰,黃允滸. 面向可解釋性人工智能與大數(shù)據(jù)的模糊系統(tǒng)發(fā)展展望[J]. 智能科學(xué)與技術(shù)學(xué)報(bào),2019,1(4):327-334.
[15] 成科揚(yáng),王寧,師文喜,等. 深度學(xué)習(xí)可解釋性研究進(jìn)展[J]. 計(jì)算機(jī)研究與發(fā)展, 2020,57(6):1208-1217.
[16] 顧明遠(yuǎn). 教育大辭典:增訂合編本.上[M]. 上海:上海教育出版社,1998.
[17] HINDS J. Towards an analysis of discourse: the English used by teachers and pupils by J. McH. Sinclair and R. M. Coulthard[J]. Studies in language, 1979, 3(1): 129-133.
[18] 顧小清,王煒. 支持教師專業(yè)發(fā)展的課堂分析技術(shù)新探索[J]. 中國(guó)電化教育,2004(7):18-21.
[19] 程云,劉清堂,王艷麗,等. 課堂教學(xué)行為分析云模型的構(gòu)建與應(yīng)用研究[J]. 遠(yuǎn)程教育雜志,2017,35(2):36-42.
[20] 王阿習(xí),王旭. 整合會(huì)話分析與文本挖掘技術(shù)來(lái)評(píng)價(jià)協(xié)作學(xué)習(xí)——訪談卡耐基梅隆大學(xué)著名教授卡洛琳·佩恩斯坦·羅澤[J]. 現(xiàn)代遠(yuǎn)程教育研究,2017(6):3-10.
[21] GUNAWARDENA C N, LOWE C A, ANDERSON T. Analysis of a global online debate and the development of an interaction analysis model for examining social construction of knowledge in computer conferencing[J]. Journal of educational computing research, 1997, 17(4): 397-431.
[22] GARRISON D R, ANDERSON T, ARCHER W. Critical thinking, cognitive presence, and computer conferencing in distance education[J]. American journal of distance education, 2001, 15(1): 7-23.
[23] NEWMAN D R. A content analysis method to measure critical thinking in face-to-face and computer supported group learning[J]. Interpersonal computing and technology, 1995, 3(2): 56-77.
[24] 賈利鋒,李海龍. 臨場(chǎng)感對(duì)在線學(xué)習(xí)者學(xué)習(xí)認(rèn)知的影響——基于探究社區(qū)理論的條件過(guò)程分析[J].電化教育研究,2020,41(2):45-52.
[25] 柳晨晨,于澎,侯潔蕊,等.在線學(xué)習(xí)中互動(dòng)討論模式如何影響學(xué)習(xí)者的批判性思維[J].電化教育研究,2021,42(3):48-54,61.
[26] WU L, LI J, LIU Q, et al. Information measures of knowledge contribution: a new method to measure knowledge contribution in collaborative knowledge building: an information theory perspective[J]. Journal of educational computing research, 2021, 59(7): 1319-1342.
[27] 吳林靜,高喻,劉清堂,等. 基于語(yǔ)義的在線協(xié)作會(huì)話學(xué)習(xí)投入自動(dòng)分析模型及應(yīng)用研究[J]. 電化教育研究,2022(3):77-84.
Online Collaborative Conversation Analysis from Perspective of Artificial Intelligence: Conceptual Model and Its Application
WU Linjing, ?TU Fengjiao, ?MA Xinqian, ?GAO Yu, ?LIU Qingtang
(School of Educational Information Technology, Faculty of Artificial Intelligence Education, Central China Normal University, Wuhan Hubei 430079)
[Abstract] Learners' collaborative conversation data is an important type of data for in-depth understanding their learning process and cognitive state. However, due to the flexibility of natural language and the complexity of learning contexts, the degree of automation of collaborative conversation data analysis is not high, and the data is difficult to be applied on a large scale. From the perspective of artificial intelligence, this paper constructs a conceptual model of online collaborative conversation analysis based on artificial intelligence technology, and discusses the theoretical basis, basic features, analysis process and common methods of online collaborative conversation analysis. Two typical cases of online collaborative conversation analysis, "Information Theory-based Knowledge Contribution Measurement" and "Semantic-based Automatic Analysis of Collaborative Conversation Learning Engagement", are further analyzed in detail. The cases demonstrate that this model can combine the "computability" of artificial intelligence technology with the "comprehensibility" of educational research, and build a bridge for the integration of artificial intelligence technology and collaborative conversation analysis, which is an important guide and reference for the practice of online collaborative conversation analysis.
[Keywords] Online Collaborative Conversation; Artificial Intelligence; Conceptual Model; Computability; Comprehensibility