劉 浩,劉笑笑,辛 濤
北京師范大學(xué) 中國基礎(chǔ)教育質(zhì)量監(jiān)測協(xié)同創(chuàng)新中心,北京 100875
隨著機(jī)器學(xué)習(xí)和深度學(xué)習(xí)驅(qū)動人工智能技術(shù)飛速發(fā)展,多個國家已將人工智能提升到國家戰(zhàn)略高度。美國于2020年頒布了《為人工智能的未來做好準(zhǔn)備》和《國家人工智能研發(fā)戰(zhàn)略規(guī)劃》,歐盟委員會與歐洲機(jī)器人協(xié)會合作頒布了“SPARC”機(jī)器人創(chuàng)新計劃。隨著人工智能賦能教育的影響逐步加深,我國在2017年7月8日發(fā)布了《新一代人工智能發(fā)展規(guī)劃》,并指出要發(fā)展智能教育,利用智能技術(shù)加快推動人才培養(yǎng)模式、教學(xué)方法改革,構(gòu)建包含智能學(xué)習(xí)、交互式學(xué)習(xí)的新型教育體系(1)《國務(wù)院關(guān)于印發(fā)新一代人工智能發(fā)展規(guī)劃的通知》,2017年7月8日,http://www.moe.gov.cn/s78/A16/s5886/xtp_left/s5895/201708/t20170830_312730.html,2021年7月15日。。2018年,教育部印發(fā)的《教育信息化2.0行動計劃》提出“智能化”將成為教育信息化體系建設(shè)五大方向之一,促進(jìn)教育信息化從融合應(yīng)用向創(chuàng)新發(fā)展的高階演進(jìn),信息技術(shù)和智能技術(shù)深度融入教育全過程,推動改進(jìn)教學(xué)、優(yōu)化管理、提升績效(2)《教育部關(guān)于印發(fā)〈教育信息化2.0行動計劃〉的通知》,2018年4月18日,http://www.moe.gov.cn/srcsite/A16/s3342/201804/t20180425_334188.html,2021年7月15日。。2019年,聯(lián)合國教科文組織發(fā)布的《教育中的人工智能:可持續(xù)發(fā)展的挑戰(zhàn)與機(jī)遇》在運(yùn)用人工智能推動教育變革等問題上達(dá)成共識。當(dāng)前,人工智能技術(shù)為教育評價提供了新思路與新手段,開啟并塑造了教育評價的新形態(tài)。人工智能在學(xué)習(xí)預(yù)測與教學(xué)評價中的應(yīng)用,可以實(shí)現(xiàn)動態(tài)監(jiān)測和智能分析。然而,目前人工智能應(yīng)用在基礎(chǔ)教育監(jiān)測領(lǐng)域中的優(yōu)勢體現(xiàn)還不夠充分,在研究與應(yīng)用中未形成系統(tǒng)高效的應(yīng)用體系。要全面透徹地分析人工智能對基礎(chǔ)教育監(jiān)測的作用,必須從人工智能的智能控制、自然語言處理、機(jī)器學(xué)習(xí)及深度學(xué)習(xí)算法等方面全面系統(tǒng)地進(jìn)行剖析,從“經(jīng)驗(yàn)主義”走向“數(shù)據(jù)主義”,從“宏觀群體”評價走向“微觀個體”評價,從“單一評價”走向“綜合評價”,促進(jìn)人工智能技術(shù)在教育監(jiān)測中的深入應(yīng)用。
1.題庫建設(shè)與智能化組卷
題庫建設(shè)是基于教育測量學(xué)、統(tǒng)計學(xué)和信息技術(shù)三門學(xué)科交叉融合的基礎(chǔ)上,主要應(yīng)用經(jīng)典測量理論(CTT)和項(xiàng)目反應(yīng)理論(IRT),并逐步向計算機(jī)自適應(yīng)測試(CAT)發(fā)展。題庫建設(shè)的具體內(nèi)容主要包括:題目命制技術(shù)、試題分類與抽樣、試題分析、參數(shù)等值等技術(shù)。例如,基礎(chǔ)教育監(jiān)測題庫命制技術(shù)主要涉及開發(fā)、編制、篩選、評價等方面,既需要題目命制的原則和方法,也需要提供試題的評價標(biāo)準(zhǔn)。伴隨著信息技術(shù)的發(fā)展和我國基礎(chǔ)教育監(jiān)測相關(guān)技術(shù)的日漸成熟,在教育測量學(xué)等理論的指導(dǎo)下,人工智能可以實(shí)現(xiàn)計算機(jī)題庫的智能化管理,如可以依據(jù)能力目標(biāo)、知識內(nèi)容、題型功能等方面實(shí)現(xiàn)對監(jiān)測工具的自動分類,并對試題進(jìn)行預(yù)測。
題庫建設(shè)需要明確試題對應(yīng)的考查目標(biāo),且同一考查目標(biāo)需要包含多道經(jīng)過等值技術(shù)處理的試題。題庫建設(shè)技術(shù)建立在對自然語言理解的基礎(chǔ)上,即根據(jù)用戶的需要搜索試題并組成符合要求的試卷,實(shí)現(xiàn)這一要求的前提是題庫的每一道試題都能恰當(dāng)?shù)乇碚?。在表征試題的基礎(chǔ)上,題庫建設(shè)還需要構(gòu)建一個搜索系統(tǒng),包括規(guī)則庫、綜合數(shù)據(jù)庫和控制系統(tǒng)(3)蔣培杰、熊斌:《人工智能賦能大規(guī)模教育考試五步曲》,《中國考試》,2020年第12期。。題庫建設(shè)的最終目的是實(shí)現(xiàn)智能化組卷,在智能化組卷過程中,從含有大量試題的題庫中選取一定數(shù)目的試題,組成一份滿足特定考試目標(biāo)要求的試卷。試題編制合理且能反映考試要求,難度層次分明、區(qū)分度良好。相較于傳統(tǒng)的人工組卷,智能化組卷效率更高,根據(jù)組卷的原則、試卷評價指標(biāo)和指標(biāo)間關(guān)系構(gòu)建組卷模型,再利用隨機(jī)算法、回溯法、遺傳算法和粒子群等人工智能算法自動生成符合標(biāo)準(zhǔn)的試卷。自動組卷實(shí)質(zhì)上是在試題庫內(nèi)自動挑選出一個滿足條件的子集。目前通用的組卷方法是隨機(jī)選取法,即在題庫中隨機(jī)搜索滿足約束條件的試題,直到整個試卷各項(xiàng)指標(biāo)滿足要求,由于各項(xiàng)指標(biāo)之間的制約關(guān)系,這種方法往往需要進(jìn)行多次回溯,組卷效率不高,成功率較低(4)周紅曉:《遺傳算法在試題庫智能組卷中的應(yīng)用》,《浙江師范大學(xué)學(xué)報(自然科學(xué)版)》,2003年第4期。。遺傳算法是一種模擬自然界生物進(jìn)行過程的計算模型,它以適應(yīng)度函數(shù)值作為搜索信息,使用群體搜索技術(shù),搜索過程具有很大的靈活性,并且具有隨機(jī)性、自適應(yīng)性和并行性的特點(diǎn),以其良好的智能搜索技術(shù),得到了廣泛的應(yīng)用(5)周明、孫樹棟:《遺傳算法原理及應(yīng)用》,北京:國防工業(yè)出版社,2002年,第89頁。。不同算法在難易程度、求解速度、組卷質(zhì)量和題庫規(guī)模適應(yīng)性上各有優(yōu)劣,在基礎(chǔ)教育監(jiān)測的實(shí)際應(yīng)用中,需要根據(jù)問題的實(shí)際情況,選擇合適的算法進(jìn)行適當(dāng)?shù)母倪M(jìn)或組合。通過高質(zhì)量高效率的智能化組卷,更精準(zhǔn)有效地診斷學(xué)生的能力水平。
2.智能化測評與診斷
人工智能作用于基礎(chǔ)教育監(jiān)測的測評與診斷,主要表現(xiàn)在基于大數(shù)據(jù)可視化技術(shù)及深度學(xué)習(xí)技術(shù),形成評價結(jié)果的智能診斷及預(yù)警分析模型。智能化測評與診斷是通過人工智能的方式評估學(xué)習(xí)者的發(fā)展,利用人工智能對經(jīng)過數(shù)字化處理的教學(xué)過程、教學(xué)數(shù)據(jù)進(jìn)行測評與分析。以往的測評是題目導(dǎo)向型,以學(xué)生成績和升學(xué)率為評價標(biāo)準(zhǔn),現(xiàn)在的導(dǎo)向逐步由知識轉(zhuǎn)向核心素養(yǎng)。測評核心素養(yǎng)的內(nèi)涵與維度在不斷發(fā)展和深化,對學(xué)生的能力要求也更加全面,進(jìn)而要求測評工具的多樣化。智能化測評已經(jīng)在學(xué)生能力和知識水平評估、人格與心理健康評估以及教學(xué)過程評估等方面取得進(jìn)展:學(xué)生能力和知識水平評估突破紙筆測驗(yàn)的局限,轉(zhuǎn)向過程性評價、綜合能力評價和動態(tài)性評價;人格與心理健康評估擺脫了對自陳量表法的依賴,依據(jù)多模態(tài)數(shù)據(jù)有望實(shí)現(xiàn)無痕式和伴隨式評估;智能分析技術(shù)助力教學(xué)反饋,使教學(xué)過程評估更加直接、便捷和精準(zhǔn)(6)駱方、田雪濤、屠焯然、姜力銘:《教育評價新趨向:智能化測評研究綜述》,《現(xiàn)代遠(yuǎn)程教育研究》,2021年第5期。。
智能化測評是新興測評手段的重要體現(xiàn)。語義分析技術(shù)、語言識別技術(shù)和光學(xué)字符識別技術(shù)的發(fā)展是智能化測評與診斷的關(guān)鍵技術(shù)。例如,在教育監(jiān)測中針對音樂學(xué)科進(jìn)行智能電子化測試,通過系統(tǒng)開發(fā),建立學(xué)校版本系統(tǒng)和區(qū)縣版本系統(tǒng),在數(shù)據(jù)上傳之后,根據(jù)制定的機(jī)評標(biāo)準(zhǔn),基于語音合成、語音評測等智能語音技術(shù)和虛擬現(xiàn)實(shí)、模擬人機(jī)對話的客觀評價技術(shù)進(jìn)行分析測評,實(shí)現(xiàn)了語音數(shù)據(jù)的采集、儲存、結(jié)果評分的一體化和智能化。智能化測評相較于傳統(tǒng)的教學(xué)測評,在對學(xué)習(xí)者診斷時表現(xiàn)出的優(yōu)勢主要體現(xiàn)在兩個方面:一方面,智能化測評通過大量的學(xué)習(xí)數(shù)據(jù)對每個學(xué)習(xí)者進(jìn)行建模,結(jié)合知識圖譜和智能算法,將評價貫穿于教學(xué)活動的始終,更加關(guān)注學(xué)習(xí)者整體、全面的發(fā)展。另一方面,智能測評通過機(jī)器批閱作業(yè),快速給予學(xué)生反饋并提出針對性的學(xué)習(xí)指導(dǎo),從而更好地激發(fā)學(xué)生的學(xué)習(xí)積極性。在智能化測評賦能基礎(chǔ)教育監(jiān)測的過程中,為測試工具的開發(fā)及監(jiān)測手段的創(chuàng)新帶來了新的啟示,通過利用相關(guān)算法模型及時給出測評結(jié)果與反饋,實(shí)現(xiàn)對學(xué)習(xí)者學(xué)習(xí)表現(xiàn)的實(shí)時監(jiān)測,并針對他們的學(xué)習(xí)表現(xiàn)給予適當(dāng)?shù)脑u價,讓每位學(xué)生了解自己的發(fā)展水平和優(yōu)勢。通過獲取國家不同區(qū)域?qū)用娴膶W(xué)生個性化的教育監(jiān)測過程數(shù)據(jù),更有利于高效精準(zhǔn)把握區(qū)縣基礎(chǔ)教育發(fā)展水平,為國家基礎(chǔ)教育質(zhì)量改革與提升提供重要的科學(xué)依據(jù)。
3.智能化閱卷
傳統(tǒng)閱卷中,因考生數(shù)量大、評卷工作時間長、工作強(qiáng)度高,評卷教師在評分過程中極易感到身心疲憊,評分主觀性強(qiáng)。在智能化閱卷中,智能化閱卷系統(tǒng)不會受到個人情緒等主觀或不確定因素的影響,在節(jié)省人力成本提高閱卷效率的同時,在很大程度上能夠保證評分的客觀公正性。智能化閱卷能夠提供客觀的第三方質(zhì)量評價標(biāo)準(zhǔn),管理部門和學(xué)科評卷之間對評卷質(zhì)量的監(jiān)控和評價,能夠由單一的網(wǎng)上評卷系統(tǒng)按照技術(shù)規(guī)范進(jìn)行質(zhì)量監(jiān)控,上升到通過計算機(jī)智能評分來逐一對比計算人工評分的準(zhǔn)確程度并進(jìn)行統(tǒng)計分析,對形成多樣化的評卷質(zhì)量監(jiān)控體系具有重要意義(7)楊現(xiàn)民、王榴卉、唐斯斯:《教育大數(shù)據(jù)的應(yīng)用模式與政策建議》,《電化教育研究》,2015年第9期。。智能化閱卷所具有的減輕人力負(fù)擔(dān)、準(zhǔn)確率高和具備第三方質(zhì)量評價等優(yōu)點(diǎn),為基礎(chǔ)教育監(jiān)測的閱卷系統(tǒng)開發(fā)、閱卷效率的提高和監(jiān)測規(guī)模的擴(kuò)大提供了重要的技術(shù)支持和保障。
人工智能作用于基礎(chǔ)教育監(jiān)測的閱卷評分,主要是結(jié)合智能分析技術(shù),有效地輔助教育質(zhì)量評價的過程。智能化閱卷是通過對考生答卷進(jìn)行圖像識別、文字提取與轉(zhuǎn)寫、關(guān)鍵特征提取、文本內(nèi)容分析,依據(jù)專家評分標(biāo)準(zhǔn)和機(jī)器評分模型,實(shí)現(xiàn)對考生答題內(nèi)容的自動評分。智能化閱卷可以分為人工特征方案和深度學(xué)習(xí)方案兩個主要方向,人工特征方案是使用淺層語言學(xué)特征分析法,先對試題評分標(biāo)準(zhǔn)提取相關(guān)特征進(jìn)行定義,然后自動抽取考生答卷樣本的信息,并將其對應(yīng)到先前定義的相應(yīng)特征,基于統(tǒng)計數(shù)據(jù),完成對樣本答卷的評分;深度學(xué)習(xí)方案主要是通過多引層的神經(jīng)網(wǎng)絡(luò)自動抽取與評分標(biāo)準(zhǔn)相關(guān)的特征,在多個維度上建立起對待評樣本的完整數(shù)學(xué)模型,并進(jìn)行匹配評分(8)何屹松、 孫媛媛、 汪張龍:《人工智能評測技術(shù)在大規(guī)模中英文作文閱卷中的應(yīng)用探索》,《中國考試》,2018年第6期。。基于自然語言理解基礎(chǔ)的發(fā)展,無論是漢字識別還是英語識別,人工智能都具有良好的識別效果,與傳統(tǒng)閱卷相比,智能化閱卷的準(zhǔn)確性更高?;谌B接型的卷積神經(jīng)網(wǎng)絡(luò)(Fully Connectted Convolutional Neural Networks)的版面分析理解和文字識別技術(shù)核心算法使得計算機(jī)智能閱卷評分系統(tǒng)已經(jīng)形成了一套完善的“端到端”(圖片直接輸入,文字識別直接輸出)的識別處理方案(9)S.Evan,L.Jonathan,D.Trevor,“Fully Convolutional Networks for Semantic Segmentation”,IEEE Transactions on Pattern Analysis and Machine Intelligence,2017,39(4),pp.640-652.。智能評測技術(shù)對填空題和作文類主觀題的閱卷優(yōu)勢較為明顯。填空題的智能化閱卷步驟主要包括圖片預(yù)處理、手寫體圖文識別和機(jī)器對比答案判別等;作文類主觀題智能化閱卷需將圖片轉(zhuǎn)化為文本,通過專家定標(biāo)評分,訓(xùn)練評分模型,再利用多維度計算機(jī)智能評分技術(shù)即可得到人機(jī)結(jié)合的評分結(jié)果。以作文評分為例,首先對每篇文本進(jìn)行詞向量轉(zhuǎn)化,將自然語言數(shù)值向量化,轉(zhuǎn)化為計算機(jī)可識別的語言,再提取各維度的特征,如字跡工整程度、詞匯豐富度等,然后將這些向量化后的文本特征數(shù)據(jù)作為特征空間,以專家評分作為輸出空間,通過機(jī)器學(xué)習(xí)算法訓(xùn)練,獲得當(dāng)次考試的評分模型,實(shí)現(xiàn)智能化閱卷。智能化閱卷的作用主要體現(xiàn)在:閱卷過程實(shí)現(xiàn)降本增效;智能甄別抄襲、套題等虛假結(jié)果;智能評分更加客觀穩(wěn)定;評分過程有跡可循等(10)《2021智能教育發(fā)展藍(lán)皮書》編寫組:《2021智能教育發(fā)展藍(lán)皮書——智能技術(shù)賦能教育評價》,合肥:訊飛教育技術(shù)研究院,2021年,第8-9頁。。智能化閱卷在基礎(chǔ)教育監(jiān)測應(yīng)用中體現(xiàn)出的優(yōu)勢和作用,很大程度上保證了閱卷的效率、科學(xué)性和公平性。
4.智能化分析決策與評價
人工智能作用于基礎(chǔ)教育監(jiān)測的分析決策與評價,具體表現(xiàn)在運(yùn)用大數(shù)據(jù)建立各級數(shù)據(jù)分析模型,建立可視化分析工具,給出科學(xué)的評價結(jié)果,對其中存在的整體與局部問題進(jìn)行分析并做出科學(xué)決策。教育數(shù)據(jù)挖掘(Educational Data Mining)是綜合運(yùn)用數(shù)學(xué)統(tǒng)計、機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘等技術(shù)和方法,對教育大數(shù)據(jù)進(jìn)行處理和分析,通過數(shù)據(jù)建模,發(fā)現(xiàn)學(xué)習(xí)者學(xué)習(xí)結(jié)果與學(xué)習(xí)內(nèi)容、學(xué)習(xí)資源和教學(xué)行為等變量之間的相關(guān)關(guān)系,來預(yù)測學(xué)習(xí)者未來學(xué)習(xí)趨勢的方法(11)徐鵬、 王以寧、 劉艷華:《大數(shù)據(jù)視角分析學(xué)習(xí)變革——美國〈通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進(jìn)教與學(xué)〉報告解讀及啟示》,《遠(yuǎn)程教育雜志》,2013年第6期。。智能化分析決策則基于教育數(shù)據(jù)挖掘,通過機(jī)器學(xué)習(xí)和深度學(xué)習(xí),按照測評目的和需求編輯數(shù)據(jù)分析架構(gòu),智能化生成偏向于數(shù)據(jù)分析的報告并用于決策。
在《深化新時代教育評價改革總體方案》政策文件的指引下,未來基礎(chǔ)教育監(jiān)測趨勢必然走向評價方式多元化。人工智能可以根據(jù)教育監(jiān)測的形態(tài)及其指標(biāo),如監(jiān)測學(xué)科數(shù)據(jù)的層次性、監(jiān)測設(shè)計的模塊化和監(jiān)測學(xué)科項(xiàng)目選擇的個性化等方面,設(shè)定好計算機(jī)可識別的評價標(biāo)準(zhǔn)和相應(yīng)的算法,按照評價標(biāo)準(zhǔn)自動對監(jiān)測數(shù)據(jù)進(jìn)行分析評價。借助仿真實(shí)現(xiàn)人機(jī)結(jié)合、數(shù)據(jù)驅(qū)動的教育決策,是目前教育領(lǐng)域極受關(guān)注的研究熱點(diǎn),是未來教育管理、教育政策研究的新范式(12)暢肇沁、陳小麗:《基于人工智能對教育影響的反思》,《教育理論與實(shí)踐》,2019年第1期。。根據(jù)各級或者不同的評價主體構(gòu)建評價模型,有助于實(shí)現(xiàn)從單一評價方式向多元評價方式轉(zhuǎn)變,促進(jìn)教育決策的精準(zhǔn)化。未來的教育是人工智能與教師協(xié)作的時代,人工智能利用大數(shù)據(jù)統(tǒng)計的方式將數(shù)據(jù)進(jìn)行相關(guān)統(tǒng)計和處理,構(gòu)建有針對性的模型,有助于發(fā)現(xiàn)學(xué)生在知識、技能、能力和素養(yǎng)等方面的優(yōu)勢和不足。總的來說,人工智能技術(shù)將會有效促進(jìn)教育教學(xué)和科學(xué)化決策。一方面,可以為教師有針對性地改進(jìn)教學(xué)、提高課堂質(zhì)量和為學(xué)生有針對性地改善學(xué)習(xí)提供建議。另一方面,教育大數(shù)據(jù)的表征與關(guān)聯(lián)價值為決策者提供了現(xiàn)實(shí)依據(jù)與科學(xué)參考,教育大數(shù)據(jù)表征了社會資源、教育投入等影響科學(xué)化決策的因素,同時,關(guān)聯(lián)價值提供了宏觀價值調(diào)控方案的參考,讓決策者在信息充足的基礎(chǔ)上進(jìn)行決策,從對決策對象準(zhǔn)確把握的角度支持科學(xué)化決策(13)劉桐、沈書生:《從表征到?jīng)Q策:教育大數(shù)據(jù)的價值透視》,《電化教育研究》,2018年第6期。。借助大數(shù)據(jù)技術(shù)開展智能化決策與評價,在教育質(zhì)量監(jiān)測結(jié)果的分析解讀和應(yīng)用中,有助于為政府依據(jù)地方教育發(fā)展水平做出決策提供科學(xué)依據(jù),并通過開展智能化分析動態(tài)把握政策實(shí)施效果。
國際教育成就評價協(xié)會(IEA)主席Thierry Rocher先生指出,伴隨數(shù)字革命,教育評估從評估理念、對象到評估工具和方法等各方面都面臨著新的需求和挑戰(zhàn)(14)科大訊飛智慧教育:《教育未來 因A.I.而能——2020全球人工智能與教育大數(shù)據(jù)大會在京召開》,2020年12月11日,http://news.bnu.edu.cn//zx/ttgz/119928.html,2021年7月15日。。人工智能與基礎(chǔ)教育監(jiān)測的融合,能夠促進(jìn)基礎(chǔ)教育監(jiān)測的新樣態(tài)發(fā)展。在促進(jìn)人工智能賦能基礎(chǔ)教育監(jiān)測創(chuàng)新技術(shù)應(yīng)用的過程中,面臨著處理教育復(fù)雜性與算法確定性之間的矛盾、人工智能技術(shù)與監(jiān)測過程的創(chuàng)新融合以及高素質(zhì)監(jiān)測人才隊(duì)伍建設(shè)等方面的挑戰(zhàn)。準(zhǔn)確識別伴隨技術(shù)而來的巨大挑戰(zhàn),減輕其弱點(diǎn)、風(fēng)險和潛在危害是非常必要的。
1.教育復(fù)雜性與算法確定性之間矛盾的平衡
我們要關(guān)注人工智能技術(shù)在教育應(yīng)用中的邊界與尺度,認(rèn)識到人的不可代替性。由于教育監(jiān)測中的評價對象是不確定的、個性化的和靈活的人,而人工智能卻是確定性的、公式化和標(biāo)準(zhǔn)化的工具,在人工智能融合基礎(chǔ)教育監(jiān)測的過程中,需要恰當(dāng)?shù)靥幚砗媒逃膹?fù)雜性與算法確定性之間的矛盾。主要表現(xiàn)在以下三個方面:教育的模糊性、不確定性與算法的確定性之間的矛盾;學(xué)生發(fā)展的個性化與算法公式化之間的矛盾;教育規(guī)則的靈活性與算法規(guī)則的生硬性之間的矛盾(15)譚維智:《人工智能教育應(yīng)用的算法風(fēng)險》,《開放教育研究》,2019年第6期。。人的成長和發(fā)展沒有明確的路徑,教育的過程、目標(biāo)、方法充滿模糊性和復(fù)雜性,人工智能的算法是確定性的,如果不加以區(qū)分地使用統(tǒng)一的數(shù)據(jù)模型來評價學(xué)生,可能無法發(fā)現(xiàn)學(xué)生特長培養(yǎng)出個性化發(fā)展的人。人工智能賦能的教育監(jiān)測把每個人都抽象為一組數(shù)據(jù)、一組標(biāo)簽或一組特征,對于學(xué)生特征的精準(zhǔn)識別雖然有利于為不同學(xué)生提供差異化、個性化學(xué)習(xí)診斷與決策,但也可能強(qiáng)化學(xué)生個人偏好甚至促使學(xué)生走向極端化(16)賈開:《人工智能與算法治理研究》,《中國行政管理》,2019年第1期。。因此,在教育監(jiān)測過程中需要恰當(dāng)處理教育復(fù)雜性、學(xué)生發(fā)展多樣性和算法確定性之間的矛盾。
2.人工智能技術(shù)賦能監(jiān)測過程的創(chuàng)新與融合
當(dāng)前大數(shù)據(jù)技術(shù)在深入發(fā)展,但我國數(shù)據(jù)存儲、處理技術(shù)基礎(chǔ)薄弱,教育大數(shù)據(jù)的應(yīng)用面臨著數(shù)據(jù)收集、存儲、分析處理、結(jié)果可視化呈現(xiàn)、數(shù)據(jù)結(jié)果兼容性以及基礎(chǔ)薄弱等挑戰(zhàn)(17)方海光:《教育大數(shù)據(jù):邁向共建、共享、開放、個性的未來教育》,北京:機(jī)械工業(yè)出版社,2016年,第89頁。。在基礎(chǔ)教育監(jiān)測中,人工智能技術(shù)也尚未深度融合到監(jiān)測的各個環(huán)節(jié),在數(shù)據(jù)線上收集、存儲、可視化呈現(xiàn)、模型構(gòu)建和實(shí)時反饋等方面有待改進(jìn)。例如,我國基礎(chǔ)教育評估監(jiān)測以紙筆測試和問卷調(diào)查為主。紙筆測試在測查學(xué)生對知識技能的掌握方面有很大優(yōu)勢,但對了解學(xué)生的高階思維能力、合作能力、問題解決能力、溝通能力等有較大的局限性(18)李勉:《基礎(chǔ)教育評估監(jiān)測:教育督導(dǎo)體系建設(shè)的新領(lǐng)域和新挑戰(zhàn)》,《中國考試》,2021年第5期。。另外,在人工智能賦能基礎(chǔ)教育監(jiān)測中可能存在數(shù)據(jù)隱私安全、算法設(shè)計缺陷和模型有偏等風(fēng)險,這在智能化組卷、閱卷和測評與診斷環(huán)節(jié)尤為重要。未來,在借助人工智能技術(shù)開展計算機(jī)自適應(yīng)測驗(yàn)、心理素質(zhì)測驗(yàn)、實(shí)時反饋能力測驗(yàn)等方面,還面臨著技術(shù)創(chuàng)新與轉(zhuǎn)變的巨大挑戰(zhàn)。
3.教育監(jiān)測人才隊(duì)伍的缺乏與培養(yǎng)
基礎(chǔ)教育監(jiān)測結(jié)果應(yīng)用的有效落腳點(diǎn)在課堂,對教師等教育教學(xué)者而言,目前熟悉監(jiān)測理念和技術(shù)原理的一線教師較少,對于結(jié)果的解讀和應(yīng)用水平還有待提升。當(dāng)人工智能的算法應(yīng)用于基礎(chǔ)教育監(jiān)測時,教師很難理解算法評價的內(nèi)在邏輯,教育教學(xué)的分析、評價與決策,是根據(jù)算法本身的一套規(guī)則,教師無法判斷依據(jù)算法做出的評價是否準(zhǔn)確以及是否符合學(xué)生需求。對于校長等教育決策者而言,如果未準(zhǔn)確識別算法設(shè)計的缺陷,可能會影響到不同層面有效的教育決策。對于家長而言,如果學(xué)生數(shù)據(jù)信息使用不當(dāng),學(xué)生家長之間更有可能利用“數(shù)據(jù)標(biāo)簽”進(jìn)行比較,錯配學(xué)生關(guān)鍵能力,從而誤導(dǎo)學(xué)生的綜合成長。在人工智能大規(guī)模地推進(jìn)并應(yīng)用于教育教學(xué)監(jiān)測的過程中,提升教育者、管理者、決策者等不同群體的教育監(jiān)測理論水平,是結(jié)果應(yīng)用與解讀過程中面臨的重大需求與挑戰(zhàn)。
從教育長遠(yuǎn)規(guī)劃和發(fā)展趨勢看,人工智能更好地服務(wù)于基礎(chǔ)教育監(jiān)測,必須加強(qiáng)和拓展人工智能在基礎(chǔ)教育監(jiān)測中的研究和實(shí)踐。主要對策體現(xiàn)在以下四個方面:
1.拓展多學(xué)科評估,開發(fā)新型測評工具,準(zhǔn)確評估學(xué)生關(guān)鍵能力
2021年3月,教育部等六部門印發(fā)了《義務(wù)教育質(zhì)量評價指南》,進(jìn)一步補(bǔ)充了關(guān)于義務(wù)教育質(zhì)量評價的相關(guān)要求,監(jiān)測學(xué)科領(lǐng)域主要包括德育、語文、數(shù)學(xué)、英語、科學(xué)、體育與健康、藝術(shù)、勞動、心理健康。并強(qiáng)調(diào)要注重結(jié)果評價與增值評價相結(jié)合、綜合評價與特色評價相結(jié)合、自我評價與外部評價相結(jié)合、線上評價與線下評價相結(jié)合(19)《教育部關(guān)于印發(fā)〈國家義務(wù)教育質(zhì)量監(jiān)測方案(2021年修訂版)〉的通知》,2021年9月24日,http://www.moe.gov.cn/srcsite/A11/moe_1789/202109/t20210926_567095.html,2021年11月29日。。建立多學(xué)科、全覆蓋的智能監(jiān)測評估系統(tǒng),發(fā)揮大數(shù)據(jù)技術(shù)在教育監(jiān)測中的有效應(yīng)用,是未來人工智能賦能基礎(chǔ)教育監(jiān)測的重要發(fā)展方向。同時,要開發(fā)并廣泛應(yīng)用新型監(jiān)測工具,精準(zhǔn)測評并培養(yǎng)有關(guān)學(xué)生核心素養(yǎng)的重要學(xué)習(xí)能力。例如:基于大腦功能模塊開展學(xué)習(xí)能力測評,培養(yǎng)學(xué)生面向未來發(fā)展的關(guān)鍵學(xué)習(xí)能力;結(jié)合新型評價工具設(shè)置問題情境,讓學(xué)生在與動態(tài)的任務(wù)環(huán)境互動過程中,探索整合信息培養(yǎng)復(fù)雜問題解決能力;在核心素養(yǎng)測評方面,開發(fā)試驗(yàn)多任務(wù)情景的創(chuàng)造力測評工具,在游戲的交互環(huán)境中測量學(xué)生的高階思維能力。基于學(xué)生關(guān)鍵學(xué)習(xí)能力的精準(zhǔn)測評,有助于摒棄傳統(tǒng)的學(xué)科知識測驗(yàn)向注重能力測驗(yàn)轉(zhuǎn)變,為多學(xué)科評估學(xué)生學(xué)習(xí)能力提供科學(xué)測評工具。
2.結(jié)合人工智能大數(shù)據(jù)技術(shù),構(gòu)建組卷、測評、閱卷與決策的四維一體化監(jiān)測體系
人工智能技術(shù)將會滲入基礎(chǔ)教育監(jiān)測的每個環(huán)節(jié)。在題庫建設(shè)中,通過記錄每道題目的研發(fā)過程、智能化分類到科學(xué)化組卷,結(jié)合智能分析技術(shù)給予客觀穩(wěn)定的智能化閱卷評分并實(shí)時反饋學(xué)生的學(xué)習(xí)結(jié)果,最后基于可視化分析工具為各級各類決策提供科學(xué)依據(jù)。在體系構(gòu)建中,還需在關(guān)鍵技術(shù)方面取得突破:深化對人類情緒、情感的識別及了解,與腦科學(xué)、認(rèn)知心理學(xué)等相關(guān)學(xué)科融合,重點(diǎn)推進(jìn)情感計算、認(rèn)知計算、智能感知等技術(shù)的發(fā)展(20)黃璐、鄭永和:《人工智能教育發(fā)展中的問題及建議》,《科技導(dǎo)報》,2018年第17期。。目前的智能教學(xué)系統(tǒng)在檢測學(xué)生的認(rèn)知水平時,交互方式以鍵盤加鼠標(biāo)為主,不能識別學(xué)生的真實(shí)物理身份,更不能有效識別學(xué)生的情感狀態(tài)并給予及時而恰當(dāng)?shù)那楦蟹答?21)賈積有等:《人工智能賦能基礎(chǔ)教育的路徑與實(shí)踐》,《數(shù)字教育》,2020年第6期。。在評價過程中注重探索多種評價方式的技術(shù)實(shí)現(xiàn),注重評價的結(jié)果性、過程性、增值性、系統(tǒng)性和科學(xué)性。在人工智能賦能教育監(jiān)測中,努力做到評價模型科學(xué)化、主體參與多元化、數(shù)據(jù)獲取立體化、診斷分析最優(yōu)化和評價反饋精準(zhǔn)化(22)劉邦奇等:《智能技術(shù)賦能教育評價:內(nèi)涵、總體框架與實(shí)踐路徑》,《中國電化教育》,2021年第8期。。通過開發(fā)實(shí)時監(jiān)測系統(tǒng),精準(zhǔn)刻畫學(xué)與教實(shí)時動態(tài)互動模式,全面收集學(xué)生行為數(shù)據(jù),建立科學(xué)模型進(jìn)行可視化分析,為課堂教學(xué)提供科學(xué)的教學(xué)資源和有效的教學(xué)指導(dǎo)。
3.刻畫學(xué)生個性化畫像,促進(jìn)基礎(chǔ)教育監(jiān)測數(shù)據(jù)結(jié)果在不同層面的分析與應(yīng)用
目前,基礎(chǔ)教育監(jiān)測的結(jié)果尚未大量應(yīng)用到學(xué)校層面,僅將結(jié)果應(yīng)用在省級、市級和區(qū)縣層面,一定程度上制約了結(jié)果的深入解讀和應(yīng)用。培養(yǎng)具有個性化發(fā)展的人是教育的重要目標(biāo)之一,未來在開展基礎(chǔ)教育監(jiān)測的計算機(jī)自適應(yīng)測驗(yàn)背景下,利用監(jiān)測數(shù)據(jù)識別學(xué)生的個性化特征,刻畫促進(jìn)學(xué)生個性化發(fā)展的畫像,并通過模型構(gòu)建和數(shù)據(jù)分析,掌握學(xué)生發(fā)展的過程數(shù)據(jù)和個性化數(shù)據(jù),最終將數(shù)據(jù)反饋給校長、教師、家長等教育主體,為校長改善管理、教師提升教學(xué)和家長教育子女提供恰當(dāng)指導(dǎo),從而加強(qiáng)基礎(chǔ)教育監(jiān)測數(shù)據(jù)結(jié)果在家庭、學(xué)校、區(qū)縣和國家層面的應(yīng)用。當(dāng)前,教育大數(shù)據(jù)的應(yīng)用主要體現(xiàn)在驅(qū)動國家教育政策科學(xué)化,區(qū)域教育均衡發(fā)展、學(xué)校教育質(zhì)量提升,課程體系與教學(xué)效果的最優(yōu)化和個體的個性化發(fā)展方面(23)楊現(xiàn)民、王榴卉、唐斯斯:《教育大數(shù)據(jù)的應(yīng)用模式與政策建議》,《電化教育研究》,2015年第9期。。針對教育質(zhì)量監(jiān)測結(jié)果在學(xué)校和個體層面應(yīng)用不足的現(xiàn)狀,未來需要創(chuàng)新測驗(yàn)形式、繼續(xù)完善數(shù)據(jù)管理和應(yīng)用系統(tǒng),通過對數(shù)據(jù)進(jìn)行科學(xué)處理,為學(xué)生個體化學(xué)習(xí)進(jìn)步提供反饋,推動監(jiān)測結(jié)果在個體和學(xué)校層面的應(yīng)用。
4.有效開展各級層面的監(jiān)測技術(shù)培訓(xùn),提高決策者、教育者和學(xué)習(xí)者的數(shù)據(jù)素養(yǎng)
基礎(chǔ)教育監(jiān)測在人工智能賦能的背景下,在工具開發(fā)、監(jiān)測實(shí)施和評價等方面有了科學(xué)完善的實(shí)施步驟,但是不同管理層面的領(lǐng)導(dǎo)者和教育者對一些關(guān)鍵技術(shù)的理解還不夠深入,尤其是教師可能無法理解算法的內(nèi)在邏輯,在結(jié)果的應(yīng)用與解讀過程中還存在算法缺陷、模型有偏、應(yīng)用不充分等問題,不同群體數(shù)據(jù)素養(yǎng)的提升成為監(jiān)測結(jié)果應(yīng)用面臨的重要挑戰(zhàn)。通過在各級層面開展監(jiān)測技術(shù)和理論培訓(xùn),增強(qiáng)教育決策者對監(jiān)測數(shù)據(jù)結(jié)果的發(fā)現(xiàn)力、教育教學(xué)者對監(jiān)測理論技術(shù)的理解力以及學(xué)習(xí)者對自身學(xué)業(yè)表現(xiàn)的感知力,有效提高不同教育主體的數(shù)據(jù)素養(yǎng)。例如,對教師而言,培養(yǎng)教師的數(shù)據(jù)素養(yǎng),一方面需要從教師培訓(xùn)入手,重點(diǎn)培養(yǎng)其數(shù)據(jù)知識和數(shù)據(jù)技能,同時加強(qiáng)培訓(xùn)的績效評估;另一方面還要聚焦于基于數(shù)據(jù)的教學(xué)實(shí)踐,重點(diǎn)培養(yǎng)教師基于數(shù)據(jù)解決教育教學(xué)實(shí)際問題的能力,形成科學(xué)合理的數(shù)據(jù)觀念(24)林攀登、張立國、周釜宇:《從經(jīng)驗(yàn)回顧到數(shù)據(jù)驅(qū)動:人工智能賦能教師教學(xué)反思新樣態(tài)》,《當(dāng)代教育科學(xué)》,2021年第10期。。在加強(qiáng)新興測評技術(shù)的開發(fā)應(yīng)用過程中,幫助管理者、教育者、學(xué)習(xí)者理解技術(shù)原理和數(shù)據(jù)應(yīng)用技術(shù),提升數(shù)據(jù)素養(yǎng),對于科學(xué)合理地解讀數(shù)據(jù)、恰當(dāng)使用數(shù)據(jù)具有重要意義。
人工智能賦能基礎(chǔ)教育監(jiān)測,促進(jìn)了教育監(jiān)測過程中各個環(huán)節(jié)的技術(shù)應(yīng)用與創(chuàng)新。未來在人工智能與基礎(chǔ)教育監(jiān)測深入融合的過程中,需要有效發(fā)揮人工智能與大數(shù)據(jù)帶來的技術(shù)優(yōu)勢,克服人才短缺、技術(shù)創(chuàng)新應(yīng)用以及學(xué)生個體發(fā)展等方面的問題與挑戰(zhàn),構(gòu)建新時代的教育評價體系,進(jìn)一步促進(jìn)以核心素養(yǎng)為導(dǎo)向的評價,發(fā)展增值評價、過程評價,并擴(kuò)大能夠自動評估的學(xué)習(xí)活動、可捕捉能力的范圍以及跨時間和跨環(huán)境的范圍,確保人工智能賦能基礎(chǔ)教育監(jiān)測的科學(xué)性、可靠性、有效性和公平性。
北京師范大學(xué)學(xué)報(社會科學(xué)版)2022年2期