丁 念 亮
當(dāng)前全球正在經(jīng)歷新一輪科技革命,人工智能技術(shù)已成為推動(dòng)教育變革的重要力量。教育部于2018年發(fā)布《教育信息化2.0行動(dòng)計(jì)劃》,要求進(jìn)一步推進(jìn)人工智能教育的發(fā)展[1],表明我國(guó)教育信息化已進(jìn)入一個(gè)新的階段。教育人工智能的理論探索、技術(shù)開發(fā)和生態(tài)構(gòu)建將是當(dāng)前和未來(lái)教育研究的重要任務(wù)。在學(xué)習(xí)評(píng)價(jià)研究領(lǐng)域,人工智能的介入正深刻改變著傳統(tǒng)學(xué)習(xí)評(píng)價(jià)模式,但學(xué)習(xí)評(píng)價(jià)模式的智能化發(fā)展之路卻充滿了諸多挑戰(zhàn)。
人工智能是計(jì)算機(jī)系統(tǒng)的一種能力,它能夠完成本質(zhì)上具有人類特征的行為[2]。人工智能的概念源自Alan Turing的《計(jì)算機(jī)器與智能》,但其作為一個(gè)術(shù)語(yǔ)則是由麻省理工學(xué)院教授John McCarthy 等人首次提出[3]。這一術(shù)語(yǔ)本身具有較強(qiáng)的包容性,含有多個(gè)相互交叉重疊的概念,如預(yù)測(cè)分析、深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、專家系統(tǒng)和社交機(jī)器人等。雖然人工智能是一個(gè)多維度概念,但其核心都是機(jī)器模仿人的一種或幾種智力活動(dòng)[4]。
在學(xué)習(xí)評(píng)價(jià)中的人工智能可以包含上述一個(gè)或多個(gè)技術(shù)概念,這與學(xué)習(xí)評(píng)價(jià)的內(nèi)涵密切相關(guān)。學(xué)習(xí)評(píng)價(jià)一般理解為對(duì)學(xué)生學(xué)習(xí)成效的評(píng)價(jià),其內(nèi)涵在歷史上也經(jīng)歷了若干變化,至今仍有不同的理解。Harlen將“對(duì)學(xué)習(xí)的評(píng)價(jià)(assessment of learning)”和“為學(xué)習(xí)的評(píng)價(jià)(assessment for learning)”做了區(qū)分,認(rèn)為兩者的差異歸于其各自不同的評(píng)價(jià)目的[5]。“對(duì)學(xué)習(xí)的評(píng)價(jià)”目的是終結(jié)性的,意在提供可靠的學(xué)生學(xué)業(yè)成績(jī)報(bào)告,評(píng)價(jià)過(guò)程是線性的;而“為學(xué)習(xí)的評(píng)價(jià)”本質(zhì)上是形成性的、不斷重復(fù)的循環(huán)過(guò)程,目的是從持續(xù)的學(xué)習(xí)活動(dòng)中提取數(shù)據(jù)、形成反饋信息并指導(dǎo)學(xué)生下一步的學(xué)習(xí)。與上述兩種理解不同,Dann提出了“評(píng)價(jià)即學(xué)習(xí)(assessment as learning)”的概念[6]。這種學(xué)評(píng)融合的評(píng)價(jià)理念使學(xué)生全程置于評(píng)價(jià)之中,使教、學(xué)、評(píng)三者融為一體,評(píng)價(jià)不再是教和學(xué)的附屬品,而是與教和學(xué)一起構(gòu)成的相互關(guān)聯(lián)和滲透的統(tǒng)一體。學(xué)評(píng)融合模式的優(yōu)勢(shì)是能夠?qū)W(xué)習(xí)進(jìn)行及時(shí)反饋和連續(xù)反饋,但限于傳統(tǒng)評(píng)價(jià)手段高昂的時(shí)間成本,這種評(píng)價(jià)模式似乎只是一種現(xiàn)實(shí)中難以實(shí)現(xiàn)的評(píng)價(jià)理想。當(dāng)大數(shù)據(jù)、人工智能和區(qū)塊鏈技術(shù)日趨成熟并逐漸滲透到教育領(lǐng)域時(shí),學(xué)評(píng)融合的評(píng)價(jià)模式也迎來(lái)了新的發(fā)展契機(jī)。
人工智能等信息技術(shù)與學(xué)評(píng)融合理念的結(jié)合可以實(shí)現(xiàn)學(xué)習(xí)與評(píng)價(jià)的同步。在過(guò)去的一二十年中,人工智能技術(shù)已經(jīng)在學(xué)習(xí)評(píng)價(jià)中得到越來(lái)越廣泛的應(yīng)用,如智能作文評(píng)分系統(tǒng)和智能教學(xué)系統(tǒng)等。智能學(xué)習(xí)評(píng)價(jià)利用人工智能技術(shù)對(duì)學(xué)習(xí)過(guò)程大數(shù)據(jù)進(jìn)行分析并提供實(shí)時(shí)反饋。學(xué)習(xí)過(guò)程中產(chǎn)生的大量與學(xué)習(xí)相關(guān)的數(shù)字化信息被準(zhǔn)確完整地記錄下來(lái)用于學(xué)習(xí)評(píng)價(jià)。這些數(shù)據(jù)既包括鼠標(biāo)點(diǎn)擊次數(shù)和鍵盤操作情況,也涵蓋學(xué)習(xí)任務(wù)完成進(jìn)度及正確率等信息。除此之外,通過(guò)精密傳感儀器甚至可以獲得學(xué)生的心率、微表情等所有個(gè)人活動(dòng)信息數(shù)據(jù)。這些學(xué)習(xí)過(guò)程數(shù)據(jù)由系統(tǒng)預(yù)置的評(píng)價(jià)模型自動(dòng)分析并生成實(shí)時(shí)反饋信息,指導(dǎo)進(jìn)一步學(xué)習(xí)。理論上,智能學(xué)習(xí)評(píng)價(jià)能完全貫徹學(xué)評(píng)融合的評(píng)價(jià)思想,徹底改變傳統(tǒng)評(píng)價(jià)體系下無(wú)法連續(xù)評(píng)價(jià)和及時(shí)評(píng)價(jià)的尷尬局面。
智能學(xué)習(xí)系統(tǒng)從早期的智能專家系統(tǒng)逐漸向自適應(yīng)和智適應(yīng)學(xué)習(xí)系統(tǒng)過(guò)渡,不僅自動(dòng)提供學(xué)科知識(shí),對(duì)學(xué)習(xí)行為進(jìn)行診斷評(píng)價(jià)[7],還可以憑借大數(shù)據(jù)和人工智能技術(shù)使其擁有媲美特級(jí)教師的教學(xué)能力[8]。通過(guò)基于大數(shù)據(jù)的量化自我學(xué)習(xí)算法,智能學(xué)習(xí)系統(tǒng)全面記錄學(xué)生學(xué)習(xí)行為,評(píng)估預(yù)設(shè)學(xué)習(xí)內(nèi)容是否掌握,最終實(shí)現(xiàn)學(xué)習(xí)評(píng)價(jià)的動(dòng)態(tài)性、全程性和綜合性[9]。信息化時(shí)代背景下,智能學(xué)習(xí)評(píng)價(jià)的內(nèi)在價(jià)值決定了其存在和發(fā)展的合理性。
人工智能技術(shù)支持下的學(xué)習(xí)評(píng)價(jià)可以快速實(shí)現(xiàn)評(píng)價(jià)目標(biāo)的個(gè)性化。依托智能學(xué)習(xí)系統(tǒng),設(shè)計(jì)者利用人工智能技術(shù)對(duì)學(xué)習(xí)大數(shù)據(jù)進(jìn)行分析,可以得到學(xué)生學(xué)習(xí)行為的預(yù)測(cè)信息,進(jìn)而形成基于學(xué)習(xí)內(nèi)容的個(gè)性化評(píng)價(jià)目標(biāo)。在完成學(xué)習(xí)內(nèi)容后,系統(tǒng)可對(duì)目標(biāo)達(dá)成情況向?qū)W生和教師進(jìn)行反饋,推送新的學(xué)習(xí)內(nèi)容,形成新的評(píng)價(jià)目標(biāo),如此周而復(fù)始,引導(dǎo)每個(gè)學(xué)生完成預(yù)定的學(xué)習(xí)內(nèi)容。由于學(xué)生學(xué)習(xí)能力存在個(gè)體差異,學(xué)生的評(píng)價(jià)目標(biāo)和學(xué)習(xí)進(jìn)度是不一樣的。這與傳統(tǒng)學(xué)校教育中的評(píng)價(jià)體制相異,因而目前無(wú)法將人工智能學(xué)習(xí)系統(tǒng)大規(guī)模應(yīng)用到學(xué)校教學(xué)中,只能較多滿足自主學(xué)習(xí)者的需要。
傳統(tǒng)的紙筆評(píng)價(jià)方式只能進(jìn)行數(shù)據(jù)抽樣或階段性測(cè)評(píng),獲取學(xué)習(xí)數(shù)據(jù),完成評(píng)價(jià)和反饋。這種評(píng)價(jià)方式的不足在于評(píng)價(jià)過(guò)程的中斷。學(xué)習(xí)評(píng)價(jià)的理想狀態(tài)就是無(wú)間斷的全程評(píng)價(jià)。但全程評(píng)價(jià)方式會(huì)產(chǎn)生巨量數(shù)據(jù),傳統(tǒng)數(shù)據(jù)分析手段無(wú)法快速處理,當(dāng)然也無(wú)法進(jìn)行全程記錄、分析和評(píng)價(jià)。人工智能技術(shù)可以全程記錄學(xué)習(xí)行為數(shù)據(jù),并依據(jù)評(píng)價(jià)模型實(shí)現(xiàn)即時(shí)性全程性評(píng)價(jià)。除了學(xué)習(xí)行為之外,學(xué)生的心理狀態(tài)、運(yùn)動(dòng)情況、休息情況等都可以通過(guò)智能便攜設(shè)備進(jìn)行全程記錄和分析評(píng)價(jià)。
學(xué)習(xí)評(píng)價(jià)系統(tǒng)能夠準(zhǔn)確客觀地診斷學(xué)習(xí)表現(xiàn),幫助師生把握課程目標(biāo)和教學(xué)策略[10]。學(xué)習(xí)過(guò)程大數(shù)據(jù)是學(xué)習(xí)行為的數(shù)字化體現(xiàn),排除了人工打分的個(gè)人偏好、隨意和誤差等不利因素。數(shù)據(jù)記錄精確即時(shí),在評(píng)價(jià)模型成熟可靠的前提下,評(píng)價(jià)效果必然是客觀和精確的。因此,開發(fā)出可靠的評(píng)價(jià)模型是評(píng)價(jià)效果的重要保障。但評(píng)價(jià)模型的開發(fā)并非易事,需要融合先進(jìn)的信息技術(shù)和科學(xué)的評(píng)價(jià)理念,經(jīng)過(guò)專業(yè)人員通力合作反復(fù)測(cè)試才能完成。
紙筆評(píng)價(jià)方式常以階段性評(píng)價(jià)為主,評(píng)價(jià)內(nèi)容圍繞本階段的學(xué)習(xí)表現(xiàn),可以包括單元測(cè)試、課堂表現(xiàn)、作業(yè)成績(jī)等主要學(xué)習(xí)行為。但除此以外的學(xué)生素質(zhì)評(píng)價(jià)則較為主觀和模糊,缺乏客觀精確的統(tǒng)計(jì)數(shù)據(jù)作為依據(jù)。造成這種困難的原因在于缺少一種可以容納全部可測(cè)項(xiàng)目的評(píng)價(jià)工具,僅依靠傳統(tǒng)人力無(wú)法完成如此龐大的數(shù)據(jù)處理工作。人工智能技術(shù)的介入使學(xué)生綜合素質(zhì)評(píng)價(jià)成為可能。綜合素質(zhì)可以進(jìn)行測(cè)評(píng)項(xiàng)目分解,并向人工智能評(píng)價(jià)系統(tǒng)無(wú)限添加,對(duì)數(shù)據(jù)進(jìn)行自動(dòng)記錄、分析和匯總,最終得出評(píng)價(jià)結(jié)果和反饋建議。
智能評(píng)價(jià)系統(tǒng)往往與智能學(xué)習(xí)系統(tǒng)整合,成為智能學(xué)習(xí)系統(tǒng)的一部分,傳統(tǒng)評(píng)價(jià)中的教師評(píng)價(jià)、學(xué)生自評(píng)和互評(píng)部分被人工智能取代,智能評(píng)價(jià)系統(tǒng)扮演了教師和學(xué)生在傳統(tǒng)評(píng)價(jià)過(guò)程中的角色。原本由教育者和受教育者共同完成的教學(xué)評(píng)價(jià)活動(dòng),僅由人工智能便可完成[11],原有的評(píng)價(jià)參與者被排除在外。通過(guò)所謂的算法“黑匣子”,基于深度學(xué)習(xí)的人工智能所構(gòu)建的評(píng)價(jià)系統(tǒng)超出了人類監(jiān)控能力,導(dǎo)致無(wú)法對(duì)智能評(píng)價(jià)系統(tǒng)的準(zhǔn)確性、客觀性和公正性做出科學(xué)評(píng)判。人類有可能從最初的系統(tǒng)設(shè)計(jì)者,轉(zhuǎn)變?yōu)閷W(xué)習(xí)評(píng)價(jià)的旁觀者;而人工智能評(píng)價(jià)系統(tǒng)則可能成為教育的隱形操控者。學(xué)習(xí)評(píng)價(jià)活動(dòng)成為智能評(píng)價(jià)系統(tǒng)獨(dú)立掌控的壟斷事務(wù),普通教師對(duì)學(xué)生的評(píng)價(jià)和學(xué)生的自評(píng)互評(píng),因?yàn)檫^(guò)于“主觀”或者過(guò)于繁瑣而無(wú)奈讓位于高效的智能評(píng)價(jià)。但智能評(píng)價(jià)系統(tǒng)的設(shè)計(jì)往往無(wú)法完全反映教育目標(biāo),如同情心、正義感、批判性思維能力等素質(zhì)指標(biāo)。這種狹隘的智能評(píng)價(jià)系統(tǒng)一旦取代人類成為學(xué)習(xí)的評(píng)價(jià)者,教育將面臨被異化的風(fēng)險(xiǎn)。
智能學(xué)習(xí)系統(tǒng)往往內(nèi)置評(píng)價(jià)系統(tǒng),在評(píng)價(jià)系統(tǒng)研發(fā)和測(cè)試階段往往需要教師的參與,把符合時(shí)代要求的評(píng)價(jià)思想融入評(píng)價(jià)模型,由信息技術(shù)專家將教學(xué)評(píng)價(jià)思想轉(zhuǎn)化為一串串代碼,最終實(shí)現(xiàn)學(xué)生學(xué)習(xí)行為的智能化評(píng)價(jià)。由此帶來(lái)的一個(gè)重要轉(zhuǎn)變就是教師職能的弱化。正常使用的智能評(píng)價(jià)系統(tǒng)已經(jīng)具備了全自動(dòng)的評(píng)價(jià)流程,不需要教師的介入,教師失去話語(yǔ)權(quán),師生關(guān)系可能會(huì)逐漸淡化。雖然人機(jī)交互的自主學(xué)習(xí)模式已逐漸成為學(xué)校教育的重要輔助力量,但人工智能技術(shù)目前還不能完全模擬教師在教育中的情感職能。師生之間和生生之間融洽的人際關(guān)系對(duì)學(xué)生未來(lái)成長(zhǎng)至關(guān)重要,去教師化的智能評(píng)價(jià)系統(tǒng)很難實(shí)現(xiàn)如人類之間的直接情感交流,由此可能導(dǎo)致學(xué)生的情感缺失和性格障礙,不利于學(xué)生的人際交往能力發(fā)展[12]。
新時(shí)期我國(guó)陸續(xù)發(fā)布的重大教育政策已經(jīng)明確了綜合素質(zhì)的重要性。國(guó)家近幾年大力推進(jìn)的新高考改革方案加強(qiáng)了對(duì)學(xué)生核心價(jià)值和綜合能力的考核,并將綜合素質(zhì)評(píng)價(jià)作為高考錄取的重要參考。2020年10月,中共中央、國(guó)務(wù)院印發(fā)了《深化新時(shí)代教育評(píng)價(jià)改革總體方案》,要求“改革學(xué)生評(píng)價(jià),促進(jìn)德智體美勞全面發(fā)展”[13],探索通過(guò)信息化等手段記錄學(xué)生品行等日常表現(xiàn),并納入學(xué)生綜合素質(zhì)評(píng)價(jià)。這些都表明綜合素質(zhì)評(píng)價(jià)日益凸顯的重要性和創(chuàng)新評(píng)價(jià)手段的緊迫性。但目前的評(píng)價(jià)手段多為主觀評(píng)價(jià),難以保證綜合素質(zhì)評(píng)價(jià)結(jié)果的客觀性和準(zhǔn)確性。同時(shí),利用過(guò)程數(shù)據(jù)進(jìn)行的綜合素質(zhì)評(píng)價(jià)也面臨挑戰(zhàn)。首先,人們對(duì)綜合素質(zhì)的理解和界定存在一定的差異,對(duì)學(xué)習(xí)者的技能、信念、毅力、情感、態(tài)度等特質(zhì)尚缺乏清晰的界定和明確的維度,因而難以準(zhǔn)確測(cè)量和評(píng)估。其次,在綜合素質(zhì)評(píng)價(jià)建模過(guò)程中,存在大量無(wú)標(biāo)注數(shù)據(jù)。缺乏語(yǔ)義標(biāo)簽的數(shù)據(jù)很難用于模型的構(gòu)建、訓(xùn)練和完善[14]。造成這一困難的原因在于相關(guān)實(shí)證研究的不足。墨爾本大學(xué)教育學(xué)院評(píng)價(jià)研究中心的桑德拉等認(rèn)為,缺乏有效的實(shí)證研究數(shù)據(jù),就無(wú)法定義學(xué)習(xí)過(guò)程中學(xué)生的各項(xiàng)素質(zhì),難以實(shí)現(xiàn)學(xué)習(xí)評(píng)價(jià)的效度、效用和解釋力[15]??梢?jiàn),對(duì)學(xué)習(xí)過(guò)程要素進(jìn)行明確的定義是構(gòu)建測(cè)量模型的關(guān)鍵步驟,而要對(duì)學(xué)習(xí)過(guò)程所涉及要素進(jìn)行確切定義,只能依靠大量的實(shí)證研究。
傳統(tǒng)的學(xué)習(xí)評(píng)價(jià)目標(biāo)較為單一,數(shù)據(jù)采集方式也較為簡(jiǎn)單,評(píng)價(jià)內(nèi)容主要涉及課程學(xué)習(xí)本身,較少大規(guī)模采集學(xué)生的行為、情感或其他個(gè)人信息。因此,在傳統(tǒng)評(píng)價(jià)體系中,學(xué)生個(gè)人隱私泄露風(fēng)險(xiǎn)和潛在危害較小。但隨著人工智能技術(shù)的介入,學(xué)生行為數(shù)據(jù)的實(shí)時(shí)采集成為現(xiàn)實(shí)。學(xué)生的日常學(xué)習(xí)行為,包括學(xué)習(xí)平臺(tái)登錄次數(shù)、使用資源情況、在線學(xué)習(xí)時(shí)長(zhǎng)、作業(yè)提交情況等都被記錄在案。通過(guò)攝像頭和智能便攜設(shè)備,學(xué)生的地理位置、社交偏好、表情變化、運(yùn)動(dòng)和睡眠時(shí)長(zhǎng)等私密性數(shù)據(jù)也可以實(shí)時(shí)記錄和查詢。在符合倫理并遵守法律的前提下合理使用這些數(shù)據(jù),可以極大地提高學(xué)習(xí)評(píng)價(jià)的準(zhǔn)確性和客觀性,甚至可以幫助教師描繪出學(xué)生學(xué)習(xí)的數(shù)字全景圖,為客觀評(píng)價(jià)提供可靠的數(shù)據(jù)支持。但學(xué)生隱私數(shù)據(jù)實(shí)時(shí)采集往往伴隨著倫理和法律風(fēng)險(xiǎn)。人工智能技術(shù)使學(xué)生可以被當(dāng)作實(shí)驗(yàn)對(duì)象時(shí)時(shí)處處暴露在放大鏡下等待評(píng)判,這種評(píng)價(jià)系統(tǒng)忽略了學(xué)生作為人的基本權(quán)利,違背了教育評(píng)價(jià)的本意。沒(méi)有約束的智能評(píng)價(jià)系統(tǒng)極有可能淪為“課堂間諜”[16],對(duì)學(xué)生的個(gè)人隱私構(gòu)成極大威脅。許多智能系統(tǒng)基于云端建設(shè),更增加了隱私數(shù)據(jù)濫用的潛在風(fēng)險(xiǎn)。
傳統(tǒng)的學(xué)習(xí)評(píng)價(jià)方式以終結(jié)性評(píng)價(jià)為主,簡(jiǎn)單易行,成本較低。即使采用形成性評(píng)價(jià),教師也只是把評(píng)價(jià)過(guò)程粗略劃分為幾個(gè)大的類別,數(shù)據(jù)采集量不大,對(duì)數(shù)據(jù)處理能力要求不高。因此,傳統(tǒng)評(píng)價(jià)方式投入的人工和經(jīng)濟(jì)成本相對(duì)較低。與之相反,智能評(píng)價(jià)系統(tǒng)開發(fā)費(fèi)用較高,且管理運(yùn)行也需要較高的技術(shù)要求和成本投入。構(gòu)建大規(guī)模智能評(píng)價(jià)系統(tǒng)的成本難以準(zhǔn)確估算,但通過(guò)其他大型人工智能項(xiàng)目動(dòng)輒數(shù)億美元的巨大投入來(lái)看,構(gòu)建和維護(hù)一個(gè)智能學(xué)習(xí)評(píng)價(jià)系統(tǒng)的費(fèi)用也會(huì)相當(dāng)高昂[2]。桑德拉等指出,構(gòu)建學(xué)習(xí)評(píng)價(jià)系統(tǒng)的測(cè)量模型成本較高,不僅耗時(shí)費(fèi)力而且需要技術(shù)和設(shè)備支持,小規(guī)模應(yīng)用時(shí)經(jīng)濟(jì)性也很差[15]。同時(shí),學(xué)習(xí)行為數(shù)據(jù)采集需要硬件設(shè)施的支持才能實(shí)現(xiàn)。傳統(tǒng)學(xué)校平臺(tái)的數(shù)據(jù)采集功能十分有限,無(wú)法收集到學(xué)生平臺(tái)之外的學(xué)習(xí)信息。智能便攜設(shè)備盡管可以滿足這一要求,但人人佩戴目前尚不現(xiàn)實(shí)。
智能評(píng)價(jià)系統(tǒng)應(yīng)該體現(xiàn)正確的教育價(jià)值判斷,否則人工智能技術(shù)不僅無(wú)助于學(xué)習(xí)評(píng)價(jià),反而會(huì)造成嚴(yán)重誤導(dǎo)。在現(xiàn)有的智能評(píng)價(jià)系統(tǒng)尚不能對(duì)學(xué)生情感和綜合素質(zhì)等方面做出整體評(píng)價(jià)的情況下,人工評(píng)價(jià)仍不可缺席。智能評(píng)價(jià)和人工評(píng)價(jià)應(yīng)該形成互補(bǔ)關(guān)系,共同服務(wù)于學(xué)習(xí)評(píng)價(jià)。教師不能一味地將自己的評(píng)價(jià)者角色讓位于日漸強(qiáng)大的人工智能,也不可完全否定人工智能在重復(fù)性技能型工作方面的客觀性和專業(yè)性。學(xué)習(xí)評(píng)價(jià)不僅僅是對(duì)學(xué)習(xí)成績(jī)和行為數(shù)據(jù)的統(tǒng)計(jì)和比較,還應(yīng)涵蓋復(fù)雜的思維活動(dòng)和細(xì)膩的情感活動(dòng)。目前即使最先進(jìn)的人工智能系統(tǒng)也無(wú)法完全模擬和評(píng)價(jià)人類的情緒、意志和語(yǔ)言表達(dá)。人類評(píng)價(jià)者的參與可以關(guān)照學(xué)生的情商和語(yǔ)商等多個(gè)評(píng)價(jià)維度[14],防止評(píng)價(jià)維度單一而導(dǎo)致的片面性。同時(shí),學(xué)習(xí)者不論是作為獨(dú)立的學(xué)習(xí)個(gè)體還是相互聯(lián)系的集體成員,學(xué)習(xí)評(píng)價(jià)都應(yīng)該包含學(xué)習(xí)者本人的自我評(píng)價(jià)和同伴互評(píng),而不應(yīng)當(dāng)使學(xué)習(xí)評(píng)價(jià)成為智能學(xué)習(xí)系統(tǒng)的壟斷行為。
科學(xué)的評(píng)價(jià)模型是有效實(shí)施學(xué)習(xí)評(píng)價(jià)的關(guān)鍵一環(huán),也是目前大數(shù)據(jù)時(shí)代亟待攻克的難題。學(xué)界應(yīng)當(dāng)加強(qiáng)與商界的合作,開發(fā)大規(guī)模適用的智能學(xué)習(xí)評(píng)價(jià)系統(tǒng)。因?yàn)榇髷?shù)據(jù)本身并不能自動(dòng)呈現(xiàn)教育的真相,應(yīng)當(dāng)把大數(shù)據(jù)變成可理解的小數(shù)據(jù),才能對(duì)學(xué)習(xí)狀況進(jìn)行科學(xué)測(cè)量和評(píng)價(jià),進(jìn)而提供合理反饋,提高學(xué)習(xí)質(zhì)量。這需要本學(xué)科教師、評(píng)價(jià)研究者、人工智能和大數(shù)據(jù)工程師的有效協(xié)作和努力。因此在一定意義上,科學(xué)的評(píng)價(jià)模型是智能化學(xué)習(xí)評(píng)價(jià)的核心與關(guān)鍵[17]。當(dāng)把學(xué)習(xí)測(cè)量和學(xué)習(xí)評(píng)價(jià)分開看待時(shí),它們的再次結(jié)合就變得不那么自然而然,而是需要使預(yù)先建構(gòu)的測(cè)量模型與評(píng)價(jià)內(nèi)容相適應(yīng),即測(cè)量模型須涵蓋評(píng)價(jià)內(nèi)容且體現(xiàn)評(píng)價(jià)者的價(jià)值判斷。這就要求評(píng)價(jià)者明確學(xué)習(xí)評(píng)價(jià)的價(jià)值導(dǎo)向,在構(gòu)建測(cè)量模型時(shí)確定“影響學(xué)習(xí)評(píng)價(jià)質(zhì)量的關(guān)鍵性假設(shè),并對(duì)其逐一檢驗(yàn)”[15]。
學(xué)習(xí)評(píng)價(jià)系統(tǒng)中的數(shù)據(jù)采集內(nèi)容能夠包括學(xué)生全部學(xué)習(xí)行為??纱┐髟O(shè)備、人臉識(shí)別、智慧校園監(jiān)控等大量數(shù)據(jù)采集設(shè)備的應(yīng)用使學(xué)生時(shí)時(shí)刻刻都處在“第三只眼”的注視之下,毫無(wú)隱私可言。所收集到的數(shù)據(jù)如何管理一直是嚴(yán)肅的倫理問(wèn)題。人工智能在教育應(yīng)用中的倫理風(fēng)險(xiǎn)主要在于設(shè)計(jì)開發(fā)和實(shí)踐應(yīng)用兩個(gè)環(huán)節(jié)[11]。學(xué)習(xí)評(píng)價(jià)系統(tǒng)的設(shè)計(jì)人員在開發(fā)之初除了要有明確的教育價(jià)值理念指導(dǎo)之外,還要有嚴(yán)格的倫理規(guī)范作為約束。因此,制定符合社會(huì)倫理和技術(shù)倫理的制度規(guī)約是對(duì)學(xué)生學(xué)習(xí)行為數(shù)據(jù)進(jìn)行管理、使用和保護(hù)的制度保障。在有效的倫理框架下開展學(xué)習(xí)行為評(píng)價(jià),才能最大限度地保障學(xué)生權(quán)利,促進(jìn)學(xué)生健康發(fā)展。在具體評(píng)價(jià)過(guò)程中,評(píng)價(jià)者能否遵守評(píng)價(jià)倫理制度需要由政策和法規(guī)加以強(qiáng)制約束。評(píng)價(jià)行為必須在法規(guī)框架內(nèi)進(jìn)行,違反倫理法規(guī),侵犯、泄露、傳播學(xué)生隱私的行為應(yīng)受到法律制裁。學(xué)生提出質(zhì)疑或?qū)﹄[私有爭(zhēng)議時(shí),應(yīng)該首先暫停數(shù)據(jù)采集,在獲得學(xué)生或家長(zhǎng)同意之后,才能繼續(xù)使用。學(xué)生、家長(zhǎng)和學(xué)校共同擁有學(xué)習(xí)數(shù)據(jù)的所有權(quán)和使用權(quán)。只有制定完整的隱私和倫理制度的具體規(guī)約,智能學(xué)習(xí)評(píng)價(jià)才能在更大規(guī)模上健康發(fā)展。
在我國(guó)現(xiàn)行的教育體制下,由政府推動(dòng)的自上而下的評(píng)價(jià)模式改革更容易取得成效。除了加大研發(fā)和推廣的投入以外,政府應(yīng)順應(yīng)智能時(shí)代的發(fā)展趨勢(shì),繼續(xù)強(qiáng)化政策導(dǎo)向,具體落實(shí)教育評(píng)價(jià)改革。事實(shí)上,我國(guó)已經(jīng)發(fā)布了若干政策文件,大力推動(dòng)人工智能學(xué)習(xí)評(píng)價(jià)的落實(shí)。其中,2020年發(fā)布的《深化新時(shí)代教育評(píng)價(jià)改革總體方案》就指明了落實(shí)教育評(píng)價(jià)改革的創(chuàng)新路徑,強(qiáng)調(diào)充分利用“人工智能、大數(shù)據(jù)等現(xiàn)代信息技術(shù),探索開展學(xué)生各年級(jí)學(xué)習(xí)情況全過(guò)程縱向評(píng)價(jià)、德智體美勞全要素橫向評(píng)價(jià)”,“提高教育評(píng)價(jià)的科學(xué)性、專業(yè)性、客觀性”[13]。以此為導(dǎo)向,教育主管部門可結(jié)合人工智能、大數(shù)據(jù)和區(qū)塊鏈技術(shù)嘗試建立區(qū)域性乃至全國(guó)性的權(quán)威智能評(píng)價(jià)系統(tǒng),向所有學(xué)校開放,統(tǒng)一管理。這樣可以降低小規(guī)模開發(fā)和應(yīng)用造成的重復(fù)建設(shè)和資源浪費(fèi);也可以避免由于學(xué)校之間數(shù)據(jù)格式和評(píng)價(jià)標(biāo)準(zhǔn)的不統(tǒng)一,而無(wú)法橫向比較的弊端。
綜上所述,智能學(xué)習(xí)評(píng)價(jià)是新時(shí)期教育評(píng)價(jià)改革的重要組成部分,是智能時(shí)代 “識(shí)才”“育才”“選才”的重要手段。智能學(xué)習(xí)評(píng)價(jià)系統(tǒng)構(gòu)建過(guò)程中,探索智能評(píng)價(jià)建模方法和關(guān)鍵技術(shù)、正確處理智能評(píng)價(jià)和人工評(píng)價(jià)的關(guān)系、制定保護(hù)隱私合乎倫理的政策法規(guī)、注重頂層設(shè)計(jì)和基層建設(shè)的結(jié)合,既是實(shí)現(xiàn)智能學(xué)習(xí)評(píng)價(jià)的保證,也是教育改革的要求。