[摘 要] 生成式人工智能已經具備與人類進行有意義多輪對話的重要能力。傳統(tǒng)高等教育形成性評價在及時性、個性化等方面存在不足。如何利用生成式人工智能優(yōu)化高等教育評價過程,已經成為教育界共同關注的話題。研究旨在通過生成式人工智能,提供智能反饋,優(yōu)化形成性評價,提高評價的效率與個性化水平,進而促進學生有效學習的發(fā)生。研究利用文獻法與歸納法,聚焦形成性評價,在探討生成式人工智能賦能高等教育形成性評價的基礎上,從形成性評價的理念、對象、過程、結果和倫理等方面,探討生成式人工智能賦能形成性評價的挑戰(zhàn),并提出了生成式人工智能賦能形成性評價的路徑以期為生成式人工智能更好地賦能高等教育形成性評價提供借鑒和參考。
[關鍵詞] 生成式人工智能; 智能反饋; 教育評價; 形成性評價; 技術賦能
[中圖分類號] G434 [文獻標志碼] A
[作者簡介] 盧國慶(1988—),男,河南周口人。講師,博士,主要從事學習分析研究。E-mail:luguoqing@nwnu.edu.cn。賀相春為通信作者,E-mail:hxc@nwnu.edu.cn。
一、引 言
教育評價是高等教育中的重要環(huán)節(jié),關乎國家人才培養(yǎng)的方向與質量。2020年,中共中央 國務院印發(fā)《深化新時代教育評價改革總體方案》提出“創(chuàng)新評價工具,利用人工智能、大數據等現(xiàn)代信息技術,探索開展學生各年級學習情況全過程縱向評價”[1]。作為教育評價的重要形式,形成性評價與反饋有助于提升學習績效,在高等教育中的作用越來越重要[2]。形成性評價旨在幫助學生成為自主學習者,是師生在教與學過程中持續(xù)使用的、有計劃性的過程,以增加學生對特定學科學習成果的理解[3]。目前,有關人工智能在教育評價中的運用多以總結性評價為主,而人工智能在形成性評價中的應用潛力有待進一步挖掘[4]。
生成式人工智能(Generative Artificial Intelligence,簡稱GAI)是一種能生成新內容的新型人工智能。美國人工智能研究實驗室OpenAI于2022年11月發(fā)布的GAI產品ChatGPT,引發(fā)了全球教育界的關注。GAI是由大語言模型驅動的可以生成文本、代碼等內容的技術,其底層基于Transformer模型,可以根據用戶輸入的提示詞,生成相應的內容,并進行多輪智能對話,它不僅可以生成多樣化的內容資源,而且能夠實現(xiàn)智能問答,為學生提供個性化、及時的智能反饋。國內類似的GAI工具如文心一言、訊飛星火等紛紛涌現(xiàn),逐漸改變了人類的學習和思維方式。GAI具備為常見教育任務提供高質量反饋的能力,引發(fā)了全球教育工作者思考應該教會學生什么及如何開展評價的基本問題。
GAI賦能教育評價已經得到了研究者的關注[5],目前,GAI在學習與評價中的應用還存在著諸多爭議。第一,賦能還是限制?有學者認為,GAI讓老師有更多的時間專注于教學,是學習與評價的未來[6]。然而,大模型算法存在偏見,學生在面對GAI流暢的表達時缺乏批判性思考能力[7]。因此,應當禁止或限制高等教育中使用GAI。第二,剽竊還是合作?GAI在形成性評價中的運用可能使得人機合作與學業(yè)作弊之間的界限變得愈發(fā)模糊和迷離。第三,以機器還是以人為中心?以機器為中心的導向會讓學生對機器產生高度依賴,這可能陷入認知外包的陷阱。如何構建以人為中心的形成性評價路徑是亟須探討的重要方向。本研究圍繞形成性評價這一主題,在分析GAI賦能形成性評價的基礎上,從形成性評價的理念、對象、過程、結果和倫理等方面,探索GAI對形成性評價的潛在挑戰(zhàn),并提出GAI賦能形成性評價的路徑。
二、形成性評價與智能反饋的內涵
(一)形成性評價:促進學生學習
形成性評價起源于20世紀60年代,最早由布魯姆將形成性評價概念引入到教學領域[8]。布魯姆認為,形成性評價是為教與學提供反饋與糾正的評價。理解形成性評價的概念,需要辨析形成性評價與總結性評價的區(qū)別。大多數學者認為,形成性評價和總結性評價分別對應“為了學習的評價”和“對學習的評價”[8],前者的目的是促進學生有效學習的發(fā)生,而后者更多是為了鑒定學習結果。根據Black和Wiliam的觀點,形成性評價的主要策略是為促進學習者的進步提供反饋,鼓勵同伴間互助反饋,鼓勵學生成為自主學習者[9]。在形成性評價中,學習者根據來自教師、同伴或智能體等的反饋,決定如何調整學習方法與策略,促進有效學習。
(二)智能反饋:促進形成性評價
反饋已成為形成性評價的重要策略[2],它可在不同的層次發(fā)揮作用。根據Hattie和Timperley提出的促進學習的反饋模型,反饋可以作用在任務、過程、自我調節(jié)和個人四個層次[10]。常見的反饋類型有教師反饋、同伴反饋和智能反饋[11]。其中,智能反饋通過扮演學習助手的角色為學習者提供即時的自動反饋。在高等教育中,智能反饋能幫助教師減輕課堂規(guī)模增加帶來的負擔,并提高個性化支持程度[11]。研究者基于自然語言處理和認知診斷等智能技術,通過實證研究發(fā)現(xiàn)基于AI的形成性評價反饋能夠提升學習績效和自我調節(jié)學習的水平[4]。然而,大多數智能反饋方式提供了基于預定義答案或學習分析的結果,其交流與評價能力有限[12]。未來亟須探索更加個性化的智能反饋方式。GAI通過多輪對話,能夠根據學習者的學習狀態(tài)或特征提供個性化、多維的智能反饋。
三、生成式人工智能賦能形成性評價的價值
研究表明,GAI能夠創(chuàng)新評價技術和形式,通過智能反饋提高效率,助力自適應評價和個性化學習,改善可及性和包容性[13]。本研究認為,GAI可以在知識、能力和實踐三個層面,發(fā)揮創(chuàng)新評價方式、提高效率和個性化水平的價值,如圖1所示。
圖1 GAI賦能形成性評價的價值
(一)創(chuàng)新形成性評價方式
數字技術改變了形成性評價的方式,提高了測驗的靈活性[13]。然而,傳統(tǒng)數字技術更多的是將測驗題目數字化。GAI技術有望通過設計和提供復雜的形成性評價任務,使得評價更具情境性。GAI有創(chuàng)新形成性評價方式的潛力,可以將評價方式擴展到基于游戲的、交互式的模擬場景,開展互動式的情境化評價[14]?;贕AI的情境化評價具有重要的價值:第一,評估學習者高階能力。情境化評價通過評測復雜的學習成果,進而評價高階能力,如問題解決能力。第二,促進學習投入。GAI支持的評價方式通過情境感知,識別學習者需求、目標和困難,提供即時、個性化的智能反饋,實時澄清和解決學生的困惑,進而提高學習者學習投入[15]。第三,節(jié)約成本。GAI工具輔助自動生成題目,有效降低題目生成的成本和時間[16]。
(二)提高形成性評價效率
GAI賦能形成性評價有望進一步提升形成性評價效率。通過多輪對話,GAI在教師的監(jiān)督下能夠生成更加準確、客觀的教師評語[17]。在知識層面,GAI通過提供即時的文本反饋及自動化評價,幫助學生有效獲取知識,減少教師的工作量,讓教師有更多的時間與學生進行高質量的互動。在能力層面,GAI通過提供即時的、個性化的幫助,促進學生能力的提升,改善學生學習習慣。在實踐層面,GAI通過情境化任務,提供持續(xù)的高質量智能反饋,促進學生的實踐與應用。
(三)提高評價的個性化水平
GAI擅長分析和理解自然語言、圖片等多模態(tài)數據,有助于挖掘定性數據的價值,通過定性的、基于文本的分析提高分析能力和個性化水平,以便更全面地掌握學生學習情況。GAI有助于豐富形成性評價的數據種類,通過提供個性化的指導和資源,有效支持學生自定步調的個性化學習[15]。GAI可以根據學生的學習行為和文本足跡,評估個體/群體的觀點,識別學生情緒狀態(tài),進而為其提供個性化的學習評估與智能反饋[18]。GAI模型能實現(xiàn)自適應測試,根據學生的學習情況和學習特點,為其提供高自適應水平的學習評估與反饋,幫助學生了解自己的學習情況,及時調整學習策略,提高學習效果。
四、生成式人工智能賦能形成性評價的挑戰(zhàn)
形成性評價的目的是促進學生學習的發(fā)生,那么GAI賦能的形成性評價能否有效促進學習的發(fā)生,仍然面臨諸多挑戰(zhàn),主要表現(xiàn)在評價理念、對象、過程、結果和倫理方面,如圖2所示。
圖2 GAI賦能形成性評價的挑戰(zhàn)
(一)形成性評價理念:缺乏以人為中心的指導思想
高校學生自發(fā)使用GAI,禁用它變得幾乎不現(xiàn)實[15]。以人為中心的教育理念關注學生的能動性和自主性。運用GAI開展評價若缺乏以人為中心的指導思想,可能陷入以機器為中心的囹圄。以機器為中心的評價主要依據預設的規(guī)則和算法,缺乏對情境和個體差異的主觀判斷能力。機器評價通常難以充分考慮情感、文化和個體差異等方面,而這些方面在形成性評價中至關重要。缺乏以人為中心的指導思想的問題可能導致評價結果過于機械化,無法充分考慮學生的個性、情感和創(chuàng)造力等方面的因素。形成性評價不僅基于成績和行為進行量化評估,還涉及對學生全面發(fā)展的關注、關心和人文關懷。機器無法像人一樣準確理解和感知學生的情感和需求,也難以提供針對性的個性化指導和支持。
(二)形成性評價對象:依賴與高階思維的藩籬
人機協(xié)同的邊界在哪里?人機如何有效合作和最優(yōu)組合?學生用GAI完成作業(yè)的現(xiàn)象引發(fā)了教育界的普遍擔憂,原因在于學生更多地將GAI作為答案的提供者,而非學習的促進者,人機之間的關系淪為“替代”,而非“輔助”,這并非理想的人機協(xié)同狀態(tài)。GAI的便捷性和高效性使得學生容易產生依賴心理[19]。學生傾向于利用GAI來完成作業(yè),過分依賴其智能反饋提供的答案,而未能深入體驗和理解背后所蘊含的能力培養(yǎng)的過程與邏輯[20]。過度依賴GAI不僅無法促進學生的真正學習,反而可能會對他們的學習狀況產生誤導性的描述,進而影響學習效果,使得學生對自身學習情況產生錯誤評價。學生對GAI的誤用或過度依賴將會導致學生陷入認知外包的陷阱[21]。學生過度依賴機器生成的內容,會忽視對基礎知識的掌握和鞏固,缺乏批判地全盤接受GAI的輸出,會導致學生在學習過程中缺乏深度思考和自主探究的能力,進而限制學生高階思維的發(fā)展。
(三)形成性評價過程:黑箱與評價標準不明
GAI的工作原理相對復雜,涉及大規(guī)模的數據和算法。如GPT-3約有750GB的預訓練數據量,Token數量高達5千億,其參數規(guī)模達到1,750億,而GPT-4的參數達到萬億規(guī)模。深度神經網絡常被形容為“黑匣子”,其推導過程與結果依據不透明,可解釋性較弱[22]。同樣,GAI智能反饋的規(guī)則和算法也是黑箱模型,師生難以理解其評價結果底層的依據和邏輯。GAI的工作原理可能會導致機器的評價標準不明確,師生難以理解和信任機器評價發(fā)生的過程和結果。
(四)形成性評價結果:破壞準確性與公平性
GAI的興起使得傳統(tǒng)的課程評價方式受到前所未有的挑戰(zhàn)和沖擊,評價的準確性與公平性面臨巨大的考驗。GAI有可能成為多數學生書面作業(yè)的代理工廠[7]。如果學生提交的作業(yè)是由GAI生成的解決方案,而非他們親自解決問題所得出的結果,那么他們的知識和技能水平就無法得到準確的評估。試想用機器來評價機器,其評價結果肯定難以反映學生的真實水平,何談評價的準確性。教育評價往往基于學生的知識掌握和應用能力,而如果學生過度依賴機器,其真實的學習狀況和知識水平無法得到準確的反映,這不僅會影響學生的學習積極性,還可能誤導教師使用錯誤的教學策略和方法。
過程和結果公平是教育公平的重要方面。GAI可能會帶來教育過程和評價結果的不公平。在教育過程中使用GAI的學生可能比不使用GAI的學生更有優(yōu)勢,尤其對書面作業(yè)而言效果愈發(fā)明顯。如果學生使用GAI來生成高質量的書面作業(yè),而教師也很難區(qū)分文本是機器生成還是人類生成,他們可能比其他沒有使用該工具的學生獲得更高的成績,從而導致教育過程和評價結果的不公平[14]。
(五)形成性評價倫理:誘發(fā)新的倫理問題
1. 數據隱私問題
在形成性評價中使用GAI工具時,同樣存在隱私和數據安全問題[6]。利用GAI進行形成性評價需要大量的學生數據進行預訓練或人工強化反饋,由于學生數據的敏感性,會誘發(fā)對數據隱私和安全的擔憂。如學生數據泄露,或未經授權訪問學生資料,以及使用學生資料作其他用途,都將會對學生個人造成威脅[19]。同時,如果GAI系統(tǒng)的安全防護措施不到位,也可能會導致數據泄露,使得學生的敏感信息被非法獲取或濫用。由于GAI技術的高度復雜性,學生無法完全了解自己的數據在模型訓練和使用過程中的流向和用途,因此,無法對數據進行有效的控制。
2. 算法偏見問題
GAI的評價結果很大程度上依賴于訓練數據的質量。如果訓練數據存在偏見,或者數據集本身不具有廣泛性和代表性,那么GAI輸出的評價結果可能存在偏見或錯誤,對某些個體或群體產生不公平的待遇[19]。GAI輸出類似“隨機鸚鵡學舌”,輸出的好壞很大程度上取決于訓練數據。由于GAI可能會對特定群體產生偏見,在評價中使用GAI最困難的是確保反饋沒有偏見,并符合主流道德標準[23]。例如,那些在龐雜的互聯(lián)網文本語料庫上訓練的模型,在生成反饋時可能會展現(xiàn)出算法偏見和歧視傾向。另外,GAI也存在“幻覺”或編造的問題,生成看似連貫但沒有依據的答案,如GPT-3.5可能生成并不存在的參考文獻。
3. 學業(yè)作弊問題
調查研究表明,大學生使用GAI的典型場景包括課程學習、科研活動、日常生活和升學求職[24],其中,課程學習和科研活動比較常見。然而,在課程學習和學術領域中,當學生和研究人員利用這一工具時,其誠信相應地面臨著潛在的風險[25]。在生成文本的過程中,這些文本可能來源于訓練集中已有的完整句子甚至段落,從而導致版權和作弊問題。學業(yè)作弊并非新現(xiàn)象,在GAI出現(xiàn)前已然存在。然而,GAI工具在學習與評價中的應用會加劇作弊行為,腐蝕高等教育的目的,降低學位價值。學生使用GAI生成的文本給課程形成性評價帶來了獨特的挑戰(zhàn)。教師可能無法區(qū)分學生的作品是否是學生自己的所作。盡管已經出現(xiàn)專門檢測作弊的人工智能工具,如AI Text Classifier, GPTZero和AI Cheat Check等,但是這些工具同樣也不能準確區(qū)分出文本的來源[26]。
五、生成式人工智能賦能形成性評價的路徑
針對GAI賦能形成性評價存在的挑戰(zhàn),根據面向特定領域的大語言模型的形成性評價框架[27],本研究構建了以人為中心的、融合多元互證的形成性評價路徑,如圖3所示。
圖3 GAI賦能形成性評價的路徑
(一)確立形成性評價理念:形成以人為中心的導向
雖然GAI有提供個性化的智能反饋的潛力,但它不能取代人際互動在學習過程中的重要地位[23]。GAI賦能形成性評價需要摒棄以機器為中心的導向,確立以人為中心的評價理念。以人為中心的形成性評價理念不僅需要教師的參與驗證智能反饋,而且體現(xiàn)在對學生學習過程和高階思維的重視。
第一,教師需要驗證智能反饋生成。智能反饋的生成不僅依托通用大語言模型,而且需要建立在學科知識圖譜、學科問題庫和反饋庫等知識庫的基礎上。其中,學科問題庫是針對學科領域高質量的問—答集合,反饋庫涵蓋學科問題解決方法和常見錯誤,為學生提供高質量的智能反饋。教師需要在“回路”,參與設計與檢驗,確保智能反饋對學生思維發(fā)展具有良好的引導性。
第二,教師需要重視學生的學習過程。在形成性評價中,教師不僅要評價學生最終的作品,而且需要支持與監(jiān)督學生的學習過程。教師可以通過提問等形式督促學生的學習過程,同時可以采用不同形式的支架策略促進學生的深度參與。師生需要具備較高的人工智能素養(yǎng),如有效使用GAI的知識和技能,能與GAI進行有效的溝通和協(xié)作,并在各種場景中使用GAI工具,批判性地評估GAI的輸出結果,具備GAI使用的倫理和道德意識[15],了解GAI的工作原理,能夠有效地與GAI互動,從而有效地使用GAI支持課堂教學與評價。
第三,以人為中心的評價理念更加重視學生的高階思維。大模型的思維鏈方法符合人腦的思維模式,廣泛應用于激發(fā)大語言模型的多步推理能力。通過思維鏈方法,大語言模型具備知識的“涌現(xiàn)”能力。以人為中心的評價理念需要運用教育提示語工程[28],挖掘大模型的知識涌現(xiàn)能力,引導學生成為積極主動的參與者,而不是被動的知識接受者。教育提示語工程可以使學生掌握與GAI對話的技巧,獲得高質量的智能反饋,保護學生獨立思考的能力,而不是被GAI單方面牽制。通過引導學生合理使用GAI,促進學生高階思維的發(fā)展,實現(xiàn)更好的學習效果。
(二)轉變形成性評價的方式:減輕黑箱模型的影響
由于GAI工具的存在,高等教育應該終結以論文為作業(yè)的評價方式[29]。為了減輕黑箱模型的影響,高等教育需要進一步轉變形成性評價方式,明確過程評價標準,學生應該更多地通過協(xié)作分享、匯報交流的形式,向教師和同學展示他們的想法。為了避免學生依賴GAI不假思考地完成作業(yè),可以布置多模態(tài)類型作業(yè)[16],同時進一步優(yōu)化作業(yè)要求,如要求結合課堂筆記、小組協(xié)作等。此外,還可以應用一些先進的抄襲檢測工具以檢測學生的作業(yè),防止學生潛在的剽竊行為[30]。在評價的設計和內容上,應降低對記憶性知識的依賴,將重心轉移至所學知識在實踐情境中的靈活運用能力、問題解決能力,采用情境化測評,考查學生批判性和創(chuàng)造性思維,注重高階思維的評價。高等教育工作者應該轉變評價思維方式,具備提出問題比直接獲取答案更重要,整合觀點比羅列觀點更重要的評價意識[31]。
(三)促進學生高階思維的發(fā)展:明確人機協(xié)同的邊界
為了避免師生對GAI的過度依賴,GAI賦能形成性評價需要進一步明確人機協(xié)同的邊界。理想的人機協(xié)同并非一切交給機器代勞,機器并不能代替學生的思維過程,尤其是高階思維的過程。為了促進學生高階思維的發(fā)展,需要在獨立解決問題和尋求GAI幫助之間尋求平衡,明確人機協(xié)同的邊界,為特定領域微調模型,定制機器的反饋風格,并讓學生學會用GAI學習[15]。
第一,明確規(guī)定GAI工具的可接受和不可接受的用途。為了減輕潛在風險和挑戰(zhàn),應該制定明確的使用方案,指導學生如何在課程學習和評價中使用GAI工具。為學生提供一個明確的框架,明確GAI用途接受的界限,如使用GAI進行頭腦風暴可以接受,而直接復制GAI的反饋內容作為自己的想法或作業(yè)是不可以接受的,并引導學生以透明和負責任的方式聲明GAI工具的使用情況。
第二,有監(jiān)督地微調模型,重新設計反饋風格。GAI的開發(fā)一般是為其通用目的,其性能可能因特定領域訓練數據不足而出現(xiàn)偏差[32]。為了在教育情境中更好地應用,需要針對特定學科導入領域知識庫,通過在特定教育領域的小規(guī)模數據集上有監(jiān)督地微調模型,幫助GAI模型在特定領域變得更加精通和敏感。同時,通過角色身份設定、開場語設置、提問預設和對話模擬等,創(chuàng)建智能反饋問答應用,進而改善GAI的反饋風格。此外,還需要兼顧教育價值和目的,設計一種定制的啟發(fā)式、引導式和追問式的反饋風格,通過提供腳手架、言語鼓勵等反饋,為學生創(chuàng)造一個支持性的學習環(huán)境。
第三,學會用人工智能學習。學生會使用GAI并不等于用GAI學習[15]。用GAI學習不僅僅意味著會操作,還要求學生具備提問策略,能設計適當的提示語。學會用GAI學習是一個迭代的過程,在這個過程中學生探索和識別獲取有效反饋的策略,進而實現(xiàn)學習目標。這個過程可能并非一帆風順,學生需要測試與GAI模型交互的最佳路徑,調整他們對模型的期望,提高自主學習的能力[15]。
(四)保障評價的準確與公平:豐富多元反饋互證
為了形成性評價更準確和公平,教師可以通過教師反饋、同伴反饋和智能反饋等多元反饋相互佐證。第一,教師對學生學習的過程和結果進行監(jiān)督與反饋;第二,同伴之間相互對學習過程和結果進行互評與反饋;第三,GAI智能反饋主要指運用恰當的提示語,針對具體學習任務,聚焦學生學習過程中的任務、過程、自我調節(jié)和個體等層面,提供針對性的評價與建議;第四,通過融合多元信息與反饋,將人類評價反饋與GAI智能反饋的相互佐證,多元參與引導GAI評價反饋的過程,監(jiān)督GAI評價的結果,提高GAI智能反饋的準確性。
已有研究發(fā)現(xiàn),GAI支持的形成性評價能根據學習過程數據,為學習者提供更加精準、個性化的評價反饋[17]。GAI智能反饋的主要體現(xiàn)在對任務、過程、自我調節(jié)和個人等維度的評價反饋[33]。第一,任務反饋指針對學生的任務完成情況提供反饋,如學生的解決方案是否正確,錯誤的原因及建議;第二,過程反饋指針對學生完成任務的過程提供反饋,如是否使用與過程相關的步驟或策略;第三,自我調節(jié)反饋指針對學生完成任務的自我調節(jié)過程提供反饋,如群體協(xié)作分工、計劃進度和元認知策略等;第四,個人反饋指針對學習者而不是任務的評價反饋,如對學習者的表揚。本研究以“人工智能及教育應用”課程為例,結合小組研討任務,通過調用API接口,采用GPT-4對學習過程進行多維評價反饋,見表1。
(五)規(guī)范形成性評價倫理:強化多方聯(lián)合行動
規(guī)范形成性評價倫理,保護學生信息安全,需要進一步強化國家、高校和教師等多方聯(lián)合行動。在國家層面,為了在教育評價中負責任地利用GAI,需要制定一系列相關的政策法規(guī)。根據《生成式人工智能服務管理暫行辦法》,GAI的服務提供者,應當“使用具有合法來源的數據,增強訓練數據的真實性、準確性、客觀性和多樣性”[34]。另外,教育、科技等部門應當根據各自的職責,依法加強對GAI的管理,引導教師與學生合理、安全和負責任地使用GAI。
在學校層面,高校必須明確師生應用GAI的規(guī)范與邊界,同時確保如何保護和使用師生的數據。數據隱私是決定是否使用GAI時要考慮的重要因素。高校必須制定詳細的規(guī)則,通過具體實踐來保護學生的數據安全和隱私[23]。在評價實踐中,建立校園網對GAI的統(tǒng)一訪問入口,減少學生的個人信息在外部網絡平臺泄露的風險,確保數據在傳輸和存儲過程中的安全可控。
在教師層面,通過合理設計形成性評價任務,減少學業(yè)作弊的發(fā)生。防止學業(yè)作弊最有效的方法之一是教育學生什么是作弊和抄襲[14]。對于學生使用GAI完成作業(yè)的現(xiàn)象,教師應該加強對學生的教育,幫助學生樹立對GAI的正確認識,意識到其潛在危害,同時聯(lián)合家長或監(jiān)護人,加強對學生的智能素養(yǎng)教育,提高學生對GAI使用的道德意識。不僅如此,在平時的教學和評價中,為了防范學生濫用GAI,教師可以開展GAI相關的教育活動,如告訴學生文本生成和想法生成之間的區(qū)別[35],學業(yè)不端的界限與后果等。為了讓學生安全、負責任地使用GAI,與GAI一起學習,國家、學校和師生等應多方共同努力,形成一種安全使用、道德誠信和負責任的文化,以阻止學業(yè)抄襲等學術不端問題,規(guī)范評價倫理,促進健康的、安全的、有效的學習發(fā)生。
六、結 束 語
GAI通過智能反饋與多輪對話,具備賦能形成性評價的價值與潛力,有望創(chuàng)設一種新型的人機協(xié)同形成性評價路徑。本研究聚焦高等教育形成性評價領域,在分析GAI賦能形成性評價的價值基礎上,從形成性評價理念、對象、過程、結果和倫理等方面探討了GAI對形成性評價的挑戰(zhàn)。針對GAI應用于形成性評價的挑戰(zhàn),本研究總結了GAI賦能形成性評價的實施路徑。此外,本研究還厘清了GAI賦能形成性評價的價值與挑戰(zhàn),有利于教育工作者更好地運用人工智能技術助力形成性評價,打破技術依賴與思維的藩籬,促進學生有效學習的發(fā)生。后續(xù)研究應深入探索學生與GAI互動的過程和模式,以及GAI賦能形成性評價的效果,促進教育評價向個性化、多元化、智能化方向發(fā)展。
[參考文獻]
[1] 中共中央 國務院. 中共中央 國務院印發(fā)《深化新時代教育評價改革總體方案》[EB/OL]. (2020-10-13)[2024-05-07]. http://www.gov.cn/zhengce/2020-10/13/content_5551032.htm.
[2] MORRIS R, PERRY T, WARDLE L. Formative assessment and feedback for learning in higher education: a systematic review[J]. Review of education, 2021,9(3):1-26.
[3] BLACK P, WILIAM D. Developing the theory of formative assessment[J]. Educational assessment, evaluation and accountability,2009,21:5-31.
[4] LIAO X, ZHANG X, WANG Z, et al. Design and implementation of an AI-enabled visual report tool as formative assessment to promote learning achievement and self-regulated learning: an experimental study[J]. British journal of educational technology, 2024,55:1253-1276.
[5] 白雪梅,郭日發(fā). 生成式人工智能何以賦能學習、能力與評價?[J]. 現(xiàn)代教育技術,2024(1):55-63.
[6] BAIDOO-ANU D, ANSAH L O. Education in the era of generative artificial intelligence (AI): understanding the potential benefits of ChatGPT in promoting teaching and learning[J]. Journal of AI,2023,7(1):52-56.
[7] 李海峰,王煒. 生成式人工智能時代的學生作業(yè)設計與評價[J]. 開放教育研究,2023,29(3):31-39.
[8] 王爍,宗序連. 形成性評價的理論內涵與實踐反思[J]. 教學與管理,2020(15):1-4.
[9] BLACK P, WILIAM D. Classroom assessment and pedagogy[J]. Assessment in education: principles, policy & practice, 2018,25(6):551-575.
[10] HATTIE J, TIMPERLEY H. The power of feedback[J]. Review of educational research, 2007,77(1):81-112.
[11] TASKIRAN A, GOKSEL N. Automated feedback and teacher feedback: writing achievement in learning English as a foreign language at a distance[J]. Turkish online journal of distance education, 2022,23(2):120-139.
[12] DEEVA G, BOGDANOVA D, SERRAL E, et al. A review of automated feedback systems for learners: classification framework, challenges and opportunities[J]. Computers & education, 2021,162:1-43.
[13] MAO J, CHEN B, LIU J C. Generative artificial intelligence in education and its implications for assessment[J]. TechTrends, 2024,68(1):58-66.
[14] COTTON D R, COTTON P A, SHIPWAY J R. Chatting and cheating: ensuring academic integrity in the era of ChatGPT[J]. Innovations in education and teaching international,2023,61(2):228-239.
[15] DAI Y, LIU A, LIM C P. Reconceptualizing ChatGPT and generative AI as a student-driven innovation in higher education[J]. Procedia CIRP, 2023,119:84-90.
[16] 劉明,郭爍,吳忠明,等. 生成式人工智能重塑高等教育形態(tài):內容、案例與路徑[J]. 電化教育研究,2024(6):57-65.
[17] 羅恒,廖小芳,茹琦琦,等. 生成式人工智能支持的教師評語研究:基于初中數學課堂的實踐探索[J]. 電化教育研究,2024,45(5):58-66.
[18] TAN S C, CHEN W, CHUA B L. Leveraging generative artificial intelligence based on large language models for collaborative learning[J]. Learning: research and practice, 2023,9(2):125-134.
[19] KASNECI E, SE?覻LER K, K?譈CHEMANN S, et al. ChatGPT for good? On opportunities and challenges of large language models for education[J]. Learning and individual differences,2023,21:104-110.
[20] EXTANCE A. ChatGPT has entered the classroom: how LLMs could transform education[J]. Nature, 2023,623:474-477.
[21] 余勝泉,汪凡淙. 人工智能教育應用的認知外包陷阱及其跨越[J]. 電化教育研究,2023,44(12):5-13.
[22] 蘭國帥,杜水蓮,宋帆,等. 生成式人工智能教育:關鍵爭議、促進方法與未來議題——UNESCO《生成式人工智能教育和研究應用指南》報告要點與思考[J]. 開放教育研究,2023,29(6):15-26.
[23] RAWAS S. ChatGPT: empowering lifelong learning in the digital age of higher education[J]. Education and information technologies,2024,29:6895-6908.
[24] 李艷,許潔,賈程媛 翟雪松. 大學生生成式人工智能應用現(xiàn)狀與思考——基于浙江大學的調查[J]. 開放教育研究,2024(1):89-98.
[25] LEE J. Y. Can an artificial intelligence chatbot be the author of a scholarly article?[J]. Journal of Educational Evaluation,2023,20:1-6.
[26] BOWER M, TORRINGTON J, LAI J. et al. How should we change teaching and assessment in response to increasingly powerful generative Artificial Intelligence? Outcomes of the ChatGPT teacher survey[J]. Education and information technologies, 2024:1-37.
[27] T?魪LLEZ N R, VILLELA P R, BAUTISTA R B. Evaluating ChatGPT-generated linear algebra formative assessments[J]. International journal of interactive multimedia & artificial intelligence,2024,8(5):75-82.
[28] 趙曉偉,祝智庭,沈書生. 教育提示語工程:構建數智時代的認識論新話語[J]. 中國遠程教育,2023(11):22-31.
[29] STOKEL-WALKER C. AI bot ChatGPT writes smart essays: should professors worry?[J]. Nature, 2022, Dec, 9.
[30] RAHMAN M M, WATANOBE Y. ChatGPT for education and research: opportunities, threats, and strategies[J]. Applied sciences, 2023,13(9):1-21.
[31] 沈書生,祝智庭. ChatGPT類產品:內在機制及其對學習評價的影響[J]. 中國遠程教育,2023,43(4):8-15.
[32] 王帥杰,湯倩雯,楊啟光. 生成式人工智能在教育應用中的國際觀察:挑戰(zhàn)、應對與鏡鑒[J]. 電化教育研究,2024,45(5):106-112,120.
[33] MANDOUIT L, HATTIE J. Revisiting "The Power of Feedback" from the perspective of the learner[J]. Learning and instruction, 2023,84:1-9.
[34] 中華人民共和國國家互聯(lián)網信息辦公室.生成式人工智能服務管理暫行辦法[EB/OL]. (2023-07-13) [2024-09-24]. https://www.cac.gov.cn/2023-07/13/c_1690898327029107.htm.
[35] VARGAS-MURILLO A R, DE LA ASUNCION I N M, DE JES■S GUEVARA-SOTO F. Challenges and Opportunities of AI-assisted learning: a systematic literature review on the impact of ChatGPT usage in higher education[J]. Learning, teaching and educational research,2023,45:101-110.
The Value, Challenges and Pathways of Generative Artificial Intelligence in Empowering Formative Assessment in Higher Education
LU Guoqing, YANG Qin, HE Xiangchun
(School of Educational Technology, Northwest Normal University, Lanzhou Gansu 730030)
[Abstract] Generative artificial intelligence (GAI) has already acquired the important ability to engage in meaningful multi-round dialogues with humans. Traditional formative assessment in higher education is deficient in timeliness and personalization. How to use generative artificial intelligence to optimize the assessment process in higher education has become a common concern in education sector. This study aimed to provide intelligent feedback through generative artificial intelligence to optimize formative assessment and increase the efficiency and personalization of assessment, which could in turn promote effective learning. Using literature research method and inductive method, this study focused on formative assessment. On the basis of exploring GAI-empowered formative assessment in higher education, this study explores the challenges of GAI-empowered formative assessment in terms of the concept, object, process, result and ethics. It also proposes the pathway for GAI-empowered formative assessment. This study provides references and insights for better GAI-empowered formative assessment in higher education.
[Keywords] Generative Artificial Intelligence; Intelligent Feedback; Educational Assessment; Formative Assessment; Technology Empowerment
DOI:10.13811/j.cnki.eer.2024.11.012
基金項目:2024年度中央引導地方科技發(fā)展資金項目“教師專業(yè)能力智能測評與人機協(xié)同教學關鍵技術研究與系統(tǒng)研發(fā)”(項目編號:24ZYQA038);2024年度國家自然科學基金資助項目“基于多模態(tài)數據的混合學習情境投入分析模型與干預研究”(項目編號:62467007)