• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      教育大語(yǔ)言模型的內(nèi)涵、構(gòu)建和挑戰(zhàn)

      2024-10-11 00:00:00劉明吳忠明楊簫郭爍廖劍

      摘要:大語(yǔ)言模型作為新一代人工智能的核心技術(shù),為教育領(lǐng)域帶來(lái)前所未有的機(jī)遇。但由于以ChatGPT為代表的通用大語(yǔ)言模型僅能提供通用型反饋,難以與復(fù)雜的教育場(chǎng)景、育人方式相匹配,因而亟需構(gòu)建專(zhuān)用的教育大語(yǔ)言模型。教育大語(yǔ)言模型具有教育知識(shí)庫(kù)的全面性、教學(xué)內(nèi)容生成的安全性、反饋信息的教育價(jià)值性、問(wèn)題解決的個(gè)性化、人機(jī)交互的多模態(tài)性、用戶使用的易用性等特點(diǎn)和優(yōu)勢(shì)。其構(gòu)建流程主要包括6個(gè)步驟:一是制定教育目標(biāo),預(yù)設(shè)模型構(gòu)建標(biāo)準(zhǔn)與技術(shù)范式;二是選擇或設(shè)計(jì)大語(yǔ)言模型基座,對(duì)齊教育任務(wù)屬性;三是構(gòu)建教育語(yǔ)料庫(kù),實(shí)現(xiàn)無(wú)序數(shù)據(jù)的教育價(jià)值轉(zhuǎn)向;四是開(kāi)展模型訓(xùn)練或提示,獲得教育任務(wù)通用和細(xì)粒度知識(shí);五是鏈接外部教育知識(shí)庫(kù),靈活擴(kuò)展模型知識(shí)和學(xué)生模型;六是評(píng)價(jià)教育大語(yǔ)言模型,讓模型“懂人理”。當(dāng)前教育大語(yǔ)言模型的應(yīng)用主要聚焦編程、課后閱讀和計(jì)算機(jī)教育三類(lèi)教學(xué)場(chǎng)景,有助于學(xué)生計(jì)算思維、提問(wèn)能力和編程技能等高階能力和學(xué)科基本能力的提升。未來(lái)教育大語(yǔ)言模型應(yīng)由多方合力共建語(yǔ)料庫(kù)與知識(shí)庫(kù)以統(tǒng)一標(biāo)準(zhǔn),嘗試應(yīng)用新技術(shù)以破解多模態(tài)理解缺陷和計(jì)算困境,深入探索人機(jī)協(xié)同教學(xué)機(jī)制以實(shí)現(xiàn)其與高階教育目標(biāo)的匹配。

      關(guān)鍵詞:教育大語(yǔ)言模型;生成式人工智能;人工智能教育應(yīng)用;知識(shí)增強(qiáng)

      中圖分類(lèi)號(hào):G434 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-5195(2024)05-0050-11 doi10.3969/j.issn.1009-5195.2024.05.006

      基金項(xiàng)目:2024年度國(guó)家自然科學(xué)基金面上項(xiàng)目“知識(shí)增強(qiáng)大語(yǔ)言模型的科學(xué)課教學(xué)問(wèn)題智能生成方法研究”(62477039);2024年度重慶市教育委員會(huì)科學(xué)技術(shù)研究計(jì)劃重點(diǎn)項(xiàng)目“個(gè)性化科學(xué)教育大語(yǔ)言模型的關(guān)鍵技術(shù)與應(yīng)用示范研究”(KJZD-K202400208)。

      作者簡(jiǎn)介:劉明,博士,教授,博士生導(dǎo)師,西南大學(xué)教育學(xué)部(重慶 400715);吳忠明,博士研究生,西南大學(xué)教育學(xué)部(重慶 400715);楊簫,碩士研究生,西南大學(xué)教育學(xué)部(重慶 400715);郭爍,博士研究生,西南大學(xué)教育學(xué)部(重慶 400715);廖劍,博士,副教授,碩士生導(dǎo)師,西南大學(xué)教育學(xué)部(重慶 400715)。

      黨的二十大報(bào)告提出,要“構(gòu)建新一代信息技術(shù)、人工智能、生物技術(shù)、新能源、新材料、高端裝備、綠色環(huán)保等一批新的增長(zhǎng)引擎”,“推進(jìn)教育數(shù)字化”(新華社,2022)。教育數(shù)字化轉(zhuǎn)型既是構(gòu)建教育新生態(tài)、支撐教育高質(zhì)量發(fā)展的必由之路(祝智庭等,2022),也是推進(jìn)教育公平發(fā)展的有效途徑。教育部懷進(jìn)鵬部長(zhǎng)在談及教育、科技、人才、創(chuàng)新等領(lǐng)域的改革時(shí)亦指出,要“大力推進(jìn)智慧校園建設(shè),打造中國(guó)版人工智能教育大模型”(中華人民共和國(guó)教育部,2024)。面對(duì)新一輪科技革命和產(chǎn)業(yè)變革的深入發(fā)展,以生成式人工智能為代表的新一代人工智能技術(shù)成為引領(lǐng)教育數(shù)字化轉(zhuǎn)型的重要驅(qū)動(dòng)力,將推動(dòng)教育領(lǐng)域迎來(lái)人機(jī)協(xié)同、跨界融合、共創(chuàng)共享的新時(shí)代(戴嶺等,2023)。大語(yǔ)言模型作為新一代人工智能的核心技術(shù),主要有兩大發(fā)展方向:一是以ChatGPT為代表的通用大語(yǔ)言模型,二是針對(duì)特定領(lǐng)域或任務(wù)進(jìn)行優(yōu)化設(shè)計(jì)的專(zhuān)用大語(yǔ)言模型。由于教育內(nèi)容的復(fù)雜性、教育場(chǎng)景的多樣性和教育形式的靈活性,傳統(tǒng)通用大語(yǔ)言模型難以充分理解教育場(chǎng)景和信息的內(nèi)在關(guān)系,其普適化、通用化的生成內(nèi)容無(wú)法與現(xiàn)實(shí)教育內(nèi)容及教育主體高度匹配,也難以實(shí)現(xiàn)與教育場(chǎng)景的深度耦合,因此教育領(lǐng)域亟需設(shè)計(jì)、開(kāi)發(fā)和構(gòu)建專(zhuān)用的教育大語(yǔ)言模型。本研究通過(guò)分析當(dāng)前國(guó)內(nèi)外主流的教育領(lǐng)域大語(yǔ)言模型的類(lèi)型、技術(shù)特征和優(yōu)缺點(diǎn),提出了教育大語(yǔ)言模型的主要內(nèi)涵與特征,描述了教育大語(yǔ)言模型的主要構(gòu)建方法與流程,并探討了當(dāng)前教育大語(yǔ)言模型開(kāi)發(fā)與建設(shè)面臨的挑戰(zhàn)與應(yīng)對(duì)策略,以期為新一代人工智能賦能教育數(shù)字化轉(zhuǎn)型提供參考。

      一、大語(yǔ)言模型教育應(yīng)用綜述

      隨著2022年ChatGPT將大語(yǔ)言模型引入大眾視野,大語(yǔ)言模型行業(yè)發(fā)展如火如荼,諸如LLaMA、OPT、Baichuan等開(kāi)源大語(yǔ)言模型如雨后春筍般發(fā)布,為垂直領(lǐng)域的教育大語(yǔ)言模型奠定了良好的技術(shù)基座。通過(guò)對(duì)近三年教育領(lǐng)域大語(yǔ)言模型相關(guān)的學(xué)術(shù)論文、行業(yè)咨詢(xún)報(bào)告、Github開(kāi)源項(xiàng)目以及開(kāi)源數(shù)據(jù)競(jìng)賽等進(jìn)行檢索,本研究共梳理出29個(gè)可應(yīng)用于教育領(lǐng)域的大語(yǔ)言模型。進(jìn)一步分析發(fā)現(xiàn),當(dāng)前對(duì)教育領(lǐng)域大語(yǔ)言模型的探索處于起步階段,研究主體主要是商業(yè)公司和高校研究團(tuán)隊(duì);研究平臺(tái)主要有兩類(lèi):一是企業(yè)、高?;蜓芯吭涸O(shè)立的研究平臺(tái),二是以開(kāi)源數(shù)據(jù)競(jìng)賽、國(guó)際教育會(huì)議工作坊等為支撐的開(kāi)放平臺(tái)。

      從教育應(yīng)用視角出發(fā),本研究將教育領(lǐng)域大語(yǔ)言模型劃分為通用型教育大語(yǔ)言模型、指令微調(diào)型教育大語(yǔ)言模型、數(shù)據(jù)驅(qū)動(dòng)型教育大語(yǔ)言模型和知識(shí)增強(qiáng)型教育大語(yǔ)言模型四種技術(shù)范式。表1對(duì)15個(gè)主流教育領(lǐng)域的大語(yǔ)言模型的應(yīng)用場(chǎng)景、特點(diǎn)與不足等進(jìn)行了梳理和比較。

      1.通用型教育大語(yǔ)言模型

      通用型教育大語(yǔ)言模型是指在特定教育任務(wù)或教學(xué)活動(dòng)的指導(dǎo)下,教育用戶直接利用ChatGPT、星火認(rèn)知大模型等對(duì)話式聊天機(jī)器人和開(kāi)源大語(yǔ)言模型的通用知識(shí),通過(guò)主動(dòng)對(duì)話的形式解決教育問(wèn)題、輔助教學(xué)活動(dòng)的大語(yǔ)言模型。較為常見(jiàn)的工具有ChatGPT、星火認(rèn)知大模型、文心一言等。該范式是大語(yǔ)言模型教育應(yīng)用的初等形態(tài),研究者已在啟發(fā)式對(duì)話教學(xué)(李海峰等,2024)、學(xué)習(xí)行為分析(Snyder et al.,2024)和作業(yè)評(píng)價(jià)(王麗等,2023)等場(chǎng)景下開(kāi)展了教育應(yīng)用,具有適用場(chǎng)域廣泛、教育實(shí)效明顯、師生使用部署便捷等優(yōu)勢(shì),但也存在因模型閉源和領(lǐng)域深度知識(shí)缺失而帶來(lái)的教育提示語(yǔ)編寫(xiě)困難、反饋的教育價(jià)值不高、復(fù)雜教育任務(wù)場(chǎng)景下準(zhǔn)確度不足、數(shù)據(jù)隱私與安全隱患等問(wèn)題。

      2.指令微調(diào)型教育大語(yǔ)言模型

      指令微調(diào)型教育大語(yǔ)言模型是指在特定教育任務(wù)引導(dǎo)下,通過(guò)構(gòu)建基于教育學(xué)或心理學(xué)理論指導(dǎo)的結(jié)構(gòu)化文本,來(lái)表達(dá)規(guī)范的教育微調(diào)數(shù)據(jù)集、微調(diào)指令數(shù)據(jù)集或教育提示語(yǔ),以此對(duì)通用大語(yǔ)言模型開(kāi)展提示輸出或指令調(diào)優(yōu)訓(xùn)練的垂直領(lǐng)域大語(yǔ)言模型。此類(lèi)范式下,最具代表性的模型有國(guó)際中文教育大語(yǔ)言模型“桃李”、九章大模型(MathGPT)、中文兒童陪伴大語(yǔ)言模型“巧板”,以及用于教育文本評(píng)估、課堂活動(dòng)指導(dǎo)和教學(xué)問(wèn)答的大語(yǔ)言模型“Merlyn Edu”(Jagmohan et al.,2023)。有學(xué)者使用DistilBERT-66M模型和自整理數(shù)據(jù)集,經(jīng)微調(diào)形成了支持“困惑、情感和緊迫”三個(gè)維度的在線課堂分析大語(yǔ)言模型(Clavié et al.,2019)。此類(lèi)教育大語(yǔ)言模型在保留原有基座模型泛化能力的基礎(chǔ)上,簡(jiǎn)化了師生撰寫(xiě)復(fù)雜教育提示語(yǔ)的過(guò)程,提升了模型反饋的教育價(jià)值,也提高了目標(biāo)教育任務(wù)的準(zhǔn)確度。但由于其有效微調(diào)指令數(shù)據(jù)量不足和不均衡等因素,使得此類(lèi)范式下的教育大語(yǔ)言模型缺乏對(duì)學(xué)科知識(shí)的認(rèn)知,進(jìn)而導(dǎo)致其在復(fù)雜任務(wù)場(chǎng)景下的反饋效果不佳、模型過(guò)擬合,甚至生成有害信息等。

      3.數(shù)據(jù)驅(qū)動(dòng)型教育大語(yǔ)言模型

      數(shù)據(jù)驅(qū)動(dòng)型教育大語(yǔ)言模型是指在指令微調(diào)型教育大語(yǔ)言模型構(gòu)建過(guò)程中,在開(kāi)展指令微調(diào)前,使用與任務(wù)相關(guān)的公共數(shù)據(jù)集或通用教育數(shù)據(jù)集構(gòu)建預(yù)訓(xùn)練數(shù)據(jù)集(如教學(xué)數(shù)據(jù)、百科知識(shí)等),對(duì)大語(yǔ)言模型基座進(jìn)行預(yù)訓(xùn)練,進(jìn)而實(shí)現(xiàn)“預(yù)訓(xùn)練+微調(diào)”雙階段訓(xùn)練的教育大語(yǔ)言模型。此類(lèi)范式下,代表性的研究有:其一,Bulathwela等(2023)基于T5基座模型,使用開(kāi)源S2ORC數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練,并使用SQuAD、SciQ開(kāi)源問(wèn)答數(shù)據(jù)集進(jìn)行兩階段微調(diào),構(gòu)建了教育問(wèn)題生成大語(yǔ)言模型“EduQG+”。其二,MetaAI自研了基于自回歸架構(gòu)的大語(yǔ)言模型,從預(yù)印本服務(wù)器、Semantic Scholar、教材、PubChem、Common Crawl等資源中過(guò)濾并構(gòu)建了880億Token論文數(shù)據(jù)庫(kù)、70億Token引文數(shù)據(jù)庫(kù)、科學(xué)知識(shí)庫(kù)、學(xué)術(shù)與科學(xué)語(yǔ)料庫(kù)、科學(xué)領(lǐng)域代碼數(shù)據(jù)庫(kù),由此構(gòu)建了用于科學(xué)知識(shí)推理、檢索與組合的教育大語(yǔ)言模型“Galactica”(Taylor et al.,2022)。其三,Zhao等(2024)基于LLaMA-13B基座模型,使用化學(xué)論文和課本數(shù)據(jù)庫(kù)進(jìn)行預(yù)訓(xùn)練,并使用科學(xué)相關(guān)文本提示語(yǔ)進(jìn)行指令調(diào)優(yōu),最終構(gòu)建了可實(shí)現(xiàn)化學(xué)知識(shí)問(wèn)答、分子式設(shè)計(jì)與反應(yīng)分析的化學(xué)教育大語(yǔ)言模型“ChemDFM”。相較于指令微調(diào)型教育大語(yǔ)言模型,此類(lèi)教育大語(yǔ)言模型一定程度上解決了準(zhǔn)確性、過(guò)擬合和有害信息等問(wèn)題;但因訓(xùn)練數(shù)據(jù)質(zhì)量參差不齊、知識(shí)時(shí)效性難以保障、多模態(tài)表示缺失等因素,致使該模型面對(duì)新知識(shí)時(shí)可能仍無(wú)法滿足教育任務(wù)的需要,同時(shí)生成內(nèi)容的深度也存在不足。

      4.知識(shí)增強(qiáng)型教育大語(yǔ)言模型

      知識(shí)增強(qiáng)型教育大語(yǔ)言模型是指在上述教育大語(yǔ)言模型進(jìn)行推理、生成響應(yīng)之前,充分引入檢索增強(qiáng)生成(Retrieval-Augmented Generation,RAG)技術(shù),通過(guò)檢索模型輸入與預(yù)設(shè)外部教育知識(shí)庫(kù)(如教材、學(xué)科知識(shí)圖譜等)的相關(guān)內(nèi)容或引用網(wǎng)絡(luò)搜索引擎檢索結(jié)果,以實(shí)現(xiàn)對(duì)教育大語(yǔ)言模型的輸出優(yōu)化。例如,華東師范大學(xué)的社會(huì)認(rèn)知計(jì)算團(tuán)隊(duì)基于LLaMA-7B/13B基座,在教育學(xué)與心理學(xué)理論指導(dǎo)下,以自建中文教材與經(jīng)過(guò)過(guò)濾的開(kāi)源指令調(diào)優(yōu)對(duì)話數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練,并以自建問(wèn)答、情感支持、啟發(fā)式對(duì)話和論文評(píng)估等數(shù)據(jù)集進(jìn)行微調(diào),同時(shí)整合了基于搜索引擎的檢索增強(qiáng)技術(shù),由此構(gòu)建了可用于知識(shí)問(wèn)答、情感咨詢(xún)、產(chǎn)婆術(shù)對(duì)話教學(xué)與文本評(píng)估等眾多教育場(chǎng)景的教育對(duì)話大語(yǔ)言模型“EduChat”(Dan et al.,2023)。浙江大學(xué)的研究團(tuán)隊(duì)基于Qwen-7B基座模型,首先利用通用中文語(yǔ)料庫(kù)對(duì)其進(jìn)行微調(diào);其次利用教材類(lèi)的教育權(quán)威知識(shí)庫(kù)構(gòu)建本地知識(shí)庫(kù),并以此對(duì)模型進(jìn)行第二輪無(wú)監(jiān)督微調(diào);隨后基于布魯姆分類(lèi)法在多種教育任務(wù)場(chǎng)景中構(gòu)建指標(biāo)模板,以此收集教育指令數(shù)據(jù)集并進(jìn)行第三輪指令微調(diào);最后引入基于本地知識(shí)庫(kù)和搜索引擎兩類(lèi)檢索方法進(jìn)行輸出結(jié)果優(yōu)化,由此構(gòu)建了檢索增強(qiáng)的教育大語(yǔ)言模型“智?!龢?lè)”(WisdomBot)。方略研究院(2024)利用GPT結(jié)構(gòu)大語(yǔ)言模型,運(yùn)用自建的互聯(lián)網(wǎng)內(nèi)容數(shù)據(jù)、高校管理與研究的智庫(kù)數(shù)據(jù)、人類(lèi)反饋數(shù)據(jù),以及持續(xù)更新的高等教育業(yè)務(wù)場(chǎng)景和主題知識(shí)庫(kù),構(gòu)建了面向高校管理和智庫(kù)咨詢(xún)的教育大語(yǔ)言模型“一答”。此類(lèi)技術(shù)范式能夠通過(guò)引入外部知識(shí)庫(kù)的方式,實(shí)現(xiàn)教育大語(yǔ)言模型的知識(shí)可持續(xù)更新,并進(jìn)一步提升反饋的準(zhǔn)確性和實(shí)用性。然而,由于現(xiàn)有研究中普遍缺乏其與學(xué)生畫(huà)像或?qū)W生模型的有效整合,進(jìn)而導(dǎo)致其普遍存在個(gè)性化學(xué)習(xí)支持不足的問(wèn)題。

      基于上述分析,本研究從大語(yǔ)言模型教育應(yīng)用的技術(shù)范式、場(chǎng)景應(yīng)用、教育反饋價(jià)值和教育知識(shí)深度四個(gè)方面構(gòu)建了如圖1所示的大語(yǔ)言模型教育應(yīng)用發(fā)展框架。當(dāng)前大語(yǔ)言模型的教育應(yīng)用已基本涵蓋智慧教學(xué)、智慧學(xué)習(xí)、智慧管理與智慧評(píng)價(jià)四大場(chǎng)景,但多以智慧學(xué)習(xí)和評(píng)價(jià)場(chǎng)景為主。隨著技術(shù)手段的不斷精進(jìn),以指令微調(diào)、教育大數(shù)據(jù)預(yù)訓(xùn)練、知識(shí)增強(qiáng)等技術(shù)對(duì)大語(yǔ)言模型進(jìn)行二次或多次開(kāi)發(fā)的教育WTXdSHSFlmW5dPlzHWlDrg==大語(yǔ)言模型將會(huì)不斷涌現(xiàn),其不僅能降低教育用戶的使用門(mén)檻,逐步擺脫通用大語(yǔ)言模型在開(kāi)放域知識(shí)上的無(wú)序性和在教育反饋上的低階性,而且隨著模型的教育知識(shí)深度不斷強(qiáng)化,教育知識(shí)實(shí)時(shí)更新的能力將不斷得到拓展,教育反饋價(jià)值也將由通用性走向具有認(rèn)知和元認(rèn)知干預(yù)效果的個(gè)性化,進(jìn)而促進(jìn)教、學(xué)、管、評(píng)四大場(chǎng)景下的協(xié)同應(yīng)用效果從簡(jiǎn)單的拓展發(fā)展為減負(fù)或“增援”(樂(lè)惠驍?shù)龋?022)。另外,數(shù)據(jù)的隱私保護(hù)和復(fù)雜教育場(chǎng)景下的泛化能力也將得到有效提升,進(jìn)而為教育數(shù)字化轉(zhuǎn)型的基礎(chǔ)設(shè)施建設(shè)提供堅(jiān)實(shí)的技術(shù)基座。當(dāng)然其也面臨生成內(nèi)容安全隱患、開(kāi)發(fā)經(jīng)濟(jì)技術(shù)成本高、多模態(tài)理解能力欠缺等問(wèn)題。

      二、教育大語(yǔ)言模型的內(nèi)涵與特征

      基于上文對(duì)主流教育大語(yǔ)言模型的分析和比較,本研究將教育大語(yǔ)言模型界定如下:教育大語(yǔ)言模型是指在教育理論或規(guī)范指導(dǎo)下,在特定教學(xué)場(chǎng)景中,使用教育大數(shù)據(jù)進(jìn)行提示或指令微調(diào)、預(yù)訓(xùn)練甚至引入外部知識(shí)進(jìn)行檢索增強(qiáng)而生成的深度神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型,是自然語(yǔ)言處理、知識(shí)庫(kù)和教育大數(shù)據(jù)技術(shù)等的集合體,其以人機(jī)對(duì)話或者智能分析服務(wù)的形式,為教師、學(xué)生、管理者和家長(zhǎng)等教育主體,提供高效化教學(xué)資源創(chuàng)建、智能化人機(jī)協(xié)同教與學(xué)、個(gè)性化教育反饋與評(píng)價(jià)和精準(zhǔn)化教育管理與決策服務(wù)等功能,旨在實(shí)現(xiàn)人類(lèi)智慧與機(jī)器智能的協(xié)同共生。

      該定義中,教育大數(shù)據(jù)是指教育活動(dòng)中產(chǎn)生的,并在教育理論或規(guī)范下進(jìn)行修正和標(biāo)準(zhǔn)化的大規(guī)模數(shù)據(jù),包括教學(xué)反思日志、心理輔導(dǎo)文本、報(bào)考咨詢(xún)記錄、MOOC論壇評(píng)論等。深度神經(jīng)網(wǎng)絡(luò)模型是指基于Transformer架構(gòu)的神經(jīng)網(wǎng)絡(luò)模型,包括主流的輕量級(jí)BERT到重量級(jí)T5以及超重量級(jí)的LLaMA模型等。與通用型大語(yǔ)言模型相比,教育大語(yǔ)言模型具有以下典型特征:

      一是教育知識(shí)庫(kù)的全面性。教育大語(yǔ)言模型依托教育大數(shù)據(jù)預(yù)訓(xùn)練和外部知識(shí)檢索增強(qiáng)技術(shù),保障教育大語(yǔ)言模型在教育情境下具有相對(duì)廣泛和及時(shí)更新的知識(shí)結(jié)構(gòu),包括教育情境下的教育知識(shí)、科學(xué)研究和社會(huì)實(shí)踐中涉及的各學(xué)科領(lǐng)域、不同層次水平的知識(shí)等,體現(xiàn)了教育大語(yǔ)言模型的包容性,并能夠準(zhǔn)確地理解與生成內(nèi)容。

      二是教學(xué)內(nèi)容生成的安全性。通用大語(yǔ)言模型仍存在生成內(nèi)容版權(quán)爭(zhēng)議、虛假信息、違法用途和價(jià)值導(dǎo)向不安全等倫理問(wèn)題(焦建利,2023)。而教育大語(yǔ)言模型作為支持落實(shí)立德樹(shù)人任務(wù)的數(shù)字基座,能夠主動(dòng)保障在各類(lèi)教育情境下快速生成健康、安全、高質(zhì)量的教育內(nèi)容,實(shí)現(xiàn)主動(dòng)追溯非原創(chuàng)內(nèi)容源頭,并根據(jù)用戶偏好實(shí)現(xiàn)推理過(guò)程的透明闡述,同時(shí)能避免有害或與價(jià)值導(dǎo)向偏離的信息輸送,繼而提升教育大語(yǔ)言模型的可信度。

      三是反饋信息的教育價(jià)值性。當(dāng)前通用大語(yǔ)言模型教育反饋能力僅停留在淺層次的糾錯(cuò)型反饋(徐曉藝等,2024),而教育大語(yǔ)言模型融合了教育學(xué)、心理學(xué)和學(xué)習(xí)科學(xué)相關(guān)理論,能夠生成具有啟發(fā)性和可實(shí)施性的教育反饋,如支架引導(dǎo)、糾錯(cuò)反饋等認(rèn)知型反饋,以及學(xué)習(xí)策略指導(dǎo)、自我調(diào)節(jié)等元認(rèn)知反饋,有助于促進(jìn)學(xué)習(xí)者學(xué)科核心素養(yǎng)和高階思維能力的發(fā)展。

      四是問(wèn)題解決的個(gè)性化。面對(duì)教育情境的復(fù)雜性與教育活動(dòng)中任務(wù)的復(fù)雜性(翟雪松等,2023),教育大語(yǔ)言模型能精準(zhǔn)把握教育目標(biāo)和學(xué)生畫(huà)像,理解多樣教育場(chǎng)景下多元化的用戶需求,充當(dāng)諸如助教、學(xué)伴、助管等不同角色,適應(yīng)自主學(xué)習(xí)、小組學(xué)習(xí)、情景化學(xué)習(xí)等多種學(xué)習(xí)情境,實(shí)現(xiàn)個(gè)性化學(xué)習(xí)、差異化教學(xué)、精準(zhǔn)化評(píng)價(jià)、數(shù)據(jù)驅(qū)動(dòng)化管理。

      五是人機(jī)交互的多模態(tài)性。教育數(shù)據(jù)是外在表現(xiàn)數(shù)據(jù)與情感、認(rèn)知、技能等內(nèi)在機(jī)理數(shù)據(jù)的統(tǒng)合(牟智佳,2020),教育大語(yǔ)言模型應(yīng)當(dāng)具備圖片、音頻、視頻等多模態(tài)教育數(shù)據(jù)的識(shí)別和融合能力,推動(dòng)人形教育機(jī)器人、數(shù)字孿生等前沿教育技術(shù)輔助教學(xué),揭示深層次教育規(guī)律,促進(jìn)教育公平。

      六是用戶使用的易用性。通用大語(yǔ)言模型通常需要利用較為精準(zhǔn)的提示語(yǔ)來(lái)輸出高質(zhì)量的內(nèi)容。教育大語(yǔ)言模型能對(duì)不同層級(jí)用戶的認(rèn)知水平、信息素養(yǎng)等進(jìn)行充分考量,并從訓(xùn)練數(shù)據(jù)和模型架構(gòu)兩個(gè)層面,降低提示語(yǔ)、上下文等外部因素對(duì)輸出內(nèi)容的影響。

      上述特征是教育大語(yǔ)言模型的理想特征,受限于教育大數(shù)據(jù)建設(shè)、計(jì)算能力和技術(shù)發(fā)展瓶頸等因素,現(xiàn)有的教育大語(yǔ)言模型可能還無(wú)法囊括上述全部特征,但其依舊是教育大語(yǔ)言模型未來(lái)應(yīng)當(dāng)遵循與發(fā)展的目標(biāo)。未來(lái)應(yīng)當(dāng)在教育大語(yǔ)言模型構(gòu)建流程的基礎(chǔ)上,不斷開(kāi)展教育場(chǎng)景的適應(yīng)性拓展。

      三、教育大語(yǔ)言模型構(gòu)建流程

      基于教育大語(yǔ)言模型的內(nèi)涵與特征,本研究提出基于混合增強(qiáng)生成技術(shù)的教育大語(yǔ)言模型構(gòu)建流程。其中,混合增強(qiáng)生成技術(shù)是指在“人在回路”設(shè)計(jì)理念指引下,與一線教師協(xié)同增強(qiáng)大語(yǔ)言模型生成內(nèi)容的安全性以及反饋信息的教育價(jià)值性,并利用檢索增強(qiáng)生成技術(shù)解決大語(yǔ)言模型中教育領(lǐng)域知識(shí)不足,進(jìn)而提升知識(shí)結(jié)構(gòu)全面性的方法。教育大語(yǔ)言模型開(kāi)發(fā)的每個(gè)階段都需開(kāi)發(fā)者、一線教師、專(zhuān)家、學(xué)生和家長(zhǎng)的協(xié)同參與,以增強(qiáng)用戶對(duì)模型的信任度。模型構(gòu)建流程包括制定教育目標(biāo)、選擇或設(shè)計(jì)大語(yǔ)言模型、構(gòu)建教育語(yǔ)料庫(kù)、開(kāi)展模型訓(xùn)練或提示、鏈接外部教育知識(shí)庫(kù)、評(píng)價(jià)模型等6個(gè)步驟。其邏輯關(guān)系與主要內(nèi)容如圖2所示。

      1.制定教育目標(biāo),預(yù)設(shè)模型構(gòu)建標(biāo)準(zhǔn)與技術(shù)范式

      該環(huán)節(jié)是開(kāi)發(fā)教育大語(yǔ)言模型的預(yù)備工作,也是區(qū)別于通用大語(yǔ)言模型構(gòu)建的核心流程,主要包含教育目標(biāo)預(yù)設(shè)、教育/心理理論挖掘、評(píng)價(jià)規(guī)范與指令模板構(gòu)建等流程。在教育目標(biāo)預(yù)設(shè)層面,需要進(jìn)行用戶需求的教育痛點(diǎn)分析、潛在使用場(chǎng)景分析、“合規(guī)性”與“可行性”分析以及構(gòu)建深度確定。首先,開(kāi)發(fā)團(tuán)隊(duì)要基于對(duì)用戶的研究或數(shù)據(jù)分析,挖掘具體的教育痛點(diǎn)、對(duì)應(yīng)需求與潛在使用場(chǎng)景,進(jìn)而確定具體的教育目標(biāo)。其次,確認(rèn)模型構(gòu)建的合規(guī)性,如是否有政策或法規(guī)的限定或支持,應(yīng)用對(duì)象是否涉及相關(guān)法律法規(guī)或?qū)W術(shù)倫理的限制。再次,評(píng)估模型構(gòu)建的可行性,如現(xiàn)有教育大數(shù)據(jù)是否完備、開(kāi)發(fā)人員現(xiàn)有技術(shù)水平能否保障、硬件與資金投入是否充足、教育領(lǐng)域?qū)<夷芊裰С珠_(kāi)發(fā)全程的咨詢(xún)與價(jià)值觀對(duì)齊工作等。最后,依據(jù)上述決策內(nèi)容,確定構(gòu)建的大模型類(lèi)型,是指令微調(diào)型、數(shù)據(jù)驅(qū)動(dòng)型還是知識(shí)增強(qiáng)型的教育大語(yǔ)言模型。教育/心理理論挖掘是指根據(jù)教育目標(biāo),選擇合適的教育學(xué)或心理學(xué)理論,來(lái)指導(dǎo)教育大語(yǔ)言模型生成內(nèi)容邏輯與價(jià)值理性的過(guò)程,如選用蘇格拉底產(chǎn)婆術(shù)理論來(lái)指導(dǎo)啟發(fā)式對(duì)話任務(wù)。評(píng)價(jià)規(guī)范是指開(kāi)發(fā)團(tuán)隊(duì)在教育/心理理論指導(dǎo)下,構(gòu)建教育大數(shù)據(jù)評(píng)估指標(biāo)體系、語(yǔ)言合規(guī)性過(guò)濾標(biāo)準(zhǔn)和教育大語(yǔ)言模型生成內(nèi)容人工評(píng)價(jià)標(biāo)準(zhǔn)等,進(jìn)而保障生成內(nèi)容的安全性和教育場(chǎng)景的適應(yīng)性。指令模板是指在開(kāi)發(fā)團(tuán)隊(duì)根據(jù)目標(biāo)任務(wù)的實(shí)際需求,遵循理論規(guī)范,構(gòu)建教育語(yǔ)料庫(kù)標(biāo)準(zhǔn)化表達(dá)的模板,如基于布魯姆認(rèn)知分類(lèi)法則構(gòu)建的面向高階認(rèn)知對(duì)話活動(dòng)的微調(diào)指令語(yǔ)料庫(kù)模板。

      2.選擇或設(shè)計(jì)大語(yǔ)言模型基座,對(duì)齊教育任務(wù)屬性

      基座大語(yǔ)言模型的選擇或設(shè)計(jì)是構(gòu)建教育大語(yǔ)言模型的基礎(chǔ)。當(dāng)前主流的教育大語(yǔ)言模型均通過(guò)選擇通用大語(yǔ)言模型開(kāi)展指令微調(diào)或“預(yù)訓(xùn)練+微調(diào)”,少部分教育科技企業(yè)在自主設(shè)計(jì)大語(yǔ)言模型的基礎(chǔ)上進(jìn)一步構(gòu)建了教育大語(yǔ)言模型。在設(shè)計(jì)大語(yǔ)言模型層面,需充分考慮教育目標(biāo)任務(wù)的特征,開(kāi)展基礎(chǔ)架構(gòu)選擇與結(jié)構(gòu)拓展。基礎(chǔ)架構(gòu)的選擇應(yīng)與大語(yǔ)言模型的四大技術(shù)路線相照應(yīng)。例如,諸如MOOC情感分類(lèi)等輕量級(jí)理解型教育任務(wù)宜選擇BERT類(lèi)自編碼型大語(yǔ)言模型架構(gòu),人機(jī)對(duì)話、科學(xué)推理等有條件生成型教育任務(wù)宜選擇LLaMA、Qwen等GPT類(lèi)自回歸型大語(yǔ)言模型架構(gòu),文本摘要、機(jī)器翻譯等多語(yǔ)言無(wú)條件生成型任務(wù)宜選擇mT5、BART等序列轉(zhuǎn)序列型大語(yǔ)言模型架構(gòu),而融合上述多種教育任務(wù)的則可以選擇ChatGLM、ERNIE等GLM類(lèi)自回歸空白填充型大語(yǔ)言模型架構(gòu)。結(jié)構(gòu)拓展需根據(jù)教育任務(wù)需求在基礎(chǔ)架構(gòu)上進(jìn)行拓展,如有多模態(tài)輸入任務(wù)的應(yīng)當(dāng)考慮在編碼階段增加多模態(tài)融合、一致性對(duì)齊和多層次學(xué)習(xí)表示等的結(jié)構(gòu)設(shè)計(jì)。在選擇大語(yǔ)言模型層面,應(yīng)當(dāng)從教育目標(biāo)的任務(wù)類(lèi)型與大語(yǔ)言模型技術(shù)路線和細(xì)粒度特征對(duì)齊兩個(gè)視角進(jìn)行選擇,如可以選擇ChatGLM3、mT5、FireFly-Qwen、Alpaca-LoRA等。

      3.構(gòu)建教育語(yǔ)料庫(kù),實(shí)現(xiàn)無(wú)序數(shù)據(jù)的教育價(jià)值轉(zhuǎn)向

      要訓(xùn)練出高性能的教育大語(yǔ)言模型,需要從數(shù)據(jù)的采集來(lái)源和預(yù)處理方法兩個(gè)方面著手。在采集來(lái)源方面,要重點(diǎn)關(guān)注無(wú)監(jiān)督的通用型數(shù)據(jù)集和有監(jiān)督的特定任務(wù)型數(shù)據(jù)集。通用型數(shù)據(jù)集主要是指大規(guī)模、易獲取和多樣性強(qiáng)的開(kāi)放教育語(yǔ)料庫(kù),主要包括中小學(xué)和高等教育教材和相關(guān)學(xué)科書(shū)籍、教育政務(wù)網(wǎng)站、期刊文獻(xiàn)數(shù)據(jù)庫(kù)、MOOC論壇對(duì)話、代碼庫(kù)、古詩(shī)詞等。例如,大規(guī)模中文對(duì)話數(shù)據(jù)集BELLE包含了約80萬(wàn)條多輪對(duì)話的開(kāi)源數(shù)據(jù),School Math包含了約25萬(wàn)條中文數(shù)學(xué)題及解題過(guò)程的數(shù)據(jù)(Ji et al.,2023)。特定教學(xué)任務(wù)型數(shù)據(jù)集主要是指為了提升教育大語(yǔ)言模型在特定教學(xué)場(chǎng)景(如教學(xué)反饋、心理輔導(dǎo)等)下的垂直能力而自主構(gòu)建或開(kāi)源的領(lǐng)域語(yǔ)料庫(kù)、對(duì)話數(shù)據(jù)集和人類(lèi)指令集等。例如,EduChat為增強(qiáng)其情感支持、對(duì)話式教學(xué)、寫(xiě)作評(píng)價(jià)功能,構(gòu)建了中文情感支持?jǐn)?shù)據(jù)集ESConv-zh、對(duì)話教學(xué)語(yǔ)料庫(kù)和寫(xiě)作評(píng)價(jià)語(yǔ)料庫(kù)(K?pf et al.,2023)。在預(yù)處理方法層面,首先要基于第一個(gè)環(huán)節(jié)中指定的評(píng)價(jià)規(guī)范,結(jié)合教育專(zhuān)家的建議,對(duì)教育大數(shù)據(jù)開(kāi)展質(zhì)量過(guò)濾、去重、隱私去除、分詞等流程(Zhao et al.,2023);其次要依據(jù)預(yù)設(shè)的指令模板對(duì)教育數(shù)據(jù)集進(jìn)行整理與統(tǒng)一表達(dá),如將傳統(tǒng)問(wèn)答語(yǔ)料庫(kù)轉(zhuǎn)換為蘇格拉底式對(duì)話語(yǔ)料庫(kù),實(shí)現(xiàn)由傳統(tǒng)數(shù)據(jù)集向安全、具有特定教育價(jià)值的語(yǔ)料庫(kù)轉(zhuǎn)換。

      4.開(kāi)展模型訓(xùn)練或提示,獲得教育任務(wù)通用和細(xì)粒度知識(shí)

      預(yù)訓(xùn)練與指令微調(diào)或提示學(xué)習(xí)是教育大語(yǔ)言模型獲得任務(wù)能力的核心步驟。在指令微調(diào)型教育大語(yǔ)言模型構(gòu)建流程中,可以開(kāi)展提示學(xué)習(xí)。提示學(xué)習(xí)克服了微調(diào)的高成本劣勢(shì),使得大語(yǔ)言模型在不顯著改變其結(jié)構(gòu)和參數(shù)的條件下,通過(guò)輸入“提示”文本,即可增強(qiáng)模型的泛化能力。在概念上,提示是一種輸入形式,用于指示教育大語(yǔ)言模型在執(zhí)行特定教育任務(wù)時(shí)應(yīng)該采取什么行動(dòng)或生成什么輸出。在實(shí)現(xiàn)方式上,當(dāng)前的提示學(xué)習(xí)主要有情境學(xué)習(xí)提示和思維鏈提示兩類(lèi)技術(shù)路徑,前者主要通過(guò)問(wèn)題描述、問(wèn)答樣本和問(wèn)題來(lái)提示大語(yǔ)言模型,后者在問(wèn)答樣本中涉及推理步驟。在實(shí)際效果上,提示學(xué)習(xí)可以方便地提供最新的知識(shí),降低訓(xùn)練計(jì)算成本,同時(shí)少量樣本的提示學(xué)習(xí)效果也更優(yōu)于傳統(tǒng)微調(diào)(Adigwe et al.,2023)。因此,在應(yīng)用策略上,針對(duì)BERT、T5等輕量級(jí)和重量級(jí)的大語(yǔ)言模型可以采用微調(diào),而針對(duì)如GPT-3.5-Turbo、GPT-2等超重量級(jí)大語(yǔ)言模型則可以考慮采用提示學(xué)習(xí)策略(劉明等,2023)。

      在數(shù)據(jù)驅(qū)動(dòng)型和知識(shí)增強(qiáng)型教育大語(yǔ)言模型構(gòu)建流程中,需要開(kāi)展基于“預(yù)訓(xùn)練+微調(diào)”的雙階段訓(xùn)練過(guò)程。在預(yù)訓(xùn)練層面,需要引入無(wú)監(jiān)督的、中文教育場(chǎng)景的大規(guī)模通用數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練,讓大語(yǔ)言模型獲得解決教育領(lǐng)域任務(wù)的通用能力。在微調(diào)層面,需要根據(jù)教育目標(biāo),細(xì)分任務(wù)需求,再引入指令微調(diào)流程,讓教育大語(yǔ)言模型再獲得特定的下游任務(wù)能力。通過(guò)微調(diào)后的大語(yǔ)言模型可以更好地適配到具體的教育目標(biāo)中。當(dāng)前,大語(yǔ)言模型領(lǐng)域主要有指令微調(diào)和對(duì)齊微調(diào)兩類(lèi)微調(diào)方法。其中,指令微調(diào)需要先構(gòu)建具有“描述—(解釋—輸入)—輸出”格式的實(shí)例集,然后以有監(jiān)督方式進(jìn)行微調(diào),實(shí)例的格式設(shè)計(jì)和合理的數(shù)量增量可以提升大語(yǔ)言模型在教育目標(biāo)中的泛化能力。對(duì)齊微調(diào)主要是為了降低教育大語(yǔ)言模型的虛假信息、認(rèn)知沖突等有害信息而進(jìn)行的微調(diào)。教育大語(yǔ)言模型中的對(duì)齊微調(diào)主要體現(xiàn)為,融合“人在回路”理念的強(qiáng)化學(xué)習(xí),構(gòu)建獎(jiǎng)勵(lì)模型,實(shí)現(xiàn)模型輸出內(nèi)容與人類(lèi)價(jià)值觀的對(duì)齊。

      5.鏈接外部教育知識(shí)庫(kù),靈活擴(kuò)展模型知識(shí)和學(xué)生模型

      知識(shí)檢索增強(qiáng)環(huán)節(jié)是知識(shí)增強(qiáng)型教育大語(yǔ)言模型構(gòu)建的必要環(huán)節(jié),是保障教育大語(yǔ)言模型緩解外部教育知識(shí)局限性、降低反饋幻覺(jué)、及時(shí)更新知識(shí)和實(shí)現(xiàn)個(gè)性化學(xué)習(xí)的外包服務(wù),主要包括構(gòu)建本地教育知識(shí)庫(kù)、學(xué)生模型和搜索引擎檢索三類(lèi)方法。三類(lèi)方法均包含知識(shí)檢索和提示語(yǔ)注入兩個(gè)步驟,其中構(gòu)建本地教育知識(shí)庫(kù)和學(xué)生模型兩類(lèi)方法中還包含教育知識(shí)準(zhǔn)備、學(xué)生模型構(gòu)建、知識(shí)入庫(kù)三個(gè)前置步驟。具體而言,教育知識(shí)準(zhǔn)備是指收集外部教育知識(shí)數(shù)據(jù)并進(jìn)行向量化的過(guò)程,其可被劃分為結(jié)構(gòu)化和非結(jié)構(gòu)化教育知識(shí)兩類(lèi)。結(jié)構(gòu)化教育知識(shí)是指學(xué)科知識(shí)圖譜、教育評(píng)估反饋數(shù)據(jù)、教學(xué)資源元數(shù)據(jù)等具有標(biāo)準(zhǔn)化格式、有清晰數(shù)據(jù)屬性定義、可供人和計(jì)算機(jī)高效訪問(wèn)的教育數(shù)據(jù)。非結(jié)構(gòu)化教育知識(shí)是指教師上傳的課程文檔、文獻(xiàn)、教材、教學(xué)多媒體資源、編碼代碼和數(shù)理公式等未設(shè)定數(shù)據(jù)模型或進(jìn)行預(yù)定義排序的教育數(shù)據(jù)。學(xué)生模型是提升教育大語(yǔ)言模型個(gè)性化能力的基礎(chǔ)設(shè)置,本質(zhì)上它是一個(gè)存儲(chǔ)學(xué)習(xí)成績(jī)、學(xué)習(xí)歷史、學(xué)習(xí)能力、性格與情感等數(shù)據(jù)的教育知識(shí)庫(kù),其通過(guò)一定的數(shù)據(jù)過(guò)濾、關(guān)鍵信息提取、分塊、格式化規(guī)范,可形成結(jié)構(gòu)化和非結(jié)構(gòu)化兩類(lèi)離線教育知識(shí)集,隨后可根據(jù)文本特征選擇嵌入模型(如ERNIE-Embedding、BGE等),并將知識(shí)集中的文本數(shù)據(jù)轉(zhuǎn)化為向量矩陣。知識(shí)入庫(kù)是指將離線教育知識(shí)集進(jìn)行向量化后,建立索引,寫(xiě)入并構(gòu)建離線教育知識(shí)庫(kù)的過(guò)程。知識(shí)檢索主要是指根據(jù)教育用戶的提問(wèn)和歷史對(duì)話數(shù)據(jù),在離線教育知識(shí)庫(kù)或搜索引擎中挖掘與提問(wèn)或歷史對(duì)話最相關(guān)知識(shí)的過(guò)程。提示語(yǔ)注入是指將知識(shí)檢索環(huán)節(jié)挖掘到的最相關(guān)知識(shí)作為指令加入提示語(yǔ)的過(guò)程,并通過(guò)將組合后的指令輸入教育大語(yǔ)言模型,實(shí)現(xiàn)輸出效果的優(yōu)化。

      6.評(píng)價(jià)教育大語(yǔ)言模型,讓模型“懂人理”

      完成教育大語(yǔ)言模型的構(gòu)建后,則需要評(píng)估、比較大語(yǔ)言模型的性能并更新獎(jiǎng)勵(lì)模型。教育大語(yǔ)言模型主要有兩種評(píng)估方式:機(jī)器評(píng)價(jià)與人工評(píng)價(jià)。在機(jī)器評(píng)價(jià)方面,主要考察BERTScore和DialogRPT兩個(gè)評(píng)價(jià)指標(biāo)(Dan et al.,2023)。其中,BERTScore是指通過(guò)比較評(píng)價(jià)數(shù)據(jù)集(如C-Eval、GAOKAO等)中的目標(biāo)文本與教育大語(yǔ)言模型生成的文本之間的余弦相似度,并對(duì)生成的精準(zhǔn)度、召回率和F1 Score等數(shù)據(jù)進(jìn)行類(lèi)比。DialogRPT主要用來(lái)評(píng)估模型生成文本的流暢度,相關(guān)參數(shù)包括updown、human_vs_rand、human_vs_machine和final(average & best)。在人工評(píng)價(jià)方面,需要依據(jù)在制定教育目標(biāo)環(huán)節(jié)構(gòu)建的評(píng)價(jià)體系進(jìn)行,其包括課程知識(shí)回答正確率計(jì)算、滿意度和安全性評(píng)估方法、教育專(zhuān)家或教育大語(yǔ)言模型受眾問(wèn)卷調(diào)查模板或訪談提綱、機(jī)器與專(zhuān)家反饋模板的相似度計(jì)算、機(jī)器對(duì)用戶提問(wèn)的理解程度評(píng)價(jià)方法和機(jī)器生成內(nèi)容的教育價(jià)值評(píng)價(jià)體系等。其次,基于機(jī)器評(píng)價(jià)和人工評(píng)價(jià)結(jié)果,對(duì)教育大語(yǔ)言模型開(kāi)展置信度評(píng)估,對(duì)置信度較低的環(huán)節(jié)進(jìn)行二次訓(xùn)練與開(kāi)發(fā),例如根據(jù)用戶反饋對(duì)教育語(yǔ)料庫(kù)進(jìn)行重新設(shè)計(jì),對(duì)基座大模型的選擇、設(shè)計(jì)方法甚至預(yù)訓(xùn)練和微調(diào)方法進(jìn)行策略調(diào)整。最后,需要收集高質(zhì)量的教育專(zhuān)家評(píng)價(jià)反饋數(shù)據(jù),采用排序、問(wèn)題約束、基于規(guī)則等方法對(duì)數(shù)據(jù)進(jìn)行清理,調(diào)用基于人類(lèi)反饋的強(qiáng)化學(xué)習(xí)算法(如近端策略?xún)?yōu)化算法PPO、自然語(yǔ)言策略?xún)?yōu)化算法NLPO)構(gòu)建獎(jiǎng)勵(lì)模型,對(duì)模型輸出結(jié)果進(jìn)行優(yōu)化和過(guò)濾,使得教育大語(yǔ)言模型的輸出結(jié)果更好地與人類(lèi)價(jià)值觀對(duì)齊(Zhao et al.,2023)。

      四、教育大語(yǔ)言模型應(yīng)用案例

      基于教育大語(yǔ)言模型的技術(shù)范式,已有研究者在不同范式下將教育大語(yǔ)言模型應(yīng)用到教育領(lǐng)域,并取得了一定的效果。筆者將從編程、課后閱讀和計(jì)算機(jī)教育三類(lèi)教學(xué)場(chǎng)景呈現(xiàn)教育大語(yǔ)言模型賦能學(xué)生計(jì)算思維、提問(wèn)能力和編程技能等高階能力和學(xué)科基本能力提升的應(yīng)用案例。

      1.編程教學(xué)場(chǎng)景下指令調(diào)優(yōu)型教育大語(yǔ)言模型培養(yǎng)學(xué)生計(jì)算思維能力

      計(jì)算思維是智慧教育時(shí)代學(xué)生需要具備的最為重要的核心素養(yǎng)之一,如何在科學(xué)、編程等教學(xué)中系統(tǒng)地開(kāi)展計(jì)算思維教學(xué),成為學(xué)校應(yīng)對(duì)未來(lái)挑戰(zhàn)和培養(yǎng)未來(lái)人才的關(guān)鍵路徑(陳鵬等,2023)。有學(xué)者首先基于計(jì)算思維理論框架與支架式教學(xué)理論,構(gòu)建了基于ChatGPT提示微調(diào)的智能編程支架學(xué)習(xí)大語(yǔ)言模型,其包含解決方案評(píng)估、代碼評(píng)估與自主對(duì)話三大功能模塊以及對(duì)應(yīng)的多輪對(duì)話提示語(yǔ)模板,并基于GPT-3.5 API進(jìn)行調(diào)優(yōu)。其次基于理論框架與教育大語(yǔ)言模型,構(gòu)建了智能編程支架學(xué)習(xí)系統(tǒng),并在S大學(xué)教育技術(shù)學(xué)專(zhuān)業(yè)課程中開(kāi)展了為期一個(gè)學(xué)期的教學(xué)實(shí)驗(yàn),44名大二學(xué)生被隨機(jī)分配到實(shí)驗(yàn)組(使用該系統(tǒng)開(kāi)展編程學(xué)習(xí))和對(duì)照組(在傳統(tǒng)的教師指導(dǎo)模式下開(kāi)展教學(xué))。通過(guò)學(xué)期始末的計(jì)算思維能力測(cè)驗(yàn)對(duì)照與期末的編程學(xué)習(xí)系統(tǒng)接受度問(wèn)卷調(diào)查,結(jié)果表明實(shí)驗(yàn)組學(xué)生在編程能力測(cè)驗(yàn)中的平均得分高于對(duì)照組學(xué)生,大部分學(xué)生對(duì)該編程系統(tǒng)持積極態(tài)度,且相較于傳統(tǒng)教學(xué)模式,該智能編程支架學(xué)習(xí)系統(tǒng)能有效提升學(xué)生的計(jì)算思維能力;但研究還發(fā)現(xiàn)該系統(tǒng)以及調(diào)優(yōu)后的模型在理解學(xué)生復(fù)雜需求的準(zhǔn)確性上仍存在不足(廖劍等,2024;Liao et al.,2024)。

      2.課后閱讀場(chǎng)景下數(shù)據(jù)驅(qū)動(dòng)型教育大語(yǔ)言模型培養(yǎng)學(xué)生提問(wèn)意識(shí)與閱讀能力

      提問(wèn)意識(shí)與能力是批判性思維、問(wèn)題解決能力等核心素養(yǎng)的重要構(gòu)成要素,其與閱讀理解能力有著顯著的相關(guān)性。針對(duì)傳統(tǒng)閱讀理解教學(xué)中普遍存在的提問(wèn)少、水平低、層次淺等問(wèn)題,有學(xué)者構(gòu)建了面向閱讀理解教學(xué)場(chǎng)景下學(xué)生自主提問(wèn)的教育大語(yǔ)言模型Co-Asker。該模型基于T5-Pegasus 275M基座,使用開(kāi)源中文維基百科數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練,并利用中文閱讀理解數(shù)據(jù)集和中醫(yī)藥問(wèn)答語(yǔ)料庫(kù)進(jìn)行微調(diào)。研究還構(gòu)建了人機(jī)協(xié)同問(wèn)題共創(chuàng)系統(tǒng),并在某大學(xué)智慧教育通識(shí)課程中開(kāi)展教育實(shí)驗(yàn)。結(jié)果表明,Co-Asker可以產(chǎn)生高質(zhì)量的類(lèi)人化問(wèn)題,激發(fā)學(xué)生的提問(wèn)興趣和投入度,加深學(xué)生對(duì)淺層次閱讀內(nèi)容的理解。但研究也發(fā)現(xiàn),該系統(tǒng)難以產(chǎn)生能啟發(fā)學(xué)生深層次思考的深度問(wèn)題,且可能會(huì)引起部分學(xué)生在學(xué)習(xí)任務(wù)中對(duì)問(wèn)題生成功能的過(guò)度依賴(lài),同時(shí)也存在模型的大規(guī)模參數(shù)與數(shù)據(jù)的量級(jí)導(dǎo)致智能提問(wèn)模型的訓(xùn)練時(shí)間與經(jīng)濟(jì)成本消耗過(guò)高等問(wèn)題(Liu & Zhang et al.,2024)。

      3.計(jì)算機(jī)教育場(chǎng)景下知識(shí)增強(qiáng)型教育大語(yǔ)言模型提升學(xué)生編程技能

      如何開(kāi)展融合通識(shí)與專(zhuān)業(yè)的計(jì)算機(jī)教育課程是提升學(xué)生計(jì)算思維和數(shù)字化能力的關(guān)鍵。有學(xué)者在哈佛大學(xué)計(jì)算機(jī)科學(xué)導(dǎo)論課程項(xiàng)目平臺(tái)CS50中,為了實(shí)現(xiàn)對(duì)學(xué)生在線課程學(xué)習(xí)的“一對(duì)一”指導(dǎo),增設(shè)了智能化編程教學(xué)指導(dǎo)工具。該工具以GPT-4作為基座模型,引入檢索增強(qiáng)技術(shù),將課程講授內(nèi)容以30秒為時(shí)間窗口進(jìn)行分割,并逐一使用OpenAI的文本嵌入模型進(jìn)行向量化并存儲(chǔ)于ChromaDB向量數(shù)據(jù)庫(kù)中。之后該模型會(huì)根據(jù)學(xué)生的輸入,在向量數(shù)據(jù)庫(kù)中查詢(xún)講座片段,最后將最相關(guān)的內(nèi)容整合在提示語(yǔ)中,由此實(shí)現(xiàn)解釋代碼片段、修改代碼風(fēng)格、課程查詢(xún)等功能,并降低GPT-4模型的幻覺(jué)現(xiàn)象。將該工具應(yīng)用于參與CS50課程項(xiàng)目的70名學(xué)生中,通過(guò)學(xué)生反饋和專(zhuān)家驗(yàn)證回應(yīng)的準(zhǔn)確性發(fā)現(xiàn),該工具在指導(dǎo)學(xué)生開(kāi)展具有挑戰(zhàn)性的問(wèn)題上是有效且可靠的,同時(shí)其回應(yīng)的課程知識(shí)的正確率達(dá)到88%(Liu & Zenke et al.,2024)。然而,由于微調(diào)語(yǔ)料庫(kù)的缺失,此模型也存在反饋質(zhì)量不穩(wěn)定的問(wèn)題,且忽略了人機(jī)協(xié)同教學(xué)設(shè)計(jì)的作用。

      五、教育大語(yǔ)言模型的實(shí)施挑戰(zhàn)與應(yīng)對(duì)策略

      1.語(yǔ)料庫(kù)與知識(shí)庫(kù)的構(gòu)建缺乏統(tǒng)一的標(biāo)準(zhǔn),需多方合力共建

      教育大語(yǔ)言模型具有的知識(shí)全面性和反饋信息的教育價(jià)值性,其本質(zhì)是由預(yù)訓(xùn)練或微調(diào)語(yǔ)料庫(kù)的完備性及其教育性決定的;而教育需求和問(wèn)題響應(yīng)個(gè)性化的實(shí)現(xiàn)則取決于檢索增強(qiáng)生成的外部教育知識(shí)庫(kù)中學(xué)生模型知識(shí)庫(kù)的構(gòu)建。從數(shù)據(jù)要素視角來(lái)看,當(dāng)前制約教育大語(yǔ)言模型發(fā)展的主要因素有兩個(gè):一是非結(jié)構(gòu)化、多模態(tài)問(wèn)答語(yǔ)料庫(kù)的缺乏(邢蓓蓓等,2016),二是具有特定教育價(jià)值的指令調(diào)優(yōu)語(yǔ)料庫(kù)和學(xué)生模型數(shù)據(jù)庫(kù)建設(shè)標(biāo)準(zhǔn)的缺失。

      針對(duì)上述問(wèn)題,可以從數(shù)據(jù)建設(shè)生態(tài)和統(tǒng)一標(biāo)準(zhǔn)構(gòu)建兩個(gè)角度進(jìn)行應(yīng)對(duì)。針對(duì)數(shù)據(jù)建設(shè)生態(tài)問(wèn)題,可從宏觀、中觀和微觀三個(gè)視角構(gòu)建應(yīng)對(duì)策略。在宏觀治理層面,政府與教育部門(mén)應(yīng)推動(dòng)教育大語(yǔ)言模型基礎(chǔ)設(shè)施和公共訓(xùn)練數(shù)據(jù)資源平臺(tái)建設(shè),重視非結(jié)構(gòu)化教育過(guò)程數(shù)據(jù)的挖掘與治理。同時(shí),可依托政府背書(shū)、科技企業(yè)聯(lián)動(dòng)、學(xué)校或研究院帶動(dòng)與智慧教育專(zhuān)家指導(dǎo)的模式,以教育數(shù)據(jù)開(kāi)源倡議、開(kāi)放數(shù)據(jù)競(jìng)賽等形式(如BEA競(jìng)賽),帶動(dòng)學(xué)生與從業(yè)者共同參與教育領(lǐng)域數(shù)據(jù)的構(gòu)建、挖掘與治理,從而形成高質(zhì)量教育數(shù)據(jù)建設(shè)的新生態(tài)。在中觀學(xué)校層面,應(yīng)構(gòu)建更加完備的非結(jié)構(gòu)化數(shù)據(jù)服務(wù)與管理基礎(chǔ)設(shè)施,標(biāo)準(zhǔn)化數(shù)據(jù)接口,形成全域協(xié)同的數(shù)據(jù)共創(chuàng)機(jī)制,實(shí)現(xiàn)不同部門(mén)與業(yè)務(wù)流程的知識(shí)庫(kù)的流通與融合,由此既可為構(gòu)建“校園百事通”奠定數(shù)據(jù)基礎(chǔ),也可為服務(wù)區(qū)域和國(guó)家教育數(shù)字化轉(zhuǎn)型奠定良好條件。在微觀開(kāi)發(fā)團(tuán)隊(duì)層面,可以通過(guò)反向翻譯法,將公開(kāi)的英文教育數(shù)據(jù)集(如OpenAssistant問(wèn)答數(shù)據(jù)集、ESConv英文心理咨詢(xún)數(shù)據(jù)集)進(jìn)行翻譯,擴(kuò)充中文教育數(shù)據(jù)集范圍。在教育大語(yǔ)言模型指令調(diào)優(yōu)和學(xué)生模型標(biāo)準(zhǔn)建設(shè)方面,應(yīng)聯(lián)同教育學(xué)、學(xué)習(xí)科學(xué)、心理學(xué)和自然語(yǔ)言處理領(lǐng)域的專(zhuān)家,從學(xué)科教學(xué)、啟發(fā)式問(wèn)答等方面開(kāi)展語(yǔ)料庫(kù)構(gòu)建的標(biāo)準(zhǔn)化格式與規(guī)范制定,并從基本信息、內(nèi)容偏好、學(xué)習(xí)風(fēng)格、平時(shí)表現(xiàn)等方面開(kāi)展學(xué)生模型知識(shí)庫(kù)的結(jié)構(gòu)與數(shù)據(jù)標(biāo)準(zhǔn)設(shè)計(jì)。

      2.模型結(jié)構(gòu)的多模態(tài)理解缺陷和計(jì)算困境凸顯,亟須嘗試應(yīng)用新的技術(shù)

      當(dāng)前,高等學(xué)??蒲袌F(tuán)隊(duì)獨(dú)立開(kāi)展教育大語(yǔ)言模型研究,主要面臨兩大核心挑戰(zhàn):一是已有教育大語(yǔ)言模型在選用基座模型的輸入嵌入、注意力機(jī)制等方面時(shí)對(duì)多模態(tài)的理解能力不足;二是大語(yǔ)言模型龐大的參數(shù)規(guī)模對(duì)算力的需求很大,導(dǎo)致教育大語(yǔ)言模型的訓(xùn)練和推理時(shí)間與硬件成本居高不下。在保持現(xiàn)有計(jì)算技術(shù)條件下,亟須嘗試應(yīng)用新的技術(shù)。

      針對(duì)模型結(jié)構(gòu)的多模態(tài)理解缺陷問(wèn)題,可以考慮引入視覺(jué)語(yǔ)言模型,或在輸入嵌入層面引入圖片、文本、知識(shí)圖譜等多模態(tài)數(shù)據(jù)一致性對(duì)齊嵌入模型,并在注意力機(jī)制部分引入交叉注意力機(jī)制、局部注意力機(jī)制等,進(jìn)而提升大語(yǔ)言模型的多模態(tài)理解能力。針對(duì)算力需求困境問(wèn)題,可以從訓(xùn)練策略調(diào)整和降低模型復(fù)雜度兩方面著手。在訓(xùn)練策略調(diào)整方面,可以嘗試使用分布式云計(jì)算策略,通過(guò)騰訊云HCC、百度智能云千帆大模型平臺(tái)構(gòu)建高性能計(jì)算集群,進(jìn)而降低教育大語(yǔ)言模型構(gòu)建的門(mén)檻與時(shí)間成本。在降低模型復(fù)雜度方面,可以基于知識(shí)蒸餾技術(shù),構(gòu)建諸如EduDistilBERT一類(lèi)的“教育小模型”(Clavié et al.,2019),在最大程度保留教育大語(yǔ)言模型性能的同時(shí),壓縮模型的復(fù)雜度,進(jìn)而降低教育大語(yǔ)言模型的推理成本。

      3.教育大語(yǔ)言模型與高階教育目標(biāo)匹配難,亟待深入探索人機(jī)協(xié)同教學(xué)機(jī)制

      教育大語(yǔ)言模型中指令調(diào)優(yōu)類(lèi)模型在復(fù)雜教育情境下存在理解能力不足的問(wèn)題,數(shù)據(jù)驅(qū)動(dòng)型與知識(shí)增強(qiáng)型模型雖在特定教育任務(wù)下的回應(yīng)具有適應(yīng)性且準(zhǔn)確率較高,但在已有的學(xué)習(xí)活動(dòng)設(shè)計(jì)中,教育大語(yǔ)言模型多以“喂養(yǎng)型”人機(jī)會(huì)話形式向?qū)W生傳授知識(shí),盡管這在一定程度上能提升學(xué)習(xí)效率,降低教師壓力,但也可能讓學(xué)生產(chǎn)生惰性依賴(lài),難以在學(xué)習(xí)效果提升、高階思維能力培養(yǎng)等方面實(shí)現(xiàn)可持續(xù)發(fā)展。

      解決上述問(wèn)題需要深度探索融合教育大語(yǔ)言模型的人機(jī)協(xié)同教學(xué)機(jī)制。一方面,在機(jī)器智能層面,教育大語(yǔ)言模型應(yīng)當(dāng)在蘇格拉底對(duì)話理論、協(xié)作知識(shí)建構(gòu)理論等高階學(xué)習(xí)理論與支架指導(dǎo)下形成高質(zhì)量語(yǔ)料庫(kù),并開(kāi)展預(yù)訓(xùn)練與微調(diào),同時(shí)結(jié)合外部知識(shí),讓教育大語(yǔ)言模型在學(xué)習(xí)活動(dòng)中充分發(fā)揮作為協(xié)作、啟發(fā)、反思等高階思維活動(dòng)的引導(dǎo)者和師生外部知識(shí)拓展的認(rèn)知大腦。此外,教育大語(yǔ)言模型應(yīng)當(dāng)與教育機(jī)器人、虛擬代理和數(shù)字孿生等技術(shù)進(jìn)行深度融合,實(shí)現(xiàn)物理與虛擬空間中認(rèn)知中樞的構(gòu)建與信息的具身貫通。另一方面,在人類(lèi)智慧方面,教師需充分發(fā)揮其教學(xué)智慧,探索教育大語(yǔ)言模型賦能高階認(rèn)知學(xué)習(xí)活動(dòng)的實(shí)踐路徑,將教育大語(yǔ)言模型的技術(shù)、人機(jī)交互特征與教學(xué)活動(dòng)要素進(jìn)行關(guān)聯(lián)映射,進(jìn)而動(dòng)態(tài)把握教學(xué)過(guò)程,實(shí)現(xiàn)差異化角色設(shè)計(jì),并在正確的人機(jī)協(xié)同學(xué)習(xí)觀引導(dǎo)下規(guī)范學(xué)生學(xué)習(xí)動(dòng)機(jī)與行為,繼而通過(guò)對(duì)教學(xué)實(shí)踐的反思與反饋進(jìn)一步反哺教育大語(yǔ)言模型。

      在大語(yǔ)言模型等智能技術(shù)賦能教育數(shù)字化轉(zhuǎn)型的熱潮下,本研究從教育大語(yǔ)言模型的內(nèi)涵與特征入手,梳理并總結(jié)了教育大語(yǔ)言模型的主要構(gòu)建流程,并對(duì)實(shí)際開(kāi)發(fā)中可能存在的問(wèn)題與挑戰(zhàn)提出了應(yīng)對(duì)之策,以期為大語(yǔ)言模型賦能教育發(fā)展提供參考。當(dāng)下教育大語(yǔ)言模型主要聚焦教育目標(biāo)任務(wù)指導(dǎo)下的數(shù)據(jù)、模型等教育基礎(chǔ)設(shè)施建設(shè)方面的研究,未來(lái)將會(huì)涌現(xiàn)更多以育人為核心要義的教育大語(yǔ)言模型。此類(lèi)大語(yǔ)言模型在基礎(chǔ)能力上更關(guān)注對(duì)多模態(tài)知識(shí)的理解,其不僅具有強(qiáng)大的教育目標(biāo)任務(wù)生成能力,更能夠以“教育智能體”的形態(tài)融入教育機(jī)器人雙師教學(xué)、虛擬現(xiàn)實(shí)學(xué)習(xí)環(huán)境下的虛擬教育代理,并以更加高階的人機(jī)協(xié)同角色適應(yīng)更多教育場(chǎng)景,從而賦能教師專(zhuān)業(yè)發(fā)展和學(xué)生成長(zhǎng)。

      參考文獻(xiàn):

      [1]陳鵬,王曉,楊姝等(2023).可視化編程能有效促進(jìn)K12學(xué)生的發(fā)展嗎——基于SSCI期刊39項(xiàng)實(shí)驗(yàn)和準(zhǔn)實(shí)驗(yàn)的元分析[J].現(xiàn)代遠(yuǎn)程教育研究,35(4):102-112.

      [2]戴嶺,胡姣,祝智庭(2023).ChatGPT賦能教育數(shù)字化轉(zhuǎn)型的新方略[J].開(kāi)放教育研究,29(4):41-48.

      [3]方略研究院(2024).高教管理與研究平臺(tái)[EB/OL]. [2024-04-08].https://www.squarestrategics.com/publicize.

      [4]焦建利(2023).ChatGPT:學(xué)校教育的朋友還是敵人?[J].現(xiàn)代教育技術(shù),33(4):5-15.

      [5]樂(lè)惠驍,汪瓊(2022).人機(jī)協(xié)作教學(xué):沖突、動(dòng)機(jī)與改進(jìn)[J].開(kāi)放教育研究,28(6):20-26.

      [6]李海峰,王煒,李廣鑫等(2024).智能助產(chǎn)術(shù)教學(xué)法——以“智能蘇格拉底會(huì)話機(jī)器人”教學(xué)實(shí)踐為例[J].開(kāi)放教育研究,30(2):89-99.

      [7]廖劍,許邯鄲,劉明等(2024).數(shù)智分身:人工智能時(shí)代教師本位人機(jī)共教模式[J].現(xiàn)代遠(yuǎn)程教育研究,36(4):85-93.

      [8]劉明,吳忠明,廖劍等(2023).大語(yǔ)言模型的教育應(yīng)用:原理、現(xiàn)狀與挑戰(zhàn)——從輕量級(jí)BERT到對(duì)話式ChatGPT[J].現(xiàn)代教育技術(shù),33(8):19-28.

      [9]牟智佳(2020).多模態(tài)學(xué)習(xí)分析:學(xué)習(xí)分析研究新生長(zhǎng)點(diǎn)[J].電化教育研究,41(5):27-32,51.

      [10]王麗,李艷,陳新亞等(2023).ChatGPT支持的學(xué)生論證內(nèi)容評(píng)價(jià)與反饋——基于兩種提問(wèn)設(shè)計(jì)的實(shí)證比較[J].現(xiàn)代遠(yuǎn)程教育研究,35(4):83-91.

      [11]新華社(2022).高舉中國(guó)特色社會(huì)主義偉大旗幟 為全面建設(shè)社會(huì)主義現(xiàn)代化國(guó)家而團(tuán)結(jié)奮斗——在中國(guó)共產(chǎn)黨第二十次全國(guó)代表大會(huì)上的報(bào)告[EB/OL].[2023-09-12].https://www.gov.cn/xinwen/2022-10/25/content_5721685.htm.

      [12]邢蓓蓓,楊現(xiàn)民,李勤生(2016).教育大數(shù)據(jù)的來(lái)源與采集技術(shù)[J].現(xiàn)代教育技術(shù),26(8):14-21.

      [13]徐曉藝,陸祎(2024).生成式人工智能助力初中英語(yǔ)寫(xiě)作教學(xué)的實(shí)踐探究[J].中小學(xué)英語(yǔ)教學(xué)與研究,(4):49-53.

      [14]翟雪松,許家奇,童兆平等(2023).人工智能賦能高校韌性教學(xué)生態(tài)的路徑研究[J].中國(guó)遠(yuǎn)程教育,43(1):49-58.

      [15]中華人民共和國(guó)教育部(2024).統(tǒng)籌推進(jìn)教育科技人才體制機(jī)制一體改革[EB/OL].[2024-08-05].http://www.moe.gov.cn/jyb_xwfb/gzdt_gzdt/moe_1485/202407/t20240722_1142

      212.html.

      [16]祝智庭,胡姣(2022).教育數(shù)字化轉(zhuǎn)型的實(shí)踐邏輯與發(fā)展機(jī)遇[J].電化教育研究,43(1):5-15.

      [17]Adigwe, A., & Yuan, Z. (2023). The ADAIO System at the BEA-2023 Shared Task: Shared Task Generating AI Teacher Responses in Educational Dialogues[C]// Proceedings of the 18th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2023). Toronto, Canada: Association for Computational Linguistics:796-804.

      [18]Bulathwela, S., Muse, H., & Yilmaz, E. (2023). Scalable Educational Question Generation with Pre-Trained Language Models[C]// Wang, N., Rebolledo-Mendez, G., & Matsuda, N. et al. Artificial Intelligence in Education. Cham: Springer Nature Switzerland:327-339.

      [19]Clavié, B., & Gal, K. (2019). EduBERT: Pretrained Deep Language Models for Learning Analytics[EB/OL]. [2023-09-12]. http://arxiv.org/abs/1912.00690.

      [20]Dan, Y., Lei, Z., & Gu, Y. et al. (2023). EduChat: A Large-Scale Language Model-Based Chatbot System for Intelligent Education[EB/OL]. [2023-09-14]. http://arxiv.org/abs/2308.02773.

      [21]Jagmohan, A., & Vempaty, A. (2023). Merlyn Mind’s Education-Specific Language Models[EB/OL]. [2023-09-12]. https://www.merlyn.org/blog/merlyn-minds-education-specific-

      language-models.

      [22]Ji, Y., Deng, Y., & Gong, Y. et al. (2023). Exploring the Impact of Instruction Data Scaling on Large Language Models: An Empirical Study on Real-World Use Cases[EB/OL]. [2023-09-12]. http://arxiv.org/abs/2303.14742.

      [23]K?pf, A., Kilcher, Y., & von Rütte, D. et al. (2023). OpenAssistant Conversations - Democratizing Large Language Model Alignment[EB/OL]. [2023-09-14]. http://arxiv.org/abs/2304.07327.

      [24]Liao, J., Zhong, L., & Zhe, L. et al. (2024). Scaffolding Computational Thinking with ChatGPT[J]. IEEE Transactions on Learning Technologies, 17:1-15.

      [25]Liu, M., Zhang, J., & Nyagoga, L. M. et al. (2024). Student-AI Question Cocreation for Enhancing Reading Comprehension[J]. IEEE Transactions on Learning Technologies, 17:815-826.

      [26]Liu, R., Zenke, C., & Liu, C. et al. (2024). Teaching CS50 with AI: Leveraging Generative Artificial Intelligence in Computer Science Education[C]// Proceedings of the 55th ACM Technical Symposium on Computer Science Education V. 1. New York, NY, USA: Association for Computing Machinery:750-756.

      [27]Snyder, C., Hutchins, N. M., & Cohn, C. et al. (2024). Analyzing Students Collaborative Problem-Solving Behaviors in Synergistic STEM+C Learning[C]// Proceedings of the 14th Learning Analytics and Knowledge Conference. New York, NY, USA: Association for Computing Machinery:540-550.

      [28]Taylor, R., Kardas, M., & Cucurull, G. et al. (2022). Galactica: A Large Language Model for Science[EB/OL]. [2024-04-01]. http://arxiv.org/abs/2211.09085.

      [29]Zhao, W. X., Zhou, K., & Li, J. et al. (2023). A Survey of Large Language Models[EB/OL]. [2023-09-12]. http://arxiv.org/abs/2303.18223.

      [30]Zhao, Z., Ma, D., & Chen, L. et al. (2024). ChemDFM: Dialogue Foundation Model for Chemistry[EB/OL]. [2024-04-10]. http://arxiv.org/abs/2401.14818.

      收稿日期 2023-11-13 責(zé)任編輯 劉選

      The Essence, Development and Challenges of Educational Large Language Models

      LIU Ming, WU Zhongming, YANG Xiao, GUO Shuo, LIAO Jian

      Abstract: Since the generalized Large Language Models(LLMs) can only provide generalized feedback, which is difficult to match with complex educational scenarios, there is an urgent need to build Educational Large Language Models(ELLMs). ELLMs are characterized by the comprehensiveness of the educational knowledge bases(EKB), the security of the teaching content generation, the educational nature of the feedback value, the personalization of the problem solving, the multimodal nature of the human-computer interaction, and the ease of use for the users. There are six steps to construct ELLMs: formulating educational goals, selecting or designing a LLM base, constructing educational corpuses, model training or prompt learning, linking to external EKB, evaluating ELLMs. As far as the application of ELLMs is concerned, existing studies have been applied to programming, after-school reading and computer education, and have explored the enhancement of higher-order competencies and the basic disciplinary competencies that ELLMs empower students. For the future ELLMs, it is necessary to make multi-party efforts to build corpuses and EKB to unify the standards, consider the technological shift, and explore the mechanism of human-computer collaborative pedagogy.

      Keywords: ELLMs; Generative Artificial Intelligence; Artificial Intelligence in Education; Knowledge Augmentation

      达日县| 吉安县| 临潭县| 福泉市| 普定县| 镶黄旗| 武陟县| 怀集县| 武山县| 仁寿县| 大新县| 青冈县| 鸡西市| 五大连池市| 桑植县| 邹平县| 丹东市| 海林市| 策勒县| 平陆县| 晋城| 陕西省| 北流市| 海盐县| 延庆县| 丰城市| 南阳市| 屏南县| 萨迦县| 青浦区| 巫溪县| 兖州市| 报价| 松滋市| 桂阳县| 阳朔县| 自贡市| 皮山县| 玉林市| 扶沟县| 万盛区|