張悅 魏順平
【摘 要】當前,語文作文批改面臨著批改任務(wù)繁重、評價不精細、反饋不及時的問題。在深化教育評價改革的背景下,人工智能為語文作文評價提供了技術(shù)支持。語文作文評價工具的應用,使教師能夠在教學中提高作文批改的效率,豐富作文評價的內(nèi)容;使學生能夠即時獲得作文批改的詳細反饋。本文以5款語文作文評價工具為例,分析語文作文評價工具的功能和應用,并根據(jù)軟件的功能為教育主體提供選用建議。
【關(guān)鍵詞】教育評價;語文作文評價工具;人機協(xié)同
【中圖分類號】G434? ?【文獻標識碼】B
【論文編號】1671-7384(2024)02、03-115-05
當前,我國正圍繞建設(shè)高質(zhì)量教育體系,以教育評價改革牽引教育領(lǐng)域綜合改革。2020年,中共中央、國務(wù)院頒布《深化新時代教育評價改革總體方案》,在創(chuàng)新評價工具方面指出要“利用人工智能、大數(shù)據(jù)等現(xiàn)代信息技術(shù)”[1]。2023年,教育部辦公廳頒布《基礎(chǔ)教育課程教學改革深化行動方案》,特別指出利用數(shù)字化技術(shù)賦能基礎(chǔ)教育這一方向,教學評價要“充分利用人工智能和大數(shù)據(jù)技術(shù),加強過程性與增值性評價,注重發(fā)揮教學評價的引導、診斷、改進與激勵作用”[2]。隨著技術(shù)賦能進入智能化階段,人工智能、物聯(lián)網(wǎng)、VR/AR成為這一階段的代表性技術(shù)。教育者能夠運用數(shù)字化技術(shù)提升教育評價的水平,“實現(xiàn)數(shù)字思維引領(lǐng)的價值轉(zhuǎn)型”[3]。本文以數(shù)字化技術(shù)為教育評價賦能為主題,基于5款作文批改App進行比較和分析,討論人機協(xié)同下語文作文評價工具在教育教學中發(fā)揮的作用,并為教育主體選用工具提供方法與思路。
人機協(xié)同下的語文作文評價
1.語文作文批改面臨的問題
在語文作文批改中,教師需要耗費大量時間與精力,學生面臨著作文修改無從下手的問題。首先,教師的作文批改任務(wù)繁重。高中語文課程標準在文學閱讀與寫作任務(wù)群中,制定了學生“寫作次數(shù)不少于8次”[4]的要求。語文作文由于考試分值、篇幅要求,所需的批改時間也超過語文測試和作業(yè)練習中的其他題型。由是,作文的布置次數(shù)和批改時間,導致了教師批改作文需要花費大量的精力。其次,教師批改作業(yè)的時間有限,在給作文直接批改得出分數(shù)時,往往不能寫出詳細的分數(shù)評定說明。這也就導致學生在寫完作文后,只能得到簡單的作文分數(shù),不能針對其中的問題進行修改和完善。在教育實踐中,語文作文寫作和作文批改都是相對主觀的活動,學生覺得作文“難寫”,教師認為作文“難改”。針對語文作文批改存在的問題,語文作文評價工具能夠提供解決方法。
2.語文作文評價工具的發(fā)展
寫作自動評價(Automated writing evaluation, AWE)工具的開發(fā),始于20世紀六十年代美國的研究。相對于英文寫作自動評價工具,語文作文評價工具的研發(fā)盡管起步較晚,但也形成了一系列的研究成果。在算法方面,語文作文評價工具主要依靠自然語言處理、機器學習等技術(shù)來支持運行。在應用方面,語文作文評價工具主要有以下類別:“漢語L2作文自動評分系統(tǒng)”[5]是面向第二語言學習者的中文批改系統(tǒng),被應用在漢語水平考試(HSK)的作文批改中;“智能反思寫作系統(tǒng)”[6]是張登博運用java語言和基于python的自然語言處理技術(shù)構(gòu)建,能夠?qū)χ形淖魑倪M行反饋的評價系統(tǒng),目的在于使學習者對中文寫作形成反思性的評價;“自動輸出流暢性等級”[7]是吳恩慈和田俊華利用機器算法,對小學語文作文的流暢性進行自動評價的模型。總之,隨著算法的提升與完善,中文寫作自動批改技術(shù)得到發(fā)展。在技術(shù)的支持下,一批語文作文評價工具得到開發(fā),并被投入實踐中進行應用。
3.語文作文評價的工具介紹
語文作文評價工具以手機端的應用程序(application,App)為主。依據(jù)“七麥數(shù)據(jù)”的華為應用市場數(shù)據(jù)統(tǒng)計(表1),筆者按照安裝數(shù)據(jù)由高到低,將主流的語文作文評價工具和產(chǎn)品信息列舉如下。(1)筆神作文。由北京一筆兩劃科技有限公司開發(fā),在應用市場的下載量最多。該應用程序主要為中小學語文作文提供批改和診斷服務(wù),功能需付費使用。(2)光速寫作。由好課幫助教育科技有限公司開發(fā),支持人工智能寫作和人工智能作文批改。該應用程序界面簡潔,各功能可以免費使用。(3)智學作文。由華云大數(shù)據(jù)有限公司開發(fā),提供中英文的作文批改服務(wù)。作文批改功能付費使用,每篇作文的批改需花費對應的積分。(4)文娃改作文。由仿腦科技有限公司開發(fā),目前只支持小學階段的語文作文批改。(5)友章作文。由廣州世紀華軻科技有限公司開發(fā),為作文提供寫作思路和智能批改服務(wù),覆蓋小學、初中和高中三個學段。以上應用程序都支持免費下載,除光速寫作、文娃改作文免費,其余工具的語文作文評價服務(wù)都需要付費使用。
語文作文評價工具的功能與應用
1.語文作文評價工具的功能介紹
語文作文評價工具可從錄入、批改和拓展三類功能進行分類(表2),下面將具體介紹5款語文作文評價工具的基礎(chǔ)功能。
(1)筆神作文
該工具支持人工批改和人工智能輔助批改。在人工批改功能中,作文批改分為綜合評價、作文精批、深度分析三個板塊。在綜合評價中,頁面展示了材料與積累、內(nèi)容與價值、表達與感受、結(jié)構(gòu)與邏輯四個評分標準。在作文精批中,每段文字下會提示相應的批改評價,會顯示錯別字、主語缺失、標點使用等細節(jié)問題。在深度分析中,應用程序會對該篇作文的亮點進行分析,并針對作文提出詳細的修改建議。在人工智能輔導批改功能中,頁面分為寫前輔導、寫中輔導和寫后批改三個部分。在寫后批改中,錄入功能支持拍照轉(zhuǎn)文字,也可拼寫輸入。輸入完成后,人工智能能夠根據(jù)作文內(nèi)容進行打分。作文評價分綜合評價、批改詳情、全文潤色、拓展閱讀四個部分。在綜合評價中,該部分繪制等級基礎(chǔ)和發(fā)展等級兩個雷達圖。在批改詳情中,系統(tǒng)對作文進行逐段點評,并在末尾給出總體評價。在全文潤色中,系統(tǒng)給出2篇全文潤色以供參考。拓展閱讀中,頁面提供學習范文和動畫視頻。
(2)光速寫作
當用戶輸入作文圖片后,光速作文可以直接識別并在作文圖片上進行批改。在作文批改中,光速作文提供綜合評價、分句點評和全文潤色三個功能。在綜合評價中,系統(tǒng)支持對不同學段不同文體的作文進行批改,分別從切合題意、選材恰當、情感真摯、語言精妙、結(jié)構(gòu)嚴謹和書寫規(guī)范六個板塊對作文打分。在全文點評中,系統(tǒng)有標準、鼓勵和嚴格三種評分類型,以選定的風格對作文進行分析和評價。在分句點評中,頁面提供有佳句點評和修改建議兩類評語,在作文圖片中用線標注點評的句子,分別用綠色線劃出好句,用黃色線劃出建議修改的句子,并用紅色字體指正作文中的錯別字。在全文潤色中,程序會以人工智能寫作技術(shù)生成一篇范例作文。
(3)智學作文
該應用程序提供寫作指導、中文作文自動批改、英文作文自動批改、同步作文、作文素材、互動作文等服務(wù)。在中文作文批改中,頁面提供作文所屬年級和文體的選擇。作文支持圖片識別和手動輸入兩種方式,其中智能識圖技術(shù)十分靈敏,可以準確識別分欄形式的考場作文。在基礎(chǔ)版功能中,作文評價細分為主體明確、符合題意、情感真摯、結(jié)構(gòu)嚴謹和語言流暢五個標準,作文分析由四個部分組成,為字詞句批改、篇評、建議和AI點評。在字詞句批改中,頁面以綠色橫線劃出好詞好句,用紅色標注出需要修改的句子。在篇評中,系統(tǒng)會指出該篇作文存在的優(yōu)點和不足。在建議中,系統(tǒng)會針對該篇作文的開頭、中心論點、結(jié)尾分別給出建議。在AI點評部分,系統(tǒng)會對作文的內(nèi)容進行分析,指出還有待修改的地方。
(4)文娃改作文
文娃改作文僅支持小學學段的作文批改,在主頁中輸入作者名、作文題目和作文字數(shù),便可以進入作文的自動批改界面。作文支持拍照、語音、鍵盤三種輸入形式。在批改頁面中,系統(tǒng)首先會給出得分和字數(shù)統(tǒng)計。在作文段落中,系統(tǒng)用紅色字體對錯別字、搭配錯誤進行批改,并給出句評和總評??傮w而言,文娃改作文的功能較為簡單,僅能對小學語文作文給出修改說明和建議。
(5)友章作文
該應用提供寫作思路和智能批改兩個功能。在智能批改中,作文輸入支持拍照識圖和手寫識別。批改功能分為批改和分析兩個部分。在批改中,系統(tǒng)從文章內(nèi)容、表達能力和語用能力三個部分評分。在得出綜合分數(shù)后,系統(tǒng)還會從加分項、扣分項和知識鞏固三個方面點評作文。在分析中,頁面分為能力評估、知識拓展和統(tǒng)計三個部分。其中,能力評估以雷達圖展示寫作能力評估,從文章內(nèi)容、表達能力和語用能力得出綜合得分,并給出評分詳細解析和全文點評。在能力拓展中,系統(tǒng)會給出作文語句的搭配和拓展。在統(tǒng)計中,系統(tǒng)會對該篇作文字、詞、句的運用進行分析。
2.語文作文評價工具的運用案例
在教育評價中,教師可以協(xié)同應用數(shù)字化技術(shù)為教學賦能。在人機協(xié)同下,“測量工具的設(shè)計和教學設(shè)計一樣,均屬于創(chuàng)造性工作,由教師負責更為明智,而對資源的適性推薦以及依據(jù)測量規(guī)則自動組題、批閱等,可交付機器負責”[8]。接下來,筆者通過列舉作文批改的具體案例,來介紹5款語文作文評價工具的自動批改功能。
(1)筆神作文
在“AI輔導老師”中,用戶選擇“寫后批改”。在“提交作文”中,用戶可以選擇手動輸入,或者拍照轉(zhuǎn)文字,識別不準確的地方可以修改,讓內(nèi)容更準確。輸入完作文,用戶選擇對應的年級和文體后確認提交,不久便可以看到作文的批改詳情。在筆神作文中,使用者可以查看作文分數(shù)、作文水平雷達圖、拓展閱讀材料。此外,使用者還可以根據(jù)每段作文下的具體點評,對作文的語句進行修改潤色。
(2)光速寫作
在光速寫作中,用戶點擊進入“作文批改”,可以將作文拍照,或選擇圖庫的圖片,點擊“去批改”提交作文。在“綜合批改”欄目下,用戶在評分標準中選擇對應的學段,即可得到對應的分數(shù)和評價。在“全文點評”中,用戶可以更改評分的風格,得到相應的分析和建議。在“分句點評”中,使用者可以查看佳句點評和修改建議。在上傳的作文圖片中,應用程序會用紅色標注分數(shù)、錯別字。用戶可在作文圖片上檢視綠色線批注的佳句,以及黃色線標注需要修改的句子。在“分句點評”中,使用者還可以查看標注句子對應的建議。
(3)智學作文
在首頁中,用戶進入“中文作文”界面。選擇對應的學段、文體類別后,使用者輸入作文題目和內(nèi)容后,可以拍照上傳作文。根據(jù)批改的需要,用戶可以選擇“基礎(chǔ)版”“名師版”“名師真人版”模式之一,消耗相應積分即可得到作文的批改結(jié)果。在選擇“基礎(chǔ)版”批改后,用戶會得到系統(tǒng)提供的一份“學生作文提升報告”。在報告中,使用者可以查看作文分數(shù)、作文等級的評定。在作文的分析報告中,用戶可以查看“字詞句批改”,其中紅色為錯誤修改批注,綠色為好詞好句批注。使用者可以根據(jù)“篇評”“建議”“南昊AI”提出的修改建議,對作文進行相應的修改與潤色。此外,用戶在“批改記錄”中還可以查詢過往作文的批改情況。
(4)文娃改作文
在首頁中,用戶輸入作文的作者名、題目和字數(shù),再選擇作文的對應年級,即可進入批改界面。使用者可以選擇拍照、語音、鍵盤三種輸入模式之一,將作文輸入系統(tǒng)獲得批改結(jié)果。在批改結(jié)果中,使用者可以查看作文的得分和字數(shù)統(tǒng)計。在“修改作文”中,用戶可以在該頁面中查看作文相應部分的句評、段評和用紅色標注的修改提示。用戶還可以瀏覽“修改后的作文”,查看系統(tǒng)修改后的作文。在“批閱說明”中,用戶可以查看系統(tǒng)對該篇作文的點評。
(5)友章作文
在首頁中,用戶點擊進入“智能批改”界面。在“新建作文批改”中,用戶選擇對應的作文輸入方式。在選擇對應的學段、文體類別后,使用者點擊“完成”,即可得到作文得分和評價分析。在“批改”中,使用者可以查看作文“加分項”“扣分項”“知識鞏固”的批改詳情。在“分析”中,使用者可以查看與該篇作文相關(guān)的“能力評估”“知識拓展”“統(tǒng)計”。在“能力評估”中的“評分詳細解析”,使用者還可以點擊查閱詳細的多維度點評。
3.語文作文評價工具的功能與應用述評
在應用方面,由于各個軟件的功能差異,用戶使用體驗感也各不相同。在作文識別方面,上述語文作文評價工具都支持圖片掃描和電子文檔兩種輸入方式。在5款語文作文評價工具中,智學作文的圖片文字識別(Image Text Recognition)技術(shù)最為成熟,能夠識別考場試卷中的分欄作文。個別應用程序如文娃改作文,還能支持語音識別。在錯別字識別方面,5款語文作文評價工具都能夠識別出錯字,并給出修改建議。在直觀性呈現(xiàn)方面,筆神作文和友章作文能夠根據(jù)作文的內(nèi)容,繪制能力雷達圖,形象地顯示出作文的各項得分指標。在拓展材料方面,筆神作文能夠提供相關(guān)主題的范文和拓展學習材料,友章作文提供了知識拓展,從語句搭配和語句拓展兩方面,給出作文提升的語料。值得注意的是,這5款語文作文評價工具都只能單篇進行作文批改,不能同時評閱一批作文,故而效率顯得不夠高。
在評價方面,語文作文評價工具利弊兼有。以優(yōu)點而言,5款語文作文評價工具能夠?qū)ψ魑倪M行定性和定量相結(jié)合的評價,不僅能夠給出具體的作文分數(shù),且評語較為貼合作文的實際情況。各軟件的不足之處也非常明顯。首先,大部分軟件是識別圖片轉(zhuǎn)為文字,僅能從內(nèi)容來判定作文質(zhì)量,對于寫作的字體和整潔度等卷面細節(jié)則無法判斷。其次,由于未經(jīng)過嚴格的信效度檢驗,這些作文批改工具無法在考試作文的評價中應用,只能用于日常寫作教學的形成性評價中,即“一般是在寫作教學進行過程中開展的,它所借助的手段有日記、周記、課堂練筆、平時作業(yè)、發(fā)表的文章和形成性測驗等”[9]。此外,因為批改工具的評分標準不夠嚴密,教師在獲取工具提供的作文評價時,無法得知作文教學是否達到了教學目標,是否促進了學生語文核心素養(yǎng)的能力培養(yǎng)??傊Z文作文評價工具可以為語文作文評價提供便利,但應用程序本身仍有許多需要完善改進的地方。
語文作文評價工具的選用建議
1.給教師及學校管理者的建議
在實踐運用方面,中小學語文教師可以使用語文作文評價工具提升教學評價的質(zhì)量。首先,教師可以借助語文作文評價工具的自動批改功能,快速定位學生的作文層次水平。其次,教師可以查看系統(tǒng)對錯別字的識別,把握作文批改的細節(jié)。此外,教師還可以參看系統(tǒng)給出的作文評語,為批改和評價作文拓展思路。根據(jù)各軟件不同的應用效果,教師可以搭配使用各工具的批改功能,以獲得更好的使用體驗。在識別圖片方面,盡管大部分批改工具都能夠識別圖片,但智學作文識別功能的精準度較高。教師可以使用智學作文進行作文圖片的識別,將作文轉(zhuǎn)化為電子文本格式。獲取電子版作文之后,教師可以將其導入到識別功能不準確的軟件中,以使用不同軟件的作文批改服務(wù)。但是,由于軟件評分的信效度有待檢驗,作文的最終評分仍需教師本人再次確定。
在學校層面,教育管理者應該積極作出嘗試,接納信息化工具帶來的教育評價變革。首先,學校應該做好應用工具進校園的安全性評估工作,遴選出一批“易用、可用、好用的數(shù)字教學平臺和工具”[10],為教育教學的數(shù)字化進程賦能。其次,學??梢詫酉鄳能浖推脚_,購買作文自動批改的服務(wù),以減輕教師批改作文的負擔。最后,學校相關(guān)部門應組織對教師信息技術(shù)的培訓指導,使得教師能夠熟練地運用信息技術(shù),利用相關(guān)工具來提升作文批改的效率。
2.給學生及家長的建議
在課堂之外,學生可以利用語文作文評價工具來提升寫作水平。首先,學生可以利用作文評價工具得到作文的分數(shù)評價,并且了解到作文中存在的不足。大部分軟件能提供總體評價與修改建議,個別軟件還能夠針對相應的作文語句提出修改建議,如筆神作文和光速寫作。其中,筆神作文的句批更為詳細,具有較強的修改操作性。在作文評價工具的建議指導下,學生能夠修改作文的相應細節(jié)。其次,學生可以在程序中查看批改的歷史記錄,以建立作文的成長記錄袋。成長記錄袋中的記錄內(nèi)容,“一是學生作品產(chǎn)生過程的說明,二是學生的系列作品,三是學生的反思”[9]。學生在使用作文評價工具的過程中,可以記錄下修改之處和反思感悟,建立寫作與反思的資料庫,在不斷的練習與積累中提升寫作水平。
此外,學生家長也可以為學生使用語文作文評價工具提供幫助。首先,因為語文作文評價工具以手機應用程序為主,學生家長應注意學生是否在使用手機軟件學習,并提醒學生使用手機的時間不宜過長。其次,家長還可以對寫作批改的收費標準是否合理進行判斷。在注冊登錄時,大部分應用程序會提供2~3次免費批改作文的機會,之后的作文批改收費不同。除了光速作文、文娃改作文提供免費的批改服務(wù),其余3個軟件都是在付費后才能使用作文批改服務(wù)。應用程序按照收費的價格由高到低排列為:筆神作文(168元1年)>智學作文(1元1篇)、友章作文(1元1天)>光速寫作、文娃改作文(免費)。學生家長可以根據(jù)經(jīng)濟水平情況,為學生支付相應的作文批改費用。
結(jié)? 語
在教育評價改革的背景下,信息技術(shù)支持的工具能夠為評價賦能。語文作文評價工具的出現(xiàn),能解決目前語文作文批改中存在的問題。人機協(xié)同下語文作文評價工具的應用,一方面能夠?qū)⒔處煆呐牡姆敝厝蝿?wù)中解放出來,將精力投入到知識產(chǎn)出與創(chuàng)新中。另一方面,學生獲取了即時性強、評價細致的作文批改報告,有助于提升語文寫作的能力。然而,目前的語文作文評價工具仍存在著評價標準不透明、評價結(jié)果不準確等問題。相信隨著技術(shù)的發(fā)展,語文作文評價工具將更新迭代,以更加準確、更加高效、更為個性的批改服務(wù)來滿足師生對于作文評價的需求。
注:本文系國家自然科學基金2022年面上項目“教育信息化戰(zhàn)略對民族地區(qū)義務(wù)教育優(yōu)質(zhì)均衡的影響研究(72274234)”、2023年中央民族大學研究生科研實踐項目(SJCX2023013)的階段性研究成果
參考文獻
中共中央,國務(wù)院. 深化新時代教育評價改革總體方案[EB/OL].[2020-10-13].https://www.gov.cn/gongbao/content/2020/content_5554488.htm.
中華人民共和國教育部.基礎(chǔ)教育課程教學改革深化行動方案[EB/OL].[2023-05-26].http://www.moe.gov.cn/srcsite/A26/jcj_kcjcgh/202306/t20230601_1062380.html.
[10] 黃榮懷,楊俊鋒. 教育數(shù)字化轉(zhuǎn)型的內(nèi)涵與實施路徑[EB/OL].[2022-04-06].http://www.jyb.cn/rmtzgjyb/202204/t20220406_687679.html.
中華人民共和國教育部. 普通高中語文課程標準(2017年版2020年修訂)[M]. 北京:北京師范大學出版社,2022: 8.
徐昌火,陳東,吳倩,等. 漢語作為第二語言作文自動評分研究初探[J]. 國際漢語教學研究,2015(1): 83-89.
張登博,劉明. 智能反思寫作反饋系統(tǒng)的設(shè)計與應用[J]. 現(xiàn)代教育技術(shù),2021,31(11): 96-103.
吳恩慈,田俊華. 基于語言學特征的小學生作文流暢性自動評價[J]. 教育測量與評價,2020(3): 41-50+64.
祝智庭,彭紅超,雷云鶴. 智能教育: 智慧教育的實踐路徑[J]. 開放教育研究,2018,24(4): 13-24+42.
傅蔚. 寫作評價的內(nèi)涵、類型與特點研究[J]. 現(xiàn)代教育科學,2010(8): 76-78.
作者單位:中央民族大學教育學院
編? ?輯:王曉波