俞顯
隨著云計(jì)算、大數(shù)據(jù)、自然語(yǔ)義分析技術(shù)的快速迭代發(fā)展,智能語(yǔ)音識(shí)別與分析技術(shù)在醫(yī)療、交通、通信、會(huì)務(wù)等領(lǐng)域有了廣泛的應(yīng)用,由此帶來(lái)一場(chǎng)新的社會(huì)變革。語(yǔ)言教學(xué)歷來(lái)關(guān)注學(xué)生語(yǔ)言綜合應(yīng)用能力的評(píng)價(jià),但受限于測(cè)評(píng)手段不足,往往只能通過(guò)紙筆測(cè)試來(lái)監(jiān)測(cè)學(xué)生的學(xué)習(xí)狀況,一定程度上導(dǎo)致了“啞巴英語(yǔ)”“聾子英語(yǔ)”等語(yǔ)言教學(xué)異化現(xiàn)象。隨著智能語(yǔ)音測(cè)評(píng)技術(shù)的發(fā)展,利用該項(xiàng)技術(shù)開(kāi)展教學(xué)和考試受到廣泛關(guān)注,全面評(píng)價(jià)學(xué)生的語(yǔ)用能力有了技術(shù)支撐。近年來(lái),智能語(yǔ)音測(cè)評(píng)技術(shù)在教學(xué)應(yīng)用上不斷深入,產(chǎn)生了一批有意義的研究和實(shí)踐成果,有力地助推了兩者的融合。相比之下,智能語(yǔ)音測(cè)評(píng)技術(shù)在大規(guī)模高利害考試中應(yīng)用的研究卻較為鮮見(jiàn),不利于學(xué)術(shù)和實(shí)踐的交流。為此,本文分析智能語(yǔ)音測(cè)評(píng)技術(shù)在中考英語(yǔ)聽(tīng)說(shuō)能力考試(以下稱“人機(jī)對(duì)話”)應(yīng)用過(guò)程中存在的問(wèn)題,并提出相應(yīng)的解決策略,以期為相關(guān)研究和實(shí)踐提供參考。
智能語(yǔ)音測(cè)評(píng)技術(shù)在英語(yǔ)教學(xué)中應(yīng)用的研究隨著自然語(yǔ)音處理、機(jī)器深度學(xué)習(xí)和大數(shù)據(jù)技術(shù)的發(fā)展而不斷深入。最早的研究可追溯到1952 年貝爾研究所研發(fā)出第一個(gè)語(yǔ)音識(shí)別系統(tǒng)。之后,隨著自然語(yǔ)義處理技術(shù)的發(fā)展,利用技術(shù)手段輔助英語(yǔ)聽(tīng)力口語(yǔ)訓(xùn)練逐漸受到青睞,單機(jī)訓(xùn)練和語(yǔ)音糾正是這一時(shí)期的技術(shù)特點(diǎn)。第二個(gè)階段是20 世紀(jì)80 年代至21世紀(jì)前10年,隨著計(jì)算機(jī)存儲(chǔ)和處理技術(shù)以及自然語(yǔ)音識(shí)別技術(shù)的快速發(fā)展,對(duì)自然語(yǔ)義的編碼和解碼成為這個(gè)時(shí)段的主流應(yīng)用,主要表現(xiàn)為不同語(yǔ)言互譯、語(yǔ)音識(shí)別等,但由于機(jī)器學(xué)習(xí)算法沒(méi)有大規(guī)模突破,智能語(yǔ)音測(cè)評(píng)技術(shù)的應(yīng)用場(chǎng)景規(guī)模比較有限。第三個(gè)階段是2010 年至今,隨著大數(shù)據(jù)、云計(jì)算技術(shù)的發(fā)展,機(jī)器深度學(xué)習(xí)無(wú)論是訓(xùn)練的數(shù)據(jù)量還是運(yùn)算速度都有了空前的發(fā)展,從而極大地提高了智能語(yǔ)音測(cè)評(píng)技術(shù)應(yīng)用于測(cè)量的信度和效度,這一時(shí)期智能語(yǔ)音測(cè)評(píng)技術(shù)的研究呈爆發(fā)態(tài)勢(shì)。研究主要聚焦在三個(gè)方面:一是智能語(yǔ)音測(cè)評(píng)技術(shù)優(yōu)化。通過(guò)機(jī)器學(xué)習(xí)算法優(yōu)化和計(jì)算機(jī)運(yùn)算能力的提升,大幅度提高語(yǔ)義分析和評(píng)判的精確度[1]。二是智能語(yǔ)音測(cè)評(píng)技術(shù)在教學(xué)中的應(yīng)用研究,關(guān)注如何利用技術(shù)手段支持教與學(xué)活動(dòng)的組織與實(shí)施,并通過(guò)數(shù)據(jù)反饋來(lái)改進(jìn)教學(xué)策略[2]。三是智能語(yǔ)音測(cè)評(píng)技術(shù)的應(yīng)用效果研究。通過(guò)實(shí)驗(yàn)組和對(duì)照組的準(zhǔn)實(shí)驗(yàn)數(shù)據(jù)分析后認(rèn)為,利用智能語(yǔ)音測(cè)評(píng)技術(shù)的實(shí)驗(yàn)組其聽(tīng)說(shuō)能力的提高大于對(duì)照組,提升了教學(xué)效率,激發(fā)了學(xué)生的學(xué)習(xí)積極性等[3]。
可以發(fā)現(xiàn),當(dāng)前的研究主要關(guān)注智能語(yǔ)音技術(shù)在教學(xué)中的應(yīng)用研究。而有關(guān)智能語(yǔ)音測(cè)評(píng)技術(shù)在大規(guī)模高利害考試中應(yīng)用的研究卻并不多見(jiàn),本文嘗試以此為切入口,結(jié)合實(shí)踐和觀察開(kāi)展相應(yīng)分析,以期為相關(guān)研究和實(shí)踐提供參考。
調(diào)查研究采用分層隨機(jī)抽樣法在S 市內(nèi)選取15所初中學(xué)校和10 所高中學(xué)校作為樣本來(lái)源,初中學(xué)校的調(diào)查對(duì)象涉及教學(xué)副校長(zhǎng)、英語(yǔ)學(xué)科教師;高中學(xué)校的調(diào)查對(duì)象為高一新生(參加過(guò)人機(jī)對(duì)話考試)。作為港口城市的S 市位于東部沿海,經(jīng)濟(jì)社會(huì)發(fā)展程度較高,城鄉(xiāng)發(fā)展較為均衡,信息化和數(shù)字經(jīng)濟(jì)發(fā)展區(qū)位優(yōu)勢(shì)明顯。S 市于2009 年啟動(dòng)英語(yǔ)聽(tīng)力口語(yǔ)人機(jī)對(duì)話考試的試點(diǎn)工作,并于2011 年全面推開(kāi)。該市中考英語(yǔ)人機(jī)對(duì)話考試采用智能語(yǔ)音技術(shù)支持,考務(wù)管理、試卷制作均采用計(jì)算機(jī)輔助完成??荚囘^(guò)程采用人機(jī)交互形式,即聽(tīng)力部分收聽(tīng)電腦播放語(yǔ)音并選擇正確答案,口語(yǔ)部分按要求用口語(yǔ)作答試題。閱卷環(huán)節(jié)采用“人工抽樣定標(biāo),智能測(cè)評(píng)系統(tǒng)深度學(xué)習(xí)并自動(dòng)評(píng)分”的模式??荚嚱M織方面,綜合考慮考試機(jī)位和考試安全保障等因素,測(cè)試實(shí)行按時(shí)段分批次進(jìn)行,并規(guī)定不同時(shí)段采用不同試卷。試卷分聽(tīng)說(shuō)兩部分,其中聽(tīng)力15 分,分為聽(tīng)對(duì)話回答問(wèn)題(5 題,5 分)、聽(tīng)對(duì)話和短文答題(10 題,10 分);口語(yǔ)10 分,分朗讀短文(3 分)、情景問(wèn)答(2分)、話題簡(jiǎn)述(5 分)。聽(tīng)說(shuō)合計(jì)25 分(英語(yǔ)學(xué)科滿分120分),考試時(shí)長(zhǎng)為30分鐘左右。
本次研究運(yùn)用調(diào)查研究法和資料分析法。調(diào)查研究方面,采用調(diào)查問(wèn)卷和半結(jié)構(gòu)化訪談的形式:面向初中學(xué)校,發(fā)放教師問(wèn)卷56份,有效問(wèn)卷54份,有效率96.4%。教師區(qū)域分布為:農(nóng)村27人(50.00%),鄉(xiāng)鎮(zhèn)12 人(22.20%),中心城區(qū)15 人(27.8%)。面向高中學(xué)校,通過(guò)網(wǎng)絡(luò)問(wèn)卷的形式,共發(fā)放學(xué)生問(wèn)卷2165份,有效問(wèn)卷2150份,有效率99.31%。其中,男生1057 人(49.16%),女生1093 人(50.84%);區(qū)域分布為:農(nóng)村101 人(4.70%),鄉(xiāng)鎮(zhèn)882 人(41.02%),中心城區(qū)1167 人(54.28%)。調(diào)查問(wèn)卷涉及對(duì)人機(jī)對(duì)話的滿意度、試題考查內(nèi)容和題型的適切度、試題難度和區(qū)分度的合理性、自動(dòng)化評(píng)分的認(rèn)可度、教學(xué)壓力情況、學(xué)生練習(xí)方式等方面,并運(yùn)用SPSS21.0軟件對(duì)相關(guān)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。訪談采用集體座談和個(gè)別訪談的形式,訪談對(duì)象是英語(yǔ)學(xué)科教師和教學(xué)副校長(zhǎng),共56 人參與訪談,其中教學(xué)副校長(zhǎng)10 人。訪談聚焦學(xué)生學(xué)習(xí)投入的變化、教學(xué)壓力的來(lái)源及其原因、教師對(duì)人機(jī)對(duì)話優(yōu)勢(shì)與不足的看法等維度。資料分析方面的數(shù)據(jù)類型主要有兩種,一類是量化數(shù)據(jù),包括問(wèn)卷調(diào)查數(shù)據(jù)、智能語(yǔ)音評(píng)分系統(tǒng)參數(shù)、考試成績(jī)數(shù)據(jù)、試題質(zhì)量參數(shù)等;另一類是質(zhì)性數(shù)據(jù),包括文件材料、訪談對(duì)話、觀察記錄、工作總結(jié)和反思等。分析時(shí),對(duì)質(zhì)性數(shù)據(jù)進(jìn)行剖析并建立相關(guān)聯(lián)系,且以量化數(shù)據(jù)為輔助用以確證。
中考具有學(xué)業(yè)水平鑒定和畢業(yè)升學(xué)選拔的雙重屬性,既強(qiáng)調(diào)標(biāo)準(zhǔn)參照測(cè)驗(yàn)下劃定考核層次,又重視常模參照測(cè)驗(yàn)下人才選拔的區(qū)分度。而在人機(jī)對(duì)話實(shí)踐中,目前來(lái)看,兩種測(cè)驗(yàn)?zāi)P屯y以調(diào)和。調(diào)研發(fā)現(xiàn),為降低由于考試形式變化帶來(lái)的“不穩(wěn)定”風(fēng)險(xiǎn),人機(jī)對(duì)話試題的難度一般較筆試部分低,表現(xiàn)為高分組與低分組平均值差異小、區(qū)分度底。低區(qū)分度帶來(lái)的弊端已初露端倪,值得重視。一是考生學(xué)業(yè)負(fù)擔(dān)不降反增。訪談發(fā)現(xiàn),對(duì)英語(yǔ)高水平考生來(lái)說(shuō),低難度的試題降低了該類考生的學(xué)科競(jìng)爭(zhēng)力。為達(dá)到“止損”的目標(biāo),這部分考生一方面繼續(xù)加強(qiáng)聽(tīng)說(shuō)能力的訓(xùn)練,確保人機(jī)對(duì)話不丟分;另一方面在筆試部分投入更多的時(shí)間和精力以擴(kuò)大優(yōu)勢(shì)。對(duì)中等水平考生而言,人機(jī)對(duì)話難度降低后為其創(chuàng)造了與高水平學(xué)生縮小差距的機(jī)會(huì),為此投入更多的時(shí)間成本已成必然。必須承認(rèn),以上種種異象是優(yōu)質(zhì)教育資源匱乏背景下以升學(xué)率作為核心考核指標(biāo)的結(jié)果表現(xiàn)。二是廣義公平下對(duì)個(gè)體利益的忽視。廣義上看,低難度的試題有利于激發(fā)基礎(chǔ)薄弱學(xué)校和學(xué)生教與學(xué)的積極性,有助于其聽(tīng)說(shuō)能力的整體提升,符合羅爾斯有關(guān)弱勢(shì)群體社會(huì)保護(hù)的公共利益觀[4]。但就個(gè)體而言,高水平考生其固有的學(xué)科優(yōu)勢(shì)被壓縮,但難以獲得相應(yīng)的補(bǔ)償機(jī)會(huì),廣義上的群體公平存在忽視個(gè)體利益的嫌疑。由此可見(jiàn),人機(jī)對(duì)話的低區(qū)分度并不能完全滿足“兩考合一”的目標(biāo)要求。但同時(shí)也應(yīng)該看到,作為一項(xiàng)促進(jìn)學(xué)生英語(yǔ)學(xué)科能力發(fā)展為旨趣的教學(xué)評(píng)價(jià)活動(dòng),其整體“投入—產(chǎn)出”的社會(huì)效益值得肯定。
難度等值方面,人機(jī)對(duì)話受考試機(jī)位數(shù)量的限制,實(shí)行按時(shí)段分批次組織考試的方式,出于保密的考慮,不同時(shí)段采用不同試卷,由此帶來(lái)不同試卷難度等值的問(wèn)題。鑒于中考的高利害性,一般要求同一學(xué)科復(fù)本試卷應(yīng)刻畫(huà)在同一測(cè)量尺度下,以實(shí)現(xiàn)分?jǐn)?shù)橫向比較的目的。但由于保密要求等因素的限制,目前人機(jī)對(duì)話不同時(shí)段試卷難以運(yùn)用業(yè)已成熟的難度等值技術(shù),如設(shè)置“錨題”,其難度把控一般依靠命題教師的業(yè)務(wù)能力和命題經(jīng)驗(yàn),難度的穩(wěn)定性具有一定的不確定性,這一問(wèn)題需要從根本上予以解決。
區(qū)域、校際教育資源配置失衡引發(fā)的問(wèn)題在人機(jī)對(duì)話教學(xué)中表現(xiàn)得尤為突出。調(diào)研發(fā)現(xiàn),新增人機(jī)對(duì)話考試特別是口語(yǔ)模塊后,有近80%的英語(yǔ)教師表示壓力明顯增加,其中鄉(xiāng)鎮(zhèn)教師占比高達(dá)90%左右,而起點(diǎn)差異和過(guò)程差異是教學(xué)壓力的主要來(lái)源。起點(diǎn)差異上,鄉(xiāng)鎮(zhèn)教師自身的口語(yǔ)教學(xué)能力不足和鄉(xiāng)鎮(zhèn)學(xué)生口語(yǔ)基礎(chǔ)薄弱是目前人機(jī)對(duì)話教學(xué)中普遍存在的情況,導(dǎo)致鄉(xiāng)鎮(zhèn)師生在面對(duì)人機(jī)對(duì)話教學(xué)時(shí)輸在了“起跑線”上;過(guò)程差異上,城市教師的整體聽(tīng)說(shuō)教學(xué)能力要高于鄉(xiāng)鎮(zhèn)教師,城市學(xué)生可以也獲得更為優(yōu)質(zhì)的學(xué)習(xí)資源(可以理解為家庭文化資本在教育中的集中體現(xiàn))??梢哉f(shuō),在追求考試成績(jī)的目標(biāo)函數(shù)上,變量的起點(diǎn)和過(guò)程取值作用疊加,擴(kuò)大的不僅僅是城鄉(xiāng)考生的分?jǐn)?shù)差異,更有鄉(xiāng)鎮(zhèn)教師的心理壓力。在此背景下,集中有限教育資源,提高學(xué)生的學(xué)業(yè)成績(jī),成為教育領(lǐng)域中最為常見(jiàn)的價(jià)值追求[5]。為取得更高的分?jǐn)?shù),教師在人機(jī)對(duì)話日常教學(xué)中只針對(duì)考試的題型和內(nèi)容來(lái)設(shè)計(jì)教學(xué)活動(dòng),重視學(xué)生的應(yīng)試技巧,“一切以學(xué)生為重”的表象下隱藏著“一切以分?jǐn)?shù)為重”的實(shí)質(zhì)。教師將學(xué)生語(yǔ)言綜合運(yùn)用能力的培養(yǎng)窄化為語(yǔ)言應(yīng)試能力的培養(yǎng),忽視了學(xué)生的個(gè)性、特長(zhǎng)和興趣,映射出英語(yǔ)教師固化的應(yīng)試教育思維。對(duì)考生而言,人機(jī)對(duì)話日常練習(xí)只限于考試的題型和內(nèi)容,抑制了語(yǔ)言對(duì)話交流的豐富性,導(dǎo)致學(xué)生主動(dòng)參與度不高,出現(xiàn)考試分?jǐn)?shù)和學(xué)習(xí)興趣的二元沖突。
此外,人機(jī)對(duì)話作為信息技術(shù)在教學(xué)和考試融合方面的積極嘗試,其參與主體,即學(xué)生和教師顯然尚未做好準(zhǔn)備。調(diào)查發(fā)現(xiàn),教師們普遍缺乏將信息技術(shù)融合教學(xué)以實(shí)現(xiàn)教學(xué)目標(biāo)的能力,如有教師將網(wǎng)絡(luò)教學(xué)資源簡(jiǎn)單地視為學(xué)生自主學(xué)習(xí)資源,注重人機(jī)對(duì)話測(cè)試軟件對(duì)考試場(chǎng)景的模擬而忽視對(duì)反饋結(jié)果的深入解讀以支持教學(xué)策略的改進(jìn)等。另一方面,調(diào)查數(shù)據(jù)顯示,有近85%的學(xué)生使用手機(jī)作為課外口語(yǔ)練習(xí)的學(xué)習(xí)工具。在“完成人機(jī)對(duì)話練習(xí)后,你會(huì)使用手機(jī)玩游戲、看新聞等娛樂(lè)活動(dòng)嗎?”的調(diào)查上,結(jié)果顯示,學(xué)生使用手機(jī)娛樂(lè)的行為頻次與使用手機(jī)開(kāi)展人機(jī)對(duì)話練習(xí)的行為頻次呈正相關(guān)。由此而言,學(xué)生日常手機(jī)管理問(wèn)題和聽(tīng)說(shuō)練習(xí)多樣化的支持方式同樣值得重視。
傳統(tǒng)口語(yǔ)面試由于組織難度大、耗時(shí)長(zhǎng)、評(píng)分信度不穩(wěn)定等原因而無(wú)法在大規(guī)模高利害考試中得以廣泛應(yīng)用。智能語(yǔ)音測(cè)評(píng)技術(shù)在語(yǔ)言測(cè)評(píng)中的有效應(yīng)用,極大地提高了口語(yǔ)測(cè)評(píng)的效率,改變了傳統(tǒng)口語(yǔ)面試的局限,可以說(shuō)是一次“評(píng)價(jià)技術(shù)”決定“評(píng)價(jià)關(guān)系”的經(jīng)典例證。但由于智能語(yǔ)音測(cè)評(píng)技術(shù)仍處于發(fā)展中,功能缺失導(dǎo)致的測(cè)評(píng)活動(dòng)異化現(xiàn)象需要警惕。一是口語(yǔ)試題多樣化設(shè)計(jì)有待進(jìn)一步完善。筆者調(diào)研發(fā)現(xiàn),為保證測(cè)評(píng)結(jié)果的可信有效,在實(shí)踐中口語(yǔ)試題內(nèi)容和題型一般選用測(cè)評(píng)技術(shù)支持的話題和對(duì)話形式。從狹義上講,選用與成熟測(cè)評(píng)技術(shù)相匹配的試題可以保證測(cè)評(píng)結(jié)果信度和效度,遵循的是考試公平、公正的價(jià)值尺度。但從廣義上看,有限的試題內(nèi)容和題型并不能全面地測(cè)量出考生的口語(yǔ)能力,這就要求在試題命制的過(guò)程中掌握信息技術(shù)環(huán)境下英語(yǔ)聽(tīng)說(shuō)核心能力的有效觀測(cè)點(diǎn),這對(duì)命題教師來(lái)說(shuō)是一個(gè)巨大的挑戰(zhàn)。二是評(píng)分模型尚處于升級(jí)發(fā)展過(guò)程。從實(shí)踐上,當(dāng)前應(yīng)用到大規(guī)模高利害考試的口語(yǔ)評(píng)分系統(tǒng)均通過(guò)了省級(jí)以上權(quán)威鑒定報(bào)告,可以滿足考試要求,但也處在不斷發(fā)展完善過(guò)程當(dāng)中。評(píng)分系統(tǒng)的基本原理是對(duì)數(shù)據(jù)集的挖掘和分析,是機(jī)器深度學(xué)習(xí)的過(guò)程,而機(jī)器深度學(xué)習(xí)除了需要高效的算法外,更需要大量的非同質(zhì)、關(guān)系復(fù)雜的數(shù)據(jù)集用作訓(xùn)練,但目前口語(yǔ)評(píng)分現(xiàn)狀是機(jī)器深度學(xué)習(xí)所需的數(shù)據(jù)的積累量需要進(jìn)一步擴(kuò)大,數(shù)據(jù)之間關(guān)系的同質(zhì)性也比較高,高效的機(jī)器深度學(xué)習(xí)尚缺乏理想的現(xiàn)實(shí)條件。但可以肯定的是,隨著人機(jī)對(duì)話口語(yǔ)語(yǔ)音數(shù)據(jù)的不斷積累和算法的不斷完善,評(píng)分模型的精度會(huì)越來(lái)越高。
進(jìn)一步看,在口語(yǔ)測(cè)評(píng)的效率和公平對(duì)話中,隱含著教育實(shí)踐對(duì)工具理性和價(jià)值理性的認(rèn)識(shí)與選擇。如何在口語(yǔ)能力測(cè)評(píng)的合教育價(jià)值目標(biāo)與最大程度發(fā)揮測(cè)評(píng)技術(shù)效用的合工具性之間取得平衡,是人機(jī)對(duì)話進(jìn)一步發(fā)展不可回避的現(xiàn)實(shí)問(wèn)題。
面對(duì)人機(jī)對(duì)話,師生表現(xiàn)的態(tài)度基本一致,但是行為表現(xiàn)卻并不完全一致。英語(yǔ)教師呈現(xiàn)出的是“承認(rèn)”與“抵制”的雙重矛盾心理;而學(xué)生的反應(yīng)是“順從”的心理狀態(tài)。調(diào)查發(fā)現(xiàn),英語(yǔ)教師對(duì)人機(jī)對(duì)話的“承認(rèn)”體現(xiàn)在三個(gè)方面。一方面是課程標(biāo)準(zhǔn)的教學(xué)認(rèn)識(shí)。絕大部分英語(yǔ)教師對(duì)開(kāi)展人機(jī)對(duì)話考試的意義有明確的認(rèn)識(shí),認(rèn)為開(kāi)展該項(xiàng)考試,有助于學(xué)生語(yǔ)言綜合運(yùn)用能力的發(fā)展,有利于培養(yǎng)學(xué)生的英語(yǔ)核心素養(yǎng)。第二方面是契合學(xué)生發(fā)展的教學(xué)自覺(jué)。置身全球化發(fā)展的場(chǎng)域,具備良好的英語(yǔ)交流與應(yīng)用能力是學(xué)生在未來(lái)社會(huì)發(fā)展的核心競(jìng)爭(zhēng)力,而初中英語(yǔ)學(xué)習(xí)是重要的基礎(chǔ)。在此背景下,夯實(shí)學(xué)生初中英語(yǔ)基礎(chǔ)成為初中英語(yǔ)教師的職業(yè)使命感,觸發(fā)其教學(xué)自覺(jué)性。有教師表示,“英語(yǔ)交流對(duì)話中,聽(tīng)說(shuō)占據(jù)重要的比重,而傳統(tǒng)的英語(yǔ)教學(xué)只注重紙筆測(cè)試而造成‘聾子、啞巴’英語(yǔ),是典型的教學(xué)異化現(xiàn)象,作為學(xué)科教師難辭其咎”。第三方面是教育政策要求下的強(qiáng)制承認(rèn)。在行政文件上規(guī)定人機(jī)對(duì)話作為考試項(xiàng)目,至少在教育領(lǐng)域內(nèi)具有普遍的合法性。對(duì)身處領(lǐng)域內(nèi)的英語(yǔ)教師來(lái)說(shuō),執(zhí)行教育行政主管部門的政策便具有天然的合理性。以上三點(diǎn)勾勒出教師對(duì)人機(jī)對(duì)話客觀性承認(rèn)的基本輪廓,但在實(shí)踐中,受人機(jī)對(duì)話主客觀條件的限制,在“承認(rèn)”的背后又隱藏著現(xiàn)實(shí)性“抵制”。一方面是教師“精力缺乏”。調(diào)查發(fā)現(xiàn),新增口語(yǔ)模塊牽制了英語(yǔ)教師額外的時(shí)間,并需要付出更多的精力,但又沒(méi)有相應(yīng)的補(bǔ)償措施;另一方面是教師的“本領(lǐng)恐慌”。英語(yǔ)教師普遍表示,將口語(yǔ)列入中考后,考查要求增加,但由于自身口語(yǔ)教學(xué)能力不足和學(xué)生口語(yǔ)基礎(chǔ)不一導(dǎo)致教學(xué)壓力倍增,表現(xiàn)的是內(nèi)心的“抵制”??梢钥吹剑凇俺姓J(rèn)”與“抵制”的矛盾對(duì)峙中,在沒(méi)有補(bǔ)償性和容錯(cuò)機(jī)制的保障下,英語(yǔ)教師出于“自我保護(hù)”的本能反應(yīng),勢(shì)必會(huì)將人機(jī)對(duì)話推向功利性教育——應(yīng)試教育。
對(duì)考生的調(diào)查發(fā)現(xiàn),考生對(duì)人機(jī)對(duì)話的支持度均值為3.56,呈中等水平,得分標(biāo)準(zhǔn)差為較小,僅為0.28,說(shuō)明考生對(duì)人機(jī)對(duì)話并沒(méi)有表現(xiàn)出鮮明的態(tài)度。有考生表示,“升讀普高、重高是我的愿望,也是我家人的期望,我的精力主要集中在提高分?jǐn)?shù)上,包括人機(jī)對(duì)話”。另一方面,筆者分析發(fā)現(xiàn),新增口語(yǔ)模塊后考生的筆試卷面均值高于新增前且呈顯著性差異,而新增口語(yǔ)后,筆試試卷的考前預(yù)估難度要略高于新增前。這是否說(shuō)明新增口語(yǔ)模塊后,考生英語(yǔ)學(xué)科的整體水平有所提高需要進(jìn)一步分析。
測(cè)驗(yàn)活動(dòng)的有效性在很大程度上取決于測(cè)驗(yàn)工具的科學(xué)性[6]。人機(jī)對(duì)話試題的低難度導(dǎo)致的低區(qū)分度、試題不等值、能力測(cè)評(píng)不全面等問(wèn)題違背高利害考試的公平性原則。目前來(lái)看,需要從測(cè)量理念和測(cè)量技術(shù)兩個(gè)方面尋求解決辦法。在測(cè)量理念上,依據(jù)標(biāo)準(zhǔn)參照測(cè)量理論和能力測(cè)定標(biāo)注法劃定人機(jī)對(duì)話的合格線,對(duì)合格考生做相應(yīng)的基于測(cè)量等值技術(shù)的賦值。測(cè)量技術(shù)上,測(cè)量等值常用的方法是共同題組設(shè)計(jì),即錨題設(shè)計(jì),但中考屬于高利害考試,實(shí)踐中采用共同題組具有不可控的風(fēng)險(xiǎn)。嘗試采用“無(wú)錨人”“無(wú)錨題”的項(xiàng)目反應(yīng)模型已有一定的成果,有學(xué)者認(rèn)為解釋性題目反應(yīng)模型(explanatory item response model,EIRM)中的線性logistic 測(cè)驗(yàn)?zāi)P褪菍?shí)現(xiàn)測(cè)驗(yàn)等值“無(wú)錨人”“無(wú)錨題”的重要方法[7]。另一方面,要關(guān)注項(xiàng)目功能差異分析。由于考生性別、生活習(xí)慣、信息素養(yǎng)層次等非測(cè)試因素方面的情況不一,因此在設(shè)計(jì)試題的過(guò)程中要充分考慮非測(cè)試因素對(duì)考生作答反應(yīng)的影響。當(dāng)然,構(gòu)建本地化的人機(jī)對(duì)話評(píng)分模型是提高評(píng)分系統(tǒng)信度的關(guān)鍵。要大量采集考生日常練習(xí)的語(yǔ)音數(shù)據(jù)和行為數(shù)據(jù),一方面供評(píng)分系統(tǒng)開(kāi)展深度學(xué)習(xí),另一方面通過(guò)行為數(shù)據(jù)分析考生的學(xué)習(xí)特征并以此提供學(xué)習(xí)策略指導(dǎo),從而形成基于考生特征的評(píng)分模型,提高評(píng)分的信度和效度。
教育政策的本質(zhì)是教育資源的重新分配,而政策的公平性直接決定著政策的可持續(xù)性。維護(hù)公平的過(guò)程是要確保起點(diǎn)公平、過(guò)程公平從而實(shí)現(xiàn)結(jié)果公平。由于區(qū)域經(jīng)濟(jì)發(fā)展程度不一、校際教育資源分配失衡、家庭文化和教育投入存在差異等原因,實(shí)施人機(jī)對(duì)話后,師生群體的英語(yǔ)聽(tīng)說(shuō)能力水平和獲得的教育資源并不一致。因此,人機(jī)對(duì)話的公平訴求便集中在過(guò)程公平上。目前來(lái)看,一方面應(yīng)提供教與學(xué)活動(dòng)所需的有效支持。針對(duì)英語(yǔ)教師,要加大教師聽(tīng)說(shuō)教學(xué)能力的專業(yè)培訓(xùn)力度,培訓(xùn)內(nèi)容除了學(xué)科知識(shí)、教學(xué)法外,要增加英語(yǔ)聽(tīng)說(shuō)教學(xué)案例的分享(含案例分析、公開(kāi)課觀摩),同時(shí)要重視信息技術(shù)支持下的基于英語(yǔ)學(xué)科的教學(xué)能力構(gòu)建,實(shí)施城鄉(xiāng)教師定期交流和幫扶。針對(duì)考生,分析考生學(xué)習(xí)需求和學(xué)習(xí)特征,提供學(xué)習(xí)資源、學(xué)習(xí)工具等多樣化的學(xué)習(xí)支持,提供學(xué)習(xí)反饋信息和學(xué)習(xí)策略指導(dǎo)。另一方面,要特別關(guān)注由于考試形式變化而造成的師生心理情緒的變化,通過(guò)分析師生的壓力來(lái)源,為教與學(xué)提供有力保障。
在以分?jǐn)?shù)作為考核指標(biāo)的影響下,人機(jī)對(duì)話的“育人”價(jià)值被弱化,教學(xué)行為受到考試行為影響,以分?jǐn)?shù)為目的的教學(xué)行為成為教師普遍的教學(xué)追求,而在技術(shù)層面又無(wú)法全面支持聽(tīng)說(shuō)能力測(cè)試要求。為此,一要引導(dǎo)英語(yǔ)教師樹(shù)立正確的教學(xué)觀。英語(yǔ)教師應(yīng)當(dāng)按照《課程標(biāo)準(zhǔn)》規(guī)定的課時(shí)完成指定的教學(xué)任務(wù)。要實(shí)施教學(xué)督查,重點(diǎn)關(guān)注教學(xué)內(nèi)容的全面性和語(yǔ)言交際情景創(chuàng)設(shè)的真實(shí)性[8]。二是鼓勵(lì)有條件的高中學(xué)校設(shè)置英語(yǔ)聽(tīng)說(shuō)特色招生,為英語(yǔ)交際能力有特長(zhǎng)的考生提供更多的升學(xué)途徑。三是依據(jù)考試需要,完善人機(jī)對(duì)話考試功能,盡可能實(shí)現(xiàn)模擬真實(shí)交際情境下的人機(jī)對(duì)話考試。未來(lái)人機(jī)對(duì)話應(yīng)該像調(diào)研過(guò)程中一位英語(yǔ)教師所描述的那樣:“一個(gè)開(kāi)放的或者半結(jié)構(gòu)的話題,組織4-6 名學(xué)生一起討論,計(jì)算機(jī)在這一過(guò)程中記錄學(xué)生的語(yǔ)言表達(dá)、情緒表達(dá)、邏輯表達(dá)、肢體語(yǔ)言等,計(jì)算機(jī)可以深度參與到這個(gè)討論中,然后對(duì)所有學(xué)生做出基于考查標(biāo)準(zhǔn)的過(guò)程性、表現(xiàn)性、綜合性的聽(tīng)說(shuō)能力評(píng)價(jià)?!敝挥薪虒W(xué)目標(biāo)、考試要求和技術(shù)功能互相配合和補(bǔ)充,在全面發(fā)展學(xué)生語(yǔ)言綜合應(yīng)用能力的框架下,檢視技術(shù)對(duì)教學(xué)和考試的支持作用,才能實(shí)現(xiàn)人機(jī)對(duì)話考試工具理性和價(jià)值理性的平衡。