• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      分班自評的檢驗及思考*

      2020-11-15 13:50:20劉超英北京大學對外漢語教育學院
      國際中文教育(中英文) 2020年3期
      關鍵詞:換班預估漢語

      劉超英 北京大學對外漢語教育學院

      提 要 國際上二語教學界關于自評分班的研究已進行了四十年,然而對于自評分班的準確性一直存在爭議。從2016年起北京大學采用自評分班。本文從多個方面對這一實踐的結果進行檢驗,結果表明:對于以提高漢語水平為目的的高校留學生群體,可以有效地使用自評分班,如果還有其他措施調節(jié),效果更好。本文對于若干有爭議的問題進行了討論,提出檢驗自評準確性的標準不是與測試的相關性,而是分班的特定目標要求。

      一、研究背景

      (一)國際上關于自評分班的爭論焦點

      早在二十世紀七八十年代,當國際上的應用語言學家開始認真地思考二語學習中的自評問題時就開始了關于自評分班的研究,這一研究一直持續(xù)到現(xiàn)在(Summers 等,2019)。對于自評能否用于分班,長期以來學者們分歧很大。Oscarson(1978)、LeBlanc 和 Painchaud(1985)、Bachman 和 Palmer(1989)、AlFallay(2004)等認為學習者能比較準確地評價其語言能力,自評比較穩(wěn)定有效,自評與測試在分數(shù)上有一致性,自評可以用來完成傳統(tǒng)標準化考試的分班任務。Ross(1998)對60 篇有關自評的文章做了元分析,認為自評能提供穩(wěn)健的效標共時效度。對于人員選拔來講,自評所提供的能力圖像過于朦朧;而對于一些低風險決策,例如在某個項目之內進行分班或做一個簡略的需求分析,自評的精度是足夠的。而另一些學者則持不同意見,Dieten(1989)、Peirce 等(1993)認為在自評和測試之間沒有穩(wěn)定的關系,二者間只存在弱相關,因而自評不適合作為分班評價。Fratter 和Marigo(2018)通過一項自評與分班測試結合的實驗研究得出結論,總體上看大學語言中心的學生還不具備很好的自評技能,他們在決定自己的語言能力等級時還沒有把握,還需要一些諸如測試的外部評價。只用自評,學生可能會高估或低估自己的語言能力,學生的自評能力需要培訓。

      關于自評分班的爭論涉及很多問題,而焦點是自評的精度。但是自評的精度需要多高才能滿足分班的要求,并沒有說清楚。此外,除了LeBlanc和Painchaud(1985)等人真的在分班實踐中使用了自評外,不少學者(尤其是持反對意見的學者)做的還只是可行性研究,因此他們無法回答一個非常直白的問題:“在難以對學生進行自評培訓的情況下,在實際教學中使用自評分班能不能行得通,效果如何?”他們無法提供使用效度方面的證據(jù)。

      (二)北京大學的探索

      北京大學在外國留學生分班方面進行了多年的探索。北大的對外漢語教學以非學歷的長期、短期進修教學為主1,此外還有預科教學、研究生的漢語教學等。長期以來北大都使用測試分班,每學期開學,考試分班都是一項十分耗費人力的大工程,但單靠考試分班,效果始終不理想。后來,學校在考試之后增加了一個確認教材的環(huán)節(jié),首先根據(jù)考分預估學生使用的教材,然后師生一對一面談,確認教材。長期班的換班率明顯下降,但是短期班由于項目太多,人力有限,只能直接用考試分班。2015 年,研究者首先在短期班進行了自評試驗,證明自評分班可行(劉超英,2017)。2016年,研究者又研制了長期項目漢語自評表,試驗證明自評也可用于長期項目,但需要在使用中驗證。從2016 年開始,除預科班之外的各漢語進修項目均使用自評取代測試進行分班,目前這一模式運行正常。

      自評分班已顯示出如下幾個主要優(yōu)點。

      第一,節(jié)省人力、物力,使用方便。以往使用測試分班,需要印試卷、租考場、安排監(jiān)考、組織評分、銷毀試卷等,現(xiàn)在學生是在自己的電腦或手機上提交自評,上述繁雜的工作已經(jīng)取消。

      第二,能提前知道學生的漢語水平,提高了效率。由于學生的自評信息在開學之前就通過網(wǎng)絡傳輸?shù)搅藢W校,教學管理者可以在學生到校之前就預估學生需要的教材。除了分班之外,學校招生部門也在使用自評系統(tǒng),如果他們發(fā)現(xiàn)某個學生的漢語水平與該項目的多數(shù)學生差距過大,便會建議該生選擇其他項目,節(jié)省教學成本。

      第三,能得到學生聽、說、讀、寫及其他多方面的信息。

      當然,所有這些優(yōu)點都必須有一個前提,即自評分數(shù)能夠比較準確地反映學生的漢語實際情況。假如做不到這一點,以上這些優(yōu)點就無法全面體現(xiàn)出來。因此,我們有必要對自評分班的有效性進行檢驗。

      二、分班自評的檢驗

      (一)自評表的設計

      根據(jù)學生的特點,北大的漢語自評表分長期表和短期表,分別對應長期進修教學和短期進修教學。

      長期自評表由聽、說、讀、寫四個部分組成,每部分有15 個陳述性題目。如:

      我能讀沒有拼音的中文課文。I can read Chinese texts without Pinyin.

      題目內容是根據(jù)外國學生在課堂學習和日常生活中的情景設計的,難度分為初級、準中級、中級、高級四個層次,與教學中的九個難度的教材相聯(lián)系。自評表有中英、中日、中韓三個雙語版本供學生選用。每個題目有五個選項,選“總是這樣(Always)”得5 分,選“多數(shù)情況是這樣(In most cases)”得4 分,選“半數(shù)情況是這樣(About half of the time)”得3 分,選“很少這樣(Seldom)”得2 分,選“從來做不到(Never)”得1 分。每題滿分5 分,共60 題,總分300 分。

      短期自評表的結構與長期自評表大致相同,只是每個部分各10 題,共40 題,總分200 分。

      (二)信度和難度

      本研究主要使用的是2016—2017 年北大留學生長期、短期等項目的自評分班信息,其他信息做對比或補充。

      由于每次自評的題目相同,分析信度和難度時我們將同年的數(shù)據(jù)合在一起,作為一個大樣本。表1、表2 是2016 年長期、短期自評的信度和標準誤。

      表1 2016 年長期自評(樣本量:289)

      表2 2016 年短期自評(樣本量:371)

      數(shù)據(jù)顯示,無論是長期還是短期自評,單項還是全卷,Alpha 信度系數(shù)都達到了0.96 以上,表明自評的內部一致性好,相當穩(wěn)定。

      自評與測試的難度含義不同,自評中的P 值表示的并非被試在試題上的答對率,而是自評者根據(jù)任務對自己能做情況的估計,同時也可以反映自評任務的難度。表3 是2016 年長、短期自評的P 值。

      表3 2016 年長、短期自評各單項及總分的P 值

      表3 顯示,長期和短期自評題大致上都是中等難度。由于在自評表中,每一部分的題目難度都是從易到難排列的,例如長期自評表“聽”第1 題最容易,第15 題最難,第16 題是“說”最容易的題,第30 題是“說”最難的題,依此類推。短期自評表只是題量不同,排列順序相同。每一題的P 值見圖1。

      圖1 2016 年自評中各題的P 值

      圖1 顯示,無論長期還是短期自評,各題的P值均呈現(xiàn)出一種有規(guī)律的變化,題目P 值的變化與題目任務難度的變化是一致的。這表明,盡管學生在自評時對于選項的選擇是完全自由的,沒有外在的客觀答案,但大多數(shù)學生并沒有亂選,而是依照一個內在的客觀答案在進行選擇。

      (三)師評

      檢驗學生自評是否有效的一個方式是請任課教師進行評判。我們選擇任課教師已經(jīng)相當了解學生而又離開學時間不是很久的時間點,將每個學生的自評分數(shù)發(fā)給各班教師,請教師對每個學生做出判斷。判斷內容有兩項。第一,該生的自評分數(shù)與其實際漢語水平是否相符,要求教師在“自評基本相符”“自評高估”“自評低估”中做出判斷。第二,該生的水平是否適合學習該班的教材,要求教師在“適合學本班教材”“應學低班教材”“應學高班教材”中做出判斷。之所以設計后一個問題是因為適合學習某一教材的水平是有一個范圍的,即使有的學生自評有一定的高估或低估,但只要不超出某一范圍,就應該認為是達到了分班的目的。

      2016—2017 年幾個項目的師評結果見表4—表9。

      表4、表5 顯示,有70%—83%的學生自評與其實際漢語水平基本相符,自評高估和低估的比例大致相當。適合學習本班教材的學生比例在81%左右,與自評基本相符率相當或比自評略高。

      表4 學生自評的相符程度(短期項目)

      表5 學生是否適合學本班教材(短期項目)3

      表6、表7 顯示,有64%—68%的學生自評與其實際漢語水平基本相符,比短期的低一些,高估和低估的比例有的相差較大。我們分析,部分原因是長期項目學生的構成更為復雜,要求更為多樣化。與短期項目有明顯區(qū)別的是長期項目適合學本班教材的比例明顯高于自評基本相符率,達到了86%—90%,我們認為一個重要的原因是長期項目有確認教材的環(huán)節(jié),起到了調整的作用。

      表6 學生自評的相符程度(長期項目)

      表7 學生是否適合學本班教材(長期項目)

      除了長期和短期語言進修項目之外,一些主要用英語授課的留學生的研究生項目也開設漢語課,也使用自評分班。

      表8、表9 顯示,研究生項目自評基本相符率比進修生更高,達到82%—92%,適合學本班教材的比例與自評基本相符率接近,在91%左右。

      表8 學生自評的相符程度(2017 年研究生漢語課)

      表9 學生是否適合學本班教材(2017 年研究生漢語課)

      師評結果表明,學生的自評與其實際漢語水平多數(shù)甚至大多數(shù)是比較相符的,根據(jù)自評確定的教材大多數(shù)是合適的。

      (四)換班情況及教材變換幅度

      1.換班情況

      在北大,學生進入班級學習之后發(fā)現(xiàn)不合適可以要求換班,由教學負責人根據(jù)學生的情況決定是否可換及如何換。學生要求換班的原因復雜,但是教學難度不合適是一個重要的原因。換班率的高低在一定程度上反映了分班評價的效果。表10、表11 反映了2016—2017 年的換班情況。

      表10 短期項目換班情況

      表11 長期項目換班情況5

      2015 年使用的是測試分班,2016 年和2017 年是自評分班。表10、表11 顯示,實行自評分班后,學生換班率總體上并沒有增加。2017 年秋季長期項目換班率偏高并非趨向,因為2018 年秋季的換班率為6.8%,總體上看自評與測試分班的換班率差別不大。比較一下短期與長期項目可以發(fā)現(xiàn),長期項目的換班率明顯低于短期項目,其原因我們認為是長期項目確認教材的環(huán)節(jié)起了作用。

      2.教材變換幅度

      長期項目在測試或自評之后,經(jīng)過確認教材和個別學生的換班,即進入正常教學。盡管此后仍會有學生覺得不合適,但是從總體上說,到了這一階段大多數(shù)學生的教材已能滿足進行正常教學活動的要求,因此,我們把這一階段的教材作為研究的一個參照點,稱作“最終教材”,而把最初根據(jù)分數(shù)預估的教材稱作“預估教材”。

      觀察從預估到最終的教材變動情況,能夠檢查測試分數(shù)和自評分數(shù)的預估精度和偏離的程度。

      表12 顯示教材的變動很有規(guī)律,教材一致及調一本教材的占大多數(shù),其中2015 年測試教材一致及調一本教材的比例為95.58%,2016 年自評這一比例為85.31%,2017 年自評這一比例為90.25%。調兩本及以上教材的比例有規(guī)律地逐漸減少。如果把最終教材作為基本合適的教材,可以看出一種誤差分布的規(guī)律。比較測試和自評可以看出,雖然測試的精度高于自評,但是自評的精度已達到85%以上,已可以滿足推薦教材的基本要求。2017 年自評經(jīng)過調整分數(shù)線,教材一致及調一本教材的比例已經(jīng)明顯提高,達到了90%,與測試的差別不是很大了。

      表12 從預估到最終的教材變動

      再看一下長期項目教材變動的方向,見表13。

      表13 教材變動的方向

      表13 顯示,自評與測試的教材變動方向很不一樣,測試以向上換為主(換到難度更高的教材),而自評則以向下?lián)Q為主。這種差別在2015 年測試和2016 年自評中表現(xiàn)得尤為明顯。測試分數(shù)偏低是測試分班中比較常見的一種情況,即所謂沒考好,一些學生已有的語言交際能力在測試分數(shù)中沒能反映出來。自評分數(shù)偏高則有多方面原因。2016年自評后我們做了分析,認為主要是因為分數(shù)線設定不當。經(jīng)過分數(shù)線調整,2017 年向下調的比例明顯得到控制,但是總的趨勢并沒有變化。

      長期項目由九個相互銜接、逐步遞進的教材段構成:從低到高依次為《起步1》《起步2》《加速 1》《加速 2》《沖刺 1》《沖刺 2》《飛翔 1》《飛翔2》《飛翔3》6。我們把確認教材前各段的測試或自評的均分作為預估分,把確認教材及換班后各教材段的均分作為最終分,檢查一下前后兩組分數(shù)的相關性。

      圖2、3、4 顯示,測試和自評的預估均分從總體上與最終均分相當接近,為強相關。

      圖2 2015 年秋測試的預估均分與最終均分

      圖3 2016 年秋自評的預估均分與最終均分

      圖4 2017 年秋自評的預估均分與最終均分

      我們將每個學生的最終教材設定為分班的目標,用1—9 表示九個教材段,作為因變量,將每個學生的測試或自評總分作為自變量,使用一元線性回歸分析來檢查測試和自評分數(shù)對于學生最終教材的預測能力,結果見表14。

      表14 模型檢驗7

      回歸方程的模型檢驗顯示,無論是2015 年的測試,還是2016 年、2017 年的自評,方程的決定系數(shù)(coefficient of determination)R2都在 0.8 以上,表示根據(jù)測試或自評分數(shù)所做的教材預估的有效性達到了80%以上。此外,方差檢驗和T 檢驗均表明,無論測試還是自評,回歸方程的線性關系顯著,回歸方程的系數(shù)顯著。

      比較自評和測試,盡管在數(shù)值上自評比測試還是差一些,但差距不大,能夠滿足預估最終教材的基本要求。

      三、對分班自評問題的重新思考

      國際上對于分班自評的研究很多、很細致,出了很多成果。然而仍有很多問題沒有研究清楚,或者說還存在某些盲點。下面是我們對于兩個問題的重新思考。

      (一)分班自評的定義

      關于二語學習中的自評,Mariani(2009)認為,“自評指的是完成一個元認知的過程,這是指跳到外面,保持一個距離,客觀地看你的經(jīng)驗、你的生活,看的時候仿佛這不是你的。這過程既是認知的又是情感的,因為你從外部看你,你能看透你的自我知覺,你通常是那樣自我感知的”。定義中提到了兩個重要的概念——“元認知”和“知覺”。

      二語學習中的自評是學習者對于自己語言能力的知覺(perception),這種知覺是以元認知(metacognition)的形式實現(xiàn)的。根據(jù)布朗(Brown)模型8,元認知由認知的知識和認知的調節(jié)構成,認知的調節(jié)有計劃、監(jiān)測、評估三種功能。自評是監(jiān)測和評估功能的實現(xiàn)。由于元認知是對于認知的認知,是一種更為深層的認知活動。盡管評價的是目的語,但自評時不必使用目的語,一些學者還提倡使用學習者的母語,使學習者更容易理解問題。另外,既然自評是一種元認知活動,就有不同的層次,有需要更多的專業(yè)知識的自評,也有不需要專業(yè)知識的自評。正是在這一點上,學者們有不同的觀點。

      Brown 等(2014)認為:“包括數(shù)學、科學、第一和第二語言讀寫、醫(yī)學等領域的研究者都進行過自評和客觀性測量的研究,發(fā)現(xiàn)學習者完全能夠對他們自己的能力做出很好的判斷,但是只有當學習者在被評價的領域達到較高水平時判斷的準確性才能提升?!庇胁簧賹W者主張在高級階段使用自評,其原因大致也是其認為在那個階段學習者的目的語知識比較多。這種觀點正確與否可以繼續(xù)研究,但至少對于分班自評而言,只讓高級階段的學習者自評是不現(xiàn)實的,因為我們不知道誰是高級階段的學習者,分班自評的目的就是為了了解學生的水平。

      另一個與自評的準備知識有關的觀點是,自評是一種能力,需要培訓,使自評者掌握好標準。我們認為,培訓對于日常教學中的自評是必要的,但在分班自評中是難以實現(xiàn)的,因為學生自己在網(wǎng)上自評時人還沒有到學校,難以很好地實施培訓。另外,作為分班自評,我們是否需要讓學生掌握教學的標準呢?有人說學習者還沒有能力為自己定級,問題是:是否需要學生為自己定級?

      關于這個問題,Oscarson(1997)的觀點很精辟,他認為:自評(self-assessment)這一術語還有若干自由變體,例如“self-evaluation,self-appraisal,self-rating,self-report”,但“self-assessment”是使用最廣也是最為恰當?shù)?。他特別指出,“selfrating”和“self-evaluation”或許應該避免使用,因為這些詞有明顯的價值判斷的內涵,而不是更為中性的“確定程度”或“估計水平”的含義,而這種中性含義才是在自評過程中真正要考慮的。LeBlanc 和Painchaud(1985)也認為,自評并不是自我定級。

      應該說,對于分班自評來說尤其是這樣,因為在分班自評過程中我們并不需要給學生定級,只需要估計其漢語水平??紤]到分班自評時學習者的語言水平差距很大,又很難進行有效的自評培訓等現(xiàn)實情況,我們要求學習者對自己的漢語能力所做的判斷不需要特別的專業(yè)知識,而只需要幾乎每個學習者都有的一般的生活經(jīng)驗和學習經(jīng)驗,采用具體任務,使用“能做”描述的問題。關于這一點,不少學者都已有共識,Ross(1998)等就認為具體描述功能的自評題,例如“能做”描述的題目精度比較高,而抽象的總體水平的題學生比較難判斷。

      這種自評題學習者沒有培訓也同樣能做,因為這樣的自評就像是在進行一個結構性的書面訪談,自評者只需要根據(jù)所給的具體任務,回想一下自己能不能做、能做到什么程度,在幾個選項中選一個即可。從這個角度,分班自評可以稱作是一種結構型的自述(structured self-report)。

      (二)分班自評的準確性要求及確定準確性的標準

      分班自評的準確性是學者們爭論的焦點。這里涉及兩個問題:第一,判斷自評準確性的標準是什么?第二,分班自評究竟要求有多高的精度?

      很多研究者都把測試作為判斷自評準確性的效標。分班自評的提倡者往往以自評和測試相關系數(shù)高作為論據(jù)來證明自評有效;自評分班的反對者的論據(jù)往往是自評和測試只有弱相關,數(shù)據(jù)往往相差很大。而更重要的是,自評與測試的相關系數(shù)究竟要多高才可以用于分班,沒有標準。0.7 就可以嗎?0.4 就不行嗎?沒有標準使人無所適從。

      事實上,這種唯測試作效標的思想對于分班自評的發(fā)展已經(jīng)起到了消極的作用,使得一些設計得很好的自評無法投入使用。例如,Summers 等(2019)做了一項關于分班自評的研究,希望通過自評在學生到校之前就得到有關其人數(shù)、水平的信息,為安排教學資源做準備。研究結果顯示:自評設計及內部一致性方面都得到了很強的證據(jù)支持,自評的信度很高(0.95),在ACTFL 的大等級上設想的難度與實際難度一致。五度量表效果很好,能拉開各個相鄰等級的距離。但是,自評與測試的相關系數(shù)不理想,“說”的相關系數(shù)為0.44(顯著相關),“寫”的相關系數(shù)為0.45(顯著相關)。因此,研究者認為自評不宜單獨用于分班,只能對測試進行補充。我們設想,假如直接把自評分數(shù)與教學需要掛鉤,建立起對應關系,這個自評很可能就用上了。

      我們認為,測試可以作為檢驗自評的一項參照指標,在我們的研究過程中也曾做過自評與測試的相關性分析(短期自評的person 相關系數(shù)為0.85,長期自評為0.76),但是我們認為測試分數(shù)不是效標。這是因為:第一,測試本身的有效性就有待檢驗。即使是很好的標準化考試也有誤差,更何況在分班考試中,由于需要在短時間內得到分數(shù),往往只能省略口語考試、簡化寫作考試,主觀性考試往往也不能雙評,存在多種誤差源。在自評和測試的對比分析中,如果二者不一致,不一定都是自評不準。例如,在一項關于短期自評分班的研究中(劉超英,2017),有三位要求向下?lián)Q班的學生,考試分數(shù)為25—28 分,但實際上是零起點。而他們的自評分數(shù)都是0 分,反映了他們的真實水平。第二,測試與自評是兩種機制完全不同的評價方式,二者只可能在某些功能上接近(例如都可以用來分班),但由于機制完全不同,越細致分析越會發(fā)現(xiàn)二者存在著深層的差別。從評價機制上看,測試是考生通過一個使用目的語的表現(xiàn)提供一個有代表性的行為樣本,我們對行為樣本進行測量后得到一個分數(shù),分數(shù)的方差反映了不同能力的考生在考試的表現(xiàn)行為上的差異,方差越大區(qū)分度越高。但是自評不一樣,自評是自評者的一種反思行為,自評者看到某個交際任務后會判斷自己能做的程度,選一個合適的選項,并不需要提交目的語的行為樣本。我們也測量自評者提交的結果,但這不是其目的語的行為樣本,而是其關于自己目的語能力的一個報告。我們測量的不是自評者的評價行為,而是其報告的內容。自評者的評價行為也是有差異的,比如自評能力的差異,但是這種差異對于自評測量來講是誤差,這種方差越小評價越準確。因此,測試不適合作為衡量自評準確性的效標。

      那么,衡量分班自評準確性的標準是什么呢?我們認為,應該是自評分數(shù)在分班中的使用效度,即自評分數(shù)能否滿足某一種特定教學的分班需要、效果如何。效度并不是某個評價工具本身的屬性,而是包括分數(shù)使用在內的綜合屬性,因此,分班自評準確性的標準應該根據(jù)特定的分班要求來制定,檢驗準確性的證據(jù)應該到分班結果中去尋找。也就是說,自評分數(shù)應該跟分班的需要直接掛鉤。在這個方面,北大將自評分數(shù)段與所使用的九種教材掛鉤,證明自評能夠滿足預估教材的需要。

      以分班的實際需要作為效標,既可用來檢驗自評,也可用來檢驗測試。北大2015 年測試和2016 年、2017 年自評的分析結果就是例證。值得注意的是,從教材變動的方向上來看,測試和自評的主要方向是相反的,是對于分班目標的兩種不同的偏離,如果只是簡單地用相關分析證明自評不準確顯然不恰當,因為測試也有問題。

      以分班的實際需要作為標準,自評需要多高的精度這個問題就很清楚了,因為這是特定的教學機構根據(jù)特定的教學項目的分班要求自己確定的。Oscason(1997)指出:“有一點人們已經(jīng)達成了相當?shù)墓沧R,自評的準確性與恰當性在相當大的程度上取決于在每一種具體情況下的情境特點和評價要達到的目的?!?/p>

      四、結論與討論

      通過本項研究我們可以得出以下幾點結論。

      (1)北大三年的實踐及我們的檢驗結果表明,自評能夠提供穩(wěn)定的、具有區(qū)分力的信息,對于以提高漢語為目的的高校外國留學生群體,使用自評定位漢語水平、預估教材是可行的、有效的。如果能有其他輔助手段來調整,分班的效果會更好。

      (2)在判定自評準確性時,效標不是測試分數(shù),而是特定教學項目的實際分班需求。自評和測試的分班有效性都應以此進行檢驗。在本研究中,盡管自評的數(shù)據(jù)比測試還是略差一些,但是差距不大,可以滿足特定項目的分班需要。

      (3)分班自評不是學習者為自己定級,而只是一種關于自己漢語使用情況的結構型的自述。

      分班自評仍有很多問題有待研究,例如以下幾點。

      (1)自評的誤差源。自評的準確性會受到很多因素的影響,如文化差異、人格、認知能力、學習策略、自評訓練等。哪些因素影響較大、哪些因素是可控的,需要研究。

      (2)國際上廣泛使用的具體任務的“能做陳述”容易理解,意義積極,但往往難以描述完成任務的語言質量,這會使得某些任務對于中級以上的學生難以進一步區(qū)分,尤其是在中國生活過的學生容易自評偏高。Bachman 和Palmer(1989)認為從學習困難的角度設問更準確,Burson 等(2006)認為學習者更了解其弱點而不是其優(yōu)點。因此,學習困難的設問角度是一個很有價值的自評研究課題。

      (3)自評能得到很豐富的信息,但由于分班需要快速決策,由于操作上的種種原因,目前實際在分班中使用的往往只是一個總分,聽、說、讀、寫單項分等很有價值的信息還沒有充分利用。如何將這些信息用到實際的分班程序中,需要研究。

      附注

      1 北京大學對外漢語教育學院的漢語非學歷教育主要分長期和短期項目。長期項目每年2 月(春季)和9 月(秋季)開學,學習一個學期,班級和漢語教材的層次多。每學期開學初,需要使用測試或自評來評價新生的漢語水平,根據(jù)分數(shù)預估教材,再通過師生面談,確認教材,進入教學。短期項目有春季和暑期兩種,學生通常學習四至八周。每個項目開始前要進行測試或自評,確定教材??紤]到短期項目的特點,不單獨確認教材,而是在發(fā)教材時及教學開始前幾天進行微調。

      2 聽75 指聽力部分滿分為75 分,以此類推。

      3 2016 年師評中沒有“學生是否適合學本班教材”一項,2017 年部分教師未填這一項,因此兩個問題的樣本量有些不同。其他項目中也有類似情況。

      4 2017 年暑期有一個項目由于非常規(guī)原因導致數(shù)據(jù)沒有代表性,未納入統(tǒng)計。

      5 長期項目換班者中有個別學生由于上課時間沖突而換到相同教材的平行班,未納入統(tǒng)計。

      6 長期項目使用《博雅漢語》(第二版)系列教材,李曉琪主編,北京大學出版社2013 年出版。該系列教材包括:《初級起步篇I、II》《準中級加速篇I、II》《中級沖刺篇I、II》《高級飛翔篇I、II、III》。文中使用的是簡稱。

      7 模型檢驗因變量為“最終教材”。

      8 轉引自張雅明著《元認知發(fā)展與教學——學習中的自我監(jiān)控與調節(jié)》,安徽教育出版社2012 年出版。

      猜你喜歡
      換班預估漢語
      美國銀行下調今明兩年基本金屬價格預估
      交通運輸部成立船員換班工作專班
      水上消防(2022年2期)2022-07-22 08:45:12
      學漢語
      金橋(2022年6期)2022-06-20 01:36:16
      輕輕松松聊漢語 后海
      金橋(2020年11期)2020-12-14 07:52:56
      換班
      好孩子畫報(2020年2期)2020-03-30 03:47:05
      追劇宅女教漢語
      漢語不能成為“亂燉”
      華人時刊(2017年17期)2017-11-09 03:12:08
      禁忌二三事
      派出所工作(2017年9期)2017-05-30 10:48:04
      換班干部
      史密斯預估控制在排焦控制中的應用
      安吉县| 长宁区| 繁峙县| 东阳市| 电白县| 岳阳县| 无锡市| 申扎县| 西丰县| 武陟县| 玉山县| 浪卡子县| 兴业县| 噶尔县| 仁布县| 萨嘎县| 汝州市| 连城县| 九龙坡区| 赤壁市| 漳平市| 嫩江县| 靖宇县| 屏东市| 武功县| 山阴县| 澄城县| 黔南| 横山县| 龙南县| 乌鲁木齐市| 石狮市| 舒城县| 陈巴尔虎旗| 灵璧县| 鄂尔多斯市| 化德县| 堆龙德庆县| 颍上县| 南和县| 梧州市|