生態(tài)學(xué)視角下信息技術(shù)和語言測(cè)試深度融合研究*

2015-11-27 11:24:35梁麗娟

中國電化教育 2015年5期

關(guān)鍵詞：題庫效度信度

梁麗娟

(中國農(nóng)業(yè)大學(xué) 人文與發(fā)展學(xué)院外語系，北京 100083)

生態(tài)學(xué)視角下信息技術(shù)和語言測(cè)試深度融合研究*

梁麗娟

(中國農(nóng)業(yè)大學(xué) 人文與發(fā)展學(xué)院外語系，北京 100083)

適應(yīng)性測(cè)試是信息技術(shù)與教育深度融合在測(cè)試領(lǐng)域的體現(xiàn)?；跍y(cè)試的生態(tài)學(xué)視角，本文設(shè)計(jì)實(shí)施了適應(yīng)性語言測(cè)試。通過改編現(xiàn)有試題進(jìn)行題庫建設(shè)降低了題庫建設(shè)成本；采用以組為單位的跳轉(zhuǎn)原則減少了對(duì)試題的需求數(shù)量。實(shí)驗(yàn)證明依據(jù)上述方法設(shè)計(jì)的適應(yīng)性英語閱讀測(cè)試具有良好效度和信度，為今后適應(yīng)性語言測(cè)試在中小型測(cè)試中的推廣提供了借鑒。

深度融合；適應(yīng)性測(cè)試；信度；效度

一、引言

信息技術(shù)帶來了教學(xué)模式的轉(zhuǎn)變，學(xué)生個(gè)人的主動(dòng)性得到充分體現(xiàn)，教學(xué)主從關(guān)系翻轉(zhuǎn)。這種改變促使我國教育信息化從初步應(yīng)用整合階段向信息技術(shù)與教育的深度融合階段轉(zhuǎn)變[1]。這種轉(zhuǎn)變?cè)跍y(cè)試領(lǐng)域也日益體現(xiàn)。近年來，測(cè)試領(lǐng)域經(jīng)歷了從紙筆測(cè)試到計(jì)算機(jī)測(cè)試的轉(zhuǎn)變。測(cè)試的媒介發(fā)生了變化，信息技術(shù)與教育的深度融合不僅局限于媒介變化，而是測(cè)試的深層改變。

二、生態(tài)學(xué)視角下的測(cè)試觀

20世紀(jì)70年代以來，教育與生態(tài)學(xué)的結(jié)合衍生出了一系列相關(guān)研究，如教學(xué)生態(tài)、課堂生態(tài)、學(xué)習(xí)生態(tài)。近年來隨著信息技術(shù)的發(fā)展又出現(xiàn)網(wǎng)絡(luò)學(xué)習(xí)生態(tài)等等。其主要觀點(diǎn)認(rèn)為，學(xué)習(xí)環(huán)境是由眾多要素構(gòu)成的有機(jī)體，如課程、教學(xué)、學(xué)習(xí)和課堂；學(xué)生和教師作為學(xué)習(xí)環(huán)境中的主體與環(huán)境相互作用就構(gòu)成了一個(gè)教學(xué)生態(tài)系統(tǒng)[2]。以教學(xué)生態(tài)、課堂生態(tài)和學(xué)習(xí)生態(tài)等反觀測(cè)試，就形成了生態(tài)視角下的測(cè)試觀。生態(tài)視角下的測(cè)試屬于教學(xué)生態(tài)系統(tǒng)的一部分，它應(yīng)具有這一系統(tǒng)共有的特征即開放、共享、交互等。以測(cè)試系統(tǒng)的交互性為例，交互指的是受試與自身之外的任何生物或非生物進(jìn)行的交互，如受試與考試資源之間的交互。一般來說，測(cè)試生態(tài)系統(tǒng)中，外部交互較多的受試能更好地利用考試資源從而體現(xiàn)自身的水平。因此在生態(tài)視角下的測(cè)試中我們應(yīng)該重視這種交互，使受試能主動(dòng)選擇，利用適合自己的考試資源。傳統(tǒng)的紙筆測(cè)試不能充分實(shí)現(xiàn)這一任務(wù)。隨著信息技術(shù)在教育領(lǐng)域的深入應(yīng)用，基于計(jì)算機(jī)的適應(yīng)性測(cè)試(Computer Adaptive Testing，簡(jiǎn)稱“CAT”)是一種更理想的選擇。所謂適應(yīng)性就是測(cè)試軟件自動(dòng)地適應(yīng)被試的具體情況，在被試作答過程中根據(jù)作答的正誤估算出被試的可能水平，并針對(duì)這一水平迅速?zèng)Q策，從題庫中調(diào)取難度恰當(dāng)?shù)念}目繼續(xù)施測(cè)。直到施測(cè)的題目足夠多，測(cè)試信息量達(dá)到一定精度為止。它不同于傳統(tǒng)的紙筆測(cè)試，是一種非順序、非線性的測(cè)試方法，是更加科學(xué)化和人性化的測(cè)試方法。本文基于測(cè)試的生態(tài)學(xué)視角，以語言測(cè)試為例，就適應(yīng)性測(cè)試的設(shè)計(jì)和實(shí)施進(jìn)行了實(shí)證性研究。

三、相關(guān)研究

(一)國外研究

第一個(gè)適應(yīng)性語言測(cè)試由美國楊百翰大學(xué)(Brigham Young University)實(shí)施，并且證實(shí)了適應(yīng)性閱讀測(cè)試相對(duì)于傳統(tǒng)閱讀考試的效率[3]。Laurier在法語適應(yīng)性考試中采用30詞左右的段落作為閱讀材料，并從考試內(nèi)容、技術(shù)要求和實(shí)施等方面進(jìn)行了可行性論述[4]。Zabaleta研究發(fā)現(xiàn)在普通機(jī)考和適應(yīng)性考試相結(jié)合的測(cè)試中語法和閱讀的得分具有很高的相關(guān)性[5]。總體來說，以閱讀為主要內(nèi)容的適應(yīng)性語言測(cè)試研究仍處于探索階段。盡管一些研究證實(shí)了適應(yīng)性測(cè)試的效率，但閱讀測(cè)試模式對(duì)考試效度和信度的影響研究仍需深入探討。

(二)國內(nèi)研究

在國內(nèi)，相對(duì)于計(jì)算機(jī)在教學(xué)中的廣泛應(yīng)用，計(jì)算機(jī)在語言測(cè)試中的應(yīng)用還有待深入。目前已實(shí)施的適應(yīng)性語言測(cè)試較少。曾用強(qiáng)對(duì)比了不同的CAT模式在詞匯測(cè)試中的效果[6]。韓少杰和李新濤研究了適應(yīng)性考試信度和預(yù)測(cè)效度[7]。張武保進(jìn)行了自適應(yīng)性詞匯測(cè)試與適應(yīng)性詞匯測(cè)試[8]。在上述實(shí)施的適應(yīng)性測(cè)試中，兩項(xiàng)是針對(duì)詞匯的研究，兩項(xiàng)是綜合性考試研究，筆者認(rèn)為適應(yīng)性語言測(cè)試的開發(fā)和有效性研究應(yīng)該在總體研究的基礎(chǔ)上進(jìn)行分項(xiàng)研究，也就是對(duì)不同語言技能(聽說讀寫)的適應(yīng)性考試進(jìn)行分別研究。閱讀能力是一項(xiàng)非常重要的語言技能，又是各種考試考察的重點(diǎn)，所以本文就如何設(shè)計(jì)有效的適應(yīng)性閱讀測(cè)試進(jìn)行研究。

四、適應(yīng)性閱讀測(cè)試設(shè)計(jì)

(一)題庫建設(shè)

試題庫的質(zhì)量決定適應(yīng)性測(cè)試的成敗。試題庫需包含充足的試題數(shù)量，試題必須能反映考生某一語言技能的水平[9]。題庫設(shè)計(jì)的第一個(gè)問題是題庫的大小。題庫太小，不能提供足夠的試題實(shí)現(xiàn)跳轉(zhuǎn)；題庫太大會(huì)增加題目設(shè)計(jì)者的負(fù)擔(dān)。研究發(fā)現(xiàn)試題庫的大小為適應(yīng)性考試固定長(zhǎng)度的12倍左右能滿足考試內(nèi)容和結(jié)構(gòu)上的需求[10]。本測(cè)試預(yù)計(jì)在30分鐘左右，每位考生完成20-28個(gè)閱讀題目，由此計(jì)算出本試題庫應(yīng)包含約320道題目。題庫設(shè)計(jì)的第二個(gè)問題是題目質(zhì)量。一般來說，適應(yīng)性考試的試題需要經(jīng)過實(shí)測(cè)得出難度系數(shù)、區(qū)分度等相關(guān)信息[11]，但由于費(fèi)用等原因?qū)崪y(cè)往往不現(xiàn)實(shí)，所以采用改編紙筆測(cè)試的試題成為另一種選擇。Young等[12]在設(shè)計(jì)容量為300-500道題目的題庫時(shí)使用了改編自分級(jí)閱讀材料的題目，研究發(fā)現(xiàn)考試效度不受影響。因此本研究采用改編試題。

(二)題型

本研究中所采用的閱讀題目形式為短語境閱讀，閱讀題目題干平均40字左右，形式如右圖所示。傳統(tǒng)篇章閱讀理解中一篇文章后往往有4-5個(gè)問題，如何在適應(yīng)性考試中確定難度和考點(diǎn)成為難題。而短語境閱讀由于單一的問題和短小的題干，更容易確定題目的難度和考點(diǎn)。由于語境短了，所選的材料類型可以大大增加，多種類型的閱讀材料更能體現(xiàn)讀者的閱讀能力[13]。研究證明短語境閱讀形式能有效測(cè)量閱讀者的閱讀水平。此外，我們?cè)趯?duì)題目進(jìn)行改編時(shí)考察了不同的閱讀技能，如詞義相關(guān)、例證、描述結(jié)論、邏輯推理、目的、對(duì)比、情境判斷和因果關(guān)系等。

短語境閱讀題目形式范例圖

(三)具體設(shè)計(jì)

根據(jù)題目難度我們將題庫中題目劃分為4個(gè)等級(jí)區(qū)域：入門、初級(jí)、中級(jí)、高級(jí)。4個(gè)等級(jí)之下共包含10個(gè)次級(jí)別：入門1-2級(jí)、初級(jí)1-3級(jí)、中級(jí)1-2級(jí)、高級(jí)1-3級(jí)。測(cè)試分為兩部分，第一部分為探查階段。探查階段的起始點(diǎn)位于初級(jí)區(qū)域。分配學(xué)生4道難度不同的題目，如果全部答對(duì)就進(jìn)入中級(jí)；如果錯(cuò)一個(gè)則繼續(xù)完成初級(jí)階段的另一組探測(cè)題(題目難度和上一組相當(dāng))，如全部答對(duì)也能進(jìn)入中級(jí)，否則根據(jù)剛才8道題的得分給學(xué)生分配相應(yīng)的定級(jí)試卷。在初級(jí)探測(cè)階段成績(jī)較好的學(xué)生會(huì)進(jìn)入中級(jí)探測(cè)階段，再根據(jù)表現(xiàn)學(xué)生可以進(jìn)入高級(jí)階段，或者進(jìn)入中級(jí)的定級(jí)階段。

測(cè)試第二部分為定級(jí)階段。要分配給適合考生水平的題目，因?yàn)檫@樣才能提供關(guān)于考生水平的最大信息量。為了滿足這一需求，我們按照難度將試題庫中的題目分成20多個(gè)級(jí)別的分試卷，每個(gè)分試卷都含有12道題，由3組題目組成，每組包含4道題。相鄰的分試卷有8道題是重合的。這樣設(shè)計(jì)是因?yàn)楸环峙涞较噜彿衷嚲淼膶W(xué)生水平差異并非很大，他們之間的能力是有重疊的。根據(jù)學(xué)生的答題情況判斷他們?cè)?0個(gè)級(jí)別中的位置。

本設(shè)計(jì)的特點(diǎn)是以組為單位跳轉(zhuǎn)。比如考生完成探查階段做完初級(jí)探查的四道題目后，正確率若為100%，則跳轉(zhuǎn)到中級(jí)第一組；如果正確率低于100%，則繼續(xù)做完初級(jí)階段第二組題。設(shè)計(jì)也充分考慮到考試的偶然性。如在第一組探測(cè)題中學(xué)生出現(xiàn)一個(gè)錯(cuò)誤，我們認(rèn)為這具有一定的偶然性，因此給學(xué)生機(jī)會(huì)完成第二組探測(cè)。如果學(xué)生在第二組探測(cè)題中表現(xiàn)出色同樣能向上級(jí)跳轉(zhuǎn)。

五、實(shí)驗(yàn)

我們采用實(shí)驗(yàn)的方法，在實(shí)驗(yàn)班進(jìn)行初測(cè)與再測(cè)，還對(duì)適應(yīng)性測(cè)試成績(jī)與期末考試成績(jī)進(jìn)行了相關(guān)分析。

(一)實(shí)驗(yàn)對(duì)象

我校目前實(shí)施分級(jí)教學(xué)。根據(jù)學(xué)生入學(xué)英語考試成績(jī)將學(xué)生分為一級(jí)班、二級(jí)班和三級(jí)班。該實(shí)驗(yàn)以熟悉網(wǎng)絡(luò)技術(shù)的信息與電氣工程學(xué)院二級(jí)班41人為實(shí)驗(yàn)對(duì)象。

(二)數(shù)據(jù)采集

本實(shí)驗(yàn)采集的數(shù)據(jù)為兩次適應(yīng)性閱讀測(cè)試成績(jī)、期末考生成績(jī)和調(diào)查問卷。第一次適應(yīng)性測(cè)試于2014年11月實(shí)施，并于12月進(jìn)行再測(cè)。兩次測(cè)試前后相隔1個(gè)多月，以降低前測(cè)對(duì)后測(cè)的影響。兩次適應(yīng)性閱讀測(cè)試均安排在同一語音室，并在相同的時(shí)間段進(jìn)行，即都是上午8點(diǎn)開始。第一次測(cè)試后采用問卷調(diào)查學(xué)生對(duì)考試的態(tài)度，問卷為五級(jí)量表，按程度強(qiáng)弱打分，5為強(qiáng)，1為弱。受試于2015年1月進(jìn)行期末考試?？荚囆问綖閭鹘y(tǒng)的紙筆綜合性考試。我們通過SPSS20.0對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行了分析。

(三)研究結(jié)果分析與討論

1.測(cè)試信度

為了驗(yàn)證適應(yīng)性閱讀測(cè)試是否是一種較為理想的測(cè)試手段，首先對(duì)考試信度進(jìn)行了驗(yàn)證。信度是由同一個(gè)考試所得出分?jǐn)?shù)的一致性。影響信度的因素分為一般、環(huán)境和個(gè)人因素[14]。一般因素包括考試指令是否清晰，學(xué)生對(duì)考試形式是否熟悉；環(huán)境因素指環(huán)境的舒適度或噪音等因素；個(gè)人因素包括考生個(gè)人的生理或心理狀態(tài)等。問卷數(shù)據(jù)包含了影響信度的種種因素。在各種相關(guān)因素基本穩(wěn)定的情況下，如果兩次測(cè)試成績(jī)相關(guān)性較高，則說明這一測(cè)試具有較高信度。2014年11月第一次適應(yīng)性閱讀測(cè)試后，通過問卷就考試指令、界面等對(duì)學(xué)生進(jìn)行了調(diào)查，結(jié)果如表1所示。

表1 對(duì)考試態(tài)度的問卷統(tǒng)計(jì)(n1=41)

問卷統(tǒng)計(jì)結(jié)果顯示學(xué)生認(rèn)為考試界面和考試指令的清晰程度是很高的，分別為4.20和4.18。對(duì)考試環(huán)境和考試當(dāng)天個(gè)人狀態(tài)及對(duì)鼠標(biāo)點(diǎn)擊和鍵盤操作的熟練程度評(píng)價(jià)較高，分別為3.87，3.98和3.64。在這種情況下，分別計(jì)算出學(xué)生在兩次適應(yīng)性測(cè)試中的成績(jī)以及它們的測(cè)量標(biāo)準(zhǔn)誤差(如表2所示)，然后對(duì)學(xué)生兩次適應(yīng)性測(cè)試反映的能力值作了皮爾遜相關(guān)分析(如表3所示)。

表2 初測(cè)與再測(cè)成績(jī)

表3 初測(cè)與再測(cè)成績(jī)的相關(guān)性

兩次考試成績(jī)均值分別為5.36和5.98(本研究中適應(yīng)性閱讀測(cè)試的計(jì)分原則不是百分制)，差異性顯著。因?yàn)閮纱螠y(cè)驗(yàn)前后相隔一個(gè)多月，測(cè)試所采用的題目難度相當(dāng)。第二次測(cè)試平均成績(jī)高于第一次測(cè)試體現(xiàn)出學(xué)生水平的提高，這說明本測(cè)試對(duì)于學(xué)生的進(jìn)步是較敏感的。

根據(jù)表3，本研究中兩次考試的相關(guān)系數(shù)為0.892。一般來說大型的標(biāo)準(zhǔn)化考試信度要達(dá)到0.90。但對(duì)于中小規(guī)模的低風(fēng)險(xiǎn)測(cè)試，信度達(dá)到0.892是可以的。

2.校標(biāo)關(guān)聯(lián)效度

效度研究在當(dāng)今語言測(cè)試研究中具有非常重要的地位。Bachman認(rèn)為語言測(cè)試專業(yè)化和語言測(cè)試效度研究是語言測(cè)試界現(xiàn)在和未來研究的兩個(gè)重點(diǎn)領(lǐng)域[15]。在適應(yīng)性語言測(cè)試中語言測(cè)試效度包括內(nèi)容效度、結(jié)構(gòu)效度、效標(biāo)關(guān)聯(lián)效度等。本文關(guān)注的是校標(biāo)關(guān)聯(lián)效度，指的是測(cè)驗(yàn)分?jǐn)?shù)與外在校標(biāo)間的符合程度。若兩者相當(dāng)符合，則表示校標(biāo)效度高，反之則否。

我們把學(xué)生期末考試成績(jī)作為外在校標(biāo)，把適應(yīng)性閱讀測(cè)試成績(jī)與期末考試總成績(jī)做相關(guān)分析，如表4所示。

表4 適應(yīng)性閱讀測(cè)試成績(jī)與期末考試成績(jī)的相關(guān)分析

數(shù)據(jù)顯示兩種考試在.01水平上顯著相關(guān)，相關(guān)系數(shù)為0.766。期末考試為包含聽力、閱讀、翻譯、寫作等內(nèi)容的綜合性考試，而本測(cè)試為閱讀單項(xiàng)測(cè)試，能夠達(dá)到0.766的相關(guān)性是較理想的。

3.討論

自生態(tài)學(xué)的思想引入教育領(lǐng)域以來，教育生態(tài)日益成為備受關(guān)注的領(lǐng)域，并為我們重新審視教育中存在的問題提供了一個(gè)全新的視角[16]。生態(tài)學(xué)視角下的測(cè)試觀對(duì)測(cè)試提出了更高的要求。適應(yīng)性測(cè)試能夠更好地實(shí)現(xiàn)考試的交互性，并具有開放性、多人共享的特點(diǎn)，因此構(gòu)建適應(yīng)性測(cè)試環(huán)境成為近年來教育應(yīng)用領(lǐng)域的研究熱點(diǎn)[17]。

特色一：生態(tài)視角下的適應(yīng)性測(cè)試

從生態(tài)學(xué)的視角看，適應(yīng)性測(cè)試更容易幫助考生構(gòu)建與考試環(huán)境和諧發(fā)展的生態(tài)系統(tǒng)。學(xué)生對(duì)考試的反饋問卷顯示，學(xué)生認(rèn)為本次考試難度適當(dāng)。主要原因是計(jì)算機(jī)會(huì)根據(jù)學(xué)生的答題情況提供與其水平相適應(yīng)的題目，這樣不僅能在更短的時(shí)間內(nèi)提供更準(zhǔn)確的考試信息，還能降低考生因?yàn)橛龅礁唠y度題目時(shí)產(chǎn)生的負(fù)面焦慮，營造積極的考試氛圍。此外，適應(yīng)性測(cè)試還能通過信息技術(shù)使考生隱性的問題顯性化，從而促進(jìn)新資源的生成，調(diào)節(jié)考生與考試環(huán)境的關(guān)系。

特色二：通過改編現(xiàn)有試題進(jìn)行題庫建設(shè)

適應(yīng)性測(cè)試的效果很大程度上取決于題庫質(zhì)量。題庫的建設(shè)研制成本較高，因?yàn)樵囶}的編纂需要大量經(jīng)驗(yàn)豐富的教師來進(jìn)行，并且需要進(jìn)行具有一定規(guī)模的實(shí)測(cè)來獲得試題參數(shù)，如難度系數(shù)和區(qū)分度等。在低風(fēng)險(xiǎn)的考試中題庫建設(shè)成本的問題可以通過改編現(xiàn)有試題加以克服。本研究根據(jù)實(shí)測(cè)數(shù)據(jù)將閱讀材料劃分成若干不同的等級(jí)。對(duì)現(xiàn)有試題進(jìn)行評(píng)估改編從而作為題庫題目來源，可以有效控制題庫建設(shè)成本。研究結(jié)果表明通過對(duì)現(xiàn)有試題進(jìn)行改編而進(jìn)行題庫建設(shè)的做法是可行的。

特色三：以組為單位的跳轉(zhuǎn)原則

跳轉(zhuǎn)原則可以根據(jù)測(cè)試的不同類型來定義。本研究中采用的是以組為單位的跳轉(zhuǎn)原則。每組包含四道試題。根據(jù)考生答題的總體情況決定下一組題目的難度，這不同于其它適應(yīng)性測(cè)試中以題為單位的跳轉(zhuǎn)原則。首先，以題為單位跳轉(zhuǎn)必須要具備龐大的題庫，這在中小型考試中會(huì)給設(shè)計(jì)者造成很大的壓力；其次，以題為單位跳轉(zhuǎn)對(duì)題目難度的劃分要求相當(dāng)嚴(yán)格，一般只有實(shí)測(cè)題目才能精確計(jì)算出相應(yīng)的難度系數(shù)、區(qū)分度等指標(biāo)；再者，以題為單位的跳轉(zhuǎn)忽略了考試中的偶然性，進(jìn)而給考試帶來額外的負(fù)擔(dān)。

測(cè)試結(jié)果表明上述生態(tài)視角下的適應(yīng)性英語閱讀測(cè)試具有良好的信度和效度，說明通過改編現(xiàn)有試題進(jìn)行題庫建設(shè)和采用以組為單位進(jìn)行跳轉(zhuǎn)的做法在適應(yīng)性語言測(cè)試的開發(fā)中是可行的。

六、結(jié)論

測(cè)試經(jīng)歷從紙筆測(cè)試到計(jì)算機(jī)測(cè)試的轉(zhuǎn)變，這是信息化與教育深度融合在測(cè)試領(lǐng)域的趨勢(shì)。生態(tài)學(xué)視角下的適應(yīng)性測(cè)試比傳統(tǒng)考試更科學(xué)有效。本文嘗試設(shè)計(jì)了適應(yīng)性語言測(cè)試，設(shè)計(jì)通過改編現(xiàn)有試題進(jìn)行題庫建設(shè)降低了題庫建設(shè)成本，采用以組為單位的跳轉(zhuǎn)原則降低了對(duì)試題的需求數(shù)量。實(shí)驗(yàn)證明依據(jù)上述方法設(shè)計(jì)的適應(yīng)性英語閱讀測(cè)試具有良好效度和信度。計(jì)算機(jī)輔助的適應(yīng)性測(cè)試代表了未來語言測(cè)試發(fā)展的方向，應(yīng)該加快研究的深入和加大研究的規(guī)模。

[1] 張小紅,熊秋娥. 論高等教育信息化的十大關(guān)系[J]. 中國電化教育,2014, (12):43-48.

[2] 張立新,徐飛飛. 論虛擬課堂的生態(tài)屬性及其管理[J]. 中國電化教育,2014, (2):1-6.

[3] Madsen, H. Evaluating a computer-adaptive ESL placement test [J].CALICO Journal, 1987, (2):41-50.

[4] Laurier, M. The development of an adaptive test for placement in French [A].Chalhoub-Deville, M.. Issues in computer adaptive testing of reading proficiency [C]. New York: Cambridge University Press, 1999.124.

[5] Zabaleta, F. Developing a Multimedia, Computer-based Spanish Placement Test [J]. CALICO Journal, 2007, (3):675-692.

[6] 曾用強(qiáng).個(gè)性化自適應(yīng)性測(cè)試探索[J]. 外語教學(xué)與研究, 2002,(4):19-23.

[7] 韓少杰,李新濤.基于英語網(wǎng)絡(luò)測(cè)試系統(tǒng)的自適應(yīng)測(cè)試與常規(guī)測(cè)試的對(duì)比實(shí)驗(yàn)研究[J].外國語言文學(xué), 2006, (4): 250-253.

[8] 張武保. 自適應(yīng)性測(cè)試的實(shí)驗(yàn)研究[J]. 解放軍外國語學(xué)院學(xué)報(bào),1999, (3): 53-55.

[9] 陳仕品,張劍平.《現(xiàn)代教育技術(shù)》精品課程自適應(yīng)測(cè)試系統(tǒng)的設(shè)計(jì)[J].中國電化教育,2008,(9): 93-97.

[10] He, W. & Reckase, M.D. Item Pool Design for an Operational Variable-Length Computerized Adaptive Test [J]. Educational and Psychological Measurement, 2014,(3):473-494.

[11] Hsu, C.L, Wang, W. C. & Chen, S. Y. Variable-Length Computerized Adaptive Testing Based on Cognitive Diagnosis Models[J]. Applied Psychological Measurement, 2013, (7):563-582.

[12] Young, R., Shermis, M. D, Brutten, S. R., & Perkins, K. From conventional to computer-adaptive testing of ESL reading comprehension [J]. System, 1996, (1):23-40.

[13] 李筱菊. 語言測(cè)試科學(xué)與藝術(shù)[M].長(zhǎng)沙: 湖南教育出版社,1997.

[14] Cohen, A. English for academic purposes in Brazil: The use of summary tasks [A]. C. Hill & K. Parry. From testing to assessment: English as an inter national language[C].London:Longman,1994.174-204.

[15] 陳慧麟. 基于紙筆的語言測(cè)試和基于計(jì)算機(jī)的語言測(cè)試之間效度對(duì)等性驗(yàn)證模式初探[J].外語界,2009,(3):73-80.

[16] 彭偉國,張文蘭,毛仁興.影響信息技術(shù)與課程深層整合的生態(tài)學(xué)歸因分析[J]. 中國電化教育,2010,(2):92-95.

[17]陳仕品,張劍平. 適應(yīng)性學(xué)習(xí)支持系統(tǒng)的學(xué)生模型研究[J]. 中國電化教育, 2010, (5): 112-117.

梁麗娟：講師，博士，研究方向?yàn)橛?jì)算機(jī)輔助英語教學(xué)(bonnie_119@sina.com)。

2015年1月11日

責(zé)任編輯：趙興龍

An Ecological Perspective of Integration between IT and Language Testing

Liang Lijuan
(English Department, College of Humanity and Development, Agricultural University, Beijing 100083)

In-depth integration of IT and language testing is embodied by the application of adaptive test. Based on ecological perspective, this paper designs an adaptive English reading test. Firstly, the method of adapting existing material is proposed in order to cut the cost of item banking. Secondly, the design of jumping on the basis of a unit reduces the number of items needed in item bank. Empirical study shows that the English reading test with the above designing features reveals a sound validity and reliability.

In-depth Integration; Adaptive Reading Test; Reliability; Validity

G434

1006—9860(2015)05—0095—04

* 本文系北京市教委青年英才項(xiàng)目 “計(jì)算機(jī)化適應(yīng)性英語閱讀測(cè)試的設(shè)計(jì)及有效性驗(yàn)證”(項(xiàng)目編號(hào)：YETP0333)的部分研究成果。

99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

生態(tài)學(xué)視角下信息技術(shù)和語言測(cè)試深度融合研究*

一、引言

二、生態(tài)學(xué)視角下的測(cè)試觀

三、相關(guān)研究

(一)國外研究

(二)國內(nèi)研究

四、適應(yīng)性閱讀測(cè)試設(shè)計(jì)

(一)題庫建設(shè)

(二)題型

(三)具體設(shè)計(jì)

五、實(shí)驗(yàn)

(一)實(shí)驗(yàn)對(duì)象

(二)數(shù)據(jù)采集

(三)研究結(jié)果分析與討論

六、結(jié)論

一、引言

二、生態(tài)學(xué)視角下的測(cè)試觀

三、相關(guān)研究

五、實(shí)驗(yàn)

六、結(jié)論