張文星
上世紀(jì)60、70年代,世界上第一代大型電子語料庫誕生,隨后各國競(jìng)相開發(fā)語料庫。經(jīng)過半個(gè)多世紀(jì)的發(fā)展,語料庫種類繁多,技術(shù)日漸成熟,語料庫語言學(xué)的學(xué)科地位也得以確立。語料庫的誕生和發(fā)展給語言研究以及語言應(yīng)用研究帶來了一場(chǎng)革命性的變化[1]。語料庫在語言研究及其相關(guān)領(lǐng)域應(yīng)用較廣,且相關(guān)成果豐碩,而學(xué)者們對(duì)于語料庫應(yīng)用于語言測(cè)試的思考則要晚的多,要追溯到上世紀(jì)90年代??上驳氖牵Z言測(cè)試界近些年越發(fā)注意到外語學(xué)習(xí)者語料庫和本族語者語料庫在語言測(cè)試領(lǐng)域應(yīng)用的的巨大潛力和空間[2-3]。本文將對(duì)語料庫語言學(xué)和語言測(cè)試的接口進(jìn)行理論探討,分析語料庫應(yīng)用于語言測(cè)試相關(guān)研究的可能性、必要性及其所面臨的挑戰(zhàn),同時(shí)結(jié)合語料庫在語言測(cè)試中的具體應(yīng)用進(jìn)行論證說明。
語料庫與語言測(cè)試的接口可以從真實(shí)性、科學(xué)性和對(duì)計(jì)算機(jī)技術(shù)的依賴性三個(gè)方面進(jìn)行研究:
語料庫(corpus)是指按照一定的語言學(xué)原則,運(yùn)用隨機(jī)抽樣方法,收集自然出現(xiàn)的連續(xù)的語言文本或話語片段而建成的具有一定容量的大型電子文庫[4]。語料庫里面存放的是大量在語言的實(shí)際使用中真實(shí)出現(xiàn)過的語言材料,這些語言信息可以供研究者進(jìn)行語言研究、分析和描述。同時(shí),語料庫的原始語料是通過隨機(jī)抽樣選取的,這使得它具有代表性,可以作為語言研究與教學(xué)的重要基礎(chǔ)和依據(jù)。在語料庫的基礎(chǔ)上對(duì)語言進(jìn)行分析研究的科學(xué)就是語料庫語言學(xué)(corpus linguistics),它是以語料庫中收集儲(chǔ)存的真實(shí)語言材料作為其唯一研究對(duì)象。
語言測(cè)試是一門跨學(xué)科的綜合性科學(xué),它從語言學(xué)、語言教學(xué)法和學(xué)習(xí)論取得科學(xué)內(nèi)容,從心理測(cè)量學(xué)獲得科學(xué)手段[5]。一個(gè)多世紀(jì)以來,語言測(cè)試大致經(jīng)歷了以下四個(gè)變化時(shí)期:前科學(xué)時(shí)期;心理測(cè)量:結(jié)構(gòu)主義時(shí)期;心理語言學(xué)(社會(huì)語言學(xué)時(shí)期);交際語言測(cè)試時(shí)期[6]。而語言學(xué)理論先后經(jīng)歷了歷史比較語言學(xué)、結(jié)構(gòu)主義語言學(xué)、轉(zhuǎn)換生成語法、心理語言學(xué)與社會(huì)語言學(xué),可見語言測(cè)試的發(fā)展過程與語言學(xué)理論發(fā)展過程基本吻合。我們現(xiàn)處于交際語言測(cè)試時(shí)期,起源于上世紀(jì)70年代后期,Widdowson提出語言教學(xué)真實(shí)性問題,認(rèn)為語言是交際工具,是思想表達(dá)系統(tǒng),而學(xué)習(xí)語言就是要掌握一套語言的意念和功能,因此語言教學(xué)以培養(yǎng)交際能力為中心[7]。隨后,交際語言測(cè)試應(yīng)運(yùn)而生。但是,伴隨著交際語言測(cè)試法的向前發(fā)展,真實(shí)性問題凸顯出來,受到學(xué)者們的關(guān)注和討論,成為語言測(cè)試的一個(gè)熱門話題[8]。語言測(cè)試中的真實(shí)性是指受試者在測(cè)試中使用目標(biāo)語完成測(cè)試任務(wù)與其在現(xiàn)實(shí)生活中使用語言進(jìn)行交際活動(dòng)的相似程度,也就是語言測(cè)試與語言交際的統(tǒng)一程度[9]。Lewkowicz把真實(shí)性分解為輸入的真實(shí)性(測(cè)試文本、測(cè)試任務(wù))、輸出的真實(shí)性和情景的真實(shí)性。對(duì)于測(cè)試文本的真實(shí)性,Lewkowicz則建議在測(cè)試中使用未作任何改動(dòng)或簡化的源文本[10]?,F(xiàn)代語料庫為第四代語料庫,其容量之大、時(shí)效性之強(qiáng)是前幾代所無法比擬的,而語料庫中存儲(chǔ)的大量多樣的真實(shí)語料(其中包括書面語料和口語語料)則可以作為源文本為語言測(cè)試開發(fā)者所用,為不同規(guī)模、要求和目的的語言測(cè)試服務(wù)。語言測(cè)試對(duì)于真實(shí)性的關(guān)注和要求,使語料庫在語言測(cè)試領(lǐng)域有了一席之地,因?yàn)檎Z料庫的使用能夠保證語言測(cè)試最大限度的真實(shí)性。
語料庫目前已經(jīng)發(fā)展到第四代,即Web多媒體或多模態(tài)語料庫。語料庫根據(jù)研究需要可以分成不同的種類,但是語料庫中所存儲(chǔ)的真實(shí)語料是經(jīng)過加工、分析和處理(如標(biāo)注和賦碼等)了的,否則是不能成為有用資源為研究者所用。而加工、分析和處理語料的過程需用到相關(guān)的語言學(xué)理論知識(shí),所以語料庫的構(gòu)建是建立在語料庫語言學(xué)理論基礎(chǔ)上的,是科學(xué)的。此外,對(duì)所收集的真實(shí)文本進(jìn)行標(biāo)注和賦碼是語料庫構(gòu)建中的重要環(huán)節(jié)。語料庫標(biāo)注則指對(duì)語料庫文本附加解釋性的語言信息,通常分為計(jì)算機(jī)自動(dòng)標(biāo)注、機(jī)助人工標(biāo)注和人工標(biāo)注[11]。而標(biāo)注又包括元信息標(biāo)注(如詞性賦碼、句法標(biāo)注、語言標(biāo)注、語用標(biāo)注、語音標(biāo)注、語誤標(biāo)注等)和非語言信息標(biāo)注[12]。如今,隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展和對(duì)大型語料庫的需求,人工標(biāo)注賦碼顯得費(fèi)時(shí)費(fèi)力,而市場(chǎng)上已有一些經(jīng)濟(jì)實(shí)用的自動(dòng)詞性賦碼器,如Brill POS tagger,CLAWS,TreeTagger等。經(jīng)過標(biāo)注賦碼后的語料庫所包含的的信息豐富,研究者可以通過相關(guān)檢索軟件(如Word-Smith、Antcorn、BFSU ParaConc 等)進(jìn)行提取,既方便又科學(xué)。所以,語料庫語言學(xué)是一門科學(xué)。
語言測(cè)試試題開發(fā)首先要確定考試構(gòu)念,并對(duì)語言水平等級(jí)進(jìn)行描述。以往,外語水平的等級(jí)描述比較主觀,也很模糊?,F(xiàn)在,研究者可以對(duì)語料庫中的語料進(jìn)行分析,驗(yàn)證語料習(xí)得發(fā)展規(guī)律,在此基礎(chǔ)上合理劃分和描述外語水平,可以合理定位被測(cè)試者的外語水平。語言測(cè)試設(shè)計(jì)者在開發(fā)試題的各個(gè)環(huán)節(jié)會(huì)充分考慮這些研究成果信息,合理選取考試素材。同時(shí),語料庫中的各種標(biāo)注信息也能為各種目的的考試所用,設(shè)計(jì)者可以通過相關(guān)檢索快速定位其所關(guān)注的文本特征和語言點(diǎn),大大節(jié)省人力和時(shí)間,而且較大程度地保證合理的考試效度,彰顯考試的科學(xué)性和公平性。所以,二者都符合科學(xué)性的要求。
語料庫除了真實(shí)性和代表性,它還具備可持續(xù)性,這需要依賴計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù)來實(shí)現(xiàn)。隨著技術(shù)手段的不斷更新發(fā)展,語料庫的規(guī)模也越來越大,而且更新升級(jí)速度迅速提升,比如現(xiàn)在大型網(wǎng)絡(luò)語料庫都在朝動(dòng)態(tài)語料庫方向發(fā)展,能夠及時(shí)補(bǔ)充和更新語料,這比較吻合語言發(fā)展變化這一自然屬性。但是,傳統(tǒng)描述語言變化手段速度慢、成效低,不能很好地跟蹤記錄語言變化,與真實(shí)語言發(fā)展變化情況脫節(jié)。語料庫彌補(bǔ)了這一缺憾,而且語料庫技術(shù)的使用可以很好地捕捉、記錄和保存這些語言歷時(shí)變化,為語言發(fā)展理論提供真實(shí)可靠證據(jù)。在此基礎(chǔ)上,測(cè)試設(shè)計(jì)者可以從這些語料庫中提取考試素材,適當(dāng)關(guān)注語言的歷時(shí)變化,能或多或少地補(bǔ)充和糾正所儲(chǔ)存的語料內(nèi)容。這為語言測(cè)試的設(shè)計(jì)開發(fā)和評(píng)估量表等提供了基礎(chǔ),使語言測(cè)試內(nèi)容更符合語言真實(shí)發(fā)展?fàn)顩r,比傳統(tǒng)語言測(cè)試更科學(xué)。因?yàn)樗鼭M足了語言測(cè)試對(duì)于真實(shí)文本輸入的要求,也更有可能獲得受試的真實(shí)語言輸出,如現(xiàn)代英語口語考試。
如今,我們處在一個(gè)講究效率的時(shí)代,高效便捷成了各行各業(yè)的不懈追求,語言測(cè)試也不例外。許多為中國英語學(xué)者所親睞的考試都已采取機(jī)考或網(wǎng)考方式。如GRE機(jī)考和TOEFL iBT(Internet Based Test),新托福以互聯(lián)網(wǎng)為依托,其所用語料均來源于真實(shí)學(xué)術(shù)語言環(huán)境的語料庫。大規(guī)模機(jī)考網(wǎng)考的實(shí)施方便各種考試語料庫的建立,以供研究者后續(xù)開發(fā)研究所用,所以語料庫的可持續(xù)性和語言測(cè)試的機(jī)考網(wǎng)考趨勢(shì)可以很好地對(duì)接起來。
從以上分析可知,語料庫語言學(xué)與語言測(cè)試有著較好的接口,從理論上可以進(jìn)行語料庫在語言測(cè)試中的應(yīng)用嘗試。
語料庫和語料庫語言學(xué)在當(dāng)今語言研究由高度抽象轉(zhuǎn)向語言的實(shí)際使用這個(gè)過渡中起著十分重要的作用:一是提供真實(shí)語料;二是提供統(tǒng)計(jì)數(shù)據(jù);三是驗(yàn)證現(xiàn)行的理論;四是構(gòu)建新的理論[13]。而在語言測(cè)試領(lǐng)域,語料庫也有著較廣闊的應(yīng)用前景:
現(xiàn)代大規(guī)??荚嚩紩?huì)制定相應(yīng)的評(píng)分量表來指導(dǎo)評(píng)分。評(píng)分量表是對(duì)語言使用者運(yùn)用語言能力的一系列描述,由低到高分成幾個(gè)不同等級(jí),用來描述語言能力發(fā)展的不同階段[14]。評(píng)分量表在主觀題評(píng)分中的作用更為突出,它是評(píng)分員對(duì)考生語言行為表現(xiàn)進(jìn)行評(píng)分的重要參考依據(jù)。所以,為了保證較高的評(píng)分員效度,一個(gè)科學(xué)的評(píng)分量表至關(guān)重要。國內(nèi)外許多考試的評(píng)分量表都是基于語言測(cè)試專家的直觀經(jīng)驗(yàn)制定的,帶有較強(qiáng)的主觀性,好在國外一些考試機(jī)構(gòu)已經(jīng)開始利用語料庫輔助評(píng)分量表制定,如劍橋ESOL考試中心開發(fā)的寫作部分的通用量表(Common Scale for Writing,CSW )則是利用語料庫提供的信息,采用定性和定量相結(jié)合的方法制訂出來的[14]。
此外,研究者還可以利用語料庫進(jìn)行試題編制。我們知道,信度和效度是語言測(cè)試中的兩個(gè)重要概念。Henning把效度定義為一項(xiàng)測(cè)試或測(cè)試一部分測(cè)量它聲稱測(cè)量內(nèi)容的合適性[15],也就是說測(cè)試有效是指它測(cè)量了它應(yīng)該測(cè)量的東西。為了保證測(cè)試的效度,我們可以利用語料庫來編制試題。語料庫里面存儲(chǔ)著大量真實(shí)語言文本,而研究者通過相關(guān)語料庫檢索工具和技術(shù)能更清楚地認(rèn)識(shí)語言使用規(guī)律。國內(nèi)研究者常用語料庫 (如 BNC、COCA、COBUILD英語語料庫和中國英語學(xué)習(xí)者語料庫CELC等)及其它各種學(xué)習(xí)者語料庫都能提供真實(shí)可靠的語言信息。測(cè)試開發(fā)者還可以利用學(xué)習(xí)者語料庫摸清學(xué)習(xí)者語言使用規(guī)律及其文本特征,同時(shí)還能確定處于某一外語水平的學(xué)習(xí)者常犯的語言錯(cuò)誤及其特征,為試題編制提供重要信息,從而確保較好的效度。
詞匯大綱的概念最初由Sinclair和Renouf提出,并由Willis給予了大綱性的論述,認(rèn)為詞匯大綱應(yīng)該注重以下幾點(diǎn):語言的最基本詞形;詞的中心用法;詞的最典型搭配[16]。傳統(tǒng)的考試大綱詞匯表大多由語言教育和語言測(cè)試領(lǐng)域的專家根據(jù)自身知識(shí)經(jīng)驗(yàn)制訂,因而不一定符合客觀情況。比如有的不常用的低頻詞匯卻當(dāng)作重點(diǎn)詞匯,或是某個(gè)詞的不常用的用法卻當(dāng)作中心用法。語料庫的出現(xiàn)使研究者制訂出更為客觀可靠的考試大綱詞匯表成為可能。頻率信息和語言真實(shí)性是使用語料庫帶來的兩大優(yōu)勢(shì)[17]。研究者可以很輕松地通過語料庫檢索軟件(如Wordsmith和Antcorn)來確定詞頻列表,而語料庫中存儲(chǔ)的真實(shí)語料又彌補(bǔ)了我們個(gè)體知識(shí)經(jīng)驗(yàn)的不足。除此之外,研究者可以針對(duì)不同考試的目的制訂出特定領(lǐng)域的考試大綱詞匯表。
語料庫還可以用來進(jìn)行效度驗(yàn)證。例如:鄒申等基于傳統(tǒng)效度驗(yàn)證方法之上[18],借助英語學(xué)習(xí)者語料庫(CEM )和英語國家語料庫(BNC)對(duì)2000-2002年TEM-8考試中的30道改錯(cuò)題做了實(shí)證研究,證明語料庫可以幫助我們加深對(duì)改錯(cuò)項(xiàng)目內(nèi)容效度的認(rèn)識(shí)。穆惠峰借助自建語料庫[19]、中國學(xué)生英語口筆語語料庫(SWECCL)、布朗語料庫(BROWN)和英語國家語料庫(BNC),對(duì)大學(xué)英語四級(jí)考試的完型填空部分的內(nèi)容效度進(jìn)行了驗(yàn)證,發(fā)現(xiàn)了一些不足,如部分考點(diǎn)的典型性不太高、部分干擾項(xiàng)的設(shè)計(jì)不夠科學(xué)等,并就如何讓語料庫服務(wù)語言測(cè)試提了幾點(diǎn)建議。此外,鄒申以《英語專業(yè)寫作教學(xué)語料庫》為例[20],探索了利用語料庫進(jìn)行考試效度驗(yàn)證新模式。目前,用語料庫進(jìn)行效度驗(yàn)證的研究仍然處于起步階段,有著較廣的發(fā)展空間。
語料庫在語言測(cè)試領(lǐng)域的應(yīng)用遠(yuǎn)不止以上三個(gè)方面,它還可以用于自動(dòng)評(píng)分系統(tǒng)的研制。此外,各種考試語料庫的構(gòu)建能為研究者提供更加豐富的信息,對(duì)于外語水平能力構(gòu)念的描述會(huì)有更加清楚的認(rèn)識(shí)。語料庫也應(yīng)該可以在語言測(cè)試領(lǐng)域生機(jī)勃發(fā)。
語料庫可以為語言測(cè)試所用,但它也不是萬能的。我們?cè)跇?gòu)建和使用語料庫的時(shí)候,都擺脫不了抽樣的問題。因?yàn)檎Z料庫再大也是有限的,它不可能涵蓋所用的真實(shí)語料。語料本身的內(nèi)容及選擇的標(biāo)準(zhǔn)就約束了語料庫的使用范圍,也決定了其在語言測(cè)試研究中的應(yīng)用范圍。Alderson指出當(dāng)我們對(duì)數(shù)據(jù)分析結(jié)果進(jìn)行解釋和作出決定的時(shí)候,我們一定要認(rèn)真考慮所用語料庫樣本的代表性和相關(guān)性[21],這其中當(dāng)然包括語料庫的大小及其創(chuàng)建年代等因素。所以語料庫在語言測(cè)試研究中的應(yīng)用具有一定的局限性。
其次,雖然語料庫有可能提升語言能力水平測(cè)試中的透明性、連續(xù)性和可比較性,但在構(gòu)建各種學(xué)習(xí)者語料庫和分析其語料時(shí),我們會(huì)發(fā)現(xiàn)語言能力水平仍是一個(gè)比較模糊的變量。這對(duì)基于語料庫的相關(guān)研究來說是個(gè)潛在的威脅[22]。所以,語料庫不能滿足各種各樣的測(cè)試要求,測(cè)試研究開發(fā)者應(yīng)該做好基于語料庫的語言能力水平的分級(jí)及其相應(yīng)特征描述工作,對(duì)于所選語料庫是否能夠滿足測(cè)試目的需提前做好評(píng)估,降低風(fēng)險(xiǎn)。
最后,國內(nèi)學(xué)者已經(jīng)習(xí)慣使用國際知名語料庫來開展相關(guān)研究,這其中也存在一定的風(fēng)險(xiǎn),因?yàn)橄馚NC這樣的語料庫大多為以英語為本族語者建立的語料庫,而中國外語學(xué)習(xí)者的中介語有其自身發(fā)展規(guī)律和特點(diǎn)。我們?cè)谶x擇標(biāo)準(zhǔn)時(shí),不能全部照搬國外的研究,應(yīng)該結(jié)合本地國情進(jìn)行,充分利用各種中國英語學(xué)習(xí)者語料庫,開展相關(guān)測(cè)試研究。
語料庫語言學(xué)與語言測(cè)試?yán)碚撋嫌兄T多接口,如同語料庫應(yīng)用于語言教學(xué)研究一樣,語料庫在語言測(cè)試領(lǐng)域也應(yīng)具有廣闊的應(yīng)用前景。國外相關(guān)機(jī)構(gòu)(如Cambridge ESOL和美國ETS)已經(jīng)進(jìn)行了相關(guān)研究和應(yīng)用嘗試,并推出了相關(guān)產(chǎn)品。中國學(xué)者的研究也已經(jīng)起步,但是相關(guān)研究團(tuán)隊(duì)還未組建。中國是考試大國,如何利用各種英語語料庫和學(xué)習(xí)者語料庫進(jìn)行語言測(cè)試開發(fā)和研究是擺在專家學(xué)者面前的一個(gè)重大問題。
[1]Hunston,S.Corpora in Applied Linguistics[M].Cambridge:Cambridge University Press,2002.
[2]Barker,F(xiàn).How can corpora be used in language testing?//A O’Keeffe,M McCarthy.The Routledge Handbook of Corpus Linguistics[M].New York:Routledge,2010.
[3]Taylor,L,Barker,F(xiàn).Using corpora for language assessment[A]//E.Shohamy,N H Hornberger.Encyclopedia of Language and Education[M].New York:Springer,2008.
[4]楊惠中.語料庫語言學(xué)導(dǎo)論[M].上海:上海外語教育出版社,2002.
[5]楊惠中.語言測(cè)試與語言教學(xué)[J].外語界,1999(1).
[6]薛榮.交際語言測(cè)試:理論模式與評(píng)估標(biāo)準(zhǔn)[J].外語教學(xué),2008(3).
[7]Widdowson,H.G.Teaching Language as Communication[M].Oxford:Oxford University Press,1978.
[8]Bachman,Palmer.Language Testing in Practice[M].Shanghai Foreign Language Education Press,1996.
[9]黃大勇.語言測(cè)試中的真實(shí)性概念[J].語言教學(xué)與研究,2004(2).
[10]Lewkowicz,J.A.Authenticity in language testing [J].Language Testing,2000(1):43-64.
[11]李文中.語料庫標(biāo)記與標(biāo)注:以中國英語語料庫為例[J].外語教學(xué)與研究,2012(3).
[12]梁茂成,李文中,許家金.語料庫應(yīng)用教程[M].北京:外語教學(xué)與研究出版社,2011.
[13]張樹青.東北地方口語語料庫的構(gòu)建及應(yīng)用[D].黑龍江:哈爾濱工程大學(xué),2009.
[14]孔文,鄒申.語料庫在語言測(cè)試中的應(yīng)用[J].外語電化教學(xué),2007(4).
[15]Henning,G.A Guide to Language Testing:Developing,E-valuation,Research[M].New York:Newburg House,1987.
[16]權(quán)立宏.PowerGREP在外語詞匯教學(xué)中的應(yīng)用:以數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí)為理念[J].山東外語教學(xué),2010(1).
[17]肖忠華,許家金.語料庫與語言教育[J].中國外語教育,2008(2).
[18]鄒申,楊任明.語料庫在試題設(shè)計(jì)和驗(yàn)證中的應(yīng)用研究[J].外語電化教學(xué),2008(5).
[19]穆惠峰.基于語料庫的大學(xué)英語四級(jí)完型填空測(cè)試內(nèi)容效度驗(yàn)證研究[J].外語電化教學(xué),2011(4).
[20]鄒申.基于語料庫的寫作測(cè)試效度研究:以《英語專業(yè)寫作教學(xué)語料庫》為例[J].外語電化教學(xué),2012(1).
[21]Alderson J C.Do corpora have a role in language assessment[A]//Thomas,J A,Short,M H.Using Corpora for Language Research[M].London:Longman,1996.
[22]Carlsen,C.Proficiency level-a fuzzy variable in computer learner corpora[J].Applied Linguistics,2012,33 (2):161-183.
重慶科技學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版)2013年11期