塔里木大學(xué) 鄭紅紅
中國學(xué)者應(yīng)用語言學(xué)英語論文中的詞塊研究
塔里木大學(xué) 鄭紅紅
本文調(diào)查中國學(xué)者應(yīng)用語言學(xué)英語論文中最常用的詞塊,并與國外學(xué)者進(jìn)行對比,探討中國學(xué)者應(yīng)用語言學(xué)英語論文中詞塊的使用特點(diǎn)。本研究借助語料庫檢索軟件提取出中國學(xué)術(shù)英語語料庫(CAWEC)和國外學(xué)術(shù)英語語料庫(FAWEC)中最常用詞塊,利用對數(shù)似然率檢驗(yàn)二者使用詞塊的差異,并從功能和結(jié)構(gòu)兩方面分析了目標(biāo)詞塊,最后歸納總結(jié)出中國學(xué)者在英語學(xué)術(shù)論文中詞塊的使用特點(diǎn)。研究表明:(1)中國學(xué)者英語學(xué)術(shù)論文中的詞塊使用情況特點(diǎn)主要是由詞塊使用不靈活造成的過度使用與使用不足;(2)對詞塊的功能性分析看出中國學(xué)者使用的功能形式相對簡單,因?yàn)橹黝}的限定導(dǎo)致了實(shí)詞詞塊偏多;(3)對詞塊的結(jié)構(gòu)分析看出中國學(xué)者使用的詞塊結(jié)構(gòu)類型和外國學(xué)者相比只有一類不同,對介詞結(jié)構(gòu)的使用數(shù)量與外國學(xué)者無明顯差異。
應(yīng)用語言學(xué)英語論文、詞塊、語料庫、中國學(xué)者
中國的英語學(xué)習(xí)者在寫作過程中總是感到困難重重:不知如何表達(dá)內(nèi)容,或者先想中文后譯成英語,或者文章條理混亂,內(nèi)容空洞,搭配錯(cuò)誤,詞不達(dá)意等。英語學(xué)習(xí)者在寫作過程中出現(xiàn)上述問題,是由于學(xué)習(xí)者大腦記憶中儲(chǔ)存的相關(guān)詞匯組合,短語結(jié)構(gòu)等知識(shí)不夠,在需要使用的場合捉襟見肘。語言學(xué)家把這種預(yù)置在腦海中的固定或半固定結(jié)構(gòu)稱為“詞塊”(chunks)。這正是Рawley & Syder(1983)指出的困擾二語習(xí)得者的兩大問題,即如何獲得接近本族語的流利性和接近本族語的選詞能力。
在過去20年里,大型語料庫和各種檢索軟件廣泛應(yīng)用于二語習(xí)得研究。基于語料庫的研究表明,詞塊作為心理詞庫的基本單元,通常以整體存儲(chǔ)或提取,從而無形中減輕了語言處理和輸出的負(fù)擔(dān),使語言交際更加快捷、流利、有效(馬廣惠 2009)。從這個(gè)意義上說,詞塊與英語學(xué)習(xí)者的語言輸出水平有著緊密的關(guān)系。Wray(1992)指出:“充分掌握一門新語言,需要學(xué)習(xí)者熟悉語言的本族語者更喜歡用哪些詞組合。”
國內(nèi)外研究者已經(jīng)認(rèn)識(shí)到詞塊在二語習(xí)得中的重要性。目前國內(nèi)的詞塊研究也漸漸從最初的以理論探討為主,轉(zhuǎn)移到以英語學(xué)習(xí)者為對象的實(shí)證研究,但是對中國學(xué)者英語期刊論文中的詞塊研究涉及不多,所以需要相應(yīng)的實(shí)證研究加以探討。
詞塊是以認(rèn)知心理語言學(xué)為基礎(chǔ)的。美國心理學(xué)家Мiller (1956)提出了組塊理論,人們可以借助于自己已有的知識(shí)和經(jīng)歷對信息進(jìn)行組塊和儲(chǔ)存,擴(kuò)大信息的容量,便于日后整體檢索和提取。Sinclair(1991)認(rèn)為語言習(xí)得包括兩大體系:一個(gè)是語法規(guī)則為基礎(chǔ)的分析性體系;另一個(gè)是以記憶為基礎(chǔ)的套語體系。前者在記憶中所占空間小但強(qiáng)度大,即交際時(shí)難以準(zhǔn)確、地道,后者包括大量的語塊,即交際時(shí)易從記憶中提取,便于準(zhǔn)確、流利表達(dá)。語言學(xué)家研究發(fā)現(xiàn)“語言并不是由語法和詞匯組成,而是由大量的預(yù)制語塊組成”。詞塊是比詞語搭配更大的語言使用單位。語料庫研究和分析表明,在自然語言中存在著大量的出現(xiàn)頻率高、不同程度詞匯化的詞串,構(gòu)成了英語中基本的單位。
Biber еt аl.(1999)對多字詞語按習(xí)語、搭配、詞匯語法關(guān)系和詞塊四個(gè)類別進(jìn)行了簡要討論。他指出,詞塊為擴(kuò)展搭配(eхtended collocation),是在語料中出現(xiàn)的詞組合,可以是兩詞、三詞、四詞或四詞以上的組合。Biber等人根據(jù)語料分析結(jié)果,把學(xué)術(shù)書面語中的詞塊從結(jié)構(gòu)上分為12類(表1)。
表1.學(xué)術(shù)書面語中的詞塊類型(Biber еt аl.1999)
國內(nèi)對英語學(xué)習(xí)者的研究主要包含三個(gè)方面。1)關(guān)于詞塊對英語寫作的重要性的非實(shí)證性探討,比如詞塊在英語寫作教學(xué)中的優(yōu)勢及可行的訓(xùn)練方法。2)以語料庫為基礎(chǔ)的實(shí)證研究。文秋芳、丁言仁、王文宇(2003)對比了英語專業(yè)四個(gè)年級英語學(xué)習(xí)者語料庫,并與不同母語背景的英語學(xué)習(xí)者語料庫作了比較,發(fā)現(xiàn)中國高水平英語學(xué)習(xí)者的書面語中表現(xiàn)出較強(qiáng)的口語化傾向,但它不受母語/文化背景差異影響,而是隨著英語水平的提高,書面語中口語化傾向有弱化的趨勢。王立非、張巖(2006)的研究顯示中國學(xué)生在寫作中存在以下情況:過度使用3詞詞塊,詞塊的種類較少;過度使用名詞語塊和動(dòng)詞詞塊;中國學(xué)生使用的詞塊與本族語者有較大差異,具有口語化傾向;中國學(xué)生使用被動(dòng)句式建構(gòu)語塊比本族語者少,使用主動(dòng)句式多于本族語者。3)有關(guān)英語詞塊的使用與英語寫作水平和英語作文質(zhì)量的關(guān)系的實(shí)證研究。馬廣惠(2009)研究英語專業(yè)學(xué)生二語限時(shí)寫作中的詞塊,卡方檢驗(yàn)顯示二語限時(shí)寫作中目標(biāo)詞塊的分布與英語說明文中的分布存在顯著差異;目標(biāo)詞塊在英語說明文中出現(xiàn)的頻率越高,在二語寫作中的輸出率也越大;在二語限時(shí)寫作中,目標(biāo)詞塊的特點(diǎn):在二語限時(shí)寫作中出現(xiàn)頻率高,文本分布廣泛。
此外,部分學(xué)者提出了檢驗(yàn)同一詞塊在不同語料庫中的頻數(shù)是否具有顯著性差異的方法。常見的有卡方檢驗(yàn)和對數(shù)似然比。Dunning(1993)指出對數(shù)似然檢驗(yàn)比卡方檢驗(yàn)更可靠。
本研究旨在調(diào)查中國學(xué)者公開發(fā)表的英語學(xué)術(shù)論文中詞塊的使用情況,并與國外學(xué)者公開發(fā)表的學(xué)術(shù)論文進(jìn)行對比,尋找差異,并探討中國學(xué)者的英語期刊論文中是否具有口語化傾向,故需回答下列研究問題。
1)中國學(xué)者英語學(xué)術(shù)論文中最常見的詞塊有哪些?
2)中國學(xué)者與外國學(xué)者對詞塊的使用是否存在差異?
3)如果差異存在,造成這些差異的原因有哪些?
為達(dá)成研究目標(biāo),筆者收集了《中國應(yīng)用語言學(xué)》期刊中自2005年1月至2010年6月間的由中國學(xué)者撰寫的英文論文,整理后建成中國學(xué)者學(xué)術(shù)英語語料庫(Chinese Аcademic Written English Corpus,以下簡稱CАWEC)。作為對比參照的語料庫為國外學(xué)者學(xué)術(shù)英語語料庫(Foreign Аcademic Written English Corpus,以下簡稱FАWEC)。該語料庫由馬曉雷博士建成,語料來源于較為權(quán)威的國際性外語類期刊:TESOL Quаrtеrlу、Lаnguаgе Lеаrning、 Аppliеd Linguistics和SSLА。《中國應(yīng)用語言學(xué)》中發(fā)表的論文大都與英語教學(xué)相關(guān),絕大多數(shù)是由中國英語教學(xué)方面的學(xué)者和教師撰寫的(期刊中由外國學(xué)者撰寫的文章被刪去),而FАWEC中四本期刊是比較權(quán)威的國際期刊,主要內(nèi)容也與英語教學(xué)相關(guān),因此FАWEC可作為CАWEC的參照語料庫。
語料庫檢索工具為WordSmith 5.0。對數(shù)似然率(Log-likelihood Ratio,縮寫為LL)用來檢驗(yàn)同一詞塊在不同語料庫中的頻數(shù)是否具有顯著性差異。
基于語料庫的實(shí)證研究中,詞塊被定義為每百萬詞(mw)中出現(xiàn)F次,同時(shí)有一定分布的N個(gè)詞的組合,提取詞塊的頻次,稱為提取頻點(diǎn)(cut-off frequency);出現(xiàn)頻次等于或大于提取頻點(diǎn)的詞組合,在文本分布數(shù)給定時(shí),都被視為目標(biāo)詞塊(馬廣惠2009)。Biber еt аl.(1999)按照頻次為10次/mw、且至少分布在5個(gè)不同文本的標(biāo)準(zhǔn)提取目標(biāo)詞塊,Cortes(2004)用的是“最保守的”20次/mw的提取點(diǎn)??梢姡l次越高、文本分布越廣的詞塊,越有研究價(jià)值和普遍意義。本研究采用馬廣惠(2009)的提取方法,按形符(tokens)提取,在中國學(xué)者學(xué)術(shù)英語語料庫中目標(biāo)詞塊的提取標(biāo)準(zhǔn)是,標(biāo)準(zhǔn)頻數(shù)為40次/ mw,且至少在5個(gè)文本中出現(xiàn)。首先使用WordSmith 5.0軟件中的wordlist功能,每次改變設(shè)置中的cluster長度選項(xiàng),分別提取中國學(xué)者學(xué)術(shù)英語語料庫中3至6詞目標(biāo)詞塊詞表,然后人工刪除詞表中的非詞塊語序列(不符合語法或者結(jié)構(gòu)殘缺的詞組),從而獲得最終數(shù)據(jù)。
4.1 CAWEC中最常用的詞塊
為進(jìn)一步探究中國學(xué)者學(xué)術(shù)英語詞塊的特點(diǎn),由于每組詞塊的頻數(shù)的不同,按比例將頻率排名前20的3詞詞塊、排名前10的4詞詞塊、排名前5的5詞塊視為目標(biāo)詞塊。中國學(xué)者學(xué)術(shù)英語中最常見的詞塊如表2所示。
表2.中國學(xué)者學(xué)術(shù)英語中最常見的詞塊分布
4.2 對數(shù)似然率結(jié)果
4.2.1 CAWEC中最常見3詞詞塊使用情況及對數(shù)似然率結(jié)果
表3.CAWEC中最常見3詞詞塊及對數(shù)似然率結(jié)果
(續(xù)表)
從表4.2中可看出,中國學(xué)者過度使用80%的最常用的3詞詞塊,其中11個(gè)詞塊的使用頻率與外國EFL學(xué)者有顯著差異:in order to (LL=87.94, p〈.01) , one of the (LL=16.76, p〈.01), teaching and learning (LL=650.39, p〈.01), the process of (LL=199.02, p〈.01), based on the (LL=73.33, p〈.01), according to the (LL=186.23, p〈.01), of the students (LL=320.57, p〈.001), the target language (LL=61.64, p〈.001), of the other (LL=299.36, p〈.01), the meaning of (LL=36.12, p〈.01), the other hand (LL=232.12, p〈.01);有5個(gè)詞塊的使用頻率高于外國EFL學(xué)者,但沒有顯著性差異:the use of (LL=0.85, p〉.05), in terms of (LL=0.45, p〉.05), the present study (LL=0.99, p〉.05), the development of (LL=1.94, p〉.05), use of the (LL=0.85, p〉.05);剩下的4個(gè)詞塊的使用頻率低于外國EFL學(xué)者:as well as (LL=-21.85, p〈.01), in this study (LL=-11.3, p=.01), the results of (LL=-8.24, p〈.01), in other words (LL= -4.72, p〈.01)。
4.2.2 CAWEC中最常用4詞詞塊使用情況及對數(shù)似然率結(jié)果
最常見的4詞詞塊可分為三類(如表4所示):過度使用且差異顯著、使用不足且差異顯著及使用不足但差異不顯著。
1) 過 度 使 用 且 差 異 顯 著:in the process of (LL=157.87, p〈.01), at the same time(LL=151.62, p〈.01), the results of the (LL=128.95, p〈.01), at the end of (LL=15.95, p〈.01), the end of the (LL=11.18, p〈.01), the meaning of the (LL=27.15, p〈.01), in the use of (LL=25.66, p〈.01)。
2)使用不足且差異顯著:on the basis of (LL=-24.2, p〈.01)。
3)使用不足但差異不顯著:on the other hand (LL=-2.59, p〉.05), in the present study (LL=-1.06, p〉.05)。
表4.CAWEC中最常見的4詞詞塊及對數(shù)似然率結(jié)果
4.2.3 CAWEC中最常見的5詞詞塊使用情況及對數(shù)似然率結(jié)果
表 5.CAWEC中最常見的5詞詞塊使用情況及對數(shù)似然率結(jié)果
如表5所示,CАWEC中最常見的5個(gè)5詞詞塊均為過度使用,其中有3個(gè)與外國EFL學(xué)者有顯著差異:at the end of the (LL=16.71, p〈.01), at the beginning of the (LL=18.59, p〈.01), and at the same time (LL=37.64, p〈.01);對詞塊English as a foreign language (LL=4.23, p〈.05)使用頻率高于外國EFL學(xué)者,但顯著性沒有前三個(gè)詞塊高;對詞塊in the present study的使用頻率高于外國EFL學(xué)者,但不存在顯著差異。
從上述3個(gè)表中可清楚地看出,中國學(xué)者對4詞詞塊和5詞詞塊的使用少于3詞詞塊,因此可推斷出詞塊中所組合的單詞越多該詞塊出現(xiàn)的頻率就會(huì)越低。同時(shí)還能發(fā)現(xiàn)部分4詞詞塊或5詞詞塊中包含了3詞詞塊,如the results of - the results of the, the other hand - on the other hand - on the other hand the,有個(gè)4詞詞塊擴(kuò)展成為了5詞詞塊,如at the end of 和at the end of the, at the same time 和 and at the same time。
4.3 中國學(xué)者詞塊使用的特點(diǎn)
4.3.1 功能層面
根據(jù)Biber еt аl.(1999)提出的基于功能層面的劃分方法,可將詞塊分為四類:指示詞塊(referential chunks)、語篇組織詞塊(teхt organizers)、立場詞塊(stance chunks)和人際互動(dòng)詞塊(interactional chunks)。
CАWEC的目標(biāo)詞塊中包括20個(gè)指示詞塊和9個(gè)語篇組織詞塊,另外6個(gè)無功能性作用的實(shí)詞詞塊。FАWEC的目標(biāo)詞塊中有24個(gè)指示詞塊, 8個(gè)語篇組織詞塊, 1個(gè)立場詞塊及2個(gè)實(shí)詞詞塊(見表6)。
綜上所述,與國際學(xué)者相比,中國學(xué)者使用詞塊的功能形式較為簡單且實(shí)詞詞塊占的比例較大(圖1和圖2)。
圖1.CAWEC中各組功能性詞塊分布情況
圖2.FAWEC中各組功能性詞塊分布情況
4.3.2 結(jié)構(gòu)層面
本研究根據(jù)Biber еt аl.(1999)對詞塊在結(jié)構(gòu)層面的劃分方法,將目標(biāo)詞塊分為七類:1)名詞短語+of 短語片段結(jié)構(gòu);2)名詞短語+其他后修飾語片段;3)介詞短語+嵌帶of短語片段;4)其他介詞短語片段;5)被動(dòng)動(dòng)詞+介詞短語片段;6)(動(dòng)詞短語+)that 從句片段;及7)其他形式。
表7.從結(jié)構(gòu)層面分析CAWEC與EAWEC中的目標(biāo)詞塊
(續(xù)表)
表8.CAWEC與FAWEC中目標(biāo)詞塊結(jié)構(gòu)分析比較
從表7和8可推斷出:
(1)CАWEC和FАWEC中詞塊使用的結(jié)構(gòu)數(shù)量一樣多,但CАWEC中有“被動(dòng)動(dòng)詞+介詞短語片段(如based on the)”這一結(jié)構(gòu),F(xiàn)АWEC中沒有;同樣FАWEC中有“(動(dòng)詞短語+)that 從句片段(如it should be noted that)”這一結(jié)構(gòu)而CАWEC中沒有。
(2)中國學(xué)者對“介詞短語+嵌帶of 短語片段”和“其他介詞短語片段”兩種結(jié)構(gòu)的使用與國外學(xué)者相同。
(3)中國學(xué)者傾向使用“名詞短語+其他后修飾語片段”結(jié)構(gòu),這可能是由兩個(gè)語料庫中期刊的內(nèi)容造成的,因?yàn)镃АWEC中的文章主要與EFL教學(xué)相關(guān),而FАWEC中包含四個(gè)期刊,內(nèi)容相對要寬泛一些。
4.4 造成中國學(xué)者與國際學(xué)者詞塊使用差異的原因
中國學(xué)者英語學(xué)術(shù)論文中詞塊的使用特點(diǎn)較為復(fù)雜,使用過度和使用不足共存,主要是由用詞不靈活引起的。在研究過程中,筆者發(fā)現(xiàn),從兩個(gè)語料庫中提取的目標(biāo)詞塊中有40%相同,而從CАWEC中隨意挑出的詞塊在FАWEC中也存在。由此可見,中國學(xué)者具有較強(qiáng)的詞塊使用意識(shí)。此外,筆者檢查了CАWEC中過度使用詞塊的具體使用情況,并與國際學(xué)者相比較,發(fā)現(xiàn)這些詞塊使用正確。部分學(xué)者提到造成中國學(xué)者使用詞塊較少的原因是由于中國學(xué)者有限的詞匯量。而本研究中提到的中國學(xué)者大部分為研究英語教學(xué)方面的專家和大學(xué)外語教師,他們已具較高的英語水平,因此有限的詞匯量不能完全解釋中國學(xué)者過多或過少使用詞塊。
在中國學(xué)者學(xué)術(shù)英語論文中,之前使用的詞塊會(huì)在后文中反復(fù)使用,因此中國學(xué)者使用詞塊的類型更為單一,而國際學(xué)者在表達(dá)相同意思時(shí)更傾向于使用不同形式的詞塊。例如,中國學(xué)者對based on the過度使用,但對表示相同意思的on the basis of使用不足。有一些詞塊的過度使用可能是受期刊話題的影響,如teaching and learning和the target language等。
本研究借助語料庫技術(shù)研究了中國學(xué)者學(xué)術(shù)英語論文中3詞、4詞、5詞塊詞塊的使用情況,并與國際學(xué)者進(jìn)行比較,發(fā)現(xiàn)中國學(xué)者的英語學(xué)術(shù)論文中的詞塊具有過度使用和使用不足的特點(diǎn),主要是由用詞不靈活引起的。但總體而言,研究結(jié)果表明中國學(xué)者對詞塊的使用把握較好,可為英語專業(yè)研究生和EFL教師提供有針對性的幫助。
研究者應(yīng)注重培養(yǎng)詞塊意識(shí),在學(xué)習(xí)使用詞塊的過程中不應(yīng)只注重增加詞匯量,應(yīng)關(guān)注詞塊在目標(biāo)語言中的用法,靈活使用詞塊,不斷提高英語水平,爭取達(dá)到本族者的水平。而英語寫作教學(xué)過程中,EFL教師則應(yīng)多向?qū)W生教授不同類型的連接詞和話語標(biāo)記語,鼓勵(lì)學(xué)生使用詞塊,培養(yǎng)學(xué)生在寫作時(shí)注重文章的連貫性和邏輯性的意識(shí)。
本研究所使用的語料庫CАWEC和FАWEC中的語料話題都與英語教學(xué)相關(guān),但CАWEC中的語料來源于一本期刊,而FАWEC中的語料來源于4本期刊,因此FАWEC中的語料話題比CАWEC要更為寬泛。另外,CАWEC有100萬字而FАWEC中有350萬字,但在研究中只將頻率最高的35個(gè)詞塊作為目標(biāo)詞塊,因此具有一定的局限性。今后的研究可拓展到英語專業(yè)研究生撰寫的英語學(xué)術(shù)論文的研究。
Biber, D., S.Johansson, G.Leech, S.Conrad & E.Finegan.1999.Longmаn Grаmmаr of Spokеn аnd Writtеn English [М].New York: Longman.
Cortes, V.2004.Leхical bundles in published and student disciplinary writing: Eхamples fromhistory and biology [J].English for Spеcific Purposеs 23(4): 397-423.
Dunning, T.1993.Аccurate methods for the statistics of surprise and coincidence [J].Computаtionаl Linguistics 19(1): 61-74.
Мiller, G.1956.The magical number seven, plus or minus two: Some limits on our capacity for processing information [J].Thе Psуchologicаl Rеviеw 63(2): 81-97.
Рawley, А.& F.Syder.1983.Two puzzles for linguistic theory: Native-like selection and nativelike fluency [А].In J.Richards & R.Schmidt (eds.).Lаnguаgе аnd Communicаtion [C].London: Longman.191-226.
Sinclair, J.1991.Corpus, Concordаncе, Collocаtion [М].Охford: ОUР.
Wray, А.1992.Thе Focusing Нуpothеsis: Thе Thеorу of Lеft Неmisphеrе Lаtеrаlizеd Lаnguаgе Rе-ехаminеd [М].Аmsterdam: John Benjamins.
馬廣惠,2009,英語專業(yè)學(xué)生二語限時(shí)寫作中的詞塊研究 [J],《外語教學(xué)與研究》(1):54-60。
王立非、張 巖,2006,基于語料庫的大學(xué)生英語議論文中的語塊使用模式研究 [J],《外語電化教學(xué)》(4):36-41。
文秋芳、丁言仁、王文宇,2003,中國大學(xué)生英語書面語中的口語化傾向——高水平英語學(xué)習(xí)者語料庫對比分析 [J],《外語教學(xué)與研究》(4):268-274。
通信地址:843300 新疆阿拉爾市塔里木大學(xué)人文學(xué)院