王 灝,繆芙蓉
(西北師范大學(xué) 外國語學(xué)院,甘肅 蘭州 730070)
語料庫是指按照一定的語言學(xué)原則,運(yùn)用隨機(jī)抽樣方法,收集自然出現(xiàn)的連續(xù)的語言文本或話語片段而建成的具有一定容量的大型電子文庫(楊慧中,2002)。從20世紀(jì)90年代初以來,隨著第二代大規(guī)模語料庫的誕生與語料庫的技術(shù)方法的更加成熟,近年來許多不同領(lǐng)域不斷地涌現(xiàn)出有關(guān)語料庫研究的專著、論文等成果,其中基于語料庫與語言教學(xué)及語言學(xué)習(xí)相關(guān)的研究成果尤為引人關(guān)注。并且語料庫在現(xiàn)代語言學(xué)研究和語言教育中發(fā)揮著越來越重要的作用,為外語教學(xué)研究提供了一種嶄新的哲學(xué)思維模式。
本研究采用的是論文文獻(xiàn)檢索和統(tǒng)計(jì)分析的方式。統(tǒng)計(jì)分析軟件使用的是SPSS18.0版本,同時(shí)運(yùn)用了Excel進(jìn)行了數(shù)據(jù)分析。首先,根據(jù)南京大學(xué)關(guān)于中國國內(nèi)外語類核心期刊的分類及排序,篩選出能夠代表外語類研究居于前5位的核心期刊,在中國知網(wǎng)中以“語料庫”為篇名、關(guān)鍵字和摘要檢索詞進(jìn)行檢索,選取5種核心期刊上從2008—2012年的有關(guān)語料庫的研究論文共100篇(表1),筆者將其所有的論文下載后組建成本次研究的自建論文數(shù)據(jù)庫,并根據(jù)其發(fā)表年份及期刊對其進(jìn)行SPSS統(tǒng)計(jì)得出各期刊及每年發(fā)表論文的曲線圖,然后從研究內(nèi)容,研究方法等角度運(yùn)用EXCEL軟件進(jìn)行了數(shù)據(jù)統(tǒng)計(jì)分析。
表1 2008—2012年5種外語類核心期刊 發(fā)表語料庫的研究論文情況
1.總體數(shù)量發(fā)展趨勢。
對外語類的5種核心期刊中的語料庫的論文進(jìn)行SPSS軟件分析,2008-2012年間各期刊研究論文數(shù)據(jù)變化如圖1顯示,《解放軍外國語學(xué)院學(xué)報(bào)》的相關(guān)研究論文最多,占所選論文的26%。筆者認(rèn)為其原因之一是解放軍外國語學(xué)院學(xué)報(bào)的發(fā)行單位及創(chuàng)辦理念:它是由解放軍外國語學(xué)院主辦的外國語言文學(xué)學(xué)術(shù)性刊物,其主要特色是:(1)綜述性研究和專題研究并重,前者反映一級學(xué)科外國語言文學(xué)的前沿動態(tài),后者報(bào)告國內(nèi)外有關(guān)的最新研究成果及信息;(2)兼顧純理論性研究和實(shí)證性研究。為了進(jìn)一步分析并說明這5種核心期刊中所篩選出的論文特征,筆者把這些所有研究按時(shí)間分成2個(gè)階段:第一個(gè)階段2008-2010年間發(fā)表的語料庫研究的論文共計(jì)55篇,占本次調(diào)查100篇論文總量的55%;第二個(gè)階段2011-2012年間發(fā)表在5種期刊上的論文共計(jì)45篇,占論文總量的45%。很顯然,關(guān)于語料庫論文研究數(shù)量有稍微下降的趨勢,但是在《外語教學(xué)與研究》期刊上此類論文數(shù)量還是有所增加的。
圖1 5種核心期刊基于語料庫研究的變化情況(2008-2012)
2.基于語料庫的研究方法分類。
基于國內(nèi)以往的語料庫研究的分類方法,筆者將100篇關(guān)于語料庫的論文按照語料庫本體研究和其應(yīng)用性研究進(jìn)行分類。其中語料庫本體的研究是對語料庫自身擁有的特點(diǎn)、方法,建設(shè)的作用、意義及其素材來源的相關(guān)研究。應(yīng)用性研究就是把語料庫作為一種工具,把其運(yùn)用于其他的領(lǐng)域研究具體內(nèi)容。本次研究的論文中對語料庫本體研究的論文為18篇,占論文總量的18%,而采用語料庫的應(yīng)用性研究的論文共73篇,占總量的73%;論文中還有9篇是關(guān)于專家論壇,國際會議及述評的相關(guān)研究。圖2顯示了2008-2012年間基于語料庫研究的本體研究與應(yīng)用性研究的動態(tài)變化關(guān)系。發(fā)現(xiàn)整個(gè)相關(guān)研究以應(yīng)用性研究為主,說明語料庫研究者們除了對語料庫理論進(jìn)行研究外,還注意到了語料庫它本身就是一個(gè)供研究者們進(jìn)行研究時(shí)使用的工具,只有通過與語料庫的結(jié)合,進(jìn)行相關(guān)研究才具有一定說服力,可行性及科學(xué)性。
圖2 語料庫研究方法的變化情況
3.基于語料庫的主要研究內(nèi)容。
本調(diào)查通過對研究內(nèi)容的細(xì)化分類,筆者發(fā)現(xiàn)100篇研究論文中,主要包括5種研究內(nèi)容:對語料庫本體的研究論文共18篇,占18%;基于語料庫研究英語口語的論文共13篇,占13%;基于語料庫研究翻譯的論文共10篇,占總論文的10%;基于語料庫研究課堂教學(xué)的論文共9篇,占總論文的9%;基于語料庫研究詞匯的論文9篇,占9%??傮w表明,對語料庫的研究內(nèi)容比較豐富,比較全面。
(1)語料庫本體的研究。
在本次研究的論文中對語料庫本體的研究論文共18篇,筆者對其進(jìn)行了細(xì)分,發(fā)現(xiàn)主要研究內(nèi)容有:語料標(biāo)注,詞匯重復(fù)及差異方面的研究。
其中潘鳴威(2008)提出CEM(Corpus for English Majors),即《英語語料庫》為研究者們不僅提供了中國英語專業(yè)學(xué)習(xí)者的真實(shí)語料,而且提供不同的學(xué)習(xí)者之間的語言學(xué)習(xí)的特點(diǎn)。對其語料的標(biāo)注進(jìn)行研究,則可以使研究者、教師或教材編寫者更快地通過量化統(tǒng)計(jì)處理,為語料的應(yīng)用尋找更好的依據(jù)和支撐。研究主要介紹了66萬詞次寫作語料的言語失誤標(biāo)注原則、言語失誤分類及其特點(diǎn),并列舉了失誤標(biāo)注的具體操作方法。張雪梅(2008)主要介紹了中國高校外語專業(yè)多語種語料庫建設(shè)與研究—英語語料庫的建設(shè)概況和其中的翻譯子語料庫,然后詳細(xì)說明了翻譯子語料庫的標(biāo)注體系及特色,最后指出了使用語料庫進(jìn)行研究時(shí)應(yīng)注意的問題。此外,語料庫語言學(xué)的一項(xiàng)基本研究內(nèi)容就是語料庫之間的詞匯或其他的特征出現(xiàn)頻率的差異研究,具體方法使用的統(tǒng)計(jì)方法主要是卡方檢驗(yàn)。葛詩利(2010)提出任何統(tǒng)計(jì)方法的應(yīng)用都有相應(yīng)的前提假設(shè),由于卡方檢驗(yàn)不能夠完全符合詞匯差異的研究,提出其他統(tǒng)計(jì)方法包括對數(shù)似然率和秩和檢驗(yàn)也能夠?qū)υ~匯差異進(jìn)行研究,并對此做了實(shí)驗(yàn),實(shí)驗(yàn)證明,對數(shù)似然率與卡方檢驗(yàn)類似,在詞匯差異檢驗(yàn)中也會受到樣本量和樣本代表性的影響進(jìn)而產(chǎn)生統(tǒng)計(jì)偏誤,但是秩和檢驗(yàn)卻能在一定程度上解決這些問題,得到比較客觀的統(tǒng)計(jì)結(jié)果。
(2)基于語料庫研究英語口語的研究。
在基于語料庫對英語口語的研究中,筆者發(fā)現(xiàn)對口語中的復(fù)數(shù)信息的重要性及口語中短語動詞、情態(tài)詞語、交互詞語、多次慣用及口語中的停頓現(xiàn)象等有相應(yīng)研究。
胡敏(2011)基于中國英語學(xué)習(xí)者口語的語料,研究了中國英語學(xué)習(xí)者復(fù)數(shù)標(biāo)記的變異狀況及其影響因素。其中有91名大學(xué)生參加了本次研究。在數(shù)據(jù)分析基礎(chǔ)上,作者得出如下結(jié)論:第一,正確的復(fù)數(shù)標(biāo)記和標(biāo)記缺失并不是復(fù)數(shù)標(biāo)記變異的主要形式,主要形式還包括零標(biāo)記和單數(shù)名詞被標(biāo)記。第二,復(fù)數(shù)標(biāo)記變異具有系統(tǒng)性,語音、語義、句法和詞匯層面都會對其產(chǎn)生不同程度的影響。其中語義層面是最重要的影響因素,而句法層面則是最弱的因素。第三,語體與復(fù)數(shù)標(biāo)記變異的影響因素相關(guān)性較弱。潘琪(2011)以公共英語考試口語語料庫的子庫(SECOPETS-4)和英語本族語語料庫(NICT-NATIVE)為基礎(chǔ),采用中介語對比分析的方法,分析并研究了中國學(xué)習(xí)者的英語口語中的三類語用標(biāo)記語:情態(tài)詞語、交互詞語、多詞慣用語的使用特征。研究結(jié)果表明了中國學(xué)習(xí)者在這三個(gè)方面的使用程度都過少。然而,中國學(xué)生對某些高頻的情態(tài)助動詞和副詞的使用過度,并且還存在一些誤用現(xiàn)象。本研究進(jìn)一步說明了中國學(xué)習(xí)者掌握口語中的語用標(biāo)記語的詞匯數(shù)量較少,并且對高頻詞匯的用法掌握不全面、不準(zhǔn)確,導(dǎo)致交流障礙。高瑩,樊宇(2011)從分析敘述中的停頓現(xiàn)象比較了中美大學(xué)生的口語表達(dá)的差異,研究發(fā)現(xiàn)美國大學(xué)生對使用停頓策略比中國學(xué)生更加擅長,前者停頓現(xiàn)象多發(fā)生在句子與句子之間或主句與從句之間;而后者的停頓位置除句子(從句) 之間外,更多發(fā)生于句子中間。研究表明了有效的停頓策略和語塊教學(xué)有助于學(xué)習(xí)者的語速提高,口語流利性增強(qiáng)。
(3)基于語料庫對翻譯的研究。
自Baker(1993,1995)介紹語料庫語言學(xué)在翻譯研究中的應(yīng)用以來,語料庫翻譯研究(corpus-based translation studies)已發(fā)展成為一種新研究方式,研究內(nèi)容涉及譯者文體,翻譯語言共性特征、翻譯轉(zhuǎn)換過程等,其中對翻譯共性(translation universals)的研究最為突出。
肖忠華,戴光榮(2010)通過對比分析兩個(gè)自建漢語譯文平衡語料庫,探討了漢語譯文的詞匯和句法特征,發(fā)現(xiàn):首先,相比于漢語母語,漢語譯文詞匯的密度略低,尤其是實(shí)義詞與功能詞之比偏低;其次,漢語譯文中連接詞的使用更多,有很明顯的特征;最后,漢語譯文中被動結(jié)構(gòu)受英文影響很大,所以對規(guī)范化假設(shè)進(jìn)行質(zhì)疑。
此外,由于英、漢兩種語言對人稱代詞手段在構(gòu)句層面的依賴程度不同,英漢翻譯中人稱代詞的轉(zhuǎn)換表現(xiàn)出一定的特點(diǎn)。黃立波(2008)通過借助雙語平行語料庫,考察了英漢翻譯中人稱代詞主語在文學(xué)和非文學(xué)兩種文體類型中的數(shù)量、頻次和轉(zhuǎn)換的類型。研究表明,在英譯漢的過程中,人稱代詞主語語際轉(zhuǎn)換表現(xiàn)出源語遷移現(xiàn)象,語內(nèi)類比很突出,根本原因歸于兩種語言對形式手段在依賴程度上的差異,以及語言相對社會地位和認(rèn)知規(guī)律等因素的作用。
王惠,朱純深(2012)介紹了自行創(chuàng)建的語料庫雙模式標(biāo)注系統(tǒng)及標(biāo)注抽取的工具,并且探討了如何通過語料庫建設(shè),特別是語料的標(biāo)注,拓寬了語料庫在翻譯教學(xué)、自學(xué)中的應(yīng)用。最后說明了全面的標(biāo)注抽取模式不僅方便學(xué)習(xí)者對特定翻譯現(xiàn)象的集中觀察和學(xué)習(xí),也易于課堂上的舉例或者集中講解。
(4)基于語料庫對課堂教學(xué)的研究。
如今應(yīng)用語言學(xué)的一個(gè)嶄新的領(lǐng)域就是語料庫語言學(xué)的研究成果及技術(shù)手段應(yīng)用于英語課堂教學(xué)中,并取得了很大的優(yōu)勢。在本研究的論文中,戈玲玲,李廣偉,劉朝暉(2011)通過自建大學(xué)英語教學(xué)語料庫及自主測試語料庫,采用計(jì)算機(jī)編程技術(shù)和數(shù)據(jù)庫技術(shù)開發(fā)了一個(gè)基于校園網(wǎng)的Web大學(xué)英語教學(xué)平臺系統(tǒng),該系統(tǒng)的一個(gè)很大優(yōu)點(diǎn)就是為教師針對不同的學(xué)習(xí)者使用個(gè)性化教學(xué)提供了可能性,并給學(xué)生提供了趣味性的學(xué)習(xí)工具。
此外,隨著學(xué)習(xí)者語料庫的建立,其已作為新的數(shù)據(jù)資源為語言研究及二語的學(xué)習(xí)服務(wù)。甄鳳超,王華(2010)主要提出了在外語教學(xué)中,學(xué)習(xí)者語料庫的兩大途徑:間接應(yīng)用和直接應(yīng)用,前者是把基于學(xué)習(xí)者語料庫的中介語研究發(fā)現(xiàn)應(yīng)用到了外語教學(xué)中,有助于教師了解學(xué)習(xí)者的語言運(yùn)用特征及其困難,進(jìn)而實(shí)施有效的課堂干預(yù);后者是使用學(xué)習(xí)者語料庫的數(shù)據(jù)驅(qū)動學(xué)習(xí),進(jìn)而讓學(xué)習(xí)者通過分析積極和消極的語言證據(jù)以提高語言意識,同時(shí)通過練習(xí)加強(qiáng)語言的學(xué)習(xí)。
(5)基于語料庫研究詞匯的論文。
詞匯既是語言交際的基礎(chǔ),又是語言習(xí)得的主要內(nèi)容。第二語言習(xí)得的研究成果表明,學(xué)習(xí)者在語言使用過程中所遇到的困難與詞匯有直接的關(guān)系,詞匯量不足是其中的重要因素(Connor 1996, Nation 1990)。與此同時(shí),國內(nèi)研究者也開始關(guān)注詞匯輸入頻率和詞匯習(xí)得之間的關(guān)系。很多學(xué)者(如湯聲平,2002;趙勇,鄭樹棠,2003,等)撰文談?wù)撛~匯重復(fù)對詞匯習(xí)得的意義,并提出編寫教材時(shí)應(yīng)該考慮這個(gè)因素。
羅衛(wèi)華,鄧耀臣(2009)以英國國家語料庫(BNC)為基礎(chǔ),通過采用計(jì)量語言學(xué)的方法,研究了普通書面的英語篇際詞匯重復(fù)特性,并探討了對英語詞匯習(xí)得的啟示。研究結(jié)果表明,在篇際詞匯中占很大比例的是樣本組中一次詞;字?jǐn)?shù)大約相等的任意兩個(gè)語篇的詞匯重復(fù)率較小,詞匯重復(fù)數(shù)也呈正態(tài)分布;篇際詞匯很小的一部分是重復(fù)率在5-15次以上的詞匯。進(jìn)而可以看出,篇際詞匯重復(fù)模式給英語的詞匯教學(xué)造成了很大的困難,使英語學(xué)習(xí)者普遍感覺到詞匯不足,且不能轉(zhuǎn)換成積極詞匯。
由于英語寫作是學(xué)生詞匯量的直接性體現(xiàn),對寫作中的詞匯也有許多的研究。其中詞匯的錯(cuò)誤分析不僅有助于了解學(xué)習(xí)者第二語言的掌握程度及學(xué)習(xí)策略,而且有助于了解學(xué)習(xí)者共同的學(xué)習(xí)特點(diǎn),對促進(jìn)二語教學(xué)具有重要意義。何華清(2009)采用了定量、定性分析方法,對中國學(xué)習(xí)者英語語料庫中290篇作文的詞匯錯(cuò)誤進(jìn)行分析,結(jié)果表明。中國學(xué)生的詞匯錯(cuò)誤主要有拼寫錯(cuò)誤、詞類錯(cuò)誤、替代錯(cuò)誤、省略型錯(cuò)誤和冗余型錯(cuò)誤。所以要克服這些錯(cuò)誤,學(xué)習(xí)者必須在了解英漢語言之間的差異和英語詞匯具體使用規(guī)則的基礎(chǔ)上,通過說、寫等各種方法來鞏固所學(xué)詞匯知識,逐步提高詞匯運(yùn)用能力。
本次調(diào)查發(fā)現(xiàn),國內(nèi)近5年在語料庫方面的研究取得的成就顯著,研究方式也趨于多元化,研究內(nèi)容也細(xì)化到各個(gè)層面。從整體來看,中國的語料庫的研究發(fā)展?fàn)顩r良好,但是不足還是存在的。筆者總結(jié)了以下幾點(diǎn):(1)相關(guān)研究在這5種核心期刊的論文總量所占比例應(yīng)成增長的態(tài)勢,為學(xué)者做基于語料庫的研究做出貢獻(xiàn)。(2)研究者們在近5年來,主要是把語料庫作為一種工具來進(jìn)行研究,關(guān)于語料庫的本體研究也應(yīng)該得到發(fā)展。(3)由于在我國語料庫的研究中雖然有自己的特色但也存在不足之處,所以我國的語料庫研究應(yīng)通過與其他國家的語料庫的研究進(jìn)行對比,來對我國的語料庫的發(fā)展查漏補(bǔ)缺。
通過回顧和研究我國外語類的5種核心期刊近5年的相關(guān)語料庫的研究現(xiàn)狀,不僅對我國基于語料庫的教學(xué)模式及學(xué)習(xí)方法提供了重要的指導(dǎo),還預(yù)示了今后國內(nèi)語料庫的發(fā)展方向和趨勢:(1)從學(xué)習(xí)者的角度出發(fā),以英語本族語語料庫和中國英語學(xué)習(xí)者語料庫為基礎(chǔ),探討英語課堂教學(xué)的實(shí)證研究將會越來越多。(2)由于網(wǎng)絡(luò)的現(xiàn)代化,今后基于網(wǎng)絡(luò)的語料庫也會得以建設(shè)。
由此可以預(yù)見,隨著我國對語料庫研究的更加具體和系統(tǒng),未來的中國語料庫研究會更具有中國特色。
[1]Baker, M. 1993. Corpus Linguistics and Translation Studies: Implications and Applications[A].In M. Baker, G. Francis & E. Tognini-Bonelli(eds.). Text and Technology: In Honour of John Sinclair[C]Amsterdam: John Benjemins. 17-45.
[2]Baker, M. 1995. Corpora in Translation Studies: An Overview and some Suggestions for Future Research[J]. Target 7:223-243.
[3]Connor, U. 1996.Contrastive Rhetoric[M]. Cambridge: CUP.
[4]Nation, I. 1990.Teaching and Learning Vocabulary[M].New York: Newbury House Publishers.
[5]Olophan, M. 2004. Introducing Corpora in Translation Studies[M]. London: Routledge.
[6]高瑩,樊宇. 基于語料庫的中美大學(xué)生口語敘述中停頓現(xiàn)象比較研究[J].解放軍外國語學(xué)院學(xué)報(bào),2011(4):71-77.
[7]戈玲玲,李廣偉,劉朝暉. 基于語料庫的大學(xué)英語教學(xué)平臺建設(shè)及其教學(xué)模式研究[J].外語界,2011(5):2-9.
[8]葛詩利. 語料庫間詞匯差異的統(tǒng)計(jì)方法研究[J]. 現(xiàn)代外語,2010(3):249-257.
[9]何華清. 非英語專業(yè)學(xué)生寫作中的詞匯錯(cuò)誤分析—一項(xiàng)基于語料庫的研究[J].外語界,2009(3):2-9.
[10]胡敏. 中國英語學(xué)習(xí)者書面語料復(fù)數(shù)標(biāo)記的變異研究[J]. 現(xiàn)代外語,2011(2):187-219。
[11]黃立波. 英漢翻譯中人稱代詞主語的顯化—基于語料庫的考察[J].外語教學(xué)與研究,2008(6):454-461.
[12]羅衛(wèi)華,鄧耀臣.基于BNC語料庫的英語篇際詞匯重復(fù)模式研究[J].外語教學(xué)與研究,2009 (3): 224-229.
[13]潘鳴威.談?wù)凜EM語料庫中翻譯語料的標(biāo)注[J].外語界,2008(4):13-19.
[14]潘琪.中國英語學(xué)習(xí)者英語口語語用標(biāo)記語使用特征研究—基于SECOPETS語料庫的實(shí)證研究[J].外語與外語教學(xué),2011(3):35-40.
[15]湯聲平.從教與學(xué)的雙重視角看大學(xué)英語(全新版)系列教材[J].外語界,2002(3):76-80.
[16]王惠,朱純深. 翻譯教學(xué)語料庫的標(biāo)注及應(yīng)用—“英文財(cái)經(jīng)報(bào)道中文翻譯及注釋語料庫”介紹[J]. 外語教學(xué)與研究,2012(2):246-257.
[17]肖忠華,戴光榮. 尋求“第三語碼”—基于漢語譯文語料庫的翻譯共性研究[J]. 外語教學(xué)與研究,2010(1):52-60.
[18]楊慧中.語料庫語言學(xué)導(dǎo)論[M]. 上海:上海外語教育出版社,2002.
[19]張艷莉,潘鳴威. CEM寫作語料的標(biāo)注原則及說明[J].外語界,2008(4):20-26.
[20]趙勇,鄭樹棠.大學(xué)英語教材中的核心詞匯的關(guān)注[J].外語與外語教學(xué),2003(6):21-24。
[21]甄鳳超,王華.學(xué)習(xí)者語料庫數(shù)據(jù)在外語教學(xué)中的應(yīng)用:思想與方法[J].外語界,2010(6):72-80.