王蓮涔
(西南大學 外國語學院,重慶 400715)
語料庫應用于大學俄語詞匯教學的探索
王蓮涔
(西南大學 外國語學院,重慶 400715)
詞匯教學是語料庫資源和研究手段應用于外語教學時間最早和成果最多的一個領域。國內學者對語料庫應用于外語教學,主要是英語教學進行了深入細致的研究。然而迄今為止,俄語語料庫在國內高校俄語專業(yè)教育中的應用并不普遍,甚至“幾乎空白”,這對功能強大的語料庫而言無疑是極大的資源浪費。本文采用語料庫方法,通過調查同義詞在不同語體中的分布,發(fā)現(xiàn)同義詞在不同語體中的優(yōu)先用詞原則,運用語義韻律方法,從新的維度反映詞語的搭配特征,揭示其不同的類聯(lián)接?;谡Z料庫的詞匯教學,注重量化分析,能揭示一些單純靠直覺分析不能發(fā)現(xiàn)的規(guī)律,為大數(shù)據(jù)時代的大學俄語教學提供新的視角,促進俄語教學。
語料庫;詞匯教學;詞頻;詞語搭配;語義韻律1
在俄羅斯,現(xiàn)代計算機語料庫的起步比較晚。但是,世界上并非沒有俄語語料庫,近些年來,俄語語料庫的發(fā)展呈現(xiàn)出加速發(fā)展的勢頭,國內外先后出現(xiàn)了不同類型的俄語語料庫。語料庫(корпус)和語料庫語言學(корпусная лингвистика)從理論、內容和方法等方面對語言教學與研究產生重要的影響。首先,它可以直接影響俄語教學的內容、側重點以及教學內容的編排順序等,繼而對教學大綱和教材的編寫產生影響;其次,它也對語言教學的思想和方法產生直接的影響。
近二十年來,英語學界在語料庫語言學應用方面的研究碩果累累,相對而言,俄語界對語料庫的應用研究還很缺乏,研究成果不多。但可喜的是,近十年來,國內俄語界學者已經開始關注俄語語料庫和基于語料庫的俄語研究,也有了些許的研究成果,如,《俄語語料庫的新發(fā)展》(許漢成,2005);《基于俄漢熟語語料庫的俄語熟語模式化及自動識別》(秦立東,2007);《俄語語料庫和基于語料庫的語法研究》(李紹哲,2012),《俄語國家語料庫與俄語專業(yè)教學》(于金玲趙娜,2013);《基于語料庫的俄語同義詞語義韻研究》(孫敏慶,2013)等,研究動態(tài)呈現(xiàn)出上升的趨勢。但是,總的來說, 俄語語料庫的研究和基于俄語語料庫的應用研究還有待進一步深入。①
首先,本文對俄語語料庫的研究和創(chuàng)建作簡要回顧;其次,闡述基于語料庫的詞匯教學的理據(jù);再次,從詞頻統(tǒng)計分析、詞語搭配、語義韻律和詞語辨析等方面探討語料庫在大學俄語詞匯教學中的應用模式;最后,對基于語料庫的俄語詞匯教學的發(fā)展趨勢進行預測與展望。
語料庫,顧名思義就是存放語言材料的倉庫, 但是這個倉庫里的語言材料不是雜亂無章地堆砌在一起的。語料庫是一個由大量在真實情況下使用的語言信息集成的專供研究使用的資料庫(Leech & Michael, 1981)。確切地說, 語料庫是指存放在計算機里的大量原始語料文本或經過加工后帶有語言學信息標注的文本。它是一個龐大的語言素材的集合體,主要用于觀察、分析和研究目標語的各種特征(唐潔儀 何安平,2004)。
語料庫的建設發(fā)軔于歐美,20世紀60年代建立的第一代布朗語料庫(Brown Corpus)和80年代建立的倫敦—隆德英語口語語料庫(London-Lund Corpus of Spoken English)為現(xiàn)代語料庫語言學奠定了堅實的基礎。20世紀80-90年代是語料庫建設快速發(fā)展的時期,建立了一批具有世界影響力的語料庫, 如主要用于詞典學研究的COBUILD英語語料庫、朗文語料庫(Longman Corpus Network)、英語國家語料庫(BNC)、國際英語語料庫(ICE)。語料庫是語言學和計算機科學交叉的一個學科,隨著計算機技術的發(fā)展,建立特大型語料庫已經不再是很困難的事,2001年開始建設全球英語監(jiān)測語料庫(The Global English Monitor Corpus)。監(jiān)測語料庫的規(guī)模沒有最終限制,它像語言一樣,處于不斷發(fā)展之中。
相對于西歐和北美語料庫研究的蓬勃發(fā)展,其他國家的語料庫研究處于相對落后的狀態(tài)。但,近年來,俄語、漢語、日語及東歐國家的語料庫建設成績斐然。中國的語料庫建設開始于20世紀80年代,已經建立的語料庫有:現(xiàn)代漢語語料庫(MCLC)、科研英語語料庫(JDEST)、石油英語語料庫(GPEC)、國家現(xiàn)代漢語語料庫。日語方面有代表性的語料庫有:EDR語料庫、青空文庫、現(xiàn)代日語書面語語料庫、日語口語語料庫、近代女性雜志語料庫等。
現(xiàn)代俄語語料庫的建立與研究相對較晚,直至21世紀之前,俄語方面還沒有一個可供世界俄語研究者訪問的俄語語料庫。俄羅斯國內外的研究者都意識到了建立俄語語料庫的必要性,于是,在幾個國家?guī)缀跬瑫r出現(xiàn)了關于建立可供網(wǎng)上訪問的俄語語料庫的科研項目。俄語語料庫的建設大體可分為兩種:俄羅斯自建的語料庫和其他國家建立的語料庫。在俄羅斯,20世紀70年代,Л.Засорина主持建立了一個語料庫,依據(jù)該語料庫1977年Л.Засорина編纂出版了《俄語頻率詞典》。但該語料庫和基于語料庫的詞典沒有電子版,限制了語料庫的使用范圍和功能。20世紀70年代末80年代初,俄羅斯數(shù)學家А.Ершов在建立自然語言處理系統(tǒng)過程中,通過總結所積累的知識和技術后,得出一個結論:只要建立俄語知識庫(машинный фонд русского языка),就可以解決用自然語言與計算機交流,并且讓計算機完成某些通常由人承擔的語言工作,如機器翻譯這樣的問題。俄語知識庫可以理解為計算機化俄語知識庫。該項目曾計劃建立若干個子庫和相關軟件:俄語總詞表、文本庫、詞典庫、術語庫、語法庫、歷史俄語庫、語音庫、方言庫等。這樣的知識庫一旦完成,一方面可以提高俄語語言學各學科的現(xiàn)代化水平,另一方面也會成為建立各種以俄語為界面的人機交互系統(tǒng)以及以俄語為載體的信息處理系統(tǒng)的基礎。遺憾的是由于蘇聯(lián)解體,項目沒有完成。但在近20年的研發(fā)過程中,積累了大量的資源,包括文本語料庫、詞典和軟件,這是俄語工作者一筆寶貴的財富。90年代,俄語研究所詞典編纂實驗部(Отдел экспериментальной лексикографии Института РЯ)在А.Н. Баранов、М.Н. Михайлов和Х.Томмола的主持下建立了現(xiàn)代政論文本語料庫(Корпус текстов по современной публицистике);圣彼得堡大學在В.Б. Касевич主持下建立了圣彼得堡大學俄語語料庫。20世紀,在俄羅斯基礎研究基金的支持下,莫斯科大學語文系普通和計算機詞匯學及詞匯編撰學實驗室在2000-2002年期間建立了俄語報紙計算機文本語 料 庫(компьютерный корпус текстов русских газет конца ХХ века,簡稱КГТ)。КГТ的建設由實驗室主任А.А. Поликарпов和實驗室人員共同完成。當前,КГТ對公眾僅部分開放,未來將開放全部內容。從2002年起,俄羅斯的語料庫建設呈現(xiàn)出加速發(fā)展的趨勢。В.Плугян, Е.Рахилина在Яндекс公司的支持下建成了標準俄語文學文本語料庫(50萬詞次);俄羅斯信息傳遞問題研究所建成了詞法和句法信息語料庫(10萬詞次);С.Шаров建立了4千萬詞次的代表性的俄語語料庫,在此基礎上,通過網(wǎng)絡發(fā)布了一部新的俄語詞頻詞典。
語料庫的出現(xiàn)改變了語言學的研究方式,但是俄語語料庫在20世紀一直落后于世界語料庫的發(fā)展,缺乏系統(tǒng)的理論研究和先進的實踐成果。俄語國家語料庫(Национальный корпус русского языка--НКРЯ)的出現(xiàn),改變了這一狀況。俄語國家語料庫計劃建設規(guī)模2億詞次,至2012年規(guī)模達到3.64億詞次,標注信息包括元文本標注、詞法標注、句法標注、語義標注和重音標注。該語料庫包括一個主庫和9個子庫,除11-14世紀的古代俄語文本語料庫外,其他部分都對外開放,俄語國家語料庫是迄今規(guī)模最大的俄語代表性學術語料庫。
俄語國家語料庫的建設主要參照了英語語料庫(特別是布朗語料庫和英國國家語料庫)的建設經驗,最重要的特征有兩個:
第一,國家語料庫具有代表性和語料庫文本類型的平衡性。只有語料庫的規(guī)模達到一定程度,才能談得上具有代表性。俄語國家語料庫建設之初設計規(guī)模為2億詞次。語料庫必須盡量包括各種類型的書面語和口語文本類型(各種體裁的文藝作品、政論文、學術著作、商務信函、口語會話、方言等等),而且所有這些類型的文本在語料庫里所占的比例要大體相當,基本一致。文本要按照一定的比例選取,文藝作品(包括劇本和回憶錄)約占40%。俄語國家語料庫包括的文本類型有:不同文體和流派的散文作品、劇本、回憶錄-自傳、雜志政論文、文藝評論、報紙政論文、新聞、科技文章、科普文本和教材、宗教和宗教哲學文本、正式公文和法律文本、日常生活文本(包括私人信件、日記等)等。
第二,國家語料庫具有語料標注信息。是否有標注信息是語料庫區(qū)別于其他類型電子數(shù)據(jù)的重要特征,只有對語料進行標注,才能更好地滿足語言研究的需要,語料庫標注的信息越豐富,它的學術研究價值和使用價值就越高。俄語國家語料庫目前進行了四種標注:元文本標注、詞法標注、重音標注和語義標注。詞法標注是借助專門自動詞法分析軟件進行的。俄語詞形的同形異義現(xiàn)象相當普遍,自動詞法分析軟件對輸出的部分文本進行了人工消歧和校對,這部分文本構成了標注詞法語料庫,還有一些語料進行了句法標注。
另外,俄語國家語料庫還建立了俄語平行文本語料庫,在翻譯理論和實踐、外語教學、機器翻譯等方面具有特殊的應用價值。俄語國家語料庫的建成徹底改變了俄語語料庫發(fā)展落后的現(xiàn)狀。
除了上述俄羅斯自己建立的俄語語料庫外,還有一些其他國家建立的俄語語料庫,這些語料庫是世界背景下俄語語料庫的重要補充。它們有瑞典烏普薩拉—圖賓根語料庫(Upssala-Tubingen)和芬蘭赫爾辛基大學俄語文本標注語料庫ХАНКО。2002年,我國學者提出開展俄語語料庫研究的問題,介紹了瑞典烏普薩拉—圖賓根語料庫和莫斯科大學報紙文本語料庫(許漢成,2005),近幾年關于俄語語料庫和基于語料庫的研究已經成為國內外俄語學界研究的熱點。目前國內建立的俄語語料庫有俄漢平行語料庫。語料庫語言學作為一種新興的經驗主義研究方法或者語言學學科將會影響到語言研究的各個方面,包括構詞學、詞匯學、詞法學、句法學、語義學、語用學及篇章語言學等,不僅如此,語料庫也為語言教學帶來許多的思想和方法 (Sinclair, 1988 ;Thomas, 2005 )。
一定的教學法總是依據(jù)一定的語言學說,比如,聽說法之所以在外語教學中強調模仿與記憶,就是因為它接受了結構主義語言學關于語言是一套習慣的觀點;語法—翻譯法之所以重視有關語言知識的講解和分析,是因為它采納了關于語言是代碼的理論;圖式理論強調人已有知識和知識結構對當前認知活動的決定作用,是“人們用已有的結構來記住新資料的一種方法”(桂詩春,2003: 5),認知圖式構建的關鍵因素是有一批“具體的語境(context-specif i c)”和“復現(xiàn)的語境(contextual repetitions)”(Aston, 1997:56)。
語料庫語言學與從圖式建構的角度看待語言發(fā)展的觀點在理念上有相似之處,兩者都認為,語言使用者都是在不斷地接觸和體驗相同或相似的形式結構在不同語境中是如何表達語義內涵與概念之后,才逐步形成抽象的語言知識,發(fā)展起語言能力的。建構語言圖式的條件是在自然語境下的大量和重復性的接觸語料,而語料庫的資源極其豐富,語料信息的提取更方便快捷,可以滿足這個語料庫所提供的大量在形式及語義上相近而又稍有差別的檢索行,能夠為認知圖式的建構、確認、擴展和重構提供良好的語言環(huán)境和基礎。G.Aston 指出新圖式的習得過程其實是不斷對已有圖式的組構和解構,這個建構過程有兩種相輔相成的途徑:一是“從具體到抽象”,二是“從抽象到具體”。在這兩個過程中,最關鍵的因素是要由大批在不同語境中反復的東西。而語料庫特有的語境共現(xiàn)功能正好能夠在相對同質的大量語料中反復呈現(xiàn)不同語境里的同一語言現(xiàn)象,語境共現(xiàn)界面有助于學生在一批相同的、相類似的語境信息刺激下,形成知識的圖式化進入大腦記憶。研究表明,語料庫的語境共現(xiàn)可以為建構和重構圖式提供合適的語言材料。
另外,語料庫的工具特別有利于設計教學任務,引導學習者建構外語學習的陳述性和程序性知識。使用語料庫不僅可以幫助設計各類教學任務,更可以引導學習者進行甄別、選擇、分類、歸納總結與各層次結構相匹配的、較典型的語言表達形式,加強詞匯學習的針對性,改善教學效果,提高教學質量。
語料庫集中了大量真實的語言素材,這一特性決定了語料庫的基本用途就是向學習者提供語言輸入。Ellis(1994)認為,輸入的頻率是影響語言發(fā)展的因素之一。Gass和Selinker(2001)指出,輸入中頻率很高的那部分內容比較容易引起注意。此外,對于語言水平較高的學習者,某些不常出現(xiàn)的內容也會由于其頻率之低而引起注意。語料庫在其檢索工具的配合下,使得頻率的集中體現(xiàn)不再是一件難事,通過語料庫索引行這種特殊的呈現(xiàn)方式,學習者毫不費力就能夠注意到出現(xiàn)頻率較高的語言現(xiàn)象,從而了解操本族語者經常使用的語言形式,這樣就可以在實際使用中減少誤用。
無論是教學還是研究,使用語料庫的最根本出發(fā)點是索引(concordance), 這是一種以呈現(xiàn)詞條索引的方式來描述詞條的方法。最為廣泛采用的索引方式是“關鍵詞的語境共現(xiàn)”(Key Word In Context, 縮略為KWIC),針對某一事先設定的檢索詞,計算機在語料庫中迅速搜索出包含檢索詞的所有句子,并將他們以檢索詞居中的形式排列出來。這種呈現(xiàn)方式提供了有關檢索詞使用的語境,根據(jù)需要,語境的范圍小至檢索詞左右的幾個詞,大至包含檢索詞的整個句子甚至整個段落。語料庫索引成功地解決了通過多語境學習詞匯這一難題。Cobb(1997)的研究證明,當多個語境通過索引行的形式同時呈現(xiàn)時,學習者可以從中獲得有變通性的詞匯知識。索引式詞匯學習的效果在某種程度上可與自然語境中的學習效果媲美。
詞匯教學是語料庫資源和研究手段應用于外語教學時間最早和成果最多的一個領域。外語教學界長期都在討論兩個重要問題: 一是教什么, 二是怎么教?;谡Z料庫的詞匯教學不僅有助于解決 “教什么”的問題,而且有助于解決“怎么教”的問題。
Sinclair早在20世紀80年代就提出外語教學可以從學習詞匯入手。他認為,以往的詞匯教學僅僅是語法教學的附屬品,詞的選擇缺乏代表性和科學性(Sinclair, 1988)。他和同事聯(lián)合調查了9套對外英語教材,通過統(tǒng)計研究發(fā)現(xiàn),教材中的高頻詞缺少最基本的描述。為此,他提出以詞匯為綱的外語教學就是:首先從大型自然語料庫中選擇最常見的詞型,然后,學習這些詞的最基本的使用模式,繼而,學習與這些詞最常見的搭配詞。
1997年出版的俄羅斯大科學詞典中收錄的詞匯有131257個。在俄語學習過程中, 要全部掌握這樣海量的詞匯是不可能的, 也是沒有必要的。人們學習外語也通常不是因為目的語里有什么就學什么, 而是首先學習那些目的語本族語者最常用,也就是說最有使用價值的詞匯和表達方式(何安平,2001)。外語學習是一個由易到難,循序漸進的過程,在俄語詞匯教學方面首先應該讓初級和中級學習者學習和掌握俄語本族語者最常用的詞語。但是詞匯的選取應該客觀、準確和科學, 不能完全憑借我們的主觀判斷、經驗和直覺。統(tǒng)計語料庫可以得到一種新的信息—語言特征的頻數(shù)和頻率。這種新的信息遠比語言學家的一般感覺重要,詞頻和頻率信息不僅說明了語言現(xiàn)象的普遍性,同時也是各種語言統(tǒng)計模型的基礎數(shù)據(jù)(傅興尚等,2009: 293)?!盎诙碚Z國家語料庫衍生的詞典”網(wǎng)站是俄語國家語料庫在詞典編撰方面做出的一大貢獻。網(wǎng)站包含4類詞典,分別是:《俄語新詞語法詞典》、《新俄語詞匯頻率詞典》、《俄語成語詞典》、《俄語非物質名詞動詞搭配詞典》。表1列出了俄語國家語料庫中前10個使用頻率最高的名詞、動詞、代詞和形容詞,我們發(fā)現(xiàn)這些詞匯在語言運用中具有必不可少的價值,說明學生應該優(yōu)先學習并掌握這些詞匯?;谡Z料庫的詞頻統(tǒng)計能夠為詞匯大綱的設計與教材詞匯的編排提供可靠的依據(jù), 可以用于解決詞匯教學中“教什么”的問題。因此,在俄語教學中應優(yōu)先教授基于語料庫的高頻詞匯及其常用搭配。
表1 НКРЯ中前10個使用頻率最高的詞語
在詞匯教學中使用語料庫還可以有助于解決“怎么教”的問題。同義詞、近義詞辨析是俄語詞匯教學的難點和重點,有時甚至連本族語使用者都很難講清楚其差別。如果我們借助于從語料庫中提取的語言信息作為證據(jù),通過對大量真實的語言實例進行系統(tǒng)分析來揭示語言運用的特征和規(guī)律,那么對同義詞、近義詞的講解就會更有說服力。于丹紅(2007)采用語料庫方法區(qū)分了同義詞одеть和 надеть,孫敏慶(2013)通過語料庫對同義詞вызвать—пробудить—привлечь進行了語義韻研究。本文以задача和задание為例探討在俄語詞匯教學中如何使用НКРЯ進行同義詞辨析。.
同義詞由于其內在意義的差異,在不同的語體中往往呈現(xiàn)出不同的分布特征,所以統(tǒng)計它們在不同語體中的頻率差異,有助于將它們區(qū)分開來。語言用于社會活動的不同領域,便產生不同類型的文體。Кожина(2003)把語體分為一般語體和個別語體。一般語體包括:科學語體、公文語體、報刊政論語體、文藝語體和日常口語體。本文的語料取自俄語國家語料庫的書面文本基礎語料庫和口語語料庫。書面文本基礎語料庫又稱現(xiàn)代俄語標準語料庫,收集的是俄語書面標準語,書面語篇的時間跨度是從18世紀中葉至21世紀初,而口語語料庫語篇的創(chuàng)作時間僅為1900-2000年,因此,我們首先在自建庫頁面將書面語篇的時間也設定為1900-2000年,然后分別選擇文學語篇及非文學語篇中的公文事務、政論、生產技術、學術科研領域進行建庫。這樣我們得到了與五大功能語體大致對應的五類子庫:文學庫、公文事務庫、政論庫、科技庫和口語庫。
具體操作如下:首先進入檢索界面,如圖:
在詞匯—語法檢索欄輸入要檢索的詞 задача 檢索條件設為單詞頻數(shù),語法和語義選項不選。
得到檢索結果如下:
由于各子庫的詞數(shù)從100萬到6000萬不等,為使統(tǒng)計更為科學,需要計算出同等詞數(shù)下各子庫中這兩個詞的出現(xiàn)頻次。我們將子庫的詞數(shù)均設定為100萬,得到的頻次如下:
總頻數(shù) 每百萬詞頻數(shù)задача 16943 63.8 задание 3036 13.25
表2 задание 和задача 在不同語體中的每百萬詞的詞頻分布
上述數(shù)據(jù)表明,在各個語體中,задача 的使用頻率均高于задание,尤其在口語中更是經常使用задача,而不是задание。由此可見,通過調查同義詞在不同語體中的分布,可以發(fā)現(xiàn)同義詞在不同語體中的優(yōu)先用詞原則,這是傳統(tǒng)的只從概念意義或句法功能方面辨析近義詞所無法做到的。
另外,語義韻律的提出也為同義詞辨析提供了新的維度。下面我們借助俄語國家語料庫對同義詞 произойти/(發(fā)生), случиться/(發(fā)生)的搭配情況進行考察、量化分析,以揭示出它們的語義韻。具體操作如下:
第一步,在俄語國家語料庫基礎庫頁面,建立類聯(lián)接。通過查閱詞典可知,兩個詞在用于“發(fā)生”之意時,均支配非動物名詞第四格形式,因此,在基礎庫檢索頁面,分別輸入關鍵詞的同時,將其支配詞的語法特征限定為существительные/(名詞),винительные/(四格),неодушевленное/(非動物性),這樣得到相應的類聯(lián)接即為V+N,且N被限定為非動物名詞第四格形式。為便于數(shù)據(jù)提取,我們將расстояниe項設置為от 1 до 1,即要求節(jié)點詞后邊的第一個名詞要符合上述語法限制條件。
第二步,將索引行到的語例保存為TXT,以利于語料庫軟件進行檢索。
第三步,借助檢索軟件AntConc 3.2.1對搭配詞進行檢索統(tǒng)計。將文本文件導入AntConc3.2.1 中,在searchterm 中勾選words 框, 輸入相應的檢索詞,同時將右跨距設置為1,左跨距設置為0,點擊collocates 和start,便可得到動詞的搭配詞表。通過對315條索引行進行觀察、統(tǒng)計其所支配的名詞發(fā)現(xiàn)(不計重復),與случиться搭配的詞語按順序為,событие/(事件),пожар/(火災),факт/(事實),время/(時間), скандал/(丑聞),жизнь/(生活),инцидент, случай/(事情),既和消極意義的詞匯(火災,事件等)搭配,又和傾向于中性涵義的詞匯搭配(如生活、時間、故事)等。與произойти搭配的名詞按順序為изменение/(改變),перемены/(替換),событие/(事件),вследствие(后果),теракты/(恐怖活動)等,其詞匯多為具有消極傾向意義的詞語。語義韻律作為語料庫語言學的一個重要術語,從新的維度反映詞語的搭配特點。可以說,揭示同義詞語義韻差異是辨析它們的一個有效途徑。同時還發(fā)現(xiàn),這兩個詞最常見的形式是случившийся/(發(fā)生的,陽性形式),случившиеся/(發(fā)生的,復數(shù)形式), произошедшие/(發(fā)生的,復數(shù)形式)。
綜上所述,使用語料庫的檢索方法進行的同義詞或近義詞辨析,主要是通過考察同義詞或近義詞在不同語域中的詞頻分布差異,統(tǒng)計各搭配詞與關鍵詞共現(xiàn)的顯著程度,觀察檢索行中呈現(xiàn)的同義詞或近義詞的搭配特征,揭示其不同的類聯(lián)接、搭配關系和語義韻等語言特征。這種基于語料庫的研究方法,注重量化分析,通過所呈現(xiàn)的數(shù)據(jù)挖掘潛在的語言特征,揭示一些單純靠直覺分析不能發(fā)現(xiàn)的規(guī)律。
本文是對語料庫應用于俄語詞匯教學的一種探索性研究。根據(jù)近年來對語料庫及語料庫語言學研究動態(tài)的觀察,筆者認為,基于語料庫的詞匯教學是大勢所趨。因為基于語料庫的詞匯教學方法符合以學生為中心的教學理念,這使得教師不再是知識的傳授者, 而是教學活動的組織者和設計者, 學生是研究者和參與者,學生通過探索了解語言的特征,有利于提高學生的自主學習能力。我們有理由認為,越來越多的師生將接受基于語料庫的課堂詞匯教學、詞語搭配學習、詞匯測試等新的學習理念和方法,基于語料庫的教學方法將越來越受到重視。隨著語料庫、語料檢索工具的不斷發(fā)展,語料庫的研究方法和技術手段將會不斷地運用到俄語詞匯教學實踐中,在編寫詞匯大綱和教材等方面也會得到廣泛應用,基于語料庫的教學研究也將進一步深化。
[1] Aston, G. 1997. Enriching the learning environment: Corpora in ELT [A].Teaching and Language Corpora [C]. In A. Wichmann et al. (eds.). London: Addison Wesley Longman Limited.
[2] Cobb, T. 1997. Is there any measurable learning from hands-on concordancing? [J]. System, (3):301 -315.
[3] Ellis, R. 1994. The Study of Second Language Acquisition [M]. Oxford: Oxford University Press.
[4] Gass, S. & L. Selinker. 2001. Second Language Acquisition: An Introductory Course (2nd Edition) [M]. New Jersey: Lawrence Erlbaum Associates.
[5] Leech, G. & H. Michael. 1981. Short Style in Fiction. A Linguistic Introduction to English Fictional Prose [M]. New York: Longman.
[6] Sinclair, J. 1988. A lexical syllabus for language learning [A]. In R. Carter & & M. McCarthy (eds.). Vocabulary аnd Language Teaching[C]. Harlow: Longman.
[7] Thomas, J. 2005. The use of L1 in an L2 on line chatactivity [J]. Canadian Modern Language Review, (1):161-182
[8] Кожина М.Н. 2003. Стилистический энциклопедический словарь русского языка[M]. М.:Флинта.
[9] 傅興尚 許漢成 易綿竹等 .2009 .俄羅斯計算語言學與機器翻譯[M]. 北京:語文出版社.
[10] 桂詩春. 2003.記憶與英語學習[J].外語界, (3):2-8.
[11] 何安平. 2001.語料庫與外語教學[J]. 國外外語教學, (3):15-19.
[12] 李紹哲.2012.俄語語料庫和基于語料庫的語法研究[D]. 哈爾濱:黑龍江大學.
[13] 秦立東.2007. 基于俄漢熟語語料庫的俄語熟語模式化及自動識別[D]. 哈爾濱:黑龍江大學.
[14] 孫敏慶. 2013.基于俄語國家語料庫的同義詞差異研究[J].天津外國語大學學報, (3):17-22.
[15] 唐潔儀 何安平. 2004.語料庫在外語教學中的應用 [J].外語電化教學, (5):42-45 .
[16] 許漢成. 2005 .俄語語料庫的新發(fā)展[J]. 中國俄語教學,(1):21-26.
[17] 于丹紅.2007.俄語國家語料庫與俄語詞匯教學——以одеть和надетъ為例[J].俄語學習,(6):84-86.
[18] 于金玲 趙娜. 2013.俄語國家語料庫與俄語專業(yè)教學[J].黑河學院學報, (2):12-15.
Application of Corpus in College Russian Vocabulary Teaching
Vocabulary teaching is an area wherein corpus resources and research methods are applied earliest and achieve the most fruits. Researchers in China have conducted intensive and thorough investigations into the application of corpora in foreign language teaching, mainly in English teaching. Nevertheless, so far Russian corpora are scarcely applied to the teaching of Russian majors in colleges, which is undoubtedly a big waste of corpus resources. Using corpus-based research methodology, this paper discovers the priority principle of the use of synonyms in different genres through looking into the distribution of synonyms in texts of different genres, and with the method of semantic prosody, this paper reveals collocational features of vocabulary and uncovers their linkages between different parts of speech. Corpus-based vocabulary teaching attaches importance to quantitative analysis and, therefore, is able to discover rules that always escape intuitive analysis. Thus, it can provide a new perspective for college Russian teaching in the Big Data Era and promote Russian teaching.
corpus; teaching vocabulary; word frequency; collocation; semantic prosody
H08
A
2095-4948(2016)02-0079-06
本文為中央高校基本科研業(yè)務費專項資金項目“基于語料庫的中國學習者俄語錯誤分析”(swu1609007)的階段 性成果。
王蓮涔,女,西南大學外國語學院副教授,博士,研究方向為應用語言學、詞典學、教學法。