鄭碧蓮
(廣東財經(jīng)大學外國語學院 廣東 廣州 510320)
語料庫為語言研究和教學提供了大量自然、真實的語言事實和文本數(shù)據(jù)。在理論研究層面,研究者可基于翔實的語料庫文本證據(jù)提取分析各類文體的語言特征,更加科學客觀地描述特定體裁、語域的詞匯特點和篇章特征。在語言學習層面,基于語料庫的數(shù)據(jù)驅(qū)動學習方法,符合圖式結(jié)構(gòu)和建構(gòu)主義的學習理論,能幫助學習者提高語言意識、內(nèi)化語言使用規(guī)律、提升語言交際能力,語料庫已逐漸成了外語自主學習的重要輔助性工具之一。專業(yè)優(yōu)質(zhì)的在線語料庫及操作簡易的檢索平臺可以克服自建語料庫和檢索工具的諸多限制因素,為語料庫數(shù)據(jù)驅(qū)動自主學習提供更多可能性。
美國當代英語語料庫(COCA)自開發(fā)以來受到了國內(nèi)學者的關(guān)注。徐玉蘇基于COCA語料庫創(chuàng)建微型文本設計詞匯教學,并通過實驗對比驗證了該教學實踐對提升詞匯學習效果和提高學生自主學習能力起到了較大的促進作用[1];方玲、汪興富對如何利用COCA語料庫的便捷檢索功能培養(yǎng)學習者自主學習能力和提升英語語言文化知識做了示范性的論述。[2]84然而,現(xiàn)有研究多基于COCA在線語料庫的部分檢索功能探索其在教學或?qū)W習中的應用,尚缺乏對各檢索模塊的全面討論。因此,本文將結(jié)合具體的問題情境闡述如何綜合使用COCA在線語料庫的各項功能進行檢索查驗和歸納總結(jié),提升高校學習者的自主學習能力。
我國高校學生多為英語中高級學習者,已具備較扎實的語言知識,但在詞塊搭配、語用語義的正確使用等方面亟待提升。如只知“face”有“面對”的意思,卻不熟悉“be faced with”作為固定語塊使用,且生搬硬套固有詞匯的現(xiàn)象依然普遍存在。圖式理論研究者認為,人們運用預先儲存的知識或知識結(jié)構(gòu)進行語言理解。[3]中國學習者英語能力的提升關(guān)鍵在于建構(gòu)、重構(gòu)其已有的語言圖式認知結(jié)構(gòu),而要實現(xiàn)此目標,就需要從語言輸入的量、質(zhì)、方式等方面做出突破。[4]語料庫資源和工具為語言學習過程中認知圖式的建構(gòu)和重構(gòu)提供了良好的環(huán)境。一方面,語料庫提供了可循環(huán)接觸和重復驗證的語言事實,并基于頻數(shù)統(tǒng)計和語境共現(xiàn)這兩大技術(shù)優(yōu)勢,凸顯語言使用中的高頻用法和顯著特征,能幫助學習者不斷檢驗和重構(gòu)、建構(gòu)語言知識圖式,科學地了解和歸納實際交際中不同體裁和語域的詞匯、語法和語篇特征,拓寬加深語言知識和有效提升語言的交際能力;另一方面,語料庫數(shù)據(jù)驅(qū)動學習要求學習者作為信息加工的主體和知識意義的主動建構(gòu)者[5],在豐富的語言實例中主動進行觀察分析、體驗發(fā)現(xiàn)和總結(jié)歸納,提高了學習者的學習興趣和主動獲取知識的動力。
COCA在線語料庫作為具備數(shù)量規(guī)模、檢索速度、持續(xù)更新、文本正式,且涵蓋口語、小說、流行雜志、報紙、學術(shù)期刊、電視電影字幕、博客、網(wǎng)站各大類型語料的專業(yè)平衡語料庫,能夠很好地服務于語境索引、詞塊搭配、類聯(lián)接語法模式歸納、語義語用辨析、創(chuàng)建個性化語料庫等學習行為。本文對COCA在線語料庫檢索功能及具體用法進行歸納(如表1),并結(jié)合問題情境,闡述如何綜合運用這些檢索功能開展自主學習。
表1 COCA 語料庫在線平臺主要檢索功能歸納
情境1:在英語學術(shù)寫作中,如何選用恰當?shù)膭釉~描述和評價他人的觀點或研究成果?描述研究行為時表示測驗、分析、評價的動詞有哪些?如何檢索到學科專業(yè)領(lǐng)域內(nèi)的相關(guān)詞匯和地道表述?
通過綜合使用List、Collocates和KWIC檢索,學習者可拓展此類表達的近義動詞,了解其常用搭配、使用語境、類聯(lián)接語法模式等知識。
在List模塊中,學習者可用其比較熟悉的test和show分別進行近義詞檢索。在搜索框中輸入[=test],POS(詞性)選擇verb.ALL,Sections(分類)下拉菜單中選擇語域ACAD,可檢索得到test的近義詞examine、assess、investigate、analyze、check等。同理,輸入[=show]則可檢索到show的近義詞explain、appear、prove、point、indicate、present、establish、reveal、demonstrate、display、illustrate等。如想了解indicate在商務學術(shù)英語中的使用情況,在搜索框中輸入[indicate],POS選擇verb.ALL,Sections選擇ACAD:Business,檢索可得到indicate及其變化形式indicates/indicated在Business子庫中的使用總頻數(shù)及各個形式的使用頻數(shù)。如想了解indicate在不同語域中的使用情況,可在Chart模塊中進行檢索,Sections選擇IGNORE,結(jié)果頁面將通過數(shù)字和柱狀圖呈現(xiàn)indicate在八大語域中的使用頻率,比較可發(fā)現(xiàn)在ACAD中的使用頻率顯著高于其他語域。
在Collocates模塊中,可檢索目標詞語前后1—9個單詞之間的詞語搭配情況。以檢索與動詞test搭配的名詞主語/賓語、介詞為例:在Word/phrase框中輸入[test],Collocates右邊的POS選擇noun.ALL,左右跨距均設定為2,Sections選擇Academic:Medicine,檢索得到Frequency列表呈現(xiàn)醫(yī)學學科領(lǐng)域中與test搭配的高頻名詞,如hypothesis、results、differences、effects、patients、samples等。同理,將以上檢索條件中的POS選定為PREP,就可以得到與test搭配的高頻介詞為for、in、by和with。
在KWIC模塊中,可直接檢索到目標詞語或短語在語境中的索引行例句。將索引行中目標詞語左右相鄰的一個或若干個詞進行排序,觀察和歸納詞語的類聯(lián)接語法模式,即詞語搭配中的語法結(jié)構(gòu)。如根據(jù)KWIC檢索得到動詞test的索引行例句,可歸納出它的6種高頻語法形式:test+名詞,test+介詞+名詞,test+名詞+介詞,test+從句,be tested,be tested+介詞+名詞。同時,利用索引行提供的局部語境或超鏈接中的擴展語境,學習者可以在大量的語境中進行分析驗證,自下而上構(gòu)建認知圖式,掌握目標詞語的語用知識。
情景2:在開展以Risk management為主題的學習時,遇到詞匯匱乏的問題怎么辦?
Collocates模塊除了用于詞語搭配的檢索,還可起到互信息查詢領(lǐng)域詞匯的功能[2]81,幫助學習者解決詞匯貧乏的困境。以risk management作為檢索詞,POS選擇noun.ALL,左右跨距均設置為9,勾選Sections中的ACADEMIC,即可獲取學術(shù)語域中risk management左右最大間距為9個單詞的上下文中共同出現(xiàn)的名詞詞頻表。通過該詞頻表可了解與risk management話題研究相關(guān)的高頻名詞,進而構(gòu)建該主題的詞匯語義網(wǎng)絡,激活學習者思維中的相關(guān)事物概念和語言表達。借助共現(xiàn)詞匯表、詞匯語義網(wǎng)絡的預置性學習,學習者可以對聽力、閱讀內(nèi)容進行預測,或為寫作、口語表達奠定詞匯基礎(chǔ)。
情景3:indicate和demonstrate在詞語搭配、語用語義方面有何區(qū)別?
Compare模塊可實現(xiàn)兩個目標詞語搭配情況的檢索對比。通過設定搭配詞語的左右跨距和詞性,檢索得到搭配的詞頻表可直觀展示目標詞語在詞語搭配上的異同。在Word1和Word2中分別輸入[indicate]和[demonstrate],Collocates右邊的POS選擇noun.ALL,左右跨距均設為2,則可檢索到這兩個目標詞語左右2個詞距內(nèi)搭配的名詞。檢索結(jié)果頁面將默認按RATIO值高低左右對照呈現(xiàn),可手動切換為按FREQUENCY排序。同時,通過KWIC索引行例句中的局部語境或進入擴展語境,比較分析詞語之間細微的語義語用差異。解決很多傳統(tǒng)教學中無法解釋清楚的語言使用問題。
情景4:各個檢索模塊之間是否相互聯(lián)系?可否快速獲取對語料庫中某個詞語在語義、搭配、語用語境等各方面的信息?
通過Word模塊檢索得到的詞條頁面,簡明扼要地展示目標詞語在語料中的綜合信息,能夠有效幫助學習者快速獲取目標詞語在意義、搭配、語法和語用等方面的認識。如在搜索框中輸入[indicate],POS選擇verb.ALL,檢索可得到基于對COCA語料庫挖掘所產(chǎn)生的詞條頁面,呈現(xiàn)目標詞語各方面的數(shù)據(jù)信息及相關(guān)鏈接(點擊即可查看),包括詞頻對比圖、相關(guān)話題(Topics)、高頻搭配(Collocates)、詞簇(Clusters)、索引行(Concordance lines)等。詞頻對比圖通過柱狀圖直觀地展示目標詞語在不同語域語料庫中的使用頻率。高頻搭配按詞性類別分別列出了與目標詞語共現(xiàn)的高頻詞匯。相關(guān)話題羅列了與目標詞在同一頁面出現(xiàn)的有語義和話題相關(guān)性的關(guān)聯(lián)詞匯。此外,單詞釋義下方的PlayPhrase可超鏈接到影視作品中的關(guān)聯(lián)片段,為學習者提供多模態(tài)學習資源。
情景5:能否利用COCA語料庫數(shù)據(jù),快速創(chuàng)建滿足個性化學習需求的語料庫?
通過Texts/Virtual下的Create corpus選項,學習者可以利用COCA這個龐大的語料庫資源自建與學習領(lǐng)域密切關(guān)聯(lián)的虛擬語料庫。根據(jù)自身的學習需求對語料來源(Source)、文章題目(Article title)、年份(Year)、文體/語域(Genre/domain)、單個關(guān)鍵詞(Words in text)這些選項進行設置,創(chuàng)建滿足個性化需求的語料庫。如篩選2015—2019年間學術(shù)研究教育學領(lǐng)域(Academic:Education)的所有期刊(Journal)文章建立語料庫。如要進行更復雜的檢索建庫,可在COCA主頁面搜索框中輸入短語、詞根、語法結(jié)構(gòu)等進行檢索,Text/Virtual選項下選擇FIND TEXTS,點擊Find matching strings進行檢索。學習者可根據(jù)需要編輯修改自建的語料庫,在單個或多個自建庫之間檢索比較。自建語料庫中的FIND KEYWORDS選項提供按詞性類別呈現(xiàn)關(guān)鍵詞列表的功能,還可調(diào)整詞頻數(shù)(FREQ)/文本數(shù)(TEXTS)或選擇語料庫特有詞匯(SPECIFIC),進一步調(diào)整詞條和建立詞條庫。據(jù)此學習者可根據(jù)自身水平有針對性地選擇高、中、低頻的詞匯進行學習。
盡管語料庫資源為語言學習提供了傳統(tǒng)學習材料無法取代的優(yōu)勢,但語料庫的建立需要經(jīng)過文本搜集、清潔、整理、標注等復雜程序。COCA在線語料庫的創(chuàng)建語料庫功能克服了語料庫建設的限制性因素,為學習者高效選取符合個體需求的學習資源提供了極大的便利。
情景6:能否借助自動統(tǒng)計數(shù)據(jù),在閱讀前了解文本難易度和重難點詞匯?
在Analyze左側(cè)搜索框中輸入目標文本,系統(tǒng)會自動基于COCA語料庫數(shù)據(jù)按高、中、低頻對文本中的詞匯進行詞頻統(tǒng)計和分類。詞頻統(tǒng)計可以幫助學習者預測文本內(nèi)容的難易度,有助于鎖定中、低頻陌生詞匯作為預習或?qū)W習重點,從而提升閱讀學習效率。此外,搜索結(jié)果頁面中的詞條超鏈接和短語匹配檢索功,有助于提高學習效率。點擊文本中的詞語即可超鏈接到詞條頁面,獲取該詞在相關(guān)話題、高頻搭配、索引行等方面的匯總信息。切換至PHRASE選項,可選定文本中的短語進行近義短語或相關(guān)搭配的搜索。
培養(yǎng)學習者基于語料庫數(shù)據(jù)驅(qū)動的學習技能,順應了數(shù)據(jù)化教育的時代要求,也是培養(yǎng)和提升學習者自主終身學習能力的必然要求。高校教育者應樹立學習者是語料庫使用主體的觀念,貫徹培養(yǎng)學習者運用語料庫進行檢索學習的理念。在持續(xù)完善語料庫和優(yōu)化檢索平臺的同時,應加強對學習者自身檢索學習能力的培養(yǎng)。本文結(jié)合問題情境論述了COCA在線語料庫在自主學習中的綜合實踐運用,為學習者語料庫驅(qū)動自主學習能力的培養(yǎng)提供參考。