如何使用第二外語學習者語料

2017-03-31 05:51劉燕華

科學與財富 2016年30期

劉燕華

摘要：學習者語料研究起源于20世界80年代后期。它的起源是基于語料語言學的理論和方法論模式。語料語言學是利用語料來研究語言的，也就是說，研究經(jīng)電腦處理過的書面或口語文本數(shù)據(jù)。盡管該領域還是一個非常新的領域，但是該領域已經(jīng)對語言理論和語言描述做出了巨大的貢獻。

關鍵詞：第二外語學習；語料庫

1.學習者語料數(shù)據(jù)的特異性

學習者語料屬于一種更加開放的二語習得類型的數(shù)據(jù)。Ellis將其區(qū)分出來，并且命名為自然語言使用數(shù)據(jù)和診療數(shù)據(jù)。自然語言數(shù)據(jù)是由學習者產(chǎn)生，并且這類學習者是抱著真實交流的目的才使用第二語言的。原則上講，只有自然語言數(shù)據(jù)可以稱之為好的，且合格的學習者語料數(shù)據(jù)，因為語料本身就應是真實的，它包含的數(shù)據(jù)必須來源于日常交際的真實對話。然而，完全自然的學習者語料很難收集，尤其是在外語環(huán)境中學習者沒有什么機會在真實的日常交際中使用第二語言。

2.學習者語料研究的主要階段

學習者語料研究的主要階段有：

1.方法論的選擇

2.學習者語料的選擇和編譯

3.數(shù)據(jù)注釋

4.數(shù)據(jù)提取

5.數(shù)據(jù)分析

6.數(shù)據(jù)解讀

7.教學實施

3.方法論的選擇

從事語料研究的研究人員一般會從這兩種方法論中選擇一種。根據(jù)研究問題，這兩種方法論分別為基于語料的方法和語料驅(qū)動的方法。基于語料的方法主要是通過語料數(shù)據(jù)來檢測一個假設或者一個規(guī)則。因此這很明顯是一個演繹式的方法，其中語料并不是主人，語料的角色是服務于證實或是推翻之前的一個理論框架。語料驅(qū)動的方法挖掘了語料全部的能力。這是一種歸納式的方法，它可以逐步的將觀察到的語料普遍化，使其最終可以建立理論或規(guī)則。

4.數(shù)據(jù)分析

給予學習者數(shù)據(jù)的研究的一個特點就是所研究的語言現(xiàn)象的廣泛性。除了那些在二語習得研究當中有明顯標志的語言現(xiàn)象，比如屈折變化詞素或者詞序，學習者語料研究也詳細考察了其他許多語言現(xiàn)象，這些語言現(xiàn)象如果不是完全被忽視了也是不被重視的研究對象，列舉數(shù)例：派生語素，搭配，詞匯豐富性，模糊限制語，語域，拼寫或是標點。

5.數(shù)據(jù)解讀

目前為止，LCR對語言的描述強于對語言的解讀。這在一定程度上很好理解，因為研究的大多數(shù)專注于中介語的變體，這些中介語是急需被描述的，尤其是中上水平或者是高水平中介語。由學習者語料提供的豐富的數(shù)據(jù)為解讀二語數(shù)據(jù)提供了堅實的基礎。Granger（1996）所提到的，整合多種語言的學習者數(shù)據(jù)的整合對比模式，和Jarvis提出的嚴謹?shù)姆椒ㄕ摽蚣?，這兩種方法轉(zhuǎn)變了研究方向以從多層語料庫中有所收獲。一語對二語由遷移影響的實證證據(jù)完全依賴于學習者一語當中存在一些與二語類似的特征。例如，Zhang將中國的英語學習者把連詞的初始位置的過度使用這一問題歸因于“在中文當中，與英文有相同意思的連詞總是放在句子的開頭?！蓖瑯?，對于短語more and more的過度使用是由于一語對二語遷移的影響，在漢語當中有相類似的說法“越來越”。由于其他一些語料庫的缺乏，所以我們暫定為這種解釋。雙語語料庫是由二語以及學習者一語共同組成的。在在這種情況下，英語和漢語就需要證實和拒絕他們之間存在的相似性。除此之外，來自于不同母語學習者的語料庫有必要去除其他其他效應帶來的遷移影響。Zhang在ICEL里提出的兩個現(xiàn)象，這兩個現(xiàn)象表明遷移造成的影響會在大量的學習者中存在，因此很有可能逐步發(fā)展而不是與遷移相關。Osborne（2008）在其關于副詞位置的研究中表明，這兩種影響經(jīng)常是共存的，而且過度使用和不足使用的程度是與學習者母語當中語言現(xiàn)象的使用頻頻相關的。

6.教學實施

盡管以純理論的角度去研究學習者語料是可以的，但是許多的LCR研究目的都是想要最終提高教學工具和方法。得益于學習者語料庫的觀點最多的領域是詞匯學，課件以及語言評估。Runden和Granger告訴我們應該如何使用學習者及本族語者語料去挖掘資料這些資料包括錯誤標記，這些錯誤標記目的是為了讓學習者把注意力放在常規(guī)的語言陷阱上。擴大的“提升寫作技巧”部分目的是為了幫助學生寫學術文本將正在學習中等程度英語的中國學生的寫作錯誤標記出來并且分析了其寫作文本。他們還設計了在線的補救自學系統(tǒng)，稱為：GrammarTalk，這個軟件針對于那些高頻率的錯誤，比如說冠詞錯誤。第三個受益于LCR的領域是語言評估。經(jīng)過仔細的分析學習者語料可以就某種程度幫助參與者篩選并且排列測試資料。加之與自然語言處理技巧的配合，它們可以用來去自動顯示出學習者的學習水平。