陳 蕊
(河南理工大學 外國語學院,河南 焦作 454000)
基于語料庫的中外期刊學術論文詞塊對比研究
陳 蕊
(河南理工大學 外國語學院,河南 焦作 454000)
在兩個自建中外學習者期刊語料庫的基礎上,通過運用語料庫分析軟件,討論比較兩個語料庫中常用詞塊呈現(xiàn)的特點。研究結果表明,中國學習者與英語本族語者在學術論文的高頻詞塊選擇上無較大差異,在功能類型上也基本一致;不同之處在于中國學習者在某些詞塊的使用上存在過多或不足的傾向。這說明雖然中國學習者已具備了較熟練運用英語進行學術論文創(chuàng)作的能力,但在規(guī)范性與準確性上仍需提高。
期刊語料庫;英語學術論文;詞塊;功能類型
詞塊是語言學的一個重要概念,語言學界對它的關注早在19世紀就已開始。但學界至今對詞塊概念仍沒有一致的定義,眾說紛紜。語言學家們從不同角度對詞塊進行研究并提出了自己的定義,如稱詞塊為詞束(lexical bundle)、詞叢(lexical cluster)、詞匯短語 (lexical phrase)或預制塊(prefabricated chunks)等。
國內語言學者如王立非、張大鳳(2006)認為詞塊通常由多個詞構成,具有兩個特征,即詞匯和語法特征,并具有特定的活動功能。王立非(2006)指出,詞塊是事先預制好且被頻繁使用的多個詞的組合,有自己特定的結構和相對穩(wěn)定的意思,它以整體形式被記憶儲存,在即時交際時被整體提取,不需要運用語法規(guī)則加工分析。國外語言學家多從語法和認知語言學角度對詞塊進行闡釋,其中具有較強普遍性和實用性的是Michael Lewis對詞塊的分類:單詞和短語;固定搭配;慣用句型;句子框架和引語。但被廣大語言學研究者采用較多且分類較全面的是Biber (1999)的分類方法。Biber從結構層面和功能層面對詞塊進行分類。結構層面上有七種主要類型詞塊:名詞詞塊、動詞詞塊、介詞詞塊、形容詞詞塊、連詞詞塊、副詞詞塊、句干詞塊,主要類型之下再細分為12種子類型。功能層面上詞塊分為4種類型:立場詞塊、組篇詞塊、指示詞快和會話詞塊。
Biber對詞塊的分類與他人不同之處在于他從二維角度結合結構和功能兩個層面分類,而不是一維角度,這為語言學研究者對詞塊的認識提供了一個全新的視角。學界對詞塊概念雖沒有一個統(tǒng)一的定義,但多數(shù)學者對詞塊的特征和功能認知基本一致,即詞塊是由大于或等于兩個詞語的多詞組成,可用于構成句子或話語,能表達較完整的意義,實現(xiàn)一定語法、語篇或語用功能形式和意義。本文對詞塊的理論研究基礎即是基于此理解及Biber的詞塊分類。
學術英語是指學術研究人員在科研學習、撰寫學術文章或進行學術交流時針對某個特點問題或概念進行闡述時所使用的英語,屬特殊用途英語的一個分支。學術研究者的學術英語水平不僅決定著他們學術知識的深廣度,同時也決定他們能否將所學準確地傳播給世界。學術研究人員要運用學術英語準確地傳播學術不僅僅要有豐厚的詞匯積累,更要具備扎實的語言基本功,能完整準確地組織語言表達學術概念或個人觀點等。這時,在語言組織過程中,作為一種具備“特定語法和語用功能的意義集合體”(馬廣惠,2011),詞塊就起著非常重要的承接和引導的意義。鑒于此,本文選取中外學術期刊論文中詞塊作為研究對象,運用語料庫方法對比兩者中詞塊的使用情況及結構、功能特征,歸納總結學術英語詞塊對中國英語學習者學術學習和學術創(chuàng)作的重要性。
本研究將采用語料庫方法對學術英語詞塊進行研究。
第一步,建立中國學習者期刊語料庫和英語本族語者期刊語料庫兩個語料庫,對其中學術英語詞塊分層抽樣、隨機選取。兩個語料庫的語料均來源于發(fā)表在中外學術期刊上的英語論文,庫容基本接近:中國學習者期刊語料庫含論文115 篇,總次數(shù)894 809;英語本族語者期刊語料庫含論文103篇論文,共計879 034詞。兩個語料庫的主題均是關于用英語進行寫作的學術論文,詞數(shù)也基本接近,因而可比性較高,結果也會較為客觀,可信度較高,可行性強。
第二步,確定語料分析軟件,以分析所建語料庫中的學術英語論文。本研究將選用語料庫研究中常用的語料分析軟件WordSmith用于提取目標詞塊、查詢特定單詞或詞塊頻數(shù)及分析相關數(shù)據(jù)。
第三步,明確界定所選詞塊概念。筆者在理論背景部分已指出,語言學界對詞塊概念的闡述與界定紛繁多樣,因此,確定本研究中將提取分析的詞塊應具備怎樣的特征,如何定義就顯得至關重要,即明確研究對象為何物。本研究針對的是國內外學術期刊上的英語論文,學術論文內容客觀,主題規(guī)范,邏輯嚴謹,所以,本研究所提取的詞塊也要具備這種規(guī)范嚴謹?shù)奶卣?,即要“意義完整,且符合傳統(tǒng)語法規(guī)則”。如果不能滿足這一特點,即便是在語料庫中高頻出現(xiàn)的詞塊,也不會被選取作為本文的研究對象進行比較討論。
第四步,確定詞塊提取標準。Biber(2004)和Cortes(2004)認為在學術英語文本中“至少出現(xiàn)在5個不同文本且頻數(shù)不少于40次/百萬詞”的4詞詞塊相較于其他詞塊具有更重要的研究意義。本研究的詞塊提取標準即參照Biber的這一發(fā)現(xiàn),將提取中國學習者期刊語料庫和英語本族語者期刊語料庫中的高頻4詞詞塊進行比較分析。
最后,分析所提取詞塊的功能特點。根據(jù)Biber(1999)對詞塊的分類方法,從功能層面對兩個語料庫中提取出的高頻4詞詞塊進行分析比較,以求歸納總結中國科研人員英語學術論文寫作特點并為其英語水平提升提供思路。
1.高頻4詞詞塊對比
如上文研究方法所述第四步,本研究參照Biber和Cortes的研究發(fā)現(xiàn)確定以“至少出現(xiàn)在5個不同文本且頻數(shù)不少于40次/百萬詞”為高頻詞塊提取標準。隨后,參照提取標準對所建中國學習者期刊語料庫和英語本族語者期刊語料庫中出現(xiàn)的高頻4詞詞塊進行提取、篩選。然后,本研究選取其中提取結果中最具代表性的出現(xiàn)頻數(shù)最高的前8位高頻4詞詞塊列表如下,通過這樣直觀的對比圖分析比較中國學習者和英語本族語者英語學術論文中高頻詞塊的使用情況及特點。
表1 中國學習者期刊語料庫和英語本族語者期刊語料庫高頻4詞詞塊對比
通過上表所示的中國學習者期刊語料庫和英語本族語者期刊語料庫出現(xiàn)頻數(shù)排名前八位的高頻4詞詞塊及相應頻數(shù),讀者不難發(fā)現(xiàn),其中有四個詞塊是相同的:at the same time、on the basis of、it could be seen和on the other hand。這四個相同詞塊的不同點在與它們出現(xiàn)在這兩個語料庫中的頻數(shù),以上四個詞組在中國學習者期刊語料庫和英語本族語者期刊語料庫中出現(xiàn)的頻數(shù)依次為70 和 97 、62 和 86 、57 和 75 、87 和 74。這些數(shù)據(jù)之間的頻數(shù)差多保持在10左右,說明中國學習者和本族語者在詞塊的選取與使用上相差不多、基本一致,中國學習者在運用英語進行學術論文寫作時能做到已熟練運用不同詞塊。
雖然有高頻出現(xiàn)的詞塊有半數(shù)相同,但表格中有一點也需引起讀者關注,即出現(xiàn)的前3位高頻4詞詞塊完全不同。中國學習者期刊語料庫中高頻4詞詞塊頻數(shù)出現(xiàn)前3位的詞塊分別是on the other hand,頻數(shù)87;by the use of,頻數(shù)80;with the increase of,頻數(shù)77;然而本族語者期刊語料庫的前3位高頻4詞詞塊則是at the same time、on the basis of、it could be seen,頻數(shù)分別為97、86、75,與前者無一重復。這種不同說明中外科研人員在撰寫學術論文時在最常使用的詞塊上選擇不同,而這些不同的詞塊選擇及頻數(shù)也折射出中國科研人員在一些詞塊的運用上較之本族語學者存在不足或過度。如表1中所列詞組at the same time,它在本族語者期刊語料庫中出現(xiàn)的頻數(shù)是97,而在中國學習者期刊語料庫中的頻數(shù)則為70,說明中國學習者對該詞塊的選擇及使用存在不足;但對于上表中的另一詞組on the other hand,中國學習者則表現(xiàn)出過度使用的情況,這點可以通過它在中國學習者期刊語料庫中出現(xiàn)的頻數(shù)87(所有詞塊中最高的)和在本族語者期刊語料庫中的頻數(shù)74(居中)上看出。這些差異也能反映出中國學習者在語言的學習和運用上還有很多需要矯正提高之處。
2.詞塊功能類型分析
詞塊在語言的使用中起著重要的作用,主要表現(xiàn)為生成語言、表達理解等,這種作用就是詞塊的功能,因此分析詞塊的功能在研究中亦是非常必要的。
筆者參照上文提到的本研究采用的詞塊提取標準進行檢索,從中國學習者期刊語料庫和英語本族語者期刊語料庫分別提取到6632個和6758個符合標準的詞塊。隨之,根據(jù)Biber (1999)和Cortes (2004)對于學術詞塊功能的分類標準對所提取的高頻詞塊分類,結果如下表所示。
表2 中國學習者期刊語料庫和英語本族語者
筆者和讀者均可從以上數(shù)據(jù)分析出兩個所建語料庫在詞塊功能類型使用上的特點。
第一點,中國學習者期刊語料庫和本族語者期刊語料庫均包含了Biber和Cortes針對學術詞塊在功能層面所劃分的幾種類型,如指示標記類、立場表達類和文本組織類。
第二點,兩個語料庫所占比例最高的詞塊功能類型均為指示標記類詞塊,分別占功能類型總數(shù)的50.54% 和 51.88%,立場表達類和文本組織類詞塊在兩個語料庫中所占比例均不到百分之二十,且數(shù)值接近,這表明中外學者在撰寫論文中對詞塊的使用在功能上是相同的。
第三點,通過上表數(shù)據(jù)不難發(fā)現(xiàn),兩個語料庫中指示標記類詞塊比例最高且數(shù)值相近,說明中外學習者在學術論文撰寫中多選擇能實現(xiàn)文本想要闡述的某個客觀對象屬性的詞塊,如“the nature of the”等。這主要由學術論文需要清楚闡釋某一客觀事物或現(xiàn)象或問題的性質所決定。
第四點,上表數(shù)據(jù)還表明,立場表達類和文本組織類詞塊在兩個語料庫中所占比例較小,均不到百分之二十。立場表達類中國學習者期刊語料庫所占比例15.8%,本族語者期刊語料庫為18.3%;文本組織類相應的比例分別為18.79%和17.48%。這些較小且數(shù)值接近的比例說明在兩個語料庫中表明說話人態(tài)度的詞塊或銜接上下文邏輯關系的詞塊使用均不多。這也是受學術論文的基本性質所限,即學術講求科學客觀,應盡可能地減少主觀評價用語。
結語
綜上,本研究發(fā)現(xiàn),中國學習者與英語本族語者在學術論文的高頻詞塊選擇上無較大差異;在功能類型上,兩者也基本一致,這些都說明中國學習者在用英語進行學術論文創(chuàng)作時,已具備了較熟練較高的水平。
但在高頻4詞詞塊選擇上體現(xiàn)出的差異性也讓筆者發(fā)現(xiàn)一些問題,即在運用英語進行學術論文寫作時,中國學習者需要提高質的問題,即對詞塊的恰當使用。要解決這一問題,中國學習者可通過多研究學習英語本族語者在學術創(chuàng)作領域常用的學術詞塊特征,多閱讀英語原文文本、背誦及模仿本族語者常用詞塊,增強自己對常用學術詞塊的理解掌握,提高語言運用能力,創(chuàng)作出更加規(guī)范、標準、地道的英語學術論文。
[1]Biber, D., S. Johansson,G. Leech, S. Conrad & Finegan. Longman Grammar of Spoken and Written English [M].Beijing: Foreign Language Teaching and Research Press,1999.
[2]Biber, D., S. Conrad & V. Cortes. If you look at...:Lexical bundles in university teaching and textbooks [J].Applied Linguistics, 2004,25(3).
[3]Cortes, V. Lexical bundles in published and student disciplinary writing: Examples from history and biology [J].English for Specific Purposes,2004(23).
[4]Lewis, M. Implementing the Lexical Approach: Putting Theory into Practice [M].Language Teaching Publications,1997.
[5]Lewis, M. The Lexical Approach [M].Language Teaching Publications,1993.
[6]Skehan, P.A Cognitive Approach to Language Learning [M].Oxford: Oxford University Press,1988.
[7]馬廣惠.詞塊的界定、分類與識別[J].解放軍外國語學院學報,2011(1).
[8]王立非,張大鳳.國外二語預制語塊習得研究的方法進展與啟示[J].外語與外語教學,2006(5).
Class No.:H031 Document Mark:A
(責任編輯:宋瑞斌)
A Corpus- based Research of Academic Paper Chunks from Chinese and Foreign Periodicals
Chen Rui
(School of Foreign Studies, Henan Polytechnic University, Jiaozuo, He’nan 454000,China)
Based on two established corpora of Chinese and foreign periodicals, the paper compares and discusses the features of chunks which are frequently used in the two corpora by applying the corpus analysis software. The research results show that in choosing high-frequent academic chunks, there is no obvious difference between Chinese learners and native English speakers. Nor is the functional feature. The difference lies in the tendency of excessive or insufficient use of certain chunks in papers of Chinese learners, which shows that although Chinese learners have a good command of writing English academic paper, the accuracy of the language still needs to be improved.
periodical corpus; English academic thesis; lexical chunks; type of function
陳蕊,碩士,講師,河南理工大學外國語學院。研究方向:英語國家社會與文化。
河南省教育廳人文社會科學研究資助計劃項目(項目號:2017-ZZJH-193);河南省教育科學“十三五”規(guī)劃項目(項目號:2016-JKGHB-0197);河南理工大學教育教改研究項目(項目號:2015JG099);河南省哲學社會科學規(guī)劃項目(項目號:2013BYY023)階段性研究成果。
1672-6758(2017)02-0129-4
H031
A