司園園
(西北大學(xué) 外國語學(xué)院,陜西 西安 710127)
詞塊指的是在語料文本中反復(fù)出現(xiàn)的兩詞或兩詞以上的結(jié)構(gòu),這些結(jié)構(gòu)不一定是語法和語義上的完整結(jié)構(gòu),如the basis of a。對詞塊的掌握程度通常被視為英語地道性的重要體現(xiàn),學(xué)習(xí)者運用詞塊能力與學(xué)術(shù)寫作水平有顯著的正相關(guān)性。鑒于此,本研究基于兩個自建語料庫:中國英語學(xué)習(xí)者語料庫與英語本族語語料庫,對比分析中國英語專業(yè)碩士研究生與英語本族語作者在學(xué)術(shù)論文中的四詞詞塊使用情況,以期對中國英語專業(yè)碩士研究生英語論文寫作研究和教學(xué)提供一些啟示。
國外對于學(xué)術(shù)詞塊的研究側(cè)重于從不同語體或?qū)W科來研究高頻詞塊結(jié)構(gòu)及語用功能,如Biber區(qū)別了程式搭配和程式序列,從結(jié)構(gòu)和功能角度研究了口語和學(xué)術(shù)語體詞塊使用特點;[1]Cortes通過對比歷史和生物學(xué)學(xué)術(shù)期刊文章發(fā)現(xiàn)不同領(lǐng)域詞塊結(jié)構(gòu)和功能;[2]Hyland指出學(xué)術(shù)詞塊在不同學(xué)術(shù)領(lǐng)域具有差異性;[3]Christin通過建立大學(xué)英語測試語料庫對比了不同學(xué)科間詞塊結(jié)構(gòu)與功能的區(qū)別。[4]
反觀國內(nèi),對于學(xué)術(shù)詞塊的研究還相對不足,多集中于學(xué)術(shù)文本自身特點的研究,如楊元媛總結(jié)了科技英語四詞詞塊使用特點。[5]也有研究某一具體特征的,如王敏等研究了學(xué)術(shù)論文中立場標記詞塊。[6]
雖然國內(nèi)外學(xué)者對學(xué)術(shù)論文中所使用的多詞詞塊進行了多方面多角度的研究,但鮮有學(xué)者針對學(xué)術(shù)論文中多詞詞塊使用特征進行對比研究。鑒于此,本文通過對比中國英語專業(yè)碩士研究生與本族語作者使用的高頻四詞詞塊,分析中國英語專業(yè)研究生學(xué)術(shù)論文寫作中四詞詞塊的使用與英語本族語作者的差異。
本研究運用語料庫語言學(xué)的相關(guān)理論及工具,并基于Biber等提出的學(xué)術(shù)詞塊結(jié)構(gòu)分類,對比分析中國英語專業(yè)碩士研究生學(xué)術(shù)論文和語言學(xué)國際期刊論文中的四詞詞塊使用情況,試圖探討如下問題:
(1)兩個語料庫中的中四詞詞塊是如何分布的,以及形成這樣分布的原因。
(2)哪些四詞詞塊在兩個語料庫中使用頻率最高,這些高頻四詞詞塊在兩個語料庫中是否具有顯著性差異,以及顯著差異形成的原因。
(3) 按照結(jié)構(gòu)分類的四詞詞塊在兩個語料庫中的分布有何差異,以及差異形成的原因。
本研究采用的是語料庫對比分析的方法。用該方法分析學(xué)習(xí)者學(xué)術(shù)論文中詞塊的使用情況時,參照語料庫的語料是英語本族語學(xué)習(xí)者的學(xué)術(shù)論文,還是國際英文期刊上的論文,學(xué)者界沒有一致的認識。Bolton等認為,學(xué)習(xí)者英文學(xué)術(shù)論文寫作應(yīng)以國際英文期刊上的論文為標準。本研究將采納他的觀點。[7]
學(xué)習(xí)者語料庫CEPTC由知網(wǎng)上隨機選取的27篇外國語言學(xué)及應(yīng)用語言學(xué)專業(yè)碩士研究生2016—2018年畢業(yè)論文組成,總計461 636字符;參照語料庫ENJAC是由在語言學(xué)國際期刊AppliedLinguistics、AnnualReviewofAppliedLinguistics、EnglishLanguage&Linguistics和AnnualReviewofLinguistics上隨機選取的49篇2016—2018年期刊文章,總計463 180字符。此外,為確保所搜集到的文本具有代表性,兩個語料庫中涉及到的所有論文都刪除了致謝、目錄、圖表、參考文獻等,只保留了英文題目、英文摘要和正文部分。
Biber等人將詞塊的詞長限制為三詞或多詞的共現(xiàn)組合,包括三詞、四詞、五詞等詞塊。[1]但是部分四詞詞塊在結(jié)構(gòu)上包含三詞詞塊(如as a result of包含as a result),并且四詞詞塊在學(xué)術(shù)論文中更為常用,在結(jié)構(gòu)上更具代表性,因此本研究的研究對象確定為四詞詞塊。
本研究所使用到的檢索工具 AntConc 3.5.7w(Windows),其詞頻表功能可自動計算出兩個語料庫的總形符數(shù)和總類符數(shù),而其N-grams功能可檢索出兩語料庫中的所有四詞詞塊。另外本研究還利用檢驗頻數(shù)差異的Chi-Square Calculator(卡方檢驗)來計算兩語料庫共有詞塊使用頻率的差異顯著性。[8]
第一步,提取本研究的目標四詞詞塊。筆者根據(jù)詞塊頻數(shù)每百萬詞出現(xiàn)10—40次不等,[2]以及自建語料庫的實際庫容大小,將目標四詞詞塊的檢索頻數(shù)設(shè)定為每百萬詞出現(xiàn)30次,且同時出現(xiàn)在不少于5個文本中,[1]以確保所搜索到的四詞詞塊體現(xiàn)語言學(xué)專業(yè)的學(xué)科特點而非碩士研究生或國際學(xué)者個人的論文寫作風(fēng)格。關(guān)于此提取標準,筆者需要指出,對詞塊的界定至今仍有爭議,[9]本研究基于經(jīng)驗,對目標四詞詞塊的界定以每百萬詞出現(xiàn)30次的頻率為提取標準,這種界定并沒有一定的統(tǒng)計學(xué)依據(jù),僅是為了搜索到一定數(shù)量的高頻四詞詞塊。通過設(shè)定每百萬詞出現(xiàn)30次的頻率,得到數(shù)量合理的同時又具有典型性的四詞詞塊(許家金、許宗瑞,2007)。根據(jù)這樣的標準,四詞詞塊頻數(shù)應(yīng)為 30/1 000 000 * 461 636=13.85 或30/1 000 000 * 463 180=13.89,因此在使用檢索工具AntConc3.5.7w(Windows)檢索詞塊時將最低頻數(shù)設(shè)置為14,文本數(shù)設(shè)置為5。分別檢索出兩個語料庫中高頻四詞詞塊,然后手動刪除在語法或語義上明顯不連貫的詞塊,如higher than that of,statement the author is等。
第二步,在經(jīng)過刪選的高頻四詞詞塊中找出兩個語料庫共有的高頻四詞詞塊,進行卡方計算,探究中國英語專業(yè)碩士研究生對兩庫中共有的高頻四詞詞塊的使用情況及原因。
第三步,根據(jù)Biber等提出的學(xué)術(shù)詞塊結(jié)構(gòu)分類標準,[1]本研究分別對兩個語料庫中的目標高頻四詞詞塊進行結(jié)構(gòu)分類與分析,并且分析英語專業(yè)碩士研究生與國際語言學(xué)作者在學(xué)術(shù)英語四詞詞塊使用方面存在的差異,并總結(jié)歸納英語專業(yè)研究生使用四詞詞塊的特點。
基于本研究對目標四詞詞塊所設(shè)定的檢索標準,使用檢索工具AntConc 3.5.7w(Windows)檢索兩個語料庫中的高頻四詞詞塊,分別獲得了兩庫中的高頻英語四詞詞塊,如表1和表2所示。
表1 CEPTC語料庫高頻四詞詞塊
表2 ENJAC語料庫高頻四詞詞塊
Biber在1999年所做的研究表明:相比于學(xué)習(xí)者,本族語者在學(xué)術(shù)寫作中會使用更多的詞塊。但是近幾年的研究結(jié)果表明:在學(xué)術(shù)論文寫作中中國英語學(xué)習(xí)者比英語本族語者使用的四詞詞塊更多。從表1可以看出,中國學(xué)習(xí)者語料庫提取出的目標四詞詞塊為87類,共2 669個;英語本族語者語料庫提取出的目標四詞詞塊共45類,共1 053個。因此可以看出,中國學(xué)習(xí)者在學(xué)術(shù)論文寫作中四詞詞塊的使用量和豐富度均超過英語本族語者,這與近幾年的研究結(jié)果一致。造成這樣結(jié)果的原因可能是英語專業(yè)碩士研究生作為高級英語學(xué)習(xí)者,在本科四年及研究生三年共七年的專業(yè)英語學(xué)習(xí)過程中,通過大量的閱讀課程及自己的閱讀經(jīng)歷和背誦寫作經(jīng)歷,已經(jīng)掌握了大量的英語詞塊。
為了探究中國英語專業(yè)碩士研究生與英語本族語學(xué)者在學(xué)術(shù)論文寫作時,對四詞詞塊使用的差異顯著度,本研究使用檢驗頻數(shù)差異的Chi-Square Calculator(卡方檢驗),對兩個語料庫中共有的15個四詞詞塊進行了頻數(shù)差異計算,結(jié)果見表3。
表3 CEPTC語料庫(Corpus1)和ENJAC(Corpus2)語料庫中高頻四詞詞塊卡方檢驗結(jié)果
注:“+”代表“過度使用”,“-”代表“使用不足”;*=significant at P<0.05,**=significant at P<0.01,***=significant at P<0.001)。
由表3可知,這15個四詞詞塊在顯著度方面可分為有顯著差異的過度使用詞塊、有顯著差異的使用不足詞塊、無顯著差異的過度使用詞塊以及無顯著差異的使用不足詞塊四種:
(1)無顯著差異的過度使用詞塊。
on the basis of(P=0.237>0.05)
as well as the (P=0.327>0.05)
at the end of(P=0.279>0.05)
in terms of the(P=0.094>0.05)
can be used to(P=0.360>0.05)
in the form of(P=0.111>0.05)
the end of the(P=0.991>0.05)
(2)有顯著差異的過度使用詞塊。
on the other hand(P=0<0.001)
at the same time(P= 0.013<0.05)
on the one hand(P=0.002<0.01)
the results of the(P=0.007<0.01)
in the present study(P=0.038<0.05)
(3)無顯著差異的使用不足詞塊。
at the beginning of(P=0.869>0.05)
(4)有顯著差異的使用不足詞塊。
the nature of the(P=0.020<0.05)
in the context of(P=0.002<0.01)
通過對比英語本族語期刊論文語料庫,中國英語專業(yè)碩士研究生學(xué)術(shù)論文語料庫中有12個詞塊屬于過度使用詞塊,3個詞塊屬于使用不足詞塊。在過度使用的詞塊中有5個詞塊屬于有顯著差異的過度使用詞塊,在使用不足的詞塊中有2個詞塊屬于有顯著差異的使用不足詞塊。這些共有詞塊的使用情況說明,中國英語專業(yè)碩士研究生在學(xué)術(shù)論文中對詞塊有過度使用的傾向。造成這一現(xiàn)象的原因可能是英語專業(yè)研究生由于熟知在學(xué)術(shù)論文中大量地使用詞塊可以使自己的論文更完美,所以在論文寫作中英語專業(yè)研究生會大量且刻意地使用詞塊;另一個原因可能是他們經(jīng)過多年的專業(yè)英語學(xué)習(xí),已經(jīng)掌握了大量的詞塊。
本研究根據(jù)Biber等人提出的詞塊結(jié)構(gòu)分類標準,[1]將本研究中的目標高頻四詞詞塊分為:動詞短語的詞塊、包含從句的詞塊、包含名詞的詞塊和介詞短語的詞塊(見表4)。
表4 CEPTC語料庫和 ENJAC語料庫詞塊結(jié)構(gòu)分類對比
從表4可以看出,兩庫四詞名詞結(jié)構(gòu)和介詞結(jié)構(gòu)比例都比較高,這也證明了Biber和Hyland的觀點:學(xué)術(shù)論文大多由含有介詞或者名詞短語的詞塊構(gòu)成。名詞短語承擔(dān)著話題引導(dǎo)和內(nèi)容陳述的作用。根據(jù)Biber等基于大型語料庫檢索的研究:名詞詞塊是學(xué)術(shù)寫作的基石,代表了學(xué)術(shù)筆語文體的特征;介詞短語則體現(xiàn)了結(jié)構(gòu)組織和信息重組從而使文章系統(tǒng)性更強。[1,3]但是相比于本族語專家,英語專業(yè)研究生對介詞結(jié)構(gòu)詞塊的使用不足;而就名詞結(jié)構(gòu)四詞詞塊的使用情況而言,英語專業(yè)研究生對名詞詞塊的使用比例與國際語言學(xué)學(xué)者對名詞結(jié)構(gòu)詞塊使用比例都為27%。
it作形式主語的詞塊和被動結(jié)構(gòu)詞塊能夠突顯學(xué)術(shù)論文描述的客觀性。從表1和表4可以看到,英語專業(yè)研究生運用多樣的it作形式主語結(jié)構(gòu)詞塊,如使用it is obvious/necessary/difficult/likely/that/to;研究生學(xué)習(xí)者也使用多樣豐富的被動結(jié)構(gòu)詞塊如can be concluded that, can be seen that,be based on that。
從表1中看到we can see that這一四詞詞塊頻率高達60次,位列高頻詞塊第五位。但是本族語語料庫詞塊卻沒有第一人稱主觀性結(jié)構(gòu)詞塊,使用的是author is not aware等第三人稱的四詞詞塊。
綜上分析,中國英語專業(yè)研究生對名詞詞塊、it作形式主語的詞塊和被動結(jié)構(gòu)詞塊使用情況說明,英語專業(yè)研究生在英語寫作表達中已基本把握了學(xué)術(shù)文體的特點。但是從介詞詞塊使用不足情況來看,英語專業(yè)研究生在學(xué)術(shù)論文寫作時的結(jié)構(gòu)組織和信息重組能力等一些加強論文系統(tǒng)性的能力還相對不足,從第一人稱主觀性結(jié)構(gòu)的誤用情況來看,在學(xué)術(shù)論文寫作時仍然還有口語化的特點。
(1)我國英語專業(yè)研究生使用高頻四詞詞塊總量超過語言學(xué)國際學(xué)者。(2)在共同使用的詞塊中,英語專業(yè)研究生有使用過度的傾向。(3)在結(jié)構(gòu)上,對包含介詞短語的詞塊使用不足,it作形式主語的詞塊和被動結(jié)構(gòu)詞塊豐富,但多屬誤用第一人稱的主觀性結(jié)構(gòu)詞塊。
通過分析本研究的研究結(jié)果,可以得到以下啟示:第一,本研究通過對比中國學(xué)習(xí)者語料庫與英語本族語語料庫,發(fā)現(xiàn)了中國英語專業(yè)碩士研究生在英語論文寫作中對四詞詞塊的使用與本族語作者有很大差距,這些發(fā)現(xiàn)為英語專業(yè)碩士研究生學(xué)術(shù)寫作研究提供了實證依據(jù)。第二,在中國英語專業(yè)碩士研究生學(xué)術(shù)論文寫作教學(xué)中,提高他們學(xué)術(shù)論文寫作水平的重要標準是使用詞塊的數(shù)量以及質(zhì)量。通過分析本研究的研究結(jié)果,發(fā)現(xiàn)目前要解決的不是中國英語專業(yè)碩士研究生在學(xué)術(shù)論文寫作中使用高頻詞塊的數(shù)量問題,而是質(zhì)量問題,即英語專業(yè)碩士研究生在英語學(xué)術(shù)論文寫作中如何恰當?shù)厥褂迷~塊的問題。要解決這一問題,英語專業(yè)碩士研究生可以查看國際語言學(xué)英文期刊論文并關(guān)注其中所使用的學(xué)術(shù)詞塊特征。教師們可以搜集英語專業(yè)碩士研究生論文和英語本族語作者所寫論文,用所搜集到的語料自建兩個語料庫,并指導(dǎo)讓學(xué)生對兩個語料庫中的四詞詞塊進行對比,從而歸納出哪些是碩士研究生經(jīng)常誤用或使用不當?shù)脑~塊,哪些是不符合英語學(xué)術(shù)論文寫作要求的詞塊。通過大量的比較閱讀、記憶和運用,加強中國英語專業(yè)碩士研究生對學(xué)術(shù)論文中所用詞塊的熟練掌握,進而提高他們的英語學(xué)術(shù)論文寫作水平。
本研究還存在一些不足的地方。比如,本研究主要采用的定量分析方法,缺乏一定的定性分析。今后可以針對中國英語專業(yè)碩士研究生學(xué)術(shù)論文中四詞詞塊的使用情況進行更多的定性分析。
黑龍江生態(tài)工程職業(yè)學(xué)院學(xué)報2020年1期