李高新
[摘要]本文首先回顧國內(nèi)外二語寫作(主要為英語)語言復雜度研究狀況,隨后描述本語料庫設計、創(chuàng)建和語言標注;接著,利用語料庫和統(tǒng)計方法,分析本項研究的兩個具體問題,結果發(fā)現(xiàn)國內(nèi)英語學習者和英語本族者在作文產(chǎn)出單位長度、從屬成分數(shù)量、并列成分數(shù)量和短語精密度四個維度上具有統(tǒng)計顯著性差異,同英語本族者相比,國內(nèi)英語專業(yè)學習者更傾向使用較短小句、語句和T單位,從屬成分使用數(shù)量較少,復雜名詞性成分所占比例較小;最后,基于上述研究,指出對國內(nèi)英語學習者進行寫作教學時英語制定差異化的教學目標與內(nèi)容,采取不同教學策略和方法,以提高學生英語寫作語言句法復雜度,進而提高其英語寫作水平。
[關鍵詞]英語寫作;語料庫;語言復雜度;句法復雜度
[中圖分類號]G642
[文獻標識碼]A
[文章編號]1671-5918(2019)07-0163-03
doi:10.3969/j.issn.1671-5918.2019.07.069
[本刊網(wǎng)址]http://www.hbxb.net
一、引言
二語寫作復雜度主要用于衡量二語學習者的書面語言輸出能力,反映二語學習者對所學語言詞匯和句法結構的駕馭和掌握能力。國內(nèi)對二語寫作的研究主要集中在英語上,本文將從詞匯復雜度和語句復雜度兩個方面梳理國內(nèi)外二語寫作研究現(xiàn)狀和趨勢。
(一)句法復雜度研究
國外二語寫作句法復雜度研究始于20的研究主要集中在如下三個方面句法復雜度定義、維度及各維度測量指標的研究;句法復雜度與語言水平、寫作質量之間的關系,句法復雜度的發(fā)展過程;學習者背景、寫作任務、寫作環(huán)境等相關因素對二語寫作句法復雜度的影響。
(二)國內(nèi)二語寫作句法復雜度研究
國內(nèi)對二語寫作的研究主要集中在英語寫作,有關二語寫作句法復雜度的文獻研究主要集中在如下三個方面句法復雜度的測量指標;句法復雜度同學習者語言水平之間的相關性;寫作任務對句法復雜度的影響。
二、研究設計
(一)研究目的
本項研究目的在于比較國內(nèi)英語學習者和英語本族者在句法復雜度上的差異,探討其背后成因,為改進英語寫作教學提供參考。
(二)研究數(shù)據(jù)
本項研究通過冰果寫作系統(tǒng)和批改網(wǎng)收集了全校大一至大四共四個年級400篇英語作文,創(chuàng)建“吉首大學英語寫作語料庫”,英語專業(yè)和非英語專業(yè)(按照期末考試成績分為初級水平和高級水平兩組)的各個年級的英語作文都有體現(xiàn),語料庫中每一篇作文都采取標注,文頭部分標注包括寫作體裁、作文主題、年級和所學專業(yè)。
(三)研究工具
本文采用基于Python的NLTK工具包和“I12句法復雜度分析器”來完成;首先把寫作文本整理為純文本格式,然后使用“I2句法復雜度分析器”,生成14個句法復雜度測量指標,本文使用其中10個測量指標。
(四)研究問題
本項研究試圖比較國內(nèi)英語學習者和英語本族者在寫作句法復雜度上是否存在顯著性差異以及差異程度。句法復雜度主要包括如下四個維度:產(chǎn)出長度,從屬成分數(shù)量,并列成分數(shù)量,以及短語精密度。具體來說,本文試圖回答如下兩個研究問題:
1.國內(nèi)英語學習者和英語本族者在句法復雜度上是否存在顯著性差異?如果存在,差異體現(xiàn)在那些方面,差異程度為多少?
2.在句法復雜度方面,具有較高水平的國內(nèi)非英語專業(yè)學習者寫作是否比低水平的非英語專業(yè)學習者寫作更接近英語本族者?
三、分析與討論
為保證英語本族者和國內(nèi)英語學習者兩組的同質性,分別從BAWE語料庫中隨機抽樣本族者和自建語料庫中抽取國內(nèi)英語學習者的英語作文各50篇。
(一)英語本族者和國內(nèi)英語學習者在句法復雜度上的差異
國內(nèi)英語學習者和英語本族者句法復雜度測量指標平均值具體細節(jié)如下:
1.國內(nèi)初級英語學習者產(chǎn)出單位長度的三個指標小句平均長度、語句平均長度和T單位平均長度分別為9.14、15.26和13.70,反映從屬成分數(shù)量的小句從句數(shù)和T單位從句數(shù)平均數(shù)量分別為0.46和0.64,反映并列成分數(shù)量的小句并列短語、T單位并列短語和語句T單位平均值分別為0.39、0.38和1.12,反映短語精密度的小句復雜名詞成分和T單位復雜名詞成分分別為1.103和1.682。
2.國內(nèi)高級英語學習者產(chǎn)出單位長度的三個指標小句平均長度、語句平均長度和T單位平均長度分別為9.57.16.68和14.89,反映從屬成分數(shù)量的小句從句數(shù)和T單位從句數(shù)平均數(shù)量分別為0.47和0.78,反映并列成分數(shù)量的小句并列短語、T單位并列短語和語句T單位平均值分別為0.25、0.46和1.35,反映短語精密度的小句復雜名詞成分和T單位復雜名詞成分分別為1.101和1.752。
3.國內(nèi)英語學習者平均產(chǎn)出單位長度的三個指標小句平均長度、語句平均長度和T單位平均長度分別為9.352.15.974和14.296,反映從屬成分數(shù)量的小句從句數(shù)和T單位從句數(shù)平均數(shù)量分別為0.466和0.710,反映并列成分數(shù)量的小句并列短語、T單位并列短語和語句T單位平均值分別為0.321、0.420和1.237,反映短語精密度的小句復雜名詞成分和T單位復雜名詞成分分別為1.101和1.752。
4.英語本族者平均產(chǎn)出單位長度的三個指標小句平均長度、語句平均長度和T單位平均長度分別為9.982、19.873和17.183,反映從屬成分數(shù)量的小句從句數(shù)和T單位從句數(shù)平均數(shù)量分別為0.558和0.747,反映并列成分數(shù)量的小句并列短語、T單位并列短語和語句T單位平均值分別為0.398、0.4978和1.443,反映短語精密度的小句復雜名詞成分和T單位復雜名詞成分分別為1.325和2.178。
研究問題1旨在調查國內(nèi)英語學習者和英語本族者在句法復雜度上是否存在顯著性差異;如果存在,差異體現(xiàn)在那些方面。從表格1中可以看出,就句法復雜度10個測量指標中有9個指標(除T/S外)而言,國內(nèi)英語學習者均值均低于英語本族者。
使用獨立樣本t檢驗,檢測國內(nèi)英語學習者和英語本族者組的復雜度均值是否具有顯著性差異??紤]到本項研究調查10個復雜度指標,因此需要對同一數(shù)據(jù)集進行多重檢驗,采用Bonferroni校正法避免出現(xiàn)假陽性,提高檢測準確率。結果顯示,在國內(nèi)英語學習者組和英語本族者組中,10個測量指標中有8個指標(除CP/C和T/S外)具有統(tǒng)計顯著性(p值小于0.005)。
研究結果表明,國內(nèi)英語學習者和英語本族者寫作在句法復雜度的產(chǎn)出單位長度、從屬成分數(shù)量、并列成分數(shù)量和短語精密度等4個維度方面均存在顯著性差異。就產(chǎn)出單位長度而言,國內(nèi)英語學習者的小句、語句和T單位平均長度都顯著短于英語本族者。在從屬成分數(shù)量方面(DC/C和DC/T測量指標),研究結果表明,國內(nèi)英語學習者所使用從句數(shù)量顯著小于英語本族者。在并列成分數(shù)量方面,研究結果表明,國內(nèi)英語學習者僅僅在短語并列成分數(shù)量(測量指標CP/T)上不同于英語本族者,但是在句子并列成分數(shù)量(測量指標T/S)上沒有區(qū)別。本項研究還表明,國內(nèi)英語學習者復雜名詞成分顯著小于英語本族者。
(二)具有較高水平的國內(nèi)英語專業(yè)學習者寫作是否比低水平非英語專業(yè)學習者寫作更接近英語本族者
在已確定國內(nèi)英語學習者和英語本族者在句法復雜度上具有統(tǒng)計顯著性的基礎之上,需要進一步調查具有較高水平的英語專業(yè)學習者寫作是否比低水平的非英語專業(yè)學習者寫作更接近英語本族者。表格1顯示,除CP/C和T/S測量指標外,句法復雜度其10個指標均值在如下三組中呈正線性關系:初級水平非英語專業(yè)學習者、高級水平英語專業(yè)學習者、英語本族者。
1.產(chǎn)出單位長度。結果表明產(chǎn)出單位長度的3個指標平均值存在顯著差異,高級水平英語專業(yè)學習者和英語本族者組之間在MLC、MILS和MLT存在差異,初級水平非英語專業(yè)學習者和英語本族者組在上述三個指標之間也存在差異。初級水平非英語專業(yè)學習者和高級水平英語專業(yè)學習者之間,MLS和和MLT均值出現(xiàn)顯著性提高。不過,盡管MLC指標均值在初級水平非英語專業(yè)學習者和高級水平英語專業(yè)學習者之間也.有提高,但是提高并不具有統(tǒng)計顯著性。這些結果表明,就作文中語句和T單位平均長度而言,英語水平較高的非英語專業(yè)學習者要比英語水平不是太高的學生更顯著接近英語本族者。
國內(nèi)初級水平和高級水平英語學習者同英語本族者在產(chǎn)出單位長度上具有顯著性差異,反映英語寫作水平高的學習者能夠寫出較長的T單位、小句和語句。這對國內(nèi)英語寫作教學具,有非常重要的啟示:平時寫作教學中通過“寫長法”激發(fā)學生寫作興趣,鼓勵學生積極寫作,增加句子長度,提高產(chǎn)出單位長度;此外,本項研究也間接證明“寫長法”對英語寫作教學的重要作用。
2.從屬成分數(shù)量。結果表明反映從屬成分數(shù)量的2個指標平均值存在顯著差異,高級水平英語專業(yè)學習者和英語本族者組之間在DC/C和DC/T存在差異,初級水平非英語專業(yè)學習者和英語本族者組在上述2個指標之間也存在差異。盡管高級水平英語專業(yè)學習者比初級水平非英語專業(yè)學習者使用更多的從屬成分,但是這次提高在從屬成分數(shù)量的2個指標上并不具有統(tǒng)計顯著性。結果表明,同語言水平不是太高的學生相比,語言運用水平比較高的英語專業(yè)學習者在寫作中并沒有顯著使用更多的從屬成分。但是,結果表明隨著非英語專業(yè)學習者英語水平能力提高,他們似乎在小句層級上并沒有使用太多句法復雜度。
初級和高級水平的英語學習者在從屬成分數(shù)量維度上明顯不同于英語本族者,表明無論是初級水平非英語專業(yè)學習者還是高級水平的英語專業(yè)學習者都存在句式單調、句子類型缺乏變化等問題,這就要求英語寫作教學應多注重鼓勵學生采用各種句法結構,運用各種句式轉換,強化學習者句法從屬性意識,提高寫作質量和信息含量。
3.并列成分數(shù)量。就從屬成分數(shù)量而言,除高級水平英語專業(yè)學習者和英語本族者組外,初級水平非英語專業(yè)學習者和英語本族者組在CP/T指標均值也存在顯著差異;但是,初級水平非英語專業(yè)學習者和高級水平英語專業(yè)學習者之間并沒有這種顯著關系。上述三個組在CP/S和T/S指標均值方面并沒有發(fā)現(xiàn)顯著差異。
這些結果表明,相比英語本族者,國內(nèi)英語學習者在每T單位中顯著少使用并列短語,但是在每小句中并列短語或者每語句中T單位數(shù)量方面并非如此。進一步來講,初級水平和高級水平英語學習者在寫作中并列成分數(shù)量方面并沒有顯著差異。
4.短語精密度。最后,結果表明除高級水平英語專業(yè)學習者和英語本族者組外,初級水平非英語專業(yè)學習者和英語本族者組在反映短語精密度的兩個指標均值存在顯著差異。CN/T指標表明初級水平非英語專業(yè)學習者和高級水平英語專業(yè)學習者之間存在顯著差異,表明同初級水平的非英語專業(yè)學習者相比,高級水平英語專業(yè)學習者在每T單位上使用更多的復雜名詞性成分,因此在這一方面更接近英語本族者。CN/C指標均值在初級水平和高級水平英語學習者之間也有提高,但是提高并不具有統(tǒng)計顯著性。
高級水平的英語專業(yè)學習者和英語本族者在短語精密度這一維度上顯著不同于初級水平非英語專業(yè)學習者,表明寫作水平較高的同學能夠比較好地運用濃縮更多信息的短語,提高語句信息含量。短語復雜度是反映高水平寫作者能力的一個重要指標,因此應培養(yǎng)初級水平學習者對短語的熟練運用,減少英語寫作中的“口語化”特征,使其更加趨向“書面化”。
四、結語
本項研究采取基于語料庫的研究設計,研究結果發(fā)現(xiàn)國內(nèi)英語學習者和英語本族者在產(chǎn)出單位長度、從屬成分數(shù)量、并列成分數(shù)量和短語精密度的句法復雜度等四個維度上具有統(tǒng)計顯著性差異;同英語本族者相比,國內(nèi)英語學習者更傾向使用較短小句.語句和T單位,從屬成分使用數(shù)量較少,復雜名詞性成分所占比例較小;此外,每T單位中,并列成分使用數(shù)量也比較少;國內(nèi)英語學習者和英語本族者兩組之間在語句并列方面并不存在顯著差異,表明國內(nèi)英語學習者多數(shù)已掌握此種結構。
本項研究具有非常如下啟示:首先,英語寫作教師應考慮對非英語專業(yè)和英語專業(yè)兩組學習者制定差異化的教學目標與內(nèi)容,注意寫作語篇產(chǎn)出單位長度、句法難度等因素;其次,英語寫作教師應針對不同類型的寫作者給予足夠的寫作訓練機會,應強調從屬修飾成分、短語精密度等句式多樣化,采取不同教學策略和方法,提高其寫作句法復雜度,進而提高其英語寫作水平;最后,本項研究發(fā)現(xiàn)產(chǎn)出單位長度、從屬成分數(shù)量和短語精密度三個維度可較好預測英語學習者寫作水平,對計算機輔助寫作評分具有重要的參考價值。
受限于研究時間和采集樣本,建議未來進一步研究可在本研究基礎上進一步擴大樣本量并擴展至詞匯復雜度層面,全面描述國內(nèi)英語寫作語言復雜度的特征,為國內(nèi)英語寫作教學與研究提供更多參考。
參考文獻:
[1] Norris,J. M.,and L. Ortega. Towards an Organie Approach to Investigating CAF in Instructed SLA: The Case of Complexity[J]. Applied Linguistics,2009,30(4) :555,78.
[2] Lu,Xiaofei. A Corpus - Based Evaluation of Syntactic Complexity Measures as Indices of College - Level ESL WritersLanguageDevelopment [J]. TESOL Quarterly,2011,(45) 1:36 -62.
[3] Biber,Douglas. Should We Use Characteristics of Conversation to Measure Grammatical Complexity in L2 Writing Development?[J].TESOL Quarterly,2011,45(1):5 -35.
[4] Taguchi,Naoko. W hat Linguistic Features Are Indicative of Writing Quality? A Case of Argumentative Essays in a College Composition Program [J]. TESOL Quarterly,2013,47(2) : 420 - 430.
[5] Crossley,Scott A. ,and Danielle S. McNamara. Does writing development equal writing quality? A computational investigation ofsyntactie complexity in I2 learners [J]. Jourmal of Second Language Writing,2014(26): 66 -79.
[6] Ellis,R.,and F. Yuan. The Effects of Planning on Fluency,Complexity,and Accuracy in Second Language Narrative Writing [J]. Studies in Second Language Acquisition,2004(26) : 59 -84.
[7]Ortega,L. Syntactic Complexity Measures and their Relationship to I2 Proficiency: A Research Synthesis of College - level I2Writing [J].. Applied Linguistics,2003 (24)4: 492 -518.
[8]陳慧媛.英語寫作表現(xiàn)測量指標的類別及特性研究[J].現(xiàn)代外語,2010(1):72-80,110.
[9]陸小飛,許琪.二語句法復雜度分析器及其在二語寫作研究中的應用[J].外語教學與研究,2016(3):409-480.
[10]王靜萍.資源指引型的任務復雜度對二語寫作語言表現(xiàn)的影響[J]. 外語教學,2013(4):65-68,104.
[11]徐曉燕.中國英語專業(yè)學生英語議論文句法復雜性研究[J].外語教學與研究,2013,45(2):264-275,320.
[12]劉兵,王奕凱.非英語專業(yè)研究生英文寫作中形容詞使用特征研究 [J]. 中國外語,2015:45-53.
[13]王初明.外語寫長法[J].中國外語,2005(1):45-49.
[14]鮑貴.二語學習者作文詞匯豐富性發(fā)展多緯度研究[J].外語電化教學,2008:38-44.