陳為捷 林韻蔚
英語寫作是體現(xiàn)英語掌握能力的重要項(xiàng)目,并且在各種升學(xué)考試中,英語寫作都是必不可少的,但是學(xué)生對英語寫作充滿困惑,而教師對英語寫作的指導(dǎo)又不能滿足英語學(xué)習(xí)者對英語寫作的需求。隨著計(jì)算機(jī)輔助教學(xué)技術(shù)的發(fā)展,寫作自動評價(jià)系統(tǒng)出現(xiàn)并在教學(xué)中投入使用,系統(tǒng)的效度為學(xué)界所認(rèn)可。通過對系統(tǒng)使用的調(diào)查研究發(fā)現(xiàn),系統(tǒng)使用者的態(tài)度以及使用方法都會影響它的效果,但是系統(tǒng)對英語寫作的輔助作用被證實(shí)是確實(shí)有效的。但是迄今為止卻鮮有人去調(diào)查根據(jù)系統(tǒng)反饋進(jìn)行的修改中哪些語言特征對習(xí)作分?jǐn)?shù)的提升有積極的預(yù)測作用。因此本研究想探尋在自動評價(jià)系統(tǒng)的幫助下,那些寫作成績獲得顯著提高的學(xué)習(xí)者,在作文修改方面存在哪些共性特征?旨在為英語寫作教學(xué)提供指導(dǎo)依據(jù)。
1. 多維分析方法
Biber的多維分析法:Biber(1988)從LLC(LondonLund Corpus)英語口語語料庫和LOB(Lancaster-Oslo-Bergen)英語書面語語料庫中選取了覆蓋23種口筆語語體的文本。根據(jù)以往的研究,Biber總結(jié)出67個(gè)常用于分析語體變異的語言特征,它們包括過去時(shí)態(tài)、完成時(shí)態(tài)、現(xiàn)在時(shí)態(tài)、地點(diǎn)狀語、時(shí)間狀語等(具體67個(gè)語言特征見附錄)。Biber對文本中的 67種語言特征進(jìn)行了調(diào)查:他提取了每個(gè)文本的所有語言特征頻率,通過對頻率值的因子分析發(fā)現(xiàn)語言特征的共現(xiàn)情況,總結(jié)出描述語體特征的7個(gè)因子或7個(gè)功能性維度。它們包括維度1“交互性與信息性表達(dá)”(involved versus informational production)、維度2“敘事性與非敘事性描述”(narrative versus non-narrative concerns)等。每一維度由因子負(fù)荷為正、負(fù)值的兩組“共現(xiàn)”性語言特征組成。這兩組語言特征在一個(gè)維向上呈互補(bǔ)分布,表達(dá)相反的交際功能。比如說,第一維度上呈互補(bǔ)關(guān)系的是交互性功能和信息性功能。交互性功能由負(fù)荷值為正值的語言特征來體現(xiàn),包括第一二人稱代詞、特殊疑問句、動詞的現(xiàn)在時(shí)態(tài)以及私人性動詞 (private verbs) 、強(qiáng)調(diào)式詞語 (emphatics) 等,而信息性功能由因子負(fù)荷為負(fù)值的語言特征來體現(xiàn),包括名詞、介詞、詞長 (這里指復(fù)雜的詞匯) 、類符與形符比 (type-token ratio,即語篇中的詞匯密度) 等。所謂互補(bǔ)分布是說當(dāng)帶有負(fù)負(fù)荷值的語言特征頻繁出現(xiàn)在一個(gè)語篇中,那帶有正負(fù)荷值的語言特征就會出現(xiàn)的較少。 Biber(1989)在其多維分析框架的基礎(chǔ)上,通過5個(gè)維度上詞匯和句法特征的共現(xiàn)規(guī)律將481篇文本聚類為8種不同文本類型,包括親密人際互動型(intimate interpersonal interaction)、信息互動型(informational interaction)等。在多維分析出現(xiàn)之前,以往的語體對比研究大多集中于分析語篇在某一參數(shù)上的差異 (如正式性與非正式性) ,難以充分揭示語體間的差異。多維分析這種基于統(tǒng)計(jì)分析的研究方法顯然大大提高了分析的客觀性和準(zhǔn)確性。
2. 研究設(shè)計(jì)
2.1 研究問題
本文擬回答以下研究問題:
2.1.1分?jǐn)?shù)得到顯著提升的習(xí)作的初稿和定稿分別具有何種語體特征和具體語言特征?
2.1.2初稿和定稿在語體特征和具體語言特征上有何差異?
2.2 研究語料
下載某次批改網(wǎng)舉辦的“百萬同題”寫作活動中某學(xué)校參與的1448位學(xué)生的初稿和終稿共2896份習(xí)作,篩選出終稿與初稿相比提分達(dá)到10分以上的習(xí)作,得到81位同學(xué)的初稿和終稿,共162份習(xí)作,建立起一個(gè)小型語料庫。
2.3 研究工具
Biber的多維分析嚴(yán)重依賴統(tǒng)計(jì)技術(shù), 給研究者帶來了巨大的技術(shù)困擾。 Nini (2015)根據(jù)Biber的研究框架設(shè)計(jì)了一個(gè)多維標(biāo)注與分析工具M(jìn)AT 1.3(Multidimensional Analysis Tagger 1.3)。通過實(shí)驗(yàn)對比發(fā)現(xiàn)用MAT按照 Biber1984年的分析流程處理文本后的結(jié)果與Biber的研究結(jié)果相符。實(shí)驗(yàn)證明MAT可以復(fù)制Biber的多維分析方法。江進(jìn)林、許家金進(jìn)一步認(rèn)定了MAT多維語體分析的信度與效度。
MAT的使用使一系列繁瑣的工作得以自動化完成,例如文本標(biāo)注、特征提取和數(shù)據(jù)分析。 軟件處理完文本就能生成每篇文章中每種語言特征的頻數(shù)、每篇文章的維度值,在每個(gè)維度里參照其他8種文本類型,報(bào)告被研究文本最接近的文本類型等。
3. 結(jié)果與討論
3.1 總體維度差異
3.1.1 體裁與文本類型
從MAT的報(bào)告的數(shù)據(jù)總體來看,提分10分以上的習(xí)作的初稿和定稿的文本類型相同,都是屬于交互勸說型(involved persuasion)。初稿和定稿在單一維度之間的體裁類型只在維度六有變化——初稿在維度六“即席信息組織精細(xì)度(online information elaboration)”表現(xiàn)出來的體裁類型為廣播稿(broadcasts),而定稿在維度六的體裁類型為官方文件(official documents),表明定稿的即席信息組織精細(xì)度略高于初稿,語篇組織緊湊度有所提升。
3.1.2 六個(gè)維度值差異
圖1直觀地顯示初稿和定稿在維度5上的維度值有明顯的差異,定稿的維度值明顯高于初稿。維度5為“信息抽象與具體程度”(abstract versus non-abstract information)。維度值越高表明文章越抽象、越正式。可見,學(xué)生作文內(nèi)容抽象程度與其作文成績成正相關(guān)。
3.2 語言特征分析
從表2可以看出,將提分10分以上習(xí)作的初稿的語言特征和定稿的語言特征進(jìn)行配對T檢驗(yàn)后得出有顯著差異的語言特征有8個(gè),其中維度值升高的有名詞化名詞、聯(lián)合短語、表語形容詞和類形符比,維度值下降的有除名詞化的名詞外的其他名詞、第二人稱代詞、過去時(shí)和現(xiàn)在完成時(shí)。
Biber和馬克沃斯和Baker(1974)發(fā)現(xiàn),現(xiàn)在完成時(shí)經(jīng)常與過去時(shí)同時(shí)出現(xiàn),作為敘事的標(biāo)志。語料庫中的習(xí)作文體是議論文,因此在定稿中,作為敘事文體標(biāo)志的現(xiàn)在完成時(shí)和過去時(shí)的減少符合議論文文體的特點(diǎn),為習(xí)作成績的提高做出了貢獻(xiàn)。Chafe(1985)指出,第二人稱代詞需要一個(gè)特定的接收信息人,并表示與該接收人的高度參與。這體現(xiàn)了文章中的高度互動。該語料庫中定稿的第二人稱代詞使用頻率的下降,正體現(xiàn)了論說類文章不需要那么強(qiáng)的互動性。第二人稱代詞使用的減少促使了習(xí)作成績的提升。Chafe(1982,1985)和Danielewicz(1986)指出名詞化的名詞合能擴(kuò)展思想的容量,并將信息整合到更少的單詞中。名詞化的名詞使用頻率的提升表現(xiàn)了相比于初稿,定稿信息的復(fù)雜度有所提升,這也促使習(xí)作成績得到提升。由于名詞化的名詞使用頻率的增加,比如導(dǎo)致其他名詞使用量的減少,這與檢驗(yàn)結(jié)果一致。類形符比的提高和聯(lián)合短語的使用頻率提升都體現(xiàn)了定稿信息密度的提高。表語形容詞使用頻率的增加體現(xiàn)了定稿中對某行為或某事件的評價(jià),符合論說類文章中又論又評的需求,因而也促使了習(xí)作成績的提升。
通過多維分析模型,我們發(fā)現(xiàn)分?jǐn)?shù)提分10分以上的定稿與初稿相比,在維度5與維度6上有差異。相比初稿,該論說文的定稿表現(xiàn)出信息更密集、更抽象的特點(diǎn),這是由語言特征使用頻率的增減實(shí)現(xiàn)的。本研究給寫作教學(xué)的啟示是,引導(dǎo)學(xué)生形成語域意識,采用適合寫作文體的語言特征。