江西 劉 洋
基于RANGE工具對文學作品的語料分析——以《飄》為例
江西劉洋
本研究從RANGE工具的基本原理和使用方法出發(fā),利用RANGE軟件分析經典作品《飄》,從語料庫的角度對這部優(yōu)秀的經典文學作品的語料進行詞匯和文體分析,在分析這部經典作品的詞匯和文體的特征的同時,更從實踐中對具體的文學作品語料進行難易程度的估評,促進對這部經典作品的理解。
RANGE詞匯分析《飄》
瑪格麗特·米歇爾于1936發(fā)表了長篇小說《飄》(Gone With the Wind),小說以美國南北戰(zhàn)爭為背景,主線是女主人斯佳麗的愛恨情仇。《飄》既是一首人類愛情的絕唱,又是一幅反映社會政治、經濟、道德諸多方面巨大而深刻變化的歷史畫卷。作品一經出版就取得了巨大的轟動,受到世人的矚目。小說作家瑪格麗特·米歇爾也因這部作品名聲四揚。而學者們對這部作品的研究非常之多。其研究涉及到對作品《飄》的女性價值觀,女性生態(tài)主義等文學理論研究。而本文將從語料庫語言學視角對這部經典的文學作品的詞匯和文體進行分析和解構。
RANGE是由新西蘭維多利亞大學語言學及應用語言學的Paul Nation和Averil Coxhead共同研發(fā)的計算機語言分析軟件。它能夠迅速地幫助我們科學地判斷某文本語料情況。它是基于詞頻為基礎設計出的詞匯統(tǒng)計軟件程序。RANGE為詞匯的自動評估提供了一個有效的手段。RANGE在分析文本語料過程中的具體作用主要表現(xiàn)在四個方面:第一,分析比較不同文本的詞匯量大小、措辭的異同和詞匯的過度使用傾向。第二,能分析出閱讀該文本所需的總詞匯量;第三,該學習者對該文本中的詞匯量有多少是熟悉的,多少是陌生的;第四,通過對詞匯的量化對比分析,可以文本語料庫的詞匯重復性和某類動詞使用的特點從而對文本進行文體分析。
RANGE軟件自身含有三個基礎詞表,將要研究的語料文本中的詞匯與自身的參照詞表進行對照比較,詞表一包含約1000個最常用的詞族;詞表二包含約1000個次常用詞族;詞表三不僅包括了詞表一和詞表二的詞族,還包含了高中的和大學各科教材中最常用的學術詞匯,共計570個詞族。一個詞族包含主詞及其派生和屈折形式。RANGE軟件在處理輸入的純文本時就會自動以這3個詞頻表為參照,輸出研究文本的詞頻相關信息以供學習和研究之用。
首先將《飄》轉化成純文本文件。運行軟件RANGR,點擊菜單中的文件,打開《飄》文件的純文本信息,運行之后馬上可以RANGE對《飄》這部作品給出的一個分析內容。
表1 《飄》作品中語料詞匯統(tǒng)計表
根據(jù)表1數(shù)據(jù)可以發(fā)現(xiàn),第二個單詞TOKENS(形符),反映的是語料中詞數(shù),反應整部作品中有431756個詞,第一級形符343377,占了79.53%;第二級形符25477,占了5.9%;第一級形符13684,占了3.17%;其中3238個詞屬于,占全文的18.84%屬于基礎詞表1;2376個詞屬于基礎詞表2,;1764個詞屬于基礎詞表3,另有9806個詞在3個詞表之外。這596個詞匯共出現(xiàn)了1609次。第三個單詞TYPES(類符),它反映語料中的用詞數(shù)
剔除重復計算的詞數(shù),如全文用詞是17184個,也就是掌握了這些,整篇文章就沒有一個生詞。第四個單詞是詞簇,第五行的not是not in the list的省略,統(tǒng)計上面三個詞表外的詞數(shù),
一定程度上可反映詞匯的難度。最后一行Total為各列數(shù)據(jù)的總數(shù)。
此外,通過RANGE的截詞詞表( Stop List)功能觀察詞匯的復現(xiàn)。發(fā)現(xiàn)排名在前面的靠前的有SCARLETT、EYES、FIGHT、FACE、KNEW、MONEY、MAKE、ASHLEY 等,這些高頻出現(xiàn)的實意詞,說明《飄》這部作品著力塑造了斯嘉麗的人物形象,SCARLETT是整部作品出現(xiàn)頻率最高詞匯。同時,F(xiàn)IGHT的高頻使用,說明了作品的戰(zhàn)爭背景。EYES、FACE、MONEY的高頻使用,說明作品在真實地塑造人物所生活的環(huán)境。從這些詞匯中我們可知,《飄》還是一部現(xiàn)實主義文學力作。
全文通過使用語料庫語言處理工具RANGE對外文經典文學作品《飄》進行研究,主要是對作品得最常用詞匯,而次常用詞匯,學術詞匯以及其它詞匯的對比研究發(fā)現(xiàn),這些詞匯中占主導地位的是常用詞匯,這為讀者閱讀外文經典作品掃除了心里障礙。此外對RANGE對文本進行分析后,所得出的詞匯特征和文體特征,表面使用RANGE工具對文學作品的研究是客觀的,可行的。
[1]瑪格麗特·米歇爾.飄[M].戴侃,李野光,莊繹傳譯。北京∶人民文學出版社,1990.
[2]鮑 貴,王 霞∶RANGE在二語產出性詞匯評估中的應用[J].外語電化教學.2005(8).
[3]劉艷芹,李搖卓,孫承榮:中外大學生英語詞匯學習的語料庫研究[J]..中國石油大學學報(社會科學版)2015(2)
(作者單位:九江學院外國語學院講師)
劉 洋(1978—),女,九江,九江學院外國語學院講師,研究方向:英語教育。