劉瑜 于小娟
摘要:借助語料庫檢索工具 WordSmith5.0,通過對比分析自建《哈利.波特》系列小說語料庫和BROWN(K-R)文學類語料庫在詞匯分布、詞匯密度方面的特征,試圖發(fā)現(xiàn)《哈利.波特》系列小說的詞匯特征。
關(guān)鍵詞:《哈利.波特》;BROWN(K-R)文學語料庫;詞匯特征
一、研究背景
隨著語料庫語言學的發(fā)展,語料庫文體學以現(xiàn)代計算機和統(tǒng)計學的手段對文本進行分析,它強調(diào)用定量分析的方法分析文本,利用語料庫及語料庫工具對文本進行客觀地、量化地分析文本。較之基于直覺和印象主義的文體學,語料庫文體學能提供更客觀的數(shù)據(jù),更有說服力。
《哈利.波特》是英國作家J.K.羅琳的魔幻文學系列小說,共7部。該系列小說被翻譯成67種語言,所有版本的總銷量逾5億本,名列世界上最暢銷小說之列。國內(nèi)外學者從不同視角對它進行了多元化的剖析。從研究現(xiàn)狀來看,以使用文學理論進行的描述性研究為主導(dǎo),尚缺乏將定量分析技巧與定性分析方法相融合的研究方法?;诖?,本文將利用語料庫定量研究方法對《哈利.波特》系列小說的文體詞匯特征進行分析。
二、研究方法
本文的研究語料為自建的由7部《哈利.波特》系列小說構(gòu)成的微型語料庫共100多萬字,同時選取BROWN 語料庫中文學類文本,即 BROWN(K-R)(共計約 25 萬多詞)作為參照語料庫。本文利用語料庫文本分析軟件 Wordsmith Tools5.0對比兩庫中詞長和詞匯密度等層面的特征,分析《哈利.波特》系列小說的詞匯特征。
三、研究結(jié)果與討論
1.詞長分析
本研究發(fā)現(xiàn),只有1-13字母單詞在兩個語料庫中的比率均在0.1%以上,因此,通過對比《哈利.波特》系列小說語料庫和BROWN(K-R)文學類語料庫中1-13字母單詞的比率(如圖1所示),可以發(fā)現(xiàn),1-13字母單詞在《哈利.波特》系列小說語料庫中所占比率均小于在BROWN(K-R)文學類語料庫中的比率。由于“詞長是決定文本難易程度的一個重要指標。單詞越短小,文本越易理解,難度越低,文本的正式程度就越低;反之,單詞越長,文本越不易理解,難度越大,文本越正式”[2]。圖1進一步表明《哈利.波特》系列小說的閱讀難度較大小。
2.詞頻和詞匯密度分析
形符(Tokens)指在詞頻統(tǒng)計時,一個單詞計算為一個形符,即文本中有多少單詞就有多少形符??傂畏麛?shù)是語料庫容量的最常用的測量單位。表1顯示,《哈利.波特》系列小說語料庫總形符數(shù)為1,096,170,BROWN(K-R)文學類語料庫總形符數(shù)為256,087,因此這兩個語料庫在容量上相差近4.28倍。
類符(Types)是一個統(tǒng)計單位,一個文本的類符數(shù)就是該文本不同詞形的數(shù)量,如表1所示,《哈利.波特》系列小說語料庫和BROWN(K-R)文學類語料庫中的類符數(shù)分別為23,146和19,198。
在語料庫語言學中,類符/形符比(TTR)通常被用來衡量文本中的詞匯密度[3],詞匯密度反映的是句中實詞所占的比例,因此在一定程度上反映了文本的某種本質(zhì)特征,即用詞的多樣性。表1 的統(tǒng)計結(jié)果顯示,《哈利.波特》系列小說語料庫中類符/形符比為 2.11,而 BROWN(K-R)文學類語料庫的類符/形符比為 7.56,但由于不同容量的語料庫類符/形符比不具可比性,故一般用標準化類符/形符比(STTR)來衡量語料庫的詞匯密度。
標準化類符/形符比(STTR)是將所得到的若干個類符/形符比進行均值處理后最終得到的數(shù)值。《哈利.波特》系列小說語料庫和BROWN(K-R)文學類語料庫的標準化類符/形符比分別為44.33和44.89。Halliday發(fā)現(xiàn)非正式書面語體的詞匯密度低,書面語詞匯密度高,信息量大;而口語詞匯密度低,包含信息量小,但是句子結(jié)構(gòu)靈活多變、復(fù)雜?;谝陨蠑?shù)據(jù)分析可以了解到《哈利.波特》系列小說的詞匯普遍短小,詞匯密度較低,口語化特征明顯,用詞更加簡易,通俗。
四、結(jié)語
通過對比分析自建《哈利.波特》系列小說語料庫和BROWN(K-R)文學類語料庫在詞匯分布、詞匯密度方面的詞匯特征,發(fā)現(xiàn)《哈利.波特》系列小說所用詞匯普遍短小,詞匯密度較高,口語化特征明顯,敘事簡潔、平實,可讀性強。因此,語言研究者通過語料庫手段對文學作品詞匯進行量化分析,可以觀察到用傳統(tǒng)方法無法發(fā)現(xiàn)的很多語言事實,從而對語言本身進行更加客觀地描寫和解釋,為研究提供更加科學的數(shù)據(jù)支撐,從而使結(jié)果更具客觀性和準確性,繼而增加了 解釋的說服力。
【參考文獻】
[1]陳建生,高博.基于語料庫的《詩經(jīng)》兩個英譯本的譯者風格考察—以“國風”為例[J].天津外國語大學學報,20111(04):36-41
[2]楊秀珍,續(xù)娜,劉美瑜.基于語料庫的 《暮光之城 》系列小說詞匯特點初探[J].長春理工大學學報,2010(02):71-73
[3]王華,甄鳳超.透過主題詞和關(guān)鍵主題詞管窺中國學習者英語口語交際能力中的詞語知識[J].外語界,2007(01)