于 濤, 唐美華,2
(1.江蘇師范大學 外國語學院,江蘇 徐州 221116;2.北京外國語大學 中國外語與教育研究中心,北京 100089)
漢語小說中的詞匯特征對比研究
于 濤1, 唐美華1,2
(1.江蘇師范大學 外國語學院,江蘇 徐州 221116;2.北京外國語大學 中國外語與教育研究中心,北京 100089)
語言的性別差異是社會語言學研究的熱點。通過自建的女性與男性小說家作品語料庫間的對比,可以揭示女性小說家詞匯的使用特點。研究發(fā)現(xiàn):在詞匯豐富度和詞匯密度方面,女性小說家均低于男性小說家,說明女性作品中傳遞的文本信息量少,閱讀難度相應較低。通過主題詞分析發(fā)現(xiàn),在名詞使用方面,女性小說家與男性小說家存在顯著差異,女性偏愛使用與娛樂、學習等相關的名詞,少用表人際關系及事業(yè)的名詞和粗俗語;在人稱代詞和語氣詞使用方面,女性小說中的頻數(shù)顯著高于男性小說;在指示代詞和形容詞使用方面,女性小說中的頻數(shù)顯著低于男性小說。
漢語女性小說; 語料庫; 詞匯豐富度; 詞匯密度; 主題詞分析
語言的性別差異是社會語言學研究的熱點話題。前人研究大多著眼于英語口語[1-3]和非正式語體[4-6],對正式語體中性別差異的研究較少,對英語之外語言中性別差異的探討更為少見。當前,國內(nèi)相關研究所引觀點大都來自西方學者的研究成果,得出的結(jié)論未必適用于漢語。劉潤清強調(diào),我們引進、研究西方語言學的最終目的是要較好地研究中國本土的語言,我們的國土上有取之不盡、用之不竭的語言素材,我們要嚴肅認真地挖掘它們的特征,從而概括出具有普遍性的結(jié)論[7]。鑒于此,本文通過自建漢語女性和男性小說家作品語料庫,對比分析詞匯豐富度、詞匯密度、主題詞等,探究女性小說中詞匯的使用特點。
(一)性別和語言關系的理論研究
“性別語言”(gender language)術語由Robin Fort于1665年首次提出[8],但真正從語言學視角對“性別語言”進行研究的首推丹麥語言學家O. Jespersen[9]。20世紀60年代,社會語言學的發(fā)展和女權(quán)運動的興起大大推動了性別語言的系統(tǒng)研究。1975年,英國學者Robin Lakoff的LanguageandWoman’sPlace一書更是掀起了性別語言研究的高潮,書中不僅提出了“女性語言”的概念,而且指出在語言所反映的世界圖景中男性居于中心地位,女性的形象則殘缺不全[10]4,74-75。Lakoff的理論在西方引起了巨大的轟動和爭議。作為社會語言學中的重要變量之一,性別語言得到了更為廣泛的探究,出現(xiàn)了支配論、差異論和社會建構(gòu)論等不同的理論陣營。Lakoff、Spender、Penelope等支配論者從社會權(quán)力的角度來看待性別和語言的關系,認為男性在語言中的支配地位和女性的被壓迫地位導致了女性語言的某些特征,如模糊語和反意附加問句的頻繁使用等[10]14-18[11-12];差異論者Tannen認為男女不同的語言策略和交際風格主要源于男女文化差異,女性更善于用語言來維系人際關系[13]10,18;社會建構(gòu)論者Butler則認為性別這一變量與社會階層、年齡、教育背景等其他變量密切相關,將性別看作是特定社會和文化環(huán)境中的社會建構(gòu)[14]。
(二)性別和語言關系的實證研究
在西方,性別語言的實證研究主要針對英語,多集中于口語[1-3,15-17]和非正式語體[4-6,18],對正式語體中語言性別差異的研究較少。Argamon 等通過對英語國家語料庫中566篇英語語篇(包括小說類和非小說類)的調(diào)查發(fā)現(xiàn),女性語言呈現(xiàn)參與性(involved)特征,男性語言則呈現(xiàn)信息性(informational)特征[19]331。在國內(nèi),較早研究漢語語言中性別現(xiàn)象的是趙元任[20],他討論了男女性別差異在語音、聲調(diào)上可能造成的差異。出版性別語言研究專著的還有孫汝建[8]、白解紅[21]、史耕山[22]、楊春[23]等。受西方理論的影響,國內(nèi)對漢語性別差異進行實證研究的論文并不多見,多關注的是微博等網(wǎng)絡語言[24-28]。
以上研究大多關注口語和非正式語體中的性別差異,對正式語體和漢語語言中的性別差異現(xiàn)象鮮有涉及。本研究運用基于語料庫的方法,分析漢語女性和男性小說家作品中的詞匯差異,主要針對詞匯豐富度、詞匯密度和主題詞等方面進行實證描述,結(jié)合社會語言學相關理論進行定性分析,探討女性小說中有別于男性的詞匯特征。
(一)語料來源
本研究自建兩個語料庫:女性小說家作品語料庫(FNC),由隨機選取的20世紀漢語女性小說家作品組成;男性小說家作品語料庫(MNC),由隨機選取的同時期漢語男性小說家作品組成。為保證語料的代表性與均衡性,每位作家僅選取一部作品。經(jīng)文本合并、語料清理后,F(xiàn)NC語料庫為468 081詞次,MNC語料庫為1 561 073詞次。
(二)研究問題
本研究嘗試回答兩個問題:一是在詞匯豐富度和詞匯密度方面,女性小說家作品與男性作品是否存在差異?若是,女性小說呈現(xiàn)怎樣的特點?二是在主題詞方面,女性小說家作品與男性作品是否存在差異?若是,這些差異具體體現(xiàn)在哪些方面,反映了女性小說怎樣的特點?
(三)研究工具及步驟
本研究的目的在于考察女性小說家在詞匯選擇和使用上是否存在有別于男性作家的特征。為便于量化研究,本文主要涉及詞匯豐富度、詞匯密度和主題詞的對比。首先,借助CorpusWordParser軟件,對兩個語料庫中的文本進行切分和詞性標注,為后續(xù)對比做準備。其次,利用語料庫檢索工具PowerGrep支持正則表達式的特點,將賦碼語料中的相關詞類準確高效地檢索出來。再次,利用北京外國語大學語料庫團隊開發(fā)的BFSU PowerConc軟件中的Keyness功能,對兩個語料庫中所有詞的使用頻率進行對比,析出所有主題詞,以此考察女性小說語料庫中的詞匯特征。最后,通過BFSULL工具,檢驗兩個語料庫中相關語言現(xiàn)象是否存在顯著性差異。
(一)詞匯豐富度和詞匯密度
計算結(jié)果顯示,MNC的吉羅指數(shù)略高于FNC,說明男性小說家作品的詞匯豐富度高于女性。BFSULL結(jié)果顯示,F(xiàn)NC與MNC的詞匯豐富度具有顯著差異(LL=24.58,p<0.001),表明中文女性小說家作品的詞語變化程度較低。這可能是因為女性小說家關注的焦點相對集中,導致某些領域內(nèi)的詞匯重復率較高,表達方式相對單一。
關于詞匯密度(lexical density)的計算方法,本文采用Ure提出的計算公式:詞匯密度=實詞數(shù)量/詞匯總量*100[33]。英語中的實詞指具有穩(wěn)定詞匯意義的詞語,包括名詞、實義動詞、形容詞和副詞四個詞類,而對于漢語實詞與虛詞的分類標準,學界仍存在爭議。鑒于本文主旨不是探討漢語詞類的劃分,而是借助詞匯密度來考察男性、女性文本在信息量和難度的差異,在具體統(tǒng)計中采取胡顯耀的實詞劃分標準,將名詞、實義動詞、形容詞和數(shù)量詞歸為實詞[34]216。借助PowerGrep軟件,提取所有實詞,統(tǒng)計兩個語料庫的詞匯密度。
詞匯密度被公認為檢測文本信息量大小的指標之一,文本中的實詞越多、詞匯密度越大,傳遞的信息量就越多,文本難度相應增加。統(tǒng)計結(jié)果表明,F(xiàn)NC的詞匯密度低于MNC,即女性小說中的實詞數(shù)量和頻率較低,女性小說中所反映的信息量和文本難度相應低于男性作品。
(二)主題詞分析
表1 女性小說家使用頻率顯著高于男性小說家的詞
表2 男性小說家使用頻率顯著高于女性小說家的詞
1.名詞
一般認為,名詞與文本的信息量成正比,名詞使用越多,文本信息量越大。FNC語料庫中名詞使用頻率顯著低于MNC語料庫(LL=1805.91,p<0.001),與前文得出的結(jié)論一致,即女性作品的文本信息要低于男性作品。對比表1和表2中的名詞發(fā)現(xiàn),女性小說與男性小說的差異主要體現(xiàn)在以下幾個方面。
第一,在表達人際關系的名詞上,女性小說家使用頻率比男性要低(19<31)。這與Tannen和呂鴻禮曾指出的“女性比男性更關心人與人之間的交往,從而更多地使用表達人際關系的名詞”[13]10[35]29相悖。進一步觀察發(fā)現(xiàn):家庭關系方面,女性主要關注家族中的近親成員,如爸爸、媽媽、媳婦、孩子等;男性的關注面更廣,涵蓋了如大爺、大娘、表姐等家族中的外圍成員。社會關系方面,男性較女性使用了更多表達階層關系的詞,如小姐、少爺、老太爺、姨太太、丫鬟等。另外,女性用詞不如男性正式,更偏愛使用媽媽、媽、爸爸等詞匯,而男性多用父親、母親等詞匯。
第二,女性小說家更關注娛樂和學習,男性更關注事業(yè)。女性偏愛使用戲、歌、戲園子、舞臺等與娛樂相關,以及大學、校園、教室、書桌、書櫥、圖書、俄語、外文等與學習相關的名詞;男性則更多使用生意、事情、公司、錢等詞匯。值得注意的是,前人研究指出“女性話語更關注日常生活,男性話語較多涉及政治時勢”[13]18[35]29。但是本研究通過主題詞分析發(fā)現(xiàn),女性作品顯著多用的名詞中也存在少量描述政治時勢的詞匯,如毛主席、紅衛(wèi)兵、資產(chǎn)階級、文化大革命、蘇聯(lián)等,這可能與部分作品描寫的時代有關。
第三,“狗”一詞被男性顯著多用,且其搭配詞多為粗俗語(profanity)。這和前人研究關于“女性比男性更禮貌,男性比女性更傾向于使用粗俗語”[9]245[10]10[36-37]的論斷一致。索引行分析發(fā)現(xiàn),與狗搭配的粗俗語在男性小說中頻繁出現(xiàn),且形式多樣,有狗娘養(yǎng)的、狗日的、狗奴才、狗仗人勢、狗咬呂洞賓、狗老板等;在女性作品中僅檢索出80例與“狗”的搭配詞,除了3例“嫁狗隨狗”外,其余均表達狗的字面意思。Lakoff等前人研究曾指出,由于長期生活在男性世界中,女性所處的“無權(quán)地位”影響到她們的語言風格[10]7。這體現(xiàn)在粗俗語的使用上女性更具羞恥心,盡量避免使用粗俗語言,男性則表現(xiàn)得更為粗獷直白、毫不掩飾。
2.代詞
前人研究曾指出女性在代詞的使用上顯著多于男性[19]326。本研究前200名正主題詞中代詞有7個,前200名負主題詞中代詞有6個,可見女性小說家并未在數(shù)量上占有顯著優(yōu)勢。但是在具體代詞的使用方面,女性和男性小說家之間確實存在差異,如表3所示:女性小說家更多使用人稱代詞(5個);男性小說家顯著多用的6個代詞中并無人稱代詞,指示代詞卻有5個。女性語言注重人與人之間的互動,男性語言更注重信息性[19]332。本研究可以為以上論斷提供佐證,人稱代詞的頻繁使用能夠反映女性較男性更關注交際,而指示代詞在男性小說中的顯著多用恰好證明男性傾向于指明(specify)所說的事物,這或許也是男性文本信息量較大和正式程度較高的體現(xiàn)。
表3 女性小說家和男性小說家代詞使用對比
3.形容詞
前人研究指出,女性情感豐富細膩,形容詞的使用較男性更多樣、更豐富[10]11-12[38]9-10。但是本研究的發(fā)現(xiàn)與上述觀點相悖。從正、負主題詞表來看,女性和男性小說家頻繁使用的形容詞數(shù)目都為4;從整個形容詞詞類來看,F(xiàn)NC顯著低于MNC(LL=167.46,p<0.001)。也就是說,漢語女性小說家在形容詞的使用上顯著低于男性,或許跟本研究聚焦的是小說這一特定語體有關。小說以刻畫人物形象為中心,強調(diào)通過完整的故事情節(jié)和環(huán)境描寫來反映社會生活,無論是男性還是女性作家,勢必會運用大量的形容詞來描寫修飾的人或事物,表述其性質(zhì)、狀態(tài)或特征。
4.語氣詞
多愁善感、感情外露一向被認為是女人的天性,男性則被認為是謹言慎行,不輕易表露內(nèi)心。不少研究已表明女性在言語交際中較男性更常借助語氣詞來抒發(fā)情感。祁淑玲、張金良認為女性選用語氣詞的數(shù)量多于男性,表現(xiàn)的情感也比男性豐富[39]。肖艷紅通過對電視節(jié)目主持人語言性別差異的分析指出,較之男主持人,女主持人更容易表現(xiàn)出喜怒哀樂的情緒,更喜歡使用語氣助詞[38]10。我們的研究證實了上述論斷。由表1和表2可見,女性小說家更善于借助語氣詞表現(xiàn)她們的內(nèi)心世界,不僅在類符數(shù)的使用上高于男性(10>3),而且在上述語氣詞使用的型符數(shù)上高于男性。女性小說家喜歡使用嗎、呀、吧、呢、啦、嗯、哦等詞語,話語顯得委婉、舒緩,既增加了言語的親切感和感染力,又更容易和對方維持友好關系。比如在傾聽別人講話時,女性常常會使用一些語氣詞表示自己在認真傾聽,或做出應答以鼓勵對方繼續(xù);男性小說家常用的語氣詞僅限于么、哩、罷等,這些詞伴隨著男性短促的語音節(jié)奏,表現(xiàn)出說話利落、直白甚至強硬的特點。
本研究基于自建漢語女性與男性小說家作品語料庫,通過對兩個語料庫在詞匯豐富度、詞匯密度和主題詞方面的考察發(fā)現(xiàn):女性小說在詞匯豐富度和詞匯密度上均低于男性小說;女性話題較多涉及娛樂和學習,但她們對政治時勢也有關注;人稱代詞和語氣詞被女性小說家顯著多用,而粗俗語、指示代詞和形容詞的使用頻率則顯著低于男性小說家。
盡管詞匯系統(tǒng)是言語性別差異表現(xiàn)最為集中的方面之一,但性別差異可以體現(xiàn)在語言的方方面面。在今后的研究中,我們可以考慮從句法和語義等維度探究漢語女性小說有別于男性小說的其他特征。如果能夠結(jié)合歷時語料庫考察女性語言的變異發(fā)展,將更進一步深化對漢語語言中性別差異現(xiàn)象的研究。
[1] HOLMES J.Hedges and boosters in women’s and men’s speech[J].Language & communication,1990,10(3):185-205.
[2] LABOV W.The intersection of sex and social class in the course of linguistic change[J].Language variation and change,1990,2(2):205-254.
[3] ECKERT P.Gender and sociolinguistic variation[M]//COATES J.Readings in language and gender.Blackwell:Oxford,1997:64-75.
[4] MULAC A,STUDLEY L,BLAU S.The gender-linked language effect in primary and secondary students’ impromptu essays[J].Sex roles,1990,23(9/10):439-470.
[5] MULAC A,LUNDELL T.Effects of gender-linked language differences in adults’ written discourse:multivariate tests of language effects[J].Language & communication,1994,14(3):299-309.
[6] HERRING S C.Two variants of an electronic message schema[M]//HERRING S C.Computer-mediated communication:linguistic,social and cross-cultural perspectives.Amsterdam:John Benjamins,1996:81-106.
[7] 劉潤清.西方語言學流派[M].北京:北京外語教育與研究出版社,2013:479.
[8] 孫汝建.語言與性別[M].南京:江蘇教育出版社,1997:187.
[9] JESPERSEN O.Language:its nature,development and origin[M].New York:Macmillan, 1922.
[10] LAKOFF R.Language and woman’s place:text and commentaries[M].Oxford:Oxford University Press,1975.
[11] SPENDER D.Man-made language[M].London:Routledge,1980.
[12] PENELOPE J.Speaking freely:unlearning the lies of the father’s tongue[M].New York:Pergamon Press,1990.
[13] TANNEN D.You just don’t understand:women and men in conversation[M].New York: Ballantine Books,1990.[14] BUTLER J.Gender trouble:feminism and the subversion of identity[M].New York: Routledge,1990.
[15] RAYSON P,LEECH G,HODGES M.Social differentiation in the use of English vocabulary:some analyses of the conversational component of the British national corpus[J].International journal of corpus linguistics,1997,2(1):133-152.
[16] CAMERON D,KULICK D.Language and sexuality[M].Cambridge:Cambridge University Press,2003.[17] BAKER P.Using corpora to analyze gender[M].London: Bloomsbury Publishing Plc, 2014.
[18] OLSSON L.A study of gender-related differences in introductory letters[EB/OL].(2000-02-14) [2016-10-25]. http://epubl.ltu.se/1402-1773/2000/62/LTU-CUPP-0062-SE.pdf.
[19] ARGAMON S,KOPPEL M,FINE J,et al.Gender,genre,and writing style in formal written texts[J].Text,2003(3):321-345.
[20] 趙元任.現(xiàn)代吳語的研究[M].北京:北京商務印書館,2011.
[21] 白解紅.性別語言文化與語用研究[M].長沙:湖南教育出版社,2000.
[22] 史耕山.漢語稱贊語中的性別研究[M].北京:北京科學出版社,2008.
[23] 楊春.性別語言研究[M].北京:光明日報出版社,2010.
[24] 周炎.網(wǎng)絡博客中的語言性別特征分析[D].杭州:浙江大學,2007.
[25] 畢翠翠.網(wǎng)絡博客語言的性別差異[D].濟南:山東師范大學,2009.
[26] 乙曉燕.中美網(wǎng)絡博客中的語言性別差異對比研究[D].濟南:山東師范大學,2011.
[27] 李璐璟.網(wǎng)絡語言交流中性別差異的語用學研究[D].武漢:武漢理工大學,2012.
[28] 江錦強.微博語言性別差異研究:以大學生微博為例[D].福州:福建師范大學,2013.
[29] 梁茂成.什么是語料庫語言學[M].上海:上海外語教育出版社,2016.
[30] DALLER H,VAN H R,TREFFERS-DALLER J.Lexical richness in the spontaneous speech of bilinguals[J].Applied linguistics,2003,24(2):197-222.
[31] YU G.Lexical diversity in writing and speaking task performances[J].Applied linguistics,2009,31(2):236-259.
[32] 施建剛,邵斌.基于語料庫的漢語譯文翻譯共性研究:以《蘇東坡傳》漢譯本為例[J]. 外國語言文學,2016,33(2):97-104.
[33] URE J.Lexical density and register differentiation[C]//PERREN G E,TRIMM J M. Applications of linguistics:selected papers of the 2nd international congress of applied linguists.London:Cambridge University Press,1971:443-452.
[34] 胡顯耀.基于語料庫的漢語翻譯小說詞語特征研究[J].外語教學與研究,2007,39(3): 214-220.
[35] 呂鴻禮.俄語中的性別語言變體及其成因探微[J].解放軍外國語學院學報,2004, 27(5):26-29.
[36] HERRING S C.Gender differences in CMC:findings and implications[J/OL].Computer professionals for social responsibility journal,2000,18(1):179-210[2017-01-20]. http://cpsr.org/issues/womenintech/herring/.
[37] ECKERT P,MCCONNELL-GINET S.Language and gender[M].Cambridge:Cambridge University Press,2013.
[38] 肖艷紅.電視節(jié)目主持人的語言性別差異研究[D].長沙:湖南大學,2013.
[39] 祁淑玲,張金良.感嘆詞語的性別差異研究[J].現(xiàn)代語文(語言研究版),2009(12):64-66.
(責任編輯:李曉梅)
Contrastive Study of Lexical Features in Chinese Novels
YU Tao1, TANG Meihua1,2
(1.School of Foreign Studies, Jiangsu Normal University, Xuzhou, Jiangsu 221116, China;2.National Research Center for Foreign Language Education, Beijing Foreign Studies University, Beijing 100089, China)
The lexical differences caused by the gender factor are described through empirical studies based on comparing the self-built corpus of Chinese novels of female writers with that of Chinese novels of male writers, with the purpose to discover the unique lexical features of female writers. The results show that the lexical richness and lexical density in female novels are lower than those in male novels. Thus, female novels are less informational and difficult than male novels. The result of keyword analyses shows that: nouns pertaining to entertainment and study, personal pronouns and auxiliary words of tone are more frequently used in female novels; nouns indicating interpersonal relations, business and profanity, deictic pronouns and adjectives are less frequently used by female.
Chinese novels of female writers; corpus; lexical richness; lexical density; keyword analysis
2017-04-20
于濤(1975—),男,江蘇贛榆人,江蘇師范大學外國語學院副教授,博士,研究方向:語料庫語言學、應用語言學;唐美華(1981—),女,江蘇東臺人,北京外國語大學中國外語與教育研究中心博士研究生,江蘇師范大學外國語學院講師,研究方向:語料庫語言學、應用語言學。
H146
A
1674-0297(2017)04-0117-06
分析是語料庫間對比最常見的方法之一,可以有效地發(fā)現(xiàn)語料庫的語言特征[29]84。借助主題詞中的實詞,可以推斷觀察語料庫的主題和所言之事。主題詞有正、負主題詞之分。如果某詞在觀察語料庫中的頻率顯著高于其在參照語料庫中的頻率,該詞為正主題詞;反之則為負主題詞。本研究借助BFSU PowerConc軟件,分別得出兩個語料庫的詞表,通過Keyness功能對兩個詞表中的所有詞窮盡比較,將主題性值達到顯著水平的詞全部抽取出來,生成主題詞列表(Keyword list)。根據(jù)對數(shù)似然率排序,選出前200名正主題詞和后200名負主題詞。鑒于小說語體的特殊性,去除這400個主題詞中的人名,將刪選后的詞匯按照它們所言之事分類。限于篇幅,本文主要討論兩個語料庫中存在較大差異的詞類(見表1和表2)。