佟玉平 汪琳
摘要:計量文體學(xué)作為一種新的文體學(xué)研究方法,將語言學(xué)與計算機(jī)技術(shù)密切結(jié)合,對文章的語言特色進(jìn)行定量分析,對文章的語言用詞方式、語言規(guī)律進(jìn)行描述。總統(tǒng)就職演講作為一種典型的政治性文體,對其語言規(guī)律進(jìn)行歷時性探索可以看出,在美國兩百多年的歷史里演講這種文體的語言進(jìn)化過程。從最開始的探索過程到逐漸意識到演講對群眾的煽動作用,演講的用詞開始形成一個整體的規(guī)律。
關(guān)鍵詞:計量文體學(xué) 總統(tǒng)就職演講 語料庫
中圖分類號:H315 ?文獻(xiàn)標(biāo)識碼:A ?文章編號:1009—5349(2019)19—0116—02
總統(tǒng)的就職演講實際上是借用演講的語言技巧來塑造新總統(tǒng)的良好形象,甚至向觀眾展示語言背后隱藏的意識形態(tài)。目前國內(nèi)學(xué)者對總統(tǒng)就職演講的研究涉及語法隱喻、人際意義分析、文體分析、中美領(lǐng)導(dǎo)人語言特色分析、話語策略研究,以及系統(tǒng)功能語法框架下的批評話語分析、評價理論分析等多個領(lǐng)域。本文將從文章的用詞風(fēng)格和文體特征這一方向出發(fā),通過計量文體學(xué)理論從歷時分析的角度對總統(tǒng)就職演講這一文體進(jìn)行概括總結(jié)。
一、文獻(xiàn)綜述
計量文體學(xué)基于語料庫的研究,以計量的方式定量地分析文本,在語料庫語言學(xué)的基礎(chǔ)上對文本進(jìn)行更深入的統(tǒng)計與分析。Leech和Short早就認(rèn)為文體學(xué)需要統(tǒng)計這種定量分析來獲得客觀的分析結(jié)果,以支撐對語篇文體特征的主觀判斷。[1]Enkvist也曾認(rèn)定文體特征具有統(tǒng)計學(xué)原理。他認(rèn)為文體標(biāo)記在不同文本內(nèi)出現(xiàn)的密度顯著不同,這就是語言文體學(xué)被稱為定量科學(xué)的原因。[2]計量文體學(xué)中一項流行的研究是測定文體。它研究不同語篇中的詞長、句長等特征以確定其作用。[3]
本文將對美國總統(tǒng)就職演講這一特殊文體進(jìn)行計量文體學(xué)分析,以一種全新的角度觀察總統(tǒng)就職演講這一文體的歷時發(fā)展過程,觀察隨著時間的變化對語言發(fā)展的影響。計量文體學(xué)、語料庫語言學(xué)等研究中經(jīng)常以AntConc,Wordsmith等語料庫工具進(jìn)行分析。本文在分析工具方面大膽創(chuàng)新,將語言學(xué)與計算機(jī)更深入地結(jié)合,用人工智能領(lǐng)域的編程語言python的文本分析功能對總統(tǒng)就職演講進(jìn)行計量文體學(xué)分析。
二、整個就職演講語料庫的語言特征
首先,使用python中的nltk(自然語言工具包)下載所有的語料庫資源。它包含了大量語料庫資源,如古登堡語料庫、布朗語料庫、就職演講語料庫、路透社語料庫等,python也有第三方庫,科學(xué)計算包numpy和scipy可以幫助計算語料庫翻譯中常用的定量指標(biāo)。計算完成后,利用統(tǒng)計模塊對數(shù)據(jù)進(jìn)行均勻性檢驗、方差分析和卡方分析。描述性統(tǒng)計也可以通過繪圖庫matplotlib可視化。[4]
總統(tǒng)就職演講的總形符數(shù)是135689;總類符數(shù)是9097。這意味著總統(tǒng)就職演講語料庫中有135689個單詞和9097個詞匯。形符數(shù)除以類符數(shù)的百分比為13.99%,標(biāo)準(zhǔn)百分比為42.4%。從這個判斷來看,詞匯密度應(yīng)該是一般的。在總統(tǒng)就職演講中共有4191個低頻詞。如果我們不看上下文,就很難用低頻詞來理解文本主題。就職演說語料庫中最常見的詞是3個字母的詞。接下來是2個字母的單詞,第三個是4個字母的單詞,然后是1個字母的單詞。超過一半的單詞不超過4個字母。最長的單詞有17個字母,最短的單詞有1個字母。
還可以看出,只有4906個詞重復(fù)使用,起著重要的語義作用。因此對文本的分析研究實際上是集中在這些重復(fù)和經(jīng)常使用的4906個詞上。
三、歷時性語言特征
不同的總統(tǒng)在演講時可能有自己的語言風(fēng)格和習(xí)慣。因此,在總結(jié)就職演說語料庫整體語言特征的基礎(chǔ)上,從不同總統(tǒng)語言習(xí)慣的角度分析其語言特征。
使用python編程,可以方便地獲取總字符數(shù)、單詞平均長度、英語單詞總數(shù)、句子數(shù)、平均句子長度、詞匯數(shù)和單詞重復(fù)次數(shù)等數(shù)據(jù)。根據(jù)單詞和句子的因素,獲得的數(shù)據(jù)將重新整合到表1中。
表1可以看出,單詞數(shù)最多的年份是1841年,而單詞數(shù)最少的年份是1793年。據(jù)統(tǒng)計,在長度上有四個不同的階段:(1)建國初期,從第一任總統(tǒng)到第四任總統(tǒng),大部分演講都是有接近一萬的字符數(shù)。此時,話題相對有限。例如,華盛頓的第二次演講只說我來這里向你們宣誓。(2)從第五屆到第十六屆總統(tǒng)林肯,演講字?jǐn)?shù)急劇增加,增加了一倍多,有超過5000字的演講,以第九屆總統(tǒng)哈里斯為代表。他的演講共8464個字。這是從“門羅派”到內(nèi)戰(zhàn)結(jié)束的時期。(3)內(nèi)戰(zhàn)后,胡佛第31次大蕭條是美國經(jīng)濟(jì)發(fā)展成為世界強(qiáng)國時期。這一時期的講話時間較長,但總體上減少了。(4)從第32位羅斯福到現(xiàn)在的特朗普,篇幅大大縮短了。隨著時間的變化,總統(tǒng)就職演說越來越多地使用了簡短的詞語,這似乎與時代的變化是一致的,演說越來越簡潔。
從“平均句子長度”和“單詞重復(fù)次數(shù)”兩列來看,近百年來,句子越來越短,單詞越來越短,詞匯重復(fù)次數(shù)也越來越多,這一點更為明顯。
總統(tǒng)的講話通常是1個小時左右。最長的是1841年威廉哈里森總統(tǒng)的演講,長達(dá)2小時。但是總統(tǒng)演講的時間越來越短,基本上大約是20分鐘。
四、結(jié)語
作為一種特殊的政治性演講,總統(tǒng)就職演講是一種非常具有代表性的珍貴語料。本文從計量文體學(xué)角度出發(fā)對總統(tǒng)就職演講的語言特征進(jìn)行分析。得到結(jié)論為總統(tǒng)就職演講的詞匯密度一般。近百年來,句子越來越短,單詞越來越短,詞匯重復(fù)次數(shù)也越來越多。作為一種政治性演講,其規(guī)律性越來越強(qiáng),在語言使用層面也趨向規(guī)律性和簡潔性。
參考文獻(xiàn):
[1]McEnery,Tony& Andrew W.CorpusLinguistics.An Introduction[M].Edingburgh:Edingburgh University Press,2006.
[2]桂詩春,寧春巖.語言學(xué)研究方法[M].北京:外語教學(xué)與研究出版社,2005.
[3]胡壯麟,劉世生.西方文體學(xué)辭典[Z].北京:清華大學(xué)出版社,2004.
[4]王天奇,管新潮.語料庫語言學(xué)研究的技術(shù)拓展——“Python文本分析:用可實現(xiàn)的方法挖掘數(shù)據(jù)價值”[J].評外語電化教學(xué),2017(10):177. ? ? ? ? ? ? ?責(zé)任編輯:趙慧敏