史傳敏
內(nèi)容摘要:《萬水千山走遍》是三毛的一部游記散文,本文通過自建《萬水千山走遍》語料庫,從高頻詞、標(biāo)點(diǎn)符號、文本難度和句子分析四個層面,對作品進(jìn)行風(fēng)格分析。
關(guān)鍵詞:《萬水千山走遍》 語料庫 語言風(fēng)格 高頻詞 標(biāo)點(diǎn) 文本難度 句子
1.引言
《萬水千山走遍》是作家三毛撰寫的一部散文游記,國內(nèi)關(guān)于文本風(fēng)格的研究大多從文學(xué)角度,基于研究者自身的主觀感受,對作家的思想、作品的語言、結(jié)構(gòu)進(jìn)行描述。本文旨在通過定量的語言特征統(tǒng)計(jì)與分析,結(jié)合此前對《萬水千山走遍》的定性傳統(tǒng)風(fēng)格學(xué)描寫,總結(jié)出這部作品的風(fēng)格。
2.語料庫的建立
本文首先建立《萬水千山走遍》語料庫,采用“語料庫在線”網(wǎng)頁對語料進(jìn)行初步分詞和詞性標(biāo)注,輔以人工校對,然后借助于AntConc和Excel對詞匯、標(biāo)點(diǎn)進(jìn)行量化統(tǒng)計(jì)和分析,再用AntConc進(jìn)行主題詞分析和高頻詞檢索。
3.《萬水千山走遍》作品風(fēng)格分析
3.1基于語料庫的高頻詞分析
高頻詞是反映文本內(nèi)容和作者用詞習(xí)慣的一個重要語言特征。Leech和Short(2001)認(rèn)為頻次超高或者超低的詞都是一種偏離。劉穎(2014)認(rèn)為,對于同一類型的不同作家的作品,高頻詞可以反映不同文本之間的關(guān)注內(nèi)容的差異。
分析名詞可以大致了解語料涉及的主題;分析動詞可以知道三毛在這部作品中使用動詞的傾向性,是表示人或事物的動作、存在、變化還是表示人的必理活動及意愿等等;分析形容詞可以發(fā)現(xiàn)作者的情感及作者敘述性的寫作傾向。用AntConc的Wordlist功能處理《萬水千山走遍》語料庫可以得到前100個高頻詞,我們可以進(jìn)一步整理出高頻詞的詞類。見表1:
由表1可知,《萬水千山走遍》中使用最多的人稱代詞是“我”,并且“我”的使用頻次非常高,從第一人稱的視角還原旅途場景、抒發(fā)個人情感,這樣的敘述手法可以達(dá)到讓讀者感同身受的效果。整體上,人稱代詞整體在文中的比例非常高,這體現(xiàn)了三毛以移步換景的手法向讀者敘述這趟心靈放逐之旅的見聞。
文中高頻的動詞有走、去、來、看、吃、想等,名詞有時候、東西、地方、旅館等,這類詞都是偏口語化的用詞,單音節(jié)詞比較多,這些生活化詞高頻率的使用營造出一種輕松中又有些忙碌的旅行氛圍。另外,高頻詞中的動詞的數(shù)量遠(yuǎn)遠(yuǎn)高于其他,這也體現(xiàn)了散文游記的特點(diǎn),著重于刻畫見聞軼事,描摹人物景致。
3.2基于語料庫的標(biāo)點(diǎn)符號分析
符號是書面語言中不可缺少的一部分,標(biāo)點(diǎn)符號是文本中的有機(jī)成分,不是外加上去的,同一個文本使用不同標(biāo)點(diǎn)符號會產(chǎn)生不同的效果。我們通過Excel統(tǒng)計(jì)出《萬水千山走遍》中的標(biāo)點(diǎn)符號使用頻次,見表2。
從表2可以看出,文本中“,”出現(xiàn)的頻率非常高,經(jīng)過檢索我們可以發(fā)現(xiàn)這篇散文多是短句,甚至話題鏈內(nèi)部不需要逗號標(biāo)注停頓的地方很多都用上了逗號,這些用逗號隔開的內(nèi)容往往都含有作者想要表達(dá)的語義重點(diǎn),或者傳遞某種氛圍。如(1)。
(1)也是那一晚,做了一個夢,夢中,大巴士——那種叫做青鳥的干凈巴士,載了我去了一個棕櫚滿布的熱帶海灘,清潔無比的我,在沙上用枯枝劃一個人的名字。
例(1)一個話題中包含7個小句,由逗號造成的短暫停頓賦予了文本一種韻律感,使文本內(nèi)容更加輕松易讀。同時,在名詞代詞后的停頓讓讀者有更多時間將注意點(diǎn)轉(zhuǎn)向文本意境的描摹刻畫,而不僅僅是敘述內(nèi)容本身。如(1)中“清涼無比的我,”突出表現(xiàn)“我”的身體、心理狀態(tài)都是極佳狀況。
此外,“?!薄?!”“?”在文中的使用頻率也很高。其中,句號的使用可以表現(xiàn)文本話題鏈之間的轉(zhuǎn)換,作為一部游記散文,豐富的敘述主體內(nèi)容決定了文本需要使用大量的句號,從而使文本更具生動性和畫面感。問號和感嘆號的使用往往是為了表達(dá)作者強(qiáng)烈的情感,有時甚至出現(xiàn)多個感嘆號并列出現(xiàn)的情況。如(2)。
(2)“喂?。』熨~!”我追著去打車子,水中跑也跑不快,連腰上都已濕了。
例(2)中兩個感嘆號連用,放大了語氣,表現(xiàn)作者的極度憤慨。問號和感嘆號在文本中的大量出現(xiàn)反映了作者善于刻畫人物心理,描摹事件情狀的特點(diǎn)。
此外,這篇散文中的雙引號使用頻次僅次于“,”“?!?。經(jīng)檢索發(fā)現(xiàn),整部散文游記具有對話和描寫相結(jié)合的特點(diǎn)。
3.3基于語料庫的文本難度分析
在計(jì)算風(fēng)格學(xué)中,有幾個指標(biāo)可以用來衡量文本的難易程度,包括類符形符比,平均詞長,平均句長,平均段長等。類符形符比(Type Token Ratio,TTR)是類符(Type)和形符(Token)之比,形符是指一個文本中所有的詞,類符是文本中詞頻為1的詞,TTR是衡量詞匯豐富度的指標(biāo),詞匯豐富度越高,文本越難。TTR的公式(陸蕓,2012):
表3是《萬水千山走遍》語料庫的文本難度各項(xiàng)指標(biāo)系數(shù)。
通過對文本難度的分析,我們可以看到這個文本中的形符類符比較低,可見文章中超過一半的詞匯都出現(xiàn)不止一次,詞匯豐富度低,文本難度不高。平均詞長為1.5左右,進(jìn)一步驗(yàn)證了上文中得出的文章以單音節(jié)詞居多的結(jié)論,平均句長和平均段長比為0.466,可見平均每段的的句子數(shù)為2.14,說明一個篇章中的情節(jié)較少,更加降低了文章理解的難度。
3.4基于語料庫的句子分析
句子分析主要從兩方面著手,一是句長離散度,二是句子破碎度。
句長離散度是文本中句子的句長偏離平均句長的程度,計(jì)算公式(苗艷艷,2017):
Ds表示句長離散度,Li表示平均句長,Ls表示不同句子的長度,N表示文本中句子的總數(shù)。句長離散度的大小反映的是文本的節(jié)奏變化程度,值越小表示句長變化不大,文本比較平穩(wěn),句長重復(fù)很高,整個文本就比較有韻律。
句子破碎度是指一句話的停頓次數(shù),一般來說,句子中的標(biāo)點(diǎn)符號越多,停頓越多,破碎度越高,口語性越強(qiáng)。計(jì)算公式(闞明剛,2011):
句子破碎度=小句數(shù)/總句數(shù)
表4是句長離散度和句子破碎度具體數(shù)據(jù)。
《萬水千山走遍》文本的句長離散度為18.193,句子破碎度為2.648,文本的句長離散度較高,表明文本中的句長變化比較大,文章結(jié)構(gòu)富于變化,長短句錯落。句子破碎度較高,表明文章中每句話中的停頓較多,口語性很強(qiáng)。
4.結(jié)論
本文通過自建《萬水千山走遍》語料庫,從高頻詞、標(biāo)點(diǎn)符號、文本難度和句子分析四個層面,對作品進(jìn)行風(fēng)格分析,得出結(jié)論如下:
通過高頻詞分析,可以得出三毛大量使用第一人稱敘述這次旅行見聞,敘述語言多以單音節(jié)詞動詞為主,內(nèi)容偏口語化,讀起來輕松、流暢、自然。
標(biāo)點(diǎn)符號方面,文章以短句為主,在造成停頓的同時,傳遞出特定語義重點(diǎn),營造特定氛圍。感嘆號和句號的使用強(qiáng)化了文章的情感語氣,使表達(dá)更切合口語特點(diǎn)。雙引號的高頻使用體現(xiàn)了文章一大敘述特點(diǎn)——對話和描寫相結(jié)合。
文本難度方面,這部散文游記中超過一半的詞匯都出現(xiàn)不止一次,詞匯豐富度低,平均詞長、句長、段長都較短,文本理解難度不高。
句子方面,這部游記散文的結(jié)構(gòu)富于變化,長短句錯落,并且口語性較強(qiáng)。
參考文獻(xiàn)
[1]闞明剛.幾個語體參數(shù)的定量對比研究——以新聞報道和訪談對話為例[J].語文學(xué)刊,2011(17):46-48+54.
[2]劉穎,肖天久.金庸與古龍小說計(jì)量風(fēng)格學(xué)研究[J].清華大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2014,29(05):135-147+179.
[3]陸蕓.詞匯豐富性測量方法及計(jì)算機(jī)程序開發(fā):回顧與展望[J].南京工業(yè)大學(xué)學(xué)報(社會科學(xué)版),2012,11(02):104-108.
[4]苗艷艷.基于語料庫的畢飛宇、蘇童作品風(fēng)格比較研究[D].南京師范大學(xué),2017.
[5]Leech,Short. Style in Fiction:A linguistic introduction to English Fictional Prose.北京:外語教學(xué)與研究出版社,2001.
(作者單位:上海交通大學(xué)人文學(xué)院)