蔡愛娟
【摘 要】唐詩(shī)宋詞是中國(guó)文化的瑰寶,歷來(lái)受到人們的廣泛關(guān)注。本文基于數(shù)據(jù)庫(kù)分析,對(duì)唐詩(shī)宋詞的題目、詩(shī)人、用字和意象進(jìn)行了統(tǒng)計(jì)和對(duì)比分析。
【關(guān)鍵詞】全唐詩(shī);全宋詞;數(shù)據(jù)庫(kù);對(duì)比分析
歷來(lái)對(duì)唐詩(shī)宋詞的對(duì)比研究主要是感性的定性研究,比如分析唐詩(shī)宋詞的不同風(fēng)格。20世紀(jì)以來(lái),隨著計(jì)算機(jī)科學(xué)的發(fā)展,人們加大了對(duì)古代文學(xué)的定量研究。張三夕(1984)通過(guò)定量分析,考證全唐詩(shī)的詩(shī)人實(shí)為三百多人①。朱崇才(1993)統(tǒng)計(jì)《全宋詞》高頻字,認(rèn)為《全宋詞》有一定的女性化傾向。劉明華(1999)利用《全唐詩(shī)》軟件,發(fā)現(xiàn)《全唐詩(shī)》用字的一些特點(diǎn),比如字頻最高的是“不”。 尚永亮(2007)探討數(shù)據(jù)庫(kù)、計(jì)量分析方法及其對(duì)古代文學(xué)研究的現(xiàn)代化進(jìn)程作用。龔嵐(2009)分析唐詩(shī)宋詞中高頻字的使用和演變情況。張三夕、張世敏(2013)從方法論的角度提出將計(jì)量研究法引入古代文學(xué)研究。
利用數(shù)據(jù)處理工具構(gòu)建唐詩(shī)宋詞數(shù)據(jù)庫(kù)進(jìn)行定量研究,具有系統(tǒng)性和可驗(yàn)證性。本文基于《全唐詩(shī)》、《全宋詞》數(shù)據(jù)庫(kù),利用ACCESS、MySQL和PHP等數(shù)據(jù)處理工具,從統(tǒng)計(jì)的角度出發(fā),探討唐詩(shī)宋詞的不同特點(diǎn)。
1 對(duì)唐詩(shī)宋詞題目的分析
1.1 對(duì)《全唐詩(shī)》高頻題目的分析
《全唐詩(shī)》所有詩(shī)作共計(jì)42657篇,共有2271個(gè)題目。此處列舉了重復(fù)頻率最高的前十項(xiàng)題目,如下表所示:
表1顯示,《全唐詩(shī)》中題目重復(fù)最多的是《句》,并且它遙遙領(lǐng)先于第二名《古意》,而我們所了解的詩(shī)詞中以“句”為名的不多,有些奇怪。再篩選出題目為《句》的詩(shī)作,發(fā)現(xiàn)它們并不全是以“句”為題,絕大多數(shù)指詩(shī)歌中零落的句子,也許是在流傳過(guò)程中散佚,不知其名,因而以“句”為名。所以,《全唐詩(shī)》題目頻率使用最高的應(yīng)為《古意》。
此外,高頻的《長(zhǎng)門怨》、《塞下曲》、《送別》、《柳》反映了詩(shī)歌選材和情感的取向,體現(xiàn)了“送別”、“閨怨”、“邊塞”等幾大主題,符合我們通常的認(rèn)知。
1.2 對(duì)《全宋詞》高頻題目的分析
《全宋詞》記錄數(shù)5303,查找題目重復(fù)項(xiàng),使用頻率最高的前十個(gè)題目如下所示:
此處宋詞的題目指“詞牌名”,一般與詞的內(nèi)容無(wú)關(guān),只是套用格式。通過(guò)數(shù)據(jù)庫(kù)查找出來(lái)的前十項(xiàng)高頻詞牌名,均為常見詞牌名。
《全宋詞》使用頻率最高的前五項(xiàng)詞牌名覆蓋的詩(shī)人數(shù)目如下:
《全宋詞》前五個(gè)高頻詞牌名覆蓋的詩(shī)人數(shù)目相差不大,并且詩(shī)人是相似的,但《浣溪沙》覆蓋的詩(shī)作數(shù)目遠(yuǎn)勝于其他詞牌名,即對(duì)于特定詩(shī)人而言,《浣溪沙》的使用頻率高于其他詞牌名。它音節(jié)明快,句式整齊,易于上口,為婉約、豪放兩派詞人所常用。兩大流派皆鐘情于此,則排名第一不足為奇。
2 唐詩(shī)宋詞的詩(shī)人與作品的情況分析
2.1 《全唐詩(shī)》高產(chǎn)詩(shī)人
《全唐詩(shī)》共2356位詩(shī)人,其中詩(shī)作總數(shù)最多的前十名詩(shī)人列舉如下:
可見,唐詩(shī)詩(shī)作最多的并非李白而是白居易,其詩(shī)作2641篇,占全唐詩(shī)總數(shù)的6.2%。除了白居易,李白、杜甫、劉禹錫、元稹、李商隱、齊己、韋應(yīng)物、陸龜蒙也都是我們耳熟能詳?shù)脑?shī)人,其詩(shī)作不僅流傳千古而且數(shù)量豐富。
前十名中只有“貫休”不太熟悉。貫休是唐末五代著名畫僧。他能詩(shī)善畫,在中國(guó)繪畫史上有很高的聲譽(yù)。他博學(xué)多才,嫉惡如仇,詩(shī)作中往往體現(xiàn)了憂國(guó)憂民、高風(fēng)亮節(jié)的特點(diǎn),例如“旅夢(mèng)遭鴻喚,家山被賊圍”,品格高潔由此可見一斑。
2.2 《全宋詞》高產(chǎn)詩(shī)人
《全宋詞》共72位詩(shī)人,其中詩(shī)作總數(shù)最多的前十名列舉如下:
其中蘇軾作品共348篇,約占全宋詞總數(shù)的6.56%,位列第一。與《全唐詩(shī)》相似,前十名中絕大多數(shù)是我們熟悉的詞人,僅“朱敦儒”、“毛滂”和“張?jiān)伞毕鄬?duì)陌生。
朱敦儒為詞中之俊,詞作風(fēng)格隨個(gè)人人生經(jīng)歷的變化而轉(zhuǎn)變。少年時(shí),不識(shí)愁滋味,詞風(fēng)濃艷麗巧;中年時(shí),憂時(shí)憤世,詞風(fēng)慷慨激昂;晚年時(shí),閑居山水,詞風(fēng)清新自然。他開拓了宋詞的題材,進(jìn)一步發(fā)揮了以詞敘事和以詞言志的功能,使詩(shī)詞的功能初步合二為一,在詞壇上具有獨(dú)特的地位。
毛滂其詞瀟灑明潤(rùn)、情韻特勝,是“非作家之極,亦在附庸之列”的有風(fēng)致、有成就、有影響的作家。
張?jiān)汕趭^讀書,愛好詩(shī)詞,協(xié)助李綱,抗擊金兵,義憤作詞,抒發(fā)情懷。
對(duì)《全唐詩(shī)》《全宋詞》詩(shī)人、詩(shī)作的分析,發(fā)掘出了高產(chǎn)而不為人熟知的詩(shī)人。
2.3 《全唐詩(shī)》《全宋詞》詩(shī)人、詩(shī)作對(duì)比分析
通過(guò)對(duì)數(shù)據(jù)的分析,還發(fā)現(xiàn)了一些有趣的事實(shí)。比如,《全唐詩(shī)》中李姓詩(shī)人的詩(shī)歌有5158篇之多,占12.09%;而在《全宋詞》中李姓詩(shī)作323篇,占6.09%。可見,李姓對(duì)于唐詩(shī)的貢獻(xiàn)遠(yuǎn)勝于宋詞。據(jù)此展開聯(lián)想,也許“李”姓詩(shī)作之多與唐朝的特殊性——“李”是國(guó)姓有關(guān)。但《全宋詞》中收錄的詩(shī)人中,趙姓詩(shī)人詩(shī)作并不多(2%),因此,是否與“朝代”和“國(guó)姓”有關(guān)有待商榷。
另一個(gè)對(duì)比是,《全唐詩(shī)》每位詩(shī)人平均有18.1首詩(shī)(而白居易一人就占據(jù)詩(shī)作總數(shù)的6%),所以,實(shí)際上其他詩(shī)人平均詩(shī)作數(shù)還不足18首),《全宋詞》平均每位詞人73.6首。可見,《全宋詞》作品集中于部分詞人。
《全宋詞》僅收錄了72位詞人的作品,還會(huì)引發(fā)一些相關(guān)聯(lián)想:是否可以認(rèn)為《全宋詞》收錄的作品是否覆蓋面相對(duì)比較狹小,遺漏了一些相對(duì)不太有名的作品?或者是否可以認(rèn)為這與唐宋發(fā)展水平和人口數(shù)有關(guān)?抑或,雖然我們常說(shuō)“唐詩(shī)宋詞”,宋詞的地位和唐詩(shī)基本對(duì)等,但是,撐起泱泱唐詩(shī)的是整個(gè)唐朝的百姓,而撐起宋詞的只是一部分文人?
3 對(duì)唐詩(shī)宋詞高頻字分析
唐詩(shī)宋詞用字頻率最高的前二十個(gè)字中,有七個(gè)是重疊的,即數(shù)詞“一”、否定副詞“不”、方位詞“中”、“上”、疑問(wèn)代詞“何”和名詞“人”“云”。 這些詞有不同的語(yǔ)法功能,它們共同作用,實(shí)現(xiàn)詩(shī)歌抒情言志的作用。其中,唐詩(shī)用字頻率最高的前二十個(gè)字中出現(xiàn)了“花”這個(gè)意象,下文會(huì)對(duì)意象作進(jìn)一步分析。
現(xiàn)在漢字前十高頻字是“的、一、國(guó)、在、人、了、有、中、是、年”,其中“一、人、中”仍然保留著高頻地位。 “何”不在高頻之列,“是”進(jìn)入高頻,體現(xiàn)了白話文對(duì)漢字使用頻率的影響。
4 唐詩(shī)宋詞意象比較分析
基于《全唐詩(shī)》、《全宋詞》,對(duì)“花”、“西樓”、“落日/夕陽(yáng)”以及“云”這幾個(gè)常用的典型意象進(jìn)行對(duì)比分析。
《全唐詩(shī)》中四種意象的使用情況如下:
可見,“花”是詩(shī)詞永恒的主題,可寫景,可比人,表情達(dá)意,傳神到位。粗略對(duì)比發(fā)現(xiàn),唐詩(shī)中的“花”似乎更為“積極”,宋詞中的“花”更為傷感,多用來(lái)傷春懷人。
“云”也是詩(shī)詞中常用的經(jīng)典意象,如“浮云游子意,落日故人情”,“云”有飄落無(wú)依之義,有純潔之義,內(nèi)涵豐富,因而為詩(shī)人常用。
從這一角度出發(fā),勾選出詩(shī)歌常用意象,分析歸納不同意象在語(yǔ)境的不同特點(diǎn),對(duì)理解詩(shī)歌含義有很大幫助,可應(yīng)用于語(yǔ)文教學(xué)。
5 總結(jié)
本文利用數(shù)據(jù)庫(kù)工具對(duì)《全唐詩(shī)》、《全宋詞》的題目、詩(shī)人、用字以及意象等特質(zhì)進(jìn)行初步的對(duì)比分析。進(jìn)一步,可以利用中文信息處理,探索不同詩(shī)人的用字習(xí)慣、語(yǔ)言風(fēng)格等,形成一套準(zhǔn)確實(shí)用相對(duì)科學(xué)的系統(tǒng),在古代文學(xué)研究者個(gè)人研究經(jīng)驗(yàn)的基礎(chǔ)上,從信息處理的角度,為詩(shī)詞某些特質(zhì)的確定提供依據(jù),成為輔助工具。例如,確定一首無(wú)名詩(shī)的作者,我們可以在研究該詩(shī)歌的基礎(chǔ)上從數(shù)據(jù)庫(kù)中尋找與其風(fēng)格相匹配的詩(shī)人,根據(jù)風(fēng)格、用字習(xí)慣來(lái)推測(cè)作者。目前,計(jì)算機(jī)通過(guò)“學(xué)習(xí)”可以“創(chuàng)作”出讓人難辨真?zhèn)蔚脑?shī)句,意境、押韻都沒有問(wèn)題,雖然這種“詩(shī)”到底能否算作真正的詩(shī)歌有待商榷,但從定量角度,利用數(shù)據(jù)庫(kù)建設(shè)、計(jì)算機(jī)建模等方式研究詩(shī)詞不失為一個(gè)全新的探索角度。
【參考文獻(xiàn)】
[1]龔嵐.試論唐詩(shī)宋詞中的高頻字[J].江西財(cái)經(jīng)大學(xué)學(xué)報(bào),2009(1):104-108.
[2]尚永亮.數(shù)據(jù)庫(kù)、計(jì)量分析與古代文學(xué)研究的現(xiàn)代化進(jìn)程[J].文學(xué)評(píng)論,2007,(6):187-190.
[3]劉明華.唐人最愛說(shuō)“不”──《全唐詩(shī)》軟件字頻檢索如是說(shuō)[J].中國(guó)典籍與文化,1999(4).
[4]朱崇才.從高頻字看宋詞的女性化傾向[J].中國(guó)韻文學(xué)刊,1993:70-76.
[5]張三夕.作家作品研究中的數(shù)量分析——唐代詩(shī)人總數(shù)考實(shí)[J].江蘇師范大學(xué)學(xué)報(bào):哲學(xué)社會(huì)科學(xué)版,1984(2):63-67.
[6]張三夕,張世敏.古代文學(xué)研究中計(jì)量分析的應(yīng)用與限度——由唐詩(shī)宋詞排行榜引起的思考[J].社會(huì)科學(xué),2013(2):172-177.DOI:10.3969/j.issn.0257-5833.2013.02.020.
注釋:
①?gòu)埲ο壬鷧^(qū)分“詩(shī)人”和“寫詩(shī)的人”,認(rèn)為詩(shī)人至少應(yīng)為“存詩(shī)一卷以上者”.
[責(zé)任編輯:曹明明]