當(dāng)代小說句式特征的計(jì)量研究
——《繁花》與其他10部茅盾文學(xué)獎(jiǎng)作品對(duì)比

2019-11-20 07:07:14劉海濤王雅琴

山西大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版) 2019年6期

劉海濤,王雅琴

(浙江大學(xué) 外語(yǔ)學(xué)院,浙江杭州 310058)

一引言

20世紀(jì)末,隨著新技術(shù)手段不斷發(fā)展,早期注重傳統(tǒng)印象直覺式分析方法的文體學(xué)家逐漸突出科學(xué)和跨學(xué)科研究的重要性,由此以計(jì)算機(jī)為基礎(chǔ)的定量方法在文體學(xué)中開始盛行。與單純的定性研究相比,量化研究結(jié)果為文體風(fēng)格研究提供了全新的思路,使其更具科學(xué)性和客觀性。[1]使用科學(xué)統(tǒng)計(jì)方法對(duì)文學(xué)作品評(píng)析進(jìn)行驗(yàn)證,促進(jìn)了文體研究的發(fā)展,為傳統(tǒng)的思辨方法提供了客觀的證據(jù),有助于進(jìn)一步探討文學(xué)作品的藝術(shù)和審美效應(yīng)。

上海本土作家金宇澄所著的《繁花》[2]一書(以下簡(jiǎn)稱《繁》)自問世以來,反響巨大,并獲得了第九屆茅盾文學(xué)獎(jiǎng)。書中對(duì)句法形式的突破尤為顯眼,也吸引了語(yǔ)言學(xué)家的目光,被稱為重現(xiàn)的民間“話本腔”[3-4],在當(dāng)代小說中可謂獨(dú)樹一幟。書中對(duì)話鋪陳,短句豐富,標(biāo)點(diǎn)簡(jiǎn)單,律動(dòng)鮮明。小說汲取傳統(tǒng)的力量[5],形式繁復(fù)[6],鋪張的敘事方式尤為惹眼[7]。張定浩指出,作者通過對(duì)現(xiàn)代漢語(yǔ)結(jié)構(gòu)的“分解、破壞與創(chuàng)造”[8],形成了自己的一種語(yǔ)言。沈家煊以《繁〉為出發(fā)點(diǎn),討論漢語(yǔ)句法結(jié)構(gòu)的本質(zhì)特點(diǎn)。[4]這些研究表明，對(duì)該小說中具有傳統(tǒng)“漢語(yǔ)腔”特點(diǎn)的語(yǔ)言進(jìn)行調(diào)查,有利于從漢語(yǔ)實(shí)際出發(fā),回歸漢語(yǔ)自身的特點(diǎn)。因此,對(duì)于此種具有典型漢語(yǔ)特征的文本進(jìn)行深入研究是非常必要的。

已有研究發(fā)現(xiàn),句法特征在計(jì)量文體學(xué)(stylometrics,也稱計(jì)量風(fēng)格學(xué))研究中發(fā)揮著重要作用[9-10],句法特征的效能可與詞匯特征相媲美(效果甚至超過詞匯特征),是一個(gè)高效率和高準(zhǔn)確率的特征向量。目前已有不少有關(guān)當(dāng)代小說的計(jì)量文體學(xué)研究成果[11-13],但由于種種條件限制,這些研究大多停留在詞的水平上,主要關(guān)注詞匯信息(如詞頻)和句子、短語(yǔ)的統(tǒng)計(jì)特征(如句長(zhǎng)和詞長(zhǎng)等),句法特征的潛力還未充分發(fā)揮。因此,對(duì)中國(guó)當(dāng)代文學(xué)作品句式特點(diǎn)進(jìn)行計(jì)量研究有其必要性,有利于描述不同作家風(fēng)格,挖掘文體特點(diǎn),促進(jìn)文體研究的現(xiàn)代化與科學(xué)化。

在計(jì)量語(yǔ)言學(xué)領(lǐng)域,關(guān)于句法結(jié)構(gòu)的語(yǔ)言定律早已備受關(guān)注,注重使用數(shù)理統(tǒng)計(jì)方法的計(jì)量語(yǔ)言學(xué)以真實(shí)文本為對(duì)象,探究人類語(yǔ)言背后的規(guī)律,提高了研究成果的科學(xué)性和客觀性。[14-15]學(xué)者們已發(fā)現(xiàn)很多具有普適性的定律,這些定律對(duì)不同語(yǔ)體中的語(yǔ)言現(xiàn)象、語(yǔ)言結(jié)構(gòu)、結(jié)構(gòu)屬性以及它們之間的相互關(guān)系進(jìn)行動(dòng)態(tài)分析和描寫,以揭示語(yǔ)言背后的規(guī)律。對(duì)當(dāng)代小說句式特征的研究有利于從系統(tǒng)科學(xué)的角度全面理解其文體語(yǔ)言現(xiàn)象,也有助于發(fā)現(xiàn)當(dāng)代漢語(yǔ)的句式特點(diǎn)和語(yǔ)言規(guī)律。

鑒于上述背景,本文擬采用計(jì)量方法,以《繁》為例,對(duì)當(dāng)代小說的句式特點(diǎn)進(jìn)行計(jì)量研究,此外選取了10部字?jǐn)?shù)、時(shí)間與《繁》相近的茅盾文學(xué)獎(jiǎng)獲獎(jiǎng)小說,作為對(duì)照語(yǔ)料。研究問題主要集中在以下三個(gè)方面:漢語(yǔ)腔的特點(diǎn)、整齊并置的短句以及韻致序列特征。通過將《繁》與這些作品進(jìn)行對(duì)比,探究當(dāng)代小說的句式特征,不僅有助于加深對(duì)漢語(yǔ)句法結(jié)構(gòu)的認(rèn)識(shí),也對(duì)后續(xù)的漢語(yǔ)句法和文體研究有一定的啟示作用。

二語(yǔ)料構(gòu)成

本文的語(yǔ)料包括《暗算》《秦腔》《繁花》《額爾古納河右岸》《湖光山色》《天行者》《蛙》《推拿》《一句頂一萬句》《生命冊(cè)》《黃雀記》共11部小說(語(yǔ)料相關(guān)信息見表1)。由于漢語(yǔ)的詞語(yǔ)之間沒有空格等間隔符,為小句長(zhǎng)和句長(zhǎng)的統(tǒng)計(jì)帶來困難,因此本文采用中科院分詞軟件——ICTCLAS漢語(yǔ)分詞軟件對(duì)文本進(jìn)行分詞(1)http:∥ictclas.nlpir.org/，對(duì)原始語(yǔ)料進(jìn)行分詞,并對(duì)分詞后的語(yǔ)料進(jìn)行了人工校對(duì)等后續(xù)處理。。

表1 語(yǔ)料相關(guān)信息(分詞后)

三漢語(yǔ)腔特點(diǎn)

趙元任[16]提出,漢語(yǔ)主要靠停頓和語(yǔ)調(diào)界定句子,他認(rèn)為主謂形式齊全的句子為整句,主謂形式不齊全的小句為“零句”。在有意經(jīng)營(yíng)的話語(yǔ)中,整句是主要句型,而日?？谡Z(yǔ)中,零句是根本。[16-17]漢語(yǔ)中零句可獨(dú)立成句,也可與其他零句共同組成整句,直接導(dǎo)致了漢語(yǔ)中的“流水句”現(xiàn)象。[18]語(yǔ)言學(xué)家評(píng)價(jià)《繁》是“中國(guó)人血液里的東西”[4]9,也是名副其實(shí)的“漢語(yǔ)腔”。小說文從句順,行文流暢,有大量的流水句和零句,讀來一氣呵成。以下3個(gè)例子充分顯示了零句和流水句的特點(diǎn):

1.零句

(1)陶陶說,我呀,成天琢磨安全通道,消防梯,已經(jīng)神經(jīng)了。[2]129

(2)滬生原來呢,還算正派,現(xiàn)在也學(xué)壞了。[2]272

2.流水句

此刻,阿寶于琴間流連徘徊,鋼琴自由擺放,羅列散漫,形成各種行走路線,躋身于此,打開任何一塊琴蓋,內(nèi)里簡(jiǎn)單而復(fù)雜,眼下的鍵盤,一絲不動(dòng),周圍聽不到一個(gè)音階,有時(shí),鍵盤上有幾根頭發(fā),一屑碎紙,半枝斷頭鉛筆,琴蓋內(nèi)散發(fā)出陌生氣味,阿寶難以親近,感覺到痛,悵然閉闔。[2]168

漢語(yǔ)中大多數(shù)零句是名詞性詞語(yǔ)(短語(yǔ))和動(dòng)詞性詞語(yǔ)(短語(yǔ))。[16]比如說,沒有謂語(yǔ)的主語(yǔ)也可成句,如例1(1)句中“我呀”僅是一個(gè)名詞短語(yǔ)表示的主語(yǔ)。沈家煊進(jìn)一步提出,“零句”不止于此,其多樣性超出了語(yǔ)法學(xué)家的想象。如例1(2)中的“原來”不能和印歐語(yǔ)中的副詞完全畫等號(hào),它也是“廣義的話題”[4]36。

呂叔湘說:“漢語(yǔ)口語(yǔ)里特多流水句,一個(gè)小句接著一個(gè)小句,很多地方可斷可連?！盵19]7《繁》中存在很多如例2中一逗到底的流水句。大量的流水句對(duì)整體的句子分布有何影響?豐富的零句又對(duì)小句分布有何影響?筆者用計(jì)量的方法一探究竟。(2)《繁》中標(biāo)點(diǎn)簡(jiǎn)單,逗號(hào)使用居多,其他小說中會(huì)存在其他情況,如分號(hào)等。為保持統(tǒng)一,本文根據(jù)《標(biāo)點(diǎn)符號(hào)用法》(GB/T 15834—2011)所列出的標(biāo)準(zhǔn),對(duì)句子和小句進(jìn)行劃分。判斷句子的標(biāo)準(zhǔn)包括句號(hào)、問號(hào)、嘆號(hào),判斷小句的點(diǎn)號(hào)為句號(hào)、問號(hào)、嘆號(hào)、逗號(hào)、分號(hào)、冒號(hào)。此外,破折號(hào)、括號(hào)和省略號(hào)需要分情況考慮。就破折號(hào)而言,當(dāng)其標(biāo)示內(nèi)容包含完整的主謂結(jié)構(gòu)時(shí),可以作為小句的界限;當(dāng)括號(hào)中的內(nèi)容、省略號(hào)前后的內(nèi)容是小句和整句時(shí),可以作為判斷小句或句子的標(biāo)準(zhǔn)。

就小句長(zhǎng)的分布情況而言,如下頁(yè)圖1所示,《繁》的小句長(zhǎng)集中分布在2—4(詞)之間,而其他小說的小句長(zhǎng)大多處在[4,6]區(qū)間。另外,《繁》的小句長(zhǎng)比例從4開始急劇下降,6以上的小句所占比重非常小。其平均小句長(zhǎng)為3.60,和其他10部小說相比是最低的。沈家煊隨機(jī)抽取《繁》的小句,發(fā)現(xiàn)平均每句5字,超過10字的句子極少。[4]筆者也用該單位進(jìn)行了計(jì)算,發(fā)現(xiàn)《繁》的平均小句長(zhǎng)為5.16字,從數(shù)據(jù)統(tǒng)計(jì)的角度證實(shí)了沈家煊的有關(guān)說法。

圖1 所有小說的小句長(zhǎng)分布曲線

如圖2的句長(zhǎng)分布曲線顯示,就整體趨勢(shì)來說,《繁》似乎與其他小說并無明顯不同。具體來看,其短句長(zhǎng)(如長(zhǎng)度為2、3的句子)比例較低,而長(zhǎng)句長(zhǎng)比例較高。其平均句長(zhǎng)達(dá)到了4.43個(gè)小句,是所有小說中的最大值,表明就平均值而言,句子中包含的小句數(shù)量最多,反映了整句中包含很多“可斷可連”的小句,這恰好呼應(yīng)了上文中大量的流水句現(xiàn)象。金宇澄曾提出,抱著向傳統(tǒng)靠近一點(diǎn)的想法,從“很低的位置”出發(fā),完成了《繁》。[2]從這個(gè)角度看,金宇澄或多或少實(shí)現(xiàn)了自己的承諾,運(yùn)用了“密排文字”的形式講述故事。從另一角度看,小說若以口語(yǔ)對(duì)話為主要特征,則會(huì)呈現(xiàn)零句、流水句多的特征,這也反映了和其他小說相比,《繁》的口語(yǔ)特征很明顯。

圖2 所有小說的句長(zhǎng)分布曲線

從20世紀(jì)上半葉開始,就有統(tǒng)計(jì)學(xué)家對(duì)語(yǔ)言的句長(zhǎng)分布進(jìn)行了研究[20],之后有研究認(rèn)為句長(zhǎng)分布符合一定規(guī)律[21],其分布類型或可用來區(qū)分不同作者的作品。本研究將從概率分布或普遍性的角度進(jìn)一步討論這些小說的小句長(zhǎng)和句長(zhǎng)分布。

學(xué)者們使用了不同的概率分布模型擬合句長(zhǎng)分布。[21-22]其中,Pande和Dhami[22]采用了擴(kuò)正負(fù)二項(xiàng)式(Extended Positive Negative Binominal)和超帕斯卡(Hyperpascal)模型。結(jié)合前人研究和本文的語(yǔ)料,本文采用擴(kuò)正負(fù)二項(xiàng)式分布模型擬合相關(guān)數(shù)據(jù)。

結(jié)果顯示,11部小說的句長(zhǎng)擬合效果都很好(C<0.02,R2>0.9)(3)C和R2是判定模型擬合效果的兩個(gè)標(biāo)準(zhǔn)。C為差異系數(shù),C< 0.02, 結(jié)果為好;C< 0.01,結(jié)果為非常好。R2為擬合的決定系數(shù),R2>0.8,結(jié)果為可接受；R2>0.9,結(jié)果為非常好。見:劉海濤.計(jì)量語(yǔ)言學(xué)導(dǎo)論[M].北京:商務(wù)印書館,2017。,表明所選小說的句長(zhǎng)分布都遵循一定規(guī)律,均具有相似的分布趨勢(shì),即較短的句子占較大的比重,當(dāng)句長(zhǎng)增大時(shí),數(shù)量也隨之降低,較長(zhǎng)的句子所占比重很小。這說明雖然是不同作家的小說,但句長(zhǎng)分布均具有人類語(yǔ)言的普遍特征。

在這種相同變化趨勢(shì)的基礎(chǔ)上,不同小說的分布特征可能存在差異。Pande和Dhami[22]指出,擴(kuò)正負(fù)二項(xiàng)式模型的參數(shù)和指標(biāo)可以用來比較不同作者的作品。該模型包含三個(gè)參數(shù)k、p和α,而《繁》的參數(shù)k值和p值是所有小說中的最小值。同樣,本文亦使用該分布擬合小句長(zhǎng)的分布,效果也都很好(C< 0.02,R2> 0.9),反映了和句長(zhǎng)分布類似的情況,即不同小說的小句長(zhǎng)分布也存在一定規(guī)律,具有普遍特征。此外,《繁》的k值較大(處于第二位),p值最大。

為了進(jìn)一步驗(yàn)證模型是否能夠區(qū)分《繁》和其他小說,本研究沿用Pande和Dhami的方法,加入了模型的其他特征指標(biāo)(均來源于Altmann-Fitter軟件擬合結(jié)果(4)http:∥www.ram-verlag.eu/wp-content/uploads/2013/10/Fitter-User-Guide.pdf (2014-11-29),分類前對(duì)所有指標(biāo)都進(jìn)行了標(biāo)準(zhǔn)化處理。),采用層級(jí)聚類方法(5)該方法的原理是根據(jù)文本向量之間的歐式距離,逐次合并相近的對(duì)象,繼而再組成更大的簇,直到形成一個(gè)簇為止。最終通過樹狀圖來展示結(jié)果,可以清晰地顯示對(duì)象的分類結(jié)果。對(duì)文本進(jìn)行分類。聚類分析顯示,在以小句長(zhǎng)模型的指標(biāo)為文本向量的結(jié)果中,11部小說分成兩類,其中《繁》和《黃雀記》《一句頂一萬句》聚成一大類,在這一類別下,《繁》自成一類,其他2部小說為一類，而其他8部小說為另一大類,說明就小句長(zhǎng)的參數(shù)分布而言,《繁》展現(xiàn)了與大部分小說不同的特點(diǎn)。此外,以句長(zhǎng)模型的參數(shù)和指標(biāo)為變量的聚類分析結(jié)果顯示,所有小說分成兩類,其他10部小說為同一類,而《繁》則為單獨(dú)的一類,說明《繁》的句長(zhǎng)分布比小句長(zhǎng)分布更具獨(dú)特性,與其他小說皆不同。兩個(gè)聚類分析結(jié)果均有效,數(shù)學(xué)模型分類的共性相關(guān)系數(shù)小句長(zhǎng)為0.76,句長(zhǎng)為0.84。(6)該系數(shù)為驗(yàn)證聚類分析結(jié)果的效度,數(shù)值越接近1,說明效果越好。通過小句長(zhǎng)和句長(zhǎng)分布的參數(shù)比較,本文從數(shù)學(xué)模型的角度再次印證了《繁》的獨(dú)特性,同時(shí)也說明不同文學(xué)作品的句長(zhǎng)分布參數(shù)也是描述作者風(fēng)格的一個(gè)重要參數(shù),值得進(jìn)一步研究。

四整齊并置的短句

《繁》中大多是字?jǐn)?shù)不多的短句并置,大致等長(zhǎng),節(jié)奏感很強(qiáng),這些可斷可連的零句構(gòu)成了流水句。那么這些大量的零句和流水句之間的關(guān)系是否有特別之處?事實(shí)上,大多數(shù)人類語(yǔ)言中,句子和小句的關(guān)系均遵循某種規(guī)律(門策拉-阿爾特曼定律Menzerath-Altmann law),即:一種語(yǔ)言結(jié)構(gòu)越長(zhǎng),則構(gòu)成它的部分越短。[15]門策拉-阿爾特曼定律由門策拉提出,阿爾特曼進(jìn)一步完善,其通用形式為:

y=axbe-cx(b<0)

(1)

該公式中,y為平均成分長(zhǎng)度,x為結(jié)構(gòu)長(zhǎng)度。大多數(shù)情況下,一般簡(jiǎn)寫為：

y=axb(b<0)

(2)

這一定律已被驗(yàn)證存在于不同語(yǔ)言結(jié)構(gòu)單位之間,表2顯示了符合該定律的結(jié)構(gòu)單位和成分。[15]55以第一行為例,句子為結(jié)構(gòu),小句為成分,小句長(zhǎng)度為因變量。因此,句子和小句的結(jié)構(gòu)成分關(guān)系可以表達(dá)為:句子越長(zhǎng),小句的平均長(zhǎng)度越短。

表2 符合門策拉-阿爾特曼定律的語(yǔ)言單位

本文擬采用門策拉-阿爾特曼定律對(duì)句子-小句和小句-詞兩個(gè)層面進(jìn)行分析。在句子層面,句子和小句的結(jié)構(gòu)成分關(guān)系可以表達(dá)為:句子越長(zhǎng),小句的平均長(zhǎng)度越短。將該定律應(yīng)用在本文的語(yǔ)境中,若《繁》的句子越長(zhǎng),則構(gòu)成句子的小句應(yīng)當(dāng)越短。但這似乎和上文所陳述的特征有所相悖。如果用這種定律關(guān)系來比較《繁》和其他小說,會(huì)有什么發(fā)現(xiàn)?用更具普遍意義的語(yǔ)言定律去研究這種關(guān)系,或可從實(shí)證研究的角度闡釋其獨(dú)具一格的句式結(jié)構(gòu)特點(diǎn)。Hou et al.[23]曾發(fā)現(xiàn)在不同語(yǔ)體中,句子和小句的關(guān)系不盡相同,因此,本研究亦可以檢驗(yàn)Hou et al.結(jié)論的正確性。在小句層面,本文擬調(diào)查小句和詞的結(jié)構(gòu)成分關(guān)系。尚無學(xué)者對(duì)漢語(yǔ)的小句層面進(jìn)行研究[24-25](7)所注參考文獻(xiàn)，前者研究日語(yǔ)的句子、小句和論元層面,后者對(duì)捷克語(yǔ)的小句層面進(jìn)行了考察。,因而本文是該結(jié)構(gòu)層面的初步嘗試(8)為了減小異常值對(duì)結(jié)果的影響,筆者選擇了長(zhǎng)度為1-15的小句(單位:詞)和句子(單位:小句)。長(zhǎng)度為1-15的小句和句子占了整體的大部分比重,比例和都達(dá)到了98%及以上,基本能代表整體文本的特點(diǎn)。。

(一)句子和小句的層級(jí)關(guān)系

本研究結(jié)果顯示,大部分小說的擬合效果并不好(根據(jù)前人研究[26],R2值大于0.8,即模型擬合效果為可接受,而8部小說的R2值小于0.8),《繁》的擬合效果也較差(R2=0.370)。當(dāng)《繁》的句長(zhǎng)增長(zhǎng)時(shí),小句長(zhǎng)并沒有隨之呈現(xiàn)下降的趨勢(shì),而是集中在某個(gè)值(3.5)附近。表明不論《繁》的句子有多長(zhǎng),其構(gòu)成部分都保持相似的長(zhǎng)度。

從具體的例子(分詞后的句子)來看:

3) 天麻種子的培育。優(yōu)質(zhì)天麻為培育優(yōu)質(zhì)的天麻種子提供保障，在天麻開花期基質(zhì)的溫度控制在19～20攝氏度，濕度控制在50%，空氣相對(duì)濕度控制在70%，空氣溫度控制為20～23攝氏度，通風(fēng)換氣，人為補(bǔ)光。因天麻花自身不能授粉，采用人工異株授粉方法，使天麻花結(jié)實(shí)，產(chǎn)生前果，授粉完成18～20天，果實(shí)成熟，適時(shí)采收。通過伴萌發(fā)菌種植。如暫時(shí)不種植，可保存在4攝氏度的冰箱中7天左右，保證種籽有足夠的萌發(fā)率。

(1)滬生說,等于跳傘,我父母是空軍,這要訓(xùn)練。[5]49

(2)蓓蒂說,馬頭想帶我去高郎橋去看看,馬頭住的地方,全部是工廠,就是楊樹浦的茭白園,昆明路附近,經(jīng)常唱 “馬路戲”,就是露天唱戲,唱江淮劇,不買票,就可以看了,我不懂啥是江淮劇,想去看,結(jié)果讓淑婉姐姐罵了一頓,馬頭一聲不響。[5]69

第一句句長(zhǎng)是4個(gè)小句,平均小句長(zhǎng)是(2+2+4+3)/4=2.75,第二句句長(zhǎng)是15個(gè)小句,平均小句長(zhǎng)是(2+10+4+3+5+3+4+3+3+3+4+7+3+8+5)/15=4.47?？梢园l(fā)現(xiàn),句長(zhǎng)為4的平均小句長(zhǎng)比句長(zhǎng)為15的值反而要小。隨著句子的增長(zhǎng),其構(gòu)成成分——小句的長(zhǎng)度并沒有隨之降低。

這個(gè)結(jié)論與Hou et al.[23]的研究結(jié)論基本保持一致:漢語(yǔ)新聞中定律擬合效果較好，但在口語(yǔ)和小說中,定律的擬合效果較差。他們認(rèn)為,這可能和小說和口語(yǔ)中大量的流水句現(xiàn)象有關(guān)。筆者認(rèn)為這也可能和測(cè)量的單位有關(guān),這對(duì)文體學(xué)研究有一定的借鑒和思考意義。大多數(shù)小說中口語(yǔ)化的表達(dá)較多,因此有很多流水句。流水句中包含了很多意義完整、獨(dú)立且“并置”的零句。[18, 27]零句不包括完整的主謂組合,但它們也表達(dá)了一個(gè)完整的句子意義。正是漢語(yǔ)中零句的多樣性和并置性造成了結(jié)構(gòu)與成分關(guān)系的不穩(wěn)定性,導(dǎo)致了整體較差的擬合效果?？梢园l(fā)現(xiàn),趙元任的零句理論立足于漢語(yǔ)本身,能夠解釋漢語(yǔ)句式結(jié)構(gòu)的特征,從而揭示漢語(yǔ)的本質(zhì)特點(diǎn)。綜合這一小節(jié)的數(shù)據(jù)和Hou et al.[23]的結(jié)論,可以得出,語(yǔ)體和文體的差異對(duì)漢語(yǔ)句式特點(diǎn)有一定影響,這對(duì)進(jìn)一步研究漢語(yǔ)的句式特征有一定的啟示意義。由于擬合效果差異過大,這里不再比較《繁》和其他小說的參數(shù)值異同。

(二)小句和詞的層級(jí)關(guān)系

小句和詞的層級(jí)關(guān)系結(jié)果顯示,小句越長(zhǎng),詞的平均長(zhǎng)度有下降的趨勢(shì)。接近一半的小說的擬合效果都為可接受(5部小說的R2值大于0.8),表明在5部小說中,小句層面的結(jié)構(gòu)成分關(guān)系符合冪律分布。同時(shí)也可以發(fā)現(xiàn),小句層面的定律擬合結(jié)果都優(yōu)于句子層面的擬合結(jié)果。

大多數(shù)學(xué)者認(rèn)為定律的參數(shù)值異同可能和不同語(yǔ)言層級(jí)相關(guān),也有研究發(fā)現(xiàn),不同語(yǔ)體的參數(shù)值存在差異。[28]接近一半的小說擬合效果較好,因此可以進(jìn)一步觀察模型的參數(shù)值?！斗薄返腶值最大,b值最小,和其他小說有所不同。說明從數(shù)學(xué)公式的描述來看,其小句和詞的結(jié)構(gòu)成分關(guān)系亦是獨(dú)具一格。(9)由于定律并不包含其他特征指標(biāo)，因此這里僅對(duì)兩個(gè)參數(shù)的差異進(jìn)行簡(jiǎn)單比較，其統(tǒng)計(jì)學(xué)意義需要未來進(jìn)一步調(diào)查?？梢园l(fā)現(xiàn),從相鄰層級(jí)單位之間關(guān)系的角度出發(fā),對(duì)當(dāng)代小說進(jìn)行語(yǔ)言定律的描述,用數(shù)學(xué)模型概括總結(jié)客觀規(guī)律,有利于了解文學(xué)作品的特殊性和普遍性,以及漢語(yǔ)的句式特點(diǎn),從而促進(jìn)文體對(duì)比研究的科學(xué)化。

五韻致序列特征

沈家煊指出,《繁》韻致調(diào)性強(qiáng),有長(zhǎng)短句的配合,效果才明顯,如“口里一面講,身體一面靠緊,滾燙。”[2]59“滾燙”這由一詞構(gòu)成的小句,緊跟在前面較長(zhǎng)的小句之后,讀起來有朗朗上口的感覺。

K?hler提出,動(dòng)鏈可以分為長(zhǎng)度動(dòng)鏈、頻次動(dòng)鏈、多義度動(dòng)鏈等類型。本文主要研究句法結(jié)構(gòu)的長(zhǎng)度序列特征,因此采用長(zhǎng)度動(dòng)鏈指標(biāo),其定義為:一系列持續(xù)保持相等或者增長(zhǎng)趨勢(shì)的長(zhǎng)度值(如詞素長(zhǎng)度、詞長(zhǎng)或句法結(jié)構(gòu)長(zhǎng)度)。[29]90以《繁》中的某個(gè)流水句為例(分詞后的句子):

徐總說,我喜歡小地方,北方做官,包括大老板,喜歡大辦公室,旁邊往往擺一張床,甚至雙人床,擺一對(duì) 繡花枕頭,甚至密碼鎖的套房,里面有私人衛(wèi)生。[5]290

以詞為單位的小句長(zhǎng)序列為:2423362554

根據(jù)動(dòng)鏈的定義,該句話的小句長(zhǎng)動(dòng)鏈為:

(2-4)(2-3-3-6)(2-5-5)(4)

從這個(gè)例子可以看出,動(dòng)鏈對(duì)文本的區(qū)分方式較為明確,并不基于主觀臆斷,減少了爭(zhēng)議性,可以更加客觀地反映文本的線性特征。此外,該方式能窮盡文本中的相關(guān)數(shù)值,描述文本的整體特征。[29]

在此基礎(chǔ)上,本文擬從動(dòng)鏈方面調(diào)查《繁》的小句長(zhǎng)排列特征。已有不少研究分析了動(dòng)鏈秩-頻分布的擬合模型[30-31],其中,齊普夫-曼德布洛特分布模型(Zipf-Mandelbrot,以下簡(jiǎn)稱齊曼模型)可以很好地?cái)M合動(dòng)鏈的分布情況,并且從某種程度上來說,模型的參數(shù)可以用來比較不同語(yǔ)體[30, 33],因此接下來本文嘗試用該模型擬合動(dòng)鏈的秩-頻分布并比較參數(shù)。

按照動(dòng)鏈的劃分方法,本文對(duì)小句長(zhǎng)動(dòng)鏈的秩-頻分布進(jìn)行統(tǒng)計(jì)。由于篇幅有限,我們列出頻次排名前十位的小句長(zhǎng)動(dòng)鏈,如表3所示,其他10部小說的前5個(gè)動(dòng)鏈多是5、6、7、8,而《繁》不同,前5位分別是3、4、2-4、2-5、2-3。單從分布情況來看,它們的語(yǔ)言序列就有所不同。用概率分布去擬合這些小說的秩-頻分布的結(jié)果會(huì)如何?

所選小說的小句長(zhǎng)動(dòng)鏈的秩-頻分布均符合齊曼模型,雖然C值大于 0.02,但R2值大于0.9,擬合效果尚可接受,表明《繁》的小句長(zhǎng)序列遵循參數(shù)分布,存在一定規(guī)律。其a值最大,b值較小(處于第二位)。

表3 小句長(zhǎng)動(dòng)鏈的秩-頻分布

以句長(zhǎng)動(dòng)鏈模型的參數(shù)和指標(biāo)為基礎(chǔ)的聚類分析顯示,包括參數(shù)在內(nèi)一共13個(gè)指標(biāo),其共性相關(guān)系數(shù)為0.91,分類效果很好。結(jié)果表明,《繁》和其他9部小說被分為一類,《秦腔》單獨(dú)成一類,說明《秦腔》和包括《繁》在內(nèi)的10部小說都不同。而在前者的類別下,齊曼模型將《繁》和9部小說區(qū)分開來,說明從某種程度來說,《繁》的句長(zhǎng)動(dòng)鏈分布和大部分小說都不同。

眾所周知,文體研究較少關(guān)注語(yǔ)段特征(語(yǔ)言單位的組合特征)[30],動(dòng)鏈則提供了一個(gè)新視角,利用客觀明確的區(qū)分方式描繪了文本的線性組合特征。由此看來,這和“長(zhǎng)短句配合”的韻致一說有異曲同工之妙,同樣都用小句長(zhǎng)度為基準(zhǔn),描繪了文本線性特征。不同的是,動(dòng)鏈采用了數(shù)學(xué)統(tǒng)計(jì)方法來測(cè)量韻致特征,將主觀感受具象化,相關(guān)數(shù)據(jù)結(jié)果從某種程度上印證了:《繁》的韻致調(diào)性強(qiáng),與當(dāng)代小說有所不同。這也體現(xiàn)了金宇澄所說的:“當(dāng)代書面語(yǔ)的波長(zhǎng),缺少‘調(diào)性’,如到傳統(tǒng)里尋找力量,瞬息間,就有‘閃耀的韻致’。”[2]443如果不同風(fēng)格的小說可以用參數(shù)值來衡量和比較,將其擴(kuò)展到其他文體的比較研究是一個(gè)值得努力的方向。

六結(jié)語(yǔ)

華語(yǔ)文學(xué)傳媒大獎(jiǎng)年度小說家頒獎(jiǎng)詞如此評(píng)價(jià)《繁》:“他的寫作,有著話本式的傳統(tǒng)面影,骨子里亦貫通、流淌著先鋒文學(xué)的精神血脈。他將傳統(tǒng)資源、方言敘事、現(xiàn)代精神匯聚為一爐,為小說如何講述中國(guó)生活創(chuàng)造了新的典范?！盵4]103。本研究運(yùn)用計(jì)量的方法,發(fā)現(xiàn)《繁》與其他小說一樣，在句法結(jié)構(gòu)及語(yǔ)言序列特征方面均遵循人類語(yǔ)言的相關(guān)定律,同時(shí)也具有與其他小說所不同的特征,其獨(dú)特的句式結(jié)構(gòu)在當(dāng)代小說中脫穎而出。在大多數(shù)現(xiàn)代小說都受到翻譯腔影響的背景下,《繁》采取了獨(dú)具匠心的語(yǔ)言表達(dá),其“盛開的閃耀韻致”讓人感到耳目一新,不禁回首拾掇傳統(tǒng)“漢語(yǔ)腔”的神髓。

現(xiàn)代文體研究離不開現(xiàn)代研究方法[34],通過科學(xué)統(tǒng)計(jì)方法對(duì)文本特征進(jìn)行測(cè)量,不僅可以為以直覺為基礎(chǔ)的相關(guān)研究提供客觀的驗(yàn)證,同時(shí)也反映了科學(xué)統(tǒng)計(jì)方法在研究不同作家風(fēng)格中的重要作用。對(duì)不同小說的句式特點(diǎn)采用數(shù)學(xué)模型方法進(jìn)行考察亦是一種新的嘗試,為作家風(fēng)格研究提供了一種新的路向。

當(dāng)代小說句式特征的計(jì)量研究——《繁花》與其他10部茅盾文學(xué)獎(jiǎng)作品對(duì)比

一 引言

二 語(yǔ)料構(gòu)成

三 漢語(yǔ)腔特點(diǎn)

四 整齊并置的短句