陳芯瑩
(西安交通大學 外國語學院,陜西 西安 710049)
有關語言,人類從未停止過對如下幾個問題的思考:為什么只有人類有語言?語言是如何出現(xiàn)、演變和發(fā)展的?語言為何是現(xiàn)在的這個樣子?這些問題都屬于語言演化研究的范疇。語言演化研究根據(jù)時間尺度的不同,又可劃分為宏觀史、中觀史和微觀史研究[1]。語言如何隨著人類的文明累積,經(jīng)過幾萬年的演化發(fā)展并涌現(xiàn)出來是宏觀史的研究問題。中觀史則將時間尺度縮短,更加關注同一語言或不同語言之間的演化和相互關系,例如語言家族的研究,歷時音變的研究等等。每一個活的語言作為動態(tài)復雜適應系統(tǒng)[2],都是在不停地變化的。而語言演化的微觀史研究則更多地在考察正在發(fā)生的演化現(xiàn)象,例如語言的社會變體,雙語地區(qū)的語言競爭等等。與語言學的其他研究方向相類似,無論是哪一類的語言演化研究,由于缺乏必要的科學研究手段和實證數(shù)據(jù),傳統(tǒng)上更為側重內省式研究。然而,隨著眾多學科在技術上的進步和發(fā)展,語言研究逐漸引入實證方法。同時借助豐富的自然語言語料和先進的技術,從不同學科不同方法來研究語言演化問題已經(jīng)成為可能。
有關漢語歷時演變的研究主要集中在語音演變、漢字或詞匯演變、語法演變等幾個方面。由于漢語的書面語在較早的時期已經(jīng)趨于穩(wěn)定,漢語在相當長的一段歷時發(fā)展時期都采用了類似的文字書寫系統(tǒng),因此,傳統(tǒng)的漢語歷時演化研究更多地把注意力放在了漢語語音的演化研究上。這類側重語音、兼顧詞匯與語法變化的傳統(tǒng)漢語演變研究取得了不少成果[2-3]?;谡Z音、詞匯和語法的變化,語言學家將漢語演化歷史劃分為四個時期:上古漢語,中古漢語,近代漢語和現(xiàn)代漢語[2-3]。除去對漢語史進行劃分,語言學家們還采用案例分析的方法對漢字、漢語詞匯和語法的變化進行了研究,并取得了不錯的成果[4-7]。例如,經(jīng)過研究發(fā)現(xiàn)了漢語詞匯的雙音節(jié)化演變趨勢[8]。除此之外,也有基于漢語歷時語料庫和定量分析的漢語歷時演化研究[9],但較少見。而基于網(wǎng)絡分析方法的漢語歷時演化研究僅有一例,有研究者[10]通過構建字同現(xiàn)網(wǎng)絡模型,模擬和考察了漢字在漢語歷時發(fā)展過程中的演化趨勢,發(fā)現(xiàn)了高頻的漢字更可能被重復使用來組成新詞??傮w來說,諸如統(tǒng)計分析、網(wǎng)絡分析之類的現(xiàn)代跨學科研究方法仍然沒有在這一研究領域得到廣泛的應用。
與此同時,網(wǎng)絡分析,一個非?,F(xiàn)代化和典型的跨學科研究方法,已經(jīng)被應用到了漢語共時研究的許多其他方向,如現(xiàn)代漢語漢字網(wǎng)絡的結構特點研究,現(xiàn)代漢語詞匯和短語網(wǎng)絡的小世界特點研究,漢語語音網(wǎng)絡的統(tǒng)計特性研究,漢語音節(jié)網(wǎng)絡的結構特點,漢語句法網(wǎng)絡的復雜網(wǎng)絡特性,漢語句法網(wǎng)絡的中心節(jié)點研究,漢語句法網(wǎng)絡中的詞類配價模式研究,以及漢語語義網(wǎng)絡的統(tǒng)計特性研究等等[11-13]。
將網(wǎng)絡分析方法用于語言研究的優(yōu)勢不僅僅在于其先進強大的數(shù)據(jù)統(tǒng)計和分析能力,更在于它將語言材料作為一個整體結構來進行描述分析的獨特視角。語言是一個復雜系統(tǒng),這一被普遍接受的語言學觀點直至網(wǎng)絡分析方法的出現(xiàn),才真正地實現(xiàn)了從理論探討到實證研究的突破。而研究實踐也已經(jīng)證明,網(wǎng)絡分析方法可以被成功地應用到各類漢語共時研究當中,并獲得了較為豐富的研究成果。僅有的一例基于網(wǎng)絡分析的漢語歷時演化研究也顯示了網(wǎng)絡分析放在漢語演化研究當中的巨大潛力。
語言演化是一個連續(xù)的過程,而現(xiàn)有的研究成果和知識是對這一連續(xù)過程中的個別語言現(xiàn)象的片段描述,是若干分散于各個歷史時期的語言演化的局部“快照”。鮮有從語言系統(tǒng)的宏觀、整體角度的研究和認識,而一般用來模擬語言整體演變的模型過于簡單,很難真實地反映出語言演變的趨勢。如何通過累積不同時間尺度的快照,并將其合理地拼合成一幅完整而連貫的真實全景畫面,用以解釋人類語言的演變和發(fā)展,是當下語言演化研究面臨的一個重大命題。網(wǎng)絡分析方法所提供的宏觀視角,為語言演化的“全景式寫真快照”提供了可能。本文正是以此為目標,嘗試著將網(wǎng)絡分析方法進一步地應用到漢語的歷時演化研究當中,具體地說,是應用到漢語漢字的句法功能演化研究當中。
網(wǎng)絡分析方法是典型的跨學科研究方法。將它運用到漢語演化研究當中不但有助于漢語研究方法的現(xiàn)代化,還能增加漢語研究與其他學科研究之間的交流,促進相關研究的發(fā)展。同時,用現(xiàn)代科學的方法來研究探索人類所獨有的語言系統(tǒng),也是現(xiàn)代科學研究認識人類本質的必經(jīng)之路。只有采用科學的研究方法,才能對人類語言的獨有性和人類本質這些根本問題有更為深入和透徹的理解。
本文的研究思路如圖1 所示,包含了:(1)制定語料收集方案;(2)收集語料樣本;(3)對文本錯誤進行清理、校正;(4)根據(jù)文本語料庫構建同現(xiàn)網(wǎng)絡;(5)利用各類網(wǎng)絡分析工具PAJEK 分析不同時期的語言結構特征,對比數(shù)據(jù)并總結漢語系統(tǒng)的歷時演化趨勢;(6)分析“在”和“人”兩個單字詞在不同時期的語言特征變化,對比數(shù)據(jù)并總結兩個單字詞的演化趨勢;(7)結合語言網(wǎng)絡的整體參數(shù)的變化和兩個單字詞的參數(shù)變化,進行系統(tǒng)與單字詞的共演分析,總結描述漢語單字詞的句法功能演化趨勢。
圖1 應用網(wǎng)絡分析方法研究漢字句法功能演化的方法與流程
本研究主要依據(jù)王力[2]和向熹[3]先生的漢語史分期體系,隨機選擇了分屬上古漢語、中古漢語、近代漢語和現(xiàn)代漢語的真實文本語料作為研究所用的樣本語料。其中,上古漢語選取的語料是:荀子的《正名篇》。中古漢語選取的語料是:韓愈的《師說》和《進學解》、柳宗元的《捕蛇者說》、王勃的《滕王閣序》以及魏征的《諫太宗十思疏》。近代漢語選取的語料是:馬建忠的《馬氏文通》?,F(xiàn)代漢語選取的語料是:劉海濤的《計量語言學的現(xiàn)狀、理論與方法》。為了增加可對比性,所選語料均為論述文,且四個時期的語料規(guī)模大致相當,約為2800 字。
以上述真實文本為基礎,本研究分別構建了四個不同時期的漢字同現(xiàn)網(wǎng)絡。由于“同現(xiàn)”可以有不同定義,構建同現(xiàn)網(wǎng)絡的方法也有很多種,而本研究中定義的“同現(xiàn)”指兩個漢字在上述文本中的相鄰關系。如若兩個漢字在一個句子中先后相鄰出現(xiàn),則在代表這兩個漢字的網(wǎng)絡節(jié)點間建立聯(lián)系。由此類推,可以將上述的真實文本語料轉換成代表四個不同漢語時期的漢字同現(xiàn)網(wǎng)絡。下頁圖2 是一個簡易的字同現(xiàn)網(wǎng)絡的構建原理示意圖。
圖2 字同現(xiàn)網(wǎng)絡的構建原理示意圖
在構建了四個不同漢語時期的漢字同現(xiàn)網(wǎng)絡后,本研究分別對四個網(wǎng)絡的整體特征進行了分析,測量了它們的網(wǎng)絡節(jié)點數(shù)、平均度、聚類系數(shù)、平均路徑長度、直徑、網(wǎng)絡中心度和密度等網(wǎng)絡參數(shù)。通過對比分析這些網(wǎng)絡參數(shù)的歷時變化,來描述漢語語言系統(tǒng)的歷時演化。
同時,本研究還選取了“在”和“人”兩個高頻單字詞作為研究對象,分別觀察了它們在不同時期的同現(xiàn)網(wǎng)絡中的語言結構特征,測量了它們的節(jié)點度數(shù)在不同漢語時期的變化。之所以選擇“人”和“在”作為研究對象,是因為它們從古至今一直都是單字詞,受漢語雙音節(jié)化的影響相對較小。同時,“在”在漢語發(fā)展史中有明顯的語法化趨勢,而“人”則在句法和詞義上都無明顯變化,一直是實詞,沒有經(jīng)歷語法化的過程,這使得本研究可以在同現(xiàn)網(wǎng)絡中觀察單字詞語法化所帶來的網(wǎng)絡參數(shù)變化,并比較兩個不同單字詞的演化差異。
在考察了語言系統(tǒng)的整體變化,與“在”和“人”兩個單字詞的演化趨勢后,我們將兩者相結合分析,對漢語系統(tǒng)整體與具體語言現(xiàn)象之間的共同演化進行了描述,總結了漢字句法功能的歷時演變。
雖然本研究在討論具體語言現(xiàn)象的演化差異時僅僅集中討論了“在”和“人”兩個單字詞,但同樣的方法可以被應用到對其他漢字或單詞、短語的演化研究當中。研究雖然落腳在“在”與“人”兩個單字詞上,但卻實現(xiàn)了語言局部快照(單字詞演化)與語言全景快照(語言系統(tǒng)演化)的拼合,為語言演化研究成果的整合提供了一條新的途徑,為當下語言演化研究發(fā)展所急需的知識整合方案提供了新思路。
對于網(wǎng)絡結構分析研究來說,最常用的網(wǎng)絡參數(shù)是平均路徑長度、聚集系數(shù)、平均度、直徑等等[11-13]。本研究分別統(tǒng)計了不同歷史時期的四個漢字同現(xiàn)網(wǎng)絡的6 個主要網(wǎng)絡參數(shù),并對其作了對比分析,見圖3。
圖3 漢字同現(xiàn)網(wǎng)絡主要參數(shù)的變化趨勢
雖然四個不同時期的實驗文本規(guī)模相似,但據(jù)此所構建的四個字同現(xiàn)網(wǎng)絡的規(guī)模(不同漢字的數(shù)量)卻有著較為顯著的差異。本研究中,字同現(xiàn)網(wǎng)絡的節(jié)點是指不同的漢字。圖3 顯示,中古漢語的字同現(xiàn)網(wǎng)絡節(jié)點數(shù)要明顯大于其他三個時期的字同現(xiàn)網(wǎng)絡。由于文本規(guī)模相似,用字更為豐富的文本在轉換成字同現(xiàn)網(wǎng)絡時,則會擁有更多的節(jié)點。由此可知,本研究的中古漢語文本中所使用到的漢字要明顯比其他時期的文本更為豐富。一部分的原因可能是因為中古漢語部分的文本是由多個文本組合而成,所涉及的主題更為多樣化。更為本質、重要的原因則可能是因為這一時期的漢語書面語與日常口語的距離更大。這一時期的文學創(chuàng)作追求詞匯豐富、結構緊密的風尚使得這一時期的文本大多篇幅短小,遣字用詞豐富而考究。這些文學創(chuàng)作特點被保存在了中古漢語的文本里,在本研究當中則體現(xiàn)在了字同現(xiàn)網(wǎng)絡的規(guī)模差異上。
網(wǎng)絡的節(jié)點平均度數(shù)在本研究當中指的是每個漢字平均與幾個其他不同的漢字相鄰。在這四個不同時期的漢語文本當中,每個漢字平均與約5 -7 個不同的其他漢字有著同現(xiàn)關系(即前后相鄰的線性關系)。這一參數(shù)反映的是某一漢字的線性組合多樣性。漢字原本是單字詞,可以獨立擔當某些句法功能,在古代漢語中的漢字線性組合關系其實更多反映的是當時漢語的句法組合關系。但中古漢語時期,由于文本中的漢字豐富程度增加,不同的漢字分擔了原本由一個或少數(shù)漢字通常承擔的句法功能,由此造成了漢字線性組合多樣性的下降。從中古漢語到近代漢語時期,漢語書面語與口語的距離再次逐漸拉近,漢字的句法功能不再像中古漢語那樣分散;同時漢語中的雙音節(jié)詞開始占據(jù)主導地位,整體上來說,漢字本身的句法功能顯著減少,但構詞功能明顯增加,很多漢字都必須要與其他漢字組合才能擔當一定的句法功能。這些都增加了漢字線性組合的多樣性。近代漢語到現(xiàn)代漢語時期,漢語延續(xù)了上述的變化趨勢,因此漢字線性組合的多樣性進一步得到了增強。
在字同現(xiàn)網(wǎng)絡中,聚類系數(shù)反映的是與某一漢字具有同現(xiàn)關系的兩個漢字之間也存在線性關系的可能性。當這個參數(shù)大于相似規(guī)模的隨機網(wǎng)絡的聚類系數(shù)時,我們就稱之為小世界網(wǎng)絡。即任何兩個漢字之間都有可能通過少數(shù)的幾個漢字而串聯(lián)起來。小世界網(wǎng)絡特性廣泛地存在于各類真實網(wǎng)絡當中,例如社交網(wǎng)絡、萬維網(wǎng)絡、作者引用網(wǎng)絡等等。本研究中的四個網(wǎng)絡的聚類系數(shù)都要遠遠大于相似規(guī)模的隨機網(wǎng)絡的聚類系數(shù)。因此,可以初步判斷說這四個字同現(xiàn)網(wǎng)絡均具有小世界網(wǎng)絡的特性。
平均路徑長度是聚類系數(shù)相關聯(lián)的一個參數(shù)。它在同現(xiàn)網(wǎng)絡中描述的是,任意兩個漢字最少需要通過多少個不同漢字串聯(lián)起來。根據(jù)圖3 可知,這四個字同現(xiàn)網(wǎng)絡中的任意2 個節(jié)點之間的平均漢字個數(shù)不會超過4 個。結合對聚類系數(shù)的考察,可以確定它們都是小世界網(wǎng)絡。
密度這個概念在同現(xiàn)網(wǎng)絡中描述的是不同漢字之間的組合緊密程度。更通俗地講,就是兩個不同漢字同時出現(xiàn)的頻率高低。同現(xiàn)頻率高則密度更高,同現(xiàn)頻率低則密度更低。圖3 顯示,中古漢語的漢字線性組合最為松散,也就是說,漢字的組合搭配更為多樣,相對來說沒有那么固定。其次是近代漢語和上古漢語,現(xiàn)代漢語的漢字線性組合最為緊密。這可能與漢語詞匯的雙音節(jié)化有著較大的關系。詞匯的雙音節(jié)化使得漢字搭配更為固定,從而導致了網(wǎng)絡密度的增加。
網(wǎng)絡中心度參數(shù)在同現(xiàn)網(wǎng)絡中其實反映的是“超級明星漢字”存在的概率,即是不是有一些或者有多少出現(xiàn)頻率特別高、組合性特別強的明星漢字。依據(jù)圖3,網(wǎng)絡中心度:中古漢語<近代漢語<上古漢語<現(xiàn)代漢語。也就是說,中古漢語中明星漢字的數(shù)量或者使用頻率最少,而現(xiàn)代漢語中這類明星漢字的數(shù)量或者使用頻率最大。
直徑描述的是同現(xiàn)網(wǎng)絡中將組合出現(xiàn)頻率最低的兩個漢字串聯(lián)起來所需要的漢字數(shù)。這個參數(shù)其實描述了文本中低頻漢字的組合特點。低頻詞出現(xiàn)得越多,直徑就有可能越大。前面圖3 顯示,中古漢語的直徑最大而現(xiàn)代漢語的直徑最小。
盡管不同參數(shù)的變化趨勢和幅度各有不同,但從圖3 的折線形狀可以看出,所有的網(wǎng)絡參數(shù)變化都表明:漢語在從上古漢語發(fā)展到中古漢語后出現(xiàn)了轉折式的變化。同時,除了聚類系數(shù)外,其余網(wǎng)絡參數(shù)的變化曲線都表明,自中古漢語的“轉向”之后,這一變化趨勢一直延續(xù)到了近代漢語和現(xiàn)代漢語當中。為什么中古漢語在各個語言網(wǎng)絡特征指標上都明顯異于其他時期的漢語呢?可能的原因是,基于先秦口語發(fā)展起來的書面語文言在該時期開始脫離實際生活中的漢語口語,并越來越嚴重。這類與真實口語相分離的漢語書面語,直到1919年的五四運動之后,才通過改革運動又開始重新適應真實口語[2]。由于本研究的漢字同現(xiàn)網(wǎng)絡是基于文本構建的,所以反映的更多的是漢語書面語的歷時變化。而書面語與實際口語的脫離程度可能會影響到書面語的發(fā)展。例如,因為有更多的時間組織語言,對于文章易讀程度與審美傾向的取舍和側重等等,當書面語與實際口語相距較遠時,可能出現(xiàn)詞匯豐富程度增加,句子結構更為多樣等特征。而這些文本特征可能反映到了字同現(xiàn)網(wǎng)絡的參數(shù)當中。值得注意的是,研究語料的體裁、篇幅、風格等特點也都可能影響到文本的網(wǎng)絡參數(shù)。網(wǎng)絡數(shù)據(jù)的差異變化是不是主要由書面語與口語的背離發(fā)展所帶來的,則需要通過進一步的研究來證實。
盡管關于中古漢語書面語與口語相背離發(fā)展的觀點已被普遍接受,但先前的描述和理解都是內省式的。這類背離式的發(fā)展如何影響漢語的書面語?多大程度上影響了書面語的變化等問題?雖然不少針對個別作者或名著的微觀分析論證研究可以被認為是對這些問題的初步探討,但仍然缺乏宏觀的針對整個漢語系統(tǒng)的研究,或是相關探討由于缺乏真實數(shù)據(jù)的支持而未能對上述問題進行令人信服的、深入的分析和解答。以真實的語言數(shù)據(jù)為基礎,利用網(wǎng)絡分析方法,可以從系統(tǒng)宏觀的角度,真實地捕捉住并展現(xiàn)漢語書面語發(fā)展過程中的“轉向”現(xiàn)象,從而為描述和解答漢語書面語的演化問題,提供新的數(shù)據(jù)和方法參考。該研究方法因此而具有重大價值,值得進一步的嘗試和探討。
在觀察對比了漢字同現(xiàn)網(wǎng)絡整體特征的發(fā)展趨勢后,我們將目光轉向了語言系統(tǒng)當中的一類具體單位:單字詞。本研究考察了“在”和“人”這兩個單字詞的特征變化數(shù)據(jù)。
“在”與“人”在漢語的不同時期均是高頻漢字,并一直都是單字詞。雖然它們也受到漢語詞匯雙音節(jié)化的影響,但作為單字詞,它們在經(jīng)歷了變化后仍然保有比較完整的句法功能。因此較具對比性。
本研究測量了“在”和“人”的節(jié)點度數(shù)。所謂節(jié)點度數(shù),指的其實是在文本中與“在”和“人”相鄰出現(xiàn)的不同漢字的個數(shù)。從語言學的角度來說,字同現(xiàn)網(wǎng)絡中的節(jié)點度數(shù)描述的是一個漢字與其他不同漢字之間的線性組合關系的多樣性。度數(shù)越高,說明該漢字可以與更多的其他漢字產(chǎn)生相鄰的線性組合關系。為盡量減少網(wǎng)絡規(guī)模對數(shù)據(jù)的影響,使不同時期的數(shù)據(jù)之間更具對比性,本研究對所有數(shù)據(jù)都進行了標準化處理,見圖4。
圖4 “在”與“人”網(wǎng)絡參數(shù)的歷時變化
由圖4 可知,雖然均是高頻詞,除現(xiàn)代漢語時期外,“在”的度數(shù)要明顯低于“人”的度數(shù)。也就是說,“在”的線性組合能力要遠小于“人”的組合能力。但這一情況到現(xiàn)代漢語時期有了變化,“在”的線性組合能力經(jīng)過發(fā)展,在現(xiàn)代漢語中已經(jīng)具有與“人”相似的組合能力。觀察和對比圖4 中的曲線變化趨勢可知,“在”與“人”的曲線變化遵循相似的規(guī)律:從上古漢語發(fā)展到中古漢語,“在”與“人”的度數(shù)均有所降低;從中古漢語到近代漢語再到現(xiàn)代漢語,兩個漢字的度數(shù)都一再增加。明顯的不同點是:“在”從近代漢語到現(xiàn)代漢語時期的度數(shù)增加要明顯快于“人”同時期的度數(shù)增長。
經(jīng)過分析對比,本研究認為,造成這一變化差異的原因主要是“在”的語法化。作為高頻單字詞,“在”與“人”的區(qū)別是:“人”在漢語的歷時發(fā)展過程中,意義變化不大,一直都是實詞;而“在”則表現(xiàn)出了語法化的傾向,發(fā)展出了新的含義,在現(xiàn)代漢語中“在”既是實詞也是虛詞。語法化并不是一個連續(xù)、勻速變化的過程,它在某些階段的發(fā)展可能相較于其他階段更快或者更慢甚至停滯[7]。王偉的研究表明,“在”在上古漢語和中古漢語時期主要是作為動詞使用;在近代漢語時期它開始從動詞虛化成介詞和副詞;而在現(xiàn)代漢語時期它進一步地虛化,可作為“詞內結構”來使用。例如,名詞“在讀博士”[7]。同時,依據(jù)趙元任[14]的研究,由于受英語和英語翻譯的影響,“在”在現(xiàn)代漢語中被用作介詞的頻率大大增加。由于漢語是孤立語,實詞缺乏表示語法意義的形態(tài)變化,虛詞(和語序)作為表達漢語語法功能的主要手段,尤為重要。因此,作為虛詞的“在”比作為實詞的“在”能夠連接更多不同的詞,亦即虛詞“在”與實詞“在”相比,能夠與更多不同的漢字或詞產(chǎn)生線性組合關系,從而造成節(jié)點度數(shù)的增加。這可能是圖4 中,“在”與“人”在現(xiàn)代漢語時期發(fā)展趨勢不同的重要原因。
圖4 所示的數(shù)據(jù)允許我們對不同漢字(或單字詞)的演化過程進行對比。但語言作為一個完整的系統(tǒng)也是不停地處于動態(tài)變化之中的。例如,隨著新事物的出現(xiàn)和社會的發(fā)展,越來越多的新詞語出現(xiàn)在漢語的書面語當中。這些系統(tǒng)性的變化當然也會影響到系統(tǒng)當中的個體。所以,當我們在研究和考察諸如“語法化”之類的語言演化現(xiàn)象時,除了觀察和對比不同個體的變化,也應該考慮到語言系統(tǒng)變化對個體的影響,從而更為準確地區(qū)分出被考察個體的“真正”變化和它對動態(tài)語言系統(tǒng)的適應性變化。為此,本研究對比考察了圖4 兩條曲線和前面圖3 中平均度曲線的變化趨勢,見下頁圖5。
圖5 “在”與“人”以及字同現(xiàn)網(wǎng)絡系統(tǒng)的歷時變化
前文已經(jīng)提到,平均度描述的是網(wǎng)絡中所有節(jié)點平均擁有的鄰居節(jié)點數(shù),亦即度數(shù)。因此,它是與“在”和“人”的度數(shù)相對應的一個描述語言系統(tǒng)的指標。如果我們認為,節(jié)點平均度從某個角度實際上描述了不同時期漢語書面語的整體變化的話,則節(jié)點平均度的曲線可以被作為一個基線,用來衡量“在”和“人”的度數(shù)變化是“真正”的變化還是只是一種對系統(tǒng)變化的適應。從下頁圖5 可知?!叭恕睆纳瞎艥h語到中古漢語時期的變化基本與基線相符,很可能只是一種對語言系統(tǒng)性變化的適應,而從中古漢語到近代漢語時期,“人”的曲線變化要快于基線,這可能說明“人”在該階段時期的線性組合能力有明顯的提高,而從近代漢語到現(xiàn)代漢語時期的“人”的變化速率又趨于與基線一致?!霸凇睆纳瞎艥h語到中古漢語時期的變化相較于基線要小,也就是說,當漢字的平均線性組合能力均下降時,“在”的線性組合能力相對下降較小。而從中古漢語時期到近代漢語時期的曲線對比則表明,“在”的線性組合能力在該階段只有小幅的上升,而且因為其上升幅度要小于系統(tǒng)平均幅度,“在”的相對的線性組合能力其實是“明升實降”的。而從近代漢語到現(xiàn)代漢語時期,“在”的線性組合能力突然有了顯著性的提高。這一變化必然不是“在”對語言系統(tǒng)性變化的適應造成的,而本研究認為,“在”在此階段的快速語法化很可能是產(chǎn)生這一現(xiàn)象的重要原因。
通過網(wǎng)絡分析方法,利用各類網(wǎng)絡參數(shù)的對比,我們可以觀察到并定量地描述漢語系統(tǒng)整體變化的趨勢和速度。通過對四個不同時期的漢字同現(xiàn)網(wǎng)絡的平均度、聚類系數(shù)、平均路徑長度、直徑、網(wǎng)絡中心度和密度等網(wǎng)絡參數(shù)的分析和對比,描述了漢語書面語在中古漢語時期的發(fā)展轉向現(xiàn)象。傳統(tǒng)的歷時演變研究,由于研究方法的局限,沒辦法對漢語系統(tǒng)整體的變化進行類似的、比較精確的描述。同時,對“在”和“人”兩個漢字的節(jié)點度數(shù)的演化對比研究,說明了“語法化”的演化過程是非線性的,“在”在近代漢語到現(xiàn)代漢語的發(fā)展過程中,“語法化”的速度和程度都明顯增加。同時,本研究還首次實現(xiàn)了具體語言現(xiàn)象與語言系統(tǒng)變化的共演對比研究,研究結果更為精確,可信度更高。
本研究最主要的目的是利用新興的網(wǎng)絡分析方法來研究漢語的歷時演化發(fā)展,從而加深對相關研究問題的理解。利用網(wǎng)絡分析方法來進行研究的核心優(yōu)勢是,它為語言研究提供了一種新的系統(tǒng)性分析方法。現(xiàn)代語言學理論的一個核心假設是:語言是一個復雜適應系統(tǒng)[15]。但是這個被廣泛接受的觀點,由于缺乏合適的、實際可操作的方法,一直保持在一個純理論的討論水平。由于語言是一個復雜適應系統(tǒng),它必然有一些規(guī)則特征是無法直接從個體單位的特征中觀察到的。以真實文本為基礎,構建并分析語言網(wǎng)絡,為系統(tǒng)地觀察語言系統(tǒng)的宏觀特征提供了一個行之有效的操作方法,并為研究語言系統(tǒng)與語言單位個體之間的聯(lián)系提供了新的手段。盡管本研究僅對兩個單字詞“在”和“人”的句法功能的歷時演化進行了探討,但同樣的方法可以被應用到任何一個漢字、詞、短語等的研究當中。這類研究方法從系統(tǒng)整體的角度將原本已有的語言演化“局部快照”,合理地拼合起來,從而提供一種對語言系統(tǒng)“全景式”的變化描述。字詞等具體語言單位的研究在該方法下被統(tǒng)一到整個語言系統(tǒng)的研究當中,從而使得我們可以對語言系統(tǒng)整體及局部細節(jié)都有更加深入的理解。
網(wǎng)絡分析方法已在其他學科研究領域當中展現(xiàn)了巨大的潛力,它為語言學研究所帶來的新視角,也必將推進漢語歷時演化研究的發(fā)展,為未來的相關研究提供先進的研究方法,并使研究結果無論為本研究領域還是其他學科研究領域提供更有意義的對比參考。網(wǎng)絡分析方法的引入,將為漢語的歷時演化研究翻開新的一頁。
[1]王士元.語言演化的三個尺度[J].科學中國人,2013(1):16 -20.
[2]王 力.漢語史稿[M].北京:中華書局,1980.
[3]向 熹.簡明漢語史[M].北京:高等教育出版社,1993:2.
[4]韓玉強.“在+L+VP”結構中處所介詞形成的語法化歷程和機制[J].語文研究,2011(1):21 -27.
[5]沈家煊.“語法化”研究綜觀[J].外語教學與研究,1994(4):17 -24.
[6]文 旭.《語法化》簡介[J].當代語言學,1998(3):47 -48.
[7]王 偉.論“在”的語法化[J].西安外國語大學學報,2009(3):27 -31.
[8]呂叔湘.現(xiàn)代漢語單雙音節(jié)問題初探[J].中國語文,1963(1):1.
[9]劉丙麗,劉海濤.基于語料庫的漢語動詞句法配價歷時研究[J].語言教學與研究,2011(6):83 -89.
[10]Liang W,Shi Y,Huang Q.Modeling the Chinese language as an evolving network[J].Physica A,2014(393):268 -276.
[11]Cong J,Liu H.Approaching human language with complex networks[J].Physics of Life Reviews,2014(4):598 -618.
[12]劉海濤.語言網(wǎng)絡:隱喻,還是利器[J].浙江大學學報:人文社會科學版,2011(2):169 -180.
[13]陳芯瑩,劉海濤.漢語句法網(wǎng)絡的中心節(jié)點研究[J].科學通報,2011(1):735 -740.
[14]Chao Y R.A grammar of spoken Chinese[M].Berkeley:University of California Press,1968.
[15]Kretzschmar W A.The linguistics of speech[M].New York:Cambridge University Press,2009.