尚 英,宋 柔,盧達威
(1. 北京語言大學(xué) 預(yù)科教育學(xué)院,北京,100083 2. 北京語言大學(xué) 語言信息處理研究所,北京,100083)
話題是當(dāng)前漢語本體研究和語言信息處理研究中的熱點。趙元任[1]指出“把主語、謂語當(dāng)做話題和說明來看待,較為合適。”朱德熙[2-3]繼承了這種觀點。Li 和 Thompson[4]從類型學(xué)的角度指出漢語屬話題凸顯的語言,后又對句子的話題和主語做了系統(tǒng)對比。徐烈炯,劉丹青[5]認(rèn)為漢語中話題被高度語法化,成了一種句法成分。曹逢甫[6-7]在漢語篇章層面上提出了“主題鏈”概念;沈開木[8]、屈承熹[9]、許余龍[10]等也在篇章層面對話題進行了研究。呂叔湘[11]、范繼淹[12]、沈家煊[13]發(fā)展了趙元任的零句說,關(guān)注了漢語流水句現(xiàn)象,同時對漢語話題也有深入研究;陳平[14]從零形回指的角度探討了漢語話題推進情況。
話題研究在理論探索過程中取得了豐富的成果,綜觀這些成果,可以看到: 目前關(guān)于漢語話題的研究在理論上進行了多方面探討,由于不以應(yīng)用為直接目標(biāo),所得結(jié)論和規(guī)則還不能直接用于信息處理等領(lǐng)域。例如,關(guān)于“話題”的論述中的最基本的單位——漢語的句子,有的人進行了定義,而有的人沒有。依據(jù)現(xiàn)有的關(guān)于漢語“句子”的定義,在實際語料中仍然難以清晰地把握“句子”的邊界。此外,上述成果在觀點論證過程中多采用舉例的方法,少見大規(guī)模真實語料的系統(tǒng)性調(diào)查分析。目前研究多引口語和敘述體小說中的實例,這在一定程度上束縛了研究范圍,將視野放至多語體將更有助于漢語話題及話題結(jié)構(gòu)的深入研究。
宋柔[15]面向語言工程的需要,以標(biāo)點句為基本單位,提出了廣義話題結(jié)構(gòu)的概念和表示方法,歸納出了廣義話題結(jié)構(gòu)遵從的堆棧模型并拓展為流水模型,指出廣義話題結(jié)構(gòu)具有兩個重要性質(zhì): 話題的不可穿越性和話題自足句的成句性。本文在38萬字不同語體的廣義話題結(jié)構(gòu)語料庫中,基于人工標(biāo)注對話題自足句的成句性進行了實證性調(diào)查和研究。
話題自足句是在廣義話題結(jié)構(gòu)理論的基礎(chǔ)上定義的。漢語篇章中的每個標(biāo)點句都對應(yīng)一個話題自足句。如果標(biāo)點句不共享其他標(biāo)點句中成分,那么它的話題自足句就是它本身。否則,設(shè)標(biāo)點句c在廣義話題結(jié)構(gòu)S中,S是根據(jù)流水模型理論表示的,把c在S中的話題逐個地按原順序補充到c的左端,把c在S中的說明或說明尾部逐個地按原順序補充到c的右端,最后得到的就是c在S中的話題自足句。“自足”的意思是,c在字面上能找到的話題都找到了,都集中在這個“句子”中。例如,
例1
普通八哥較常見,通體黑色,嘴基上羽額聳立,形成羽幘;頭頂、頰、枕和耳羽具綠色金屬光澤;
我們用表1顯示例中標(biāo)點句與話題自足句之間的對應(yīng)關(guān)系,左欄是標(biāo)點句換行縮進圖示,右欄是每個標(biāo)點句對應(yīng)的話題自足句,其中標(biāo)下劃線的部分是補上的話題。
表1 例1的標(biāo)點句與話題自足句的對應(yīng)
話題自足句具有成句性,這是從話題和篇章的角度說的。任何自然語言中“句子”的成句性都是無法嚴(yán)格定義的,漢語缺少形式標(biāo)記,更無法嚴(yán)格定義,區(qū)分是否成句的操作基礎(chǔ)只能是語感。這種語感的大致意思是: 語法通順并且語義清楚正確。反過來說,不成句的話題自足句或者是語法不通,或者是語義不清甚至語義錯亂。
趙元任、朱德熙、沈家煊等人指出,漢語的主謂關(guān)系就是話題—說明關(guān)系。因此可以說漢語中結(jié)構(gòu)完整的“成句”的單位,具有話題—說明關(guān)系。那么,反過來,一對具有話題—說明關(guān)系的詞語串,中間不加標(biāo)點,是否能連成句呢?
從理論上說,這個問題的答案是否定的。因為我們談的是廣義話題結(jié)構(gòu),包括狀中關(guān)系、述賓關(guān)系等結(jié)構(gòu),它們句法成分不完整,通常會導(dǎo)致語義不清。當(dāng)然,從實際調(diào)查中看,廣義話題結(jié)構(gòu)中大多數(shù)的話題—說明關(guān)系,從句法結(jié)構(gòu)的角度看就是主謂關(guān)系,這對于成句性是一種正面的保障。
語料庫的調(diào)查說明,絕大多數(shù)話題自足句都是成句的。上例的話題結(jié)構(gòu)中用堆棧模型生成話題自足句S1—S5都是成句的。再看下面的例子。
例2
……已編入‖《愛因斯坦文集》,
中文本 共3卷,
由許良英、趙中立、范岱年、李寶恒、張宣三編譯,
這個話題結(jié)構(gòu)用節(jié)棧模型生成話題自足句S1—S3如下,都是成句的:
S1: ……已編入《愛因斯坦文集》,
S2: 《愛因斯坦文集》中文本共3卷,
S3: 《愛因斯坦文集》中文本由許良英、趙中立、范岱年、李寶恒、張宣三編譯,
例3
『制定……,
繼續(xù)……,』
是全國人民關(guān)心的大事。
這是匯流模型的話題結(jié)構(gòu),標(biāo)記“『』”括起來的標(biāo)點句,其說明部分在括號后面。用匯流模型生成話題自足句如下。
S1: 制定……是全國人民關(guān)心的大事。
S2: 繼續(xù)……是全國人民關(guān)心的大事。
S1、S2都是成句的。
例4
吃完晚飯,
邢老漢叼著煙鍋想說點什么,
這是話題后置的話題結(jié)構(gòu),用逆向堆棧模型生成話題自足句:
S1: 邢老漢吃完晚飯,
S2: 邢老漢叼著煙鍋想說點什么,
S1、S2都是成句的。
由上文話題自足句的生成過程可以看出,每個話題自足句只帶一個說明。如果其中的話題在標(biāo)點句序列中還帶有其他說明,那些說明就被割除了。畢竟少了信息,且去除了標(biāo)點句間的停頓,于是可能發(fā)生語法不通、語義不清甚至錯亂的情況,使得少數(shù)話題自足句不成句。
首先,漢語中沒有天然的“句子”。在現(xiàn)實的漢語篇章中,只能看到標(biāo)點句?;趶V義話題理論的話題自足句可看作抽象的“句子”在漢語中存在的現(xiàn)實形態(tài)。這種句子同其他語言中的“句子”處于同一語法層面。漢語學(xué)界對于理想的“單句”已經(jīng)進行了長期深入的研究,積累了大量成果。于是,把話題自足句當(dāng)作單句,當(dāng)作從標(biāo)點句到篇章的中間層次,是一種理論上和實踐上都比較理想的篇章語法體系構(gòu)建方法。
第二,對于語言信息處理來說,把話題自足句當(dāng)作從標(biāo)點句到篇章的中間層次也是比較適當(dāng)?shù)?。計算語言學(xué)對于單句的分析已經(jīng)比較成熟。話題自足句相當(dāng)于單句,其中積聚了比較完整的信息,對于機器翻譯、信息提取、自動文摘等應(yīng)用具有現(xiàn)實的價值。話題自足句的成句性則保證了單句分析的成果能夠運用到話題自足句上來。
第三,漢語篇章中約一半的標(biāo)點句需要從廣義話題結(jié)構(gòu)中共享話題信息。聽者/讀者在聽/讀的過程中,接收的只是標(biāo)點句。把標(biāo)點句所缺少的信息補充完整,應(yīng)當(dāng)是人的認(rèn)知過程不可或缺的一步。話題自足句具有如下性質(zhì): 信息比較完整;保全了標(biāo)點句的詞序,而詞序?qū)τ跐h語的重要性是大家的共識;生成過程足夠簡單,可以適應(yīng)人腦實時處理標(biāo)點句的需要。由于話題自足句的這些性質(zhì),我們雖然不能說人在這一步認(rèn)知過程結(jié)束時,大腦中存儲的認(rèn)知結(jié)果的形式一定是一個話題自足句,但可以猜想這種認(rèn)知結(jié)果的形式同話題自足句具有相當(dāng)大的相似性。因此,話題自足句的研究對于探索人的語言認(rèn)知過程具有重要意義。
第四,我們特別關(guān)注話題自足句中少數(shù)不成句的現(xiàn)象,詳盡地調(diào)查和發(fā)現(xiàn)這類實例,歸納這種現(xiàn)象的特征,研究使其成句的方法。這樣做的目的有4個。一是通過話題自足句成句性的視角,發(fā)掘漢語中過去未曾注意到的語言現(xiàn)象,推進漢語的研究;二是基于這些特征,想辦法通過完善廣義話題結(jié)構(gòu)的模型,改進話題自足句的構(gòu)造方法,提高話題自足句的成句率;三是基于這些特征,剔除不成句的話題自足句,從而提高使用話題自足句的應(yīng)用系統(tǒng)的性能;四是發(fā)現(xiàn)話題自足句與人的認(rèn)知結(jié)果在形式上的差異,進一步探索人的認(rèn)知機制。
4.1.1 篇章功能成分
有的篇章功能成分用在話題與說明之間,導(dǎo)致話題與說明相連以后不成句??煞?類。
4.1.1.1 句間連詞
有些句間連詞如“但是”、“并且”“然后”等,可以用在用作說明的獨立標(biāo)點句之首,可以用在兩個具有相應(yīng)邏輯關(guān)系的說明之間,但不能用在話題與說明之間。當(dāng)用作說明的標(biāo)點句句首有這種成分時,話題與說明相連所形成的話題自足句就不成句。
例5
在企業(yè)管理工作開展的過程中,預(yù)算管理一直是整項工作開展的重要內(nèi)容,其不僅對資金運用效率提升具有重要促進作用,同時也為企業(yè)決策有效的財務(wù)數(shù)據(jù)支撐。但是,在目前階段,各個企業(yè)對于財務(wù)預(yù)算管理工作的開展并未充分重視起來,導(dǎo)致企業(yè)資金運行受到限制,無法為員工提供更好的工作環(huán)境和工作條件?;诖?,針對以預(yù)算為核心的財務(wù)管理制度建設(shè)這一課題進行了深入探討,具有重要現(xiàn)實意義。
他房子里只有一鋪炕和兩個舊得發(fā)黑的木板箱,
“但”是表示轉(zhuǎn)折的句間連詞,它可以出現(xiàn)在標(biāo)點句之首,包括話題前和說明前(如本例那樣),可以出現(xiàn)在兩個具有轉(zhuǎn)折關(guān)系的說明之間,如“他數(shù)學(xué)很好但語文很糟”,但不能出現(xiàn)在話題與說明之間。當(dāng)它出現(xiàn)在用作說明的標(biāo)點句的首部時,如果把話題和說明部分連成一個話題自足句,這個問題就暴露出來了?!八孔永锏帐暗玫购芨蓛簟!敝小暗碧幵诰渥又髦^關(guān)系的話題與說明之間,導(dǎo)致了話題自足句句法不通。為解決這個問題,可以修改廣義話題結(jié)構(gòu)理論中話題自足句的處理方法,在對話題自足句作句法分析時臨時把連詞“但”刪除,待進行話題自足句之間的邏輯關(guān)系分析時,再考慮“但”的功能。又如,
例6
1976年4月,
他再次失去一切職務(wù),
“并”是表示遞進的連詞,它可以出現(xiàn)在標(biāo)點句之首,也可以用在兩個具有遞進意義的說明之間,但不能出現(xiàn)在話題與說明之間。本例中話題和說明部分連成一個話題自足句“1976年4月他并受到錯誤批判”“并”處在句子主謂關(guān)系的話題與說明之間,導(dǎo)致了話題自足句句法不通。
這類連詞是一個封閉的集合,在話題自足句生成過程中如果遇到這些連詞,正常順序下不成句,可以通過機械的辦法將其調(diào)整成句。
4.1.1.2 代詞
有些代詞可以離開上下文單獨使用,如“你、我、他”等,有的代詞離開上文語境便不能獨立使用,如“其、其余、前者”等。它們也是可以出現(xiàn)在標(biāo)點句首,但不能出現(xiàn)在話題后面。否則,一旦把話題和說明連成話題自足句,就會導(dǎo)致語法不通。
例7
大黃魚是鱸形目石首魚科黃魚屬的1種。
……
體長橢圓形,
側(cè)扁。
尾柄細(xì)長,
例中最后一個標(biāo)點句,話題與說明連接成話題自足句“大黃魚尾柄其長為其高的3倍多”句法不通,原因是代詞“其”雖然能作主語,但不能出現(xiàn)在它指代的名詞的后面緊鄰處,因而生成話題自足句時,不能出現(xiàn)在話題和說明之間。
還有一些篇章成分,由于在語料中出現(xiàn)次數(shù)較少,在此略去。
4.1.2 標(biāo)點句中賓語成為新支話題
標(biāo)點句中的賓語被后面的標(biāo)點句說明形成新支話題結(jié)構(gòu),此時新支話題作為原標(biāo)點句中的賓語,往往是不定指的,但是在生成的話題自足句中是主語,通常要求定指,否則句法錯誤。為此,要將不定指變成定指,辦法是加定指代詞“這、這些”等。如果原來新支話題以“一”加量詞的數(shù)量結(jié)構(gòu)開始,其中的數(shù)詞“一”往往要刪除。
例8
C1:那都是‖些愣頭愣腦的小伙子 。
C2: 前天把一個賣瓜子的捆了一繩子,
C3: 昨天又把一個木匠的家伙收了,
C4: 害得人連哭帶嚎。
例中新支話題是“些愣頭愣腦的小伙子”,與說明“前天把一個賣瓜子的捆了一繩子,”“昨天又把一個木匠的家伙收了,”連接成話題自足句時,須在話題前加定指代詞“這”,使得話題自足句成為“這些愣頭愣腦的小伙子前天把一個賣瓜子的捆了一繩子,”“這些愣頭愣腦的小伙子昨天又把一個木匠的家伙收了,”“這些愣頭愣腦的小伙子昨天又害得人連哭帶嚎?!?/p>
例9
邢老漢思忖了幾鍋子煙的工夫,
思忖出了‖一個主意 ,
就是給狗求得一個官方保護。
上例中的新支話題“一個主意”,是不定指的,與說明“就是給狗求得一個官方保護”連接成話題自足句“一個主意就是給狗求得一個官方保護”時,所表示的語義成了“主意之一”。如果要保持原意又要語法通順,就須在話題前加定指代詞“這”,同時需要刪除數(shù)詞“一”,成為“這個主意就是給狗求得一個官方保護?!?/p>
語料中我們還發(fā)現(xiàn)兩例新支話題結(jié)構(gòu)因文言而導(dǎo)致話題與說明連接不成句的情況,此處不詳述。
首先我們將話題自足句語義問題分為3大類: 第一類是首部語義缺失,歸為主語省略句;第二類話題自足句主謂齊全,但語義不清楚;第三類是話題自足句主謂齊全,能夠獨立表達清楚的語義,但是獨立表達的語義與其在標(biāo)點句序列中的語義不一致。
主語省略句情況復(fù)雜,受篇幅所限,需另文詳述,這里只討論其它兩類。
4.2.1 語義不清
話題所在句(準(zhǔn)確地說是話題所在的標(biāo)點句所對應(yīng)的話題自足句。這里和下面的例子中,為了避免行文繁雜,就直接說話題所在句)中的舊對象,與說明標(biāo)點句中的新對象,在標(biāo)點句序列中的關(guān)系是清晰的,當(dāng)中間的標(biāo)點句被隔離,話題與說明直接相連成為話題自足句時,這種成分之間的語義關(guān)系可能模糊不清,需要添加虛性詞顯性地表示它們的關(guān)系。從語料調(diào)查中的情況看,引起語義不清的成分,其語義角色主要有以下幾種。
4.2.1.1 時間
例10
C1:慈云桂是中國計算機專家。
……
C2: 中華人民共和國成立后 ,
C3: 任副教授、教授、……,
C4: 長期從事……工作。
例中“中華人民共和國成立后”一句是事件性時間,同時它帶有兩個說明需要形成內(nèi)層話題結(jié)構(gòu),是外層話題“慈云桂”的說明,直接生成話題自足句為:
S3: 慈云桂中華人民共和國成立后任副教授、教授、系主任……,
S4: 慈云桂中華人民共和國成立后長期從事教學(xué)和研究工作,
S3、S4的語義結(jié)構(gòu)關(guān)系是{主體1+時間+行為}。
主體和行為之間插入時間成分時,時間成分通常是簡單的時間名詞、時間名詞短語,例如,
我昨晚上急得一夜沒睡著。
馬西莫夫2006年出任哈政府副總理。
他們黃昏前到達了另一個村鎮(zhèn)。
當(dāng)時間成分為事件性時間時,通常該事件行為與時間成分后面的行為均由同一主體發(fā)出或者是模糊的主體,例如,
他畢業(yè)后回了上海。
我們開會前先收拾一下會議室。
事件性時間“畢業(yè)后”、“開會前”中的行為“畢業(yè)”、“開會”的主體有兩種可能,一種是與時間成分后面的行為主體統(tǒng)一,前一例都是“他”,后一例是“我們”;另一種可能是“畢業(yè)”、“開會”的主體是模糊的,不特別指明。
事件性時間{主體2+行為+時間方位詞}中出現(xiàn)了新的主體即主體2,則兩個主體之間需要插入顯性的標(biāo)記,表示主體2是時間成分的開始,整個話題自足句可以分析為{主體1+{主體2+行為+時間方位詞}+行為};否則主體1與主體2關(guān)系不清楚,導(dǎo)致整個句子語義模糊。上例中的S3、S4即是這種情況。
這種情況下,需要在主體2前加形式標(biāo)記,本例中可以加介詞“在”:
S3: 慈云桂在中華人民共和國成立后任副教授、……,
S4: 慈云桂在中華人民共和國成立后長期從事教學(xué)和研究工作,
4.2.1.2 處所
新舊對象之間存在主體與處所、處所與狀態(tài)的關(guān)系,需要通過加詞的方式將處所成分顯性表示出來。
例11
c1: 斑鰶是鯡形目鯡科斑鰶屬的1種,
……
c2: 分布于印度到東印度群島和朝鮮及日本南部,
c3: 中國沿海均有分布。
上例話題“斑鰶”為已有對象,與標(biāo)點句c3中“中國沿?!笔侵黧w與處所的關(guān)系,可以在處所成分前加“在”,對應(yīng)的話題自足句是:
斑鰶在中國沿海均有分布。
4.2.1.3 存在物、部件、可用設(shè)施或擁有物
話題與跨標(biāo)點句的說明中的對象是主體與存在物、部件、可用設(shè)施、擁有物等關(guān)系時,常需要在對象前加“有”表示主體和對象之間的關(guān)系。
例12
c1: 帶魚是鱸形目帶魚科帶魚屬的1種(見圖帶魚外形)。
……
c2: 卵徑約為1.4~2.2毫米,
c3: 油球一個,
c4: 油球徑為0.4~0.5毫米;
標(biāo)點句c3中的“油球”是卵的一個部件,需要在前面插入“有”,得到話題自足句“帶魚卵有油球一個,”使其關(guān)系明確,語義清楚。
4.2.1.4 類屬與特征
話題與跨標(biāo)點說明中的新對象是種屬或主系關(guān)系,需要在種屬、主系間加系詞“為/是”。
例13
角鮟鱇亞目無腹鰭,
無假鰓,
副蝶骨與額骨不連接,
體側(cè)扁,
深海魚類,
最后一個標(biāo)點句“深海魚類”是話題“角鮟鱇亞目”的父類,如果直接生成話題自足句為“角鮟鱇亞目深海魚類”,不自然,中間加上“為/是”生成話題自足句“角鮟鱇亞目為(是)深海魚類,”。
4.2.1.5 動詞論元
漢語中二價動詞,如果施事S和受事O同時出現(xiàn),則可能的順序有3種: SVO,SOV,OSV。例如,
① 我喝牛奶了。 ④ 小華認(rèn)識小剛。
② 我牛奶喝了。 ⑤ 小華小剛認(rèn)識。
③ 牛奶我喝了。 ⑥ 小剛小華認(rèn)識。
①~③三個句子,盡管語序不同,但表達了同樣的語義關(guān)系,兩個論元中,“我”是“喝”的施事,“牛奶”是“喝”的受事。我們認(rèn)為之所以上例中O與S位置可以靈活出現(xiàn),是因為二者的詞匯語義決定了與V的語義關(guān)系,否則它們的順序調(diào)整會受限,往往需要其他手段予以輔助,以便理解。例如,
④~⑥三個句子中只有④的語義是清晰的,⑤⑥的語義不清楚,因為“小剛”與“小華”對于“認(rèn)識”的語義關(guān)系不確定,如果將二者放在一起,盡管從語序上有前后之分,但還是難以理解。
在廣義話題結(jié)構(gòu)中,有時候話題與跨標(biāo)點句說明連接成話題自足句時,有些OSV或者SOV的語序不能表達原有的語義或者存在歧義,這時我們?yōu)榱吮WC語義的清晰,需要對話題自足句中的相關(guān)成分進行調(diào)序。
例14
白朗軍長驅(qū)入陜,
攻占商南等地,
一度逼近西安。
又沿渭水西進,
由隴縣進入甘肅省境。
陜西一帶哥老會紛紛歸附,
在上例標(biāo)點句序列中,最后一個標(biāo)點句表達的語義是“陜西一帶哥老會紛紛歸附白朗軍”。但在堆棧模型下生成的話題自足句為“白朗軍陜西一帶哥老會紛紛歸附”,這個句子本身可接受度差;另外如果沒有足夠的歷史知識,可能會將“陜西一帶哥老會”與“白朗軍”當(dāng)作隸屬關(guān)系,可見這種表達還會影響到語義的理解,因此需要調(diào)序。
調(diào)序超出了流水模型現(xiàn)有的功能范圍,所以這類現(xiàn)象列在現(xiàn)有體系無法覆蓋的范圍內(nèi)。
4.2.1.6 復(fù)雜關(guān)系要素不全
復(fù)雜關(guān)系句所述的關(guān)系涉及多個要素,其中有些要素在上文提到,下文往往省略。話題自足句脫離了廣義話題結(jié)構(gòu)的語境,是孤立的,在被省略成分不能作為話題被共享的情況下,話題自足句可能發(fā)生語義不清的問題。
例15
c1:2004年 ,
c2: 國內(nèi)生產(chǎn)總值達到13.65萬億元,
c3: 比上年增長9.5%;
c4: 財政收入2.63萬億元,
c5: 增長21.4%;
c6: 社會消費品零售總額5.4萬億元,
c7: 增長13.3%;
c8: 進出口貿(mào)易總額1.15萬億美元,
c9: 增長35.7%,
c10: 由上年居世界第四位上升為第三位;
c5、c7、c9對應(yīng)的話題自足句為:
S5: 2004年財政收入增長21.4%;
S7: 2004年社會消費品零售總額增長13.3%;
S9: 2004年進出口貿(mào)易總額增長35.7%;
“增長”關(guān)系需要說明增長的主體、增長的基點、增長量。在標(biāo)點句序列中三個標(biāo)點句所說的對象增長率都是比較于基點“上年”而說的,但是在話題結(jié)構(gòu)中,由于省略了比較對象,生成的話題自足句S5、S7、S9缺失了增長基點,從而導(dǎo)致語義表達不清楚。因此需要將缺失的關(guān)聯(lián)對象“比上年”補出來。這一對象的補足可通過模式匹配的方式從上文中獲取。
還有個別更為復(fù)雜的情況,限于篇幅此處略去。
4.2.2 語義錯亂
跨標(biāo)點句的說明如果關(guān)聯(lián)到話題所在句中的幾個對象,其中有的是話題,另一些是其他關(guān)聯(lián)要素,它們并不相鄰,用現(xiàn)有流水模型不能把它們都提取出來,話題自足句由于關(guān)聯(lián)對象缺失而致語義失解。此時需要在適當(dāng)位置插入話題所在句中的非話題的關(guān)聯(lián)對象,并且常常需要添加介詞、結(jié)構(gòu)助詞等虛詞,使關(guān)聯(lián)對象之間的關(guān)系得以清晰表達。這種處理方式超出了現(xiàn)有流水模型的功能,只能歸入現(xiàn)有流水模型無法覆蓋的范圍。
例16
c1: 安徽省……
c2: 澇災(zāi)則以淮河流域較多,
c3: 主要出現(xiàn)在7~8月;
c4: 次為長江流域,
c5: 多出現(xiàn)在6~7月。
例中標(biāo)點句c3、c5對應(yīng)的話題自足句分別是:
S3: 安徽省澇災(zāi)主要出現(xiàn)在7~8月,
S5: 安徽省澇災(zāi)多出現(xiàn)在6~7月,
原文要表達的語義是“安徽省澇災(zāi)在淮河流域主要出現(xiàn)在7~8月”,“安徽省澇災(zāi)在長江流域多出現(xiàn)在6~7月”,而由于“淮河流域”和“長江流域”無法作為話題被共享,話題自足句S3、S5表達的語義錯誤,背離了原文要表達的語義。需要在此類情況下補足必要的成分,有時還需要另加虛詞,以保證話題自足句的通順合法,因此例中需要在“淮河流域”和“長江流域前”加介詞“在”,如此處理后生成的話題自足句如下:
S3: 安徽省澇災(zāi)在淮河流域主要出現(xiàn)在7~8月,
S5: 安徽省澇災(zāi)在長江流域多出現(xiàn)在6~7月,
這樣的處理方法超出了流水模型的功能范圍。
還有些現(xiàn)象涉及到對象的動態(tài)變化,限于篇幅本文不加討論。
本文界定了話題自足句及其成句性,闡述了研究話題自足句及其成句性的意義,列舉并分析了語料中話題自足句不成句的主要情況,并做了詳細(xì)分類。主要分為兩大類: 句法不通和語義不清或錯亂。其中句法不通的情況主要是篇章連接成分導(dǎo)致話題自足句不成句和新支話題不定指導(dǎo)致話題自足句不成句。篇章連接成分是一個封閉的集合且出現(xiàn)的位置固定在標(biāo)點句首,新支話題不定指的情況具有較好的形式特征,能夠用機械化的辦法將不定指變?yōu)槎ㄖ福虼丝傮w上可以通過改進流水模型中話題自足句的生成方法,將其不成句的問題解決掉。
據(jù)統(tǒng)計,語料中共有30 963個標(biāo)點句,對應(yīng)30 963個話題自足句,其中有1 963個不成句的話題自足句。不成句的話題自足句根據(jù)不成句原因的分類情況如表2所示。
表2中其他語義不清或語義錯亂類的話題自足句不成句的語言現(xiàn)象比較復(fù)雜,在現(xiàn)有流水模型的機制中無法提供改進機制使得話題自足句成句。這些現(xiàn)象實例雖然分了多個類別,但是從整個語料來看,所占比例很少。這些現(xiàn)象的處理方法并非完全無跡可循,例如,對于復(fù)雜關(guān)系句引入模式匹配的方法就是一種可以探索的途徑。還有相當(dāng)多的部分可以通過加入介詞等功能詞來解決。這些可能的解決途徑不僅為廣義話題結(jié)構(gòu)流水模型的改進提供了可能的方向,而且對于探索說漢語者在聽/讀標(biāo)點句序列過程中的話題信息認(rèn)知機制,提供了十分有益的啟示。
表2 話題自足句不成句現(xiàn)象的分類情況
受篇幅限制,本文對上表中的主語省略句未進行詳細(xì)說明,其他各類中也有些出現(xiàn)數(shù)量少的細(xì)類無法詳細(xì)示例解釋,相關(guān)內(nèi)容可參見筆者的博士學(xué)位論文。
本文是廣義話題結(jié)構(gòu)理論實證性研究的一部分,說明話題自足句是隱藏在漢語篇章中的一種客觀存在的、通常具備成句性的語言單位,少數(shù)不成句的則有若干系統(tǒng)性的原因。實證性研究對于科學(xué)理論的可靠性、可用性具有重要意義,但只是相關(guān)理論研究的一部分。漢語篇章廣義話題結(jié)構(gòu)的研究剛剛開始,其中最具實質(zhì)性的課題之一是如何分析判斷標(biāo)點句之間的話題—說明關(guān)系。這一工作具有極大的挑戰(zhàn)性,是我們今后工作的目標(biāo),需要在實證性研究工作的基礎(chǔ)上,經(jīng)過長期努力來解決。
[1] 趙元任.漢語口語語法(呂叔湘譯)[M].北京:商務(wù)印書館,1979.
[2] 朱德熙.語法講義[M].北京: 商務(wù)印書館,1982.
[3] 朱德熙.語法答問[M].北京: 商務(wù)印書館,1985.
[4] Li C, Thompson S. Subject and Topic: A New Typology of Language[M]New York: Academic Press,1976: 457-489.
[5] 徐烈炯,劉丹青.話題的結(jié)構(gòu)與功能[M].上海: 上海教育出版社,1998.
[6] 曹逢甫.主題在漢語中的功能研究:邁向語段分析的第一步[M].北京: 語文出版社,1979.
[7] 曹逢甫.漢語的句子與子句結(jié)構(gòu)[M].北京: 北京語言大學(xué)出版社,1990.
[8] 沈開木.現(xiàn)代漢語話語語言學(xué)[M].北京: 商務(wù)印書館,1996.
[9] 屈承熹.漢語篇章語法[M].北京: 北京語言大學(xué)出版社,2006.
[10] 許余龍.篇章回指的功能語用探索[M].上海: 上海外語教育出版社,2004.
[11] 呂叔湘.漢語語法分析問題[M].北京: 商務(wù)印書館,1979.
[12] 范繼淹.漢語句段研究[C],范繼淹語言學(xué)論文集,北京: 語文出版社,1986: 252-270.
[13] 沈家煊. “零句”和“流水句”-為趙元任先生誕辰120周年而作[J].中國語文,2012(5): 403-415.
[14] 陳平.漢語零形回指的話語分析[J].中國語文,1987(5): 363-378.
[15] 宋柔.漢語篇章廣義話題結(jié)構(gòu)的流水模型[J].中國語文,2013(6): 483-494.
[16] 蔣玉茹,宋柔.基于廣義話題理論的話題句識別[J],中文信息學(xué)報, 2012(5): 114-128.
[17] 尚英.漢語篇章廣義話題結(jié)構(gòu)理論的實證性研究[D],北京: 北京語言大學(xué)博士學(xué)位論文,2014.
[18] 尚英,宋柔.基于廣義話題結(jié)構(gòu)語料庫的語體對比研究——以報告體與小說體為例[J].計算機工程與應(yīng)用,2014(11): 21-27.
[19] 張瑞朋.現(xiàn)代漢語書面語中跨標(biāo)點句句法關(guān)系約束條件的研究[D],北京: 北京語言大學(xué)博士學(xué)位論文,2007.