• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      漢語(yǔ)話頭話身關(guān)系分析影響因素研究*

      2024-01-11 08:41:58盧達(dá)威
      學(xué)術(shù)研究 2023年12期
      關(guān)鍵詞:標(biāo)點(diǎn)常識(shí)句法

      盧達(dá)威

      一、話頭話身結(jié)構(gòu)和話頭話身關(guān)系分析

      話頭話身關(guān)系是話題說明關(guān)系的擴(kuò)展。漢語(yǔ)是話題顯著型語(yǔ)言。在單句層面表現(xiàn)為“主語(yǔ)即話題”;①趙元任:《漢語(yǔ)口語(yǔ)語(yǔ)法》,北京:商務(wù)印書館,1979 年,第45 頁(yè);朱德熙:《語(yǔ)法答問》,北京:商務(wù)印書館,1985 年,第38 頁(yè);沈家煊:《“零句”和“流水句”》,《中國(guó)語(yǔ)文》2012 年第5 期。在篇章層面,話題可以通過平行推進(jìn)或?qū)蛹?jí)推進(jìn)等零形回指方式②陳平:《漢語(yǔ)零形回指的話語(yǔ)分析》,《中國(guó)語(yǔ)文》1987 年第5 期。以及其他方式被后續(xù)的小句談?wù)摚瑥亩鴺?gòu)成超越單句的“主題鏈”③曹逢甫:《漢語(yǔ)的句子與子句結(jié)構(gòu)》,北京:北京語(yǔ)言大學(xué)出版社,2005 年,第53-54 頁(yè)?;颉皾h語(yǔ)句”④[美]屈承熹:《漢語(yǔ)篇章語(yǔ)法》,潘文國(guó)等譯,北京:北京語(yǔ)言大學(xué)出版社,2006 年,第282 頁(yè)。。宋柔⑤宋柔:《漢語(yǔ)敘述文中的小句前部省略現(xiàn)象初析》,《中文信息學(xué)報(bào)》1992 年第3 期;宋柔:《現(xiàn)代漢語(yǔ)跨標(biāo)點(diǎn)句句法關(guān)系的性質(zhì)研究》,《世界漢語(yǔ)教學(xué)》2008 年第2 期;宋柔:《漢語(yǔ)篇章廣義話題結(jié)構(gòu)的流水模型》,《中國(guó)語(yǔ)文》2013 年第6 期;宋柔:《小句復(fù)合體的語(yǔ)法結(jié)構(gòu)》,北京:商務(wù)印書館,2022 年,第18 頁(yè)。對(duì)單句層面和篇章層面中的“話題/主題”概念進(jìn)行了統(tǒng)一和擴(kuò)展,認(rèn)為被談?wù)摰某煞旨瓤梢允菃尉鋵用娴模部梢允瞧聦用娴?,而且不僅可以是體詞性成分,還可以是謂詞性成分、環(huán)境成分、狀語(yǔ)性成分,甚至介詞、連詞等,⑥宋柔:《小句復(fù)合體的語(yǔ)法結(jié)構(gòu)》,第26 頁(yè)。故使用了“話頭(naming)”的說法,以免與傳統(tǒng)話題混淆。話頭所對(duì)應(yīng)的說明成分則稱為“話身(telling)”。一個(gè)話頭可對(duì)應(yīng)多個(gè)話身,話頭及其所有話身組成的結(jié)構(gòu)叫“話頭話身結(jié)構(gòu)(Naming-telling Structure)”。

      在實(shí)際語(yǔ)料中,話頭話身結(jié)構(gòu)的概念更有利于語(yǔ)篇結(jié)構(gòu)描寫。語(yǔ)篇是由一個(gè)個(gè)標(biāo)點(diǎn)句⑦標(biāo)點(diǎn)句指以逗號(hào)、分號(hào)、句號(hào)、嘆號(hào)、問號(hào)、直接引語(yǔ)的冒號(hào)、部分波折號(hào)和刪節(jié)號(hào)(關(guān)于波折號(hào)和刪節(jié)號(hào)的細(xì)節(jié)將另文說明)分隔的語(yǔ)段(宋柔:《小句復(fù)合體的語(yǔ)法結(jié)構(gòu)》,第15 頁(yè))。構(gòu)成的,但超過50%的標(biāo)點(diǎn)句句法或語(yǔ)義不完整。①盧達(dá)威、宋柔、尚英:《從廣義話題結(jié)構(gòu)考察漢語(yǔ)篇章話題的認(rèn)知復(fù)雜度》,《中文信息學(xué)報(bào)》2014 年第5 期。這些句法語(yǔ)義不完整的標(biāo)點(diǎn)句大多能夠在上文(少數(shù)情況是下文)找到所缺失(或稱共享)的“話頭”,這些標(biāo)點(diǎn)句本身就是“話身”,從而形成話頭話身結(jié)構(gòu)。與話題說明不同的是,話頭話身結(jié)構(gòu)允許層層嵌套,一個(gè)話頭話身結(jié)構(gòu)允許話身是一個(gè)話頭話身結(jié)構(gòu)。在話頭話身結(jié)構(gòu)理論中,標(biāo)點(diǎn)句通過話頭話身關(guān)系組成話頭話身結(jié)構(gòu),進(jìn)而組成篇章,形成了“標(biāo)點(diǎn)句—話頭話身結(jié)構(gòu)—篇章”的語(yǔ)篇組織方式。本文研究話頭與話身的關(guān)系,是要探究標(biāo)點(diǎn)句如何通過話頭共享組織成話頭話身結(jié)構(gòu);以及通過研究話頭補(bǔ)全過程,探究語(yǔ)言認(rèn)知和理解的過程。為清晰展現(xiàn)話頭話身結(jié)構(gòu),我們將整個(gè)篇章按照每個(gè)標(biāo)點(diǎn)句占一行的方式來排列,并將話身標(biāo)點(diǎn)句縮進(jìn)到話頭的右邊,這樣就可以把話頭和話身的關(guān)系直觀展現(xiàn)(如表1),這種篇章表示方法稱為“換行縮進(jìn)圖式”。②宋柔:《現(xiàn)代漢語(yǔ)跨標(biāo)點(diǎn)句句法關(guān)系的性質(zhì)研究》,《世界漢語(yǔ)教學(xué)》2008 年第2 期;宋柔:《漢語(yǔ)篇章廣義話題結(jié)構(gòu)的流水模型》,《中國(guó)語(yǔ)文》2013 年第6 期;宋柔:《小句復(fù)合體的語(yǔ)法結(jié)構(gòu)》,第19-20 頁(yè)。

      表1 以換行縮進(jìn)圖式展示話頭話身結(jié)構(gòu)

      表1 是賓州中文樹庫(kù)(Chinese Tree Bank,CTB)的一段新聞?wù)Z料,我們用換行縮進(jìn)圖式對(duì)這段新聞進(jìn)行排列后,得到了如表1 所示的呈現(xiàn)形式。從話頭話身結(jié)構(gòu)的角度看,整體段落7 個(gè)標(biāo)點(diǎn)句(c1~c7)構(gòu)成以“西藏銀行部門”為最外層話頭的話頭話身結(jié)構(gòu)(例中話頭用“ □ ”表示)?!拔鞑劂y行部門”的話身有三個(gè),分別是“積極調(diào)整信貸結(jié)構(gòu)”(c1)、目的連詞“以”為話頭的話頭話身結(jié)構(gòu)(c2~c3)和以“去年”為話頭的話頭話身結(jié)構(gòu)(c4~c7)。其中“去年”的話身也有3 個(gè),分別是以“新增貸款”為話頭的話頭話身結(jié)構(gòu)(c4~c5),“農(nóng)牧業(yè)……億元”(c6)和“鄉(xiāng)鎮(zhèn)……點(diǎn)八三”(c7)。從標(biāo)點(diǎn)句的角度看,除c1 不缺話頭外,c2~c7 都缺少部分話頭,有的缺少一層話頭(如c2 和c4),有的缺少兩層話頭(如c3、c6、c7),有的缺少三層話頭(如c5)。以c5 為例,“比上年增加八億多元”不完整,缺少話頭。檢索上下文發(fā)現(xiàn)c5 說的是“新增貸款”(在c4),屬于實(shí)體話頭;③話頭話身結(jié)構(gòu)理論中包含四種類型話頭:實(shí)體話頭、環(huán)境話頭(包括時(shí)間和處所)、謂詞話頭和狀性話頭(宋柔:《漢語(yǔ)篇章廣義話題結(jié)構(gòu)的流水模型》,《中國(guó)語(yǔ)文》2013 年第6 期)。補(bǔ)全后看似完整,再往前還發(fā)現(xiàn)環(huán)境話頭“去年”(在c4),這是“新增貸款比上年增加八億多元”發(fā)生的時(shí)間;再往前發(fā)現(xiàn)c5還有另一實(shí)體話頭“西藏銀行部門”(在c1),這是“新增貸款”的領(lǐng)有者。再往前已沒有其他能夠進(jìn)一步補(bǔ)充說明c5 的部分了,至此,c5 補(bǔ)全話頭后完整的信息應(yīng)該是“西藏銀行部門去年新增貸款比上年增加八億多元”,補(bǔ)全后的句子叫作“話頭話身自足句”(Naming-telling Clause)。其中,“新增貸款”是直接話頭,“西藏銀行部門”和“去年”都是間接話頭。

      以上對(duì)表1 的分析發(fā)現(xiàn),識(shí)別各標(biāo)點(diǎn)句的話頭需要對(duì)標(biāo)點(diǎn)句進(jìn)行話頭話身關(guān)系分析。話頭識(shí)別的研究可以幫助我們了解人在閱讀理解時(shí)對(duì)標(biāo)點(diǎn)句的認(rèn)知過程,進(jìn)而幫助計(jì)算機(jī)進(jìn)行話頭話身結(jié)構(gòu)自動(dòng)識(shí)別。但這是一項(xiàng)復(fù)雜的任務(wù)。對(duì)人來說,憑語(yǔ)感進(jìn)行話頭識(shí)別很容易,這個(gè)過程甚至是無意識(shí)的。但我們更想知道,所謂的“語(yǔ)感”究竟包含了哪些內(nèi)容?也就是說,人在話頭話身關(guān)系的識(shí)別過程中,究竟調(diào)用了哪些語(yǔ)言特征和語(yǔ)言知識(shí)?以及這些特征和知識(shí)如何協(xié)調(diào)和互動(dòng)?哪些因素起了關(guān)鍵作用?調(diào)用順序如何?對(duì)這些問題的研究,一方面從語(yǔ)言認(rèn)知的角度,能夠?qū)θ祟愓Z(yǔ)言理解有更深刻的認(rèn)識(shí);另一方面,從語(yǔ)言計(jì)算的角度,話頭話身結(jié)構(gòu)識(shí)別可以檢驗(yàn)語(yǔ)言學(xué)知識(shí)和規(guī)律的正確性,也有助于計(jì)算機(jī)信息抽取、信息摘要、機(jī)器翻譯等工程應(yīng)用。

      本文正是在已有話頭話身結(jié)構(gòu)理論的基礎(chǔ)上,從語(yǔ)言認(rèn)知和語(yǔ)言計(jì)算的角度出發(fā),分析話頭話身關(guān)系,挖掘話頭識(shí)別過程中所涉及的影響因素和因素間的互動(dòng)關(guān)系。為此,我們構(gòu)造了一個(gè)“話頭話身結(jié)構(gòu)語(yǔ)料庫(kù)”,對(duì)30963 個(gè)標(biāo)點(diǎn)句、約37.8 萬字的語(yǔ)料進(jìn)行了人工的話頭話身結(jié)構(gòu)標(biāo)注,內(nèi)容涉及百科釋文、小說和政府工作報(bào)告等語(yǔ)體類型。其中,百科釋文包括生物、地理、歷史事件和人物4 種題材;小說包括當(dāng)代小說、現(xiàn)代章回小說和古代白話小說。考察語(yǔ)料發(fā)現(xiàn),話頭話身關(guān)系涉及語(yǔ)義、句法、語(yǔ)境、常識(shí)、百科知識(shí)等影響因素。以下我們將對(duì)這些影響因素逐一考察。

      二、影響話頭話身關(guān)系分析的語(yǔ)義因素

      考察語(yǔ)料發(fā)現(xiàn),話頭話身分析中最主要的影響因素是語(yǔ)義知識(shí),這是標(biāo)點(diǎn)句話頭識(shí)別分析的基礎(chǔ)。語(yǔ)義知識(shí)對(duì)人來說顯而易見,但從語(yǔ)言理解過程看,我們不知道自己調(diào)用了哪些知識(shí)以及這些知識(shí)的調(diào)用過程。從語(yǔ)言計(jì)算角度,理解語(yǔ)義則是比較困難的。雖然人工智能大語(yǔ)言模型(如ChatGPT 等)已具有一定的語(yǔ)義知識(shí),但這些模型是一個(gè)黑箱,無法知道其識(shí)別過程,且對(duì)語(yǔ)義的理解不穩(wěn)定。因此,我們?nèi)孕枰獙?duì)影響話頭話身關(guān)系的語(yǔ)義因素進(jìn)行挖掘。目前發(fā)現(xiàn)的語(yǔ)義特征有以下類型。

      (一)話頭和話身主要謂詞的語(yǔ)義關(guān)系

      這主要是指話頭和話身謂詞的語(yǔ)義搭配關(guān)系(如表2)。表2 展現(xiàn)了語(yǔ)料中最普通的話頭話身結(jié)構(gòu),其中c1 不缺話頭,c2 缺少話頭。從語(yǔ)言認(rèn)知過程看,c2 的話頭補(bǔ)全過程如下。首先,判斷c2 缺話頭的原因。本句缺少話頭的原因是核心謂語(yǔ)“倒酒”的論元數(shù)量不足,“倒酒”缺少語(yǔ)義上的主體論元。第二,判斷缺失話頭的類型。根據(jù)語(yǔ)義常識(shí),“倒酒”的主體應(yīng)該是人。第三,查找c1 的所有成分(“小姐”“啟開”“酒瓶”),并逐一識(shí)別其語(yǔ)義類型(“小姐”是人,“啟開”是動(dòng)作,“酒瓶”是物品)。第四,匹配c2 對(duì)話頭的語(yǔ)義要求和c1 的候選話頭語(yǔ)義類型,得到c2 的話頭是“小姐”。從語(yǔ)言計(jì)算的角度,以上認(rèn)知過程可以形式化為話頭識(shí)別的基礎(chǔ)算法,其中語(yǔ)義搭配知識(shí)和語(yǔ)義類型知識(shí)可以從語(yǔ)義詞典①如由北京大學(xué)袁毓林教授開發(fā)的《漢語(yǔ)實(shí)詞信息詞典》。該詞典包含名詞的物性結(jié)構(gòu)知識(shí),形容詞、動(dòng)詞的論元結(jié)構(gòu)知識(shí)等,特別是物性結(jié)構(gòu)知識(shí)包含了豐富的與名詞所指事物有關(guān)的常識(shí)(詳見袁毓林、曹宏:《“漢語(yǔ)形容詞句法語(yǔ)義功能信息詞典暨檢索系統(tǒng)”知識(shí)內(nèi)容說明書》,《辭書研究》2019 年第2 期;袁毓林、曹宏:《〈動(dòng)詞句法語(yǔ)義信息詞典〉知識(shí)體系及其檢索界面》,《中文信息學(xué)報(bào)》2022 年第8 期。或者語(yǔ)料統(tǒng)計(jì)中獲得。

      表2 話頭和話身主要謂詞之間的語(yǔ)義關(guān)系示例

      話頭和話身謂詞的語(yǔ)義搭配關(guān)系是其他語(yǔ)義特征的基礎(chǔ),話頭和話身謂詞的語(yǔ)義關(guān)系是最基本的語(yǔ)義關(guān)系。語(yǔ)料調(diào)查中發(fā)現(xiàn),大部分標(biāo)點(diǎn)句的話頭靠話頭和話身的謂詞的語(yǔ)義搭配就可以識(shí)別。

      (二)大話頭與小話頭的語(yǔ)義關(guān)系

      有的標(biāo)點(diǎn)句缺少話頭的原因不是核心謂詞的論元不足,而是當(dāng)句首為一階名詞或者一些意義不自足詞語(yǔ)時(shí),缺少其依附成分。這類詞語(yǔ)相當(dāng)于一個(gè)小話頭,需要在上文找到所依附的成分作為大話頭。小話頭與其依附的大話頭的語(yǔ)義關(guān)系主要有:局部和整體、部分與全體、屬性與主體、事物與領(lǐng)有者,以及空間(或時(shí)間)參照關(guān)系、人際參照關(guān)系等(如表3)。②張瑞朋:《現(xiàn)代漢語(yǔ)書面語(yǔ)中跨標(biāo)點(diǎn)句句法關(guān)系約束條件的研究》,北京:中國(guó)社會(huì)科學(xué)出版社,2013 年,第37-40 頁(yè)。

      表3 大話頭與小話頭之間的語(yǔ)義關(guān)系示例

      表3(a)句首“年均溫度”是一種屬性,其屬性主體是“澳門”。表3(b)c1 的“安徽省”和c2 句首“銅陵”構(gòu)成大小處所的關(guān)系,“安徽省”成為c2的話頭。表 3(c)c1 的“1912 年10 月”與“9日”以及c2 句首“17、18 日”構(gòu)成大小時(shí)間的關(guān)系。大小話頭的語(yǔ)義關(guān)系也可以歸納為詞匯知識(shí),在話頭識(shí)別時(shí),這類知識(shí)可以作為語(yǔ)義搭配知識(shí)的補(bǔ)充。

      (三)前句主語(yǔ)和賓語(yǔ)的語(yǔ)義關(guān)系

      單靠上文話頭和話身謂詞的搭配以及大小話頭語(yǔ)義關(guān)系有時(shí)還不足以確定話頭。例如,在判斷句中,前句主語(yǔ)和賓語(yǔ)在語(yǔ)義搭配上能與話身搭配,但主賓語(yǔ)的語(yǔ)義關(guān)系不同,會(huì)影響是否作為話頭。若前句的主語(yǔ)和賓語(yǔ)分別是類和子類或類和元素的語(yǔ)義關(guān)系時(shí),傾向于以子類或元素作為本句話頭(如表4)。表4(a)c2 和c3 句首“眼”“背鰭”都是身體部件名稱,c1 的“條紋蝦魚”和“中國(guó)玻甲魚科”語(yǔ)義上都能成為部件的主體。在沒有其他標(biāo)記的情況下,傾向于以子類為話頭,即“條紋蝦魚”。而且這與句法無關(guān),即使我們把上例稍作變動(dòng),以“條紋蝦魚”作主語(yǔ),語(yǔ)感上仍然認(rèn)為c2~c3 在描述“條紋蝦魚”(如表4(a1))。在語(yǔ)料庫(kù)中真實(shí)的例子如表4(b)。表4(b)c2 句首是器官名詞“體”,需要依附于生物全體構(gòu)成整體與器官關(guān)系。僅看詞匯語(yǔ)義,c1 中“電鰻目”“硬骨魚綱”都能與之搭配?!半婗犇俊笔亲宇悾坝补囚~綱”是父類,“電鰻目”更傾向于成為話頭。

      表4 前句主語(yǔ)和賓語(yǔ)之間的語(yǔ)義關(guān)系示例

      可見主賓語(yǔ)的語(yǔ)義關(guān)系也能影響話頭識(shí)別。判斷句中傾向以概念更具體、外延更小的成分為話頭。

      (四)話身謂語(yǔ)語(yǔ)義類型

      標(biāo)點(diǎn)句本身謂語(yǔ)動(dòng)詞的語(yǔ)義類型對(duì)話頭話身關(guān)系也有較大影響。若缺話頭的標(biāo)點(diǎn)句的謂語(yǔ)是表達(dá)屬性、狀態(tài)等靜態(tài)描寫的語(yǔ)義時(shí),傾向于以前句動(dòng)詞賓語(yǔ)為話頭;若標(biāo)點(diǎn)句的謂語(yǔ)動(dòng)詞是表達(dá)動(dòng)作、事件等動(dòng)態(tài)描寫的語(yǔ)義時(shí),傾向于以前句主語(yǔ)為話頭(如表5)。表5(a)和(b)的c1 相似,c2 不同。表5(a)的c2 的句首是“臉上”,核心謂語(yǔ)是“有些紅點(diǎn)”,無論從搭配角度還是大小話頭關(guān)系看,c1 的“兩人”或“孫小姐”在句法和語(yǔ)義上都能成為c2 的話頭。但從語(yǔ)感可知,c2 是對(duì)“孫小姐”的進(jìn)一步說明,其話頭應(yīng)該是c1 的賓語(yǔ)“孫小姐”。表5(b)不同在于,雖然c1 的“鴻漸”和“孫小姐”在句法語(yǔ)義等方面也都能作為c2 的話頭,但從語(yǔ)感可知c2 的話頭是主語(yǔ)“鴻漸”而不是“孫小姐”。造成以上差別的原因是:表5(a)的c2 是靜態(tài)描寫,這種情況往往是對(duì)前句賓語(yǔ)(通常在句子的信息結(jié)構(gòu)中是新事物)的進(jìn)一步解釋說明。而表5(b)c2 的核心謂詞“說”是動(dòng)作性較強(qiáng)的語(yǔ)義類型,往往是前句主語(yǔ)的時(shí)間上連續(xù)的動(dòng)作??梢?,標(biāo)點(diǎn)句本身的語(yǔ)義類型也有重要影響。

      表5 話身謂語(yǔ)語(yǔ)義類型差異示例

      (五)非直接句子成分充當(dāng)話頭

      在上文的討論中,我們默認(rèn)話頭成分是一個(gè)能夠直接充當(dāng)句子成分的短語(yǔ)結(jié)構(gòu)。實(shí)際上,在一定的語(yǔ)義因素影響下,句子成分的局部也可能成為話頭,如定中結(jié)構(gòu)的定語(yǔ)或主謂結(jié)構(gòu)的主語(yǔ)等(如表6)。表6(a)(b)(c)中,c2 都以c1 中定中結(jié)構(gòu)的定語(yǔ)為話頭,而這個(gè)定中結(jié)構(gòu)在c1 中分別是主語(yǔ)、賓語(yǔ)、介詞賓語(yǔ)。雖然句法各異,但語(yǔ)義上這幾個(gè)定語(yǔ)都是中心語(yǔ)是領(lǐng)有者,故成為c2 的話頭。這不是特例,定中結(jié)構(gòu)中表環(huán)境、領(lǐng)屬、類型等的定語(yǔ),都有可能成為后句話頭(如表7)。表7(a)是語(yǔ)料庫(kù)原文,c2 的話頭“1995 年末居民儲(chǔ)蓄存款余額”呈現(xiàn)為定中結(jié)構(gòu),只要有需要,定語(yǔ)的各個(gè)部分幾乎都能成為話頭。比如我們可以自擬出表7(b)(c)(d)的例子。表7(b)(c)(d)中c2 的話頭分別是“存款”“居民”“1995 年末”,在語(yǔ)義上分別與中心語(yǔ)“余額”構(gòu)成環(huán)境、領(lǐng)屬、類型等關(guān)系。c2 句與其構(gòu)成話頭話身關(guān)系的原因既包括句式的對(duì)齊,也包括大小話頭的語(yǔ)義關(guān)系??梢姡m然從傳統(tǒng)的句法分析角度看,定語(yǔ)與中心語(yǔ)是修飾關(guān)系,定語(yǔ)是名詞短語(yǔ)的一個(gè)成分,不是句子的直接成分,不影響句子格局,但從話頭話身結(jié)構(gòu)看,定語(yǔ)和中心語(yǔ)在語(yǔ)用上可能是一系列潛在的嵌套的話頭話身關(guān)系。

      表6 定中結(jié)構(gòu)的領(lǐng)屬定語(yǔ)充當(dāng)話頭的示例

      表7 定中結(jié)構(gòu)的各類型定語(yǔ)充當(dāng)話頭的示例

      除了定中結(jié)構(gòu)外,當(dāng)句子主語(yǔ)是主謂結(jié)構(gòu)時(shí),其主語(yǔ)也可能充當(dāng)話頭(如表8)。表8(a)c2 的話頭是主謂賓結(jié)構(gòu)“建設(shè)規(guī)模超過國(guó)家財(cái)力、物力的可能”,其主語(yǔ)部分“建設(shè)規(guī)?!边€可以獨(dú)立做話頭。例如,我們可以根據(jù)句法平行結(jié)構(gòu)的原則追補(bǔ)出以c1“建設(shè)規(guī)?!睘樵掝^(如表8(b)的c3)。

      表8 主謂結(jié)構(gòu)的主語(yǔ)充當(dāng)話頭的示例

      當(dāng)然,以上的例子只說明存在這樣的現(xiàn)象,并非所有定中結(jié)構(gòu)的定語(yǔ)都能成為話頭。例如描寫性的定語(yǔ)(如“漂亮的女孩”中的“漂亮”)就不能與中心語(yǔ)形成話頭話身關(guān)系,不能被后續(xù)話身說明。

      (六)小結(jié)

      從上述語(yǔ)義特征可知,在認(rèn)知話頭話身關(guān)系時(shí),首先確認(rèn)造成話頭缺失的原因,如果是核心謂語(yǔ)的主體論元缺失,則要考慮話身與候選話頭的語(yǔ)義搭配;如果標(biāo)點(diǎn)句句首有小話頭,則要考慮候選話頭與句首小話頭的語(yǔ)義關(guān)系;判斷句中,傾向于概念更具體、外延更小的成分為話頭;如果話身標(biāo)點(diǎn)句表達(dá)靜態(tài)描寫,一般是一種解釋說明,傾向于以非句首的成分為話頭;另外,表環(huán)境、領(lǐng)屬、類型的定語(yǔ)和主謂結(jié)構(gòu)的主語(yǔ)也可能成為話頭。

      三、影響話頭話身關(guān)系分析的句法因素

      這里說的句法因素,主要是指在進(jìn)行標(biāo)點(diǎn)句的話頭話身關(guān)系分析時(shí),能夠從字面識(shí)別的,或者經(jīng)過簡(jiǎn)單句法分析能夠識(shí)別的特征。已發(fā)現(xiàn)的句法特征有關(guān)聯(lián)詞語(yǔ)、平行結(jié)構(gòu)和語(yǔ)篇停頓。這些句法特征一般與語(yǔ)義因素不沖突,主要起到標(biāo)記提示的作用。

      (一)關(guān)聯(lián)詞語(yǔ)

      關(guān)聯(lián)詞語(yǔ)對(duì)話頭話身關(guān)系分析有明顯的提示作用,特別是標(biāo)點(diǎn)句句首有“就”“便”“所以”“但是”等后連詞時(shí),該句傾向于共享前句的主語(yǔ)作話頭(如表9)。表9(a)的c1 主語(yǔ)“王腳”和賓語(yǔ)“兒子王肝和女兒王膽”,在語(yǔ)義上都能與c2“大聲喝斥”搭配,但在于c2 句首存在后連詞“便”,表示c2和c1 是動(dòng)作的順承,即c2 是動(dòng)態(tài)描寫。因此,c2 語(yǔ)義指向“王腳”。如果前句有與之搭配的前關(guān)聯(lián)詞,那么這一對(duì)關(guān)聯(lián)詞語(yǔ)傾向于對(duì)應(yīng)起來。例如表 9(b)的c3 缺話頭,c3 與“你”和“他”在語(yǔ)義上都能夠搭配,不過“雖然”和“但是”組成關(guān)聯(lián)詞對(duì),所以c3 共享“雖然”的話頭“他”。

      表9 關(guān)聯(lián)詞語(yǔ)影響話頭話身關(guān)系分析的示例

      (二)平行結(jié)構(gòu)

      平行結(jié)構(gòu)最早由Frazier①Frazier, Lyn; Taft, Lori; Roeper, Tom; Clifton, Charles, “Parallel Structure: A Source of Facilitation in Sentence Comprehension”, Mem Cognit, 12(5), 1984, pp.421-430.提出,指由兩個(gè)或兩個(gè)以上相關(guān)聯(lián)的語(yǔ)言單位組成,這些語(yǔ)言單位由連接詞或其他手段連接,具有相同的組成成分,在句子中擔(dān)當(dāng)相同的句法角色。平行結(jié)構(gòu)一般被用于修辭方面的研究,如篇章銜接等。Chambers 等①C. Chambers; R. Smyth, “Structural Parallelism and Discourse Coherence: A Test of Centering Theory”, Journal of Memory Language, vol.39(4) , 1998, pp.593-608(16).把平行結(jié)構(gòu)引入描述篇章回指現(xiàn)象,研究了代詞回指問題,認(rèn)為代詞傾向于回指與其結(jié)構(gòu)平行的先行詞,李榕②李榕:《影響代詞回指的因素分析》,《當(dāng)代語(yǔ)言學(xué)》2012 年第2 期。認(rèn)為平行結(jié)構(gòu)指相接的兩句話宏觀結(jié)構(gòu)一致,而且包含有語(yǔ)義聯(lián)系的謂語(yǔ)。她關(guān)注的也是代詞回指的問題,認(rèn)為如果含代詞的句子和前一句的格式平行,平行結(jié)構(gòu)可以打破主語(yǔ)的優(yōu)先權(quán),影響代詞回指。總體來說,學(xué)者們對(duì)平行結(jié)構(gòu)的定義主要關(guān)注篇章銜接等方面。話頭話身結(jié)構(gòu)的標(biāo)注過程中發(fā)現(xiàn),平行結(jié)構(gòu)對(duì)共享話頭的確認(rèn)非常有效(如表10)。表10 都是平行結(jié)構(gòu)組成的話頭話身結(jié)構(gòu)。表10(a)的c1 尾部和c2、c3 對(duì)應(yīng)成分都是“互相+行為”;表10(b)的c1~c3 的結(jié)構(gòu)都是“時(shí)間副詞+擔(dān)任+隸屬者+職務(wù)”;表10(c)的c2~c4 與c1 尾部都是“向+方向+到達(dá)+處所”結(jié)構(gòu)。當(dāng)然,平行結(jié)構(gòu)也能夠造出反例(如表11(a))。表11(a)c1~c3 雖然句式上構(gòu)成了平行結(jié)構(gòu),但常識(shí)上,“小趙”的可能方位只有左右前后上下,如果后面被占據(jù)了,再有“后面”只能是“小錢”的后面。若換成“前、后、左、右”則不一樣,如表11(b)的c2、c3,由于“前、后、左、右”語(yǔ)義不沖突,于是都傾向于共享主語(yǔ)“小趙”。可見話頭識(shí)別的影響因素是眾多的。

      表10 平行結(jié)構(gòu)影響話頭話身關(guān)系分析的示例

      表11 平行結(jié)構(gòu)影響話頭話身關(guān)系分析的正反例對(duì)比

      (三)語(yǔ)篇停頓(標(biāo)點(diǎn)符號(hào))

      語(yǔ)言中停頓的長(zhǎng)短代表了人對(duì)話頭轉(zhuǎn)換的預(yù)期,停頓長(zhǎng)更傾向轉(zhuǎn)換話頭,停頓短更傾向接著原有話頭繼續(xù)說。不同停頓時(shí)長(zhǎng)落實(shí)到文本中,就是不同的標(biāo)點(diǎn)符號(hào)。因此,標(biāo)點(diǎn)符號(hào)作為話頭話身關(guān)系的標(biāo)記是有一定認(rèn)知理?yè)?jù)的,語(yǔ)料中對(duì)話頭話身關(guān)系分析也有一定影響(如表12)。表12 的c3 缺少話頭。從上文看,c1 的“鄉(xiāng)鎮(zhèn)企業(yè)”無論句法上還是語(yǔ)義上都適合充當(dāng)c3 的話頭,但是語(yǔ)感上c3 與c1~c2 并不屬于同一個(gè)話頭話身結(jié)構(gòu),c2 的句號(hào)起到了一定的提示作用。實(shí)際上,c3 是一個(gè)主語(yǔ)省略句,在政府工作報(bào)告中比較常見。當(dāng)然,標(biāo)點(diǎn)符號(hào)僅為一種傾向性提示,句號(hào)切分話頭話身結(jié)構(gòu)的平均正確率只有80.77%,③何曉文、羅智勇、胡紫娟、王瑞琦:《基于小句復(fù)合體的句子邊界自動(dòng)識(shí)別研究》,《中文信息學(xué)報(bào)》2021 年第5 期。例如,表1 的c5 句就是反例。c5 是句號(hào),但是后句沒有轉(zhuǎn)換話頭,仍以“西藏銀行部門”為話頭。

      表12 語(yǔ)篇停頓(標(biāo)點(diǎn)符號(hào))影響話頭話身關(guān)系分析的示例

      (四)句法特征判別與語(yǔ)義核查

      本節(jié)提到的句法特征,雖然對(duì)話頭話身關(guān)系的判別有較高的準(zhǔn)確率,但目前只是局部的特征,尚未形成體系。由于漢語(yǔ)句法形式特征比較缺乏,能夠明確影響話頭話身關(guān)系的句法因素并不多見,所以句法特征對(duì)語(yǔ)料覆蓋度不高,多數(shù)情況下需要其他知識(shí)輔助判斷。

      值得注意的是,基于句法特征進(jìn)行話頭識(shí)別后,還需要進(jìn)行語(yǔ)義、語(yǔ)境、常識(shí)等多方面知識(shí)的核查,才能真正確認(rèn)話頭。人在理解語(yǔ)言時(shí)也如此,當(dāng)一句話符合句法、語(yǔ)義、常識(shí)等各方面的認(rèn)知,我們才認(rèn)為自己“理解”了這句話。若某個(gè)具有特定句法特征的話頭語(yǔ)義不合格,應(yīng)該根據(jù)語(yǔ)義特征重新識(shí)別話頭。這是話頭識(shí)別過程中的一種“語(yǔ)義核查”機(jī)制。

      四、影響話頭話身關(guān)系分析的語(yǔ)境因素

      大部分標(biāo)點(diǎn)句單看前句可以確定話頭,但仍有極少數(shù)標(biāo)點(diǎn)句,需要看更遠(yuǎn)的上下文才能確認(rèn)(如表13)。表13(a)的c2 句首“下面”是方位詞,意義不自足,需要含有方位特征的名詞作話頭構(gòu)成空間參照關(guān)系。例中可與“下面”形成參照的候選成分有“那張片子”和“‘杜甫’兩字”。這兩個(gè)成分無論誰作為c2 的話頭句法語(yǔ)義都是通順的。由于“天頭上”又和“下面”對(duì)應(yīng)形成方位的平行結(jié)構(gòu),似乎傾向于以“天頭上”前的“那張片子”作為話頭,即理解為表13(b)。但我們看更遠(yuǎn)的上下文就會(huì)發(fā)現(xiàn)(見表13(c)),表 13(a)理解不正確。仔細(xì)揣摩表13(c)的后文發(fā)現(xiàn),“片子”從上到下應(yīng)該是“‘杜甫’兩字”,接著是“標(biāo)題”,接著是正文。所以“下面”并不是指“那張片子”的下面,而是“‘杜甫’兩字”的下面。因此,c2“下面紫墨水寫的標(biāo)題”,其話頭應(yīng)該是“‘杜甫’兩字”。

      表13 語(yǔ)境因素影響話頭話身關(guān)系分析的示例

      這個(gè)例子反映出,句法特征有時(shí)候會(huì)起反作用,甚至引起誤導(dǎo),下文語(yǔ)境對(duì)其進(jìn)行了糾正。語(yǔ)境因素通常以一種“語(yǔ)境核查”的形式起作用。就是說,如果一個(gè)話頭符合句法語(yǔ)義,但與語(yǔ)境相沖突,則應(yīng)該重新選擇符合句法語(yǔ)義的其他候選話頭,再進(jìn)行語(yǔ)境核查。

      五、影響話頭話身關(guān)系分析的常識(shí)因素

      有時(shí)僅靠句法語(yǔ)義知識(shí)仍然難以確認(rèn)標(biāo)點(diǎn)句的話頭是其上下文的哪一成分,還需要用到常識(shí)(如表14)。表14(a)“香蕉”比“桃子”容易剝皮是常識(shí),若c2 改成“剝皮真麻煩!”將會(huì)理解為對(duì)“桃子”的描述,以“桃子”為話頭。表14(b)單從句法語(yǔ)義上看,c2“搶去錢袋”的話頭可以是“他們”也可以是“潰兵”。但“潰兵”更容易讓人與“搶”的施動(dòng)者聯(lián)系起來,因此以“潰兵”為話頭更合理。即使表14(c)將主語(yǔ)和賓語(yǔ)位置調(diào)換,把“潰兵”作為主語(yǔ),“搶去方老先生的錢袋”的人仍理解為潰兵。可見,當(dāng)若干候選話頭句法語(yǔ)義都合格而難以選擇時(shí),往往需要常識(shí)輔助。同時(shí),常識(shí)也會(huì)對(duì)符合句法語(yǔ)義的話頭進(jìn)行核查,核查不通過可能需要重新選擇其他候選話頭(如表11(a))。但將常識(shí)形式化難度很大,人們甚至不清楚自己有多少常識(shí),對(duì)語(yǔ)言處理而言是一大挑戰(zhàn)。

      表14 常識(shí)因素影響話頭話身關(guān)系分析的示例

      六、影響話頭話身關(guān)系分析的百科知識(shí)

      有的情況不僅需要句法語(yǔ)義語(yǔ)用知識(shí)和常識(shí),還要調(diào)用百科知識(shí)幫助話頭的判斷(如表15)。表15 的c4 的句首是“下葉”,是魚的部件名,意義不自足,需要主體。此時(shí),如果沒有足夠的百科知識(shí),很難判斷“下葉”是“鰺”的部件,還是“尾鰭”的部件。只有我們形成了一個(gè)魚類的本體知識(shí)集,才知道,“下葉”實(shí)際上是魚尾的一部分,所以話頭不是“鰺”,而是先共享c3 的“尾鰭”作直接話頭,再共享“鰺”作間接話頭。在語(yǔ)言計(jì)算中,百科知識(shí)可以利用知識(shí)圖譜等資源進(jìn)行識(shí)別。

      表15 百科知識(shí)影響話頭話身關(guān)系分析的示例

      七、話頭話身關(guān)系分析中的知識(shí)調(diào)用與互動(dòng)

      上文分析可知,話頭話身關(guān)系分析涉及句法、語(yǔ)義、語(yǔ)境、常識(shí)以及百科等知識(shí),是一個(gè)復(fù)雜的過程?;谏衔姆治龊驼Z(yǔ)料庫(kù)研究,我們對(duì)這些影響因素的調(diào)用順序、協(xié)調(diào)和互動(dòng)過程,進(jìn)行了歸納。總的來說,話頭話身關(guān)系的分析過程中各類知識(shí)調(diào)用順序是:句法知識(shí)→語(yǔ)義知識(shí)→常識(shí)/百科知識(shí)→語(yǔ)境知識(shí)。這些知識(shí)的用途主要包括話頭判定和話頭合格性核查。話頭判定指從眾多可能詞語(yǔ)中選擇最合適的話頭,這個(gè)操作要反復(fù)比較和篩選,要調(diào)用較多的認(rèn)知資源;話頭合格性核查只要檢查當(dāng)前選中的話頭是否合格,沒有比較和篩選等操作,需要的認(rèn)知資源較少。話頭話身分析所涉及的知識(shí)中,句法知識(shí)主要用于話頭判定,語(yǔ)境知識(shí)主要用于話頭核查,語(yǔ)義、常識(shí)/百科知識(shí)既用于話頭判定,也用于話頭核查。他們的互動(dòng)過程如圖1 所示。

      圖1 話頭話身分析中各因素的調(diào)用與協(xié)調(diào)

      對(duì)各知識(shí)的調(diào)用與互動(dòng)過程說明如下:(1)句法知識(shí)。話頭識(shí)別過程中,首先嘗試根據(jù)句法特征確定話頭。句法特征是語(yǔ)言理解的表層特征,最容易被識(shí)別,調(diào)用的認(rèn)知資源最少。如果能夠判定話頭,則再進(jìn)行語(yǔ)義、常識(shí)、百科知識(shí)、語(yǔ)境的核查。若均核查通過,則表示句法判定的話頭正確;若任何一個(gè)環(huán)節(jié)的核查不通過,都將利用語(yǔ)義知識(shí)進(jìn)行話頭的重新判定。(2)語(yǔ)義知識(shí)。在沒有明顯可用于判定話頭的句法特征下,則根據(jù)語(yǔ)義特征進(jìn)行話頭判定。若語(yǔ)義特征可以判定話頭,則進(jìn)行常識(shí)、百科知識(shí)和語(yǔ)境的核查;若語(yǔ)義特征無法最終判定話頭,則通過常識(shí)、百科知識(shí)進(jìn)一步判定。(3)常識(shí)、百科知識(shí)。若經(jīng)句法特征和語(yǔ)義特征分析后,仍有若干個(gè)候選話頭不能唯一確定,則根據(jù)常識(shí)和百科知識(shí)對(duì)若干個(gè)符合句法語(yǔ)義的候選話頭進(jìn)行選擇。判定后,再進(jìn)行語(yǔ)境核查。若仍無法判定話頭,則表示上文找不到同時(shí)符合句法、語(yǔ)義、常識(shí)和百科知識(shí)的話頭,此時(shí),該句可能是無主句、省略句或其他等不存在話頭的情況,甚至可能是有誤的句子,這些暫不在本文討論范圍內(nèi)。(4)語(yǔ)境知識(shí)。語(yǔ)境知識(shí)主要用于對(duì)已選話頭進(jìn)行核查,在句法語(yǔ)義常識(shí)等特征對(duì)話頭判斷失誤的情況下進(jìn)行糾正。

      八、結(jié)語(yǔ)

      話頭話身結(jié)構(gòu)是組成漢語(yǔ)篇章的基本組織結(jié)構(gòu)。話頭話身結(jié)構(gòu)是由多個(gè)標(biāo)點(diǎn)句通過話頭共享而組成的。本文研究話頭話身關(guān)系,補(bǔ)全標(biāo)點(diǎn)句缺失的話頭,正是為了發(fā)現(xiàn)標(biāo)點(diǎn)句間的話頭共享關(guān)系。從語(yǔ)篇研究的角度,這項(xiàng)工作使我們對(duì)語(yǔ)篇組織結(jié)構(gòu)有更深刻的認(rèn)識(shí)。從語(yǔ)言認(rèn)知的角度,話頭補(bǔ)全的過程涉及的句法、語(yǔ)義、常識(shí)、百科知識(shí)等影響因素以及它們的互動(dòng)關(guān)系,是人們理解語(yǔ)言的過程之一,話頭話身關(guān)系研究有利于我們更好探索語(yǔ)言理解過程的奧秘。從語(yǔ)言計(jì)算角度,話頭話身關(guān)系研究和話頭補(bǔ)全是語(yǔ)篇自動(dòng)分析的基礎(chǔ)任務(wù)。只有將話頭補(bǔ)全涉及的影響因素和交互過程形式化,才能構(gòu)建自動(dòng)計(jì)算;也只有清楚每個(gè)標(biāo)點(diǎn)句的話頭話身關(guān)系,才能在此基礎(chǔ)上進(jìn)行句間邏輯關(guān)系分析、篇章主旨分析等工作,這是各種基于篇章的語(yǔ)言處理任務(wù)不可逾越的基本步驟。

      猜你喜歡
      標(biāo)點(diǎn)常識(shí)句法
      標(biāo)點(diǎn)可有可無嗎
      句法與句意(外一篇)
      《遼史》標(biāo)點(diǎn)辨誤四則
      述謂結(jié)構(gòu)與英語(yǔ)句法配置
      靠不住的常識(shí)
      文苑(2020年11期)2020-11-19 11:45:11
      小小標(biāo)點(diǎn)真厲害
      句法二題
      詩(shī)詞聯(lián)句句法梳理
      近視600度以上,這5條常識(shí)務(wù)必知道
      有趣的標(biāo)點(diǎn)
      莱芜市| 阜宁县| 玉树县| 宁武县| 石河子市| 昭苏县| 天全县| 阜宁县| 信宜市| 怀仁县| 广元市| 襄垣县| 胶州市| 泸州市| 长葛市| 海林市| 镇江市| 怀来县| 本溪市| 乌拉特前旗| 敦煌市| 姜堰市| 阿拉善左旗| 江都市| 韩城市| 剑川县| 南雄市| 丹棱县| 莱西市| 西乡县| 汶川县| 鄂托克旗| 疏勒县| 桑植县| 尼勒克县| 新邵县| 霞浦县| 静海县| 万山特区| 云浮市| 舒城县|