• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于小句關(guān)聯(lián)理論的有標(biāo)選擇復(fù)句層次關(guān)系自動(dòng)識(shí)別

      2016-03-09 09:07:56羅進(jìn)軍
      關(guān)鍵詞:表里復(fù)句自動(dòng)識(shí)別

      尹 蔚,羅進(jìn)軍

      (華中師范大學(xué),湖北 武漢 430079)

      基于小句關(guān)聯(lián)理論的有標(biāo)選擇復(fù)句層次關(guān)系自動(dòng)識(shí)別

      尹 蔚,羅進(jìn)軍

      (華中師范大學(xué),湖北 武漢 430079)

      以小句關(guān)聯(lián)理論為理論基礎(chǔ),結(jié)合具體事例重點(diǎn)探討“兩句式”“三句式”“四句式”有標(biāo)選擇復(fù)句層次關(guān)系的自動(dòng)識(shí)別方法。

      小句關(guān)聯(lián)理論;有標(biāo)選擇復(fù)句;層次關(guān)系;自動(dòng)識(shí)別;表里關(guān)聯(lián)

      一 引言

      有關(guān)復(fù)句特別是多重復(fù)句層次關(guān)系的本體研究,漢語學(xué)界做了大量卓有成效的工作。邢福義認(rèn)為,多重復(fù)句的分析必須善于抓住關(guān)聯(lián)詞語,進(jìn)行全面觀察,然后逐層深入地剖析。關(guān)聯(lián)詞語是形式上的標(biāo)志。不管是大層次還是小層次,都要善于根據(jù)關(guān)聯(lián)詞語來斷定關(guān)系。沒有運(yùn)用關(guān)聯(lián)詞語的,也要看能夠添上什么樣的關(guān)聯(lián)詞語,借以斷定其關(guān)系。抓住關(guān)聯(lián)詞語進(jìn)行全面觀察時(shí),要善于化繁為簡(jiǎn)。[1]

      此外,沈開木、[2]蔡建中、[3]石安石、[4]肖國(guó)政、[5]陸丙甫、金立鑫、[6]汪國(guó)勝、劉秀明[7]等也提出了不少真知灼見。魯松、白碩、李素建等認(rèn)為,漢語多重關(guān)系復(fù)句的句法分析問題主要是由復(fù)句中的關(guān)系分析和層次分析組成。為了有效地形式化地表示多重關(guān)系復(fù)句的層次結(jié)構(gòu),該文提出了關(guān)系層次樹的概念,并以此為基礎(chǔ)構(gòu)造文法,采用部分?jǐn)?shù)據(jù)驅(qū)動(dòng)的確定性移進(jìn)-歸約算法實(shí)現(xiàn)多重關(guān)系復(fù)句的關(guān)系層次分析。[8]

      小句關(guān)聯(lián)理論對(duì)有標(biāo)復(fù)句層次關(guān)系的自動(dòng)識(shí)別做了較為系統(tǒng)的研究。提出了“小句關(guān)聯(lián)體”“轄域”“關(guān)聯(lián)指向”“連用”“合用”一系列概念,并探索了具體的識(shí)別流程:計(jì)算機(jī)先從有標(biāo)復(fù)句中提取語表序列→將所提取的語表序列跟后臺(tái)表里關(guān)聯(lián)模態(tài)庫(kù)中已有的語表序列進(jìn)行比較,找到最相似的甚至相同的→給出語表序列相應(yīng)的層次關(guān)系。[9]因?yàn)橛锌茖W(xué)實(shí)驗(yàn)作為有力支撐,所以該文的很多想法都在實(shí)踐層面得到了驗(yàn)證。

      二“兩句式”有標(biāo)選擇復(fù)句層次關(guān)系的自動(dòng)識(shí)別

      “兩句式”有標(biāo)選擇復(fù)句的層次關(guān)聯(lián)模式只有一種,那就是“1”式。所謂“1”式是指在第一小句末尾是第一層,用豎線可表示為:“①|(zhì)②”。因此,“兩句式”有標(biāo)選擇復(fù)句的層次關(guān)系的自動(dòng)識(shí)別相對(duì)來說比較簡(jiǎn)單,如果是單純型語里關(guān)系,那就更是如此。如:

      (1)①白五爺是專程看望我們,②還是另有別的事情要辦呢?

      (2)①事實(shí)上她也抨擊到了我,②或者說我也受到了誤傷。

      計(jì)算機(jī)提取以上兩例的語表序列,得到的結(jié)果見表1。

      語表序列的聚類,也就是到我們事先建好的有標(biāo)選擇復(fù)句表里關(guān)聯(lián)模態(tài)表里去匹配最相似的語表序列模式。結(jié)果發(fā)現(xiàn)例(1)正好跟1號(hào)語表序列模式匹配,例(2)跟2號(hào)語表序列模式匹配。

      表1 有標(biāo)選擇復(fù)句表里關(guān)聯(lián)模態(tài)表

      如果是復(fù)合型語里關(guān)系,如:

      (3)①要么是好人,②否則就是壞人。

      計(jì)算機(jī)提取例3有標(biāo)選擇復(fù)句的語表序列,得到結(jié)果見表2。

      表2 有標(biāo)選擇復(fù)句表里關(guān)聯(lián)模態(tài)表

      兩句式有標(biāo)選擇復(fù)句的復(fù)合型語里關(guān)系除了選擇關(guān)系跟假轉(zhuǎn)關(guān)系的復(fù)合外,還有選擇關(guān)系跟假設(shè)關(guān)系的復(fù)合,甚至還有三合型語里關(guān)系。但是不管是哪一種復(fù)合型語里關(guān)系,其自動(dòng)識(shí)別的流程都是類似的。

      三 “三句式”有標(biāo)選擇復(fù)句層次關(guān)系的自動(dòng)識(shí)別

      “三句式”有標(biāo)選擇復(fù)句就層次關(guān)聯(lián)而言有三種模式,即“11”式、“12”式、“21”式。所謂“11”式是指在第一小句末尾是第一層,在第二小句末尾也是第一層;所謂“12”式是指在第一小句末尾是第一層,在第二小句末尾是第二層;所謂“21”是指在第一小句末尾是第二層,在第二小句末尾是第一層。如:

      (4)①要么是名,②要么是利,③要么是愛。

      (5)①是我真的如此自私,②還是我愛他當(dāng)真不如對(duì)世民,③因而不能為他犧牲半分?

      (6)①是聲音低,②所以大伙沒聽清,③還是這幫人沒來?

      我們看計(jì)算機(jī)如何自動(dòng)識(shí)別(4-6)例有標(biāo)選擇復(fù)句的層次關(guān)系。讓計(jì)算機(jī)提取它們的語表序列,得到結(jié)果見表3。

      將它們放到有標(biāo)選擇復(fù)句表里關(guān)聯(lián)模態(tài)表中去匹配,結(jié)果是,例(4)語表序列跟6號(hào)語表序列模式可以聚類,例(5)語表序列跟7號(hào)語表序列模式可以聚類,例(6)語表序列跟19號(hào)語表序列模式可以聚類。

      表3 有標(biāo)選擇復(fù)句表里關(guān)聯(lián)模態(tài)表

      “三句式”有標(biāo)選擇復(fù)句的層次關(guān)系肯定不止以上所說的三種,我們只是以“三句式”有標(biāo)選擇復(fù)句的層次關(guān)聯(lián)模式為標(biāo)準(zhǔn),每種類型都選取一個(gè)代表,具體說明它們層次關(guān)系的自動(dòng)識(shí)別過程。

      四 “四句式”有標(biāo)選擇復(fù)句層次關(guān)系的自動(dòng)識(shí)別

      從理論上講,“四句式”有標(biāo)選擇復(fù)句的層次關(guān)聯(lián)模式應(yīng)該有11種。如果有三個(gè)第一層,那就是“111”式。如果有兩個(gè)第一層,那就有三種模式,分別是“112”式、“121”式、“211”式。如果是只有一個(gè)第一層,那就有七種模式,分別是“122”式、“221”式、“212”式、“123”式、“132”式、“231”式、“321”式。

      先看第一種情況,即有三個(gè)第一層的。如:

      (7)①要么手狠心毒,②要么道行深廣,③要么法力無邊,④要么樹大根深。

      例(7)有三個(gè)第一層,如果用傳統(tǒng)的豎線分析法,都可以表示為:①|(zhì)②|③|④。計(jì)算機(jī)提取的語表序列,得到結(jié)果見表4。

      將它們放到有標(biāo)選擇復(fù)句表里關(guān)聯(lián)模態(tài)表中去匹配,發(fā)現(xiàn)例(7)可以與30號(hào)語表序列模式聚類。

      表4 有標(biāo)選擇復(fù)句表里關(guān)聯(lián)模態(tài)表

      再來看第二種情況,即有兩個(gè)第一層的。如:

      (8)①或者委婉地規(guī)勸,②或者從大的方面廣泛地論述,③或者從小的方面細(xì)細(xì)地指點(diǎn),④知無不言。

      (9)①或者用彩色復(fù)印機(jī)復(fù)印彩色盒帶封面,②或者將盒帶封面翻拍下來,③重新制版印刷,④或者內(nèi)外勾結(jié)從音像出版單位、印刷廠套購(gòu)乃至盜購(gòu)盒帶封面。

      (10)①或者是作品發(fā)表了,②論文獲獎(jiǎng)了;③或者是自學(xué)考試最終拿到了文憑;④或者研制的產(chǎn)品最終通過了鑒定。

      具體一點(diǎn)講,例(8)是“112”式,即“①|(zhì)②|③| |④”;例(9)是“121”式,即“①|(zhì)②||③|④”;例(10)是“211”式,即“①|(zhì)|②|③|④”。計(jì)算機(jī)提取的語表序列,得到的結(jié)果見表5。

      計(jì)算機(jī)將語表序列放到有標(biāo)選擇復(fù)句表里關(guān)聯(lián)模態(tài)表中去匹配,結(jié)果發(fā)現(xiàn),例(8)語表序列可以跟31號(hào)語表序列模式聚類,例(9)語表序列可以跟33號(hào)語表序列模式聚類,例(10)語表序列可以跟34號(hào)語表序列模式聚類。

      表5 有標(biāo)選擇復(fù)句表里關(guān)聯(lián)模態(tài)表

      最后來看第三種情況,也就是只有一個(gè)第一層的。如:

      (11)①是真法盲,②還是知法犯法,③見利忘法,④無法無天?

      (12)①是按傳統(tǒng)思路上項(xiàng)目,②爭(zhēng)貸款,③鋪攤子,④還是另辟蹊徑?

      (13)①或者武功很高,②卻不如楚留香俠義;③或者富可敵國(guó),④卻不如楚留香大方。

      (14)①是宣泄個(gè)人的弗洛伊德所說的各種“情結(jié)”,②還是引人向上,③使人更成為人,④而不是淪為獸?

      (15)①今年我們很可能沒有一個(gè)能考上北大,②或者即使有那么一個(gè)勉強(qiáng)考上了,③也不值得驕傲,④因?yàn)槠渌麑W(xué)校據(jù)說有望考十幾個(gè)。

      (16)①是為了維護(hù)黨和人民的利益,②不怕吃苦,③不怕犧牲,④還是一事當(dāng)前先替自己打算?

      (17)①他既考不上北大,②也考不上清華,③甚至很有可能連一般本科也考不上,④或者說他根本就不是塊讀書的料。

      (11)-(17)這七例分別為“122”式、“221”式、“212”式、“123”“132”“231”“321”式。計(jì)算機(jī)提取的語表序列,然后將這些語表序列放到有標(biāo)選擇復(fù)句表里關(guān)聯(lián)模態(tài)表中去匹配,得到的結(jié)果見表6。

      表6 有標(biāo)選擇復(fù)句表里關(guān)聯(lián)模態(tài)表

      “四句式”有標(biāo)選擇復(fù)句的層次關(guān)系不止上述這些,我們根據(jù)層次關(guān)聯(lián)的類型選取代表性的例子。不管是哪種類型的有標(biāo)選擇復(fù)句,其層次關(guān)系自動(dòng)識(shí)別的原理都是一樣的,即在句法關(guān)聯(lián)跟語義關(guān)聯(lián)之間尋求一種對(duì)應(yīng)關(guān)系,從而達(dá)到“由表識(shí)里”的目的。

      五 結(jié)論

      我們根據(jù)有標(biāo)選擇復(fù)句層次關(guān)聯(lián)類型,結(jié)合具體事例示范性地研究了“兩句式”“三句式”“四句式”有標(biāo)選擇復(fù)句層次關(guān)系的自動(dòng)識(shí)別問題。

      第一,研究實(shí)踐表明,基于小句關(guān)聯(lián)理論的有標(biāo)選擇復(fù)句層次關(guān)系自動(dòng)識(shí)別研究是可行的。句法關(guān)聯(lián)在有標(biāo)復(fù)句中主要表現(xiàn)為由關(guān)系標(biāo)記構(gòu)成的語表序列,而語義關(guān)聯(lián)則主要體現(xiàn)為層次關(guān)系。要想讓計(jì)算機(jī)根據(jù)有標(biāo)復(fù)句的語表序列識(shí)別其層次關(guān)系,就必須事先讓計(jì)算機(jī)“獲取”相關(guān)知識(shí),其中相當(dāng)重要的一環(huán)就是建立知識(shí)庫(kù),也就是我們所說的有標(biāo)復(fù)句表里關(guān)聯(lián)模態(tài)表,即在語表序列模式跟層次關(guān)系模式之間構(gòu)建對(duì)應(yīng)關(guān)系。

      第二,我們意識(shí)到,與其他有標(biāo)復(fù)句一樣,有標(biāo)選擇復(fù)句層次關(guān)系的自動(dòng)識(shí)別也是一項(xiàng)浩大、繁復(fù)的系統(tǒng)工程。其中涉及到多個(gè)環(huán)節(jié),比如,關(guān)系標(biāo)記的自動(dòng)識(shí)別,非小句的自動(dòng)識(shí)別,語表序列的自動(dòng)提取,語表序列的聚類,語表序列聚類規(guī)則表的構(gòu)建,表里關(guān)聯(lián)模態(tài)表的構(gòu)建,表里關(guān)聯(lián)框式簡(jiǎn)圖圖庫(kù)的建設(shè),表里關(guān)聯(lián)樹型圖圖庫(kù)的建設(shè)等等。當(dāng)然,我們也必須認(rèn)識(shí)到,語言現(xiàn)象是豐富多樣的,有標(biāo)復(fù)句的運(yùn)用也是相當(dāng)靈活的,因此,如何根據(jù)新的語言事實(shí)不斷完善我們現(xiàn)有的工作是今后相當(dāng)長(zhǎng)一段時(shí)期內(nèi)我們必須考慮的問題。我們堅(jiān)信,只要有正確的理論做指導(dǎo),有務(wù)實(shí)的學(xué)風(fēng)做保障,有創(chuàng)新的思想做動(dòng)力,就一定能夠?qū)⑽覀兊难芯抗ぷ鞑粩嗤葡蚯斑M(jìn)。

      [1]邢福義.談?wù)劧嘀貜?fù)句的分析[J].語文教學(xué)與研究,1979(1):48-53.

      [2]沈開木.句法的層次性、遞歸性及其在多重復(fù)句分析中的利用[J].漢語學(xué)習(xí),1982(5):22-24.

      [3]蔡建中.漢語多重復(fù)句層次關(guān)系的確認(rèn)[J].西北民族大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),1982(1):70-74.

      [4]石安石.怎樣確定多重復(fù)句的層次[J].語文研究,1983 (2):39-43.

      [5]肖國(guó)政.關(guān)于多重復(fù)句的劃分[J].語文教學(xué)與研究,1983(9):36-37.

      [6]陸丙甫,金立鑫.關(guān)于多重復(fù)句的層次問題[J].漢語學(xué)習(xí),1988(5):4-7.

      [7]汪國(guó)勝,劉秀明.關(guān)于多重復(fù)句的分析[J].華中科技大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2004(6):84-88.

      [8]魯 松,白 碩,李素建,等.漢語多重關(guān)系復(fù)句的關(guān)系層次分析[J].軟件學(xué)報(bào),2001(7):987-995.

      責(zé)任編輯:李珂

      Automatic Identification of Hierarchy of Marked Selective Compound Clauses based on Clausal Correlation Theory

      YIN Wei,LUO Jinjun

      (Central China Normal University,Wuhan 430079,China)

      In view of theory of clausal correlation,it analyzes the automatic identification of hierarchy of twoclause,three-clause and four-clause marked selective compound clauses.It is essential to establish a knowledge base for the computer to identify the hierarchy of marked selective compound clauses from its outer sequence.

      clausal correlation theory,marked selective compound clauses,hierarchy,automatic identification,correlation between outer form and inner meaning

      H14

      A

      1674-117X(2016)06-0094-04

      10.3969/j.issn.1674-117X.2016.06.017

      2016-09-19

      教育部人文社會(huì)科學(xué)研究青年基金項(xiàng)目“本用結(jié)合視野下的有標(biāo)選擇復(fù)句研究”(11YJC740137);國(guó)家社會(huì)科學(xué)基金項(xiàng)目“現(xiàn)代漢語有標(biāo)復(fù)句層次關(guān)系信息化研究”(10CYY034);國(guó)家社科基金重大項(xiàng)目“全球華語語法研究”(11&ZD128);教育部人文社會(huì)科學(xué)重點(diǎn)研究基地重大項(xiàng)目“漢語復(fù)句關(guān)系詞語的理論解釋和實(shí)際應(yīng)用”(13JJD740012);澳門大學(xué)研究委員會(huì)立項(xiàng)課題"Grammatical Innovations in Chinese on the Internet and Their Linguistic Implications"(MYRG093-FSH13-XJ)

      尹 蔚(1980-),女,湖南株洲人,華中師范大學(xué)副教授,博士,研究方向?yàn)楝F(xiàn)代漢語語法、理論語言學(xué);羅進(jìn)軍(1978-),男,湖南新化人,華中師范大學(xué)副教授,博士,研究方向?yàn)楝F(xiàn)代漢語語法、中文信息處理。

      猜你喜歡
      表里復(fù)句自動(dòng)識(shí)別
      連動(dòng)結(jié)構(gòu)“VP1來VP2”的復(fù)句化及新興小句連接詞“來”的形成
      漢語復(fù)句學(xué)說的源流
      韓國(guó)語復(fù)句結(jié)構(gòu)的二分說
      山河“表里”——潼關(guān),豈止是一個(gè)地理的“關(guān)”
      自動(dòng)識(shí)別系統(tǒng)
      特別健康(2018年3期)2018-07-04 00:40:18
      經(jīng)二重組織表里經(jīng)遮蓋性不良的成因與對(duì)策
      金屬垃圾自動(dòng)識(shí)別回收箱
      基于IEC61850的配網(wǎng)終端自動(dòng)識(shí)別技術(shù)
      對(duì)北洋政府新聞出版立法表里二重性的分析
      新聞傳播(2015年20期)2015-07-18 11:06:47
      復(fù)句內(nèi)部不應(yīng)當(dāng)用句號(hào)
      伊宁市| 民丰县| 南和县| 和平区| 临泉县| 清远市| 安乡县| 景德镇市| 天长市| 沧州市| 安达市| 鄢陵县| 日土县| 腾冲县| 瓮安县| 德阳市| 福安市| 清水县| 洪江市| 梧州市| 丹东市| 通辽市| 阜城县| 山东| 乐业县| 屯昌县| 绥阳县| 柳江县| 龙山县| 获嘉县| 化州市| 琼中| 三门峡市| 镇宁| 云和县| 南华县| 崇信县| 且末县| 绩溪县| 肃宁县| 信丰县|