• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      什么是計(jì)算話語學(xué)

      2019-01-11 13:04:38李佐文嚴(yán)玲
      山東外語教學(xué) 2018年6期
      關(guān)鍵詞:指代連貫語言學(xué)

      李佐文 嚴(yán)玲

      (中國傳媒大學(xué) 外國語言文化學(xué)院, 北京 10024)

      1.0 計(jì)算話語學(xué)產(chǎn)生的背景

      計(jì)算話語學(xué)是隨著自然語言處理和話語語言學(xué)研究的不斷深入提出的新概念。上世紀(jì)40-60年代機(jī)器翻譯熱潮直接催生了計(jì)算語言學(xué)的誕生。進(jìn)入互聯(lián)網(wǎng)時(shí)代,承載各種信息的語言資源都匯聚在網(wǎng)上,為自然語言處理提供了豐富語料。在計(jì)算語言學(xué)發(fā)展歷程中,詞匯、句法層面的語言處理已取得一定成果。Wilks的優(yōu)選語義學(xué)、Fillmore的格語法,Shank的概念依存理論、Simmons的語義網(wǎng)絡(luò)理論和Montague的語法等為小句層面的語義分析提供了有力的理論支撐。Chomsky的短語結(jié)構(gòu)語法被不斷改進(jìn),成為計(jì)算機(jī)句法分析的主流模式(蔡自興、王勇,2014:312)。與這些成果相比,話語層面涉及語言計(jì)算的理論還較為薄弱。目前自然語言處理中存在的諸多瓶頸問題都與語篇層面的語義計(jì)算未取得實(shí)質(zhì)性突破有關(guān)。因此,計(jì)算話語學(xué)研究是人工智能快速發(fā)展背景下自然語言處理技術(shù)提出的迫切要求,也是計(jì)算語言學(xué)不斷走向完善和深入的歷史必然。

      話語的計(jì)算研究是一個(gè)極為復(fù)雜的領(lǐng)域。隨著計(jì)算機(jī)科學(xué)的發(fā)展,機(jī)器的計(jì)算能力不斷增強(qiáng),特別是近年來深度學(xué)習(xí)的快速發(fā)展和應(yīng)用,給計(jì)算機(jī)處理話語帶來希望。然而,人工智能領(lǐng)域的專家一般只擅長工程和算法,對(duì)話語語言學(xué)的理論和規(guī)律缺乏了解,使得計(jì)算話語學(xué)研究進(jìn)展較為緩慢。因此,話語的計(jì)算研究成為現(xiàn)代話語語言學(xué)的重要研究領(lǐng)域和方向。

      2.0 計(jì)算話語學(xué)的概念

      計(jì)算話語學(xué)(computational textlinguistics)是一門研究如何在語言學(xué)理論框架內(nèi)用可計(jì)算的形式抽象概括出話語意義操作模型的學(xué)科,是用話語形式特征實(shí)現(xiàn)語義計(jì)算的處理過程。它主要涉及話語語言學(xué),認(rèn)知語言學(xué)和計(jì)算語言學(xué),是人工智能研究的重要內(nèi)容。

      計(jì)算話語學(xué)的研究路徑需要首先探討話語理解和生成的心理機(jī)制,將這種運(yùn)作方式形式化,研究算法讓計(jì)算機(jī)模擬人腦進(jìn)行語言計(jì)算,驗(yàn)證研究結(jié)果。其實(shí)質(zhì)就是希望電腦能夠像人腦一樣進(jìn)行運(yùn)算。這種研究路徑最關(guān)鍵的一步,就是揭示大腦處理語言的運(yùn)作規(guī)律。計(jì)算語言學(xué)為計(jì)算話語學(xué)提供了一整套的研究框架、方法、目標(biāo)導(dǎo)向,認(rèn)知語言學(xué)為挖掘話語的可計(jì)算模型提供了邏輯推理的理論基礎(chǔ),數(shù)學(xué)和計(jì)算機(jī)程序?yàn)橛?jì)算話語學(xué)的研究成果轉(zhuǎn)化為可操作的應(yīng)用提供了實(shí)現(xiàn)路徑,話語語言學(xué)則是計(jì)算話語學(xué)的母體和內(nèi)容庫。

      3.0 計(jì)算話語學(xué)的研究內(nèi)容

      自然語言處理系統(tǒng)一般包括理論、資源(樹庫、知識(shí)庫等)、計(jì)算模型三部分。根據(jù)系統(tǒng)功能語言學(xué)將語言的三大元功能界定為概念功能、人際功能、語篇功能,我們認(rèn)為計(jì)算話語學(xué)的研究就是從話語謀篇布局的結(jié)構(gòu)中發(fā)掘話語的概念意義和人際意義。根本問題就是揭示語篇的語義結(jié)構(gòu)、信息結(jié)構(gòu)、邏輯脈絡(luò)。

      3.1 針對(duì)概念義求解的話語主題計(jì)算

      概念義對(duì)于語篇而言,主要指語篇的整體義,即主題義。主題義并不是語篇中所有小句義的簡單疊加,而是詞語通過線性文本建構(gòu)出來的整體義。因此,要計(jì)算語篇的主題義,首先要研究語義和語篇結(jié)構(gòu)的關(guān)系,揭示語義流是如何通過語篇結(jié)構(gòu)的引導(dǎo),匯聚成各種各樣的概念義。話語語言學(xué)對(duì)語義和語篇結(jié)構(gòu)的研究集中在局部連貫和整體連貫方面,計(jì)算話語學(xué)則利用這些理論成果開展指代消解和語篇結(jié)構(gòu)建模。

      3.1.1 語篇連貫的理論研究

      連貫問題是話語研究的經(jīng)典問題。自從Halliday提出英語的銜接機(jī)制以來,眾多學(xué)者從各個(gè)角度對(duì)這一問題展開了研究。就局部連貫而言,學(xué)者們探究了小句間各種銜接手段,以及語境和認(rèn)知對(duì)語義連貫的作用。就語篇整體連貫而言,主要有以下幾種研究視角。第一,關(guān)注話語標(biāo)記承擔(dān)了怎樣的語篇框架建構(gòu)任務(wù)。這些話語標(biāo)記包括話語的起始、終結(jié)標(biāo)記,如“首先、此外、最后等”;話語的框架結(jié)構(gòu)標(biāo)記,如“第一、其次、另一方面、如前所述”等(李佐文,2003)。第二,揭示某一類語篇的常用結(jié)構(gòu)框架。如Labov(1972)的敘事結(jié)構(gòu)分析,廖秋忠(1988)的各種論證結(jié)構(gòu)等。第三,關(guān)注主位推進(jìn)模式。第四,從認(rèn)知視角揭示整體連貫的機(jī)制。如框架、腳本、圖式、心理模型。第五,語篇宏觀結(jié)構(gòu)提取(van Dijk,1980;陳忠華等,2004:190)。第六,Beaugrande(1980:102)的語篇世界模型。該模型由四個(gè)元素構(gòu)成:概念(分主、次兩個(gè)層次)、關(guān)系(33種)、算子(8個(gè))、優(yōu)選規(guī)則(12條)。概念是語篇語義網(wǎng)絡(luò)的結(jié)點(diǎn),關(guān)系則是節(jié)點(diǎn)間的聯(lián)系,算子是邏輯運(yùn)算符號(hào),優(yōu)選規(guī)則是底層到表層映射的認(rèn)知操作規(guī)則。

      上述理論成果依據(jù)“形式到語義”的計(jì)算路徑可以分為四類。第一類,如局部連貫、語篇連貫的話語標(biāo)記、語篇整體結(jié)構(gòu)模板、主位推進(jìn)模式,均關(guān)注語言形式,卻未能很好地將形式和語義的界面解釋清楚,無法解釋各種形式標(biāo)記或語篇模板反映出怎樣的語義。第二類是從認(rèn)知角度的研究,揭示了話語過程和概念間的聯(lián)系。它們對(duì)于高頻、固定結(jié)構(gòu)的解釋比較準(zhǔn)確,但應(yīng)對(duì)自然語言變化多樣的語篇構(gòu)造卻顯得力不從心。因此,這些圖式、框架、腳本的理論,更適合FrameNet、HowNet這樣的靜態(tài)知識(shí)庫建設(shè)。第三類理論對(duì)形式到語義的映射進(jìn)行了細(xì)顆粒度的詳細(xì)刻畫,如Beaugrande的語義網(wǎng)絡(luò)。但缺乏對(duì)語篇核心語義的歸納總結(jié)機(jī)制。第四類理論描繪了形式到意義的認(rèn)知計(jì)算,如宏觀結(jié)構(gòu)的計(jì)算。這些計(jì)算過程對(duì)計(jì)算話語學(xué)研究有很好的啟發(fā)作用。需進(jìn)一步研究如何讓計(jì)算機(jī)能進(jìn)行類似的認(rèn)知操作??傮w而言,針對(duì)概念義的語篇結(jié)構(gòu)研究,積累了大量成果,但仍未真正解決語篇結(jié)構(gòu)是如何構(gòu)建概念語義這一問題。

      3.1.2 語篇連貫的計(jì)算研究

      在計(jì)算話語學(xué)中,研究連貫的主要目的是發(fā)現(xiàn)句子間的邏輯語義關(guān)系。已有語篇連貫計(jì)算模型包括:話語表現(xiàn)理論(DRT)(Kamp,1981)、話語鏈圖結(jié)構(gòu)(chain-graph-based structure)(Wolf & Gibson,2005)、中心理論(Grosz & Candace,1986)、修辭結(jié)構(gòu)理論(RST)(Mann & Thompson,1988.)、漢語廣義話題結(jié)構(gòu)流水模型(宋柔,2013)等。下面重點(diǎn)介紹較為經(jīng)典的修辭結(jié)構(gòu)理論(RST)和漢語廣義話題結(jié)構(gòu)流水模型。

      修辭結(jié)構(gòu)理論(Rhetorical Structure Theory, RST) RST有四個(gè)基本元素:單位、語段、箭頭線、連貫關(guān)系,如圖1。單位是分析的最底層單元,用數(shù)字標(biāo)號(hào)。圖1的單位1是文章標(biāo)題,單位2、3、4是文章開頭的話語。語段是單位的結(jié)合體,用直線連接,用被連接的單位數(shù)字命名,如“3-4”。箭頭線的命名是單位或語段間的連貫關(guān)系,如“2”和“3-4”之間是條件關(guān)系(condition),箭頭方向指向的語段是核心成分(如“3-4”),箭頭離開的成分是衛(wèi)星成分(如“2”)。RST的連貫關(guān)系界定中,主要從語義和功能角度,而非形式和句法角度來判斷。在圖1中,我們可以看到箭頭從上至下,最終指向了“3”,可知這段話中“3”是語篇的中心,表達(dá)了語篇的主題。這是通過篇章關(guān)系的傳遞性和主輔性實(shí)現(xiàn)的。RST理論通過對(duì)局部連貫關(guān)系的逐級(jí)判定,最后將整個(gè)語篇建構(gòu)成一個(gè)以核心、衛(wèi)星成分判定連貫關(guān)系的,具有層級(jí)結(jié)構(gòu)的語篇樹(discourse tree)。

      圖1 修辭結(jié)構(gòu)理論示例(Taboada & Mann,2006)

      RST理論需完善的地方在于單位(unit)的確定(Taboada & Mann, 2006)。RST的單位通常是一個(gè)獨(dú)立的小句以及它的附屬成分。但這樣的判斷標(biāo)準(zhǔn)有可能丟失重要的細(xì)節(jié)信息,也只適用于有小句結(jié)構(gòu)的語言,不適用于口語。此外,對(duì)學(xué)術(shù)語篇中較長單位的關(guān)系判斷,以及像漢語這樣,78.8%的連貫屬于隱式連貫(梁國杰,2015:33)的語言如何判斷關(guān)系,還需要進(jìn)一步研究。

      廣義話題結(jié)構(gòu)流水模型 該模型主要將“不成句的標(biāo)點(diǎn)句”構(gòu)造為“成句的話題自足句”,使得語篇處理簡化為對(duì)單句序列的處理,為語言計(jì)算提供便利。該模型具有高覆蓋率和易操作的特點(diǎn),其分析的基本單位是標(biāo)點(diǎn)句。話題結(jié)構(gòu)由話題和說明兩部分構(gòu)成,話題是某一標(biāo)點(diǎn)句中被其他標(biāo)點(diǎn)句談?wù)摰牟糠只蛘?。說明是談?wù)撛掝}的標(biāo)點(diǎn)句。例如:

      張莉努力讀書,

      |希望能改變自己的命運(yùn)。

      王強(qiáng)早早輟學(xué),

      |進(jìn)城打工,

      |也希望能改變自己的命運(yùn)。

      這個(gè)例子中,“張莉”、“王強(qiáng)”是話題,其余是說明。由于話題不僅僅是實(shí)體類,還包括時(shí)間、處所類、狀性、謂性、推理前提等類型,所以稱之為廣義話題。廣義話題結(jié)構(gòu)的堆棧模型,是將每一行文本的左邊看作棧底,右邊看作棧頂。棧底是話題,保持不動(dòng),棧頂是說明,隨著對(duì)話題談?wù)摰倪M(jìn)行,不斷有新文本進(jìn)入棧頂?shù)恼f明位置,而舊文本則從該位置退出,從而每一行都可以補(bǔ)足成話題自足句。上例的話題自足句為:

      張莉努力讀書。張莉希望能改變自己的命運(yùn)。

      王強(qiáng)早早輟學(xué)。王強(qiáng)進(jìn)城打工。王強(qiáng)也希望能改變自己的命運(yùn)。

      在廣義話題結(jié)構(gòu)的縮進(jìn)圖式中,從左至右,從上到下,直到標(biāo)點(diǎn)句右端,所經(jīng)過的詞語串都是話題自足句。該模型還需解決的問題包括:哪些詞語是高頻話題詞語,充當(dāng)廣義話題有哪些約束條件,以及話題之間的語義關(guān)系。

      3.1.2 指代消解研究

      指代消解是將語篇中指向同一對(duì)象的不同表達(dá)識(shí)別出來,形成詞匯指代鏈。指代消解從數(shù)學(xué)角度看是個(gè)聚類過程,將指向相同實(shí)體的先行詞和各種指代聚成一類。它的操作過程是,首先將待消解的指代詞識(shí)別出來形成待消解候選項(xiàng)集合。然后用基于規(guī)則或數(shù)據(jù)驅(qū)動(dòng)的方法對(duì)這些候選項(xiàng)進(jìn)行聚類篩選,確定最后的所指對(duì)象。

      指代消解的理論模型有樸素Hobbs算法、中心理論、脈絡(luò)理論(Cristea et al.,1998)等。近期比較有影響的研究是斯坦福大學(xué)Raghunathan團(tuán)隊(duì)基于多重過濾框架的共指消解模型(Raghunathan et al.,2010)。該模型利用多種特征,進(jìn)行多層過濾。每一層的輸入是上一層消解候選項(xiàng)(mentions)聚類的輸出。在同一個(gè)聚類簇(cluster)中,每個(gè)候選項(xiàng)的屬性被所有候選項(xiàng)分享,使得全局性信息能在模型中傳遞。這樣的層次過濾保證了強(qiáng)勢(shì)特征(stronger features)享有超越弱勢(shì)特征(weaker features)的優(yōu)先權(quán)。具體的過濾層次和規(guī)則如圖2所示。

      通道(pass)類別(Type)特征(Features) 1N精確匹配(exact extent match)2N, P同位成分(appositive) |謂語主格(predicate nominative)| 角色同位語(role appositive)| 關(guān)系代詞(relative pronoun) | 首字母縮略詞(acronym) |地方性稱謂詞(demonym)3N聚類簇中心詞匹配(cluster head match) &詞包含(word inclusion) & 修飾語兼容(compatible modifiers only)& 非其他NP的子節(jié)點(diǎn)(not i-within-i)4N聚類簇中心詞匹配(cluster head match) &詞包含(word inclusion)& 非其他NP的子節(jié)點(diǎn)(not i-within-i)5N聚類簇中心詞匹配(cluster head match) &修飾語兼容(compatible modifiers only) & 非其他NP的子節(jié)點(diǎn)(not i-within-i) 6N寬松聚類簇中心詞匹配(relaxed cluster head match) & 詞包含(word inclusion) &非其他NP的子節(jié)點(diǎn)(not i-within-i)7P代詞匹配(pronoun match)

      圖2 指代消解的多重過濾標(biāo)準(zhǔn)匯總(Raghunathan,2010)

      N 指名詞性表述(nominal), P 指代詞性表述(pronominal), & 表示合取, | 表示析取

      指代消解目前的難題主要集中在三個(gè)方面(孔芳等,2010;周炫余等,2014):(1)跨文本指代消解,將不同文本中指向同一實(shí)體的名稱識(shí)別出來。(2)消解候選項(xiàng)的精準(zhǔn)識(shí)別,如何去除大量非候選項(xiàng)噪音。(3)如何利用背景知識(shí)、語篇結(jié)構(gòu)知識(shí)、深層語義知識(shí)進(jìn)行指代消解。

      3.2 針對(duì)人際義求解的話語評(píng)價(jià)計(jì)算

      人際義與情感分析(sentiment analysis)、意見挖掘(opinion mining)相關(guān),體現(xiàn)了話語的評(píng)價(jià)含義。情感分析與意見挖掘有很大的重合性,為敘述方便,以下用情感分析指代兩者。

      3.2.1 情感分析的語言學(xué)研究

      情感分析的本質(zhì)是對(duì)語言評(píng)價(jià)義的挖掘。早期對(duì)評(píng)價(jià)的研究主要在立場(stance)(Biber et al.,1989)和言據(jù)性(evidentiality)(Chafe,1986)方面。Langacker也從認(rèn)知角度討論了主觀性(subjectivity)問題(Langacker,1990)。對(duì)評(píng)價(jià)語言進(jìn)行系統(tǒng)描寫的理論當(dāng)屬M(fèi)artin團(tuán)隊(duì)提出的評(píng)價(jià)系統(tǒng)。評(píng)價(jià)系統(tǒng)由態(tài)度、介入、級(jí)差三個(gè)子系統(tǒng)構(gòu)成,三者之間是合取關(guān)系。

      態(tài)度子系統(tǒng)是核心,由涉及感情表達(dá)的“情感”,從道德方面衡量的態(tài)度表達(dá)“判斷”,從美學(xué)方面衡量的態(tài)度表達(dá)“鑒賞”三個(gè)變量組成(Martin & White,2008:42)。評(píng)價(jià)系統(tǒng)將表達(dá)態(tài)度的語言形式從顯性到隱性劃分為幾個(gè)等級(jí),即:明顯表現(xiàn)態(tài)度的題寫形式(inscribe),用隱含態(tài)度詞語表達(dá)態(tài)度的激發(fā)形式(provoke),用隱喻等手段提示態(tài)度的標(biāo)識(shí)形式(flag),靠語境和背景知識(shí)等暗示態(tài)度的陳述形式(afford)。在情感分析中,除了題寫形式,其他幾種形式的態(tài)度表達(dá)都是計(jì)算機(jī)判斷的難點(diǎn),值得深入研究。

      3.2.2 情感分析的計(jì)算研究

      情感分析首先要區(qū)分客觀陳述和主觀陳述,然后對(duì)主觀陳述進(jìn)行特征識(shí)別,提取其中的評(píng)價(jià)者(opinion holder)、評(píng)價(jià)對(duì)象(target)、評(píng)價(jià)表述(appraisal expression)等信息。最后,進(jìn)行情感類別判斷。

      對(duì)主觀陳述的識(shí)別主要依靠對(duì)情感詞、句子結(jié)構(gòu)、上下文語境等內(nèi)容的主觀性判斷,也可以通過比較待判定陳述和已知主觀陳述之間的相似度進(jìn)行。對(duì)評(píng)價(jià)者的識(shí)別主要依據(jù)命名實(shí)體,或依據(jù)FrameNet的語義角色標(biāo)注。對(duì)評(píng)價(jià)對(duì)象的識(shí)別,也多數(shù)將其限定在名詞或名詞短語范疇,主要是基于句法、語義規(guī)則。對(duì)于評(píng)價(jià)詞語的提取可以在大型語料庫中提取評(píng)價(jià)性形容詞,或用點(diǎn)互信息方法(PMI)方法判斷待評(píng)價(jià)詞,或通過WordNet和HowNet的詞義關(guān)系來提取。對(duì)情感極性的判斷,可以利用情感詞之間的相似度計(jì)算情感極性,或利用HowNet的語義相似度和語義場計(jì)算情感傾向。

      3.2.3 情感分析的難題

      情感分析中利用文內(nèi)和文外語境進(jìn)行情感義判斷的研究雖然已經(jīng)引起學(xué)者們關(guān)注,但尚未出現(xiàn)真正突破性成果,對(duì)反諷、隱喻、夸張等隱性評(píng)價(jià)無法準(zhǔn)確判定。語篇級(jí)別的整體情感傾向分析,多數(shù)是詞匯情感極性的簡單疊加,沒有結(jié)合語篇特征開展。中文情感分析中,缺乏標(biāo)注完善的大規(guī)模情感語料庫和情感詞典。在語料庫建設(shè)中,對(duì)于主觀表述、情感詞、情感表達(dá),情感信息分布模式、情感信息流動(dòng)方式等都有待進(jìn)一步研究(徐琳宏等,2008)。

      4.0 話語計(jì)算的研究方法

      計(jì)算話語學(xué)的研究具有明確的問題導(dǎo)向性。以自動(dòng)文摘為例,自動(dòng)文摘涉及文章關(guān)鍵詞、中心思想的提取等,可以通過多種方式和路徑實(shí)現(xiàn)文摘的自動(dòng)生成。因?yàn)檠芯砍晒糜谟?jì)算機(jī)處理,所以特征描寫一定要有明確、嚴(yán)格的界定方式。其次,很多計(jì)算話語學(xué)的問題可以轉(zhuǎn)變?yōu)榫垲悊栴},所以特征分類很重要。

      基于規(guī)則的研究方法 理性主義關(guān)照下基于規(guī)則的方法,將語言視為符號(hào)規(guī)則的集成。研究者從語言中提取規(guī)則加以形式化,然后轉(zhuǎn)變?yōu)樗惴ㄝ斎胗?jì)算機(jī),由計(jì)算機(jī)利用這些規(guī)則對(duì)語言進(jìn)行處理?;谝?guī)則的方法中,語言特征的形式化和建模是兩個(gè)重要步驟。形式化是用有限的符號(hào)來表示語言的無限性,而語言特征建模則需要通過數(shù)學(xué)方式。常用的數(shù)學(xué)知識(shí)包括:數(shù)理邏輯、概率統(tǒng)計(jì)、以及離散數(shù)學(xué)的知識(shí),如:集合論、邏輯、代數(shù)中與語言相關(guān)的部分(帕赫蒂等,2012:vii)。

      基于統(tǒng)計(jì)的研究方法 基于統(tǒng)計(jì)的研究方法又稱為經(jīng)驗(yàn)主義關(guān)照下語料庫驅(qū)動(dòng)的方法。經(jīng)驗(yàn)主義是將計(jì)算機(jī)視為具有體驗(yàn)?zāi)芰Φ摹胺抡嫒恕?,讓它自己從語言中學(xué)習(xí)規(guī)則。通常分為有指導(dǎo)學(xué)習(xí)和無指導(dǎo)學(xué)習(xí)。在有指導(dǎo)機(jī)器學(xué)習(xí)中,帶標(biāo)注的語料庫是機(jī)器學(xué)習(xí)的老師,而標(biāo)注什么、如何標(biāo)注來自于計(jì)算話語學(xué)的研究成果。無指導(dǎo)學(xué)習(xí)是讓計(jì)算機(jī)從未標(biāo)注語料中自己總結(jié)語言規(guī)律。但由于計(jì)算機(jī)沒有學(xué)習(xí)過標(biāo)注好的語料,往往無法知道自己總結(jié)的語言規(guī)律是否正確,從而影響了語言處理的效果(馮志偉,2011)。在實(shí)際的語言處理中,基于規(guī)則和基于統(tǒng)計(jì)的方法往往結(jié)合使用,以謀求最佳效果(中文信息處理發(fā)展報(bào)告2016:29)。

      深度學(xué)習(xí)和知識(shí)圖譜技術(shù) 深度學(xué)習(xí)是基于人工神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí),它將世界知識(shí)表示為嵌套的層次概念體系,具有很強(qiáng)的能力和靈活性,能從對(duì)象化樣本學(xué)到非對(duì)象化的對(duì)象識(shí)別。深度學(xué)習(xí)算法將一層或淺層難于處理的復(fù)雜映射或函數(shù)運(yùn)算,分解為多個(gè)嵌套層次的簡單映射。這里的關(guān)鍵是“嵌套的隱含層”,也就是深度的出現(xiàn)。在一個(gè)層次上達(dá)不到的,卻可能在更多的嵌套疊層中實(shí)現(xiàn)。深度學(xué)習(xí)算法的層次性,裂隙化聯(lián)系,顯示出不可替代的構(gòu)造功能。深度學(xué)習(xí)在多種自然語言處理任務(wù)上表現(xiàn)都很突出。

      知識(shí)圖譜是由語義網(wǎng)絡(luò)構(gòu)成的知識(shí)庫。從數(shù)據(jù)結(jié)構(gòu)上講,圖譜是由節(jié)點(diǎn)和邊來構(gòu)成,也可以把它理解成多關(guān)系圖(Multirelational graph)。它提供了實(shí)體之間的結(jié)構(gòu)化聯(lián)系,就像話語世界中命題與命題之間的各種語義關(guān)聯(lián),因此知識(shí)圖譜非常適合于話語連貫關(guān)系的計(jì)算。知識(shí)圖譜的優(yōu)勢(shì)在于強(qiáng)大的數(shù)據(jù)描寫能力,各種機(jī)器學(xué)習(xí)算法雖然在預(yù)測(cè)能力上很不錯(cuò),但描寫能力有限,知識(shí)圖譜剛好填補(bǔ)了這一空缺。

      5.0 結(jié)束語

      計(jì)算話語學(xué)作為面向自然語言處理的新興話語研究方向,其發(fā)展之路任重而道遠(yuǎn)。語篇主題義和人際義的計(jì)算是計(jì)算話語學(xué)的核心問題。主題義是語篇的語義流利用語篇結(jié)構(gòu)而建構(gòu)的,而人際義的正確解讀更多地依賴于動(dòng)態(tài)語境知識(shí)。這些問題的解決依賴于認(rèn)知語言學(xué)對(duì)人類話語理解和生成模式的解構(gòu),也依賴于計(jì)算機(jī)技術(shù)和算法的革新。對(duì)于計(jì)算話語學(xué)研究者而言,從認(rèn)知角度研究語篇結(jié)構(gòu)和人腦對(duì)語境知識(shí)的調(diào)用過程,從中推理人類普遍具有的邏輯思維模式,并設(shè)法將這些模式形式化,是一項(xiàng)相當(dāng)重要而艱巨的任務(wù)。

      猜你喜歡
      指代連貫語言學(xué)
      Let’s Save Food To Fight Hunger
      奧卡姆和布列丹對(duì)指代劃分的比較
      語意巧連貫,舊“貌”換新“顏”——從“八省聯(lián)考”卷探析高考語意連貫題
      銜接連貫題的復(fù)習(xí)備考注意點(diǎn)
      將句子寫連貫
      認(rèn)知語言學(xué)與對(duì)外漢語教學(xué)
      “不一而足”話討論
      自然語言中的指代技術(shù)的研究
      河南科技(2014年10期)2014-02-27 14:09:37
      語言學(xué)與修辭學(xué):關(guān)聯(lián)與互動(dòng)
      語料庫語言學(xué)未來發(fā)展趨勢(shì)
      海林市| 克东县| 镇安县| 封丘县| 安阳市| 萨嘎县| 隆德县| 吴旗县| 黄龙县| 巍山| 佛坪县| 兴宁市| 彭阳县| 冀州市| 突泉县| 天柱县| 渝中区| 保康县| 滕州市| 二连浩特市| 渑池县| 青川县| 莱阳市| 桦川县| 绥化市| 北流市| 邵东县| 达拉特旗| 衢州市| 扶绥县| 曲阳县| 新沂市| 滦平县| 信宜市| 贵港市| 日土县| 温宿县| 香港 | 兴山县| 佛山市| 诸暨市|