• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      中文動詞及分類研究: 中文動詞詞匯語義網(wǎng)的構建及應用

      2019-03-28 09:24:08劉美君萬明瑜
      辭書研究 2019年2期
      關鍵詞:構式語法自然語言處理

      劉美君 萬明瑜

      摘 要 隨著人工智能的日益發(fā)展,語言學成為“產(chǎn)”“業(yè)”“學”界尋求合作及突破的新契機。其中語言學語義資源的構建及標注問題成為了當前的一大熱點及難點。文章針對中文動詞語義分類問題,從理論研究、語義網(wǎng)構建及實踐應用三方面進行了全面的探討和分析。理論研究上,文章以“框架為本,構式為用”的研究方法為基石,依循框架語義和構式語法以區(qū)分動詞和構式之間的 “形義”搭配,形成“格式塔”(Gestalt)般互補。語義網(wǎng)構建上,以語言學分析為基礎,語料實證為依歸,通過 “框架元素”與“定義性構式”來定義動詞屬性,使語料兼有詞匯表征、框架階層及語義標注等信息。語義知識庫目前包含“溝通”“認知”“感知”“情緒”“評價”“社會互動”“自動”和“致使移動”八大類框架動詞,已有效運用于多種基于語義及事件框架的中文自然語言處理任務,包括中文語義自動消歧,自動語義角色標注,事件框架甄別及故事自動生成。

      關鍵詞 框架語義 構式語法 動詞分類 語義標注 自然語言處理

      一、 導論

      大數(shù)據(jù)與深度學習技術的到來,使得人工智能技術飛速發(fā)展,Marcus(2018)指出,近六年來,人工智能在語音及圖像的自動識別、機器翻譯、信息自動檢索等自然語言處理任務方面作用顯著,幾乎到達一個很難再超越的高峰期。研究者們開始關心語言學和人工智能如何進一步結合以求得突破,例如在詞性標注上,從97%到100%的可能性。(Manning 2011)為此,語言學成為“產(chǎn)”“業(yè)”“學”界尋求再突破的新契機,究其原因有四: 其一,語言學知識為人工智能的自然語言處理提供更接近語言本質的特征模型;其二,語言學規(guī)則為語言現(xiàn)象及行為差異提供更為合理的解釋;其三,語言學特征編碼為人工智能提供相對有效無噪的數(shù)據(jù)集;其四,語言學知識工程不依賴于大規(guī)模集成電路或復雜算法,大力節(jié)省軟硬件成本?,F(xiàn)階段人工智能與語言學合作發(fā)展成為必然趨勢,但合作的熱點及難點在于語言學資源庫的構建及語義標注問題。過去的自然語言處理任務在詞語切分、詞類標注、句法標注方面均已取得了良好成果。然而,語義標注的工作難度卻更大,問題更為復雜。關于語義劃分及標注的問題,國內外已經(jīng)有許多相關研究和資源庫(或線上知識庫),例如,國外有The Proposition Bank (英文PropBank Palmer et al. 2005), English FrameNet (英文框架語義網(wǎng),F(xiàn)illmore & Baker 2000), English VerbNet (英文動詞語義網(wǎng),Levin 1993; Schuler 2005); 國內有中文句結構樹 (Chen et al. 1999; Huang et al. 2000), 漢語框架語義知識庫/Chinese FrameNet (You & Liu 2005) 等。國內相關研究較國外起步晚,且現(xiàn)有語義研究及標注系統(tǒng)仍存在很大的不足和弊端,許多問題有待重新審視: 如何系統(tǒng)而有效地區(qū)分語義?如何辨別形義搭配?形式與語義對應關系如何?什么樣的語法表現(xiàn)可作為語義區(qū)分的標準?如何對動詞進行分類?什么樣的分析方法適合中文動詞的語義區(qū)分?下面從國內外相關研究總結當前語義研究及標注的主要問題和難點,并有針對性地介紹中文動詞詞匯語義網(wǎng)的特色和優(yōu)勢。

      二、 國內外語義研究及標注系統(tǒng)綜述

      國外的語義研究起步較早,發(fā)展相對成熟,已有許多完整的理論構架及標注體系,代表性研究及體系有英文框架語義網(wǎng)、英文動詞語義網(wǎng)、UCREL語義分析系統(tǒng)(USAS)及英文PropBank等。相比之下,國內的語義研究起步較晚,發(fā)展相對滯后,但也一些對應的體系和成果,比如,漢語PropBank、中文句結構樹資源庫 (Sinica Treebank)、構式義標注(劉洪超 & 詹衛(wèi)東2014)、漢語框架語義知識庫 (Chinese FrameNet)及中文動詞詞匯語義網(wǎng)(Mandarin VerbNet)等。中文的語義劃分標準及理論研究大都沿襲西方的研究體系,缺乏對中文語法特殊性的處理。而且各體系基于不同語義關聯(lián)分析語義及語法表現(xiàn),側重點不一,劃分粗細度各異,各有特點,但也存在不足之處。

      1. 英文框架語義網(wǎng) (English FrameNet)

      英文框架語義網(wǎng)[1]是根據(jù)“框架為本”(framebased)的研究方法和分析方式而建立的一套專門分析英文語義的開源性知識庫體系。(Fillmore1982; Fillmore & Atkins1992; Fillmore & Baker2000)該系統(tǒng)基于Fillmore(1982)提出的框架語義理論,以認知為驅動因素,以詞匯(不僅限于動詞)語義背后所涉及的“場景情境”(scene)來進行語義分類。這樣的背景架構即為“語義框架”(semantic frame)。語義框架除了提供認知上的事件基模, 也作為聯(lián)系相關詞匯的概念基準,以作為詞匯語義分類的依據(jù)。傳統(tǒng)上,語義框架是由一組主要的參與角色(即框架元素)來定義的,然后通過所需角色來呈現(xiàn)語義的依存關系。下面以動詞“hit”為例,呈現(xiàn)該系統(tǒng)對于動詞的核心的框架元素標注情況。

      (1) [The massive metal foot/Agent] [HIT/Impact] [the ground/Patient] with [a huge thud/Result.]

      如例(1)所示,動詞“hit”在框架語義網(wǎng)中被歸為Impact類動詞,所牽涉的核心框架元素有“Agent” (施事者),“Patient”(受事者)及非核心框架元素“Result”(結果)。系統(tǒng)對動詞本身類別及其所關聯(lián)的參與角色均進行了相應的語義標注,但顯著的缺點是只關注框架參與角色,忽略詞匯在句法上的特征表現(xiàn);另外,詞匯本身的分類也缺乏一個系統(tǒng)的準則,顯得雜亂而無章法。

      2. 英文動詞語義網(wǎng)(English VerbNet)

      英文動詞語義網(wǎng)[2]是基于Levin(1993)所提出的英語動詞詞匯分類方法(English Verb Classes and Alternations)而建立的關于英文動詞分類及結構變化的標注體系。英文動詞語義網(wǎng)的構建是在Levin(1993)提出動詞類別基礎上進行次類的細化與添加,得到同類動詞語義、語法的一致性。如Carry(攜帶)類動詞,其同類成員有Carry,Drag,Draw,Haul,Heft,這些動詞具有共同的語義角色,即施事、客體、源位、目的地,且具有共同的語法表現(xiàn),例如: NP+V+NP。下面的例子闡釋了英文動詞語義網(wǎng)對于Carry動詞的一種最常見的句法結構及語義角色。

      (2) 例句: Amanda carried the package.

      句法: Agent/施事 V Theme/客體

      語義: motion [during(E0), Theme]

      equals (E0, E1)

      motion [during(E1), Agent]

      cause (Agent, E0)

      盡管英文動詞語義網(wǎng)兼顧了語義和語法因素,但其對動詞分類缺乏標記、語義分類過于泛化、缺少對同類詞元的列舉且不適用于中文的特殊語法及語義表達。

      3. UCREL語義分析系統(tǒng)(USAS)

      UCREL語義分析系統(tǒng)[3]是一套對文本進行自動語義分析及標注的系統(tǒng)。系統(tǒng)的開發(fā)始于20世紀90年代,語義標記參考McArthur(1981)撰寫的Longman Lexicon of Contemporary English(《朗文英語當代辭典》)。該系統(tǒng)的框架于2013年開始擴展,涵蓋多國語言,包括: 中文、荷蘭語、意大利語、葡萄牙語、西班牙語和馬來語。該系統(tǒng)對語義的劃分基于一個多層結構,根據(jù)21個主要話語場進行細化分類,利用相同語義概念來聚集詞意的語義場(標注見例3)。

      (3) UCREL語義分析系統(tǒng)標注示例: “我是中國人”。

      例(3)在UCREL語義分析系統(tǒng)自動標注體系中被自動分詞且每個詞語標有三層信息: POS語法信息、語義關聯(lián)類別信息及多字詞(MultiWordExpression)信息。該系統(tǒng)的語義標注問題在于其語義關聯(lián)并不能有效區(qū)分不同的語義類型。例如,基于UCREL語義分析系統(tǒng)的分析,例(3)中“我” 不足以分辨出是歷事(Experiencer)、施事(Agent)還是說話人(Speaker)。此外,UCREL語義分析系統(tǒng)僅提供詞類標注,而沒有任何句法結構信息的標注。

      4. 英文PropBank(The Proposition Bank)

      英文PropBank[4](Kingsbury & Palmer 2002)是一套基于Treebank2華爾街日報語料(WSJ)進行的語義標記資源庫。語料庫中每個動詞都會被當作一個語義謂詞,其周圍的文本會被標注為該謂詞的論元和附加角色,謂詞本身也用細粒度的帶有語義的方法進行標記。語料庫中的語義角色采用先決的通用標記,過于泛化且靈活度低。以動詞hit為例:

      (4) a. [The boy]施事 hit her hard.

      b. ?[The wind]施事 hit her hard.

      c. ?[His words]施事 hit her hard.

      例(4)中的the boy,the wind,his words盡管語義特征不同,分別為人類、非人類的物質實體、非人類非物質事物,在英文PropBank中卻不做區(qū)分,統(tǒng)一分析為施事。更為完善的處理方法應是基于同一標記下的成分語義,根據(jù)特征區(qū)別進一步細分語義角色,如: 施事(Agent)、致事(Causer)、刺激物(Stimulas)等。

      5. 漢語PropBank

      漢語PropBank[5]沿用英文PropBank的理論體系,對中文的語料采用不同謂詞對應不同基本語義命題的理論框架進行標注。且謂詞與論元的關系也被添加到中文結構樹資料庫(Chinese Treebank)的句法樹中。如動詞“搬”(Move)屬于“致使移動” (CausedtoMove)類別,其論元包括了移動者 (ARG0: mover)、被移動物體(ARG1: moved)、移動起點(ARG2: moved from)及移動終點(ARG3: moved to)等。例(5)為該系統(tǒng)的一個標注實例。

      (5) [這個村莊]ARG0: mover[曾] ARGMADV自力更生,艱苦奮斗,[搬]REL[山] ARG1: moved添溝造平原。

      從例(5)可知,漢語Propbank明顯的問題在于對謂詞的簡單羅列(統(tǒng)一將動詞標注為“REL”),沒有對動詞進行系統(tǒng)性的分類。

      6. 中文句結構樹資源庫 (Sinica Treebank)

      中文句結構樹資源庫[6](Chen et al. 1999; Huang et al. 2000)由“中央研究院”詞庫小組(Chinese Knowledge and Information Processing)建立,基于信息為本的格語法(ICG)對中文語料庫(Sinica Corpus)的語料進行標注。該資源庫的結構框架采用中心驅動原則(HeadDriven Principle),圍繞句子或詞組的核心中心對其論元或附加成分的語法構成進行標注。圖1為一示范標注。

      如圖1所示,盡管中文句結構樹資源庫標注了詞的語法特征,但未對動詞語義進行分類,且對論元、附加成分僅進行語法標注,并沒有凸顯各自語義角色。

      7. 北京大學構式義標注

      北京大學構式義標注(劉洪超,詹衛(wèi)東2014)以構式為單位進行語義標注。構式指整體意義無法從其組成部分簡單加合出來的語言單位。該語料庫針對特定構式的認知機制進行分析,嘗試建立從表層語言到深層認知的映射。如:

      (6) a. 用一噸,少一噸。

      b. 泡一次,淡一次。

      在構式義標注中,例(6)統(tǒng)一采用“A一X,B一X”的釋義模板,其語義為“越A越B”,表達因果倚變義。盡管這一語義標注包含構式信息,但對動詞的語義角色與特定構式的互動并未進行進一步的分析標注。

      8. 漢語框架語義知識庫

      漢語框架語義知識庫是由山西大學(You & Liu 2005)開發(fā),以Fillmore(1982)的框架語義學為理論基礎,參照加州大學伯克利分校的FrameNet工程,構建的以漢語真實語料為依據(jù),可供計算機使用的漢語詞匯語義知識庫。表1為一示范標注(以動詞“到達”為例)。

      如表1所示,漢語框架語義知識庫對動詞的語義框架、動詞的核心框架元素, 非核心框架元素,以及同類詞元都進行了定義和整理,但這一知識庫的建立更像是英文框架語義網(wǎng)的中文譯本,缺乏對中文特殊語法現(xiàn)象的統(tǒng)一處理;另外,與英文框架語義網(wǎng)類似,該系統(tǒng)也缺乏對構式語義信息的標注。

      三、 中文動詞詞匯語義網(wǎng)的特性

      以上無論哪種語義分類方法,雖各有所長,但均有不足之處。對于語義的劃分,語言學家的共識就是動詞的語義必然體現(xiàn)在語法表現(xiàn)上,語法和語義是一體兩面、相輔相成的。語義角色是可能進一步細化或延伸的語言范疇??蚣苤械慕巧旧硪苍S不足以定義框架,而需要與語法特征結合。換言之,對語義角色,要將其作為構式中的框架角色進行研究。Liu和Chang(2015)指出,動詞與構式彼此互為表里,有如“格式塔”(Gestalt)般相互依存的緊密關系。構式與動詞間存有彼此定義的搭配關系,構式語義必須通過動詞來呈現(xiàn),而動詞框架與不同的構式相聯(lián)系。本文對于漢語動詞詞義分析和動詞分類的問題,提出一種“框架為本,構式為用”(framebased constructional approach)的分析方法,結合了“框架語義”理論中的事件框架(frames)和“構式語法”(Constructional Grammar)理論中構式的表征意義(Goldberg 1995,2003),來分析和劃分動詞的語義類型。框架理論主要定義了“參與者”(participant roles),但缺乏語法形式上的明確性;而構式語法主張形式和意義間的表征和對應, 正好作為在動詞劃分上顯性的標準。也就是說,對于語料庫的動詞屬性分析,首先確定所參與的語義框架,再定義每個框架下的“框架元素”(frame elements)與 “定義性構式”(defining constructions)來共同描述框架的性質;根據(jù)實際應用中詞義辨析中所需要的粗細程度,也需考慮與構式搭配的詞匯和共現(xiàn)形式(lexical collocation)。

      (一) 研究方法: “框架為本,構式為用”

      為了解決目前語義標注系統(tǒng)的問題及適應漢語本身特殊的語法特征,中文動詞詞匯語義網(wǎng)采取“框架為本,構式為用”的研究方法,這是一種以認知為驅動、以框架語義理論與構式語法為理論基石,以中文特色語法表現(xiàn)為補充的綜合性研究方法(Liu2003,2005,2016,2018; Liu & Chang2005; Liu & Chang2015,2018,2019; Liu & Chiang2008; Liu & Hu2008, 2013; Liu et al.2006,2015)。

      1. 框架語義(Fillmore1982,1985)

      本文根據(jù)Fillmore(1982)的框架語義理論,從認知語義的角度,將動詞依照其背后所涉及的“場景情境”(scene)來加以分類,即“語義框架”(semantic frame)。語義框架提供認知上的事件基模和聯(lián)系相關動詞的概念基準,也可作為動詞分類的依據(jù)。傳統(tǒng)上,語義框架是由一組主要的參與角色,即框架元素(frame element)來定義的,然后通過所需角色來呈現(xiàn)語義的依存關系。舉例來說,“買”這個動詞,從認知經(jīng)驗來說,屬于“商業(yè)交易動詞”,涉及商業(yè)交易的認知框架。在這個框架中,主要的參與元素有買家、賣家、貨品、金錢等,相關的動詞包括買、賣、付、花(錢)、要價等;同一框架下的動詞或者會搭配不同的框架元素,如表2與例7所示。

      (7) a. [我/買家]買了[一瓶水/貨品]

      b. [他/賣家]賣了[一瓶水/貨品]

      c. [我/買家]付了[他/賣家][五百塊錢/金錢]

      由此可以看出,以框架為本的分析方式可兼顧語義的共性與特性,提出符合實證經(jīng)驗的分類。此法已應用于英文動詞的分析上,已得到廣泛認可的結果(詳見“英文框架語義網(wǎng)”)。

      2. 構式語法(Goldberg 1995,1997,2010)

      在詞匯語義相關的研究中,最為廣泛接受的前提是動詞的語義屬性會體現(xiàn)在其語法表現(xiàn)上(Levin1993;Levin & Hovav1996,2005),而具有語法辨識性的語義成分才是關鍵特征。基于這一原則,我們對框架與動詞的關聯(lián)做出進一步的語法定義, 對原有的框架語義理論進行了擴展: 借助“構式語法”中形義搭配的特點(Goldberg1995,1997,2010),提出一種混合互補的方法,進一步將語義框架之標準優(yōu)化為“形義搭配”的原則; 即在框架的基礎上, 明確規(guī)定了框架元素,并列出“定義性構式”(defining construction),幫助界定語義要素的形式搭配。從宏觀的角度,“構式”也如同詞匯一般,是一種“形式和意義”的搭配對應關系,即構式自身就是具有語義的,并可通過語義上與其兼容互補的動詞體現(xiàn)出來。構式和動詞,兩者結合,相輔相成,攜手將框架的意義具體地表達出來。如同Boas(2003)所言:“動詞的每一個義項(sense)都形成一個微型構式 (miniconstruction),既包含框架語義也包含句法信息?!狈催^來說,就是一個框架的語義除了動詞所帶有的框架元素之外,也體現(xiàn)于動詞所參與的詞匯構式當中,而這些構式即為框架的“定義性構式”。

      具體來說,構式的方法主要體現(xiàn)在語義網(wǎng)參考框架中的語義要素與動詞的共現(xiàn)構式特征(colloconstructional features)。一方面,共現(xiàn)構式模式可以清晰定義動詞或框架之間的差異。如同為“致使移動類”動詞的“搬”“放”,兩者具有相似語義角色: 移動者、被移動物、處所,在共現(xiàn)構式模式方面存在顯著差異,以施事性把字句與處所倒置式為例:

      (8) 施事性把字句: a. 我把書搬到/*在桌上。

      b. 我把書放到/在桌上。

      (9) 處所倒置式: a. *桌上搬著一本書。

      b. 桌上放著一本書

      兩種共現(xiàn)構式模式區(qū)分了“搬移類”動詞與“放置類”動詞。就構式而言,根據(jù)Liu和Chang(2015)的觀點,處所處置式是放置類動詞的區(qū)別性構式,而“搬移類”動詞不能用于處所倒置式。

      另一方面,就詞匯共現(xiàn)模式(Morphocollocation)而言,基于中文十億詞語料庫(Chinese Gigaword)所做的“搬”“放”做施事性把字句謂語介詞搭配的頻率統(tǒng)計如表3所示:

      其中,“搬”通常與表路徑的“到”搭配使用,表示致使物體移動的路徑;而“放”通常與引入處所的“在”共現(xiàn),表示致使物體處于某位置。由詞匯共現(xiàn)模式,還可歸納出同類動詞如“搬移類”動詞“投”“擲”,“放置類”動詞“丟”“扔”。

      基于這樣的分析模式,動詞與構式互為表里,互相定義。以這種“框架為本,構式為用”的方法來分析歸類漢語動詞,不但有語言學的理論基礎,也具備操作上的實用性;無論是在后續(xù)的分類研究中還是應用于漢語動詞的教學,較以往的分類方法都更為合理適用。

      (二) 以真實語料為依歸

      本文中分析的文本材料,都是從各個語料庫搜索得來的自然語言實例,旨在考察動詞在實際使用中的情況。使用的語料庫包括“‘中央研究院平衡語料庫” (Sinica Balanced Corpus)和“中文十億詞語料庫”(Chinese Gigaword),利用“‘中央研究院中文詞匯速描系統(tǒng)”(Chinese Word Sketch Engine)進行查詢,在語料缺乏的情況下,也有借用其他搜索引擎(例如谷歌)的搜索結果作為輔助查詢?!爸醒胙芯吭骸钡钠胶庹Z料庫擁有涵蓋六大主題(文學、生活、社會、科學、哲學、藝術)、超過一千萬詞目的語料;中文十億詞語料庫囊括了來自兩岸及東南亞的華文新聞出版媒體,如《新華社》《人民日報》《“中央”社》及《聯(lián)合早報》等,包含了超過十億字詞的新聞語料。語料篩選方面,我們選定某一動詞作為觀察對象,以其為關鍵字在語料庫中收集語例,經(jīng)過整理和觀察,得出該動詞實際的句法表現(xiàn)、數(shù)量分布,以及最為顯著的共現(xiàn)形式,而后進行語義上的分析和討論。本文的最終目的為基于現(xiàn)有的語義標注系統(tǒng)的各類問題及漢語本身的語法特征,建立一個針對漢語動詞語義的有效分類及標注體系及知識庫,并能為中文自然語言處理所應用。

      四、 中文動詞詞匯語義網(wǎng)的構建與功能介紹

      中文動詞詞匯語義網(wǎng)(Mandarin VerbNet)[7]是關于中文動詞分類及語義標注的一個全面性詞匯語義知識庫。該知識庫由語言學導向,基于語料庫實證研究,且面向自然語言處理及教學等各種應用。該知識庫的建立以“框架為本,構式為用”的研究方法為理論基礎,為動詞進行分類及語義標注,提供了有層級的動詞框架信息和帶有統(tǒng)計頻率的動詞語義標注信息。以下為語義網(wǎng)的具體介紹。

      (一) 框架信息及其層級結構

      框架的語義范疇不同,具有層次性。(Liu & Chang 2005)按照范疇大小,可分為源框架(Archiframe)>初級框架(Primaryframe)>基本框架(Basicframe)>微框架(Microframe)??蚣荛g層層相關,低層框架可視為高層框架的子框架(subframe)。換言之,這種分層結構含有框架自上而下的繼承和使用關系。

      源框架是認知上廣義的語義領域,作為框架上層是最為概括的大類,由框架最基本的語義原型與最基礎的句式來定義,源框架為必須框架;

      初級框架可以提供一個次高層次的語法語義搭配關系(如情緒類動詞的基本框架至上還有五個初級框架,見表4);

      基本框架是認知上顯著的層次,有較明確清晰的語義成分及搭配構式,表達基本范疇所涵蓋的語義特征。源框架和基本框架是必需的,而初級框架和微框架則不是必需的;

      微框架用來描述基本框架下一些頻繁出現(xiàn)的近義詞集,用來區(qū)分近義詞的細微語義差別, 如“懸”“掛”“吊”為放置類(Placement)基本框架下面的三個微框架。

      以下以情緒類動詞為例,展示該類動詞的層級框架信息: 情緒被定義為源框架,在語義網(wǎng)中包括了五大初級框架及十個基本框架,具體框架信息如表4所示。

      除了層級框架結構,語義網(wǎng)的每一層框架都會有框架定義及框架信息,包含框架定義、代表動詞詞元、定義性構式、框架元素/參與角色(包括核心與非核心框架元素)、構式標記(用星號來標記,用于區(qū)分框架元素標記)。以下以情緒類源框架下面的五個初級框架為例,介紹其相關框架信息。

      表5中五種初級框架,雖然都是描述情緒狀態(tài),卻各自呈現(xiàn)明顯的語法表征差異,語義網(wǎng)根據(jù)定義性構式來對動詞加以分類。

      (二) 動詞的相關語義信息

      語義網(wǎng)包含經(jīng)過標注的語料(用例來自十億詞庫和中文平衡語料庫),每個動詞標記的內容包括動詞在基本框架下的框架元素和構式標記。語義網(wǎng)還提供多義詞的標注、兩個動詞的標注結果對比、半詞匯化信息等。此外,語義網(wǎng)還提供每個動詞在中文十億詞語料庫中的出現(xiàn)頻率,用來呈現(xiàn)動詞的使用情況。

      1. 動詞的標注形式

      以放置類動詞“放”為例,語義網(wǎng)的動詞語義標注主要通過兩大類信息來實現(xiàn): 框架元素(frame element)和構式標記(construction marker)??蚣茉厥强蚣軆葎釉~特定的參與角色,并通過角色來呈現(xiàn)與語義的依存關系。構式標記是跟動詞緊密連接的顯著句法標記,用來說明動詞類別和句法結構的關系,在語義網(wǎng)中用星號(*)標記加以區(qū)分。

      (10) 定義“放置類”動詞“放”:

      基本框架: 放置框架(Placement frame)

      a. 核心框架元素: 放置者、放置物、放置點

      b. 構式標記: *把、*處所標記、*體貌標記

      c. 基本構式模式:

      i. 及物的把字結構

      如: [她/放置者][把/*把][玩具/放置物]放[在/*處所標記][房間里/放置點]

      ii. 凸顯放置物的不及物結構

      如: [玩具/放置物]放[在/*處所標記][房間里/放置點]

      iii. 凸顯放置點的處所倒裝結構

      如: [房間里/放置點]放[著/*體貌標記][玩具/放置物]

      除了動詞最基本的語義,“框架為本,構式為用”的標注方法還可以標注動詞語義的概念和隱喻延伸。以“放置”(Placement)類動詞“放”為例:

      (11) a. [我/放置者][把/*把][書/放置物]放[在/*處所標記][桌子上/放置點]。

      b. [她/放置者][把/*把][老師的話/放置物]放[在/*處所標記][心上/放置點認知延伸]

      例(11)中的兩個句子,具備相同的構式及句法結構,但是語義卻不同。例(11)a為動詞“放”的典型用法,表達的是普通放置處所的概念;而例(11)b由于搭配非處所的介賓短語(在心上),使得“放”的語義從空間層面延伸至認知層面(記憶)。語義網(wǎng)對類似現(xiàn)象的處理使得詞匯的基本語義與其語義的延展或轉換得到明確的區(qū)分。

      2. 多義詞的處理

      動詞的多義性和義項劃分是語言學研究中值得關注的問題。語義網(wǎng)遵循“一個框架,一個語義”(one sense, one frame)的原則,根據(jù)所在語義框架不同,區(qū)分多義詞的不同義項。以動詞“放”為例,“放”在中文詞匯網(wǎng)絡(Chinese WordNet)的分析中包含37個不同的義項,可見其用法之廣,語義之豐富。而在中文動詞語義網(wǎng)中,根據(jù)“框架為本,構式為用”的分析, “放”初步分為兩個空間動態(tài)的基礎語義——“置放”類和“釋放”類。(Liu & Chang 2015)。如:

      (12) a. 放置義: [她/放置者][把/*把][鳥/放置物]放[在/*處所標記][籠子里/放置點]

      b. 釋放義: [她/施事][把/*把][鳥/釋放物]放[出/*出標記][籠子/源點]

      這兩個基礎義項,可以用“釋出源點”(away from a source)到“置于終點”(land at an endpoint)的事件鏈來解釋,又可經(jīng)由位移路徑衍生出“放”的其他語義和用法。在認知框架的基礎下,“放鹽、放書、放錢”等用法都和“置放”有關,構式上有處所終點出現(xiàn);但“放人、放牛、放風箏”等則與“釋放”較相關,構式上可帶有源點出處(source)。但是當構式表現(xiàn)看起來相同時,框架元素的定義就成了區(qū)分的關鍵。根據(jù)語義網(wǎng),可知“釋放”義與“放置”義的“放”牽涉的框架元素不同,實際上是涉及了兩個不一樣的基本框架:“放置”框架包含放置者、放置物、處所等,而“釋放”框架包含施事、“出”類標記、釋放物等。

      3. 兩個動詞之間的比較

      中文動詞詞匯語義網(wǎng)還可以比較同一源框架下的任意兩個動詞之間的構式模式異同,主要用于區(qū)分近義詞或反義詞的語義特征,得出其模式上的異同,進而分析其語義異同。例如,“快樂”和“高興”,都同屬于情緒源框架下的“快樂悲傷”(HappySad)基本框架,根據(jù)語義網(wǎng)的語料標注,通過自動比較的功能,可以得出兩者具有共同的模式如:

      [歷事][快樂悲傷]: 我高興/快樂?。?/p>

      [歷事][*程度][快樂悲傷]: 大家都很高興/快樂。

      [刺激源][*致使][歷事][快樂悲傷]: 美麗的景色使她們高興/快樂。

      [歷事][*情緒感官][快樂悲傷]: 她們覺得高興/快樂。

      [刺激源][*程度][快樂悲傷]: 有錢很高興/快樂。

      兩者也具有不同的構式模式,如“快樂”具有大量名物化[*快樂悲傷+名物化]的用法,而“高興”則幾乎沒有名物化;另外,“高興”具有[歷事][*程度][快樂悲傷][內容]的模式,比如: “我很高興你能過來”,而“快樂”沒有。兩者語法表現(xiàn)的異同說明他們語義上也存在細微差異,特別是“快樂”的高頻率名物化用法,對比之下,“高興”在語義上比“快樂”表現(xiàn)出更固化的句法特征。

      4. 半詞匯化信息

      中文動詞詞匯語義網(wǎng)也包含部分動詞與半詞匯化成分的搭配,半詞匯化結構是指是具有能產(chǎn)性(productive verbs)的詞匯結構。網(wǎng)站現(xiàn)有的半詞匯化結構包括“可+V”“V+人”“令人+V”等,其中V代表適應該結構的能產(chǎn)性動詞,如例(3),“可+V”的半詞匯化結構,適用于類似“可愛”“可恨”“可憐”等動詞;“V+人”的半詞匯化結構,適用于類似“煩人”“氣人”“感人”等動詞;“令人+V”的半詞匯化結構,適用于類似“令人興奮”“令人鼓舞”“令人沮喪”等動詞;這三類半詞匯化結構均屬于“情緒類”框架下的子類“刺激源屬性”的基本框架,且用“#”加以標注,以區(qū)分于其他標注信息。相關例句如下:

      (13) a. [女孩子/刺激源] [比較/*程度] [可愛/#刺激源屬性]。

      b. [這個畫面/刺激源] [十分/*程度] [感人/#刺激源屬性]。

      c. [眼前的情景/刺激源] [讓人迷惑/#刺激源屬性]。

      5. 語義網(wǎng)構建流程及進度

      語義網(wǎng)的構建流程主要包括以下幾個步驟(見圖2): 其一,語料收集與篩選。該環(huán)節(jié)旨在完成基本語料的準備,采用自動提取與手動篩選相結合的方式進行語料收集,在每個類別中定義最高頻的動詞列表,每個單詞選取合格語料200句;其二,人工標注。該環(huán)節(jié)采用半自動輔助標記工具Atom,結合人工方式標注動詞語義,主要包含動詞類別、框架元素、構式標記;其三,人工校對,為了確保標注準確性,初步標注結果由兩位項目經(jīng)理做交叉比對,進行一致性內部評分測試,以確保更高的標注準確度;其四,網(wǎng)頁開發(fā)及管理,采用JS腳本語言開發(fā)網(wǎng)頁,在網(wǎng)頁后臺對標注、定義完成的語料進行管理,利用Atom內嵌程序包自動統(tǒng)計并上傳數(shù)據(jù)至城大伺服器,以公開網(wǎng)絡用戶使用;最后,基于用戶回饋網(wǎng)站的體驗評價及建議,更新標注以提高標注質量及改善網(wǎng)頁設計以增加用戶體驗。

      目前,中文動詞詞匯語義網(wǎng)已建立了八個源框架,包括“情緒”“認知”“感知”“致使移動”“自動”“社交互動”“溝通”及“評判”類,涵蓋大約80個基本框架。另外,語義網(wǎng)定義并分類了約800個動詞,其中520個動詞得到語義標注及構式統(tǒng)計。

      在下一個階段,語義網(wǎng)短期目標為完成中文高頻的2000個動詞的分類及標注,涵蓋大概10個新的源框架,50個基本框架,并同步實行對“空間配置類”(Spatial Configuration)、“關系類”(Relational)、“存現(xiàn)類”(Existential)、“個人行為類”(Behavorial)等源框架的語義研究。

      五、 中文動詞詞匯語義網(wǎng)之NLP應用

      中文動詞詞匯語義網(wǎng)構建的同步,產(chǎn)生了一個富含語言學信息的知識庫。該知識庫的建立對于語言學本體研究、中文教學及自然語言處理均有很好的啟示及衍生作用。目前,我們已經(jīng)成功將已有的中文動詞語義網(wǎng)資源庫投入多種語義相關的中文自然語言處理任務,并已經(jīng)取得不錯的成果,以下面三個應用為例。

      (一) 中文動詞語義消歧

      詞匯歧義/多義指同一個詞具有兩個或以上不同但相關聯(lián)的語義。詞義消歧(Word Sense Disambiguation,簡稱WSD)(Wan & Liu 2018)是指基于語境信息自動解決詞義歧義的自然語言處理任務。近幾十年來WSD仍是NLP研究中的一個熱點話題,尤其在中文動詞的一詞多義問題上。例如,在例句“他很煩!”中,既可理解為“他”這個人很煩人;也可理解為“他”感到厭煩。針對情緒類動詞的語義判別問題,Liu(2016)提出了一套適用于中文“情緒類”動詞分類方法,全面且創(chuàng)新地歸納了五種“情緒類”動詞的詞匯化模式:

      (14) a. 刺激源主語+及物動詞: “這個問題煩了我三天三夜。”

      b. 刺激源主語+不及物動詞: “明天的考試很煩。”

      c. 歷事主語+及物動詞: “你在煩什么?”

      d. 歷事主語: “我好煩??!”

      e. 影響者主語+及物動詞+歷事: “那我就別再煩你了?!?/p>

      以上五種詞匯模式,能夠很好地將多義詞“煩”加以區(qū)分,其中包含三大主要語義: 例(14)a、例(14)b屬于刺激源主語(屬性類)語義,強調主語導致客體產(chǎn)生某種情緒的一種屬性;例(14)c、例(14)d屬于歷事主語(感受類)語義,強調主語的主觀感受;而例(14)e屬于影響者主語(主動影響類)語義,強調主語的主觀性及客體的受影響性。除了動詞“煩”以外,很多其他情緒類動詞也有類似歧義問題,例如:“尷尬”“無聊”“討厭”。這四個多義“情緒類”動詞各自的歧義項及在語料中的分布如表6所示:

      表6中,“框架”指的是語義網(wǎng)中各義項對應的語義框架?!罢Z義”指四個多義動詞的義項。“用例”指各義項在語料庫中的頻次?!氨壤敝富诿總€動詞找到的各500句中義項的分布比例。基于中文動詞語義網(wǎng)中以上四個多義動詞的參與角色及構式標注信息(FC),我們采用貝葉斯模型(NB)及優(yōu)化支持向量機(SMO),進行了可監(jiān)督的自動詞義消歧任務,并比較了采用三種基本特征集——單語素(unigram)、雙語素(bigram)、單名詞性結構(uniNP)進行同等消歧任務的準確度,發(fā)現(xiàn)以FC特征集的消歧準確度比其他三種特征集預測義項明顯更高,F(xiàn)score最大差異達到0.337,主要結果如圖3所示。

      另外,研究還發(fā)現(xiàn),三個基本特征集中,名詞性結構特征集的預測精確率最低,而雙語素特征集最高,單語素特征集其次,但三者的總體表現(xiàn)差別不大;在四個動詞的各義項中,歷事主語的義項比刺激源主語的義項預測準確度更高,但刺激源主語的義項最易與其他義項發(fā)生混淆;機器學習曲線表明,F(xiàn)C特征相比其他基本特征的預測優(yōu)勢隨著樣本空間的增加而呈現(xiàn)降低的趨勢。但總體而言,使用FC用于詞義消歧的功能非常顯著且有效,印證了“一個框架,一個語義”(one sense, one frame)的理論正確性,也凸顯了動詞語義與其語法結構的有效互動。

      (二) 基于中文動詞語義網(wǎng)的自動語義角色標注

      中文動詞詞匯語義網(wǎng)現(xiàn)有的資源庫的建立,由語言學導向,經(jīng)過了實證分析,提供了一個很好的語義角色自動標注訓練集。目前數(shù)據(jù)庫包含了79707條完成標注的句子及265種語義角色。在已有的資源庫的基礎之上,我們與北京大學孫薇薇教授合作了一個自動語義角色標注系統(tǒng),并已經(jīng)取得很好的標注成果(最好標注結果達到88.6%的準確度),初步實驗結果如表7所示。其中“4l”和“6l”代表了神經(jīng)網(wǎng)絡模型的深度分別為四層及六層;Dev.S表示詞語輸入的開發(fā)集自動標記準確性; Dev.F表示具有語義標簽輸入的開發(fā)集自動標記準確性。

      為實現(xiàn)語義角色的自動標注,該系統(tǒng)基于中文動詞語義網(wǎng)前期標注好的語義數(shù)據(jù)集,采用了N層前饋神經(jīng)網(wǎng)絡模型(Nlayer FNN)進行機器學習,如圖4所示。

      該模型使用的FNN模型包含兩個子層: 非線性模型及注意力模型。在數(shù)據(jù)輸入兩個子層模型之前,句子被自動分詞成主謂詞(標記為1)和非謂詞話語(標記為0)的標記的詞向量。 這些帶標記的特征向量被輸入深度學習模型以實現(xiàn)語義角色的自動標記。借助于語義自動標注的實現(xiàn),我們得以迅速擴充中文動詞語義網(wǎng)的基本資源庫,將“框架為本,構式為用”的語義分類及標注系統(tǒng)運用于廣泛的中文可監(jiān)督機器學習的自然語言處理任務之中,以下文的應用為例。

      (三) 事件框架分析及自動故事生成

      中文動詞語義網(wǎng)的研究主要圍繞動詞展開語義標注,每個動詞及其牽涉的參與角色及顯性構式構成了一系列事件(event)的有效組成部件,因此,語義網(wǎng)中的動詞語義標注及框架分類對于事件的分析、鑒別及檢索提供了非常有效的語言學線索。基于此原理,我們利用中文動詞語義網(wǎng)現(xiàn)有的大概10個源框架及256種語義角色標記,結合已經(jīng)實現(xiàn)的語義角色自動標注體系(SRL: semantic role labelling),提出了一個用于社交網(wǎng)絡(如臉書)的事件框架分析(EFA: event frame analysis)及自動故事生成(ASG: automatic story generation)系統(tǒng)。構建該系統(tǒng)的原理圖如圖5:

      我們提出的自動故事生成系統(tǒng),首先利用網(wǎng)上爬蟲軟件從社交網(wǎng)絡自動抓取大量語料,語料包含兩大信息: 用戶的個人信息及過往貼文。在已經(jīng)抓取的語料基礎之上,利用中文動詞語義網(wǎng)現(xiàn)有的標注體系做事件框架建模、鑒別、分類,以及事件串聯(lián),最后生成針對網(wǎng)絡用戶的人生故事。

      故事由四個主要部分組成: “介紹”“主體”“結論”及“展望”?!敖榻B”由用戶的個人信息組成,例如用戶的出生日期、工作情況、家庭背景,等等;“主體”“結論”及“展望”則對應不同的事件類別。例如,“主體”部分包括了用戶過往貼文中看(感官類動詞)了什么,學習(認知類動詞)了什么,吃(飲食類動詞)了什么,說(溝通類動詞)了什么,對其他人做了什么(社會互動動詞),等等。表8舉例說明了故事各組成部分對應的事件框架。

      根據(jù)語義網(wǎng)的現(xiàn)有語義標注系統(tǒng)對各種動詞的分類,以及事件的框架分析,我們可以自動識別這些不同的事件類型,并按照以上四大部件自動串聯(lián)成一個完整的人生故事。

      六、 結論

      本文以中文動詞詞匯語義網(wǎng)的理論研究、網(wǎng)站構建及實踐應用為例,全面性地總結和探討了當下人工智能盛行的語言學語義資源構建的關鍵問題和可能的應用。本文以“框架為本,構式為用”的研究方法為基礎,依循語言學家Fillmore提出的框架語義及Goldberg提出的構式語法理論,并參考以英語動詞為研究對象的FrameNet,以實際的語料為依據(jù),具體而微、形義兼顧地對中文動詞進行系統(tǒng)有效的分類。網(wǎng)站的構建經(jīng)過了語料收集和篩選、人工標注、交叉驗證及網(wǎng)站開發(fā)等步驟,構建了一個具備詞匯表征、語義標注、分類標準、框架層級(包括源框架>初級框架>基本框架>微框架)等信息的語義知識庫。語義網(wǎng)目前已經(jīng)實現(xiàn)八個源框架的動詞研究及語義標注,包括“溝通”“認知”“感知”“情緒”“社會互動”“自動”“致使移動”及“評判”類動詞。同時將繼續(xù)對“空間配置”“自然行為”等更多的語義框架進行系統(tǒng)性地分類和研究。語義網(wǎng)作為富含語言學智慧的中文動詞詞匯語義知識庫,除了為中文教學及本體研究提供了包含動詞語義框架及標注的基本信息,也提供了一個可有效運用于各種語義相關的中文自然語言處理的寶貴資源庫。

      附 注

      [1]https:∥framenet.icsi.berkeley.edu/fndrupal/

      [2]https:∥verbs.colorado.edu/~mpalmer/projects/verbnet.html

      [3]http:∥ucrel.lancs.ac.uk/usas/

      [4]https:∥propbank.github.io/

      [5]http:∥verbs.colorado.edu/chinese/cpb/

      [6]http:∥treebank.sinica.edu.tw/

      [7]http:∥mega.lt.cityu.edu.hk/~yufechen/#/

      參考文獻

      1. 劉洪超,詹衛(wèi)東.“A+ 一+ X, B+ 一+ Y” 構式的分類及釋義模板.中文信息學報,2014,28(6): 3440.

      2. Boas H C. A Lexicalconstructional Account of the Locative Alternation.∥ Carmichael L, Huang ChiaHui, Samiian V. (eds.) Proceedings of the 2001 Western Conference in Linguistics, Fresno, CA: California State University, 2003: 2742.

      3. Chen KehJiann et al. The CKIP Chinese Treebank: Guidelines for Annotation. ATALA Workshop—Treebanks, Paris, 1999: 8596.

      4. Fillmore C J. Frame Semantics.∥ Linguistic Society of Korea (ed.) Linguistics in the Morning Calm. Seoul: Hanshin Publishing Company, 1982: 111137.

      5. Fillmore C J, Atkins B T. Towards a Framebased Organization of the Lexicon: The Semantics of RISK and Its Neighbors.∥ Lehrer A, Kittay E. (eds.) Frames, Fields, and Contrasts: New Essays in Semantics. Hillsdale: Lawrence Erlbuan, 1992: 75102.

      6. Fillmore C J, Baker C F. FrameNet: Frame Semantics Meets the Corpus.∥ Robinson D, Farrell P. (eds.) Proceedings of the 74th Annual Meeting of the Linguistic Society of America, Chicago, 2000.

      7. Goldberg A E. Constructions: A Construction Grammar Approach to Argument Structure. Chicago: University of Chicago Press, 1995.

      8. Goldberg A E. Relationships between Verb and Construction.∥ Verspoor M, Sweetser E. (eds.) Lexicon and Grammar. Amsterdam/Philadelphia: John Benjamins Publishing Company, 1997: 383398.

      9. Goldberg A E. Verbs, Constructions, and Semantic Frames.∥ Rappaport H M, Doron E, Sichel I. (eds.) Syntax, Lexical Semantics and Event Structure. Oxford: Oxford University Press, 2010: 3958.

      10. Huang C R, Chen F Y, Chen K J, et al. Sinica Treebank: Design Criteria, Annotation Guidelines, and Online Interface.∥Association for Computational Linguistics. Proceedings of the Second Workshop on Chinese Language Processing: Held in Conjunction with the 38th Annual Meeting of the Association for Computational Linguistics, 2000 (Vol. 12): 2937.

      11. Kingsbury P, Palmer M. From TreeBank to PropBank.∥ LREC, Las Palmas, Canary Islands Spain,2002: 19891993.

      12. Levin B. English Verb Classes and Alternations: A Preliminary Investigation. Chicago: University of Chicago Press, 1993.

      13. Levin B, Hovav R M. Lexical Semantics and Syntactic Structure. ∥Lappin S. (ed.) The Handbook of Contemporary Semantic Theory, Oxford: Blackwell: 487507.

      14. Levin B, Hovav R M. Argument Realization. Cambridge: Cambridge University Press.

      15. Liu MeiChun. Motion, Direction and Spatial Configuration: A Lexical Semantic Study of HANG Verbs in Mandarin.∥ Shay E, Seibert U. (eds.) Motion, Direction and Location in Languages: In Honor of Zygmunt Frajzyngier. Amsterdam/Philadelphia: John Benjamins Publishing Company, 2003: 177187.

      16. Liu MeiChun. Lexical Information and Beyond: Meaning Coercion and Constructional Inference of the Mandarin Verb GAN. Journal of Chinese Linguistics, 2005,33(2): 310332.

      17. Liu MeiChun. Emotion in Lexicon and Grammar: Lexicalconstructional Interface of Mandarin Emotional Predicates. Lingua Sinica, 2016,2(4).

      18. Liu MeiChun. A Framebased Morphoconstructional Approach to Verbal Semantics.∥ Kit ChunYu, Liu MeiChun (eds.) Empirical and Corpus Linguistic Frontiers. Beijing: China Social Sciences Press, 2018.

      19. Liu MeiChun, Chang ChunEdison. From Frame to Subframe: Collocational Asymmetry in Mandarin Verbs of Conversation. International Journal of Computational Linguistics and Chinese Language Processing, 2005,10(4): 431444.

      20. Liu MeiChun, Chang JuiChing. Semantic Profile as a Source for Polysemy: Insight from the Spatialconfiguration Verb fang in Mandarin.∥ Lu Qin, Gao H H. (eds.) Chinese Lexical Semantics. Berlin: Springer International Publishing, 2015(9332): 2432.

      21. Liu MeiChun, Chang JuiChing. Placement Verbs in Chinese and English: A Contrastivs Study of Lexicalization Patterns.∥ Hong JiaFei, Su Qi, Wu JiunShiung (eds.) Chinese Lexical Semantics, 2018,20(2).

      22. Liu MeiChun, Chang JuiChing. From Caused Motion to Spatial Configuration: Placement Verbs in Mandarin.∥ Peck Jeeyoung (ed.) Language and Linguistics, 2019,20(2).

      23. Liu MeiChun, Chiang TingYi, Chou MingHui. A Framebased Approach to Polysemous Near synonymy: The Case with Mandarin Verbs of Expression. Journal of Chinese Language and Computing, 2006,15(3): 137148.

      24. Liu MeiChun, Chiang TingYi. The Construction of Mandarin VerbNet: A Framebased Approach to the Classification of Statement Verbs. Language and Linguistics, 2008,9(2): 239270.

      25. Liu MeiChun, Hu ChiaYin. Conceptual Schema as Semantic Link: A Framebased Study of Mandarin Cognition Verbs. International Journal of Computer Processing of Oriental Languages, 2008,21(1): 5575.

      26. Liu MeiChun, Hu ChiaYin. Free Alternation? A Study on Grammatical Packaging of Excessive Predication in Mandarin Chinese. Language and Linguistics, 2003,14(1): 4790.

      27. Liu MeiChun, Hu ChiaYin, Tsai HsinShan et al. The Protomotion Event Schema: Integrating Lexical Semantics and Morphological Sequencing. Journal of Chinese Linguistics, 2015,43(2): 503547.

      28. Manning C D. Partofspeech Tagging from 97% to 100%: Is It Time for Some Linguistics?∥ International Conference on Intelligent Text Processing and Computational Linguistics, 2011: 171189.

      29. Marcus G. Deep Learning: A Critical Appraisal. CoRR, abs/1801.00631,2018.

      30. McArthur T G. Longman Lexicon of Contemporary English. London: Longman,1981.

      31. Palmer M, Gildea D, Kingsbury P. The Proposition Bank: An Annotated Corpus of Semantic Roles. Computational Linguistics, 2005,31(1): 71106.

      32. Schuler K K. VerbNet: A Broadcoverage, Comprehensive Verb Lexicon. Ph.D Dissertation, University of Pennsylvania, 2005.

      33. Wan MingYu, Liu MeiChun. Supervised Word Sense Disambiguation with Framebased Constructional Features: A Pilot Study of fán ‘to annoy/be annoying/be annoyed. International Journal of Knowledge and Language Processing, 2018,9(2): 3346.

      34. You L, Liu K. Building Chinese Framenet Database.∥ Natural Language Processing and Knowledge Engineering, Proceedings of 2005 IEEE International Conference, Wuhan, 2005: 301306.

      (香港城市大學翻譯及語言學系 香港)

      (責任編輯 馬 沙)

      猜你喜歡
      構式語法自然語言處理
      構式語法框架下英語教學的思考
      青春歲月(2017年1期)2017-03-14 20:28:22
      基于組合分類算法的源代碼注釋質量評估方法
      基于構式語塊提升高職英語教學質量
      青春歲月(2016年22期)2016-12-23 10:01:04
      構式語法與句法淺析
      面向機器人導航的漢語路徑自然語言組塊分析方法研究
      詞向量的語義學規(guī)范化
      求知導刊(2016年10期)2016-05-01 14:09:25
      漢哈機器翻譯中的文字轉換技術研究
      構式語法理論視角下的初中英語教學:問題與啟示
      考試周刊(2016年1期)2016-03-11 10:12:39
      HowNet在自然語言處理領域的研究現(xiàn)狀與分析
      科技視界(2016年5期)2016-02-22 11:41:39
      基于語料庫外殼名詞的功能研究與啟示
      罗城| 金阳县| 忻城县| 长寿区| 香港| 武功县| 海伦市| 东方市| 景东| 广灵县| 获嘉县| 新宁县| 措勤县| 龙胜| 崇阳县| 监利县| 浠水县| 十堰市| 长岛县| 原阳县| 正定县| 凤城市| 娱乐| 云南省| 武宣县| 游戏| 凭祥市| 高尔夫| 秭归县| 永清县| 罗江县| 西华县| 财经| 梅州市| 固阳县| 荣昌县| 林西县| 仙居县| 永德县| 黑龙江省| 内江市|