• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      借助漢語以義索詞的英語用法檢索*

      2014-09-03 10:54:26北京外國語大學(xué)熊文新
      語料庫語言學(xué) 2014年2期
      關(guān)鍵詞:語境

      北京外國語大學(xué) 熊文新

      借助漢語以義索詞的英語用法檢索*

      北京外國語大學(xué) 熊文新

      有了一定的表達意圖卻找不到合適的英語表述方式,是中國學(xué)生經(jīng)常面臨的問題。借助句對齊的英漢平行語料庫,能夠從漢語出發(fā)檢索出與之對應(yīng)的英語實例。然而當前基于語言形式的語料庫檢索,其檢索結(jié)果必須與用戶輸入的特定檢索項匹配。為盡可能全面準確地獲取地道的英語表述,本文借鑒信息檢索的查詢擴展策略,利用同義詞詞林等語義資源,介紹一種基于漢語同義表述的意義檢索,在檢索過程同時利用淺層語法分析,使檢索精度得以保證。

      檢索、詞匯語義、淺層語法分析、雙語語料庫、翻譯句對

      1.引言

      在掌握組詞造句規(guī)則之后,借助漢英詞典,人們可以造出一些形式上合乎語法的英語句子;但離本族語者的地道表述還是要差上一大截。從不犯語法錯誤,到與英美人一樣準確自然,是每個英語學(xué)習(xí)者的目標。

      作為一種不可或缺的基礎(chǔ)性語言資源(參見馮志偉 2001),語料庫在語言本體、語言對比與翻譯以及外語教育等領(lǐng)域產(chǎn)出豐碩成果(參見Sinclair 1991;Baker 1993;Hunston 2002;Grangeret al.2002)。高照明(2004)借助英漢-漢英平行語料庫,實現(xiàn)了一個中國英語學(xué)習(xí)者能夠以漢語發(fā)問檢索相應(yīng)的英語表述的查詢系統(tǒng)。譬如想找英語如何表述“用堅強的意志和力量戰(zhàn)勝(阻礙)”這一意思,最直接的辦法是,先用漢語將其編碼為“克服困難”;把這四個漢字作為檢索項(search term),到句對齊的雙語平行語料庫中,找出跟這個詞形完全匹配的中文句子;再輸出與這些中文句子對應(yīng)的英文句子。從理論上講,借助構(gòu)建良好的雙語平行語料庫,能夠從某一種語言出發(fā),檢索出與之有對應(yīng)關(guān)系的另一種語言表述。

      然而自然語言的意義和形式并非一一對應(yīng),英漢兩種語言之間的譯法也不一致。從漢語出發(fā)檢索英語的用法,有可能發(fā)生漏檢(一些英語表述在語料庫中譯成了其他漢語形式)和誤檢(語料庫的單純字面匹配)的現(xiàn)象。本文試圖幫助中國學(xué)生找到盡可能全、盡可能準的英語表述,擬解決的問題如下:

      (1)選用何種類型的平行語料庫?

      (2)采用何種方法減少由于語言意義和形式及英漢語翻譯不對應(yīng)所造成的漏檢?

      (3)使用何種手段防止語料檢索形式檢索的誤檢?

      2.句對齊加工的英漢平行語料庫

      幫助中國英語學(xué)習(xí)者找到合適的英語表述,涉及其母語(漢語)和目標語言(英語)兩種語言。Zanettin(1998)將多語言語料庫細分為平行(parallel)和可比(comparable)兩類語料庫。前一類語料庫能看出翻譯的方向性,目標語言的譯文受到源語言的影響。后者的語料文本沒有孰先孰后的依賴關(guān)系,存儲的都是各種語言的原生文本,沒有翻譯腔;語言使用更地道、自然。理論上,可比語料庫應(yīng)是尋找合適外語表述的理想材料,但對此類語料庫的對齊加工技術(shù)還很不成熟,作為語言工程項目實施還有難度,因此目前使用較多的還是雙語平行語料庫。有關(guān)平行語料庫的創(chuàng)建及利用已經(jīng)涌現(xiàn)了很多成功范例。在現(xiàn)有技術(shù)和資源下,選擇英譯漢的平行語料,更有利于中國英語學(xué)習(xí)者提取英美本族語者真實自然的表述。

      當前雙語平行語料庫最常見的對齊單位是句子。比它大的單位,像句群段落,由于復(fù)現(xiàn)率不高,重復(fù)利用的可能性不大;比它小的單位,像短語或語塊等,雖然復(fù)現(xiàn)率、對應(yīng)的準確性都不錯,但對語料加工標注的要求也較高,不太容易實現(xiàn)。語料庫建設(shè)本質(zhì)上是個語言工程項目。句子有顯性的句末標點符號,又能表達相對完整的意義,并且重復(fù)性也比較高,因此當前絕大部分雙語平行語料庫都以句子為單位實施對齊(參見王克非、熊文新 2009)。

      搜集到盡可能多的多語對照電子文本,還只是建立了一個生語料庫。生語料的利用價值有限。針對沒有分詞的漢語文本,就只能做字層面的字頻統(tǒng)計等。想要更充分地利用語料,就有必要對其進行各種不同類型的深加工。假如對語料文本的外部屬性充分予以標注,像語體、體裁、題材、作者、翻譯方向以及創(chuàng)作時間等信息,就能根據(jù)特定屬性,抽取相關(guān)文本研究,使研究者能多層面、多角度地考察翻譯文本受哪些外在因素的影響。如果對語料進行過詞類賦碼、句法分析以及語義標注等處理,就有可能深入挖掘翻譯文本的語言屬性,開展對比語言學(xué)的研究。盡管對語料的深加工能有效提高雙語語料庫的利用價值,同時也應(yīng)看到受語言技術(shù)條件制約,處理精度尚難以保障,對語料精加工的后期校對依然需要投入大量時間和人力。

      簡而言之,現(xiàn)階段能夠?qū)χ袊鴮W(xué)生尋找合適英語表述有幫助的語言資源,應(yīng)該是做過加工標注的、并已實施句對齊的英漢平行語料庫。

      3.檢索項的同義擴展及對應(yīng)詞表引入

      人工語言,像世界語及各種程序設(shè)計語言,其語法、語義及詞匯都具有確定性。但自然語言形式和意義之間卻沒有整齊劃一的關(guān)系。Barzilay & McKeown(2001)發(fā)現(xiàn)針對同一個意思可以有不同的說法,如替換詞語、變化句式。Dale & Reiter(2000)指出有了表達意圖,想找一個恰當?shù)恼Z言形式表述,這是語言產(chǎn)出或生成問題。

      3.1 從意義到形式的檢索

      要表達某一特定意義,英語和漢語都可能有不同的說法,例如圖1中的一組漢語表述ChineseExp和一組英語表述EnglishExp。這反映語言意義和形式之間的不一致性。英漢翻譯也不具有一一對應(yīng)性,例如ChineseExp2對應(yīng)于兩種英語EnglishExp2和EnglishExp3兩種說法;而EnglishExp2在翻譯成漢語時,也另有ChineseExp2和ChineseExp3兩種譯法。正是這種語言意義和形式的不一致,以及不同自然語言互譯的不確定性,使得自然語言和翻譯顯得更加豐富多彩;而人們也總能根據(jù)不同的語境或場合選取合適的表述方式。

      在漢譯英的過程中,從源語言的漢語語句出發(fā),比如選取ChineseExp1和ChineseExpn中的任何一個用例,以該語言形式作為檢索項,執(zhí)行傳統(tǒng)的語料庫檢索,找出與其對應(yīng)的英語表述。但另一些與之同義但不同形的漢語表述對應(yīng)的英語表述將會被遺漏。譬如以ChineseExp1作檢索項,在平行語料庫中只能找到EnglishExp1;像EnglishExp2~EnglishExpn就檢索不到,因為它們與ChineseExp1在句對齊的語料庫中沒有關(guān)聯(lián),可是它們也是表達該義的地道英語。這就引發(fā)一個問題:其實英漢平行語料庫中還有大量可供參考的、地道準確的英語用法,由于學(xué)習(xí)者只挑選了部分漢語檢索項,而無法檢索出來。

      圖1.意義和形式以及不同語言的翻譯之間的不對應(yīng)關(guān)系

      語料庫檢索本質(zhì)上是語言形式的匹配,而信息檢索更關(guān)注信息主題和內(nèi)容的對應(yīng)。如果把用戶輸入的檢索項理解成信息檢索中需要在目標文本找到的概念,而不拘泥于語料庫檢索的語言形式,即不把檢索項的詞形作為唯一查詢條件,借助現(xiàn)有詞匯語義資源庫,如《同義詞詞林》,將表述相同或相似意義的不同詞語都引入作為檢索項,防止因檢索用語不同造成的目標語用法遺漏。

      3.2 詞匯語義知識庫的應(yīng)用

      梅家駒等(1983)編寫的《同義詞詞林》是我國首部現(xiàn)代漢語類義詞典。編寫初衷是為寫作或翻譯者提供一個從詞義查詞的工具書。哈爾濱工業(yè)大學(xué)開發(fā)了機用的《同義詞詞林(擴展版)》。新詞林擴展后收錄77,343條詞語,按照樹型結(jié)構(gòu)組織詞語,采用五級編碼方式。同義詞共享同一個編碼標識,如“克服”標注為:Jd09B01=。各部分編碼含義如表1所示。

      表1.同義詞詞林擴展版的詞語編碼示例

      表中共有8個編碼位,其中第8個編碼位上的標識符取值有三個{=, #,@},分別表示“同義”“相關(guān)”和“孤立詞”。本例中的“=”表示當前詞語“克服”的前7位標識,有其他詞語共享,即在《同義詞詞林》中能找到與詞語“克服”相關(guān)的其他同義詞。

      基于語義詞典的詞語語義相似度的計算方法有很多(參見Budanitsky & Hirst 2006;Jiang & Conrah 1997;裘江南等2008)。大多數(shù)算法與語言資源的特定組織結(jié)構(gòu)相關(guān),比如有些語義詞典針對每個詞條給出定義項,通過比較這些釋義短文本中的詞語分布的相似性,推知被釋詞的詞義相似度,像基于向量空間(VSM)的WordNet和Roget’s詞語的比較。另有一類語義詞典,如知網(wǎng)(HowNet),它采用人工構(gòu)造的知識描述體系,結(jié)合基本義原、語法義原以及關(guān)系義原等基本描述單位,對每個詞語表述的概念進行特別描寫。劉群、李素建(2006)根據(jù)義原性質(zhì)以及這種描述語言的語法,實現(xiàn)了詞義的相似度計算。

      《同義詞詞林》與上述詞典的組織方式都不同。它只是一個詞語集;按照一定層級對收錄詞語進行整理,即根據(jù)特定分類體系把詞語安置在樹形結(jié)構(gòu)的某個位置。編碼位自左往右可以看作分類層次。任意兩個詞語能夠根據(jù)它們右向共有的編碼位多寡,實施遠近親疏的歸類。針對本例,如果采用最粗略的歸類,選取左數(shù)第一位表示的大類,只需取其首位以字母J開始的所有詞,都可以看成是與“克服”相關(guān)的一類詞。這種處理顯然詞語顆粒度太大。如果采用最嚴苛的歸類處理,將比較位一直順移到編碼位的第7位;即只有全部7位編碼都相同的詞語才能算作一類,那么能夠算作同義詞的詞語數(shù)就少得多,也準確得多。在最粗(只看首位)和最細(看全7位)的分類方法中間存在一個過渡階段,實際處理時根據(jù)不同項目的精度要求,可以通過調(diào)整編碼位的比較序列來動態(tài)計算詞語相似度。

      許多漢語詞匯語義庫資源,像《同義詞詞林》及其擴展版、知網(wǎng)等,由于類義詞典(thesaurus)的性質(zhì),能夠從特定概念意義出發(fā),找出一簇相關(guān)的漢語表述用語,部分解決前文所述的“意義和語言形式的不一致性”問題。

      3.3 英漢對應(yīng)詞表的應(yīng)用

      有時在單語語境中不易解決的問題,若是眼界放得更開闊一些也就好辦得多。詞義消歧的主要工作是,確定某個多義詞在特定語境中的具體詞義。要完成這項任務(wù),往往事先需要儲備很多資源,比如對詞義的描述以及大量標注好的語料。這相對來說較難滿足,于是人們想到利用雙語材料來輔助解決單語的詞義消歧(參見Galeet al.1992)。

      漢語同義詞,既可以從《同義詞詞林》或知網(wǎng)等現(xiàn)有詞匯資源提取,也可以借助各類英漢漢英雙語詞典的對譯詞獲取。譬如綜合現(xiàn)有電子詞典的基礎(chǔ),可以構(gòu)造一個較大的漢英對譯詞表。例如基于現(xiàn)有電子詞典的詞表,能夠發(fā)現(xiàn)“克服”的英譯詞有{conquer, get over, hurdle, lick, overcome, ride, surmount, tide over},“度過”的英譯詞有{get through, live through, spend, tide over, weather through}。由于這兩個詞共有tide over的譯法,在表述to help to get through (a period of difficulty, distress, etc)這個意義上,它們是同義詞,如“克服困難/渡過難關(guān)”。

      漢英對譯詞既可從詞典釋義用詞中提取,也可以取自雙語語料庫的詞語自動對齊。這些都是鮮活的語言事實。放寬對詞義及同義詞認定的嚴格語言學(xué)界定之后,依據(jù)是否包含有相同的對譯詞義項,能夠構(gòu)建更豐富的漢語同義表述用法集?;趯ψg詞表的詞語形式擴展,可以消解由于翻譯選詞不一致造成的地道英語表述的遺漏。

      4.淺層語法分析

      計算機生成詞語索引行是語料庫處理最重要的手段之一(參見Hunston 2002)。語料檢索通行的做法是:先對語料文本通篇掃描或直接讀取已做好的字詞索引,定位包含檢索項的特定位置,根據(jù)用戶指定的跨距,提取指定跨距范圍內(nèi)的字符串,然后再按照特定的排列方式在屏幕上呈現(xiàn)該結(jié)果,同時以突出的顏色高亮顯示用戶輸入的檢索項。

      4.1 語料庫檢索的準確性缺陷

      在語料庫檢索中,如果某次查詢有多個檢索項,缺省狀態(tài)下它們是邏輯“和(and)”關(guān)系。滿足查詢的結(jié)果必須在指定跨距中包含這些檢索項。除非特別設(shè)計,檢索項出現(xiàn)的先后位置不影響結(jié)果。Christ(1994)指出一些專門的檢索系統(tǒng)能夠在標注程度不一的語料庫上,對詞語、詞碼等顆粒度不同的語言單位,實現(xiàn)截詞、模糊及近鄰匹配等多種檢索方式的查詢處理。

      檢索能做到什么程度,取決于對語料庫的加工程度。在沒有任何加工的生語料上,只能進行字詞一級的檢索。如果想檢索更復(fù)雜的語言現(xiàn)象,則需要先對語料庫進行相應(yīng)的標注。譬如想要檢索某些特定的句法結(jié)構(gòu),就必須先對語料庫進行句法剖析(parsing)。盡管語料庫語言學(xué)家對搭配的典型定義包含了語法和語義上的限制,但在做索引行提取和關(guān)鍵詞語境(key word in context,KWIC)時還存在如下缺陷:

      (1)語言是有層次結(jié)構(gòu)的。一些詞語線性相鄰,但分處不同層次的結(jié)構(gòu)體。它們之間的關(guān)聯(lián)有遠近親疏之分。例如有一個連續(xù)字符串AN1N2,一種可能組合是,先由N1N2結(jié)合成NP,再由A + NP組合成NP,譬如實例“男籃球隊長”。單純從形式上看,AN1直接相鄰,如“男”和“籃球”線性相鄰,但這兩個詞本身并沒有直接聯(lián)系,反倒是“男”與遠距離的“隊長”結(jié)合更緊密,因此不能單純以為物理距離相近就意味著它們結(jié)合得更緊密。

      (2)構(gòu)造文本索引行時,通常確定搭配的跨距是-4/+4或-5/+5,即在被檢索詞前后4到5個詞范圍內(nèi)出現(xiàn)的詞語,都可當做搭配候選詞。在獲取大量實例的頻次信息后,根據(jù)統(tǒng)計顯著性來評估這些實例是否為有效搭配。然而自然語言遠距離搭配的可能性是存在的。如檢索VO搭配,V和O的中心語的跨距就有可能落在規(guī)定值之外。由于遠距離搭配超出跨距所規(guī)定的范圍,這類搭配現(xiàn)象就難以提取出來,在語料庫檢索中這部分也就被遺漏了。

      要解決這些問題,需要對其實施進一步的語言學(xué)分析,而不是淺層次的字符匹配。

      4.2 淺層語法分析

      Lin(2003)介紹了加拿大艾伯塔大學(xué)林德康教授開發(fā)的英語依存語法分析器MINIPAR。以SUSANNE語料庫作為測試數(shù)據(jù),該系統(tǒng)對英語句子的依存關(guān)系識別達到88%的準確率和80%的召回率,響應(yīng)速度也很快,基本上能夠滿足處理大規(guī)模文本的需要。

      MINIPAR分析結(jié)果以元組(tuple)信息呈現(xiàn)。例如針對英語句子As he weakened, Moran became afraid of his daughters.(BNC-A6N)的句法分析,結(jié)果呈現(xiàn)如圖2所示。關(guān)系節(jié)點以形式為label (word, root, pos, governor, rel, exinfo, exinfo )這樣的元組描述。

      淺層語法分析能夠識別出詞語之間的語法依存關(guān)系,而不管關(guān)聯(lián)的詞語處于句中什么位置,相隔有多遠;只要輸入查詢詞語及其相關(guān)的語法關(guān)系,就能按圖索驥地將滿足特定語法關(guān)系的詞語檢索出來。盡管MINIPAR的分析精度還難以滿足機器翻譯等語言知識關(guān)鍵應(yīng)用的要求,但針對大規(guī)模語料庫,通過頻數(shù)等統(tǒng)計信息,能夠過濾一些錯誤或垃圾信息。

      圖 2.MINIPAR的分析結(jié)果

      要得到MINIPAR帶來的好處,就需要預(yù)先對語料庫進行標注和索引。好在MINIPAR的計算速度基本能滿足大規(guī)模文本的處理所需。語料庫索引過程通常也是脫機進行的。對于新增語料采用增量(incremental)索引的方式既能保證檢索的相對準確,又不會過多增加系統(tǒng)的計算負荷,因此,引入淺層語法分析技術(shù)對語料文本進行標注并索引是可行的。

      5.一個實驗

      以下以前文提到的查詢“用堅強的意志和力量戰(zhàn)勝(阻礙)”的英語表述為例,說明如何應(yīng)用本文介紹方法來幫助中國英語學(xué)習(xí)者獲得更多的英語表述實例(參見王克非、熊文新 2011)。

      第一步搜集相關(guān)的英漢對照文本,實施文本清潔及對齊等處理,標識各類文本外部屬性,如翻譯方向、源自文本等信息,做成基于句對齊的雙語語料。第二步對英語語料文本的每個句子,采用MINIPAR分析句中每個詞語之間的依存關(guān)系,將分析結(jié)果中的詞語(label)以及governor位置指代的相關(guān)詞語和它們之間的語法關(guān)系(rel)編入索引,供檢索系統(tǒng)調(diào)用。本步驟是雙語語料庫資源的準備階段。由于涉及整理、分析和校對等環(huán)節(jié),多是脫機完成。

      在實時檢索階段,用戶以兩個漢語詞“克服 困難”作為檢索項送入檢索系統(tǒng),如圖3所示。系統(tǒng)首先調(diào)用同義詞詞林,對檢索項實施詞語擴展,將與這兩個漢語詞意義相關(guān)的其他詞語同樣納入擴展檢索項。譬如針對詞語“克服”,先獲得其語義編碼為Jd09B01,到同義詞詞林中提取與此標記相同的詞語,如“克服”“戰(zhàn)勝”“排除萬難”“擺平”作為追加檢索項。對詞語“困難”,根據(jù)提取的語義編碼,同樣可以獲得一簇意義相關(guān)的詞,像“難關(guān)”“難點”等。根據(jù)英漢對應(yīng)詞表,得到與“克服困難“義的動詞同義表達“度過”,將這兩個檢索項的原詞及其擴展詞排列組合,可以形成多個新的查詢表達式,如“克服 難關(guān)”“戰(zhàn)勝 困難”“渡過 難關(guān)”等。這些新生成的組合也是該特定意義的有效表述。

      圖3.啟用擴展后的英語實例查詢

      誠然,在組合配對的過程中,也會有一些噪聲,如取“克服”的擴展詞“排除萬難”與“困難”的擴展詞“難點”構(gòu)成的新查詢式“排除萬難 難點”,就構(gòu)不成一個有語法關(guān)系的組合。由于在實際語料中不存在這種翻譯實例,因而采用該查詢式檢索也得不到結(jié)果,自然就無需額外處理。另外一種解決辦法是通過增加語法檢查工序來排除明顯不合法的表述。

      Xiong(2010)根據(jù)雙語“平行對應(yīng)性”的原則,利用原有檢索項和經(jīng)詞語語義擴展后的組合檢索項以及它們之間的語法關(guān)系,到經(jīng)過MINIPAR分析處理的語料庫中提取相關(guān)的英語實例。譬如輸入的原漢語檢索項是“克服 困難”,希望知道在英語中如何表達“克服困難”這一意義,在提取出的雙語對齊實例中,已確知漢語詞語“困難”在匹配英語詞語difficulty之后,到MINIPAR分析出的依存關(guān)系結(jié)果庫中,找出與difficulty具有動賓關(guān)系的謂詞成分,并將其作為可能的英語表示,并呈現(xiàn)出來供翻譯者或?qū)W習(xí)者參考。在英譯漢語料中出現(xiàn)漢語“克服 困難”及其等價語義表述的,與difficulty構(gòu)成動賓搭配的謂詞有contend with、fought、get out of、struggle with等形式。這些謂詞都具有“克服”表示的意思,然而在雙語詞典中一般不會收錄,因此借助常規(guī)查詞典的手段是檢索不到這些用法的。作為佐證的是,在漢譯英語料中,中國英語學(xué)習(xí)者和翻譯者的首選常常是中規(guī)中矩的overcome,在漢英詞典中“克服”的第一個釋義詞往往就是它。

      6.結(jié)語

      傳統(tǒng)的語料庫檢索大多是針對語言形式的檢索,在檢索之前事先就必須規(guī)劃好檢索項,因為檢索結(jié)果必須與檢索項匹配。如果檢索項選得不好,就可能找不到符合要求的語言實例。本文提出基于表達的英語“找詞”檢索,由于不知道用什么樣的英語表述,學(xué)習(xí)者只能借助已做好句對齊的英漢雙語語料庫,從對應(yīng)的漢語字詞出發(fā)迂回地找到相應(yīng)的英語表述。然而由于自然語言形式和意義的矛盾、英漢兩種語言之間翻譯的多樣性,當前的語料庫檢索系統(tǒng)只能得到與檢索項對應(yīng)的英語表述。顯然還有更多同義的英語表述,由于對譯的漢語與檢索項不同,而沒有被提取出來。此處本文借鑒信息檢索的主題詞概念擴展的方法,利用詞匯語義資源和英漢對應(yīng)語等信息,能夠最大限度地實現(xiàn)檢索結(jié)果的無遺漏。同時,針對傳統(tǒng)語料檢索的機械形式匹配,通過引入淺層語法分析技術(shù),部分提高了檢索的準確性。

      語料庫為缺乏語境的外語學(xué)習(xí)者提供了客觀真實的自然語言事實材料。雙語平行語料庫能夠?qū)崿F(xiàn)由漢語到英語的檢索,如果配以良好的檢索功能,將能為中國英語學(xué)習(xí)者提供盡可能全、盡可能準的地道英語表述;若是結(jié)合語料庫語言學(xué)的統(tǒng)計功能,無疑將對我國英語課堂教學(xué)的范例教學(xué)、學(xué)生自主學(xué)習(xí)等起到促進作用。遵循這一思路,利用對比語言學(xué)、語料庫語言學(xué)及二語習(xí)得方法,已經(jīng)有服務(wù)英語特異組合識別和教學(xué)的成果問世(熊文新等2013)。

      Baker, M.1993.Corpus linguistics and translation studies: Implications and applications [A].In M.Baker, G.Francis & E.Tognini-Bonelli (eds.).Text and Technology: In Honour of John Sinclair[C].Amsterdam: John Benjamins.233-250.

      Barzilay, R.& K.McKeown.2001.Extracting paraphrases from a parallel corpus [A].InProceedings of 39th Annual Meeting and 10th Conference of the European Chapter of Association for Computational Linguistics[C].Toulouse.50-57.

      Budanitsky, A.& G.Hirst.2006.Evaluating WordNet-based measures of lexical semantic relatedness [J].Computational Linguistics32(1): 13-47.

      Christ, O.1994.A modular and flexible architecture for an integrated corpus query system [A].In G.Kiefer & J.Pajzs (eds.).Papers in Computational Lexicography[C].Budapest.22-32.

      Dale, R.& E.Reiter.2000.Building Natural Language Generation Systems[M].Cambridge: CUP.

      Gale, W., K.Church & D.Yarowsky.1992.Using bilingual materials to develop word sense disambiguation methods [A].InProceedings of the 4th International Conference on Theoretical and Methodological Issues in Machine Translation[C].Montreal.101-112.

      Granger, S., J.Hung, S.Petch-Tyson (eds.).2002.Computer Learner Corpora, Second Language Acquisition and Foreign Language Teaching[C].Amsterdam: John Benjamins.

      Hunston, S.2002.Corpora in Applied Linguistics[M].Cambridge: CUP.

      Jiang, J.& D.Conrah.1997.Semantic similarity based on corpus statistics and lexical taxonomy [A].InProceedings of International Conference on Research in Computational Linguistics[C].Taipei.19-33.

      Lin, D.2003.Dependency-based evaluation of MINIPAR [A].In A.Abeille (ed.).Treebanks: Building and Using Parsed Corpora[C].Dordrecht: Kluwer Academic.317-329.

      Sinclair, J.1991.Corpus, Concordance, Collocation[M].Oxford: OUP.

      Xiong, W.2010.Detecting collocations from Chinese English learner’s perspective [A].InInternational Conference on Intelligent Computing and Cognitive Informatics[C].Kuala Lumpur.175-178.

      Zanettin, F.1994.Bilingual comparable corpora and the training of translators [J].Meta43(4): 616-630.

      馮志偉,2002,中國語料庫研究的歷史與現(xiàn)狀 [J].Journal of Chinese Language and Computing12(1): 43-62.

      高照明, 2004,語料與機助翻譯 [A]。載王克非等,《對應(yīng)語料庫:研制與應(yīng)用》[M]。北京:外語教學(xué)與研究出版社。

      劉 群、李素建,2002,基于“知網(wǎng)”的詞匯語義相似度計算 [J],《中文計算語言學(xué)》(2):59-76。

      梅家駒、竺一鳴、高蘊琦、殷鴻翔,1983,《同義詞詞林》[M]。上海:上海辭書出版社。

      裘江南、羅志成、王延章,2008,基于中文語義詞典的語義相關(guān)度方法比較研究 [J],《情報理論與實踐》(5):32-38。

      王克非等,2004,《雙語對應(yīng)語料庫:研制與應(yīng)用》[M]。北京:外語教學(xué)與研究出版社。

      王克非、熊文新,2009,用于翻譯教學(xué)與研究的英漢對應(yīng)語料庫加工處理 [J],《外語電化教學(xué)》(6):3-9。

      王克非、熊文新,2011,漢英對應(yīng)語料庫的檢索及應(yīng)用 [J],《外語電化教學(xué)》(6):31-36。

      熊文新、梁茂成、趙秀花,2013,基于語料庫及對應(yīng)詞表的英語特異組合發(fā)現(xiàn)方法 [J],《外語電化教學(xué)》(4):3-8。

      通信地址:100089 北京外國語大學(xué)中國外語教育研究中心/北京外國語大學(xué)國家語言能力發(fā)展研究中心

      * 本文系國家社科基金項目“服務(wù)信息檢索的自然語言”(11BYY051)的階段性成果之一,同時得到教育部“新世紀優(yōu)秀人才支持計劃”(NCET-11-0591)的支持。

      猜你喜歡
      語境
      創(chuàng)作與做夢:精神分析語境下的“植田調(diào)”解讀
      多維語境順應(yīng)與法律文本翻譯
      主題語境九:個人信息(1)
      主題語境八:語言學(xué)習(xí)(1)
      老區(qū)發(fā)展進入更高語境
      語言學(xué)習(xí)中語境化的輸入與輸出
      馬克思三種語境下的自由概念
      跟蹤導(dǎo)練(三)2
      論幽默語境中的預(yù)設(shè)觸發(fā)語
      新媒體與改革語境下的“新年獻詞”
      中國記者(2014年2期)2014-03-01 01:37:43
      安宁市| 武山县| 嘉禾县| 边坝县| 霍州市| 泸定县| 台北县| 平潭县| 南靖县| 阜平县| 呈贡县| 楚雄市| 京山县| 平潭县| 邮箱| 阿拉善左旗| 齐齐哈尔市| 吉水县| 炎陵县| 子洲县| 新昌县| 无锡市| 玉溪市| 临夏市| 改则县| 鞍山市| 兴安县| 分宜县| 大城县| 额敏县| 通江县| 本溪| 宜黄县| 敦煌市| 华容县| 称多县| 三明市| 仙游县| 厦门市| 西丰县| 双峰县|