• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于學習者視角詞典編纂自動釋義的理據

      2013-04-10 21:19:25王純磊
      湖北社會科學 2013年12期
      關鍵詞:電子化詞典學習者

      王純磊

      (宿遷學院外語系,江蘇宿遷 223800)

      基于學習者視角詞典編纂自動釋義的理據

      王純磊

      (宿遷學院外語系,江蘇宿遷 223800)

      信息化詞典學的發(fā)展必須滿足學習者的個性化需求和特殊學習需求。在此我們探討詞典編纂面向學習者自動釋義功能的理據:一是紙質詞典信息的重現是電子化詞典的主要編撰方式;二是從查詢自動化發(fā)展到內容生成自動化是編纂自動化的基本需求;三是發(fā)展到面向用戶的自動化是自動化編撰的有效跨越;四是可拆解的系列自動化計算過程是人工釋義過程的基礎。

      學習者;詞典編纂;自動釋義;理據

      在高度信息化的當代社會,詞典編纂依然是數年乃至數十年的大工程,而互聯網時代的信息爆炸和技術進步已經讓詞典編纂自動化的腳印日漸凸顯。在緊跟詞典編纂者的多樣化需求的背景下,通過建設一系列的語言信息數據庫和語言分析引擎,詞典編纂在眾多環(huán)節(jié)已經由手工發(fā)展到自動化,而且其自動化與智能化的程度不斷提高。[1](p138)實現詞典編纂的自動化是傳統(tǒng)計算詞典學的至高追求。建立起面向常人閱讀的巨大詞庫與面向機器存取的巨大詞庫是詞典編纂的自動化過程中的主要任務。但是我們認為:建立宏觀與微觀的計算詞典學的體系可以從面向編纂者的自動化發(fā)展到面向詞典用戶的自動化。之所以要發(fā)展到面向詞典用戶的自動化是因為紙質詞典信息的重現是電子化詞典的主要編撰方式,同時國內外的主流詞典編纂系統(tǒng)還徘徊在排版自動化和查詢自動化的兩個層次。因此發(fā)展到內容生成自動化成為迫切所需。[2](p94)本研究將基于讀者的認知視角來分析為詞典編纂而進行的自動釋義研究的相關理據。

      一、學習者的學習型雙語詞典和釋義模板的建構

      學習型英英詞典是一種單語詞典,它往往是學習型雙語詞典與學習型雙解詞典的原型詞典,因此在學習型詞典中居于核心和全局的重要地位。一般而言學習型雙語詞典提供的對等詞也是基于源語釋義的,然而學習型雙解詞典更是源語釋義及其釋義譯文來直接呈現。[3](p85)基于語言符號的任意性,言語概念層次的差異性和跨文化認知的趨異性,我們許多研究者堅持這樣一種觀念:外語學習者由單純使用雙語詞典到高頻地使用雙解詞典再到有規(guī)律地使用單語詞典的復雜過程體現了詞典編撰中源語釋義的獨特的文化認知價值與理解性學習價值和元語言的侵略性影響。

      貫而言之,不同釋義版本之間優(yōu)劣評判的參照點是:釋義輸出中的實詞。它是釋義輸出中的核心,釋義方式是多元的,但是內在實質是一元的。無論是整句釋義方式或者短語釋義方式或者近義詞釋義方式,也或者是人工釋義或是自動釋義,它們釋義的核心是一個要素:實詞。確立具有一定針對意義的釋義模板是應對自動釋義模式的基本條件,無論是采用整句釋義還是短語釋義的時候都需要建立基本的釋義模板。由介詞、連詞、冠詞等構成的虛詞和代詞以及模式化實詞詞塊是釋義模板的主要內容。這些內容與模式化實詞詞塊所構建的釋義框架是把自動釋義所生成的名詞、動詞、形容詞、副詞等按需要進行匹配和嵌入。此時架構的釋義框架中核心的釋義元素是基本名詞、動詞、形容詞與副詞。基于現有權威詞典的釋義數據庫我們可以針對不同性質的詞目批量化地自動抽取出詞目呈現模式而構成自我需求目的的釋義模板。[4](p31)在詞匯的層級概念體系中處于相同地位的詞都會有類似模式與結構的模板。例如,對于所有的鳥類名稱,我們可以采用與提取出a kind of bird which“體形特征捕食特征活動環(huán)境”等類似的釋義模板。當然此類研究的焦點是名詞,所以動詞、形容詞、副詞等詞性的詞目的釋義是否適用該釋義模板不在本研究討論的范疇。

      二、詞典編纂自動釋義的相關理據

      1.紙質詞典信息的重現是電子化詞典的主要編撰方式。

      網絡與電子產品的普及使得電子化詞典的存儲媒介形式較為豐富:掌上專用型、手機內嵌型、光盤附帶型、硬盤安裝型、在線網站型等等不一而足。無論是哪種類型的電子化詞典都是面向學習者的電子化詞典。肇始于20世紀40年代末期美國的機器翻譯研究建立了大量的電子化的語言信息詞典數據庫,該數據庫是針對自動化處理的電子化詞典編撰的契機??梢哉f電子化詞典的編撰與使用是以計算機編程用途的電子化詞典數據庫的建設為前提的。然而影響是雙向的,面向普通學習者的各種類型的電子化詞典的發(fā)展也一定程度上反過來促進了計算機編程用途的電子化詞典的發(fā)展。在1992年牛津英語詞典第一次發(fā)布光盤版之后,國內外的面向學習者的電子化詞典開始迅速普及。在90年代后期電子化詞典成為計算機用戶的必備軟件,而在中國2005年之后網民普遍進入寬帶時代,電子化詞典的下載、使用和制作發(fā)布蒸蒸日上。[5](p157)

      電子化詞典普及的基本優(yōu)勢體現在:一是攜帶方便,查詢便捷,檢索豐富;二是詞句可以朗讀,語法可以擴展,用法可以操練。網絡版的超級在線詞典甚至可以一次查詢多部詞典和添加用戶自定義的新詞。這個與紙質詞典相比可以說是翻天覆地,但是即便是現今最新的電子化詞典依然是在重現紙質詞典的信息。目前的電子化詞典盡管在鼠標取詞與詞句朗讀等查詢性上與模糊檢索、全文檢索、分類檢索等檢索性上與便攜性與多媒體性已經給眾多詞典用戶帶來了前所未有的便捷,但是電子化詞典的本質優(yōu)勢不僅在于重現紙質詞典的完整內容,還在于應該承擔起滿足學習者的個性化認知需求和群體化的識別需求。根據用戶的話題需求和難度需求而從海量的互聯網語料中獲取與優(yōu)化讀者所需是理想化電子化詞典的構想之一;根據用戶的詞匯能力覆蓋范圍和釋義風格偏好而由計算機自動生成相關釋義內容是理想化電子化詞典的構想之二。理想化電子化詞典的近義詞辨析是基于語料庫以及特定語域網頁語料再根據用戶的詞匯能力覆蓋范圍來有選擇性地呈現;[6](p223)理想化電子化詞典也能多維度的依據用戶的閱讀興趣、詞匯能力覆蓋范圍與語言能力水平來定性定量分析并抓取合適的語篇來滿足用戶的精讀與泛讀需要。

      2.從查詢自動化發(fā)展到內容生成自動化是編纂自動化的基本需求。

      80年代中期在我國出現針對詞典編纂的計算機輔助軟件的研發(fā),編程開發(fā)者包括了語言教學與研究者、計算機專業(yè)人員、圖書情報管理人員、其他行業(yè)從業(yè)人員、出版社辭書工作者。隨著計算機編程技術與數據庫管理技術的飛速進步,隨著寬帶在我國教育系統(tǒng)和社會生產生活中的迅速普及,詞典編纂系統(tǒng)及其輔助軟件也不斷地升級換代與更新。我國詞典編撰已經從排序、查詢、排版為主要特征發(fā)展成為分布式、工作流管理、大型平行語料庫為主要特征的編撰形式。在國際上,英美和歐洲其他國家是詞典編纂系統(tǒng)研發(fā)與實踐的主要集中區(qū)。在21世紀前的,分散性、稀少性與私密性是詞典編纂系統(tǒng)研發(fā)的主要特征。但是從2002年起歐洲舉辦了多次國際性的詞典編纂系統(tǒng)研討會,開會地點主要包括英國(2002,2003)、捷克(2004)和意大利(2006)。這些詞典編纂系統(tǒng)研討會極大地促進了基于詞典編纂系統(tǒng)研發(fā)的創(chuàng)新與技術交流。[7](p8)與國內研發(fā)技術與實力相比,國際上的研發(fā)團隊和個人更多地依賴于政府和出版商的支持與資助。同時國際水平詞典編撰的研發(fā)呈現出:技術上多樣化;平臺復雜化;語種多元化。

      考察國內外的詞典編纂系統(tǒng)的歷史研發(fā)過程后,我們發(fā)現:詞典編纂的自動化可以區(qū)分為從初級到高級的三個不同相位的歷史發(fā)展階段。第一階段是自動化排版,即通過構建友好的輸入界面,包含釋義、例證和近義詞等具體要素由詞典編纂人員直接輸入本地數據庫。本地數據庫中建立釋義字段、例證字段、近義詞字段等相應字段。最終,根據字段的具體格式自動生成排版界面。第二階段是查詢與參考的自動化,即在詞典編纂中建立計算機輔助編撰策略,以交互式編纂體系來構建集成化的獨立編撰界面,進行多種語料庫分析和多種數據庫查詢,提高編纂效率,促進編纂釋義的相關決策進程。第三階段是內容自動生成階段,編撰人員預先設定各種任務參數,由計算機根據任務參數,自動篩選語料庫并進行相關條目的數據庫查詢。由計算機輔助自動地進行各種編纂環(huán)節(jié)的決策,可以編撰出只需少量修改的詞典釋義條目。而且自動化編撰的可靠性主要可以規(guī)避人工操作在微觀釋義方面:詞目范圍、語體標簽、頻率等級、近義反義詞匯、對等詞、詞匯句法搭配、辨析、例證、釋義所造成的誤差。[8](p28)

      計算機輔助詞典編纂系統(tǒng)在現代詞典編撰中已經取得了長足的發(fā)展,尤其體現在:排版自動化。但是距離可操控的內容自動化、決策自動化方面還有很大差距??陀^地說排版自動化充其量也只是簡單的數據轉換過程,而決策自動化、編纂自動化涉及到廣泛而深入的多學科領域,具體到內容生成自動化更是我們詞典應該繼續(xù)研究的重大課題。

      3.發(fā)展到面向用戶的自動化是自動化編撰的有效跨越。

      內嵌式的詞典編纂系統(tǒng)從本體上說其自身本來就是一個自動化的電子詞典軟件。自動化的電子詞典軟件為編纂者的詞條信息制作提供語料和海量的微觀釋義信息。[9](p301)即便是在某個詞典完成了全部編纂工作后,電子詞典軟件也以光盤版、硬盤版、掌上版或者在線版形式游離于紙質詞典之外。當然孤立運行狀態(tài)的電子化詞典是否一定只是紙質詞典的信息重現,完全取決于最初詞典編纂者的需求決策,同時也受到詞典編纂系統(tǒng)后臺設計與前臺設計本身自帶的功能特性影響。我們認為,對學習者的個體化需求和群體化需求的功能的關注是新一代電子化詞典的核心價值。建設詞庫并實現自動化是計算詞典學的最高理想,其本質上就是面向編者的自動化。這種以詞典編撰者為核心服務對象的固化必然導致詞典編纂系統(tǒng)的功能局限。而我們所倡導的是:在加速詞典編纂各項任務的同時,更要面向用戶的個性化需求或群體化需求來探索詞典的有效編撰。[10](p78)

      面向詞典用戶的個性化需求或群體化需求的突出的特征體現在五個方面:第一,在視覺呈現與信息呈現自由度上要有較為開闊的空間。視覺呈現與信息呈現的自由度讓電子化詞典的用戶可以自由選擇個性化的用戶界面,也讓用戶可以選擇個性化的信息項目。例如,用戶不需要閱讀例證時,系統(tǒng)會自動屏蔽所有的例證。當用戶只需要閱讀某種詞匯難度以下的例證時,系統(tǒng)也會自動屏蔽所有的更加偏難的例證。[14](p25)第二,對詞典用戶的個性化關注。最大限度地關注電子化詞典用戶的當前語言能力水平和詞匯語法知識點缺陷,以隱藏和提示學習者所應該關注的細致釋義信息。例如,用顏色來標記不同難度系數的詞和句子。第三,借助海量的互聯網資源來挖掘電子化詞典的使用空間。電子化詞典既要為用戶滿足穩(wěn)定興趣和臨時興趣的豐富的例證閱讀,也要提供近義辨析和量化信息,徹底改變電子化詞典的“千人一面”的僵化的使用模式。例如,讓用戶可以根據需要查閱某個詞或當前詞目在美式英語與英式英語之間的使用頻率差異以及搭配差異。同時也可以讓用戶根據需求隨時查詢若干近義詞之間的語體語域的使用頻率差異以及搭配差異。[11](p132)第四,在詞匯能力、語法能力與用法能力等方面為電子化詞典用戶提供個性化的歷史跟蹤。例如,通過自動收集所有用戶查詢的單詞或跳轉查詢的單詞的詞匯難度來自動判斷并且自動通知用戶的詞匯能力發(fā)展的新動向。第五,豐富的前后臺語料及時更新系統(tǒng)以滿足其它個性化的需求。例如,用戶在使用和學習過程中遇到的生動而富有特色的例證可以通過系統(tǒng)的云計算推薦和提交并嵌入到其他用戶的電子化詞典中。當然如果用戶希望讀到某些主題內容的新聞標題作為例證,則電子化詞典也能從后臺的云計算庫回應用戶的需求而實現這項功能。[12](p559)

      4.可拆解的系列自動化計算過程是人工釋義過程的基礎。

      詞典也與其它書籍一樣是有序化呈現人類認知與文明的精神產品。具有只供理解的消極型詞典與具有豐富產出的積極型詞典是詞典的兩種基本類型,其它也還有許多分門別類的分法,研究者都可以從不同角度進行其范式研究,它們各自編纂特點也各不相同。對外語學習或外語習得過程的精心關注與盡力協(xié)助的詞典是外語學習者詞典的核心體現。由語言智能、非語言智能、有限體能所構成的具體釋義能力三要素是詞典編纂過程中首先要考慮到的主要因素。一般而言,我們可以說詞匯能力、句法能力、語義能力、語用能力、語篇能力、交流能力、查詢能力、模仿能力與語言輸出的參數控制能力是構成語言智能的基本要素,而情感與情緒是構成非語言智能的基本要素。而語言輸入輸出、文字的計算機錄入或手寫文字等都需要有限的體能。故而自動釋義和人工釋義相比較而言:一是自動釋義效率高、參數精確、海量資源調用,但是也缺乏認知個性、缺乏體驗性、輸出單調性、缺乏句法正確性;二是人工釋義具有認知模糊性、句法正確性、認知個性,但是工作效率低下、參數缺乏精確控制、輸出隨意性、資源調用范圍窄、語言能力有限性。[13](p9)因此人工釋義與自動釋義在系統(tǒng)構建初期與使用過程中都是相輔相成的。

      三、余論

      釋義評價的心理計算機制與釋義生成的心理計算機制科學地構建了詞典釋義者的釋義思維過程。[14](p26)我們可以嘗試構建多維釋義驅動的意義構建模式,選擇特定詞類為調查群體,基于學習型詞典為語料,在理論思辨、釋義評價算法、釋義生成算法、生成實驗評測等體系下,系統(tǒng)地構建學習型詞典的自動化多維釋義模型。

      [1]陸谷孫,王馥芳.當代英美詞典編纂五十年綜述[J].外語教學與研究,2006,(2).

      [2]李紅印.構詞與造句:漢語學習詞典編纂的兩個重心[J].語言文字應用,2008,(2).

      [3]Levin,Judith.The Syntax and Semantics of Complex Nominals[J].1978.

      [4]解海江,章黎平.詞典編纂理念的二度轉向[J].辭書研究,2010,(6).

      [5]Vanderwende,Lucy.Algorithm For Automatic Interpretation of Noun Sequences[J].1994.

      [6]Lauer,Mark.Designing Statistical Language Learners: Experiments on Compound Nouns[J].1995.

      [7]尹世超.語體變異與語言規(guī)范及詞典編纂——以標題語言為例[J].修辭學習,2005,(1).

      [8]Diarmuid O Seaghdha.Learning Compound Noun Semantics[J].2008.

      [9]Warren,Beatrice.Semantic patterns of noun-noun compounds[J].1978.

      [10]謝元花.語料庫與詞匯研究[J].外語教學,2002,(3).

      [11]成文麗,曲開社,等.計算機輔助詞典編纂的技術分析與系統(tǒng)設計[J].山西大學學報(自然科學版),2003,(2).

      [12]楊自儉.語言多學科研究與應用[M].南寧:廣西教育出版社,1997.

      [13]亢世勇,王興隆,等.我國計算機輔助詞典編纂系統(tǒng)初步調查研究[J].辭書研究,2012,(3).

      [14]夏立新.對漢英語文詞典編纂和出版的一些思考[J].出版科學,2011,(2).

      責任編輯鄧年

      H16

      A

      1003-8477(2013)12-0128-03

      王純磊(1977—),男,宿遷學院外語系副教授,碩士。

      江蘇省“333工程”資助項目;江蘇省高校社科基金項目(2013SJD740028)。

      猜你喜歡
      電子化詞典學習者
      你是哪種類型的學習者
      學生天地(2020年15期)2020-08-25 09:22:02
      十二星座是什么類型的學習者
      米沃什詞典
      文苑(2019年24期)2020-01-06 12:06:50
      推進外匯窗口服務電子化
      中國外匯(2019年13期)2019-10-10 03:37:48
      1 我省市級國庫集中支付電子化系統(tǒng)首次上線運行
      山西財稅(2019年3期)2019-02-19 10:16:10
      評《現代漢語詞典》(第6版)
      詞典例證翻譯標準探索
      漢語學習自主學習者特征初探
      汽車電子化,沒有假設
      汽車科技(2015年1期)2015-02-28 12:14:46
      論遠程學習者的歸屬感及其培養(yǎng)
      当涂县| 饶阳县| 西丰县| 视频| 呼玛县| 和硕县| 根河市| 祁阳县| 仙游县| 德令哈市| 凌海市| 大港区| 昌乐县| 赤水市| 邳州市| 仙桃市| 房产| 化德县| 青田县| 定陶县| 六枝特区| 泽库县| 突泉县| 安徽省| 全椒县| 五莲县| 谷城县| 安阳市| 枝江市| 洛宁县| 仙游县| 勐海县| 保山市| 犍为县| 博爱县| 廉江市| 鄱阳县| 台中县| 贺州市| 天长市| 望城县|