• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      英語主語位置與句法復(fù)雜度的研究

      2014-04-02 18:30:57于洋
      卷宗 2014年12期
      關(guān)鍵詞:數(shù)學(xué)模型語料庫

      于洋

      摘 要:本文選取ICE-GB語料庫書面英語部分(ICE-GBW),運(yùn)用計(jì)量語言學(xué)理論和方法,對英語句子中主語位置和句法復(fù)雜度進(jìn)行研究。研究結(jié)果表明句法復(fù)雜度與句子結(jié)構(gòu)符合Wimmer & Altmann模型,句法復(fù)雜度是主語位置的函數(shù),且可用線性回歸方程來表示。

      關(guān)鍵詞:語料庫;主語位置;句法復(fù)雜度;計(jì)量語言學(xué);數(shù)學(xué)模型

      1 引言

      Quirk[1]指出句子是句法研究中最重要的語言單位。在句法研究中語言學(xué)家在不同的理論框架下采用定性、思辨(普通語言學(xué))或代數(shù)、集合、圖論、數(shù)理邏輯(形式語言學(xué)和數(shù)理語言學(xué))等靜態(tài)方法研究句子的結(jié)構(gòu)、句子成分和它們之間的關(guān)系。劉海濤[2]采用另外一種句法研究采用動(dòng)態(tài)的方法,利用真實(shí)文本的量化數(shù)據(jù)來描述或揭示語言系統(tǒng)及其組成單位相互關(guān)系,使用概率論、隨機(jī)過程、微分方程、函數(shù)論等統(tǒng)計(jì)的、非離散的數(shù)學(xué)定量方法來表示這些語言現(xiàn)象之間的動(dòng)態(tài)關(guān)系,系統(tǒng)地描述并用公式化的定律來解釋這些現(xiàn)象。這種方法屬于計(jì)量語言學(xué)范疇。語言結(jié)構(gòu)的長度與其句法復(fù)雜度呈正相關(guān),是計(jì)量語言學(xué)中一個(gè)重要的測量指標(biāo),基本反映了語言系統(tǒng)自調(diào)整和自適應(yīng)的屬性。在計(jì)量句法分析上,句子成分的位置是另一個(gè)重要的計(jì)量概念。Fan, Grzybek and Altmann[3] 研究了單詞長度(按音節(jié)劃分)和其相對應(yīng)的句子位置的關(guān)系,研究發(fā)現(xiàn)處于句尾的單詞的平均長度大于句首單詞的平均長度。

      本文運(yùn)用計(jì)量語言學(xué)的理論和方法,研究句子中主語位置與句子復(fù)雜度的關(guān)系。在本研究中,主語是指主句的主語,在并列句中是指第一分句的主語。句子復(fù)雜度的測量方法有三種:第一,基于直接成分的數(shù)量, K?hler[4]認(rèn)為在句子層面上,直接成分就是分句;第二,基于短語的數(shù)量;第三;基于單詞的總數(shù)。本文將使用第二種方法,統(tǒng)計(jì)短語句法功能成分的數(shù)量。主語是句子的主旨或者主題,一般承載已知信息,句子圍繞主語展開。信息在句子中分布一般是已知信息在前,新信息在后,動(dòng)詞在已知信息和新信息之間。如在Peter got a new job yesterday句中,對聽者來說Peter為已知信息,而a new job yesterday則為新信息。新信息通常需要更加詳盡的說明,因此導(dǎo)致英語句子的尾重。

      2 數(shù)據(jù)處理

      本研究使用了ICE-GB當(dāng)代英國英語語料庫書面英語部分(ICE-GBW),包含200個(gè)文本,總計(jì)400,000單詞。這些文本有句法和詞性標(biāo)注。

      在本句中,PU,CL(main,intr,pres)為語法分析單位的起始代碼,不是句子的成分。由于本文采用具有句法功能的短語(下述用PSFE表示)數(shù)量計(jì)算句子復(fù)雜度,因此單詞、標(biāo)點(diǎn)符號及其標(biāo)注代碼忽略不計(jì)。上述句子中一共有17個(gè)PSFE(除了最開始的句法分析單位(PU,CL(main,intr,pres):

      A,PP(); PC,NP(); NPPR,AJP(attru); SU,NP(); DT,DTP(); NPPO,PP(); PC,NP(); VB,VP(intr,pres,perf); FNPPO,CL(depend,zrel,montr,pass,edp); SU,NP(); VB,VP(montr,edp,pass); A,PP(); PC,NP(); NPPR,AJP(attru); NPPO,PP(); PC,NP(); DT,DTP().

      例如:A,PP()為介詞短語其句法功能為狀語;PC,NP()為名詞短語,句法功能為介詞補(bǔ)語;NPPR,AJP(attru)為形容詞短語,句法功能為定語;SU,NP()為名詞短語,句法功能為主語等。句子的主句主語(SU,NP())從句首算起處于句子PSFE的第四位,所以其位置值為4,由于本句有17個(gè)PSFE,其句子復(fù)雜度值為17。

      3 結(jié)果與分析

      ICE-GBW中句子總數(shù)為20,530。這些句子包括了381,819個(gè)PSFE,具有36種不同的句法功能,圖1為這些PSFE的分布。

      ICE-GBW句子的平均句子句法復(fù)雜度值為18.5981,由PSFE的總數(shù)381,819除以句子的總數(shù)20,530得出。句子句法復(fù)雜度的中值為17,眾值為14。其復(fù)雜度值的區(qū)間為1到95。句法復(fù)雜度值處于1到10之間的句子占總句子數(shù)的27%,為5,471;句法復(fù)雜度值處于11到25之間的句子占句子總數(shù)的50%,為10,318;句法復(fù)雜度值處于26到99之間的句子占句子總數(shù)的23%,為4,741。在20,530個(gè)句子中,33個(gè)句子的句法復(fù)雜度為1, 2個(gè)句子的句法復(fù)雜度值95。句子句法復(fù)雜度和句型數(shù)量的關(guān)系可

      4 結(jié)論

      本研究結(jié)果表明,ICE-GBW中PSFE有著36種不同句法功能,前十位頻次最高的(按降序排列)為:DT, VB, PC, A, SU, NPPO, CJ, NPPR, OD, CS。盡管主語的位置極其重要,但卻排在第五位。句子句法復(fù)雜度和句型數(shù)量的關(guān)系可以用Wimmer & Altmann數(shù)學(xué)模型來表示。主語可以出現(xiàn)在句子中46個(gè)不同的位置,但是最主要的位置仍然是句子的前部。句子的主語位置是句子復(fù)雜度的一個(gè)指標(biāo),主語位置越靠后,句子的句法復(fù)雜度就越高。這種關(guān)系可以用線性回歸模型來表示。這種現(xiàn)象除了修辭和文體的原因外,主要是受英語句子尾重和新舊信息在句子分布原則所影響。

      參考文獻(xiàn)

      [1] Quirk, R., Greenbaum, S., Leech, G. & Svartvik, J. A comprehensive grammar of the English language[M]. Longman Group Limited: New York. 1985:47

      [2] 劉海濤,計(jì)量語言學(xué):語言研究的科學(xué)化途徑[N],光明日報(bào),2012-02-14

      [3] Fan, F., Grzybek, P., Altmann, G. Dynamics of word length in sentence [M]. Glottometrics 20, 2010:70-109

      [4] K?hler R. Quantitative syntax analysis [C]. Walter de Gruyter GmbH & Co. KG:Berlin/Boston, 2012

      [5] Wimmer, G. & Altmann, G. Towards a unified derivation of some linguistic laws [M]. In: Grzybek, P. (ed.). Contributions to the science of language: Word length and related issues: 93-117. Boston: Kluver. 2005

      猜你喜歡
      數(shù)學(xué)模型語料庫
      AHP法短跑數(shù)學(xué)模型分析
      活用數(shù)學(xué)模型,理解排列組合
      《語料庫翻譯文體學(xué)》評介
      基于語料庫“隱秘”的詞類標(biāo)注初步探究
      基于電力機(jī)器人控制系統(tǒng)的數(shù)學(xué)模型簡述
      電子制作(2019年23期)2019-02-23 13:21:34
      把課文的優(yōu)美表達(dá)存進(jìn)語料庫
      對一個(gè)數(shù)學(xué)模型的思考
      基于JAVAEE的維吾爾中介語語料庫開發(fā)與實(shí)現(xiàn)
      語言與翻譯(2015年4期)2015-07-18 11:07:45
      古塔形變的數(shù)學(xué)模型
      河南科技(2014年5期)2014-02-27 14:08:47
      考慮水包油乳狀液的復(fù)合驅(qū)數(shù)學(xué)模型
      碌曲县| 玉林市| 尼玛县| 双城市| 正宁县| 图片| 建德市| 奉节县| 金华市| 新野县| 广汉市| 祁连县| 连江县| 罗平县| 青龙| 敦煌市| 措美县| 台北市| 余庆县| 宾川县| 辽源市| 杂多县| 藁城市| 甘南县| 沾益县| 盖州市| 海城市| 微山县| 正定县| 白水县| 库伦旗| 九台市| 石城县| 红原县| 竹溪县| 金堂县| 瑞昌市| 施甸县| 夏津县| 松阳县| 双城市|