• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于語料庫的英語科技論文文體特征分析*
      ——以歷年國際數(shù)學(xué)建模特等獎?wù)撐臑槔?/h1>
      2012-12-02 06:05:02張麗平
      外語與翻譯 2012年2期
      關(guān)鍵詞:語料庫文體建模

      張麗平

      (中國人民解放軍理工大學(xué)理學(xué)院外語系,江蘇南京210011)

      基于語料庫的英語科技論文文體特征分析*
      ——以歷年國際數(shù)學(xué)建模特等獎?wù)撐臑槔?/p>

      張麗平

      (中國人民解放軍理工大學(xué)理學(xué)院外語系,江蘇南京210011)

      利用語料庫檢索工具Word Smith對國際數(shù)學(xué)建模論文進行檢索,并在考察數(shù)學(xué)科技論文的文體特征基礎(chǔ)上。描述了數(shù)學(xué)科技論文的總體特征,還通過從詞匯、詞語搭配等方面詳細(xì)分析了數(shù)學(xué)科技論文在詞匯、句子和語篇三方面的要素,為科技論文的寫作教學(xué)提供有價值的參考。

      語料庫檢索;數(shù)學(xué)科技論文;文體特征

      隨著我國教育改革的深入,國內(nèi)大學(xué)生參加的重大國際賽事越來越多,國際大學(xué)生數(shù)學(xué)建模競賽(MCM/ICM)就是這些賽事之一,它是美國國家科學(xué)基金會、美國數(shù)學(xué)會、美國運籌與管理學(xué)會及其應(yīng)用聯(lián)合會聯(lián)合舉辦的在世界上影響范圍最大的高水平大學(xué)生國際級的競賽項目,這項賽事包括從1985年開始舉辦的數(shù)學(xué)建模競賽,英文全稱“Mathematical Contest in Modeling”,縮寫為“MCM”,和2000年開始舉辦的交叉學(xué)科建模競賽“Interdisciplinary Contest in Modeling”,縮寫為“ICM”。這項賽事自誕生起就引起了越來越多的關(guān)注,并逐漸吸引了世界各地著名學(xué)府學(xué)生的參加。我國一些著名大學(xué)如清華大學(xué)、北京大學(xué)、上海交通大學(xué)、浙江大學(xué)、西北工業(yè)大學(xué)等從1989年起開始參加這項賽事,并經(jīng)常在該項賽事中取得令人矚目的成績,大大提升了學(xué)校的國際知名度。

      國際賽事的通用語言一般是英語,這對我們當(dāng)前的英語教學(xué)尤其是英語寫作教學(xué)提出了新的挑戰(zhàn)。只圍繞四六級作文寫作的非英語專業(yè)學(xué)生的寫作教學(xué)已滿足不了當(dāng)前的這種需求,大學(xué)英語的寫作教學(xué)還應(yīng)關(guān)注科技論文的寫作。這里的科技論文指“用英語撰寫的有關(guān)自然科學(xué)的學(xué)術(shù)論文、實驗報告等”[1]。對于英文科技論文的探討,國內(nèi)的研究大多是關(guān)于科技論文英文摘要的研究,也有部分研究是對英語科技論文文體的描述,這些研究基本展現(xiàn)了英語科技論文的文體特征,但多為主觀判斷。語料庫語言學(xué)強調(diào)利用語料庫收集的真實語料對文本進行量化分析,因此可以較為客觀地展現(xiàn)英文科技論文主體部分的文體特征,是科技論文文體特征研究方法的有益補充。本研究嘗試?yán)谜Z料庫語言學(xué)的研究方法,通過對自建的美國大學(xué)生數(shù)學(xué)建模特等獎?wù)撐恼Z料庫的文本分析,客觀地描述科技論文,尤其是數(shù)學(xué)科技論文的文體特征,以期對我國的本科科技英語寫作教學(xué)以借鑒。

      一、語料來源和研究方法

      本文的研究選取近五年國際大學(xué)生數(shù)學(xué)建模競賽特等獎?wù)撐臑檎Z料建立一個小型語料庫,具有一定的代表性。用自建的一個由新聞報道、文學(xué)作品等非科技論文組成的語料為參照語料庫,利用語料庫檢索軟件Wordsmith工具,采用定量和定性相結(jié)合的方法,對大學(xué)生數(shù)學(xué)建模競賽特等獎?wù)撐倪M行分析,以揭示數(shù)學(xué)科技論文的文體特征。

      二、結(jié)果分析

      (一)國際大學(xué)生科技論文的總體特征及分析

      將自建的國際大學(xué)生數(shù)學(xué)建模競賽特等獎?wù)撐恼Z料庫用Wordsmith中的統(tǒng)計功能,可以統(tǒng)計出該語料庫的總體特征,如字節(jié)數(shù)(Bytes),形符數(shù)(Tokens,文本中總的單詞數(shù)),類符數(shù)(Types,文本中不同的詞形數(shù)),類符形符比(Type/Token Ratio,在一定程度上反映用詞的變化性),標(biāo)準(zhǔn)化類符形符比(Standardised Type/Token,反映用詞的變化性),平均詞長(Ave.Word Length),平均句長(Sent.length),平均段落長(Para.Length)等等。統(tǒng)計結(jié)果如表1所示。

      ?

      類符形符比可以反映作者用詞的變化性,本語料庫的類符形符比是5.03,而BROWN語料庫的類符形符比為4.21[2],可以得知獲獎大學(xué)生已經(jīng)能較好地掌握詞匯及其應(yīng)用。類符總數(shù)為3541,可見雖然數(shù)學(xué)論文需要解決的問題不一樣,但作為專業(yè)化的科技英語,其核心詞匯量并不大。平均句長是23.04,和標(biāo)準(zhǔn)句長15.23相比要偏長,也比各類英文文體的平均單句句長17.8個詞要長[3]。數(shù)學(xué)論文的句長長于一般文體,這可能是句子所容納的信息較多的緣故。平均段落長是98.11,比標(biāo)準(zhǔn)平均段落長106.07稍短,這和數(shù)學(xué)論文中假設(shè)和結(jié)論部分的內(nèi)容有關(guān),這兩部分一個段落大多是由只含有一個假設(shè)或一個結(jié)論的單個句子構(gòu)成。平均詞長中,單個字母詞的數(shù)量接近7個字母詞的數(shù)量,單個字母構(gòu)成的單詞只有不定冠詞a和第一人稱單數(shù)I,其中字母a出現(xiàn)1627次,除去75次不是作為冠詞使用,冠詞a占單字母詞的33.2%。字母i出現(xiàn)了93次,從語境中的關(guān)鍵詞觀察,沒有一個字母i是作為人稱詞使用。所以大多數(shù)的單個字母多為作者計算時所設(shè)的某個值。把兩個字母的詞,三個字母的詞,四個字母的詞和五個字母的詞相加,共有39006個,占文本總形符數(shù)66,818的58.4%。六個字母以上的大詞共有23142個,占總形符數(shù)的35.6%。在日常談話,即席解說,甚至廣告中,六個字母以上詞的百分比都沒有超過20%[4]。所以數(shù)學(xué)論文基本上具有書面語特征。

      (二)詞匯特征

      關(guān)鍵詞指的是跟某一標(biāo)準(zhǔn)相比其頻率顯著偏高的詞,偏高的程度就是該關(guān)鍵詞的“關(guān)鍵性”[2]。這也就是說,和參照語料庫相比,關(guān)鍵詞是指在某個文本中出現(xiàn)頻率偏高的詞匯,關(guān)鍵詞的關(guān)鍵值越大表明該詞在文本的的使用頻率越大,因此關(guān)鍵詞能在一定程度上代表該文本的用詞特征。筆者將自建的一個由新聞報道、文學(xué)作品組成的共25,983,254詞的語料作為參照語料庫,利用語料庫檢索軟件Wordsmith工具的keyword searching功能對特等獎?wù)撐膸煳谋具M行分析,生成關(guān)鍵詞表,分析關(guān)鍵詞表中關(guān)鍵值在1100以上的詞匯,并利用詞語索引(concordance)分析這些詞在語境中的詞匯意義,發(fā)現(xiàn)數(shù)學(xué)論文詞匯使用主要具有以下特征。

      1.大量使用數(shù)學(xué)詞匯

      數(shù)學(xué)論文不可避免要使用公式、方程等進行運算,用圖表加以顯示結(jié)果,因此關(guān)鍵詞表中出現(xiàn)了不少數(shù)學(xué)專業(yè)詞匯,按照關(guān)鍵值大小的順序排列主要使用了這些詞匯:model(建模),algorithm(算法),diagrams(圖表),equations(等式,方程式),parameters(參數(shù)),cm(厘米),radius(半徑),figure(圖形),nodes(節(jié)點),values(值),calculate(計算),coefficient(系數(shù)),compute(計算),linear(直線的,線性的),graph(圖表,曲線圖),variables(變量),ratio(比率),interations(),subtracting(減法),interative(),vertex(頂點),nonlinear(非線性),correlation(相關(guān)性),integer(整數(shù)),quotient(商),functions(函數(shù))。

      2.普遍使用第一人稱代詞we

      在頻數(shù)最高的前10個詞中,第一人稱詞we在詞頻表中位列第八,這和黃橙紫(2003)[5]統(tǒng)計的JDEST語料庫中人稱詞的使用情況不一樣,JDEST語料庫前20位詞中沒出現(xiàn)人稱代詞,在當(dāng)時由350萬詞組成的JDEST語料庫中,we出現(xiàn)了2018詞,而本語料庫卻出現(xiàn)了1041次。顯然,相對于包括各類專業(yè)的科技英語語料庫,數(shù)學(xué)科技論文并不排斥第一人稱we的使用。而關(guān)鍵詞表顯示we的關(guān)鍵值是15420.6,可見數(shù)學(xué)論文中we的使用頻率是相對偏高,在數(shù)學(xué)論文中的使用是很普遍的。

      通常人們會認(rèn)為,過多使用第一人稱句會造成主觀臆斷的印象,這和強調(diào)客觀準(zhǔn)確的科技論文寫作是相違背的。那么本語料庫中we在其中起著怎樣的作用呢?將we置于語境中的關(guān)鍵詞中進行搜索分析發(fā)現(xiàn),以we為主語的句子的主要功能是:提出假設(shè)(we assume/hypothesize),提出使用某種算法,進行計算和怎樣計算(we use/set forth/calculate/compute/neglect),定義數(shù)值(we define),數(shù)值比較(we compare),得出計算結(jié)果(we get/obstain/find),進行建模(we model),解決問題(we solve),得出結(jié)論(we conclude/present the results)。從這些功能可見,數(shù)學(xué)論文中第一人稱句的使用可以使句子更為簡潔,其提出假設(shè)、進行建模、提出算法、定義數(shù)值、進行數(shù)值比較和得出結(jié)果等正體現(xiàn)了作者在解決問題方面的獨特之處,不會削弱數(shù)學(xué)論文的客觀性,反而使得表達更為清晰簡潔,直接有力。

      (三)句子特征

      1.時態(tài)特征

      從詞頻統(tǒng)計來看,頻率居前200位的動詞有is,are,be,have,has,use,given,set,do,does,was,were,make,take,transplants,expected,assume,see。大多數(shù)動詞都是用的現(xiàn)在時態(tài),用了過去式和過去分詞的只有was,expected和given,而語境中的關(guān)鍵詞顯示927處expected只有39處是用于過去時態(tài)或完成時態(tài),其余的都是用于被動語態(tài);100處given都是用來表示被動或條件。進一步觀察其他動詞可以得知,數(shù)學(xué)論文一般是用數(shù)學(xué)思想解決社會生活中某些具體問題,其操作和結(jié)論具有科學(xué)性和普遍性,文中多有對方程式或公式的解說以及圖表的說明,使用現(xiàn)在時態(tài)來表述,排除了任何與由于時間而引起的誤解,使文章更為客觀和生動,令人信服。

      2.語態(tài)特征

      一般科技英語為了描述客觀事實,常常會將要強調(diào)的事實置于句首,以突出重要信息,因此被動語態(tài)使用較多。根據(jù)英國里茲大學(xué)約翰·斯威爾斯(John Swales)的統(tǒng)計,科技英語中的謂語至少1/3是被動語態(tài)[6]。通過考察系動詞be,is,are,was,were,been,發(fā)現(xiàn)本語料庫被動語態(tài)一共使用522次,占句子總數(shù)的22.5%,這雖然和約翰·斯威爾斯的統(tǒng)計有所出入,但是已經(jīng)在文本中占有相當(dāng)大的比例。通過語境中的關(guān)鍵詞concordance功能檢索,進一步觀察發(fā)現(xiàn),被動語態(tài)多用于描述問題、模型、方法、計算過程和結(jié)果等。

      3.句式特征

      數(shù)學(xué)科技論文好用it引導(dǎo)的句子結(jié)構(gòu)來描述所要解決的問題,講述模型設(shè)計,評價計算過程。本語料庫中it出現(xiàn)253處,concordance顯示75處用在這四種句子結(jié)構(gòu)中:It is/seems/was/may be/would be+形容詞+that…/to do…,It+被動結(jié)構(gòu)+that…,It assumes that…,It takes/took+時間+to do…,其中第一種句子結(jié)構(gòu)使用最多。

      (四)篇章特征

      1.文體框架特征

      從詞頻表顯示來看,位列前150位的詞中涉及論文主體部分框架結(jié)構(gòu)特征的詞依次是:model,algorithm,method,data,figure,simulation,solution,assumption,results,problem。進一步到語境中的關(guān)鍵詞發(fā)現(xiàn),除了本研究所建語料庫時不包括的摘要和參考文獻部分,數(shù)學(xué)建模論文主體部分有一定的標(biāo)準(zhǔn)格式,主要包含有假設(shè)、建模、方法、算法、數(shù)據(jù)和結(jié)論幾個部分。這種格式合乎科學(xué)推理的思維邏輯:首先確定問題,建立假設(shè),然后設(shè)計模型加以驗證,這涉及到采用何種方法、何種算法,通過計算得出數(shù)據(jù)和圖表以驗證模型的有效性,最后得出結(jié)論。

      2.語篇銜接

      語篇不是句子的簡單堆砌,而是由意義和結(jié)構(gòu)相關(guān)的句子組成。語篇意義之間的連貫通常以這些銜接手段來實現(xiàn):指稱、替代、省略、連接和詞匯銜接[7]。這里主要通過詞頻表和語境中的關(guān)鍵詞來考察語篇的銜接。

      根據(jù)詞頻表前300個詞匯詞語使用頻率的高低排列,數(shù)學(xué)科技論文的銜接主要通過以下邏輯語法詞匯來實現(xiàn):and,for,that,as,which,if,so,only,but,since,where,when,given,however,because,while,thus,after,assume,therefore,until,before。其中包括表達時間順序的since,after,until,before表達因果的for,so,because,therefore,表達條件的if,only,given,assume和表達邏輯語義的and,but,however,that,as,which。從語境中進一步重點考察詞匯頻率排在前列,既可以做連詞又具有其他功能的and,for和that的用法。首先觀察詞匯頻率居于第五的and出現(xiàn)的語境發(fā)現(xiàn),1429處使用and的地方,只73處是表達增補、因果、順序、對比等連接關(guān)系[8],and基本上都是用于并列結(jié)構(gòu)中,所以,科技論文很少使用and來實現(xiàn)語篇的連貫。使用頻率較高的that,723處中作為指代作用的只有55處,其余都是起連接作用。位列詞匯頻率表第九位的for既可作表達原因的連詞,也可以作介詞,742處for中,只有5處用作連接詞表達原因,所以數(shù)學(xué)論文通常不用for來表達原因關(guān)系。

      由以上分析可知,數(shù)學(xué)科技論文由于長于推理論證,句子比較長,因此使用較多的外顯銜接詞匯來實現(xiàn)語篇的連貫。而在具體使用時又有所偏好。

      三、結(jié)論

      本文利用語料庫的定量分析方法,結(jié)合定性分析,客觀地描述和研究了近幾年大學(xué)生數(shù)學(xué)建模獲獎?wù)撐脑谟迷~、句子特征和篇章等方面的特點,改變了以往只以經(jīng)驗和直覺分析研究科技論文文體特征的研究方法,使我們對科技論文文體特征的認(rèn)識更為科學(xué)合理,對我國大學(xué)生的科技論文的寫作教學(xué)提供了更為可信的科學(xué)依據(jù)。本研究的不足之處在于所搜集的大學(xué)生數(shù)學(xué)建模特等獎?wù)撐臄?shù)量比較有限,如果能收集到所有特等獎?wù)撐牟⒔◣欤Y(jié)論將更為客觀。

      [1]秦秀白.英語語體和文體要略[M].上海:上海外語教育出版社,2004.

      [2]楊惠中.語料庫語言學(xué)導(dǎo)論[M].上海:上海外語教育出版社,2004.

      [3]錢瑗.實用英語文體學(xué)[M].北京:北京師范大學(xué)出版社,1991.

      [4]熊莉.從就職演說辭看肯尼迪演說的文體風(fēng)格[J].西南民族大學(xué)學(xué)報人文社科版,2004,(6):407-410.

      [5]黃澄紫.科技英語詞匯的統(tǒng)計特征[J].同濟大學(xué)學(xué)報(社會科學(xué)版),2003,(2).

      [6]辜嘉銘.英語科技論文寫作精要[M].武漢:武漢大學(xué)出版社,2006.

      [7]M.A.K.Halliday,Ruqaiya Hasan.Cohesion in English[M].張德祿,等譯.北京:外語教學(xué)與研究出版社,2007.

      [8]金春霞,胡清平.“and”的語法功能及作用[J].徐州教育學(xué)院學(xué)報,2000,(4):133-134.

      2012-05-19

      張麗平(1976-),女,廣西平樂人,講師,碩士。

      猜你喜歡
      語料庫文體建模
      聯(lián)想等效,拓展建?!浴皫щ娦∏蛟诘刃鲋凶鰣A周運動”為例
      輕松掌握“冷門”文體
      《語料庫翻譯文體學(xué)》評介
      文從字順,緊扣文體
      基于PSS/E的風(fēng)電場建模與動態(tài)分析
      電子制作(2018年17期)2018-09-28 01:56:44
      不對稱半橋變換器的建模與仿真
      把課文的優(yōu)美表達存進語料庫
      若干教研文體與其相關(guān)對象的比較
      基于JAVAEE的維吾爾中介語語料庫開發(fā)與實現(xiàn)
      語言與翻譯(2015年4期)2015-07-18 11:07:45
      三元組輻射場的建模與仿真

      罗江县| 玉环县| 阳城县| 墨江| 凤山县| 乐亭县| 乐至县| 新乡县| 崇信县| 南陵县| 镇巴县| 南康市| 会同县| 区。| 茶陵县| 逊克县| 乐清市| 辰溪县| 巢湖市| 二连浩特市| 蕉岭县| 治多县| 象州县| 巫溪县| 时尚| 南安市| 汉阴县| 枣强县| 会昌县| 敖汉旗| 台前县| 洛浦县| 留坝县| 潢川县| 毕节市| 弥渡县| 岳普湖县| 赤峰市| 延边| 弋阳县| 武邑县|