• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      2016—2018年國內(nèi)語料庫語言類研究綜述

      2019-08-22 00:49:42北京外國語大學(xué)大連外國語大學(xué)
      語料庫語言學(xué) 2019年1期
      關(guān)鍵詞:構(gòu)式語料庫學(xué)術(shù)

      北京外國語大學(xué)/大連外國語大學(xué) 康 卉

      提要:本研究借助CiteSpace可視化分析軟件,結(jié)合人工細(xì)讀、特征標(biāo)注以及ΔP統(tǒng)計,對2016—2018年刊載于國內(nèi)CSSCI來源期刊及北大核心期刊的720篇語料庫語言類研究文獻(xiàn)進(jìn)行詳細(xì)解讀。通過對實(shí)證類論文的研究發(fā)現(xiàn):當(dāng)前我國語料庫研究以對比為主,在語言本體研究、翻譯研究及學(xué)習(xí)者研究方面分布較為集中,且呈現(xiàn)本土化趨勢;重視詞匯和構(gòu)式,關(guān)注政治和政策也是本領(lǐng)域研究的特點(diǎn);研究方法多樣、理論探討充分,但多引自于國外。基于語料庫的研究已成常態(tài),但發(fā)展并不均衡,表現(xiàn)在對學(xué)術(shù)話語、詞塊、篇章銜接及結(jié)構(gòu)研究方面的不足,對學(xué)習(xí)者和學(xué)術(shù)研究中的翻譯研究等關(guān)注不夠。另外,在研究語種方面,漢語和英語研究較多。對于漢語變體、少數(shù)民族語言、其他外語的研究較為缺乏。

      1.引言

      語料庫語言學(xué)具有自身清晰的哲學(xué)觀、語言觀和堅實(shí)的學(xué)科發(fā)展歷史(許家金 2017:60),是“具有很強(qiáng)方法論導(dǎo)向的語言學(xué)分支”(Leech 2011:158)。在我國,從1982年上海交通大學(xué)黃人杰教授和楊惠中教授主持建立100萬詞次的學(xué)術(shù)用途英語語料庫JDEST起(譚鍵 2005:61),發(fā)展至今已有近四十年,其間不斷完善理論、創(chuàng)新角度,與多學(xué)科相融合,發(fā)展壯大。劉霞等(2014)基于CiteSpace可視化分析軟件(Chen 2006),呈現(xiàn)了1998—2013年國內(nèi)語料庫語言類研究在熱點(diǎn)作者、署名單位,以及關(guān)鍵詞方面的聚類特點(diǎn),并總結(jié)了研究的熱點(diǎn)和趨勢。張新杰(2017)對于1992—2015年國內(nèi)語料庫語言類研究進(jìn)行了總結(jié)回顧,對研究的材料基礎(chǔ)、內(nèi)容和代表性進(jìn)行了梳理。本文在借鑒前人研究的基礎(chǔ)上,結(jié)合CiteSpace軟件、人工細(xì)讀及統(tǒng)計分析,對2016—2018年間語料庫語言類研究論文進(jìn)行解讀,以期在研究熱點(diǎn)、趨勢、分布和不足等方面對其進(jìn)行細(xì)描,并為學(xué)界提供一定參考。

      2.方法

      2.1 數(shù)據(jù)采集

      本文的分析數(shù)據(jù)來自CNKI,通過使用關(guān)鍵詞和主題詞“語料庫”,對CSSCI來源期刊及北大核心期刊的文章進(jìn)行檢索(時間設(shè)置為2016年1月至2018年12月22日)。刪除“主持人語”、“會訊”、“征文”、“書評”類文章。共得到1192篇文章,將472篇自然語言處理類文章與語言類研究文章分開,最終得到720篇語言研究類論文,包括537篇實(shí)證研究論文,47篇理論類論文,79篇應(yīng)用類論文,57篇綜述類論文,如圖1所示。

      圖1 語言研究類論文分布

      2.2 可視化概覽

      借助CiteSpace可視化分析工具呈現(xiàn)720篇語言研究類論文在發(fā)文作者、高被引作者、署名單位及關(guān)鍵詞聚類概貌。

      2.3 人工學(xué)科特征標(biāo)注

      可視化分析工具對中文文獻(xiàn)進(jìn)行分析時可以在關(guān)鍵詞聚類和作者信息方面呈現(xiàn)總體趨勢,有助于快速掌握研究動態(tài)和熱點(diǎn),但亦存在諸如檢索不全面等方面的問題,人工細(xì)讀可以作為有效補(bǔ)充。

      首先對720篇語言研究類論文進(jìn)行基于研究性質(zhì)的分類,共分為四大類:實(shí)證類、理論類、應(yīng)用類和綜述類。同時對537篇實(shí)證類論文進(jìn)行自下而上的研究特征預(yù)標(biāo)注。研究特征是指論文所呈現(xiàn)的研究內(nèi)容特征,一篇研究通常會同時具有多個特征。根據(jù)語言學(xué)研究常識和預(yù)標(biāo)注的發(fā)現(xiàn)進(jìn)行針對實(shí)證研究的特征體系構(gòu)建(見表1),共得到一級類特征12個(7個研究領(lǐng)域、5個語言層次)。有的一級類標(biāo)注還包含二級類標(biāo)注。依據(jù)特征體系,對537篇實(shí)證類論文進(jìn)行標(biāo)注,針對一級類特征統(tǒng)計研究特征共現(xiàn)。分類討論時,借助二級類特征說明特定領(lǐng)域研究的具體特點(diǎn)。另外在特征標(biāo)注時,還在需要之處進(jìn)行備注,例如:涉及的理論框架(如動態(tài)理論、時空理論等)、采用的分析工具(如MAT、Wmatrix等)和分析內(nèi)容(如《老人與?!贰ⅰ墩撜Z》等)。

      表1 研究特征分類

      2.4 分析統(tǒng)計

      (1)分布統(tǒng)計,可視呈現(xiàn)

      對537篇實(shí)證類論文從7個研究領(lǐng)域和6個研究層次入手,分別進(jìn)行特征分析及可視化呈現(xiàn)。以研究領(lǐng)域?yàn)橐暯牵瑢λ械膶?shí)證研究進(jìn)行熱點(diǎn)、趨勢的分析。

      (2)ΔP學(xué)科特征相互關(guān)聯(lián)性測定

      ΔP的計算參考了Gries(2013)對兩個單詞之間互相吸引共現(xiàn)的計算。ΔP值的大小反映了兩個單詞之間的方向性吸引強(qiáng)度。本研究利用ΔP計算兩個共現(xiàn)特征之間的方向性吸引,以期能從統(tǒng)計角度反映語料庫語言類實(shí)證研究中的熱點(diǎn)和薄弱環(huán)節(jié)。

      3.發(fā)現(xiàn)

      720篇文章在綜述、理論、應(yīng)用及實(shí)證類研究的分布情況如圖1所示。本節(jié)對這四類研究進(jìn)行描述,重點(diǎn)介紹實(shí)證類論文。

      3.1 載文期刊:載文量和發(fā)文比

      研究選取前13名刊載語料庫語言類研究的期刊進(jìn)行了載文量和發(fā)文比的統(tǒng)計。載文量即期刊刊載語料庫語言類研究文章的數(shù)量?!锻庹Z電化教學(xué)》與《解放軍外國語學(xué)院學(xué)報》刊載文章數(shù)量最多,均為 38篇。圖2表明了載文量排名靠前的期刊發(fā)表綜述、理論、應(yīng)用、實(shí)證研究的數(shù)量。圖3表明了這些期刊發(fā)表語料庫語言類研究論文(及四類研究組成)與其發(fā)文總量的比值,可以反映出各個期刊對于語料庫語言類研究的關(guān)注程度?!锻庹Z與外語教學(xué)》發(fā)文比為16.17%,排名居首;其次是《中國外語》,發(fā)文比為14.63%和《外語電化教學(xué)》,發(fā)文比為11.67%。

      圖2 主要刊載語料庫語言類研究期刊載文量(單位:篇)

      圖3 主要刊載語料庫語言類研究期刊發(fā)文比(單位:%)

      3.2 文章概覽

      所有論文的題目中,僅34.3%(248條)的研究出現(xiàn)“語料庫”字樣。語料庫成為研究的常態(tài)。各研究不再停留于語料庫之名,而是向縱深挖掘研究的理論和內(nèi)容。

      論文中對于語料庫的定義比較寬泛。語料規(guī)模從幾篇文章(如20篇學(xué)術(shù)英語的摘要)或一本書至上億規(guī)模的大型語料庫(如COCA)。

      僅有38%的研究在摘要中表明了研究使用的具體語料庫,其余的文章對于語料庫的提及比較模糊,使用字樣多為“自建語料庫”或“通過語料考查”等。由于本研究僅關(guān)注摘要部分,所得的觀察有限。有可能作者認(rèn)為在摘要部分并不適合交代語料庫的規(guī)?;蚓唧w內(nèi)容。從分析使用的語料庫規(guī)模來看,需要大規(guī)模檢索,則庫容較大,如BNC、COCA和CCL等;需要人工分析標(biāo)注語言結(jié)構(gòu)信息、語義或語用信息等,則規(guī)模較小。

      3.3 作者情況:發(fā)文作者及被引作者

      (1)三年內(nèi)發(fā)文作者與署名單位情況見圖4。相關(guān)研究以上海交通大學(xué)及北京外國語大學(xué)為中心展開,發(fā)文量較高的作者分別為胡開寶、衛(wèi)乃興、王克非、許家金、李晶潔、劉永兵等,他們主要從事語料庫翻譯學(xué)、語料庫語言學(xué)理論探討、局部語法、學(xué)習(xí)者及學(xué)術(shù)英語等研究。

      圖4 三年發(fā)文作者及署名單位情況

      (2)位居前十位的被引作者如表2所示。表明近三年學(xué)界比較關(guān)注對外漢語學(xué)習(xí)者、多模態(tài)話語分析、譯者風(fēng)格、學(xué)術(shù)英語、口譯研究、特定領(lǐng)域話語分析等話題。

      表2 近三年被引前十名作者

      (續(xù)表)

      3.4 理論、綜述與應(yīng)用

      (1)57篇綜述類論文分兩大部分:1)對于語料庫語言類研究綜述;2)利用語料庫進(jìn)行的其他學(xué)科綜述。分布在翻譯14項(xiàng),語言本體研究7項(xiàng),數(shù)字人文5項(xiàng),二語習(xí)得5項(xiàng),隱喻4項(xiàng),語料庫建設(shè)3項(xiàng),學(xué)術(shù)寫作3項(xiàng),關(guān)于語料庫的語言類研究2項(xiàng)。在研究方法上,14篇是基于CiteSpace軟件的分析,占四分之一??梢奀iteSpace以其高效、清晰的特點(diǎn)受到綜述類文章的青睞。從綜述的分布來看,學(xué)界對于翻譯研究、語言本體、數(shù)字人文、二語習(xí)得及隱喻研究綜述較多。

      (2)理論類論文47篇。其中最多的為對語言本體的概念界定和理論梳理方面的研究,如概指名詞、強(qiáng)化詞、詞匯與語法的關(guān)系、詞義、短語、局部語法等,共16篇。涉及的本體亦是語料庫語言類研究經(jīng)常研究的對象。對于本體研究理論的梳理反映出學(xué)界對其的關(guān)注及熱度。對于語料庫翻譯理論的思考和討論共7篇,涉及語料庫翻譯研究史、翻譯文體學(xué)、翻譯與認(rèn)知結(jié)合等。許家金(2017)、李文中(2016)以及甄鳳超和李文中(2017)對語料庫語言學(xué)進(jìn)行了學(xué)術(shù)史和淵源的梳理。其余的理論梳理分布于語料庫研究與話語分析的結(jié)合、與學(xué)術(shù)英語研究結(jié)合、與學(xué)習(xí)者研究結(jié)合等方面。

      (3)應(yīng)用類論文79篇。52篇應(yīng)用于教學(xué),內(nèi)容多為輔助詞匯、句法、特定課程的教學(xué)開展。10篇論述語料庫應(yīng)用于詞典編撰,8篇應(yīng)用于翻譯輔助研究。其余則分散于學(xué)術(shù)研究、學(xué)生情感變化研究及期刊編輯的研究等。在論文的呈現(xiàn)方面以倡議、介紹居多,實(shí)證研究或有實(shí)證研究部分的論文較少。

      3.5 語言類實(shí)證研究

      基于表1的特征系統(tǒng),本文對選取的537篇實(shí)證類研究論文進(jìn)行了多特征標(biāo)注。表3展示了具體特征出現(xiàn)的頻次及與其共現(xiàn)的其他特征。對角線畫圈部分對應(yīng)的橫縱坐標(biāo)相同,表示該特征總共出現(xiàn)的次數(shù)。以其為節(jié)點(diǎn)的橫縱行數(shù)據(jù)相同,表示與其共現(xiàn)的其他特征。如“對比”這一特征出現(xiàn)207次,表明有207條文獻(xiàn)具有“對比”的研究特征,這207條文獻(xiàn)中的不同文獻(xiàn)還可能同時具有“學(xué)術(shù)(39)”、“學(xué)習(xí)者(43)、詞匯(58)、構(gòu)式(40)”等研究特征。

      表3 語言實(shí)證類研究特征共現(xiàn)情況

      圖5 實(shí)證論文研究內(nèi)容(特征)分布

      整體來看,在研究領(lǐng)域中,實(shí)證類論文中對比研究占比最高,主要包括了語類、語體、歷時、學(xué)習(xí)者和本族語、翻譯原文和譯文、譯文之間等不同形式與內(nèi)容的對比。表明語料庫語言類研究比較重視對比,從對比中尋找規(guī)律和特點(diǎn)。本體的研究位居第二,尤其是本體中的詞匯和構(gòu)式,可能與語料庫檢索和分析的便利性與學(xué)界對詞匯、構(gòu)式研究的偏愛有關(guān)。對話語分析的研究也位列前茅,有可能是分類時將媒體、特定語境中的語篇、口語語篇研究都?xì)w入此類的原因。接下來的排序依次為翻譯、學(xué)習(xí)者和學(xué)術(shù),對于文學(xué)體裁的關(guān)注較少,具有文學(xué)特征的研究大都(31/44)是在翻譯中對于經(jīng)典文學(xué)作品或典籍的研究。對于詞塊、篇章銜接與結(jié)構(gòu)的關(guān)注都居弱勢。下面分別對各研究領(lǐng)域的特征進(jìn)行具體分析。

      (1)對比分析數(shù)量最多(207篇),反映了我國語料庫語言類實(shí)證研究重視對比的特點(diǎn)。而且從分布比例來看,與總體的特征分布趨同,僅在翻譯研究方面高于總體水平,位于對比研究之首。不同的領(lǐng)域?qū)Ρ葍?nèi)容亦有各自的特點(diǎn),將在下文不同領(lǐng)域和語言研究層次的討論中展開。

      (2)從翻譯特征(共114篇)角度來看,對比(61)、詞匯(34)和文學(xué)(31)是同時出現(xiàn)最高的特征。翻譯研究涉及的對比除了包括不同譯者譯本、源語、目的語、歷時譯本之間的對比,隨著機(jī)器翻譯的發(fā)展,還出現(xiàn)了機(jī)器譯本與譯員譯本之間的對比。翻譯中的詞匯研究主要針對某些或某類詞匯(虛化動詞、文化概念詞、術(shù)語)的翻譯或翻譯特征(如詞義泛化)等。針對翻譯特征的研究分布在顯化和隱化(15篇)、翻譯策略(11篇)、文體與風(fēng)格(12篇)。基于文學(xué)作品或典籍的翻譯研究共31篇,其中文學(xué)作品外譯研究22項(xiàng),外譯中研究7項(xiàng),其余兩篇是關(guān)于文學(xué)翻譯語料庫建設(shè)及文學(xué)翻譯計量分析。中譯外作品與外譯中作品數(shù)量間差異較大,可能是受到國家文化走出去傳播戰(zhàn)略的影響。除了對比類的文章,還有28篇研究關(guān)注漢語譯文的特點(diǎn)與質(zhì)量??傮w來講,在語料庫翻譯研究領(lǐng)域,研究者對于漢外對比、文學(xué)外譯以及外譯漢翻譯質(zhì)量等比較關(guān)注,尤其體現(xiàn)在對詞匯層面的研究上。另一方面,翻譯類研究中對于學(xué)術(shù)、學(xué)習(xí)者以及篇章銜接與結(jié)構(gòu)的關(guān)注度較低。翻譯類研究發(fā)文較多的作者有胡開寶(6篇)、秦洪武(4篇)、王克非(3篇)以及韓江洪(3篇)。

      (3)學(xué)術(shù)英語的研究共59篇。研究的內(nèi)容主要是對比中外學(xué)者在學(xué)術(shù)寫作方面的異同(39篇),其中11篇是關(guān)于學(xué)習(xí)者學(xué)術(shù)寫作的研究。就研究的語言層次來看,對學(xué)術(shù)寫作中各部分(摘要、引言、致謝、結(jié)論等)語步特征關(guān)注較多,共15篇。對詞匯、語塊、構(gòu)式等的關(guān)注次之,且較均衡。研究的內(nèi)容主要有介入、人稱代詞、殼名詞、局部語法、模糊限制語、語法隱喻等。對于篇章方面的關(guān)注較少,此領(lǐng)域發(fā)文較多的作者有李晶潔(4篇)、劉永兵(4篇)和衛(wèi)乃興(3篇)。

      (4)學(xué)習(xí)者的研究為96篇,主要通過對比(43篇)來發(fā)現(xiàn)學(xué)習(xí)者的語言特征及其身份特征。關(guān)注的焦點(diǎn)在詞匯和構(gòu)式等的使用。具體包括各類詞匯(如情態(tài)動詞、模糊語、人稱、名詞、緩和語、增強(qiáng)語等)的使用特征,及從認(rèn)知角度研究詞匯習(xí)得狀況。對于詞塊的研究主要集中于3—4詞詞塊。支撐理論上比較分散,包括動態(tài)系統(tǒng)理論、共現(xiàn)結(jié)構(gòu)、句法復(fù)雜性、詞匯豐富性框架、英漢時空差異、話題標(biāo)記、修正策略、型式語法、結(jié)構(gòu)框架和功能框架等。漢語學(xué)習(xí)者研究占有一定比例(34篇),其中王啟、王鳳蘭(2016)關(guān)于漢語二語讀后續(xù)寫的協(xié)同效應(yīng)一文在近三年語料庫語言類研究文章中被引用次數(shù)最多,一定程度上反映了學(xué)界對漢語二語習(xí)得的關(guān)注。語言的研究層次涉及詞匯、語塊、構(gòu)式的各個方面,對語篇的研究較少。整體來看,對學(xué)習(xí)者在翻譯方面的習(xí)得研究不夠。發(fā)文較多的作者有王文斌、趙朝永、劉永兵和張萍,均為3篇。

      (5)話語分析研究囊括了媒體、政府等特定領(lǐng)域語篇及口語、個人風(fēng)格、譯作風(fēng)格等的分析與研究,因而基數(shù)較大(127篇)。在此類研究中特定領(lǐng)域的話語研究居多(94篇)。其中,對政治語篇的研究最多(44篇),主題涉及外交、政策、政府發(fā)聲、領(lǐng)導(dǎo)人話語、國家形象,關(guān)注政治領(lǐng)域的話語構(gòu)建。對“一帶一路”相關(guān)的話題尤為關(guān)注,共8篇。關(guān)于經(jīng)濟(jì)語篇的分析共10篇,其余40篇分散于旅游、法律、廣告等各個領(lǐng)域。方法上多采用批評話語分析方法,研究話語中的權(quán)力表現(xiàn)。在15篇口語研究論文中,對課堂話語語用分析占比較大(11篇),主要涉及話語自我修正、異議表達(dá)、多人話輪研究等方面,反映了學(xué)界對于學(xué)術(shù)口語的關(guān)注。研究依據(jù)的理論主要有批評話語分析、元話語、評價理論、會話原則、自我修正等理論,其次為當(dāng)前話語空間、概念隱喻、新聞框架分析、模因、互文性、歷史話語分析等。研究者在相關(guān)理論框架下,對搭配、擴(kuò)展意義單位、語義韻等語料庫研究范疇進(jìn)行分析??傊?,該領(lǐng)域的研究與政治政策連接緊密,從語用角度進(jìn)行的分析較多,口語方面對于課堂的學(xué)術(shù)口語有偏重。發(fā)文較多的作者有劉佳音(5篇)、趙永青(4篇)和高君(4篇)。

      (6)帶有文學(xué)特征(44篇)的文本多為翻譯研究的對象(33篇)。其余11篇包含隱喻、文體風(fēng)格等方面的研究,如:劉澤權(quán)、王夢瑤(2017)使用MAT多變量方法,考察《老人與?!吩诙嗑S度上的特征;方穎(2016)借助Wmatrix,闡釋阿瑟·米勒的兩部時空劇人物塑造。

      (7)本體研究中具有特征數(shù)量較多的為詞匯、構(gòu)式及對比。所有的本體研究中對漢語的研究較多(96/157),對英語的研究為37篇,對日語的研究為11篇,對英漢對比的研究為11篇,還有3篇不特別針對某種語言。從語言研究的分布可以看出國內(nèi)研究更多關(guān)注漢語本體相關(guān)問題的研究,傾向于將西方語言學(xué)理論應(yīng)用于本土研究。研究所依據(jù)的理論主要為認(rèn)知相關(guān)理論框架,占28篇,包括對構(gòu)式和詞匯的范疇、原型、映射、概念框架、隱喻、轉(zhuǎn)喻、認(rèn)知動因、認(rèn)知機(jī)制等的研究。其他理論還有構(gòu)式搭配、構(gòu)式語法框架等,種類并不多。研究主要集中在對特定詞匯、構(gòu)式、句法等的描述分析方面。雖然對于本體的研究較多,作者卻比較分散,發(fā)文較多的作者有張繼東、王芳和郭鴻杰,均為3篇。

      (8)在研究方法的運(yùn)用上,537篇研究大都涉及語料庫的常見統(tǒng)計方法,如詞頻、搭配、索引行等。其中也不乏較新的工具與方法。在統(tǒng)計方面,有二元邏輯回歸、對應(yīng)分析、構(gòu)式搭配等方法;在標(biāo)注與檢索方面有Wmatrix,Coh-Metrix,MAT,MIP,DICTION,USAS等。這些方法與工具的運(yùn)用僅占少部分比例,而且多為國外開發(fā)。

      (9)研究共現(xiàn)分析。通過特征分析,可以對2016—2018語料庫語言類研究有個大概的了解。特征共現(xiàn)分析,通過計算ΔP值可以進(jìn)一步展示各個特征之間的“吸引強(qiáng)度”。ΔP值是Gries(2013)用于研究單詞對與其共現(xiàn)單詞吸引強(qiáng)度所提出的計算值。ΔP值越高,證明某特定單詞對與其共現(xiàn)的單詞吸引力越強(qiáng)。用ΔP值計算的搭配強(qiáng)度是有方向性的。如of對course的吸引就強(qiáng)于course對of的吸引。本文用ΔP計算特定研究特征對與其共現(xiàn)特征的吸引。ΔP值高的研究,是學(xué)界比較傾向的選擇。值得說明的是,傾向性指標(biāo)并非表明其在所有研究中的比例,而是二者共同出現(xiàn)的可能性。比如course傾向于和of同時出現(xiàn),并不表明語篇中of course的數(shù)量最多。計算公式如下:

      i.ΔP=p (outcome|cue=present) - p (outcome|cue=absent)

      ii.ΔP2|1=p (word2|word1=present) - p (word2|word1=absent)

      iii.ΔP受關(guān)注程度=p (受關(guān)注特征|有既定特征) - p (受關(guān)注特征|無既定特征)

      公式i和ii是Gries(2013)計算單詞共現(xiàn)時的公式,iii是本文用于研究特征共現(xiàn)的公式。537篇文獻(xiàn)中總研究特征數(shù)為1235。學(xué)術(shù)特征在對比特征研究中受關(guān)注程度計算公式為:

      ΔP受關(guān)注程度(學(xué)|對)=39/207-(59-39)/(1235-207)=0.17

      而對比特征在學(xué)術(shù)研究中受關(guān)注程度則為:

      ΔP受關(guān)注程度(對|學(xué))=39/59 - (207-39)/(1235-59)=0.52

      0.52 > 0.17,說明對比研究在學(xué)術(shù)研究中受關(guān)注程度,比學(xué)術(shù)研究在對比研究中受關(guān)注程度要高。亦即相對于在對比分析中進(jìn)行學(xué)術(shù)方面研究,學(xué)界更傾向于在關(guān)于學(xué)術(shù)語篇研究中進(jìn)行對比。表4給出了既定特征和受關(guān)注特征的ΔP值??梢钥闯觯瑢Ρ妊芯吭趯W(xué)術(shù)研究中受關(guān)注程度的ΔP值最大,表明學(xué)界中做此類研究的傾向性最高,學(xué)者們傾向于對中外作者或?qū)W術(shù)文章的不同部分進(jìn)行對比,以發(fā)現(xiàn)不同特征。

      從表4可以看出排名靠前的研究共現(xiàn)為學(xué)術(shù)中的對比、文學(xué)中的翻譯、本體中的詞匯、翻譯中的對比、詞塊中的對比、多維中的對比、詞塊中的學(xué)習(xí)者、多維中的翻譯、文學(xué)中的對比、篇章中的學(xué)術(shù)和本體研究中的構(gòu)式。

      負(fù)值表示研究之間的排斥。考慮到分類時,人為將某些特征定義區(qū)分開來,如本體研究與翻譯、文學(xué)、學(xué)術(shù)、學(xué)習(xí)者特征不會共現(xiàn),多維與詞匯、語塊、構(gòu)式不共現(xiàn)等因素,只對有研究意義的參數(shù)解讀。相互排斥的研究特征主要有:學(xué)習(xí)者研究中對翻譯的關(guān)注、學(xué)術(shù)研究中對翻譯的關(guān)注、翻譯研究中對學(xué)習(xí)者研究的關(guān)注、詞塊研究中的話語分析、構(gòu)式研究中的話語分析等。

      表4 既定特征和受關(guān)注特征ΔP值

      3.6 最相關(guān)領(lǐng)域——自然語言處理

      自然語言處理側(cè)重于對語料庫中的語料進(jìn)行計量學(xué)角度的標(biāo)注與計算,有時需要借鑒語言學(xué)理論知識。檢索近三年文獻(xiàn)發(fā)現(xiàn),自然語言處理與語料庫語言類研究的界限有模糊之勢。如:武繼紅(2016)借助MIP詞典進(jìn)行隱喻識別研究;王立非、劉霞(2017)運(yùn)用自然語言處理方法和語步理論,對英語學(xué)術(shù)論文摘要語步結(jié)構(gòu)自動識別模型進(jìn)行構(gòu)建;陳功、梁茂成(2017)對面向中國學(xué)生的英語書面語動詞形式錯誤自動檢查進(jìn)行研究。自然語言處理模型中往往需要語言理論和知識的支撐,而模型構(gòu)建又是為語言研究服務(wù),可以在二語習(xí)得、機(jī)器翻譯、主題挖掘和情感分析等多領(lǐng)域發(fā)揮作用。目前我們看到的僅僅是模糊的邊界,真正的合作與共贏需要雙方學(xué)者的通力合作。

      4.結(jié)語

      綜上,通過對2016—2018國內(nèi)語料庫語言類相關(guān)研究的特征共現(xiàn)統(tǒng)計分析,將其研究的特點(diǎn)和趨勢歸納如下:

      (1)對比為主,本土發(fā)展。國內(nèi)對于語料庫語言類的研究角度仍以對比為主,主要體現(xiàn)在不同語種、時期、語類、語體、語言層次和單位、原文與譯文、不同譯文之間、學(xué)習(xí)者和本族語者、不同層次學(xué)習(xí)者等的對比上。對比的方法在學(xué)術(shù)英語、翻譯研究方面尤其受到歡迎,表現(xiàn)為具有較大的ΔP值。對于語言本體、翻譯、學(xué)習(xí)者的研究在所有研究中占有較大份額,是該領(lǐng)域研究的熱點(diǎn)。這三方面的研究有很強(qiáng)的本土化傾向。本體研究中,相當(dāng)比例的研究是漢語研究或漢英對比研究,這些研究有些借鑒國外先進(jìn)的理念和方法,有些立足于本土理論,對語言本身進(jìn)行描寫和觀察。翻譯研究與學(xué)習(xí)者研究本身就體現(xiàn)了學(xué)界重視外語的學(xué)習(xí)和吸收,以及漢語的有效傳播方面。高比例的漢語研究及英漢對比研究,一定程度上反映了學(xué)界對于本國語言和文化的關(guān)注與自信。

      (2)詞構(gòu)引領(lǐng),政策影響。在研究的語言層面上語料庫語言類研究比較偏重詞匯和構(gòu)式的研究,且種類和角度比較細(xì)化、多樣,反映出學(xué)界的研究視角的細(xì)分趨勢。除了微觀著眼,語料庫語言類研究也比較關(guān)注國家的政治與政策。對于媒體、政府話語、翻譯研究中外交、形象、政策等內(nèi)容的關(guān)注在該類研究中占有一定比例;翻譯研究中對中國優(yōu)秀文學(xué)外譯的關(guān)注、學(xué)習(xí)者研究中對漢語中介語的重視,一方面可能與漢語研究熱度的上升及我們的文化自信相關(guān),另一方面可能與國家文化外傳的政策有一定聯(lián)系。

      (3)方法多樣,理論西化。語料庫是很強(qiáng)方法論導(dǎo)向的學(xué)科,本身就以其工具性而受到學(xué)界青睞。近三年的研究中不乏先進(jìn)的方法。這些方法有些是和統(tǒng)計相關(guān),有些則用于標(biāo)注與檢索。問題是,本土創(chuàng)新的方法較少,基本都是學(xué)習(xí)和引進(jìn)國外的研究方法和工具。工欲善其事,必先利其器。我們在夯實(shí)語言學(xué)理論的同時,應(yīng)當(dāng)開闊視野,與自然語言處理研究相結(jié)合,開發(fā)出適合國內(nèi)研究的語言研究工具。支撐研究的相關(guān)理論亦比較豐富,但依據(jù)本土理論進(jìn)行的語料庫研究較少。期待學(xué)界有更多基于本土化理論的語料庫研究出現(xiàn)。

      (4)研究常態(tài),分布失衡?;谡Z料庫的研究已經(jīng)日趨發(fā)展成熟,成為常態(tài),很多研究者不再將“語料庫”字樣嵌于題目之中。但是在語料庫研究發(fā)展的當(dāng)下,我們應(yīng)當(dāng)注意到該領(lǐng)域研究發(fā)展的不平衡狀態(tài)。對于學(xué)術(shù)話語研究相對較少。對于詞塊和篇章的研究不足。在研究傾向方面,學(xué)習(xí)者研究中對翻譯的關(guān)注、學(xué)術(shù)研究中對翻譯的關(guān)注、翻譯研究中對學(xué)習(xí)者研究的關(guān)注、詞塊研究中的話語分析、構(gòu)式研究中的話語分析等是研究者們忽略的方面。另外,在語種研究方面,漢語和英語研究較多。對漢語變體、少數(shù)民族語言、其他外語的研究遠(yuǎn)遠(yuǎn)不足。

      猜你喜歡
      構(gòu)式語料庫學(xué)術(shù)
      《語料庫翻譯文體學(xué)》評介
      如何理解“Curator”:一個由翻譯引發(fā)的學(xué)術(shù)思考
      中國博物館(2019年2期)2019-12-07 05:40:44
      對學(xué)術(shù)造假重拳出擊
      商周刊(2019年2期)2019-02-20 01:14:22
      把課文的優(yōu)美表達(dá)存進(jìn)語料庫
      基于JAVAEE的維吾爾中介語語料庫開發(fā)與實(shí)現(xiàn)
      語言與翻譯(2015年4期)2015-07-18 11:07:45
      “XV的(不)是Y”構(gòu)式探微
      語言與翻譯(2014年1期)2014-07-10 13:06:14
      學(xué)術(shù)
      “有一種X叫Y”構(gòu)式的語義認(rèn)知考察*——從語法構(gòu)式到修辭構(gòu)式的接口探索
      語料庫語言學(xué)未來發(fā)展趨勢
      從語法構(gòu)式到修辭構(gòu)式(下)
      乌兰察布市| 同德县| 鸡西市| 如东县| 卓尼县| 小金县| 卢龙县| 万年县| 库伦旗| 寿宁县| 濮阳市| 麻江县| 崇文区| 清流县| 元阳县| 青海省| 剑河县| 卓尼县| 遂宁市| 屏山县| 万宁市| 独山县| 乐至县| 上思县| 松滋市| 光泽县| 昭平县| 巧家县| 龙里县| 余姚市| 高要市| 浙江省| 海门市| 修文县| 孝感市| 公主岭市| 洞头县| 肥乡县| 万宁市| 阿勒泰市| 伊宁市|