• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      自建雅思寫作小作文語料庫

      2018-11-14 17:48:32
      長江叢刊 2018年12期
      關鍵詞:賦碼雅思語料

      河北農(nóng)業(yè)大學

      一、前言

      在信息化的時代,將語料庫應用于外語教學已經(jīng)成為一種新的趨勢。正因此,語料庫被應用的領域越來越廣,類型也越來越多。到目前為止,國內(nèi)外已經(jīng)建立了很多大型語料庫,如中國學習者英語語料庫,美國當代英語語料庫,英國國家語料庫等。

      盡管大型語料庫龐大的數(shù)據(jù)支持為學者們的研究提供了很大的方便,但是大型語料庫的更新較慢很難為研究提供最新的信息。因此,一些研究者或教師會根據(jù)自身的要求建立小型或中型語料庫。在某種程度上,小型語料庫有著自身的優(yōu)勢表現(xiàn)如下:

      (1)目標明確,針對性強且難度適中;(2)語料更新速度快,具有時效性;(3)本地機操作,經(jīng)濟、方便、快捷,檢索語料時選擇自由;(4)自主設計,靈活標注,應用方便,易于發(fā)揮語料庫的功能。

      二、雅思寫作小作文語料庫的構建

      (一)語料的采集

      通常情況下建庫者獲取材料的種類有三種。第一種:雜志或教科書。對于這種類型的材料,可以直接鍵入或在掃描儀的幫助下掃描完成錄入。第二種:音頻或視頻。在自建語料庫中,音頻和視頻的轉(zhuǎn)錄是最困難的,它需要花費大量的時間和精力。同時,這需要轉(zhuǎn)錄員有較高的聽力水平。第三種:網(wǎng)頁、電子文檔和電影字幕。網(wǎng)絡材料的數(shù)量是巨大的,而且涉及范圍很廣,為語言學習者提供了豐富的資源。

      雅思寫作小作文語料庫中的材料主要是從互聯(lián)網(wǎng)上選擇的。在導師的幫助下,共找到176篇雅思寫作小作文的樣本,每個樣本約200個字符,語料庫的總字符約為35200。其中,作者選取了2014年至2017年8月26日發(fā)布的152篇范文。其余的樣本則是從網(wǎng)上找到的有著名考官Simon寫的。本文根據(jù)題目中的圖的類型將小作文分為6個不同的種類,他們分別是:地圖,表格,線形圖,條形圖,混合圖,流程圖。

      語料的難度應根據(jù)語料庫的應用目的和應用對象來決定。本文建立的雅思寫作小作文語料庫主要是為了幫助中國學生提高雅思寫作成績,提高中國學生的雅思通過率。根據(jù)統(tǒng)計來看,大部分中國學生的雅思寫作在5分左右,這使得中國學生不能成功進入申請的院校。建立的雅思寫作小作文語料庫選取的語料均為7分左右。一方面7分能夠滿足各國家各院校對雅思寫作考試的要求;另一方面,7分略高于中國學生目前的水平,利于提高學生的寫作水平。

      (二)文本整理

      互聯(lián)網(wǎng)上的很多文本往往是以PDF等不可修改的文本格式呈現(xiàn)的,因此選取的文本不能直接運用到語料庫的建立中。在建立語料庫之前,為了方便語料的檢索和分析,需要對文本進行簡單的加工。從網(wǎng)絡中獲得的雅思寫作小作文的格式各不同。所以,把這些文本轉(zhuǎn)換成統(tǒng)一的格式是非常必要的。在訊飛軟件的幫助下,將所有的文本同意轉(zhuǎn)換成了TXT格式。作者根據(jù)樣本的圖片類型和考試時間就每個文本文檔進行了命名。如:2016年10月13日的考試為例,題目中圖片為餅圖,所以作者將這次考試的樣本命名為“pie20161013”。

      按照要求對樣本進行轉(zhuǎn)換和命名后,需要對文本進行預處理,目的是為了保證文本詞匯的賦碼無誤、詞匯無拼寫錯誤等,文本的整理需要大量的人力和時間。因此,文本整理人員可以輔助“文本整理器”對文本進行整理。

      (三)文本賦碼

      雅思寫作小作文語料庫可能會被應用于核心詞匯、重要搭配和典型句式的檢索,因此本語料庫采用的是詞性賦碼。詞性賦碼指的是對樣本中所有的詞匯進行賦碼。詞性賦碼的方式有兩種。第一種是CLAWS。另一種是由斯圖加特大學的計算語言學研究所設計的,命名為Tree Tagger。前者主要是商業(yè)應用軟件,后者是免費的賦碼工具。雅思寫作小作文語料庫采用 Tree Tagger軟件對所有樣本進行詞性賦碼。步驟如下:

      步驟一:雙擊打開Tree Tagger3 軟件, 點擊左上角的File 菜單,選擇其中的“open File”選項,打開對話框,將雅思寫作小作文樣本載入。

      步驟二:從界面上方的“English”、“French”、“Italian”中選擇“English”。

      步驟三:因為載入的文本都是英語,因此選擇ANSI 對文本進行編碼。

      步驟四:點擊“Start Tagging”按鈕,軟件開始對載入的文本進行詞性賦碼。Tree Tagger 軟件對所載入的文本詞性賦碼完成以后,會在原文本所在的文件夾形成同名文件夾,只是擴展名變成了“.tagged”,這些文件就是賦碼后的文件。

      最后,將所有的賦碼后的文本進行整理,雅思寫作小作文語料庫就建成了。

      三、結(jié)語

      雅思寫作小作文語料庫的構建可以為雅思寫作教學提供大量的真實的語料,提高學生雅思寫作學習的積極性和系統(tǒng)性。因此,雅思寫作小作文語料庫的構建非常重要。本文建立的雅思寫作小作文語料庫能夠為雅思寫作提供幫助,但是雅思考試是每周都會進行的,因此應不斷對該語料庫進行更新和語料的補充,只用這樣才能為雅思寫作教學提供更多即時的教學材料,促進雅思寫作的教學。

      參考文獻

      [1]劉佳.建筑工程英語小型語料庫的構建標準與應用[J].建筑工程,2016(9):113~114.

      [2]畢少琴.自建小型語料庫在高中英語教學與研究中的應用[J].基礎教育外語教學研究,2013(11):47~53.

      [3]張葦,韓江洪,夏蓓潔.基于自建語料庫的旅游英語文體特征類比研究[J].合肥工業(yè)大學學報(社會科學版),2015(2):52~59.

      猜你喜歡
      賦碼雅思語料
      基于實物“ID”的變電站整站賦碼管控系統(tǒng)及方法研究
      吉林電力(2022年2期)2022-11-10 09:24:38
      Eco-Friendly pH Indicator Based on Natural Anthocyanins from Lycium ruthenicum
      基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
      交際教學法在中外合作辦學雅思閱讀課中的應用
      華語電影作為真實語料在翻譯教學中的應用
      煙包二維碼賦碼離線還是凹印在線?
      《苗防備覽》中的湘西語料
      中短單,我們選擇小盒賦碼
      國內(nèi)外語用學實證研究比較:語料類型與收集方法
      雅思6~9分成功策略
      海外英語(2013年11期)2014-02-11 03:21:02
      杭锦后旗| 清水河县| 珠海市| 科尔| 介休市| 板桥市| 毕节市| 武隆县| 镇原县| 丰原市| 马山县| 东源县| 佛坪县| 丰城市| 教育| 台山市| 河北省| 枝江市| 荃湾区| 九江市| 正镶白旗| 建始县| 东乡县| 射阳县| 抚顺县| 博罗县| 绥德县| 宣城市| 江都市| 扬州市| 波密县| 呈贡县| 弥渡县| 遂平县| 荣成市| 丰台区| 溆浦县| 平乡县| 竹溪县| 简阳市| 台中市|