• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      大學(xué)英語作文自動評分系統(tǒng)中文本聚類的應(yīng)用

      2017-04-23 00:35:54柯育強
      電子技術(shù)與軟件工程 2017年5期
      關(guān)鍵詞:大學(xué)英語

      柯育強

      摘 要 自動作文評分研究在我國尚處于起步階段。對于大學(xué)英語作文教學(xué)來說,評分需要針對不特定題目,具有通用性。在作文內(nèi)容評價方面,可以通過文本聚類按照作文詞匯等的相似度進行分類從而聚集到一起。本文通過研究大學(xué)英語作文評分難題,結(jié)合文本聚類理論,完善其應(yīng)用,將聚集不到一起差異性較大的可能跑題作文交由老師評判,可大大減少教師工作力量,提高作文評判的準(zhǔn)確性和效率,對大學(xué)英語作文教學(xué)具有良好的促進作用。

      【關(guān)鍵詞】自動作文評分 大學(xué)英語 文本聚類

      1 引言

      近幾十年來,作文自動評分在國外得到了長足發(fā)展,并廣泛應(yīng)用于實踐中。自動作文評分( Automated Essay Scoring,AES)近年來已漸成為自然語言處理研究中的熱點和重點研究對象。自動評分即非人工的,通過計算機對作文進行評分。不同于其他客觀題目,作文評分必須包含內(nèi)容評價。AES 系統(tǒng)當(dāng)然也包含這方面的評價,只是在針對不同人群、不同種類作文其內(nèi)容評價側(cè)重點不同,有的甚至只依靠內(nèi)容評價。 為了更好地對大學(xué)英語作文評價,一般來說通過內(nèi)容和語言來進行分貝評判。而其中評判內(nèi)容則可以采取聚類的數(shù)據(jù)分析 (exploratory data analy-sis),用此系統(tǒng)進行相似度聚類評價,可對跑題作文鑒別很有幫助。

      2 自動評分系統(tǒng)的意義

      在我國大學(xué)英語寫作訓(xùn)練中,由于一個老師帶的學(xué)生數(shù)量多,批改作文負擔(dān)重,導(dǎo)致學(xué)生訓(xùn)練不足,作文水平得不到提升。這時,運用自動作文評分修改作文不失為一個好方法。與人工修改相比,自動作文評分系統(tǒng)修改作文具有以下優(yōu)點:

      (1)電腦不會疲倦,更加持續(xù)高效。會比人工更仔細、客觀地評好每一篇作文,且不帶思想感情,更公正客觀,有利于學(xué)生進步。

      (2)可大大降低老師的批改工作量,使老師能有更多時間進行備課,講解。且自動評分系統(tǒng)在評分時能方便統(tǒng)計出學(xué)生的薄弱地點,讓老師可更有針對性地教學(xué)。

      (3)學(xué)生可以寫更多的作文來勁性評判,從而更進一步提高其作文水平。

      尤其是在大學(xué)英語教學(xué)改革之后,英語課程實行分級、 分課型教學(xué)改革,每位讀寫課教師面對數(shù)百名學(xué)生,如何使學(xué)生獲得更多的寫作機會,并得到有指導(dǎo)性的反饋,已成為寫作教學(xué)的燃眉之急。

      3 聚類綜述

      目前,聚類技術(shù)已然成為信息檢索、文本挖掘的有力工具。其實質(zhì)就是建立目標(biāo),將一組對象按相似度劃分成不同組別的過程,這個過程可以設(shè)置目標(biāo)為相似元素在同一組,也可以是相異元素不同組,從而達到不同目的。這是一種無指導(dǎo)的學(xué)習(xí)方法。比如給定一組樣本數(shù)據(jù) Y={Y1, Y2,Y3…, Yn},根據(jù)其相似度將這組數(shù)據(jù)氛圍s組, {D1, D2,…, Ds}的過程就是聚類。這種聚類產(chǎn)生的組就叫 簇(cluster),聚類使得每個簇成員具有相似性,而不同簇又具有差異性,聚類方法越好使簇內(nèi)相似度越高,簇間差異性越大。對文本信息的聚類就是文本聚類(Document Clustering),最初只使用它來進行信息檢索,提高準(zhǔn)確率。進行時要先把文本轉(zhuǎn)化為計算機理解的形式,也就是向量空間模型,在對文本進行預(yù)處理,比如提取無用信息,如一些低頻出現(xiàn)的詞匯及一些停用詞,輔助用詞,檢索出出現(xiàn)頻次高可以代表此文檔的詞匯。有時也需要對姓名、電話、地址等一些信息進行識別。這樣就可以構(gòu)成文本向量。有了文檔向量接下來就可以計算相似度了。由于語義內(nèi)容很難計算,一般一出現(xiàn)頻次高低進行計算這是目前較為成熟的一種方法。計算公式是以向量間歐式距離或夾角余弦來計算,距離近,夾角俞小則相似度越大。

      4 自動評分系統(tǒng)聚類研究

      現(xiàn)行的 AES 系統(tǒng)對英語作文評分已經(jīng)做到兼顧內(nèi)容和語言質(zhì)量,但這僅對外國學(xué)生而言,對于我國高校英語作文評分還存在不足。

      (1)成熟的系統(tǒng)大多用于商業(yè),價格昂貴;

      (2)這套系統(tǒng)多針對外國大學(xué)生,對我國學(xué)生來說,適用性不強;

      (3) AES 評分系統(tǒng)都是先收集已經(jīng)評過分?jǐn)?shù)的作文題目儲存分析,作為訓(xùn)練集,再以這些已經(jīng)評過分的作文建立模型再進行大批量的評分,評分時可與之前建立的評分訓(xùn)練集進行語言和內(nèi)容的比較,得出最后得分。

      適用于人數(shù)很多的大型考試或測驗,建立人工評分的訓(xùn)練集都要達到200多份,總批閱試卷量達到幾萬份。而大學(xué)英語教育一個老師針對學(xué)生最多有300名學(xué)生,遠遠達不到上述的幾萬份,很難應(yīng)用此種評分系統(tǒng)。所以,現(xiàn)在退出了一種小眾的面相大學(xué)英語作文訓(xùn)練評分模式。它的特點在于:對作文的內(nèi)容和語言質(zhì)量分別評價。在語言方面,不用多次訓(xùn)練累計而成的語言評價模型進行評價,而不用特別針對某一題目;內(nèi)容方面選擇不經(jīng)訓(xùn)練就可對內(nèi)容進行分析文本自動聚類。聚類通過對文章詞匯短語的鑒別與分析,把詞語、內(nèi)容、語義相近的文章自動聚集到一種類別中,從而進行判別。尤其對于同意題目的文章,按照聚集的詞語、語句相似度從而對內(nèi)容進行評判。但也不排除有差別特別大的,這時候就需要人工金興評判,看是否跑題,但不得不說此時已經(jīng)大大減少了老師的工作量。

      當(dāng)然了,用內(nèi)容聚類評判英語作文我們還必須不能忽視一個問題:同一題目由于角度不同也會產(chǎn)生不同內(nèi)容的作文。比如一次四六級考試中作文題目是“Join the club”。對于這個作文題目不同學(xué)生角度不同,比如有些人寫加入俱樂部的意義,有人寫加入某一類型俱樂部的經(jīng)歷和感受,比如加入英語俱樂部,棒球俱樂部,健美操俱樂部等,不同的俱樂部帶來簇就不同,由于很難鑒定高頻詞等無法對高作文進行聚類,也就無法展開上述過程。但是可以采用將語言質(zhì)量和內(nèi)容分開評判,將不同內(nèi)容再聚集到不同的大類別中,在每個大類中再運用自動聚類,進行內(nèi)容評判,將不屬于此類相似度低的反饋出來進行再分類或人工評判。因此來看作為計算機自動評分系統(tǒng)內(nèi)容評判的最后一道關(guān)卡,文本聚類方法還是很有作用的。

      5 結(jié)語

      自動作文評分符合大學(xué)英語課程教學(xué)要求,順應(yīng)潮流,尤其是文本自動聚類在其中的應(yīng)用使得英語作文批改更加方便、客觀、快捷,節(jié)省了人力物力,為老師的英語教學(xué)提供了更多便利,也使學(xué)生們的英語寫作能力得到更多鍛煉機會,學(xué)習(xí)不受時間地點限制,能夠向著自主學(xué)習(xí)的方向發(fā)展。雖然此項技術(shù)目前還不夠成熟,但這一技術(shù)已能夠在實際運用中解決問題。我們要探索性地運用它,讓長避短,讓其更好地為大學(xué)英語寫作教學(xué)服務(wù)。

      參考文獻

      [1]文秋芳.“作文內(nèi)容”的構(gòu)念效度研究[J].外語研究,2007(03):66-71.

      [2]葛詩利,陳瀟瀟.國外自動作文評分技術(shù)研究[J].外語電化教學(xué),2007(05):25-29.

      [3]曹亦薇,楊晨.使用潛語義分析的漢語作文自動評分研究[J].考試研究,2007, 3(01):63-71.

      猜你喜歡
      大學(xué)英語
      論朗讀在大學(xué)英語學(xué)習(xí)中的重要性
      考試周刊(2016年84期)2016-11-11 23:12:07
      “慕課”背景下大學(xué)英語ESP課堂教學(xué)模式改革初探
      翻轉(zhuǎn)課堂在大學(xué)英語教學(xué)中的應(yīng)用研究
      多元智能理論指導(dǎo)下的大學(xué)英語翻譯教學(xué)策略探討
      大學(xué)英語教學(xué)中PBL教學(xué)模式的實施研究
      論大學(xué)英語教學(xué)改革與實用翻譯人才的培養(yǎng)
      大學(xué)英語閱讀課程資源開發(fā)中文化意識的培養(yǎng)研究
      大學(xué)英語創(chuàng)造性學(xué)習(xí)共同體模式建構(gòu)案例研究
      校園網(wǎng)絡(luò)背景下大學(xué)英語大班教學(xué)的缺陷探究
      考試周刊(2016年77期)2016-10-09 11:19:12
      情感教學(xué)法在大學(xué)英語課堂教學(xué)中的應(yīng)用
      博客| 泽普县| 肥城市| 木里| 高青县| 龙胜| 名山县| 扬中市| 三门县| 仪征市| 江都市| 新宾| 东阳市| 曲阜市| 信宜市| 昌邑市| 威远县| 中牟县| 山丹县| 怀来县| 从江县| 社旗县| 辛集市| 宾阳县| 丰县| 永寿县| 平阳县| 鸡东县| 镇康县| 招远市| 灵台县| 都兰县| 吴川市| 汝阳县| 廊坊市| 隆子县| 永济市| 舒城县| 新田县| 中方县| 泽普县|