• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      整合型學(xué)習(xí)者語料庫平臺的規(guī)劃與實現(xiàn)

      2009-06-02 06:32毛文偉
      現(xiàn)代教育技術(shù) 2009年9期
      關(guān)鍵詞:中介語S架構(gòu)外語教學(xué)

      毛文偉

      【摘要】建立學(xué)習(xí)者語料庫能為二語習(xí)得等方面的研究提供新的思路和方法。但是,迄今為止的語料庫建設(shè)由于缺乏統(tǒng)一的平臺支持,存在著協(xié)同困難、重復(fù)勞動多以及升級、版權(quán)保護(hù)難等問題。通過構(gòu)建整合型學(xué)習(xí)者語料庫建設(shè)應(yīng)用平臺則能夠極大地提高建設(shè)的效率和效果。

      【關(guān)鍵詞】學(xué)習(xí)者語料庫;外語教學(xué);中介語;B/S架構(gòu);賦碼

      一 序言

      自世界上第一個機(jī)讀英語語料庫——布朗語料庫(Brown)創(chuàng)建以來,語料庫在語法、詞匯、文體等不同領(lǐng)域逐漸得到廣泛應(yīng)用。以推進(jìn)二語習(xí)得或中介語研究為目的的學(xué)習(xí)者語料庫建設(shè)雖稍顯滯后,但近年來也不斷取得新的成果。朗文學(xué)習(xí)者語料庫LLC(Longman Learners Corpus)、學(xué)習(xí)者英語國際語料庫ICLE(International Corpus of Learner English) 以及香港科技大學(xué)語料庫HKUST (Hong Kong University of Science and Technology Corpus)都處在不斷完善和發(fā)展的階段[1]。通過國內(nèi)學(xué)者的多年努力,中國學(xué)習(xí)者英語語料庫CLEC(Chinese Learner English Corpus)、中國大學(xué)學(xué)習(xí)者英語口語語料庫COLSEC(College Learners Spoken English Corpus)和英語專業(yè)學(xué)習(xí)者語料庫CEM(Corpus for English Majors)也先后建成,對我國二語習(xí)得研究和教學(xué)改革起到了巨大的推動作用,成為研究外語教學(xué)規(guī)律不可或缺的基本素材。

      但是,這些語料庫在開發(fā)過程中都沒有特定軟件平臺的支撐1。數(shù)據(jù)由建設(shè)者分頭輸入、處理后再匯總在一起。盡管入門門檻較低,發(fā)布后也沒有日常運(yùn)營開支,但存在著協(xié)同困難、重復(fù)勞動多、升級繁瑣以及版權(quán)保護(hù)方面的難題。隨著因特網(wǎng)技術(shù)的不斷發(fā)展,軟件平臺的體系結(jié)構(gòu)從過去的單用戶發(fā)展到今天的C/S(客戶機(jī)/服務(wù)器)和B/S(瀏覽器/服務(wù)器)架構(gòu)。這些平臺體系的出現(xiàn)為語料庫建設(shè)提供了嶄新的技術(shù)手段。在很大程度上,避免了數(shù)據(jù)分發(fā)、匯總、格式統(tǒng)一以及升級過程中的重復(fù)勞動,提高了建庫效率,降低了出錯概率。本文擬以中國日語學(xué)習(xí)者語料庫CJLC(Chinese Japanese Learners Corpus)的構(gòu)建為例,探討整和型語料庫建設(shè)應(yīng)用平臺的方案設(shè)計及實現(xiàn)。

      二 單用戶系統(tǒng)開發(fā)模式的局限

      如上所述,現(xiàn)有的語料庫多為分散開發(fā)模式。建設(shè)者只須具備基本的字處理軟件使用能力即可參與開發(fā),入門門檻不高。發(fā)布后也無需日常運(yùn)營開支。但是,這種開發(fā)方式也存在著明顯不足。首先,語料庫建設(shè)是一項龐大的工程,為了保證語料的質(zhì)量和開發(fā)效率,需要多人協(xié)同進(jìn)行。由于缺乏平臺支撐,在輸入、校對、標(biāo)注、修正等各個階段,都必須反復(fù)進(jìn)行語料的分發(fā)和匯總,重復(fù)勞動多,也容易出現(xiàn)差錯。其次,為了提高語料的可用性,還需要對語料進(jìn)行標(biāo)注。但是,僅憑字處理軟件或Dreamweaver等HTML編輯工具,很難對語料進(jìn)行深度標(biāo)注。在賦碼過程中,所有錯誤碼和數(shù)據(jù)標(biāo)簽都須手工輸入,既不直觀,加重了標(biāo)注者的負(fù)擔(dān),又提高了出錯的幾率。楊惠中等[2]指出,在中國大學(xué)學(xué)習(xí)者英語口語語料庫(COLSEC)素材的匯總過程中,觀察到了文本標(biāo)簽嵌套錯誤、標(biāo)簽拼寫錯誤、標(biāo)簽設(shè)定不一致、全角半角不一致、錯誤碼設(shè)置過多等諸多問題。這些都需要人工校對加以修正。而在發(fā)布之后,由于語料庫分散在不同用戶手中,使得開發(fā)者難以迅速、高效地對語料進(jìn)行統(tǒng)一升級和擴(kuò)充,也不利于版權(quán)保護(hù)。

      運(yùn)用基于B/S架構(gòu)的整合型語料庫開發(fā)應(yīng)用平臺2以有效地解決這些問題,提高語料庫開發(fā)效率。在B/S結(jié)構(gòu)平臺的支撐下,用戶界面通過IE等WWW瀏覽器來實現(xiàn),數(shù)據(jù)統(tǒng)一存儲在服務(wù)器端,主要事務(wù)邏輯也在服務(wù)器端完成。由此簡化了建庫流程,實現(xiàn)了數(shù)據(jù)的自動分發(fā)和匯總,系統(tǒng)升級更為快捷方便。同時,由于支持Unicode,便于實現(xiàn)多語言界面,也給語料庫的建設(shè)者和使用者帶來了很多方便。

      三 中國日語學(xué)習(xí)者語料庫(CJLC)的總體規(guī)劃

      中國日語學(xué)習(xí)者語料庫(CJLC)為國家社會科學(xué)基金項目“中國日語學(xué)習(xí)者語料庫的建設(shè)與研究”的建設(shè)內(nèi)容之一,于2008年6月啟動。該語料庫以反映中國日語學(xué)習(xí)者的實際學(xué)習(xí)情況為目標(biāo)。通過全面、系統(tǒng)地收集我國高校日語專業(yè)學(xué)生的語料,客觀、翔實、準(zhǔn)確地反映我國日語專業(yè)學(xué)生的語言習(xí)得和發(fā)展?fàn)顩r。它的建成將填補(bǔ)國內(nèi)外在這一領(lǐng)域的空白,為我國高校日語專業(yè)教學(xué)大綱、課程設(shè)置、教學(xué)內(nèi)容、教學(xué)標(biāo)準(zhǔn)、教學(xué)方法、詞匯表的制定和完善以及教學(xué)評估提供客觀依據(jù),并有力地推動兩語研究的發(fā)展。

      本語料庫平臺分為建庫和應(yīng)用兩大子系統(tǒng)。各下屬模塊的具體功能如下表1所示。每個模塊都具有不同界面,需要特定權(quán)限方能顯示和進(jìn)入。系統(tǒng)管理員根據(jù)實際需要為用戶靈活分配權(quán)限,通過網(wǎng)絡(luò)完成輸入、標(biāo)注、校對、檢索和管理等各項工作。由于數(shù)據(jù)庫存在于服務(wù)器端,可以實現(xiàn)多用戶共享,所以數(shù)據(jù)的輸入和標(biāo)注等不同階段的工作可以同步進(jìn)行,互不干擾。當(dāng)然,對于某一特定語料來說,還是需要按照一定流程完成輸入、標(biāo)注等一系列工作(詳見圖1)。

      在互聯(lián)網(wǎng)應(yīng)用的初期,開發(fā)者多使用C或Perl等CGI語言進(jìn)行Web開發(fā)?,F(xiàn)在,已有C#/ASP.NET、JSP和PHP5等多種方案可供選擇。本課題組選擇了AMP(Apache/MySQL/PHP)解決方案,即以PHP5編寫語料庫開發(fā)平臺,MySQL作為數(shù)據(jù)庫,Apache為Web服務(wù)器發(fā)布軟件。這些都是遵循GPL的開放源碼軟件,不必繳納軟件使用費。這在很大程度上降低了開發(fā)費用。同時,又擁有豐富的資源可供使用、修改或重組。在成本和可用資源方面,勝過了C#/ASP.NET/IIS解決方案。

      猜你喜歡
      中介語S架構(gòu)外語教學(xué)
      The Book Review of Methods of Critical Discourse Analysis
      Washback Studies Used in Practice Teaching
      The Connection Between “Wolf Child” Story and “Poverty of Stimulus” Argument
      B/S架構(gòu)下的學(xué)生信息管理系統(tǒng)的設(shè)計
      從認(rèn)知心理角度分析中介語石化的成因
      文化適應(yīng)視角下的中介語傾向性探討
      基于ASP技術(shù)下的大學(xué)生跳蚤書街平臺的設(shè)計與實施
      基于B/S架構(gòu)的高校實驗管理平臺的設(shè)計與實現(xiàn)
      A Rough Research on Numerical Cultural Connotations between English and Chinese
      外語學(xué)習(xí)中中介語的形成與發(fā)展
      襄樊市| 亚东县| 贺州市| 邵阳市| 松溪县| 宝应县| 西青区| 区。| 高清| 静安区| 遂宁市| 广水市| 南木林县| 怀来县| 霞浦县| 济源市| 辉县市| 鹤峰县| 明溪县| 子长县| 楚雄市| 太康县| 肇东市| 伽师县| 阿拉善右旗| 鹤峰县| 通辽市| 深州市| 科技| 彩票| 淄博市| 封开县| 西宁市| 彰化市| 克拉玛依市| 苏尼特左旗| 牙克石市| 贡觉县| 东乡县| 饶河县| 临猗县|