• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      語(yǔ)料

      • 基于雙判別器的漢泰偽平行語(yǔ)料生成方法
        譯模型獲取偽平行語(yǔ)料,這種方式需要額外訓(xùn)練一個(gè)將目標(biāo)語(yǔ)言翻譯為源語(yǔ)言的翻譯模型,該翻譯模型可以由少量平行語(yǔ)料或單語(yǔ)語(yǔ)料訓(xùn)練得到。但在漢泰語(yǔ)言對(duì)中,由于缺乏平行語(yǔ)料,故而不能訓(xùn)練出高質(zhì)量的回譯模型,因此得到的偽平行語(yǔ)料也較差。文獻(xiàn)[2-3]中使用迭代回譯的方式改進(jìn)回譯模型,對(duì)兩個(gè)翻譯方向相反的翻譯模型進(jìn)行回譯,并將回譯得到的偽平行語(yǔ)料與干凈平行語(yǔ)料混合,共同輸入到另一個(gè)翻譯模型進(jìn)行訓(xùn)練,以這樣的方法來(lái)迭代提高兩個(gè)回譯模型的性能。其生成的偽平行語(yǔ)料質(zhì)量有所提升

        現(xiàn)代電子技術(shù) 2023年20期2023-10-19

      • 基于回譯和比例抽取孿生網(wǎng)絡(luò)篩選的漢越平行語(yǔ)料擴(kuò)充方法*
        缺少高質(zhì)量的雙語(yǔ)語(yǔ)料,效果并不理想。因此,如何高效地?cái)U(kuò)充語(yǔ)料規(guī)模,成為低資源神經(jīng)機(jī)器翻譯研究中亟需解決的問(wèn)題。針對(duì)此問(wèn)題,研究人員提出了多種數(shù)據(jù)增強(qiáng)方法,通過(guò)有限的語(yǔ)料資源擴(kuò)充雙語(yǔ)語(yǔ)料規(guī)模。早期的工作主要利用人工的方式進(jìn)行語(yǔ)料擴(kuò)充,但效率較低。近年來(lái),隨著深度學(xué)習(xí)技術(shù)的發(fā)展,利用深度學(xué)習(xí)方法來(lái)擴(kuò)充雙語(yǔ)語(yǔ)料成為有效途徑?;谏疃葘W(xué)習(xí)的數(shù)據(jù)增強(qiáng)方法主要分為生成式和抽取式。生成式數(shù)據(jù)增強(qiáng)方法包括:回譯(back-translation),將目標(biāo)端的單語(yǔ)語(yǔ)料通過(guò)反

        計(jì)算機(jī)工程與科學(xué) 2022年10期2022-10-28

      • 英語(yǔ)電影中的“四語(yǔ)”
        語(yǔ)音? 語(yǔ)境? 語(yǔ)料 語(yǔ)感 英語(yǔ)核心素養(yǎng)英文電影作為融視、聽(tīng)、說(shuō)于一體的媒介,能為學(xué)生創(chuàng)造最佳的英語(yǔ)學(xué)習(xí)環(huán)境。英文電影語(yǔ)言內(nèi)容豐富、地道、通俗,是最接近生活的會(huì)話語(yǔ)言,它彌補(bǔ)了一些課本、語(yǔ)言教學(xué)片刻意為教學(xué)編排的語(yǔ)言材料的不足,為學(xué)生提供了更為廣泛、生動(dòng)、逼真的視覺(jué)直觀情景,使學(xué)生有身臨其境的感覺(jué),充分調(diào)動(dòng)了學(xué)生視聽(tīng)說(shuō)的積極性,提高英語(yǔ)聽(tīng)說(shuō)能力;有利于學(xué)生的英語(yǔ)思維和理解;有利于學(xué)生感受真實(shí)的交際語(yǔ)言,提高交際能力;有利于學(xué)生增強(qiáng)跨文化學(xué)習(xí)的意識(shí)。英文電影

        快樂(lè)學(xué)習(xí)報(bào)·教師周刊 2022年34期2022-07-16

      • 擴(kuò)大漢語(yǔ)中介語(yǔ)語(yǔ)料庫(kù)語(yǔ)料來(lái)源的途徑*
        育研究院提 要 語(yǔ)料分布是語(yǔ)料平衡性的集中體現(xiàn),與語(yǔ)料庫(kù)的功能與使用價(jià)值密切相關(guān),是語(yǔ)料庫(kù)建設(shè)中一個(gè)十分重要的問(wèn)題。以往的漢語(yǔ)中介語(yǔ)語(yǔ)料庫(kù)建設(shè)并未很好地解決這一問(wèn)題,對(duì)基于語(yǔ)料庫(kù)的漢語(yǔ)教學(xué)與研究產(chǎn)生了相當(dāng)程度的影響。這一問(wèn)題的產(chǎn)生與語(yǔ)料庫(kù)建設(shè)者對(duì)語(yǔ)料庫(kù)的認(rèn)識(shí)和建庫(kù)經(jīng)驗(yàn)有關(guān),也與國(guó)際中文教育形勢(shì)的發(fā)展有關(guān),與不同國(guó)家和中國(guó)的地緣距離、歷史、政治、經(jīng)濟(jì)、貿(mào)易、外交、文化、教育等因素密切相關(guān)。該問(wèn)題可從國(guó)內(nèi)、國(guó)外兩方面加以解決:通過(guò)國(guó)內(nèi)漢語(yǔ)教學(xué)單位廣泛收集目的語(yǔ)

        國(guó)際中文教育(中英文) 2022年2期2022-07-14

      • 蒙古文日常問(wèn)答語(yǔ)料數(shù)據(jù)集
        在約 2萬(wàn)條問(wèn)答語(yǔ)料上使用序列到序列(Sequence to Sequence,Seq2Seq)框架實(shí)現(xiàn)的。譚銘言[2]利用構(gòu)建的蒙古文知識(shí)圖譜以及命名實(shí)體識(shí)別系統(tǒng)和關(guān)系抽取系統(tǒng),搭建了面向旅游領(lǐng)域的蒙古文問(wèn)答系統(tǒng)。王光義[3]構(gòu)建了32156條紀(jì)檢監(jiān)察領(lǐng)域的蒙古文問(wèn)答語(yǔ)料,并通過(guò)問(wèn)句意圖識(shí)別和問(wèn)答匹配兩個(gè)模塊實(shí)現(xiàn)了蒙古文問(wèn)答系統(tǒng)。問(wèn)答語(yǔ)料資源的稀缺是影響蒙古文自動(dòng)問(wèn)答技術(shù)發(fā)展的重要因素之一。因此,本文通過(guò)獲取開(kāi)源中文問(wèn)答語(yǔ)料庫(kù)并通過(guò)篩選、翻譯、校正等方法

        中國(guó)科學(xué)數(shù)據(jù)(中英文網(wǎng)絡(luò)版) 2022年2期2022-07-03

      • 歷時(shí)追蹤性英語(yǔ)學(xué)習(xí)者語(yǔ)料庫(kù)的建設(shè)研究
        )一、英語(yǔ)學(xué)習(xí)者語(yǔ)料庫(kù)的建設(shè)現(xiàn)狀語(yǔ)料庫(kù)(corpus)是指以電子文本形式收集和存儲(chǔ)的語(yǔ)言材料,可以通過(guò)計(jì)算機(jī)進(jìn)行標(biāo)注、檢索和分析,為研究語(yǔ)言使用規(guī)律提供重要的語(yǔ)料基礎(chǔ)?,F(xiàn)代信息技術(shù)的發(fā)展極大地促進(jìn)了語(yǔ)料庫(kù)的研究,出現(xiàn)了各種專門用途的語(yǔ)料庫(kù)。英語(yǔ)學(xué)習(xí)者語(yǔ)料庫(kù)收集英語(yǔ)學(xué)習(xí)者的語(yǔ)言輸出材料,是研究英語(yǔ)中介語(yǔ)(interlanguage)[1]特點(diǎn)的重要數(shù)據(jù)。通過(guò)定量分析大量的英語(yǔ)中介語(yǔ)語(yǔ)料,可以對(duì)英語(yǔ)學(xué)習(xí)機(jī)制有更深刻的理解。英語(yǔ)學(xué)習(xí)者語(yǔ)料庫(kù)在過(guò)去30年里迅速發(fā)展

        安順學(xué)院學(xué)報(bào) 2022年2期2022-05-12

      • 普通話語(yǔ)句音強(qiáng)變化模式—基于SCS 和DBS 語(yǔ)料的分析
        nce,SCS)語(yǔ)料與中文標(biāo)準(zhǔn)女生音庫(kù)(Data-Baker Sentence,DBS)語(yǔ)料兩種句子錄音材料,使用語(yǔ)音分析軟件提取出每個(gè)句子100 個(gè)點(diǎn)位上的音強(qiáng),對(duì)句子音強(qiáng)的整體變化模式、變化速率、最值等進(jìn)行量化考察,以期促進(jìn)對(duì)句子音強(qiáng)變化模式的認(rèn)識(shí)。1 語(yǔ)料與方法1.1 SCS 語(yǔ)料與DBS 語(yǔ)料SCS 語(yǔ)料的句子多為日常生活內(nèi)容,其中包括陳述句40 個(gè),疑問(wèn)句38 個(gè),感嘆句和祈使句各11個(gè),共100 句;單句音節(jié)數(shù)量最少7 個(gè),最多32 個(gè)(均值1

        智能計(jì)算機(jī)與應(yīng)用 2022年2期2022-05-11

      • 基于索引功能的英語(yǔ)詞匯語(yǔ)料微本設(shè)計(jì)
        變化,有了豐富的語(yǔ)料支持和教師的合理引導(dǎo),詞匯學(xué)習(xí)變?yōu)閷W(xué)生自己的探索過(guò)程。筆者所教的非英語(yǔ)專業(yè)大二學(xué)生大多為工科,英語(yǔ)基礎(chǔ)中等,自主學(xué)習(xí)能力較強(qiáng),基于語(yǔ)料庫(kù)索引功能的詞匯教學(xué)可以有效提高學(xué)生的學(xué)習(xí)積極性和效率,讓學(xué)生更加有語(yǔ)境意識(shí)、詞匯搭配意識(shí)、自我有效驗(yàn)證意識(shí)。在20世紀(jì)80年代末期John Sinclair提出外語(yǔ)教學(xué)可以從學(xué)習(xí)詞匯入手。他認(rèn)為以往的詞匯教學(xué)僅僅是語(yǔ)法教學(xué)的附屬品、詞的選擇沒(méi)有代表性和科學(xué)性。Tim Johns開(kāi)創(chuàng)性地提倡數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí),

        當(dāng)代教研論叢 2022年12期2022-02-14

      • 需求導(dǎo)向的漢語(yǔ)繼承語(yǔ)學(xué)習(xí)者語(yǔ)料庫(kù)建設(shè)研究*
        要 建立學(xué)習(xí)者語(yǔ)料庫(kù)并基于語(yǔ)料庫(kù)進(jìn)行多維研究,是近年來(lái)國(guó)內(nèi)外第二語(yǔ)言教學(xué)和外語(yǔ)教學(xué)研究的熱點(diǎn)內(nèi)容。國(guó)內(nèi)外已建立的學(xué)習(xí)者語(yǔ)料庫(kù)不少,但都無(wú)法滿足漢語(yǔ)繼承語(yǔ)的教學(xué)及研究需求。本研究著眼于語(yǔ)料庫(kù)的使用需求,從漢語(yǔ)繼承語(yǔ)學(xué)習(xí)者語(yǔ)料庫(kù)建設(shè)的必要性,語(yǔ)料的追蹤性、同質(zhì)性、真實(shí)性、共享性、可比性以及平衡性等方面探討漢語(yǔ)繼承語(yǔ)學(xué)習(xí)者語(yǔ)料庫(kù)的建設(shè),以期能為漢語(yǔ)繼承語(yǔ)學(xué)習(xí)者語(yǔ)料庫(kù)的建設(shè)提供參考,為中介語(yǔ)對(duì)比分析提供新的角度和數(shù)據(jù)。一、引言近年來(lái),學(xué)習(xí)者語(yǔ)料庫(kù)的作用日益受到重

        國(guó)際中文教育(中英文) 2022年2期2022-02-04

      • 基于歸一化點(diǎn)向互信息的低資源平行語(yǔ)料過(guò)濾方法*
        互信息算法;平行語(yǔ)料;對(duì)齊信息0 引言神經(jīng)機(jī)器翻譯是數(shù)據(jù)驅(qū)動(dòng)模型,提高平行語(yǔ)料的規(guī)模和質(zhì)量是提升神經(jīng)機(jī)器翻譯性能最簡(jiǎn)單有效的方法。然而,通過(guò)非人工方式得到的平行語(yǔ)料,其規(guī)模足夠但質(zhì)量不佳。平行語(yǔ)料質(zhì)量不佳的情況下,提高其規(guī)模并不會(huì)讓模型有較大的性能提升甚至存在性能下降的情況,因此提高平行語(yǔ)料的質(zhì)量成了提升模型性能的關(guān)鍵,這使得平行語(yǔ)料過(guò)濾方法變得越來(lái)越重要。語(yǔ)料過(guò)濾方法是從一個(gè)大規(guī)模的、含有噪聲的平行語(yǔ)料中,過(guò)濾出一個(gè)較高質(zhì)量的子語(yǔ)料,并以此來(lái)提高翻譯模型

        通信技術(shù) 2021年12期2022-01-25

      • 海量標(biāo)注語(yǔ)料庫(kù)智能構(gòu)建系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
        術(shù)的進(jìn)步以及大型語(yǔ)料庫(kù)的不斷豐富,中文信息處理領(lǐng)域取得了豐富的研究成果。這其中尤為突出的是基于機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等方法的深入應(yīng)用,在中文分詞、詞性標(biāo)注、語(yǔ)義分析、主題提取、自動(dòng)問(wèn)答系統(tǒng)、機(jī)器翻譯、文本聚類等方面都取得了較好的效果。但對(duì)于半監(jiān)督、有監(jiān)督的算法而言,網(wǎng)絡(luò)模型的訓(xùn)練往往需要海量正確標(biāo)注的語(yǔ)料作為樣本,通過(guò)學(xué)習(xí)之后才能具備對(duì)未知數(shù)據(jù)的預(yù)測(cè)能力。例如最新的自然語(yǔ)言深度學(xué)習(xí)模型GPT-3[1],該模型通過(guò)對(duì)將近0.5萬(wàn)億個(gè)單詞進(jìn)行預(yù)訓(xùn)練,可以很好地完成

        現(xiàn)代計(jì)算機(jī) 2021年33期2022-01-21

      • 基于流程控制的漢語(yǔ)篇章結(jié)構(gòu)語(yǔ)料協(xié)同標(biāo)注系統(tǒng)*
        模的篇章結(jié)構(gòu)分析語(yǔ)料資源庫(kù)是進(jìn)行科學(xué)有效的篇章結(jié)構(gòu)分析的基礎(chǔ)?,F(xiàn)有的篇章語(yǔ)料資源中,英文的主要包括賓州篇章樹(shù)庫(kù)(PDTB)[11]、修辭結(jié)構(gòu)理論篇章樹(shù)庫(kù)(RST-DT)等[12],中文的主要包括基于連接依存樹(shù)的漢語(yǔ)篇章樹(shù)庫(kù)(CDTB)[13]和借鑒RST標(biāo)注的漢語(yǔ)篇章語(yǔ)料庫(kù)(CJPL)[14]等。就中文語(yǔ)料來(lái)說(shuō),主要存在兩個(gè)問(wèn)題。第一,絕對(duì)數(shù)量不足,相比英文語(yǔ)料的PDTB標(biāo)注的2304篇文章,CDTB由500個(gè)文檔組成,標(biāo)注了7310個(gè)關(guān)系,而CJPL僅完

        計(jì)算機(jī)與數(shù)字工程 2021年12期2022-01-15

      • 基于語(yǔ)種相似性挖掘的神經(jīng)機(jī)器翻譯語(yǔ)料庫(kù)擴(kuò)充方法
        大量高質(zhì)量的雙語(yǔ)語(yǔ)料作為訓(xùn)練數(shù)據(jù)。但是,諸如維吾爾語(yǔ)、哈薩克語(yǔ)等這些小語(yǔ)種,提供足夠多的雙語(yǔ)數(shù)據(jù)比較困難。甚至有些語(yǔ)言對(duì)幾乎沒(méi)有任何機(jī)器翻譯雙語(yǔ)平行語(yǔ)料,這種情況下通用框架的NMT就顯得非常乏力。隨著神經(jīng)機(jī)器翻譯技術(shù)的不斷進(jìn)步,學(xué)者們漸漸開(kāi)始加強(qiáng)對(duì)低資源語(yǔ)言機(jī)器翻譯問(wèn)題的探索與研究。Zoph等[8]用大量的英法雙語(yǔ)語(yǔ)料訓(xùn)練出模型之后,在烏茲別克語(yǔ)-英語(yǔ)和土耳其語(yǔ)-英語(yǔ)雙語(yǔ)機(jī)器翻譯語(yǔ)料上分別進(jìn)行進(jìn)一步優(yōu)化,成功提升了烏茲別克語(yǔ)到英語(yǔ)以及土耳其語(yǔ)到英語(yǔ)的翻譯質(zhì)

        計(jì)算機(jī)應(yīng)用 2021年11期2021-12-07

      • 一種循環(huán)迭代的智能語(yǔ)料標(biāo)注系統(tǒng)
        系統(tǒng)研發(fā)過(guò)程中,語(yǔ)料的標(biāo)注和校對(duì)工作一直需要消耗大量的人力和時(shí)間。眾所周知,人工智能領(lǐng)域的算法模型需要通過(guò)訓(xùn)練大量的語(yǔ)料得到,這些訓(xùn)練語(yǔ)料被事先進(jìn)行標(biāo)注,往往通常都是人工標(biāo)注,標(biāo)注過(guò)程需要耗費(fèi)大量人力和時(shí)間。因?yàn)闃?biāo)注的過(guò)程實(shí)際上是對(duì)語(yǔ)料中語(yǔ)言單位的特征進(jìn)行解釋的過(guò)程,不同的人可能會(huì)有不同的解釋結(jié)果,所以語(yǔ)料標(biāo)注帶有很大的主觀性。不同標(biāo)注者的知識(shí)結(jié)構(gòu)和語(yǔ)法理論也各不相同,如果只以少數(shù)人的標(biāo)注結(jié)果作為訓(xùn)練語(yǔ)料,訓(xùn)練出的算法就可能有較大的誤差。本文研究旨在積累歷

        廣東通信技術(shù) 2021年10期2021-11-08

      • 語(yǔ)料選用特征看文言文閱讀命題基本共識(shí)
        楊和平摘 要 語(yǔ)料,是構(gòu)成試題的關(guān)鍵元素。以15個(gè)省市試卷中的文言文語(yǔ)料為樣本,從語(yǔ)料的數(shù)量特征、來(lái)源特征、內(nèi)容特征和應(yīng)用特征四個(gè)維度進(jìn)行數(shù)量分析,我們發(fā)現(xiàn)文言文命題的語(yǔ)料選擇有一些基本特征和基本共識(shí)。關(guān)鍵詞 文言文;語(yǔ)料;維度;文言文閱讀命題語(yǔ)料,即試題的語(yǔ)言材料、閱讀材料,是語(yǔ)文學(xué)習(xí)的核心資源,構(gòu)成試題的關(guān)鍵元素。語(yǔ)料選用的特征和質(zhì)量,決定了試題的方向和質(zhì)量。本文以2021年全國(guó)15省市的15套試題中文言文(不含單列詩(shī)詞閱讀)選用語(yǔ)料為例,探討文言文語(yǔ)

        中學(xué)語(yǔ)文(學(xué)生版) 2021年10期2021-10-31

      • 守護(hù)語(yǔ)文教學(xué)的核心和初心
        心和初心;語(yǔ)感;語(yǔ)料;語(yǔ)用;核心素養(yǎng)《普通高中語(yǔ)文課程標(biāo)準(zhǔn)》2017年頒布后,2020年又做了修訂。該課程標(biāo)準(zhǔn)繼續(xù)明確了語(yǔ)文課程的性質(zhì),并提出了語(yǔ)文課程的核心素養(yǎng)。其中,核心素養(yǎng)備受關(guān)注,不僅高中學(xué)段圍繞它開(kāi)展教研活動(dòng),初中乃至小學(xué)也把它作為組織公開(kāi)教學(xué)的指向標(biāo)。但是,核心素養(yǎng)的四個(gè)要素(語(yǔ)言、思維、審美、文化)之間是什么關(guān)系?它們與課程性質(zhì)又是什么關(guān)系?思考的人可能不多。這樣就容易出現(xiàn)將核心素養(yǎng)的四個(gè)要素簡(jiǎn)單并列、機(jī)械拆分甚至相互對(duì)立的現(xiàn)象,以及弱化原有

        中學(xué)語(yǔ)文·教師版 2021年7期2021-09-13

      • 面向低資源神經(jīng)機(jī)器翻譯的回譯方法
        數(shù)量的高質(zhì)量平行語(yǔ)料往往難以獲取.相對(duì)于平行語(yǔ)料而言,單語(yǔ)數(shù)據(jù)廣泛地存在于互聯(lián)網(wǎng)上,往往更容易獲取,因此利用單語(yǔ)數(shù)據(jù)提高低資源神經(jīng)機(jī)器翻譯質(zhì)量成為一種常用的手段[4-8].下一個(gè)目標(biāo)語(yǔ)言單詞可通過(guò)平行語(yǔ)料訓(xùn)練得到的神經(jīng)機(jī)器翻譯模型,根據(jù)源語(yǔ)言句子和之前的目標(biāo)語(yǔ)言單詞預(yù)測(cè)得到;而語(yǔ)言模型可以根據(jù)之前的目標(biāo)語(yǔ)言單詞給出下一個(gè)目標(biāo)語(yǔ)言單詞的概率分布,并且其只需要單語(yǔ)數(shù)據(jù)訓(xùn)練得到.因此,通過(guò)語(yǔ)言模型來(lái)利用大規(guī)模的單語(yǔ)數(shù)據(jù)是一個(gè)自然的方式.Gulcehre等[4]提

        廈門大學(xué)學(xué)報(bào)(自然科學(xué)版) 2021年4期2021-06-22

      • 關(guān)于卞之琳研究的境外語(yǔ)料分析
        :卞之琳 境外 語(yǔ)料著名的中國(guó)現(xiàn)代詩(shī)人卞之琳祈通中西、譽(yù)滿全球,尤其在西方有大量擁躉和極高的知名度,其名字赫然出現(xiàn)在大英百科全書(shū)2010年卷第1頁(yè)上。作為20世紀(jì)中國(guó)最具獨(dú)創(chuàng)性的翻譯家之一,卞之琳因翻譯莎士比亞(Shakespeare)、艾略特(T.S.Eliot)、奧登(W.H.Auden)、安德烈·紀(jì)德(André Gide)的作品而聞名中國(guó)。尤其是他的翻譯風(fēng)格深受波德萊爾(Baudelaire)和魏爾倫(Verlaine)的影響,甚至詩(shī)歌作品自譯也同

        文學(xué)教育 2021年5期2021-06-15

      • 小學(xué)英語(yǔ)閱讀教學(xué)之有效探究
        策略;創(chuàng)造思維;語(yǔ)料中圖分類號(hào):G623.31 ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A ? ? ?文章編號(hào):0493-2099(2021)15-0072-02Effective Exploration of English Reading Teaching in Primary Schools(Tongzhou Primary School, Tongzhou District, Nantong City, Jiangsu Province,China) ZHAO Ch

        天津教育·下 2021年5期2021-06-15

      • 方言語(yǔ)法研究:語(yǔ)料、方法、體系
        :方言語(yǔ)法研究在語(yǔ)料獲取、方法選擇、體系建立方面都有自己特殊之處。方言語(yǔ)法語(yǔ)料獲取包括內(nèi)省語(yǔ)料、書(shū)面語(yǔ)料、網(wǎng)絡(luò)語(yǔ)料、前人語(yǔ)料。研究者需要在多方獲取材料的基礎(chǔ)上展開(kāi)研究。研究者還需要以嚴(yán)謹(jǐn)?shù)膽B(tài)度對(duì)待語(yǔ)料,如果對(duì)語(yǔ)料沒(méi)有把握,應(yīng)該及時(shí)調(diào)查,力求語(yǔ)料真實(shí)可靠。方言語(yǔ)法方法選擇包括通用方法、學(xué)科方法、專門方法。研究者需要根據(jù)特定的需要選擇合適的研究方法。方言語(yǔ)法體系應(yīng)該在理論建設(shè)、特色展示以及問(wèn)題延伸方面體現(xiàn)出優(yōu)勢(shì),尤其是在理論建設(shè)方面,既可以驗(yàn)證、補(bǔ)充已有理論,

        上海師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版) 2021年1期2021-02-22

      • 英語(yǔ)會(huì)話中停頓特征的研究
        次課堂英語(yǔ)會(huì)話的語(yǔ)料進(jìn)行了研究。通過(guò)對(duì)比有聲停頓及無(wú)聲停頓,和各個(gè)會(huì)話者在會(huì)話中停頓的頻率和位置,研究發(fā)現(xiàn)會(huì)話過(guò)程中無(wú)聲停頓的頻率遠(yuǎn)大于有聲停頓,而口語(yǔ)流利者以及有豐富二語(yǔ)語(yǔ)言經(jīng)驗(yàn)者的停頓位置更有利于對(duì)話的流利性?!娟P(guān)鍵詞】停頓;語(yǔ)料;會(huì)話1引言會(huì)話分析,也稱談話分析。顧名思義,會(huì)話分析是研究人類會(huì)話的語(yǔ)言。其研究對(duì)象包括日常生活會(huì)話和機(jī)構(gòu)性談話?,F(xiàn)在一般所說(shuō)的會(huì)話分析是指對(duì)會(huì)話的研究,尤其是對(duì)日常會(huì)話的研究。從語(yǔ)言學(xué)的角度來(lái)說(shuō),會(huì)話分析即是指語(yǔ)言學(xué)對(duì)會(huì)話

        紅豆教育 2021年29期2021-01-21

      • 大別山紅色資源漢英平行語(yǔ)料庫(kù)建設(shè)的構(gòu)想
        享。經(jīng)科學(xué)取樣、語(yǔ)料的校對(duì)和修訂,及借助計(jì)算機(jī)分析加工的雙語(yǔ)平行語(yǔ)料庫(kù),就是很好的語(yǔ)言資源支撐和科技引領(lǐng)。關(guān)鍵詞: 大別山精神; 平行語(yǔ)料庫(kù); 語(yǔ)料中圖分類號(hào): H315.9? ? ? ? ? 文獻(xiàn)標(biāo)志碼: A? ? ? ? ? 文章編號(hào): 1671-2153(2020)04-0093-05大別山是中國(guó)共產(chǎn)黨重要的建黨基地,也是中國(guó)革命走向全面勝利的戰(zhàn)略轉(zhuǎn)折地,創(chuàng)造了“28年紅旗不倒”的奇跡,留下了厚重的紅色文化遺產(chǎn),孕育了“堅(jiān)守信念、胸懷全局、團(tuán)結(jié)奮進(jìn)、

        寧波職業(yè)技術(shù)學(xué)院學(xué)報(bào) 2020年4期2020-12-24

      • 英語(yǔ)課堂應(yīng)用真實(shí)語(yǔ)料之實(shí)證研究成果回顧
        堂教學(xué)中使用真實(shí)語(yǔ)料是教師及教育研究者關(guān)注的熱點(diǎn)之一。從國(guó)內(nèi)外真實(shí)語(yǔ)料研究的總體狀況來(lái)看,絕大部分研究是理論介紹、實(shí)踐操作或現(xiàn)狀反思,實(shí)證研究相對(duì)較少。鑒于此,我們嘗試檢索整理國(guó)內(nèi)外有關(guān)真實(shí)語(yǔ)料在高校英語(yǔ)作為二語(yǔ)習(xí)得課堂的應(yīng)用的實(shí)證研究,梳理這些研究的結(jié)論,提出研究方向上的建議,以期為真實(shí)語(yǔ)料相關(guān)研究提供啟示。我們回顧分析的實(shí)證研究成果包括中文文獻(xiàn)和英文文獻(xiàn)。中文文獻(xiàn)為中國(guó)知網(wǎng)收錄的2002—2018年的15篇有關(guān)真實(shí)語(yǔ)料在高校英語(yǔ)作為二語(yǔ)言習(xí)得課堂的應(yīng)用

        邵陽(yáng)學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版) 2020年6期2020-02-26

      • 淺談視頻語(yǔ)料在對(duì)外漢語(yǔ)教學(xué)中的運(yùn)用
        漢語(yǔ)。二、“視頻語(yǔ)料”的理論概述(一)視頻語(yǔ)料的定義語(yǔ)料是指生活中真實(shí)的語(yǔ)言材料,包括紙質(zhì)和音像材料中出現(xiàn)的語(yǔ)句篇章,以及日常交際中人們說(shuō)的句子等等。視頻語(yǔ)料是包含特定目的語(yǔ)知識(shí)的、以視頻形式存在的真實(shí)的語(yǔ)言樣本,其來(lái)源為電影、電視劇、動(dòng)畫(huà)片、電視節(jié)目、歌曲、舞蹈、廣告、宣傳片和漢語(yǔ)學(xué)習(xí)網(wǎng)站等視頻資源。(二)對(duì)外漢語(yǔ)教學(xué)中運(yùn)用的視頻語(yǔ)料的要求網(wǎng)絡(luò)上的視頻語(yǔ)料相對(duì)分散、時(shí)長(zhǎng)不等、良莠不齊,因此,運(yùn)用在對(duì)外漢語(yǔ)教學(xué)中的視頻語(yǔ)料時(shí)要注意以下事項(xiàng)。1、在視頻語(yǔ)料

        長(zhǎng)江叢刊 2019年25期2019-11-15

      • 可比語(yǔ)料庫(kù)構(gòu)建與可比度計(jì)算研究綜述
        :論文描述了可比語(yǔ)料庫(kù)的基本構(gòu)建方法,包括使用已有語(yǔ)料庫(kù)、網(wǎng)絡(luò)資源和復(fù)合方法的三種類型。隨后對(duì)單語(yǔ)種可比語(yǔ)料和多語(yǔ)種可比語(yǔ)料的可比度計(jì)算問(wèn)題進(jìn)行了闡釋和分析。結(jié)果認(rèn)為,可比語(yǔ)料庫(kù)的構(gòu)建需要根據(jù)具體的應(yīng)用場(chǎng)景和需求進(jìn)行設(shè)計(jì)實(shí)施,根據(jù)不同應(yīng)用場(chǎng)景可比語(yǔ)料的可比度需作具體描述和相應(yīng)規(guī)定,并設(shè)定合理的度量指標(biāo)。關(guān)鍵詞:可比語(yǔ)料庫(kù);可比度中圖分類號(hào):G434? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2019)23-0224-04開(kāi)放科學(xué)(資源服務(wù))

        電腦知識(shí)與技術(shù) 2019年23期2019-11-03

      • 基于置信度的藏文人名識(shí)別的主動(dòng)學(xué)習(xí)模型研究
        -2]。根據(jù)標(biāo)注語(yǔ)料的規(guī)模,機(jī)器學(xué)習(xí)又可以分為監(jiān)督式機(jī)器學(xué)習(xí)(訓(xùn)練語(yǔ)料全部標(biāo)注)、半監(jiān)督式機(jī)器學(xué)習(xí)(訓(xùn)練語(yǔ)料部分標(biāo)注)和無(wú)監(jiān)督式機(jī)器學(xué)習(xí)(無(wú)標(biāo)注語(yǔ)料)三種,其中,基于大規(guī)模標(biāo)注語(yǔ)料的監(jiān)督式學(xué)習(xí)方法的命名實(shí)體識(shí)別性能優(yōu)于半監(jiān)督和無(wú)監(jiān)督方法,是常用的命名實(shí)體識(shí)別方法。主動(dòng)學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)子領(lǐng)域,其主要工作是有針對(duì)性地選擇一些信息量大的語(yǔ)料進(jìn)行人工標(biāo)注,進(jìn)而通過(guò)較少的標(biāo)注語(yǔ)料實(shí)現(xiàn)較好的模型學(xué)習(xí)效果,從而最大限度地降低語(yǔ)料標(biāo)注成本[3-4]。目前主動(dòng)學(xué)習(xí)方法已

        中文信息學(xué)報(bào) 2019年8期2019-09-05

      • 從高頻詞等級(jí)相關(guān)角度探析《紅樓夢(mèng)》作者
        方法”,測(cè)量各份語(yǔ)料之間在詞型等級(jí)方面的相關(guān)度,推斷“存疑文獻(xiàn)”的作者信息。這種算法分為三個(gè)步驟:(1) 首先,對(duì)于各份語(yǔ)料,詞型均按照出現(xiàn)頻次(即詞型的詞例數(shù))遞減順序排列;(2) 然后,對(duì)于已經(jīng)排序的詞型按照“頻序法”確定等級(jí),把出現(xiàn)頻次最高的詞型等級(jí)定為1,次高的詞型等級(jí)定為2,……依次類推,頻次相等的詞型為一個(gè)等級(jí),以其在語(yǔ)料中詞頻序值為等級(jí)[18]。(3) 接下來(lái),計(jì)算各份語(yǔ)料之間高頻詞等級(jí)的相關(guān)度。相關(guān)度的計(jì)算方法采用“斯皮爾曼等級(jí)相關(guān)”,如式

        中文信息學(xué)報(bào) 2018年11期2018-12-20

      • 瀕危語(yǔ)言與漢語(yǔ)平行語(yǔ)料庫(kù)動(dòng)態(tài)構(gòu)建技術(shù)研究
        方位的語(yǔ)言記錄、語(yǔ)料處理和語(yǔ)言信息保存。作為低資源語(yǔ)言[2-4],瀕危語(yǔ)言很多沒(méi)有文字,以口語(yǔ)的形式存在,長(zhǎng)篇自然話語(yǔ)的記錄極為有限,能找到的錄音人有限,不足以反映一種語(yǔ)言的基本面貌。同時(shí),自然口語(yǔ)的人工標(biāo)注、轉(zhuǎn)錄、對(duì)應(yīng)通用語(yǔ)言的翻譯工作量巨大。從機(jī)器翻譯的角度上去分析,建立比較好的語(yǔ)言模型,離不開(kāi)豐富語(yǔ)料庫(kù)的支持[5]。因此,如何建立瀕危語(yǔ)言的跨語(yǔ)言平行語(yǔ)料庫(kù)是研究人員們面臨的又一重要課題。呂蘇語(yǔ)作為一種瀕危語(yǔ)言,目前只有雅礱和尼亞格楚江沿岸的大約7 0

        計(jì)算機(jī)應(yīng)用與軟件 2018年9期2018-09-26

      • 小型英漢平行語(yǔ)料庫(kù)的建設(shè)研究與應(yīng)用
        50021)1 語(yǔ)料庫(kù)介紹1.1 語(yǔ)料庫(kù)的分類語(yǔ)料庫(kù)的英文為corpus,從字面上的意思講,即收集語(yǔ)料的倉(cāng)庫(kù)。早期的語(yǔ)料庫(kù)規(guī)模較小,隨著計(jì)算機(jī)技術(shù)的發(fā)展和語(yǔ)言詞匯數(shù)量的增加,其發(fā)展規(guī)模越來(lái)越大,類型也變得更加多樣化,常見(jiàn)的語(yǔ)料庫(kù)分為單語(yǔ)語(yǔ)料庫(kù)和雙語(yǔ)/多語(yǔ)語(yǔ)料庫(kù)。單語(yǔ)語(yǔ)料庫(kù)是目前開(kāi)發(fā)和使用最多的語(yǔ)料庫(kù),它僅收集一種語(yǔ)言的語(yǔ)料。雙語(yǔ)/多語(yǔ)語(yǔ)料庫(kù)是指由兩種或兩種以上語(yǔ)言的文本構(gòu)成的語(yǔ)料庫(kù)。平行語(yǔ)料庫(kù)是指由原文文本及其平行對(duì)應(yīng)的譯語(yǔ)文本構(gòu)成的雙語(yǔ)語(yǔ)料庫(kù),其雙語(yǔ)對(duì)應(yīng)

        中小企業(yè)管理與科技 2018年21期2018-02-07

      • 中古漢語(yǔ)分期研究所涉及的語(yǔ)料問(wèn)題
        異性所致。其中,語(yǔ)料觀的分殊是其中重要的原因,這涉及中古漢語(yǔ)語(yǔ)料的適用性、口語(yǔ)性和地域性等問(wèn)題。關(guān)鍵詞:中古漢語(yǔ) 分期 語(yǔ)料 適用性 口語(yǔ)性 地域性一、前言漢語(yǔ)史研究中分歧最大的要算是分期研究了,單就語(yǔ)音史的分期而言,就有將近二十種意見(jiàn)??梢?jiàn),綜合考慮了詞匯、語(yǔ)法和語(yǔ)音的漢語(yǔ)史,其分期自然是一個(gè)異常棘手的問(wèn)題,更何況漢語(yǔ)史的分期所考慮的還遠(yuǎn)遠(yuǎn)不止這三個(gè)因素。合理的分期至少還得考慮口語(yǔ)與書(shū)面語(yǔ)、通語(yǔ)與方言、文言與白話、舊有語(yǔ)言與新生語(yǔ)言、語(yǔ)言接觸與語(yǔ)言感染等

        安徽文學(xué)·下半月 2017年9期2018-02-03

      • 口譯自主學(xué)習(xí)語(yǔ)料庫(kù)建設(shè)研究
        以數(shù)字化口譯教學(xué)語(yǔ)料庫(kù)為代表的資源庫(kù)建設(shè),如日內(nèi)瓦大學(xué)的“在線共享口譯教學(xué)資源庫(kù)(SIMON)”(鄧軍濤 2015: 78);在口譯教學(xué)管理領(lǐng)域,以課程管理軟件為代表的管理系統(tǒng)的應(yīng)用,如免費(fèi)開(kāi)源的課程管理軟件Moodle(Tymczyńska 2009)。從四者的關(guān)系看,數(shù)字化口譯教學(xué)語(yǔ)料庫(kù)更具基礎(chǔ)性和先導(dǎo)性作用,因?yàn)榄h(huán)境的營(yíng)造、過(guò)程的開(kāi)展和管理的實(shí)施都必須依托高質(zhì)量資源庫(kù)的建設(shè)。但從我國(guó)口譯教學(xué)的現(xiàn)狀看,數(shù)字化口譯教學(xué)語(yǔ)料庫(kù),尤其是自主學(xué)習(xí)語(yǔ)料庫(kù)建設(shè)是一

        外文研究 2017年4期2018-01-17

      • 基于聯(lián)合學(xué)習(xí)的跨語(yǔ)言事件識(shí)別方法
        和完善的英文事件語(yǔ)料庫(kù)來(lái)幫助完成中文事件抽取任務(wù),提出了一種基于聯(lián)合學(xué)習(xí)的跨語(yǔ)言事件識(shí)別方法,即利用源語(yǔ)言的標(biāo)注語(yǔ)料對(duì)目標(biāo)語(yǔ)言的測(cè)試語(yǔ)料進(jìn)行事件識(shí)別.利用機(jī)器翻譯及詞對(duì)齊技術(shù)來(lái)保持源語(yǔ)言和目標(biāo)語(yǔ)言的語(yǔ)言一致性和標(biāo)注信息一致性.挑選合適的特征組合,使用最大熵分類模型分別實(shí)現(xiàn)觸發(fā)詞的識(shí)別和分類.通過(guò)整數(shù)線性規(guī)劃的聯(lián)合學(xué)習(xí)模型將二者結(jié)合在一起,加之局部約束和全局約束條件,對(duì)結(jié)果進(jìn)行優(yōu)化處理.實(shí)驗(yàn)結(jié)果表明,使用源語(yǔ)言的語(yǔ)料及其翻譯語(yǔ)料疊加的雙語(yǔ)語(yǔ)料時(shí),所用方法可以

        鄭州大學(xué)學(xué)報(bào)(理學(xué)版) 2017年2期2017-04-17

      • 如何使用第二外語(yǔ)學(xué)習(xí)者語(yǔ)料
        燕華摘要:學(xué)習(xí)者語(yǔ)料研究起源于20世界80年代后期。它的起源是基于語(yǔ)料語(yǔ)言學(xué)的理論和方法論模式。語(yǔ)料語(yǔ)言學(xué)是利用語(yǔ)料來(lái)研究語(yǔ)言的,也就是說(shuō),研究經(jīng)電腦處理過(guò)的書(shū)面或口語(yǔ)文本數(shù)據(jù)。盡管該領(lǐng)域還是一個(gè)非常新的領(lǐng)域,但是該領(lǐng)域已經(jīng)對(duì)語(yǔ)言理論和語(yǔ)言描述做出了巨大的貢獻(xiàn)。關(guān)鍵詞:第二外語(yǔ)學(xué)習(xí);語(yǔ)料庫(kù)1.學(xué)習(xí)者語(yǔ)料數(shù)據(jù)的特異性學(xué)習(xí)者語(yǔ)料屬于一種更加開(kāi)放的二語(yǔ)習(xí)得類型的數(shù)據(jù)。Ellis將其區(qū)分出來(lái),并且命名為自然語(yǔ)言使用數(shù)據(jù)和診療數(shù)據(jù)。自然語(yǔ)言數(shù)據(jù)是由學(xué)習(xí)者產(chǎn)生,并且這

        科學(xué)與財(cái)富 2016年30期2017-03-31

      • 對(duì)外漢語(yǔ)教學(xué)領(lǐng)域可比語(yǔ)料庫(kù)的構(gòu)建及應(yīng)用研究 ——以“把”字句的句法語(yǔ)義標(biāo)注及應(yīng)用研究為例
        4)0 引言可比語(yǔ)料庫(kù)(comparable corpus)是指內(nèi)容或形式上具有某些相似屬性的語(yǔ)料的集合,可分為多語(yǔ)可比語(yǔ)料庫(kù)和單語(yǔ)可比語(yǔ)料庫(kù)。前者多應(yīng)用于翻譯研究、機(jī)器翻譯、信息檢索等,后者常應(yīng)用于語(yǔ)言對(duì)比研究[1]。本文所構(gòu)建的漢語(yǔ)可比語(yǔ)料庫(kù)屬于后者。在國(guó)外,單語(yǔ)可比語(yǔ)料庫(kù)應(yīng)用于以下三方面: ①翻譯研究。英國(guó)曼徹斯特大學(xué)構(gòu)建的英語(yǔ)可比語(yǔ)料庫(kù)(ECC)包括英文譯文語(yǔ)料子庫(kù)和原創(chuàng)英文語(yǔ)料子庫(kù)。通過(guò)該資源可以更好地考察翻譯英語(yǔ)的獨(dú)特性[2]。②區(qū)域語(yǔ)言對(duì)比研

        中文信息學(xué)報(bào) 2017年6期2017-03-12

      • “全球漢語(yǔ)中介語(yǔ)語(yǔ)料庫(kù)”的平衡性考慮
        “全球漢語(yǔ)中介語(yǔ)語(yǔ)料庫(kù)”的平衡性考慮李桂梅(北京語(yǔ)言大學(xué)語(yǔ)言科學(xué)院,北京,100083)漢語(yǔ)中介語(yǔ)語(yǔ)料庫(kù);平衡性;原則;措施從影響漢語(yǔ)中介語(yǔ)語(yǔ)料庫(kù)平衡性的關(guān)鍵因素出發(fā),討論了“全球漢語(yǔ)中介語(yǔ)語(yǔ)料庫(kù)”在追求語(yǔ)料庫(kù)平衡性方面的基本原則和采取的措施。平衡性的基本原則是以漢語(yǔ)國(guó)際教育的現(xiàn)實(shí)情況為主要參照,兼顧代表性和覆蓋范圍?!叭驖h語(yǔ)中介語(yǔ)語(yǔ)料庫(kù)”建設(shè)者在語(yǔ)料采集、語(yǔ)料屬性標(biāo)注、確定入庫(kù)語(yǔ)料語(yǔ)料庫(kù)檢索系統(tǒng)的設(shè)計(jì)等每個(gè)階段都采取措施努力實(shí)現(xiàn)語(yǔ)料庫(kù)的平衡性,并為實(shí)

        華文教學(xué)與研究 2017年2期2017-03-09

      • 漢語(yǔ)盲文語(yǔ)料庫(kù)語(yǔ)料采集研究
        36)?漢語(yǔ)盲文語(yǔ)料庫(kù)語(yǔ)料采集研究鐘經(jīng)華1,朱 琳1,高 旭2,徐洪妹3(1. 北京聯(lián)合大學(xué) 特殊教育學(xué)院, 北京 100075; 2. 中國(guó)盲文出版社,北京 100165;3. 上海盲童學(xué)校,上海 200336)盲文語(yǔ)料庫(kù)建設(shè)在國(guó)內(nèi)外還沒(méi)有先例。為了建設(shè)多功能、綜合性的漢語(yǔ)盲文語(yǔ)料庫(kù),通過(guò)對(duì)現(xiàn)行盲文頒布60多年來(lái)的盲文出版物語(yǔ)料、非出版物語(yǔ)料以及盲人語(yǔ)料的采集,力圖涵蓋盲文使用的全貌。從語(yǔ)料調(diào)查、語(yǔ)料篩選、語(yǔ)料采集流程幾個(gè)方面闡述了盲文語(yǔ)料庫(kù)語(yǔ)料采集的主

        北京聯(lián)合大學(xué)學(xué)報(bào) 2016年4期2016-11-18

      • 語(yǔ)料庫(kù)視野下的現(xiàn)代漢語(yǔ)“龜”字義項(xiàng)分布研究
        摘要:本文運(yùn)用了語(yǔ)料庫(kù)的方法,并采用定量研究的方式,對(duì)“龜”字在現(xiàn)代漢語(yǔ)中的義項(xiàng)分布情況進(jìn)行了再次描寫(xiě)和研究,最終建議在《現(xiàn)代漢語(yǔ)詞典》等詞典釋義的基礎(chǔ)上增收4個(gè)義項(xiàng)。關(guān)鍵詞:語(yǔ)料庫(kù);龜;新義項(xiàng)一、引言《現(xiàn)代漢語(yǔ)詞典(第6版)》(以下簡(jiǎn)稱《現(xiàn)漢》)作為辭書(shū)經(jīng)典,隨著時(shí)代的發(fā)展,難免出現(xiàn)義項(xiàng)收錄不完全的現(xiàn)象。由于時(shí)代的局限性,其在收詞立項(xiàng)方面也有待補(bǔ)充和完善?!褒敗弊衷凇冬F(xiàn)漢》中只有1個(gè)義項(xiàng),與其他漢語(yǔ)類中型語(yǔ)文性詞典所收“龜”字義項(xiàng)相比大同小異,基本無(wú)變化

        教育教學(xué)論壇 2015年48期2015-12-16

      • 潛在語(yǔ)義分析的英漢口譯語(yǔ)料庫(kù)挖掘
        義分析的英漢口譯語(yǔ)料庫(kù)挖掘鄭麗芳,唐朝輝(廈門理工學(xué)院外國(guó)語(yǔ)學(xué)院,福建 廈門 361024)分析潛在語(yǔ)義分析的理論基礎(chǔ),結(jié)合英漢口譯語(yǔ)料庫(kù)的相關(guān)特點(diǎn),提出了基于潛在語(yǔ)義分析的口譯語(yǔ)料相似度的度量方法.基于PACCEL英漢口譯語(yǔ)料庫(kù)的實(shí)驗(yàn)表明,該方法的檢索精度為0.79,召回率為0.59,F(xiàn)1為0.68,檢索時(shí)間為1.124 s,在檢索精度、召回率、F1值以及時(shí)間效率上均顯著優(yōu)于實(shí)驗(yàn)的參照方法.該方法能為用戶提供更有效的檢索推薦以及在擴(kuò)展語(yǔ)料庫(kù)時(shí)自動(dòng)探析語(yǔ)料

        廈門理工學(xué)院學(xué)報(bào) 2015年1期2015-08-17

      • PATTIE兒童讀物及視聽(tīng)材料英語(yǔ)語(yǔ)料庫(kù)的創(chuàng)建
        物及視聽(tīng)材料英語(yǔ)語(yǔ)料庫(kù)的創(chuàng)建外交學(xué)院 吉 潔本文介紹“PATTIE(Preschoolers- and Teenagers-oriented Texts in English)兒童讀物及視聽(tīng)材料英語(yǔ)語(yǔ)料庫(kù)”的建設(shè)概況。PATTIE語(yǔ)料庫(kù)主要收集由成人所寫(xiě),面向4歲到10多歲兒童的英文正式出版物,包括兒童文學(xué)、小學(xué)教材、科普讀物、報(bào)刊新聞和少兒動(dòng)畫(huà)5種體裁,涉及英美等地出版物。語(yǔ)料庫(kù)經(jīng)過(guò)詞性標(biāo)注和元信息標(biāo)記,可在BFSU CQPweb語(yǔ)料庫(kù)平臺(tái)在線檢索。與面

        語(yǔ)料庫(kù)語(yǔ)言學(xué) 2015年1期2015-08-17

      • CET—4聽(tīng)力真題詞匯難度分析
        詞匯難度近年來(lái),語(yǔ)料庫(kù)語(yǔ)言學(xué)的不斷發(fā)展為大學(xué)英語(yǔ)聽(tīng)力教學(xué),尤其是聽(tīng)力詞匯的教學(xué)和研究提供了真實(shí)、地道的聽(tīng)力語(yǔ)料和聽(tīng)力環(huán)境。在全國(guó)大學(xué)英語(yǔ)四級(jí)考試(CET-4)中,聽(tīng)力理解測(cè)試分值占到總分?jǐn)?shù)的35%,是考生備考和大學(xué)英語(yǔ)教學(xué)中應(yīng)給與足夠重視的考察項(xiàng)目。由此,本研究通過(guò)對(duì)2012—2014 年共10套大學(xué)英語(yǔ)四級(jí)長(zhǎng)短對(duì)話聽(tīng)力和篇章聽(tīng)力原稿的詞匯難度進(jìn)行對(duì)比分析,進(jìn)而為考生備考及大學(xué)英語(yǔ)聽(tīng)力教學(xué)提供有效的支持和幫助。一、研究方法本研究的研究語(yǔ)料為2012—201

        校園英語(yǔ)·上旬 2015年5期2015-05-30

      • 淺論真實(shí)語(yǔ)料有效導(dǎo)入英語(yǔ)課堂教學(xué)的途徑
        題與實(shí)驗(yàn)淺論真實(shí)語(yǔ)料有效導(dǎo)入英語(yǔ)課堂教學(xué)的途徑李燕陳萍真實(shí)語(yǔ)料一直都是備受語(yǔ)言學(xué)者關(guān)注的話題。為了提高學(xué)習(xí)者的語(yǔ)言交際能力,教學(xué)者往往積極地將真實(shí)語(yǔ)料導(dǎo)入英語(yǔ)課堂教學(xué)中。但是近些年的教學(xué)實(shí)踐中,真實(shí)語(yǔ)料的運(yùn)用仍然存在一些不容忽視的問(wèn)題。以真實(shí)語(yǔ)料運(yùn)用過(guò)程中存在的問(wèn)題為切入點(diǎn),并在語(yǔ)境理論和會(huì)話分析理論的指導(dǎo)下,找尋其中具有建設(shè)性的意見(jiàn)與建議。真實(shí)語(yǔ)料;語(yǔ)言交際語(yǔ)境理論;會(huì)話分析一、英語(yǔ)真實(shí)語(yǔ)料的內(nèi)涵《朗文語(yǔ)言教學(xué)及應(yīng)用語(yǔ)言學(xué)辭典》指出:“選自報(bào)紙、雜志等的

        英語(yǔ)教師 2015年16期2015-02-13

      • 大學(xué)英語(yǔ)聽(tīng)力課堂真實(shí)語(yǔ)料的選擇與應(yīng)用策略
        英語(yǔ)聽(tīng)力課堂真實(shí)語(yǔ)料的選擇與應(yīng)用策略劉 靜《大學(xué)英語(yǔ)課程教學(xué)要求》對(duì)于學(xué)生的聽(tīng)力理解能力提出了更高的要求,培養(yǎng)學(xué)生在真實(shí)場(chǎng)景中的交際能力變得愈發(fā)重要?;诖耍⒄Z(yǔ)聽(tīng)力課堂迫切需要引入真實(shí)語(yǔ)料。著重研究聽(tīng)力教學(xué)中真實(shí)語(yǔ)料的選擇標(biāo)準(zhǔn)和應(yīng)用策略,提出具體的實(shí)施步驟,為教師選取真實(shí)語(yǔ)料并運(yùn)用于聽(tīng)力課堂提供參考。真實(shí)語(yǔ)料;聽(tīng)力課堂;選擇與應(yīng)用引言所謂真實(shí)語(yǔ)料(authentic materials),按照《朗文語(yǔ)言教學(xué)與應(yīng)用語(yǔ)言學(xué)詞典》中的解釋,其定義為“語(yǔ)言教學(xué)所

        英語(yǔ)教師 2015年20期2015-02-13

      • 基于傳媒語(yǔ)料庫(kù)的漢語(yǔ)語(yǔ)體詞匯比較研究
        30年來(lái)基于漢語(yǔ)語(yǔ)料庫(kù)的詞匯研究日趨增多,但仍有可拓展之處:其一是漢語(yǔ)學(xué)界在將語(yǔ)料庫(kù)、詞匯與語(yǔ)體進(jìn)行比較研究方面存在不足,而英語(yǔ)界這一研究卻已成趨勢(shì);其二是對(duì)語(yǔ)體間的差異性、比較性研究不足,構(gòu)成語(yǔ)體的變量較多,找到具有可比性的語(yǔ)料不易。此外基于漢語(yǔ)口語(yǔ)語(yǔ)料庫(kù)的詞匯研究相對(duì)較少。國(guó)外相關(guān)研究中,Ure[1]、Poulisse 和 Bongaert[2]等的研究表明,書(shū)面語(yǔ)篇與口語(yǔ)語(yǔ)篇在詞匯變化性與詞匯密度上存在較大的差異。此外,Biber[3]、胡顯耀[4]

        長(zhǎng)沙大學(xué)學(xué)報(bào) 2015年6期2015-01-04

      • 現(xiàn)代維吾爾語(yǔ)常用詞統(tǒng)計(jì)關(guān)鍵技術(shù)研究
        發(fā)展。為確保收集語(yǔ)料的可靠性、代表性和權(quán)威性,本文重點(diǎn)對(duì)語(yǔ)料來(lái)源、語(yǔ)料范圍、語(yǔ)料載體等進(jìn)行了研究,以保證常用詞候選表的權(quán)威性和代表性。(1) 在現(xiàn)有的語(yǔ)料庫(kù)資源基礎(chǔ)上,系統(tǒng)、持續(xù)地進(jìn)行收集、整理、加工和處理現(xiàn)代維吾爾文平面媒體、教育教材媒體、有聲媒體、網(wǎng)絡(luò)媒體語(yǔ)料,構(gòu)建現(xiàn)代維吾爾語(yǔ)語(yǔ)料庫(kù),相比之前的語(yǔ)料庫(kù),本語(yǔ)料庫(kù)語(yǔ)料來(lái)源更廣、語(yǔ)料領(lǐng)域更寬、各個(gè)領(lǐng)域比率控制適當(dāng)。(2) 對(duì)構(gòu)建現(xiàn)代維吾爾語(yǔ)語(yǔ)料庫(kù)的關(guān)鍵技術(shù)與方法進(jìn)行進(jìn)一步優(yōu)化與完善,新增了人名識(shí)別和數(shù)據(jù)自動(dòng)

        中文信息學(xué)報(bào) 2014年5期2014-02-27

      • 小議How are you? 的回答及小學(xué)英語(yǔ)教學(xué)建議
        語(yǔ)教材,通過(guò)英語(yǔ)語(yǔ)料庫(kù),分析交際用語(yǔ)How are you? 的表達(dá)。二、當(dāng)前小學(xué)英語(yǔ)教材關(guān)于How are you? 回答形式存在的問(wèn)題筆者對(duì)當(dāng)前小學(xué)不同版本英語(yǔ)教材有關(guān)How are you? 的回答進(jìn)行了歸納,從表1 得知,大部分教材中對(duì)于How are you?的回答形式過(guò)于單一,基本都是 I am fine, thank you, (and you?)筆者認(rèn)為這是導(dǎo)致很多同學(xué)下意識(shí)反應(yīng)就是回答I am fine, thank you, and y

        實(shí)踐新課程 2013年10期2013-11-27

      • Reliability assessment consideringdependent competing failure process and shifting-threshold
        電子版資源的紙質(zhì)語(yǔ)料,我們首先對(duì)其進(jìn)行掃描,然后經(jīng)過(guò)OCR軟件的識(shí)別、格式轉(zhuǎn)換和人工去噪等環(huán)節(jié)后,對(duì)最終文本進(jìn)行入庫(kù)處理。其中,非雙語(yǔ)版的漢語(yǔ)語(yǔ)料還要進(jìn)行人工翻譯和校對(duì)后方可入庫(kù)。鑒于語(yǔ)料的收集、轉(zhuǎn)換、去噪、翻譯、校對(duì)等環(huán)節(jié)十分煩瑣復(fù)雜,因此需要采集團(tuán)隊(duì)格外細(xì)致與耐心,才能保證語(yǔ)料的真實(shí)性和有效性。在此之后,雙語(yǔ)語(yǔ)料將通過(guò)Anticonc軟件進(jìn)行對(duì)齊處理。2.2 Soft failure model due to degradation and shock

        Journal of Southeast University(English Edition) 2013年1期2013-09-17

      • 上海外語(yǔ)教育出版社英漢雙語(yǔ)平行句對(duì)語(yǔ)料庫(kù)的構(gòu)建*
        標(biāo)是開(kāi)發(fā)一個(gè)基于語(yǔ)料庫(kù)的數(shù)字化雙語(yǔ)詞典編纂出版系統(tǒng),其子課題之一就是構(gòu)建一個(gè)服務(wù)于雙語(yǔ)詞典編纂、經(jīng)過(guò)深加工的、通用共時(shí)并在句子層面對(duì)齊的英漢雙語(yǔ)書(shū)面語(yǔ)語(yǔ)料庫(kù)。該語(yǔ)料庫(kù)以英語(yǔ)為原語(yǔ)、以漢語(yǔ)為譯語(yǔ),以XML(extensible Markup Language)為標(biāo)注語(yǔ)言,對(duì)英語(yǔ)原文語(yǔ)料的標(biāo)注做到分詞(tokenization)、主詞標(biāo)注(lemmatization)及詞性賦碼(part of speech tagging),對(duì)漢語(yǔ)譯文語(yǔ)料的標(biāo)注做到分詞及詞性

        辭書(shū)研究 2012年5期2012-08-07

      • 異種語(yǔ)料融合方法: 基于統(tǒng)計(jì)的中文詞法分析應(yīng)用
        很大程度上依賴于語(yǔ)料庫(kù),加大訓(xùn)練語(yǔ)料,可以直接提高詞法分析的精度。但是,手工標(biāo)注大規(guī)模語(yǔ)料代價(jià)昂貴。并且,不同領(lǐng)域的語(yǔ)料切分和標(biāo)注的標(biāo)準(zhǔn)往往不同,難以直接混合使用。圖1 以《人民日?qǐng)?bào)》語(yǔ)料和賓州中文樹(shù)庫(kù)語(yǔ)料為例,具有不同的切分和詞性標(biāo)注標(biāo)準(zhǔn),在《人民日?qǐng)?bào)》語(yǔ)料中“高新技術(shù)”為一個(gè)詞,標(biāo)注為名詞(n),在賓州樹(shù)庫(kù)中,“高新技術(shù)”被分為“高”“新”“技術(shù)”,并分別標(biāo)注為形容詞(JJ)、形容詞(JJ)和名詞(NN)。并且,這兩種語(yǔ)料的詞性標(biāo)注集也不同,名詞的標(biāo)注

        中文信息學(xué)報(bào) 2012年2期2012-06-29

      • 基于句對(duì)質(zhì)量和覆蓋度的統(tǒng)計(jì)機(jī)器翻譯訓(xùn)練語(yǔ)料選取
        的高質(zhì)量雙語(yǔ)句對(duì)語(yǔ)料庫(kù)的支持。一般來(lái)說(shuō)增加訓(xùn)練語(yǔ)料規(guī)模有助于獲得穩(wěn)定的模型參數(shù)和SMT系統(tǒng)翻譯性能的提高。但是訓(xùn)練語(yǔ)料越多,訓(xùn)練和解碼需要的時(shí)間越長(zhǎng),并且平行語(yǔ)料中存在的一些噪聲數(shù)據(jù),也會(huì)影響到訓(xùn)練的可靠性。呂雅娟[1,3]等人曾提出一種基于信息檢索模型的統(tǒng)計(jì)機(jī)器翻譯訓(xùn)練數(shù)據(jù)選擇與優(yōu)化方法,她們通過(guò)選擇現(xiàn)有訓(xùn)練數(shù)據(jù)資源中與待翻譯文本相似的句子組成訓(xùn)練子集,在不增加計(jì)算資源的情況下獲得與使用全部數(shù)據(jù)相當(dāng)甚至更好的機(jī)器翻譯結(jié)果。但是,在實(shí)際應(yīng)用中,待翻譯文本往

        中文信息學(xué)報(bào) 2011年2期2011-06-28

      • 不同測(cè)試語(yǔ)料下3~6歲健聽(tīng)與聽(tīng)障兒童音調(diào)比較研究*
        通過(guò)比較不同測(cè)試語(yǔ)料下3~6歲健聽(tīng)兒童與聽(tīng)障兒童音調(diào)的特點(diǎn),探討不同語(yǔ)料對(duì)評(píng)估結(jié)果的影響,比較健聽(tīng)兒童和聽(tīng)障兒童音調(diào)特征的主要差異及相關(guān)影響因素,為聽(tīng)障兒童音調(diào)異常的矯治提供一定幫助。1 資料與方法1.1研究對(duì)象 從浙江省、江蘇省的部分幼兒園選取3~6歲的健聽(tīng)兒童及聽(tīng)障兒童共122例(表1),其中,健聽(tīng)兒童95例,必須符合以下標(biāo)準(zhǔn):無(wú)聽(tīng)覺(jué)和言語(yǔ)障礙史;在測(cè)試期間無(wú)過(guò)敏癥或上呼吸道感染;平時(shí)使用的語(yǔ)言為普通話。聽(tīng)障兒童27例,必須符合以下標(biāo)準(zhǔn):使用漢語(yǔ)普通話

        聽(tīng)力學(xué)及言語(yǔ)疾病雜志 2011年3期2011-01-23

      • 洪誠(chéng)語(yǔ)料觀與中古漢語(yǔ)研究
        10036)洪誠(chéng)語(yǔ)料觀與中古漢語(yǔ)研究王魁偉(遼寧大學(xué)文學(xué)院,遼寧 沈陽(yáng) 110036)語(yǔ)料問(wèn)題與漢語(yǔ)史研究息息相關(guān)。洪誠(chéng)先生在語(yǔ)料的選擇、鑒別及利用等方面均有獨(dú)到而精辟的論述,其語(yǔ)料觀對(duì)漢語(yǔ)史尤其是中古漢語(yǔ)研究至今仍具理論指導(dǎo)意義。漢語(yǔ)史;中古漢語(yǔ);語(yǔ)料觀洪誠(chéng)先生(1910-1980)是著名漢語(yǔ)史學(xué)家,訓(xùn)詁學(xué)家和三禮學(xué)家,也是對(duì)語(yǔ)料問(wèn)題有精深研究和獨(dú)到見(jiàn)解的老一輩學(xué)者。其語(yǔ)料觀對(duì)漢語(yǔ)史尤其對(duì)中古漢語(yǔ)研究具有重要理論價(jià)值和指導(dǎo)意義,值得認(rèn)真總結(jié)。本文不擬全面

        深圳大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版) 2010年6期2010-04-12

      • 英語(yǔ)教學(xué)中真實(shí)語(yǔ)料的運(yùn)用
        觸現(xiàn)實(shí)世界的真實(shí)語(yǔ)料。教材里的書(shū)面語(yǔ)料雖然也有些是選自英美國(guó)家的書(shū)籍或報(bào)刊,但往往為了教學(xué)目的經(jīng)過(guò)簡(jiǎn)化和大幅度地改寫(xiě)。在英語(yǔ)教學(xué)中如果學(xué)習(xí)者僅僅接觸非真實(shí)語(yǔ)料或者雖然有真實(shí)語(yǔ)料的輸入但輸入量不夠,在現(xiàn)實(shí)世界的語(yǔ)言交際中就會(huì)感覺(jué)課堂英語(yǔ)和實(shí)際語(yǔ)言運(yùn)用的脫節(jié),陷入“啞巴英語(yǔ)”的苦惱,而英語(yǔ)教學(xué)的目標(biāo)也難以實(shí)現(xiàn)。一、真實(shí)語(yǔ)料的文獻(xiàn)背景及討論真實(shí)語(yǔ)料長(zhǎng)久以來(lái)一直是學(xué)者們討論的重要話題,何為真實(shí)語(yǔ)料?《朗文語(yǔ)言教學(xué)及應(yīng)用語(yǔ)言學(xué)辭典》認(rèn)為,選自報(bào)紙、雜志等的文章和錄自

        教學(xué)與管理(理論版) 2009年9期2009-11-04

      如皋市| 禄劝| 五台县| 宿州市| 家居| 新竹市| 包头市| 大同县| 浏阳市| 六安市| 海原县| 嫩江县| 共和县| 麟游县| 塘沽区| 武宁县| 师宗县| 资源县| 乌拉特后旗| 海晏县| 当雄县| 大同市| 东丽区| 彭水| 沙洋县| 蛟河市| 肇源县| 绥宁县| 平山县| 博兴县| 湖口县| 泽库县| 海宁市| 鄂尔多斯市| 荔波县| 鄂托克旗| 青铜峡市| 那坡县| 武城县| 历史| 霍城县|