• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      一種詞匯量的測試算法研究

      2018-07-12 09:37羅勝
      電腦知識與技術(shù) 2018年14期
      關(guān)鍵詞:測試算法

      摘要:隨著社會的發(fā)展標(biāo)準(zhǔn)化測試的出現(xiàn),對標(biāo)準(zhǔn)化測試的科學(xué)性要求越來越高,測試的質(zhì)量評價對教學(xué)管理和教學(xué)計劃至關(guān)重要。詞匯量的測試在語言教學(xué)中可以幫助老師很好的了解學(xué)習(xí)者詞匯知識的掌握情況,對教師的教學(xué)提供很大的幫助,該文對詞匯量評估計算與預(yù)測方法,提出了一種實踐評估模型。

      關(guān)鍵詞:語言詞匯;測試;算法

      中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2018)14-0248-03

      1 研究背景及意義

      一種語言包括語言知識和語言技能,詞匯知識就在一定程度上就是代表語言知識,詞匯不僅是語言的基礎(chǔ),這是衡量一個學(xué)生英語學(xué)習(xí)水平的一個不可或缺的重要指標(biāo)。由于詞匯量的掌握程度可以反映學(xué)習(xí)能,所以詞匯學(xué)習(xí)與教學(xué)、詞匯的測量這個研究方向備受國內(nèi)外研究者的關(guān)注,其中研究學(xué)習(xí)者的語言詞匯定量測試的研究最受研究者與教學(xué)的關(guān)注。

      對語言詞匯研究的方向很多,例如對詞匯量的測定方法也很多。其研究的重要性也是多方面的:語言詞語的定量測試可以促進(jìn)學(xué)習(xí),幫助教師更準(zhǔn)確的了解學(xué)生詞匯發(fā)展的水平,有助于老師改進(jìn)教學(xué)方向。通過這種定量的檢測,可以幫助老師更好地了解學(xué)習(xí)的語言基礎(chǔ),更好地掌握學(xué)習(xí)者的學(xué)習(xí)情況,有助于老師改進(jìn)和提高教學(xué)水平,這也是老師區(qū)別基礎(chǔ)好的學(xué)生與基礎(chǔ)不好的學(xué)生的一個重要手段。

      詞匯量測量是國際間跨文化研究的重要方法。所以,要想針對學(xué)習(xí)者的語言知識和語言能力進(jìn)行測試,就必須對學(xué)習(xí)者的語言詞匯水平進(jìn)行測試,語言詞匯的測試結(jié)果可以間接的反映學(xué)習(xí)者的語言知識水平。到目前為止,國內(nèi)外的研究者已經(jīng)提出很多的測試方法,也有了一些比較成熟的測試?yán)碚?。不過關(guān)于語言詞匯量的測試定量研究有一個明顯差異。首先,測定的結(jié)果差異性很大;其次,使用的基礎(chǔ)語料庫的不同,以及使用的特種值不同;有的需要測試大量的語言詞匯才得出結(jié)果,而且需要測試的覆蓋范圍比較大,測試的時間比較長。即便是對同一語言水平的測試者進(jìn)行詞匯量調(diào)查,不同的測試手段對同一個測試者測試的結(jié)果差別也很大。這就是本文提出的用少量語言詞匯測試測試出一個較為準(zhǔn)確的水平,提出一個探索似的測試算法理論。不過這個算法的正在逐步的實現(xiàn),我自行設(shè)計的《一種語言學(xué)習(xí)及智能測試平臺V1.0》就是對這個算法的系統(tǒng)實現(xiàn),而且本系統(tǒng)已經(jīng)得到國家版權(quán)局的著作權(quán)的登記,目前該軟件在我們學(xué)校部署給學(xué)生使用。測試的結(jié)果數(shù)據(jù)為后續(xù)算法的改進(jìn)提供大量的數(shù)據(jù)支持,對以后的語言詞匯測試的算法探索提供重要的數(shù)據(jù)。

      2 相關(guān)理論及數(shù)學(xué)模型的創(chuàng)建

      本文主要的研究內(nèi)容就是提出基于關(guān)聯(lián)性模型的詞匯測試算法,對目前語言詞匯定量測定工具中的理論數(shù)學(xué)模型的討論。文章中提出的關(guān)聯(lián)性模型就是馬爾可夫鏈模型。馬爾可夫鏈就是描述了某一個結(jié)果的產(chǎn)生,取決于它前面的有限個狀態(tài)[1] 。已經(jīng)測試過的多個詞匯的特征值決定下一個測試詞匯的特征值的出現(xiàn),也就測試的下一個詞的特征值關(guān)聯(lián)了它前面的多個詞的特征值。

      語言詞匯的定量測試首要的工作就是選取一個恰當(dāng)?shù)脑~匯庫,不是語言中的所有詞匯都可以作為測試樣例。除此之外,還要參考國內(nèi)外的研究者的一些研究成果相結(jié)合,以及一個區(qū)域的教學(xué)水平和教學(xué)習(xí)慣相結(jié)合。選擇語言詞匯庫的方法目前常用的有兩種,一種是詞典法;另一種是使用詞匯頻率表法。詞匯頻率表是依據(jù)詞頻表選擇一定頻率的詞來測試。通常情況下,人會先記住使用頻率高的詞匯 [2],人們對低頻率詞匯的使用少,所有不容易記住。這就是語言詞匯頻率對學(xué)習(xí)者的學(xué)習(xí)影響的一個因素,對不同使用頻率的詞匯有著明顯的差別。因此,學(xué)習(xí)者對各語言詞匯使用頻率等級的詞匯掌握情況可以反映出他對該語言知識的掌握情況。中國教育部對語言詞匯的大綱要求,尤其是對中小學(xué)英語詞匯的要求,可以大概的統(tǒng)計出英語詞匯的使用量在1.3萬左右。本文中提出的語言詞匯的測試就以英語詞匯作為測試樣例。 英語語言詞匯庫的選擇是根據(jù)《英國國家語料庫》得出的使用頻率最高的2萬個詞匯[3]。從這個語料庫中在進(jìn)行部分的篩選就精簡后得到本文中使用的詞匯庫。例如:同一個詞的不同屬性的詞,選取它的名詞形式就可以。這樣對語料庫進(jìn)行篩選后剩下大概1.5萬個詞匯。本文使用的語言詞匯庫就是這1.5萬個詞,并把剩下的詞匯庫進(jìn)行難度級別的劃分,劃分為10個難度級別。

      對測試語言詞匯建立數(shù)學(xué)模型設(shè),假設(shè)被測試詞匯的使用頻率特征值記作[idn (n∈N?)],就是詞匯的詞頻作為特征值。詞匯的測試狀態(tài)記作[Fn (n∈N?)],其中對象特征值為[idn]對應(yīng)的詞匯測試為[Fn=1],表示測試正確,否則記記[Fn=0];測試對象的特征變化值[tn (n∈N?)];表示從[idn]到[idn+1]的變化值;加權(quán)值[ζn]; [xn]表示為測試難度系數(shù)值;用 [f(x)]來計算特征值, 當(dāng)然它的取值為[x (x∈(0,10)];最后用一個測試矩陣來記錄測試的結(jié)果, 這個矩陣記著[R]矩陣;可變鄰域函數(shù)[ψn(t)]和[φn(x)],表示該特征值的詞匯鄰域詞匯特種值,如果該特種詞測試正確,則[idn]鄰域內(nèi)的詞匯測試通過;如果測試錯誤,則認(rèn)為[idn]領(lǐng)域內(nèi)的詞匯沒有掌握,而這個鄰域大小由[ψn(t)]和[φn(x)]兩個函數(shù)來決定。

      3 測試的算法及實現(xiàn)步驟

      數(shù)學(xué)模型建立之后開始測評算法, 首先,確定數(shù)據(jù)庫中詞匯的某種特征值為[1......i (i∈N?)],并每隔1500個詞劃分一個級別,共劃分10個級別,多余的詞匯規(guī)劃為最后一個級別;

      其次,選取特種初始值[id0],任意從第一級中選取一個詞匯的特種值作為初始特征值賦給[id0],第一個級別的詞匯特征值范圍[1,1500],即[id0∈1,1500],并確定詞匯難度系數(shù)[x0=1];計算第一個測試詞匯的對應(yīng)的特征值:即[id1=id0+f(x0)];對被測對象特征值[id1]對應(yīng)的詞匯的選項進(jìn)行判斷;如果被測對象特征值[id1]對應(yīng)的詞匯的 選項正確,則定義標(biāo)記[F1=1];如果被測對象特征值[id1]對應(yīng)的詞匯的選項錯誤,則定義標(biāo)記[F1=0];

      最后,得出了測試評價對象矩陣[R],對矩陣進(jìn)行相應(yīng)的計算得出結(jié)果,如果在某個特征值[idn],當(dāng)測試者的標(biāo)記[Fn]為1時,則認(rèn)為在[idn]鄰域中的詞匯都能掌握,否則認(rèn)為沒有掌握,但這這個鄰域由鄰域函數(shù)[ψn(x)]和[φn(x)]來確定的。即[idn]的左鄰域值和右鄰域值是由這兩個函數(shù)來確定的,而且不同的 [idn]的鄰域大小也可以不同,則測試者的詞匯測評域估計值為:

      式子中a表示測試判斷對的總個數(shù),b表示測試判斷錯的總個數(shù);

      其流程圖如下:

      以下就是本算法邏輯的進(jìn)一步的實現(xiàn)描述過程,已知:測試語言詞匯特征值[idn (n∈N?)] ;狀態(tài)值[Fn=1]表示測試正確,[Fn=0]表示測試錯誤;加權(quán)值為[ζn];特征差值計算函數(shù)選為[f(x)=k1+Aea+bx]的函數(shù)族之一, 實例化該函數(shù)時以語言詞匯語料庫詞頻為準(zhǔn),語料庫的最大上限為一萬五千個詞。對象特征函數(shù)的最大值也不可能超語料的上限,所以函數(shù)中的常量初始化為[k=15000], 初始值[A=id0],[a+bx=-x]。則最終實例化的[f(x)]為:[f(x)=150001+id0e-x] ,如果把[f(x)]實例為更簡單的函數(shù)也可以,只要能滿足該函數(shù)是隨著緩慢遞增的函數(shù),而差值是一個緩慢遞減的函數(shù)型即可。本文中使用的就是上述實例的函數(shù)進(jìn)行計算,對象特征值變化函數(shù)[f(x)];對象特征值變化量[tn-1];測試評價矩陣[R]表示測試者測試的結(jié)果;可變鄰域函數(shù)為然后進(jìn)行測評計算,具體步驟如下:

      下面是對本文中的算法的一個測試樣例:使用語料庫中詞匯使用頻率作為特征值;測試7個詞匯,初始值[id0=1200];加權(quán)值[ζn=0] ,測試的難度系數(shù) [x0=1],根據(jù)算法流程圖 [id1=id0+f(x0)]算出第一分測試詞匯的特征值:[id1=1200+33=1233],并且判斷[F1=1],則[x1=x0+1 =2];根據(jù)式子計算[id2=id1+t1 ],再計算[id3],[id3=id2+t2 ];本實例的難度系數(shù)總后為:[xn=12343.54.55.5];某個[idn]值時[F= =1]則左右虛線內(nèi)的單詞可以,認(rèn)為是掌握的,根據(jù)常用15000詞分成10級,假設(shè)各級的鄰域函數(shù)值為:

      對象特征值生成函數(shù)[f(x)=150001+1200e-x];

      對象特征值生成函數(shù)的,根據(jù)圖1則得出的:

      最后得出[R]矩陣:

      根據(jù)測試流程圖中的值一次判斷條件,得出算法結(jié)果:

      通過上述的算法實例計算,可以大概得出該測試者的詞匯量為4400個詞,結(jié)合圖1的實例,測試者是連續(xù)7道,第4道錯誤的測試詞匯的結(jié)果。

      4 結(jié)束語

      本文提出的算法主要是依據(jù)英國國家語料庫編制的詞頻作為詞匯樣本,其權(quán)威性還有待商榷。該算法主要是針對怎么樣產(chǎn)生測試的詞匯,測試詞匯之間的一個關(guān)聯(lián)性,使得下一個測試詞匯有已經(jīng)測試的詞匯的狀態(tài)來決定,具有馬爾可夫的性質(zhì)。至于關(guān)聯(lián)程度是有待研究,以及多維下的馬爾可夫模型也是今后研究的問題。

      參考文獻(xiàn):

      [1] 王秋艷.詞匯測試[D].重慶大學(xué), 2012.

      [2] 姜君.第二語言詞匯知識及其測試模式[D].中國石油大學(xué),2006:48-50.

      [3] 白金榮、覃春華.CET詞匯測試與詞匯教學(xué)[J].河池師范高等??茖W(xué)校學(xué)報:社會科學(xué)版,2000:28-123.

      [4] 戴煒棟.現(xiàn)代英語語言學(xué)概論[M].上海:上海外語教育出版社.2001:17-45.

      [5] 桂詩春.標(biāo)準(zhǔn)化考試—理論、原則與方法[M].廣州:廣東高等教育出版社,1986:1-200.

      [6] Halliday,M.A.K. An Introduction to Functional Grammar.2nd edition[M].北京:外語教學(xué)與研究出版社,2000.

      [7] Lyons J.Linguisti Semantics.An Introduction[M].北京:外語教學(xué)與研究出版社,2000.

      [8] 陳建清.研發(fā)MP3輔助學(xué)習(xí)功能培養(yǎng)學(xué)生英語學(xué)習(xí)習(xí)慣[A].江蘇省教育學(xué)會2006年年會論文集(英語專輯)[C]. 江蘇省教育出版社,2006.

      [9] 羅勝.一種基于馬爾科夫的詞匯量測試與評估方法[P].中國受權(quán)公告號:CN203514554U.2015.

      [10] 羅勝.一種詞匯量的測試與評估方法[P].中國受權(quán)中公告號:CN203513154U.2015.

      猜你喜歡
      測試算法
      幽默大測試
      幽默大測試
      幽默大測試
      基于MapReduce的改進(jìn)Eclat算法
      Travellng thg World Full—time for Rree
      “攝問”測試
      “攝問”測試
      “攝問”測試
      進(jìn)位加法的兩種算法
      基于增強(qiáng)隨機(jī)搜索的OECI-ELM算法
      松桃| 乐东| 孟连| 淄博市| 南丰县| 旺苍县| 饶阳县| 金沙县| 静乐县| 鄯善县| 始兴县| 谢通门县| 邵武市| 建宁县| 公主岭市| 夏邑县| 当阳市| 宁国市| 通化县| 瓦房店市| 张家口市| 西乌珠穆沁旗| 叙永县| 佳木斯市| 淮阳县| 朔州市| 平安县| 武强县| 武平县| 大英县| 乐昌市| 湄潭县| 阿勒泰市| 霸州市| 巩义市| 罗江县| 洪湖市| 沂南县| 越西县| 静宁县| 南召县|