• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于文本相似性檢索技術(shù)解決命題中重題檢測(cè)問(wèn)題的實(shí)踐
      ——以北京市自學(xué)考試命題為例

      2018-05-30 08:18:33沈鋼
      中國(guó)考試 2018年3期
      關(guān)鍵詞:查重查全率題庫(kù)

      沈鋼

      (北京教育考試院,北京 100083)

      1 問(wèn)題提出

      如何控制復(fù)本試卷間試題的重復(fù)率是專(zhuān)業(yè)考試機(jī)構(gòu)的一個(gè)難題。以單個(gè)試題為基礎(chǔ)的題卡庫(kù),重復(fù)的試題不僅造成資源浪費(fèi)和額外的開(kāi)銷(xiāo),還會(huì)嚴(yán)重地影響組卷的質(zhì)量。以試卷為基礎(chǔ)的卷庫(kù),試卷重復(fù)率超標(biāo)①試卷重復(fù)率超標(biāo)指的是一張?jiān)嚲碇械脑囶}同復(fù)本試卷重題分值之和是否超標(biāo),其標(biāo)準(zhǔn)需要參照命題部門(mén)的內(nèi)部標(biāo)準(zhǔn)。,不僅影響考試的公平、公正與測(cè)驗(yàn)的效度,還會(huì)讓社會(huì)對(duì)考試機(jī)構(gòu)的專(zhuān)業(yè)性產(chǎn)生質(zhì)疑。傳統(tǒng)的人工檢測(cè)既費(fèi)時(shí),又費(fèi)力。舉例來(lái)說(shuō),假設(shè)題庫(kù)中已有1 000道試題,需要新添加10道試題,則需要進(jìn)行10 000次檢測(cè),才能完成人工核查試題重復(fù)率(以下簡(jiǎn)稱(chēng)“查重”)。如果要查重新命制試題與全部已考試題,人力根本無(wú)法勝任。從多年實(shí)際工作的效果來(lái)看,通過(guò)查重方式不僅效率低下,而且無(wú)法全面、準(zhǔn)確地統(tǒng)計(jì)試題重復(fù)率,查重存在很大的風(fēng)險(xiǎn)。鑒于此,我們引用計(jì)算機(jī)文本相似性檢索系統(tǒng),結(jié)合已有的自學(xué)考試命題信息管理系統(tǒng),設(shè)計(jì)了自學(xué)考試試題查重系統(tǒng)。

      1.1 文本相似性檢索

      文本相似性技術(shù)是數(shù)據(jù)挖掘、信息分類(lèi)、信息檢索等電子信息處理研究領(lǐng)域的基礎(chǔ),根據(jù)文本的內(nèi)容屬性來(lái)度量?jī)蓚€(gè)電子文檔的相似程度,在論文剽竊檢索、稿件查重、版權(quán)保護(hù)等方面有著廣泛的應(yīng)用。相似試題檢測(cè)是指把試題庫(kù)中相似度很高的試題抽取出來(lái),由學(xué)科專(zhuān)家來(lái)判定它們是否有同時(shí)存在的必要性,或由計(jì)算機(jī)自動(dòng)篩掉相似度很高的試題[1]。本文提出的試題查重系統(tǒng)是在拓爾思(Text Retrieval System,TRS)相似文本檢索軟件的基礎(chǔ)上,結(jié)合自學(xué)考試的命題特點(diǎn)二次開(kāi)發(fā)的計(jì)算機(jī)軟件。系統(tǒng)首先對(duì)文本進(jìn)行分詞和詞性標(biāo)注,然后使用特征提取技術(shù)抽取有用的文本特征,將提取的文本特征表示成文本“指紋”,最后到文檔“指紋”庫(kù)中檢索與當(dāng)前文檔相似的文檔,并給出文檔的相似度量。

      1.2 重題與相似試題的界定

      在計(jì)算試題相似度之前,我們首先要定義重題和相似試題。重題,顧名思義就是完全或者幾乎完全雷同的試題。而相似試題是指兩道題在形式和內(nèi)容上有很大的相似之處,但又不完全相同,所產(chǎn)生的效果也是不相同的。例如兩道題,“在我國(guó)國(guó)家秘密的3個(gè)等級(jí)中,其密級(jí)應(yīng)由縣以上單位頒布的是”和“在我國(guó)國(guó)家秘密的3個(gè)等級(jí)中,其密級(jí)應(yīng)由市以上單位頒布的是”,題干文字內(nèi)容非常相近,但一個(gè)關(guān)鍵字的區(qū)別使兩道試題考查了同一個(gè)知識(shí)點(diǎn)的不同內(nèi)容,答案也完全不同。

      重題不但會(huì)造成資源的浪費(fèi),還會(huì)產(chǎn)生試卷質(zhì)量的隱患。重題不應(yīng)該出現(xiàn)在題庫(kù)中。在卷庫(kù)的使用中也有嚴(yán)格的限制,需要計(jì)算一張?jiān)嚲碇兄仡}的分值是否超標(biāo)。而相似試題在很多時(shí)候?qū)τ诿}尤其是自學(xué)考試命題是有意義的。一本教材的知識(shí)點(diǎn)是有限的,題庫(kù)中不可能完全回避相同知識(shí)點(diǎn)的試題。從課程的學(xué)習(xí)和考試的規(guī)律上看,課程的重點(diǎn)內(nèi)容和重要知識(shí)點(diǎn)不僅不能回避,還應(yīng)該反復(fù)考核。一方面,只有考查課程的重點(diǎn)知識(shí)才能準(zhǔn)確地測(cè)量被試的能力;另一方面,如果限制命題教師命制相似試題,則會(huì)產(chǎn)生大量的偏題、怪題,從而降低試卷的信度和效度;同時(shí),由于相似試題的考點(diǎn)和試題形式相近,使用相似試題還有助于提高試卷之間的平行性。然而,在實(shí)際命題工作中,相似試題的使用也有相應(yīng)的要求。首先,相似試題不能出現(xiàn)在同一張?jiān)嚲砝铮@有可能會(huì)造成考核點(diǎn)重復(fù)或者試題相互提示的問(wèn)題;其次,對(duì)于相近期次的考試,相似試題的分值也要嚴(yán)格控制,以免考生抓住規(guī)律,投機(jī)取巧。

      1.3 文本檢索工具

      如何選擇文本檢索工具是設(shè)計(jì)試題查重系統(tǒng)時(shí)遇到的一個(gè)核心問(wèn)題。經(jīng)過(guò)研究討論,有以下幾種方案可供選擇:1)利用數(shù)據(jù)庫(kù)產(chǎn)品的全文檢索功能。此方案的優(yōu)點(diǎn)是幾乎沒(méi)有額外研發(fā)和采購(gòu)的成本,但是,查重的指標(biāo)不清晰,檢索的體系封閉,很難做進(jìn)一步的優(yōu)化。2)基于文本分詞進(jìn)行比對(duì),可以利用開(kāi)源社區(qū)如Apache的Lucence項(xiàng)目成果。此方案優(yōu)點(diǎn)是整體技術(shù)可控,但未考慮忽略詞、同義詞的干擾因素,效果不好。3)利用現(xiàn)有文本特征提取和相似度計(jì)算的研究成果,選擇合適的算法并將算法程序化。此方案的優(yōu)點(diǎn)是采用的理論可以得到比較權(quán)威的證實(shí),但對(duì)實(shí)驗(yàn)室產(chǎn)品的實(shí)際效果缺乏案例支持,而且參數(shù)調(diào)校耗費(fèi)大量精力。4)在商業(yè)化的文本檢索和語(yǔ)義理解產(chǎn)品基礎(chǔ)上開(kāi)發(fā)查重系統(tǒng)。此方案的優(yōu)點(diǎn)是具有類(lèi)似成功案例的支持,如網(wǎng)頁(yè)去重、專(zhuān)利查新、論文剽竊檢測(cè)等領(lǐng)域的應(yīng)用,并可以開(kāi)放接口以便于二次開(kāi)發(fā);此方案的缺點(diǎn)是將付出較為昂貴的成本代價(jià)。在考慮自主開(kāi)發(fā)程序的難度以及使用效果后,我們認(rèn)為,第4種方案更適合本系統(tǒng)的開(kāi)發(fā),最終選用了業(yè)內(nèi)比較成熟的文本相似性檢索軟件——拓爾思作為系統(tǒng)的文本檢索工具。

      2 系統(tǒng)的設(shè)計(jì)和實(shí)現(xiàn)

      2.1 試題錄入模板

      試題電子化是試題查重的基礎(chǔ)。因此,試題數(shù)據(jù)來(lái)源的規(guī)范以及信息讀取的完整與準(zhǔn)確是查重系統(tǒng)的先決條件。試題錄入模板為命題教師提供了一個(gè)方便錄入試題和參數(shù)的載體,系統(tǒng)通過(guò)讀取模板文件可以將試題拆分成題干、選項(xiàng)、答案和參數(shù)等信息,并批量入庫(kù)。除上述信息外,試題模板還提供了課程代碼、試卷編號(hào)、每道試題的題號(hào)以及所屬題型等內(nèi)容。試題錄入模板采用word文件作為載體,word的錄入方式比軟件填寫(xiě)方式更容易被命題教師所接受。試題錄入模板在word的基礎(chǔ)上加入保護(hù)區(qū)和書(shū)簽定位,命題教師只允許在保護(hù)區(qū)內(nèi)填寫(xiě)內(nèi)容,保證了命題教師無(wú)法隨意改動(dòng)模板的結(jié)構(gòu)。同時(shí),系統(tǒng)通過(guò)書(shū)簽可以精準(zhǔn)定位試題或參數(shù)的起始位置,并把相關(guān)內(nèi)容抽取出來(lái)[2]。

      2.2 閾值的設(shè)定

      本文的閾值是指兩道試題的匹配符合程度,數(shù)值為0~1之間的實(shí)數(shù),共100個(gè)等級(jí),數(shù)值越大,表明2道試題相似度越高。當(dāng)取值為1時(shí),表明兩道試題完全相同,即重復(fù)試題;數(shù)值越小,則表明兩道試題相似度越低,當(dāng)取值為0時(shí),表明兩道試題完全不同[3]。試題查重系統(tǒng)需要使用者預(yù)先設(shè)定閾值,系統(tǒng)在查重后會(huì)返回大于閾值的試題列表。我們根據(jù)自學(xué)考試的實(shí)際情況,設(shè)置不同閾值反復(fù)測(cè)試,最終將閾值的默認(rèn)值設(shè)置為0.80。根據(jù)此閾值檢測(cè)出的試題,基本覆蓋所有相似試題和重題,并把需要人工復(fù)核的試題數(shù)量控制在一個(gè)合理的范圍,保證了實(shí)際使用的工作效率。另外,針對(duì)不同課程的具體情況,使用者也可以手動(dòng)調(diào)整閾值,以達(dá)到最佳的查重效果。

      2.3 查重系統(tǒng)工作流程

      從命題工作程序來(lái)看,自學(xué)考試命題工作分為分散命題、試題接收、試題入庫(kù)、試卷生成、試卷校對(duì)、試卷驗(yàn)收等環(huán)節(jié)。目前采用的人工試題查重設(shè)置在試卷驗(yàn)收環(huán)節(jié),這種工作模式的弊端在于:查重范圍有限;需要人工計(jì)算試卷重復(fù)試題的分?jǐn)?shù)以及與某套試卷中重復(fù)試題的分?jǐn)?shù)之和;若發(fā)現(xiàn)重復(fù)率超標(biāo)的情況,就要由命題教師補(bǔ)救,工作比較被動(dòng)。啟用試題查重系統(tǒng)后,可以在試題接收環(huán)節(jié),即試題入庫(kù)前進(jìn)行試題查重,將查重結(jié)果立即反饋給學(xué)科秘書(shū)和命題教師,學(xué)科秘書(shū)或命題教師可以在第一時(shí)間對(duì)疑似重復(fù)試題進(jìn)行處理。如果使用者不希望人工干預(yù),只需要把默認(rèn)閾值設(shè)置的高一些,系統(tǒng)也可以完成自動(dòng)相似試題檢測(cè),但自動(dòng)相似試題檢測(cè)的缺陷是可能產(chǎn)生誤判的現(xiàn)象[1]。

      試題查重系統(tǒng)工作流程如圖1所示。具體工作流程如下:

      圖1 試題查重系統(tǒng)流程圖

      1)命題教師將填好的試題模板交給工作人員,通過(guò)命題管理信息系統(tǒng)對(duì)試題模板進(jìn)行加載、拆分,生成試卷包導(dǎo)入系統(tǒng)。

      2)工作人員對(duì)查重參數(shù)進(jìn)行設(shè)置,包括閾值和是否同題型查重(一般為默認(rèn))。查重系統(tǒng)對(duì)導(dǎo)入的試題文本進(jìn)行分析,內(nèi)容包括題干、選項(xiàng)和答案,提取文本特征并與題庫(kù)中同科目的試題進(jìn)行對(duì)比。

      3)系統(tǒng)列出查重結(jié)果,包括所有超過(guò)閾值的試題、系統(tǒng)對(duì)應(yīng)的已存在題庫(kù)中的試題題號(hào)、試題內(nèi)容、試題所屬試卷的試卷編號(hào)等。除此之外,系統(tǒng)還將計(jì)算出本次導(dǎo)入試題中超過(guò)閾值的試題的分?jǐn)?shù)之和、與某套試卷中疑似重復(fù)試題的分?jǐn)?shù)之和,并提供打印查重結(jié)果供學(xué)科秘書(shū)參考。

      4)學(xué)科秘書(shū)對(duì)系統(tǒng)給出的查重結(jié)果進(jìn)行人工審核,若確認(rèn)本套試卷重復(fù)試題分?jǐn)?shù)超過(guò)命題要求的標(biāo)準(zhǔn),則反饋給命題教師進(jìn)行修改。

      5)命題教師對(duì)重復(fù)試題進(jìn)行修改,將重新編輯后的試題模板導(dǎo)入系統(tǒng),再次查重后如果確認(rèn)合格,試題入庫(kù)。

      3 實(shí)驗(yàn)結(jié)果和討論

      為了測(cè)試實(shí)際使用效果,我們利用自學(xué)考試題庫(kù)的數(shù)據(jù)對(duì)系統(tǒng)進(jìn)行測(cè)試。選取5門(mén)自學(xué)考試課程作為測(cè)試對(duì)象,并對(duì)題庫(kù)中的部分試題進(jìn)行改造,使其成為相似題和重題,以滿(mǎn)足測(cè)試的需要。

      3.1 準(zhǔn)確率和查全率

      本文引入衡量信息檢索系統(tǒng)性能最重要的2個(gè)參數(shù)——準(zhǔn)確率和查全率。準(zhǔn)確率和查全率是廣泛用于信息檢索和統(tǒng)計(jì)學(xué)分類(lèi)領(lǐng)域的2個(gè)度量值,用來(lái)評(píng)價(jià)結(jié)果的質(zhì)量。其中,準(zhǔn)確率是檢索出相關(guān)文檔數(shù)與文檔總數(shù)的比率,查全率是指檢索出的相關(guān)文檔數(shù)和文檔庫(kù)中所有的相關(guān)文檔數(shù)的比率。兩者取值在0~1,數(shù)值越接近1,準(zhǔn)確率或查全率就越高。準(zhǔn)確率和查全率的數(shù)學(xué)公式為:準(zhǔn)確率=提取出的正確文本數(shù)/提取出的文本數(shù)×100%,查全率=提取出的正確文本數(shù)/樣本中的文本數(shù)×100%[4]。

      3.2 實(shí)驗(yàn)結(jié)果

      5門(mén)課程在題庫(kù)中共有1 858道試題,我們準(zhǔn)備了150道相似試題,50道重題。測(cè)試試題分布情況如表1所示。

      表1 測(cè)試試題分布情況

      本次測(cè)試統(tǒng)一采用0.80作為查重閾值。首先對(duì)查重結(jié)果進(jìn)行逐題分析,判斷檢索出的試題是否與原題相關(guān),是否屬于相似試題或重題。經(jīng)過(guò)對(duì)查重結(jié)果進(jìn)行人工統(tǒng)計(jì)后,得出測(cè)試結(jié)果如表2所示。

      表2 測(cè)試結(jié)果

      通過(guò)測(cè)試結(jié)果可以看出,相似題和重題的準(zhǔn)確率和查全率令人滿(mǎn)意。在閾值設(shè)置為0.80的情況下,相似題的查全率也可以達(dá)到100%。通過(guò)綜合分析,我們可以歸納出影響查重檢測(cè)結(jié)果的因素主要有:1)題庫(kù)中試題的總量。目前測(cè)試的課程在題庫(kù)中大約有8~10套的存量題,如果對(duì)容量更大的題庫(kù)進(jìn)行測(cè)試,預(yù)計(jì)準(zhǔn)確率將有所降低。但自學(xué)考試題庫(kù)受自學(xué)考試特點(diǎn)所限,實(shí)際題庫(kù)容量不會(huì)太大,因此,系統(tǒng)能夠滿(mǎn)足自學(xué)考試題庫(kù)的需求。2)閾值的大小。閾值的大小直接決定檢測(cè)出試題的數(shù)量和人工處理的工作量。在閾值設(shè)置為0.80的情況下,查全率可以達(dá)到100%,準(zhǔn)確率也達(dá)到比較高的標(biāo)準(zhǔn),人工復(fù)核的壓力較小。因此,0.80作為默認(rèn)查重閾值是合理的。3)樣本的內(nèi)容。本次測(cè)試的樣本是對(duì)題庫(kù)中現(xiàn)有試題進(jìn)行改造后形成的,對(duì)原題內(nèi)容改動(dòng)的多少直接影響檢測(cè)結(jié)果。4)人工判斷。檢索出的試題是否與樣本相關(guān),即是否認(rèn)定為相似題或重題,取決于工作人員的人工判斷。本次測(cè)試過(guò)程的人工判斷是由具有豐富命題管理經(jīng)驗(yàn)的學(xué)科秘書(shū)負(fù)責(zé)實(shí)施,認(rèn)定的結(jié)果可以被認(rèn)為是準(zhǔn)確的。

      4 結(jié)語(yǔ)

      試題查重系統(tǒng)成功地將文本相似性檢索引入到試題查重檢測(cè),并很好地融入了現(xiàn)有的命題流程,實(shí)現(xiàn)了半自動(dòng)化的試題查重檢索。對(duì)5門(mén)自學(xué)考試課程進(jìn)行實(shí)驗(yàn)測(cè)試表明,試題查重的準(zhǔn)確率和查全率均達(dá)到較高的水平。該系統(tǒng)的應(yīng)用使控制自學(xué)考試試題重復(fù)率成為可能,解決了命題管理中復(fù)本試卷間重復(fù)率超標(biāo)的難題,節(jié)省了人力資源,提高了工作效率和命題質(zhì)量。該試題查重系統(tǒng)雖是以自學(xué)考試題庫(kù)作為模型設(shè)計(jì)開(kāi)發(fā)的,但通用性較強(qiáng),未來(lái)可以推廣到其他的考試項(xiàng)目。

      [1]李峰超.基于領(lǐng)域知識(shí)的試題分類(lèi)及相似試題檢測(cè)的研究[D].大連:大連海事大學(xué),2009.

      [2]沈鋼,趙曉茫.自學(xué)考試計(jì)算機(jī)題庫(kù)管理系統(tǒng)的設(shè)計(jì)與實(shí)踐[J].中國(guó)考試,2014(4):55-59.

      [3]周舫.漢語(yǔ)句子相似度計(jì)算方法及其應(yīng)用的研究[D].開(kāi)封:河南大學(xué),2005.

      [4]李璐,江葆紅,孫紅紅.如何提高文獻(xiàn)信息檢索中的查全率與查準(zhǔn)率[J].科技文獻(xiàn)信息管理,2010(1):23-25.

      猜你喜歡
      查重查全率題庫(kù)
      “勾股定理”優(yōu)題庫(kù)
      學(xué)位論文查重亂象引關(guān)注
      論文查重雜談
      “軸對(duì)稱(chēng)”優(yōu)題庫(kù)
      “軸對(duì)稱(chēng)”優(yōu)題庫(kù)
      “整式的乘法與因式分解”優(yōu)題庫(kù)
      學(xué)術(shù)論文該“查”什么?
      雜文月刊(2018年20期)2018-11-14 21:28:46
      海量圖書(shū)館檔案信息的快速檢索方法
      學(xué)術(shù)論文該“查”什么?
      基于詞嵌入語(yǔ)義的精準(zhǔn)檢索式構(gòu)建方法
      宜川县| 淳安县| 新竹县| 渑池县| 高州市| 华坪县| 固阳县| 邛崃市| 固始县| 津市市| 鹤岗市| 青铜峡市| 安化县| 阿合奇县| 苍梧县| 应城市| 秀山| 和硕县| 星子县| 大连市| 金阳县| 林口县| 宜兰市| 玛多县| 乐至县| 古丈县| 五莲县| 大安市| 嘉祥县| 嘉鱼县| 都匀市| 沅江市| 江津市| 留坝县| 洮南市| 新田县| 万源市| 宾川县| 沅陵县| 夏河县| 天峨县|