張滿滿
摘要:隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展和進(jìn)步,計(jì)算機(jī)自適應(yīng)測(cè)試系統(tǒng)開(kāi)始在諸多領(lǐng)域彰顯出重要的應(yīng)用價(jià)值,測(cè)試是教育評(píng)價(jià)中被廣泛采用的一種重要方法,傳統(tǒng)的測(cè)試多是借助于紙筆完成,本文基于此,首先分析了計(jì)算機(jī)自適應(yīng)測(cè)試的基本要素,然后重點(diǎn)探討了計(jì)算機(jī)自適應(yīng)測(cè)試中的若干關(guān)鍵技術(shù),望對(duì)相關(guān)人員帶來(lái)一定的參考價(jià)值。
關(guān)鍵詞:計(jì)算機(jī)自適應(yīng)測(cè)試 基本要素 關(guān)鍵技術(shù)
中圖分類號(hào):TP391.6文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1007-9416(2015)11-0000-00
隨著近十幾年來(lái)計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的成熟,測(cè)試也出現(xiàn)了新的實(shí)現(xiàn)方式,即利用計(jì)算機(jī)作為測(cè)試工具,以網(wǎng)絡(luò)作為測(cè)試平臺(tái)的計(jì)算機(jī)自適應(yīng)測(cè)試(CAT)。大量的理論和實(shí)踐均證明,這種測(cè)試方法能夠有效解決傳統(tǒng)測(cè)試中存在的諸多問(wèn)題,包括過(guò)于簡(jiǎn)單或是過(guò)于困難的問(wèn)題耽誤被測(cè)試人員的測(cè)試時(shí)間,測(cè)試人員和測(cè)試題目的隨機(jī)性使得測(cè)試結(jié)果分析的可靠性下降等等?;诖?,“因人施測(cè)”的計(jì)算機(jī)自適應(yīng)測(cè)試具有重要的研究?jī)r(jià)值。
1 計(jì)算機(jī)自適應(yīng)測(cè)試的基本要素分析
不考慮測(cè)試系統(tǒng)的差異性,整個(gè)計(jì)算機(jī)自適應(yīng)測(cè)試的工作流程可概括如下。首先是隨機(jī)從數(shù)據(jù)庫(kù)中對(duì)測(cè)試項(xiàng)目進(jìn)行選擇并展示給測(cè)試對(duì)象,測(cè)試對(duì)象作出反應(yīng)后,計(jì)算機(jī)再根據(jù)其反應(yīng)情況得出能力水平的預(yù)估值,然后根據(jù)所得到的預(yù)估值繼續(xù)從數(shù)據(jù)庫(kù)中選擇與測(cè)試對(duì)象能力相匹配的測(cè)試項(xiàng)目。當(dāng)計(jì)算機(jī)判斷測(cè)試所得結(jié)果滿足測(cè)試程序的終止標(biāo)準(zhǔn)后,測(cè)試完成。根據(jù)其工作流程,可得出計(jì)算機(jī)自適應(yīng)測(cè)試的基本要素包括以下幾點(diǎn)。
1.1 數(shù)據(jù)庫(kù)/題庫(kù)
數(shù)據(jù)庫(kù)又稱作項(xiàng)目池或是題庫(kù),其是整個(gè)計(jì)算機(jī)自適應(yīng)測(cè)試中的核心組成成分,題庫(kù)的覆蓋范圍越廣,能力測(cè)試水平越強(qiáng),測(cè)試所需要的時(shí)間復(fù)雜度和空間復(fù)雜度也就越低,整個(gè)系統(tǒng)也就越有利于實(shí)現(xiàn)。
1.2 項(xiàng)目反應(yīng)模型
項(xiàng)目反應(yīng)模型用于描述測(cè)試對(duì)象對(duì)測(cè)試項(xiàng)目所作出的反映。當(dāng)使用相同的項(xiàng)目反應(yīng)模型時(shí),工具和數(shù)據(jù)庫(kù)對(duì)于測(cè)試效果的影響應(yīng)當(dāng)小于某一特定值。
1.3 項(xiàng)目選擇模型
項(xiàng)目選擇模型主要用于在計(jì)算機(jī)得到來(lái)自項(xiàng)目反映模型的反饋后,根據(jù)測(cè)試對(duì)象當(dāng)前階段被測(cè)試出的水平來(lái)選擇合適的測(cè)試項(xiàng)目。合適的項(xiàng)目選擇模型能夠有效保障測(cè)試的精度和準(zhǔn)確性,但過(guò)于復(fù)雜的項(xiàng)目選擇模型可以會(huì)需要花費(fèi)更多的測(cè)試時(shí)間。如何在兩者之間取得平衡,則于整個(gè)測(cè)試算法的選擇和優(yōu)化息息相關(guān)。
1.4 測(cè)試終止規(guī)則
測(cè)試終止規(guī)則類似于匯編語(yǔ)言中跳出某一循環(huán)的判斷條件,在計(jì)算機(jī)自適應(yīng)測(cè)試中,測(cè)試終止的規(guī)則往往基于不同的測(cè)試目的所建立,例如大眾化普遍性測(cè)試、娛樂(lè)性測(cè)試多采用較為簡(jiǎn)單的終止規(guī)則,但擇優(yōu)式考試、精英化考試則多采用較為精確的測(cè)試終止規(guī)則,以期望所得出的測(cè)試結(jié)果更為精確。
2 計(jì)算機(jī)自適應(yīng)測(cè)試若干關(guān)鍵技術(shù)研究
2.1 題庫(kù)構(gòu)建技術(shù)
顧名思義,題庫(kù)構(gòu)建技術(shù)即是針對(duì)計(jì)算機(jī)自適應(yīng)測(cè)試中數(shù)據(jù)庫(kù)/題庫(kù)的所建立的,其包括題庫(kù)的設(shè)計(jì)組織和項(xiàng)目參數(shù)的確定兩大方面。在題庫(kù)的設(shè)計(jì)和組織上,現(xiàn)階段廣泛采用的技術(shù)是基于課程結(jié)構(gòu)的架構(gòu)技術(shù),其優(yōu)勢(shì)在于操作簡(jiǎn)單,成本低廉,可行性強(qiáng)。但其缺陷同樣較為明顯,例如架構(gòu)過(guò)程中,技術(shù)人員往往缺乏對(duì)不熟悉領(lǐng)域內(nèi)知識(shí)結(jié)構(gòu)較為陌生,可能會(huì)出現(xiàn)項(xiàng)目結(jié)構(gòu)難以與知識(shí)結(jié)構(gòu)一一對(duì)應(yīng)的情況產(chǎn)生?;诖?,現(xiàn)階段題庫(kù)設(shè)計(jì)正在向著“以本體技術(shù)構(gòu)建領(lǐng)域本體,再輔以項(xiàng)目與知識(shí)點(diǎn)的合理分配”的趨勢(shì)不斷發(fā)展,通過(guò)兩者結(jié)合提升題庫(kù)設(shè)計(jì)的覆蓋面。而在項(xiàng)目參數(shù)的確定方面,題庫(kù)構(gòu)建技術(shù)對(duì)其有著極高的精確性要求,考慮到理論與實(shí)踐存在的差異,題庫(kù)構(gòu)建的初期被賦值的初始設(shè)置參數(shù)往往難以與實(shí)際運(yùn)行情況相匹配,這就需要相關(guān)人員隨著整個(gè)測(cè)試工作的進(jìn)行不斷對(duì)相關(guān)參數(shù)進(jìn)行二次修改及維護(hù),以解決專家法誤差大和IRT理論模型可行性差的重要難題。
2.2 項(xiàng)目選擇技術(shù)
項(xiàng)目選擇技術(shù)的關(guān)鍵在于項(xiàng)目信息量的確定以保障測(cè)試的精確性和有效性、項(xiàng)目曝光率的控制以保障測(cè)試系統(tǒng)的保密性、項(xiàng)目選擇速度、內(nèi)容覆蓋面等等。對(duì)于項(xiàng)目信息量的計(jì)算與確定,實(shí)際開(kāi)發(fā)過(guò)程中往往需要對(duì)整個(gè)題庫(kù)進(jìn)行掃描和讀取,然后取項(xiàng)目的總信息量,因此提升項(xiàng)目信息量的計(jì)算速度是極其重要的。而在所開(kāi)發(fā)的計(jì)算機(jī)自適應(yīng)技術(shù)正式投入商用或民用領(lǐng)域后,考慮到系統(tǒng)的偽隨機(jī)性,故項(xiàng)目曝光不均可能會(huì)對(duì)題庫(kù)的有效利用以及測(cè)試的保密性產(chǎn)生一定的影響,故需要利用項(xiàng)目曝光控制技術(shù)來(lái)對(duì)系統(tǒng)的安全性進(jìn)行控制,即通過(guò)降低高區(qū)分度項(xiàng)目的使用率,提升低區(qū)分度項(xiàng)目的使用率來(lái)延長(zhǎng)整個(gè)系統(tǒng)的使用壽命。除此以外,常使用的技術(shù)還包括內(nèi)容平衡處理技術(shù),題干曝光控制技術(shù)等等,這些技術(shù)對(duì)計(jì)算機(jī)自適應(yīng)測(cè)試技術(shù)在不同領(lǐng)域的應(yīng)用有著重要的意義。
2.3 能力評(píng)估技術(shù)
在測(cè)試對(duì)象對(duì)計(jì)算機(jī)所展示的題目做出選擇后,計(jì)算機(jī)需要將所獲得的反饋送入能力評(píng)估技術(shù)的核心處理器中,同時(shí)結(jié)合項(xiàng)目選擇技術(shù)做出對(duì)測(cè)試對(duì)象能力的合適評(píng)估,若測(cè)試此時(shí)未滿足測(cè)試終止條件,所得結(jié)果還將會(huì)作為新的能力水平值來(lái)選擇下一道測(cè)試項(xiàng)目。因此,能力評(píng)估技術(shù)的實(shí)現(xiàn)關(guān)鍵在于測(cè)試對(duì)象初始能力的設(shè)置以及測(cè)試過(guò)程中對(duì)測(cè)試對(duì)象能力的動(dòng)態(tài)估計(jì)?,F(xiàn)階段,測(cè)試對(duì)象初始能力的設(shè)置主要是基于定性預(yù)測(cè)技術(shù)所實(shí)現(xiàn)的,即測(cè)試管理人員基于測(cè)試對(duì)象的綜合素質(zhì),依照自身的經(jīng)驗(yàn)判斷能力和邏輯推理能力將初始條件輸入進(jìn)測(cè)試系統(tǒng)中。而測(cè)試過(guò)程中對(duì)測(cè)試對(duì)象能力的動(dòng)態(tài)估計(jì)則是基于大數(shù)據(jù)分析下的動(dòng)態(tài)預(yù)測(cè)技術(shù)所實(shí)現(xiàn)的。
2.4 測(cè)試終止技術(shù)
測(cè)試終止技術(shù)自身是較為簡(jiǎn)單的,以匯編語(yǔ)言為例,常使用的測(cè)試終止函數(shù)包括atexit()、switch-break、free等等。但測(cè)試終止技術(shù)的難點(diǎn)在于對(duì)退出測(cè)試的條件進(jìn)行判斷和篩選,其往往需要在考慮到被試的估計(jì)精度以及題庫(kù)中項(xiàng)目的使用情況的基礎(chǔ)上,盡可能降低測(cè)試時(shí)間,以提升使用效率。因此,測(cè)試終止技術(shù)往往需要對(duì)多種因素進(jìn)行綜合考慮,才可以確保測(cè)試的有效性。
3 結(jié)語(yǔ)
在現(xiàn)階段人才選拔和相關(guān)的能力測(cè)試領(lǐng)域當(dāng)中,計(jì)算機(jī)自適應(yīng)測(cè)試是一種集可行性、經(jīng)濟(jì)性、可靠性于一身的測(cè)試技術(shù),其不僅能夠“因人施測(cè)”,針對(duì)不同測(cè)試對(duì)象的特點(diǎn)選擇更具有代表性的測(cè)試項(xiàng)目,而且還能在測(cè)試過(guò)程中不斷對(duì)測(cè)試者的能力進(jìn)行動(dòng)態(tài)評(píng)估,從而取得更精確的測(cè)量結(jié)果。因此,相關(guān)人員應(yīng)當(dāng)立足于此,對(duì)計(jì)算機(jī)自適應(yīng)測(cè)試中的若干關(guān)鍵技術(shù)進(jìn)行研究和完善,以期望其能夠達(dá)到更優(yōu)秀的測(cè)試結(jié)果。
參考文獻(xiàn)
[1] 龔文斌.計(jì)算機(jī)自適應(yīng)測(cè)試技術(shù)研究[D].貴州大學(xué),2013.
[2] 尹華.基于計(jì)算機(jī)自適應(yīng)測(cè)試的胃痞患者報(bào)告結(jié)局量表研制[J].價(jià)值工程,2013(18):38-39.
[3] 孟科紫.計(jì)算機(jī)自適應(yīng)測(cè)驗(yàn)的測(cè)試流程與測(cè)試技術(shù)[R].創(chuàng)新與應(yīng)用,2014(3).
數(shù)字技術(shù)與應(yīng)用2015年11期