衛(wèi)思彤
鞍山市鞍鋼高級中學(xué)
學(xué)生個體與監(jiān)考人員間的博弈模型建立
衛(wèi)思彤
鞍山市鞍鋼高級中學(xué)
本文將運(yùn)用博弈和演化手段,通過構(gòu)建考生個體與監(jiān)考人員間的博弈模型,和考生群體在學(xué)校對監(jiān)考人員采取不同激勵政策的條件下的演化模型,研究在一定條件下激勵政策與作弊人數(shù)比例間的關(guān)系。
學(xué)生個體;監(jiān)考人員;博弈
考試是教學(xué)過程中的一個重要環(huán)節(jié),考試作弊現(xiàn)象伴隨著考試制度的出現(xiàn)而出現(xiàn),在各高等院校均有不同程度的存在,且有愈演愈烈的趨勢。除去考生自身方面的因素,如學(xué)業(yè)外的其它瑣事分散了時間和精力等,影響考生個人是否作弊之外,還有另一個重要的影響因素是監(jiān)考人員(考場老師)對參與考試的所有考生的統(tǒng)一監(jiān)考策略。具體分析如下:
一方面是學(xué)生個人與監(jiān)考人員的博弈。作弊在一定條件下會使考生獲得更高收益,例如得到更高分?jǐn)?shù);同時也有一定風(fēng)險被監(jiān)考人員發(fā)現(xiàn)并除以責(zé)罰。作為經(jīng)濟(jì)人,每位考生都將時刻遵循收益最大化原則做出決策,即自己承擔(dān)最小風(fēng)險及付出最低成本以獲取最大收益。因此考生是否選擇作弊及選擇使用何種作弊手段將直接被監(jiān)考人員的監(jiān)考策略影響。監(jiān)考人員采取兩種監(jiān)考策略“嚴(yán)格監(jiān)考”與“不嚴(yán)格監(jiān)考”,和考生采取兩種應(yīng)對策略“作弊”與“不作弊”及“作弊”策略中的三種作弊手段“手機(jī)作弊”“打小抄”“抄同學(xué)”,雙方都不能通過單獨(dú)改變策略或概率以改善自身的期望得益,因此構(gòu)成混合策略納什均衡,也是該博弈模型的唯一納什均衡解。
另一方面是學(xué)校管理層給予監(jiān)考人員一定激勵機(jī)制。監(jiān)考人員采取兩種監(jiān)考策略“嚴(yán)格監(jiān)考”與“不嚴(yán)格監(jiān)考”的意愿直接決定于學(xué)校管理層給出的對激勵其監(jiān)考嚴(yán)格的機(jī)制,顯然激勵程度越高或稱為強(qiáng)策略(通常表現(xiàn)在更高的報酬﹑更優(yōu)的評級),監(jiān)考人員“嚴(yán)格監(jiān)考”意愿越強(qiáng)烈即概率越大,考生作弊被發(fā)現(xiàn)風(fēng)險越高,考生收益下降甚至為負(fù)。激勵程度越低則恰恰相反。因此單個考生的作弊決策也間接受學(xué)校管理層制定的激勵機(jī)制的影響。
1.博弈過程說明
t=0時,學(xué)校管理層給出激勵政策直接決定監(jiān)考人員收益類型。在這里,假設(shè)學(xué)校采取強(qiáng)激勵策略的概率為θ,弱激勵策略的概率為1-θ。因此也可將θ視為激勵強(qiáng)度,此處θ可視為博弈過程中的外生變量,它影響模型中其他變量的值,但不受其他變量的影響。則θ可以作為考生與監(jiān)考人員的共同信息,即學(xué)校管理層的激勵政策完全對另外兩方公開。因此考生能夠確定本場考試中所遇到的監(jiān)考人員是何種收益類型的概率,雖然考生并不能確定監(jiān)考人員的具體收益類型。
t=1時,監(jiān)考人員進(jìn)入考場的同時向考生給出其監(jiān)考策略“嚴(yán)格”(t1)或“不嚴(yán)格”(t2),此步驟對應(yīng)的實(shí)際現(xiàn)象是,考生可以在監(jiān)考人員進(jìn)入考場的幾分鐘及考試開始不久的短暫時間內(nèi),通過對監(jiān)考人員言語和行為判斷出監(jiān)考人員是否嚴(yán)格。
t=2時,選擇作弊的學(xué)生給出對應(yīng)的作弊策略:“手機(jī)作弊”(s1),“打小抄”(s2),“抄同學(xué)”(s3),此博弈可進(jìn)行重復(fù)博弈分析,即可在充分多次博弈后得到最佳混合策略。
2.符號說明
表1
3.模型過程具體分析
t1 t2 V1V2
分析,此時博弈完成,給出雙方受益矩陣及期望。
3.1 學(xué)生收益矩陣及期望
(1)T=t1,即監(jiān)考人員采取嚴(yán)格策略,又在重復(fù)博弈中,監(jiān)考人員采取嚴(yán)格策略的概率為,則。
(2)T=t2,即監(jiān)考人員采取非嚴(yán)格策略,又在重復(fù)博弈中,監(jiān)考人員采取不嚴(yán)格策略的概率為則學(xué)生收益期望為
3.2 監(jiān)考人員收益矩陣及期望
(1)監(jiān)考人員收益類型為V1,此時。所以期望為
(2)監(jiān)考人員收益類型為V2,此時所以期望為
綜上
至此,博弈建立完成。
文章通過構(gòu)建考生個體與監(jiān)考人員間的博弈模型,和考生群體在學(xué)校對監(jiān)考人員采取不同激勵政策的條件下的演化模型,結(jié)合數(shù)理推到與統(tǒng)計結(jié)果,經(jīng)過計算機(jī)的演化模擬,最終得到作弊人數(shù)N關(guān)于激勵強(qiáng)度 的關(guān)系。
此結(jié)果對于學(xué)校的實(shí)際參考意義是:
(1)提供一個有價值的,能夠作為參考讓學(xué)校決定控制作弊人數(shù)手段的模型。論文中各項參數(shù)皆可通過統(tǒng)計學(xué)方法得到,學(xué)??梢杂么四P蛷墓芾韺用娴玫娇刂谱鞅兹藬?shù)在一定范圍內(nèi)的最經(jīng)濟(jì)手段。
(2)說明學(xué)校需要將激勵政策強(qiáng)度控制在一定范圍,當(dāng)激勵政策達(dá)到一定強(qiáng)度時,學(xué)校若繼續(xù)加強(qiáng),只會造成成本的浪費(fèi)。即模型中激勵政策的調(diào)節(jié)函數(shù)與橫軸有交點(diǎn)。
[1]于久洪,張劍.基于貝葉斯博弈的銀行貸款定價研究;統(tǒng)計與決策,2010,(7)
[2] Gy¨orgy Szab′o, Kinga S. Bod′o, Benjamin Allen, and Martin A. Nowak.Four classes of interactions for evolutionary games; Physical Review E 92, 022820 (2015)