劉 洋 張建華
在警犬訓(xùn)練過程中,強(qiáng)化與懲罰的運(yùn)用是關(guān)系到訓(xùn)練效果的直接因素。但是大多數(shù)訓(xùn)導(dǎo)員極易將強(qiáng)化與懲罰的概念混淆,或者說知道兩者的概念,但是在實(shí)際訓(xùn)練中只注重使用正強(qiáng)化與正懲罰,而忽略負(fù)強(qiáng)化與負(fù)懲罰的運(yùn)用,這也是導(dǎo)致訓(xùn)練效果不理想的主要原因。本文從懲罰與強(qiáng)化的區(qū)別、懲罰的特點(diǎn)及影響懲罰效果的因素及其在警犬訓(xùn)練中的應(yīng)用等方面進(jìn)行簡(jiǎn)略探討。
懲罰是指當(dāng)犬出現(xiàn)某種行為后,呈現(xiàn)、增強(qiáng)厭惡刺激或失去、減少正強(qiáng)化物的獲得,從而使犬的這種行為出現(xiàn)的頻率降低、減少。“呈現(xiàn)、增強(qiáng)厭惡刺激”被稱為正懲罰,“去除正強(qiáng)化物”被稱為負(fù)懲罰。
強(qiáng)化是指當(dāng)犬出現(xiàn)某種行為后,呈現(xiàn)強(qiáng)化物或者去除厭惡刺激,從而使犬的這種行為出現(xiàn)的頻率提高、增多?!俺尸F(xiàn)強(qiáng)化物”被稱為正強(qiáng)化,“去除厭惡刺激”被稱為負(fù)強(qiáng)化。
由此可見,懲罰與強(qiáng)化的本質(zhì)區(qū)別是目標(biāo)行為減少與目標(biāo)行為增多。
在探討懲罰手段及運(yùn)用之前,訓(xùn)導(dǎo)員一定要對(duì)懲罰的特點(diǎn)及影響懲罰效果的因素有一個(gè)系統(tǒng)全面的掌握,方能正確有效地使用懲罰手段糾正犬的不良行為。
懲罰有立即性、情境性和復(fù)原性三大特點(diǎn)。立即性是指犬將要做出不良行為還未完全實(shí)施不良行為時(shí)立即糾正,方能達(dá)到“立竿見影”的糾正效果。情境性是指懲罰具有明顯的“時(shí)過境遷”現(xiàn)象,場(chǎng)地和懲罰者的變化都會(huì)引起犬不良行為的反彈。復(fù)原性是指懲罰容易導(dǎo)致犬的不良行為“死灰復(fù)燃”,在使用懲罰的同時(shí),一定要注重強(qiáng)化犬的良性行為來鞏固糾正效果。
影響懲罰效果的因素有以下七個(gè)方面:一致性、延緩性、連續(xù)性、變化性、時(shí)機(jī)、機(jī)體先前的狀態(tài)、對(duì)替代行為的強(qiáng)化。一致性是指對(duì)不良行為進(jìn)行懲罰,同時(shí)要避免懲罰無意中成為強(qiáng)化。延緩性是指發(fā)生不良行為的第一時(shí)間進(jìn)行懲罰,如果錯(cuò)過最佳懲罰時(shí)機(jī)的,可以刻意制造犬再次犯同樣錯(cuò)誤的情境,當(dāng)犬再次發(fā)生同樣的不良行為時(shí)及時(shí)給予懲罰。連續(xù)性是指糾正不良行為的初期,當(dāng)犬不良行為頻繁出現(xiàn)時(shí),有針對(duì)性地對(duì)同一不良行為使用連續(xù)懲罰,當(dāng)不良行為發(fā)生頻率下降后使用間歇懲罰。變化性是指經(jīng)常變換懲罰方式有助于提高懲罰效果,但不等于一次糾正使用多種懲罰方式對(duì)犬進(jìn)行懲罰。時(shí)機(jī)是指不良行為出現(xiàn)便立即懲罰。機(jī)體先前的狀態(tài)是指對(duì)于正懲罰而言,任何能增強(qiáng)刺激事件的厭惡特性的事件都能提高懲罰的效果,任何能降低刺激事件的厭惡特性的事件也能削弱懲罰的作用;對(duì)于負(fù)懲罰而言,饜足可以使某些強(qiáng)化物的損失的懲罰作用減弱,而剝奪則可以使某些強(qiáng)化物的損失的懲罰作用加強(qiáng)。對(duì)替代行為的強(qiáng)化是指懲罰不良行為,對(duì)替代不良行為的反應(yīng)即良性行為進(jìn)行強(qiáng)化。
正懲罰主要有機(jī)械刺激、反應(yīng)限制、矯枉過正等技術(shù)方法。機(jī)械刺激是指在犬出現(xiàn)不良行為后,使用手、木棒或電擊脖圈等及時(shí)給予犬擊打或電擊的厭惡刺激。反應(yīng)限制是指在犬出現(xiàn)不良行為時(shí),馬上采取措施對(duì)犬的身體進(jìn)行限制,以阻止或制止犬不良行為的繼續(xù)發(fā)生。矯枉過正是指當(dāng)犬不良行為發(fā)生后,設(shè)置與其發(fā)生不良行為相同的場(chǎng)景,復(fù)盤糾正,當(dāng)犬有不良行為表現(xiàn)的苗頭傾向時(shí),第一時(shí)間給予犬一個(gè)厭惡刺激,直至犬無視相關(guān)誘導(dǎo)其犯錯(cuò)的誘導(dǎo)物,不再出現(xiàn)不良行為。
負(fù)懲罰主要有隔離(也稱罰時(shí)出局、暫停強(qiáng)化)、反應(yīng)代價(jià)等技術(shù)方法。隔離是指在特定的情境中(犬會(huì)獲得正強(qiáng)化的情境)當(dāng)犬有不良行為出現(xiàn),將犬帶離一段時(shí)間,使其在隔離期間無法獲得強(qiáng)化的機(jī)會(huì),從而使不良行為未來發(fā)生的可能性減少。反應(yīng)代價(jià)是指當(dāng)不良行為出現(xiàn)時(shí),去除一定數(shù)量的強(qiáng)化物,從而使不良行為未來發(fā)生的可能性減少。
不了解這兩種技術(shù)的訓(xùn)導(dǎo)員可能認(rèn)為二者沒有不同,但其實(shí)是有顯著區(qū)別的,隔離強(qiáng)調(diào)的是將犬帶離場(chǎng)景,阻斷犬獲得強(qiáng)化物;而反應(yīng)代價(jià)強(qiáng)調(diào)的是直接減少或完全去除強(qiáng)化物。
行為一定是正在發(fā)生或發(fā)生了的反應(yīng)或動(dòng)作,一個(gè)行為可以是由多個(gè)行為構(gòu)成的。比如:當(dāng)訓(xùn)練犬銜取時(shí),訓(xùn)導(dǎo)員使用繩球逗引犬,犬先是注視繩球、再是跟隨繩球運(yùn)動(dòng)方向左右、上下運(yùn)動(dòng),最后當(dāng)訓(xùn)導(dǎo)員認(rèn)為犬注意力和興奮狀態(tài)達(dá)到較高點(diǎn)時(shí),使犬銜住繩球并扯拉繩球讓犬獲得繩球或吐球給予食物等方法獎(jiǎng)勵(lì)結(jié)束訓(xùn)練。但是當(dāng)犬在其中某一環(huán)節(jié)或者說是某一個(gè)行為出現(xiàn)問題的時(shí)候,訓(xùn)導(dǎo)員要單獨(dú)將這一行為拎出來進(jìn)行糾正。這過程中,犬可能在逗引過程中受外界干擾分心,對(duì)繩球不專注;或者犬銜不牢繩球或占有欲過強(qiáng)經(jīng)常誤傷訓(xùn)導(dǎo)員等。這里講的都是不良行為,訓(xùn)導(dǎo)員必須清楚地知道要糾正哪一個(gè)不良行為,在訓(xùn)練中才能做到有的放矢。
在糾正犬不良行為之前一定要做好懲罰前的準(zhǔn)備工作,如明確某種替代行為來糾正犬的不良行為、盡可能地控制犬出現(xiàn)不良行為的情境、訓(xùn)導(dǎo)員或助訓(xùn)員懲罰的態(tài)度、標(biāo)準(zhǔn)要一致等。對(duì)照影響懲罰效果的七大因素及時(shí)、連續(xù)、有變化地對(duì)犬的不良行為給予懲罰糾正。在實(shí)施懲罰過程中一定要注意對(duì)不良行為的懲罰不能伴有強(qiáng)化,確保懲罰不成為強(qiáng)化,但是對(duì)不良行為的替代行為可以進(jìn)行強(qiáng)化等。
新訓(xùn)導(dǎo)員極有可能掌握不好懲罰的時(shí)機(jī),導(dǎo)致良性行為被懲罰,將會(huì)使犬不知所措,并減少良性行為的發(fā)生;延遲懲罰是達(dá)不到糾正的效果的,懲罰和強(qiáng)化一樣,時(shí)機(jī)應(yīng)該在犬的行為出現(xiàn)后無限接近0 秒的時(shí)間做出才能達(dá)到最好的效果;懲罰不當(dāng),如過度懲罰(等同于體罰犬)或懲罰過于輕微都達(dá)不到糾正不良行為的目的。
訓(xùn)練過程中應(yīng)多使用正、副強(qiáng)化和負(fù)懲罰,而少使用正懲罰。因?yàn)檎龖土P會(huì)造成以下副作用:易使犬產(chǎn)生不良情緒甚至出現(xiàn)攻擊行為,可能造成犬逃避訓(xùn)練或厭訓(xùn),也可能成為一種強(qiáng)化即懲罰成癮(訓(xùn)導(dǎo)員只是懲罰的實(shí)施者,只有犬才知道訓(xùn)導(dǎo)員施于的懲罰是厭惡刺激還是強(qiáng)化)等。
總之,科學(xué)運(yùn)用懲罰手段是糾正犬不良行為的有效途徑,也是確保犬訓(xùn)練成功的重要秘訣。筆者認(rèn)為只有訓(xùn)導(dǎo)員能夠清醒地認(rèn)識(shí)行為與懲罰強(qiáng)化的關(guān)系,才能快速、高效地訓(xùn)出合格的工作犬。