于汝清 劉 帥 付奕銘
警犬訓(xùn)練中獎(jiǎng)勵(lì)手段的相關(guān)理論探究
于汝清 劉 帥 付奕銘
為了更好地服務(wù)實(shí)訓(xùn),本文將獎(jiǎng)勵(lì)手段按照定義、在警犬訓(xùn)練中的地位、獎(jiǎng)勵(lì)手段特點(diǎn)、形式組成、劃分標(biāo)準(zhǔn)、運(yùn)用必要性以及不同形式獎(jiǎng)勵(lì)手段的有機(jī)結(jié)合等七個(gè)方面進(jìn)行分別論述,對警犬訓(xùn)練中獎(jiǎng)勵(lì)手段的相關(guān)理論進(jìn)行探究。
獎(jiǎng)勵(lì)手段是指訓(xùn)導(dǎo)員或者助訓(xùn)員為加速培養(yǎng)和鞏固犬的能力,對犬服從指揮做出正確動(dòng)作進(jìn)行正強(qiáng)化的手段。
獎(jiǎng)勵(lì)手段在警犬訓(xùn)練當(dāng)中至關(guān)重要,常常伴隨著整個(gè)訓(xùn)練的始終。它是使犬形成條件反射、對訓(xùn)導(dǎo)員建立依戀性、使犬樂于接受訓(xùn)練、使犬建立自信心、調(diào)整緩和犬神經(jīng)活動(dòng)狀態(tài)等環(huán)節(jié)中重要的、必不可少的手段。牢固掌握和正確地運(yùn)用獎(jiǎng)勵(lì)手段,是一名合格的訓(xùn)導(dǎo)員應(yīng)當(dāng)具備的基本能力,也是警犬能力提高的必要條件。
獎(jiǎng)勵(lì)手段具有獎(jiǎng)勵(lì)形式多樣化、應(yīng)注意細(xì)節(jié)多、運(yùn)用時(shí)應(yīng)因犬而異、因科目而異和因時(shí)而異的特點(diǎn)。
(一)獎(jiǎng)勵(lì)形式多樣化,應(yīng)注意細(xì)節(jié)多
多樣化是指獎(jiǎng)勵(lì)手段分為獎(jiǎng)食、撫拍、游散、口令“好”、銜取五種獎(jiǎng)勵(lì)方式。應(yīng)注意細(xì)節(jié)多是指這五種獎(jiǎng)勵(lì)方式各自還可以細(xì)化出很多運(yùn)用細(xì)節(jié),需要訓(xùn)導(dǎo)員嚴(yán)格把握。
(二)運(yùn)用時(shí)應(yīng)因犬而異
犬存在著個(gè)體差異和犬種差異,不同犬所需要的獎(jiǎng)勵(lì)手段和因素是不同的。
(三)運(yùn)用時(shí)應(yīng)因科目而異
獎(jiǎng)勵(lì)手段的幾種獎(jiǎng)勵(lì)形式均不是可以通用于任何一個(gè)科目的,我們應(yīng)根據(jù)科目的不同選取最佳的獎(jiǎng)勵(lì)手段。
(四)運(yùn)用時(shí)應(yīng)因時(shí)而異
每一天的不同訓(xùn)練時(shí)間段、犬的不同生長發(fā)育時(shí)期、訓(xùn)練同一科目的不同時(shí)期,犬所需要的最佳獎(jiǎng)勵(lì)手段都是不同的。
獎(jiǎng)勵(lì)手段的形式通常包括獎(jiǎng)食獎(jiǎng)勵(lì)手段、撫拍獎(jiǎng)勵(lì)手段、游散獎(jiǎng)勵(lì)手段、口令“好”獎(jiǎng)勵(lì)手段、銜取獎(jiǎng)勵(lì)手段等能起到強(qiáng)化犬的正確行為作用的手段。這些手段均是通過使犬的神經(jīng)中樞產(chǎn)生興奮來達(dá)到獎(jiǎng)勵(lì)效果的。
(一)獎(jiǎng)食獎(jiǎng)勵(lì)手段
食物對于犬具有重要的生物學(xué)意義,易于引起犬的食欲,富有引誘性,能夠使犬的味覺中樞產(chǎn)生興奮。給予犬獎(jiǎng)食可以使犬在食欲上得到滿足,從而起到對犬的獎(jiǎng)勵(lì)作用。
(二)撫拍獎(jiǎng)勵(lì)手段
撫拍能夠使犬的觸覺中樞產(chǎn)生興奮,使犬得到一種愛撫、舒適的感覺,同時(shí)也能使犬感覺到訓(xùn)導(dǎo)員對自己的安慰,從而起到對犬的獎(jiǎng)勵(lì)作用。
(三)游散獎(jiǎng)勵(lì)手段
令犬游散可以滿足犬的自由反射和游戲欲望。在較長時(shí)間的訓(xùn)練當(dāng)中,由于行動(dòng)受到約束或者由于作業(yè)負(fù)擔(dān)而感到緊張時(shí),犬非??释杂?。因此,在犬完成某一動(dòng)作或科目后,令其游散,犬往往會(huì)感到非常愉快舒暢,這樣既能起到獎(jiǎng)勵(lì)犬的作用,同時(shí)還能使犬神經(jīng)活動(dòng)的緊張狀態(tài)得到緩和,對繼續(xù)訓(xùn)練很有益處。
(四)口令“好”獎(jiǎng)勵(lì)手段
口令“好”是需要結(jié)合其它非條件性獎(jiǎng)勵(lì)手段,多次重復(fù)結(jié)合,使犬建立某些條件反射后,犬才能對口令“好”產(chǎn)生興奮反應(yīng),從而起到獎(jiǎng)勵(lì)作用。
(五)“響片”獎(jiǎng)勵(lì)手段
“響片”是指通過手指按壓能夠產(chǎn)生清脆“卡塔”聲響的小型訓(xùn)練器械。使用原理等同于口令“好”獎(jiǎng)勵(lì),也是需要結(jié)合其它非條件性獎(jiǎng)勵(lì)手段,多次重復(fù)結(jié)合,使犬建立某些條件反射后,犬才能對 “響片”的“卡塔”聲產(chǎn)生興奮反應(yīng),從而起到獎(jiǎng)勵(lì)作用。
(六)銜取獎(jiǎng)勵(lì)手段
銜取獎(jiǎng)勵(lì)手段對于多數(shù)犬來說是一種獵取欲望的追求和滿足,能引起其神經(jīng)活動(dòng)過程產(chǎn)生興奮。因此,在犬做出正確行為動(dòng)作后,給予其銜取物,能使犬產(chǎn)生興奮反應(yīng),從而起到獎(jiǎng)勵(lì)作用。
(一)條件性獎(jiǎng)勵(lì)手段和非條件性獎(jiǎng)勵(lì)手段
根據(jù)是否需要后天培養(yǎng)才能起到獎(jiǎng)勵(lì)效果,可將獎(jiǎng)勵(lì)手段分為條件性獎(jiǎng)勵(lì)手段和非條件性獎(jiǎng)勵(lì)手段。條件性獎(jiǎng)勵(lì)手段是指必須通過某種形式和內(nèi)容的后天培養(yǎng)才能起到獎(jiǎng)勵(lì)效果的手段,包括口令“好”獎(jiǎng)勵(lì)手段,以及類似口令“好”的信號獎(jiǎng)勵(lì)手段,如“響片”;非條件性獎(jiǎng)勵(lì)手段是指不需要后天訓(xùn)練培養(yǎng)、犬與生俱來的、一旦運(yùn)用就能起到獎(jiǎng)勵(lì)作用的手段,獎(jiǎng)食、撫拍、游散、銜取是非條件性獎(jiǎng)勵(lì)手段。
(二)一般性獎(jiǎng)勵(lì)手段和結(jié)束性獎(jiǎng)勵(lì)手段
根據(jù)獎(jiǎng)勵(lì)效果對訓(xùn)練產(chǎn)生的影響,可將獎(jiǎng)勵(lì)手段分為一般性獎(jiǎng)勵(lì)手段和結(jié)束性獎(jiǎng)勵(lì)手段。在通常情況下,不影響犬的作業(yè)過程的獎(jiǎng)勵(lì)手段稱為一般性獎(jiǎng)勵(lì)手段;一旦運(yùn)用就意味著訓(xùn)練結(jié)束的獎(jiǎng)勵(lì)手段稱為結(jié)束性獎(jiǎng)勵(lì)手段。例如,在訓(xùn)練犬追蹤時(shí),犬按照布置的跡線低頭嗅認(rèn)時(shí),給予犬口令“好”獎(jiǎng)勵(lì)或者適度的撫拍獎(jiǎng)勵(lì),不會(huì)影響其繼續(xù)嗅認(rèn),此時(shí)口令“好”和適度的撫拍獎(jiǎng)勵(lì)是一般性獎(jiǎng)勵(lì)手段;當(dāng)犬按照布置的跡線完成整個(gè)嗅認(rèn)過程后,我們在跡線終點(diǎn)放置銜取物獎(jiǎng)勵(lì)犬,此時(shí)的銜取獎(jiǎng)勵(lì)為結(jié)束性獎(jiǎng)勵(lì)手段。為了快速掌握兩種獎(jiǎng)勵(lì)手段,我們需要在同一次訓(xùn)練或者同一組訓(xùn)練當(dāng)中預(yù)先設(shè)計(jì)好訓(xùn)練方案,明確何時(shí)要繼續(xù)訓(xùn)練,何時(shí)結(jié)束訓(xùn)練,要繼續(xù)訓(xùn)練時(shí)運(yùn)用一般性獎(jiǎng)勵(lì)手段,要結(jié)束時(shí)運(yùn)用結(jié)束性獎(jiǎng)勵(lì)手段。有針對性地使用這兩種獎(jiǎng)勵(lì)手段,可以使訓(xùn)練流暢而高效。
(三)即時(shí)性獎(jiǎng)勵(lì)手段和延時(shí)性獎(jiǎng)勵(lì)手段
根據(jù)對犬獎(jiǎng)勵(lì)時(shí)機(jī)的不同,可將獎(jiǎng)勵(lì)手段分為即時(shí)性獎(jiǎng)勵(lì)手段和延時(shí)性獎(jiǎng)勵(lì)手段。即時(shí)性獎(jiǎng)勵(lì)是指當(dāng)犬完成動(dòng)作或行為符合我們預(yù)期時(shí),第一時(shí)間獎(jiǎng)勵(lì)犬;延時(shí)性獎(jiǎng)勵(lì)是指當(dāng)犬完成動(dòng)作或行為符合我們預(yù)期時(shí),隔一段時(shí)間再運(yùn)用獎(jiǎng)勵(lì)手段。例如,在訓(xùn)練犬“坐”科目時(shí),犬服從指揮坐下就立即下達(dá)口令“好”來獎(jiǎng)勵(lì)犬,這就是即時(shí)性獎(jiǎng)勵(lì)手段;在逐步塑造犬坐延緩能力的時(shí)候,我們希望犬坐延緩的時(shí)間越來越長,隨著犬延緩能力的提高,獎(jiǎng)勵(lì)手段的運(yùn)用愈加具有延時(shí)性,即并非犬坐下就給予獎(jiǎng)勵(lì),而是坐了一定時(shí)間后再獎(jiǎng)勵(lì)犬,此時(shí)的獎(jiǎng)勵(lì)手段為延時(shí)性獎(jiǎng)勵(lì)手段。即時(shí)性獎(jiǎng)勵(lì)手段可以及時(shí)迅速起到強(qiáng)化犬的作用,利于犬的條件反射的建立,促使科目的形成;延時(shí)性獎(jiǎng)勵(lì)手段則可以使犬科目形成更具穩(wěn)定性,有利于科目的鞏固和提高。
(四)瞬時(shí)性獎(jiǎng)勵(lì)手段和持續(xù)性獎(jiǎng)勵(lì)手段
根據(jù)獎(jiǎng)勵(lì)在時(shí)間上是否具有延續(xù)性,可將獎(jiǎng)勵(lì)手段分為瞬時(shí)性獎(jiǎng)勵(lì)手段和持續(xù)性獎(jiǎng)勵(lì)手段。瞬時(shí)性獎(jiǎng)勵(lì)手段是指獎(jiǎng)勵(lì)在一瞬間發(fā)生和結(jié)束的獎(jiǎng)勵(lì)手段;持續(xù)性獎(jiǎng)勵(lì)手段是指獎(jiǎng)勵(lì)在時(shí)間上具有一定持續(xù)性的獎(jiǎng)勵(lì)手段。例如,口令“好”、自由掉落犬口中“入口即化”的獎(jiǎng)食均屬于瞬時(shí)性獎(jiǎng)勵(lì)手段。在犬完成所訓(xùn)科目后,將犬帶到身邊持續(xù)撫拍獎(jiǎng)勵(lì)犬;犬完成所訓(xùn)練科目后,令犬游散一定時(shí)間,或者將游散轉(zhuǎn)化為與其互動(dòng)游戲一定時(shí)間,此時(shí)的獎(jiǎng)勵(lì)手段即為持續(xù)性獎(jiǎng)勵(lì)手段。
(五)單一獎(jiǎng)勵(lì)手段和復(fù)合獎(jiǎng)勵(lì)手段
根據(jù)獎(jiǎng)勵(lì)在運(yùn)用時(shí)同時(shí)采用的獎(jiǎng)勵(lì)形式數(shù)目,可將獎(jiǎng)勵(lì)手段分為單一獎(jiǎng)勵(lì)手段和復(fù)合獎(jiǎng)勵(lì)手段。單一獎(jiǎng)勵(lì)手段是指在獎(jiǎng)勵(lì)犬的正確行為動(dòng)作時(shí),采用且僅采用一種獎(jiǎng)勵(lì)形式獎(jiǎng)勵(lì)犬;復(fù)合獎(jiǎng)勵(lì)手段是指在獎(jiǎng)勵(lì)犬的正確行為動(dòng)作時(shí),同時(shí)采用兩種或者多種獎(jiǎng)勵(lì)形式對犬進(jìn)行獎(jiǎng)勵(lì)。
在日常訓(xùn)練中,大多數(shù)情況下我們都應(yīng)該根據(jù)不同的訓(xùn)練狀態(tài),運(yùn)用不同的獎(jiǎng)勵(lì)手段來獎(jiǎng)勵(lì)犬的正確行為,我們稱之為常規(guī)情況。但是有一些非常規(guī)情況下是不宜或者不可以運(yùn)用獎(jiǎng)勵(lì)手段的,以下列舉幾種非常規(guī)情況下不宜或者不可以運(yùn)用獎(jiǎng)勵(lì)手段的例子。
(一)犬被施以懲罰之后不可以立即運(yùn)用獎(jiǎng)勵(lì)手段
當(dāng)犬做出非期望動(dòng)作或行為時(shí),我們通常采取機(jī)械刺激或者口令“非”等懲罰性手段來刺激犬,以糾正其錯(cuò)誤動(dòng)作或行為。有的訓(xùn)導(dǎo)員擔(dān)心犬因此會(huì)變得被動(dòng),常常會(huì)立即獎(jiǎng)勵(lì)犬,以緩和犬的神經(jīng)活動(dòng)狀態(tài)。但此時(shí)是不應(yīng)當(dāng)立即使用獎(jiǎng)勵(lì)手段的,因?yàn)闀?huì)造成犬的“誤解”,犬往往會(huì)理解為獎(jiǎng)勵(lì)的是其剛才錯(cuò)誤動(dòng)作或行為,從而導(dǎo)致錯(cuò)上加錯(cuò),未糾正錯(cuò)誤反而強(qiáng)化了錯(cuò)誤。例如,有些犬興奮的時(shí)候會(huì)銜咬甚至撕咬訓(xùn)導(dǎo)員的衣褲,這是我們不希望看到的行為,此時(shí)需要給犬機(jī)械刺激,倘若此時(shí)立即給予犬獎(jiǎng)勵(lì)以緩和其被刺激后的神經(jīng)狀態(tài),犬會(huì)理解為訓(xùn)導(dǎo)員在鼓勵(lì)其撕咬衣褲,下次犬還會(huì)繼續(xù)撕咬。正確的處理方式是應(yīng)該在犬被機(jī)械刺激后,通過進(jìn)行其他訓(xùn)練以轉(zhuǎn)移其注意力或者不予理睬的方式處理,決不能立即運(yùn)用獎(jiǎng)勵(lì)手段。
(二)需要采用“零強(qiáng)化”時(shí)不運(yùn)用獎(jiǎng)勵(lì)手段獎(jiǎng)勵(lì)犬
“零強(qiáng)化”是指當(dāng)犬做出某一動(dòng)作時(shí),不給予犬強(qiáng)化,使用這一手段的條件是:當(dāng)訓(xùn)導(dǎo)員不確定犬做出的動(dòng)作正確或者錯(cuò)誤,或者不宜使用懲罰時(shí)。例如,訓(xùn)導(dǎo)員引導(dǎo)犬扒鑒別罐時(shí),犬忽然對扒倒的鑒別罐有興趣并產(chǎn)生拱、扒等游戲行為時(shí),如果此時(shí)訓(xùn)導(dǎo)員獎(jiǎng)勵(lì)犬,則犬在日后會(huì)對鑒別罐興奮,形成“見罐就扒”的不良聯(lián)系;此時(shí)訓(xùn)導(dǎo)員也不宜采用懲罰犬的方式,以免造成犬對鑒別罐被動(dòng)的情況發(fā)生。正確的作法是訓(xùn)導(dǎo)員應(yīng)及時(shí)帶犬離開鑒別罐,以忽視、不獎(jiǎng)勵(lì)、不懲罰、“零強(qiáng)化”方法減弱犬玩罐的活動(dòng),從而減少犬再次出現(xiàn)此行為的可能性。
獎(jiǎng)食、撫拍、口令“好”(響片)、游散、銜取幾種獎(jiǎng)勵(lì)手段在犬的初期警用性能培養(yǎng)階段均可以單一使用,但是,隨著訓(xùn)練的時(shí)間和難度的增長,單一的獎(jiǎng)勵(lì)手段的獎(jiǎng)勵(lì)效果對犬來說是遠(yuǎn)遠(yuǎn)不夠的。過于單一的獎(jiǎng)勵(lì)手段或者某種獎(jiǎng)勵(lì)手段單調(diào)頻繁的使用,往往會(huì)造成獎(jiǎng)勵(lì)不充分,使犬對所訓(xùn)練的內(nèi)容不興奮,甚至產(chǎn)生抑制。獎(jiǎng)勵(lì)手段的多樣化和不規(guī)律化能使犬在訓(xùn)練中自始至終保持愉悅感,進(jìn)而保持良好的受訓(xùn)狀態(tài)。而將各種獎(jiǎng)勵(lì)方式有機(jī)結(jié)合可以達(dá)到獎(jiǎng)勵(lì)手段的多樣化和不規(guī)律化的效果。也就是說,不同獎(jiǎng)勵(lì)手段的有機(jī)結(jié)合是對犬獎(jiǎng)勵(lì)效果充分到位、是使犬擁有良好的受訓(xùn)狀態(tài)和作業(yè)狀態(tài)的有力保障。因此,當(dāng)進(jìn)入復(fù)雜科目、較難條件反射建立階段,應(yīng)將單項(xiàng)獎(jiǎng)勵(lì)有機(jī)結(jié)合起來,增加強(qiáng)度,來強(qiáng)化犬的正確有效行為。
獎(jiǎng)勵(lì)手段無論是在理論層面,還是實(shí)訓(xùn)操作層面均是一個(gè)老生常談的話題,但是獎(jiǎng)勵(lì)手段仍然是一個(gè)易懂易會(huì)卻難以精準(zhǔn)把握和靈活運(yùn)用的訓(xùn)練手段。本文對警犬訓(xùn)練中獎(jiǎng)勵(lì)手段的相關(guān)理論進(jìn)行探究,旨在能夠?yàn)閺V大訓(xùn)導(dǎo)員理清以上所提及的獎(jiǎng)勵(lì)手段相關(guān)理論脈絡(luò),方便記憶,力圖在訓(xùn)導(dǎo)員自身的理論體系構(gòu)建中和日常訓(xùn)練中提供幫助??偠灾_而靈活地掌握獎(jiǎng)勵(lì)手段是高效訓(xùn)犬的有力保障,可以在實(shí)訓(xùn)中少走彎路,達(dá)到事半功倍的效果。
(作者單位:公安部警犬技術(shù)學(xué)校,110000)
(編輯:顏 勤)