許普之 李 濤 楊 毅
眾所周知,斯金納提出的操作性條件反射理論正被廣泛應(yīng)用于警犬訓(xùn)練之中,其核心觀點(diǎn)為人或動(dòng)物為了達(dá)到自身的某種需求,會(huì)采取一定的行為,而當(dāng)這種行為的后果是對(duì)自身有利或者正向時(shí),那么這種行為在以后出現(xiàn)的頻率就會(huì)增加,反之則減少或完全消退。我們可以利用這種正強(qiáng)化或負(fù)強(qiáng)化的方法來(lái)決定動(dòng)物行為的后果,從而達(dá)到固定所需的特定行為,這就是強(qiáng)化理論。目前,在警犬訓(xùn)練中的獎(jiǎng)勵(lì)正是基于強(qiáng)化理論中的正強(qiáng)化方法,訓(xùn)導(dǎo)員在訓(xùn)練中在恰當(dāng)?shù)臅r(shí)機(jī)通過(guò)給予犬食物、物品、撫拍、聲音等獎(jiǎng)勵(lì),對(duì)所需行為起到正強(qiáng)化作用從而達(dá)到訓(xùn)練目的。本文結(jié)合斯金納的強(qiáng)化理論分析警犬訓(xùn)練中獎(jiǎng)勵(lì)物的選擇、獎(jiǎng)勵(lì)時(shí)機(jī)的把握以及獎(jiǎng)勵(lì)的原則等內(nèi)容,以期與業(yè)內(nèi)人士共同探討提高。
斯金納的強(qiáng)化理論中提出強(qiáng)化作用與使用強(qiáng)化物是分不開的,這里所說(shuō)的強(qiáng)化物不一定是實(shí)物(食物、物品等),也可以是行為(撫拍、聲音)、表情等。在實(shí)際操作中,強(qiáng)化物的概念更為寬泛,我們將可以刺激動(dòng)物再次出現(xiàn)某種行為的行為本身或由它帶來(lái)的后果,都?xì)w為強(qiáng)化物。通過(guò)使用某種強(qiáng)化物,能使所需的行為發(fā)生概率增加,動(dòng)物受到這種強(qiáng)化物的正向刺激,表現(xiàn)出積極性增高,這就是正強(qiáng)化,那么該強(qiáng)化物即為正強(qiáng)化物。正是因?yàn)閺?qiáng)化物在塑造動(dòng)物的行為上有著極大作用,所以在警犬訓(xùn)練中正強(qiáng)化物的選擇也就是通常說(shuō)的獎(jiǎng)勵(lì)物的選擇就顯得格外重要。
通常來(lái)說(shuō)警犬訓(xùn)導(dǎo)員對(duì)獎(jiǎng)勵(lì)物的選擇至少要考慮三個(gè)方面的因素:訓(xùn)導(dǎo)員便于提供和給予、警犬能夠接受、對(duì)警犬能夠起到正強(qiáng)化效果。在警犬訓(xùn)練中,訓(xùn)導(dǎo)員應(yīng)當(dāng)基于以上三個(gè)方面來(lái)選擇強(qiáng)化物,同時(shí)還應(yīng)考慮到便捷易用和成本限制的問(wèn)題。在大多數(shù)情況下,在訓(xùn)練中訓(xùn)導(dǎo)員會(huì)在犬完成動(dòng)作后給予撫拍、“好”的口令以及食物(犬糧、肉粒)、球類、咬包或其他玩具等物品作為獎(jiǎng)勵(lì)。除此之外,要使正強(qiáng)化能達(dá)到理想的效果,對(duì)獎(jiǎng)勵(lì)物的恰當(dāng)使用是很重要的。一般來(lái)說(shuō),在開始訓(xùn)練前,首先要弄清本次訓(xùn)練的目標(biāo)與訓(xùn)練科目難度以及受訓(xùn)犬的能力強(qiáng)弱,然后針對(duì)訓(xùn)練的特點(diǎn)使用恰當(dāng)?shù)膹?qiáng)化物。例如在基礎(chǔ)科目中的“坐”“臥”“立” “來(lái)”等科目的訓(xùn)練,訓(xùn)導(dǎo)員可以選擇使用強(qiáng)化效力較小的獎(jiǎng)勵(lì)物,例如犬糧、肉粒等且考慮到訓(xùn)練的連貫性與重復(fù)性,單次獎(jiǎng)勵(lì)的量不宜過(guò)多;在訓(xùn)練基礎(chǔ)科目中的“隨行”或者使用科目尤其是搜索類科目時(shí),選擇使用強(qiáng)化效力較大的獎(jiǎng)勵(lì)物,例如球類、咬包或其他玩具等物品??傊?,在訓(xùn)練中通過(guò)使用恰當(dāng)?shù)莫?jiǎng)勵(lì)物,可以使訓(xùn)練成效最大化。
需要注意的是獎(jiǎng)勵(lì)物效用的大小還與接受獎(jiǎng)勵(lì)的警犬有關(guān)。某種獎(jiǎng)勵(lì)能否達(dá)到相應(yīng)的激勵(lì)效果,取決于該獎(jiǎng)勵(lì)物的運(yùn)用是否恰當(dāng)合適,而評(píng)估該獎(jiǎng)勵(lì)物運(yùn)用的恰當(dāng)與否,又取決于施加的該獎(jiǎng)勵(lì)物作用對(duì)象的接受程度。因此,在警犬訓(xùn)練中選擇獎(jiǎng)勵(lì)物時(shí)必須考慮到警犬的特質(zhì)。比如,麻棒一般能夠起到獎(jiǎng)勵(lì)作用,但是在較小月齡的犬的訓(xùn)練中卻難以達(dá)到相應(yīng)的獎(jiǎng)勵(lì)效果,理由很簡(jiǎn)單,較硬的麻棒不適宜幼齡犬的牙齒,此階段的訓(xùn)練,小的咬包或者球反而更為合適。對(duì)于食物動(dòng)力強(qiáng)的犬,選用較易獲得的犬糧或者肉粒作為訓(xùn)練中的獎(jiǎng)勵(lì),可以在達(dá)到獎(jiǎng)勵(lì)效果的同時(shí)也能保障訓(xùn)練的連續(xù)開展;對(duì)于銜取欲望和占有欲望強(qiáng)的犬則適于選用該犬喜歡的銜取物品作為獎(jiǎng)勵(lì)物進(jìn)行訓(xùn)練。所以,在訓(xùn)練中采用獎(jiǎng)勵(lì)手段時(shí),獎(jiǎng)勵(lì)物的選擇應(yīng)該根據(jù)警犬的個(gè)體特點(diǎn)和訓(xùn)練目標(biāo)進(jìn)行調(diào)整,以確保獎(jiǎng)勵(lì)對(duì)警犬具有意義。
在警犬訓(xùn)練中,獎(jiǎng)勵(lì)時(shí)機(jī)的把握對(duì)訓(xùn)練效果的好壞有著直接聯(lián)系,斯金納的強(qiáng)化理論強(qiáng)調(diào)的動(dòng)物行為與其帶來(lái)的結(jié)果之間存在某種聯(lián)系,可以通過(guò)強(qiáng)化來(lái)促進(jìn)這種聯(lián)系的建立,從而促進(jìn)動(dòng)物行為的發(fā)生。同樣,在警犬訓(xùn)練中,訓(xùn)導(dǎo)員可以利用獎(jiǎng)勵(lì)的手段使警犬建立相應(yīng)科目與獎(jiǎng)勵(lì)之間的聯(lián)系。在此過(guò)程中,訓(xùn)導(dǎo)員對(duì)獎(jiǎng)勵(lì)時(shí)機(jī)的把握恰當(dāng)可以使訓(xùn)練事半功倍。
首先,在前期的訓(xùn)練過(guò)程中的獎(jiǎng)勵(lì)要注重及時(shí)性,也就是及時(shí)反饋。根據(jù)斯金納的強(qiáng)化理論,警犬在做出相應(yīng)動(dòng)作后訓(xùn)導(dǎo)員迅速給予獎(jiǎng)勵(lì),以使警犬建立反饋機(jī)制,將該訓(xùn)練科目與可以直接獲得獎(jiǎng)勵(lì)進(jìn)行關(guān)聯(lián)。這樣,警犬在后續(xù)的訓(xùn)練過(guò)程中就能因?yàn)榭释@得獎(jiǎng)勵(lì)而更加積極地對(duì)訓(xùn)導(dǎo)員的指令做出響應(yīng)。因此,訓(xùn)導(dǎo)員應(yīng)避免過(guò)早或過(guò)晚給予獎(jiǎng)勵(lì),從而避免使犬產(chǎn)生不良聯(lián)系,影響訓(xùn)練效果。
其次,在后期的訓(xùn)練過(guò)程中要靈活運(yùn)用間歇獎(jiǎng)勵(lì)。斯金納的強(qiáng)化理論中提到強(qiáng)化類型表,將強(qiáng)化分為兩大類——連續(xù)強(qiáng)化和間歇強(qiáng)化,其中間歇強(qiáng)化又分為固定時(shí)間、變動(dòng)時(shí)間、固定比率和變動(dòng)比率。斯金納指出間歇強(qiáng)化停止后產(chǎn)生的反應(yīng)消退要遠(yuǎn)低于連續(xù)強(qiáng)化,因此,訓(xùn)導(dǎo)員在訓(xùn)練中要善于運(yùn)用間歇強(qiáng)化以更好地固定警犬的行為。例如基礎(chǔ)科目訓(xùn)練時(shí)有時(shí)可以在犬每次完成動(dòng)作就立即獎(jiǎng)勵(lì),而有時(shí)可以在犬連續(xù)完成數(shù)個(gè)動(dòng)作后給予獎(jiǎng)勵(lì),這樣警犬會(huì)更加努力響應(yīng)訓(xùn)導(dǎo)員,以及為后續(xù)延緩能力打下訓(xùn)練基礎(chǔ)。
(一)獎(jiǎng)勵(lì)應(yīng)當(dāng)具有一致性。在訓(xùn)練中獎(jiǎng)勵(lì)伴隨著警犬特定動(dòng)作的完成而出現(xiàn),那么最初的強(qiáng)化刺激便形成了。隨著訓(xùn)練的開展,警犬的特定行為動(dòng)作以及科目均伴隨不同程度的獎(jiǎng)勵(lì)的出現(xiàn),警犬就能形成分辨性刺激,從而自行區(qū)分相倚性聯(lián)系。為了更好地使警犬形成分辨性刺激,我們?cè)趯?shí)際訓(xùn)練當(dāng)中應(yīng)保持獎(jiǎng)勵(lì)的一致性,即警犬每次完成訓(xùn)導(dǎo)員需要的行為或動(dòng)作后均應(yīng)該獲得獎(jiǎng)勵(lì),從而使警犬更加期待獎(jiǎng)勵(lì)的到來(lái),積極做出相應(yīng)動(dòng)作。這樣可以幫助警犬明確地對(duì)不同行為和指令進(jìn)行區(qū)分,并且不會(huì)因?yàn)楠?jiǎng)勵(lì)的變化而混淆。
(二)獎(jiǎng)勵(lì)應(yīng)當(dāng)具有可變性。如果在長(zhǎng)期的訓(xùn)練中訓(xùn)導(dǎo)員給予警犬的獎(jiǎng)勵(lì)總是相同的,警犬可能會(huì)對(duì)該獎(jiǎng)勵(lì)逐漸失去興趣,那么所謂正強(qiáng)化的效果也就隨之減弱。因此,訓(xùn)導(dǎo)員應(yīng)該不時(shí)地改變獎(jiǎng)勵(lì)的類型和數(shù)量,保持獎(jiǎng)勵(lì)的神秘感以激發(fā)警犬對(duì)獎(jiǎng)勵(lì)的渴望和參與訓(xùn)練的積極性。
(三)獎(jiǎng)勵(lì)應(yīng)當(dāng)具有漸進(jìn)性。在警犬訓(xùn)練中,隨著訓(xùn)練的進(jìn)行訓(xùn)導(dǎo)員應(yīng)當(dāng)逐漸減少獎(jiǎng)勵(lì)的使用頻次,以培養(yǎng)警犬的自主性和獨(dú)立性,使警犬降低對(duì)獎(jiǎng)勵(lì)的依賴。訓(xùn)練一開始,訓(xùn)導(dǎo)員應(yīng)該也必須頻繁地給予獎(jiǎng)勵(lì),以建立警犬完成動(dòng)作的積極的正反饋。然而,隨著訓(xùn)練的深入,訓(xùn)導(dǎo)員應(yīng)當(dāng)逐漸減少獎(jiǎng)勵(lì)的使用頻次,讓警犬逐漸習(xí)慣不完全依賴獎(jiǎng)勵(lì)而完成訓(xùn)導(dǎo)員下達(dá)的指令或任務(wù)。根據(jù)斯金納的強(qiáng)化理論,逐步減少獎(jiǎng)勵(lì)的使用可以增加警犬對(duì)獎(jiǎng)勵(lì)的渴望和期待,保持神秘感同時(shí)也可以增加警犬的自主性和獨(dú)立性,這和間歇性獎(jiǎng)勵(lì)的運(yùn)用有著緊密的聯(lián)系。
(四)獎(jiǎng)勵(lì)應(yīng)當(dāng)具有多樣性。警犬的不同訓(xùn)練方向和不同品種的警犬對(duì)不同類型的獎(jiǎng)勵(lì)偏好也有所差異,在訓(xùn)練過(guò)程中,警犬訓(xùn)導(dǎo)員要根據(jù)所帶警犬的喜好,有針對(duì)性地選擇多種獎(jiǎng)勵(lì)方式,如食物、玩具或響片的“咔噠”聲、撫拍等。這樣既可以增加訓(xùn)練的趣味性,又可以提高訓(xùn)練的成效。同時(shí)警犬訓(xùn)導(dǎo)員要培養(yǎng)敏銳的觀察力,靈活地運(yùn)用獎(jiǎng)勵(lì),以滿足每頭警犬在不同階段的需求差異。