Du bon et du mauvais usage de la récompense en éducation canine - Partie 2

Publié le par yannick thoulon

Suite de l'article précédent...

 

Avant propos : je le répète, il n'y a pas qu'une méthode pour réussir un apprentissage, mais il y a des méthodes plus ou moins efficaces, plus ou moins rapides, plus ou moins réfléchies... Je ne dis pas que celle-ci est la meilleure, loin de là. Je dis juste qu'elle est réfléchie et efficace...

 

... Je vais te donner un exemple concret, un des exercices les plus délicats à exécuter si on veut utiliser un renforcement 100 % positif, 100 % croquette (on n'est pas obligé de fonctionner en 100 % positif. Mais si on décide de le faire, il faut le faire bien).

Imaginons que tu veuilles apprendre à ton chien à marcher au pied grâce à la friandise, sans contrainte et sans clicker. Rappelle-toi bien une chose. Le bon usage de la croquette est soumis à 4 lois du renforcement (associées aux 4 lois de l'apprentissage citées dans l'article précédent) :

Timing du renforcement

Fréquence du renforcement

Endroit du renforcement

Intention derrière le renforcement (attention à l'intention, c'est une donnée très importante et souvent négligée. Elle nécessite de savoir lire ce que pense et veut le chien à l'instant T.)

 

Voici ce que je te vois souvent faire : tu tiens une croquette dans ta main, du côté du chien et à peu près à sa hauteur, comme ça le chien suit la main et marche au pied. Après quelques dizaines de mètres, tu t'arrêtes, le chien vient se remettre en face de toi et tu lui donnes la croquette pour le récompenser d'avoir bien marché avec toi. Ca marche, ton chien a marché au pied. Mais il n'a rien compris ni rien appris (ou du moins, pas exactement ce que tu voulais lui apprendre) ! Tu viens de bafouer les 4 lois du renforcement, et ton chien aura beaucoup de mal à apprendre à marcher au pied de cette façon. Je ne dis pas qu'il n'y arrivera pas. Je dis juste que l'apprentissage sera sans doute plus long et moins fiable. Tu auras aussi plus de mal à te débarrasser de la croquette dans les étapes suivantes.

 

En réalité, que veux-tu apprendre au chien ? A marcher au pied ? Pas exactement. Tu veux lui apprendre plusieurs choses :

- A Marcher

- à Côté de toi

- sur Plusieurs pas.

 

Cela se décompose en plusieurs données

L'endroit : "être à côté". Il faut donc récompenser le chien pile lorsqu'il se trouve à côté de toi,  et pas lorsqu'il se retourne vers toi pour avoir sa croquette en te barrant à moitié la route, sinon, tu lui apprends à marcher en crabe, ou à te dépasser et à te barrer la route dès que tu ralentis.

Le timing : "marcher". Tu veux lui apprendre à marcher à côté de toi, donne-lui donc sa croquette quand il marche, ou si c'est trop difficile (chien de petite taille), donne-la-lui pile au moment où tu t'arrêtes, et pas 6 ou 7 secondes après, le temps de la sortir de ta poche ou d'un sachet (c'est là, en général, que le chien revient se mettre en face de toi).

La fréquence :  "plusieurs pas". Tu veux que l'action se prolonge, donne-lui donc une récompense tous les pas, puis tous les deux pas, puis tous les trois pas etc. Ainsi, il ne se découragera pas et tu le récompenseras avant qu'il ne commette d'erreur. De réussite en réussite, il apprendra. Ca, c'est vraiment le plus difficile dans la pratique. Sois prêt à y passer du temps, et toute la ration du chien si nécessaire !

L'intention : La donnée la plus subtile et la plus délicate. Tu veux que le chien comprenne qu'il faut marcher à côté de toi, et non pas simplement suivre ta main. Si tu gardes la croquette dans ta main à hauteur de son nez, ou que tu la lui donnes quand il essaye de l'atteindre du bout de la truffe, tu lui apprends simplement à  s'intéresser à ta main et pas à toi ; voire pire : à réclamer la croquette. Dès que tu bougeras la main, ou quand tu n'auras plus de croquette dans la main, le chien quittera ton pied. Non pas parce qu'il fait sa mauvaise tête, mais parce que tu ne lui as pas appris la bonne chose. Ne lui donne donc pas la récompense s'il est fixé sur ta main ou s'il te pousse la main avec le museau. Evidemment, ce a nous renvoie au timing et à la fréquence : il faudra le récompenser après très peu de pas (voire un seul) et au bon endroit, pour ne pas qu'il cherche la croquette ailleurs, mais qu'il associe la récompense avec le fait de marcher à cet endroit là.

 

J'espère que cet exemple t'aura permis de mieux cerner comment utiliser la croquette, et surtout comment utiliser les lois du renforcement.

Alors maintenant, je reprends ma question première (voir article précédent).

 

Pourquoi tu fais ça ? En fait, je sais pourquoi tu le fais. Mais j'aimerais que tu saches pourquoi tu ne le feras plus...

A toi d'y répondre en réfléchissant aux lois du renforcement que tu bafoues. Je t'aide sur les deux premiers :

 

- Pourquoi tu donnes une croquette à la fin d'un cours, quand on a arrêté depuis une ou deux minutes de faire les exercices et qu'on s'apprête à partir ("parce qu'il a bien travaillé !") ?

Loi du renforcement bafouée : le timing. Le chien n'associe pas la récompense à quelque chose de précis.


- Pourquoi, pour apprendre au chien à rendre un objet, tu échanges ce qu'il a dans la gueule contre une croquette en lui mettant la friandise sous le nez ("parce que comme ça, il lâche !") ?

Loi du renforcement bafouée :  l'intention.  Certes, ça marche, mais tu auras du mal plus tard à te passer de la croquette pour le faire lâcher. Tu devrais au plutôt demander au chien de lâcher ce qu'il a dans la gueule, et ensuite sortir une croquette venue de nulle part lorsqu'il s'exécute. Ainsi, tu récompenses le fait de lâcher même sans croquette, et non le fait de vouloir la croquette.


- Pourquoi tu attires le chien avec une croquette (ou le bruit de la boîte à croquettes) pour qu'il revienne ?

Loi du renforcement bafouée :


- Pourquoi tu lui donnes une croquette avant le parcours d'agility ou la choré d'obé-rythmée ("parce que comme ça, il me regarde") ?

Loi du renforcement bafouée :


- Pourquoi tu lui fais faire le slalom en agility en le guidant avec une croquette sous le nez ?

Loi du renforcement bafouée :


- Pourquoi, quand tu apprends un nouvel exercice complexe (type slalomer entre tes jambes...) , tu ne le récompenses qu'à la fin ?

Loi du renforcement bafouée :


- Pourquoi, après seulement 6 ou 7 répétitions, tu estimes qu'il a compris et tu ne le récompenses plus ?

Loi du renforcement bafouée :

 

 

Ad lib !

 

 

 

 

Pour être informé des derniers articles, inscrivez vous :