Ne pas se leurrer sur le leurre
Un des articles les plus justes que j’ai lu depuis longtemps au sujet de la récompense et du leurre, que l’on confond souvent.
Bon j’avoue le titre c’est surtout pour le jeu de mots ;). Parce qu’il va être question du leurre mais pas que! Il va être question du mauvais emploi de la friandise en général, et de comment, ce qui devrait être un accélérateur d’apprentissage et un renforçateur devient un inhibiteur.
En gros, pourquoi ceux qui déclament qu’enseigner à la croquette donnent des chiens qui « n’obéissent » qu’avec de la bouffe sous le nez ont à la fois tord et raison.Comment cela devrait il se passer?
Tout commence par une loi du comportement: tout comportement renforcé augmente.
Donc, pour que nos chiens adoptent les comportements que nous souhaitons, nous allons les renforcer, les récompenser.
Une multitude de choses peuvent faire office de récompense mais la récompense alimentaire a beaucoup d’atouts pour elle: facile à utiliser, par tous et partout, n’interrompt pas vraiment la séance, fonctionne avec tous les chiens, permet une fréquence de distribution élevée.
Nous allons donc utiliser une friandise pour renforcer le comportement de notre chien de façon systématique, c’est la phase d’acquisition, puis de façon aléatoire lors de la phase d’automatisation, pour ensuite passer aux phases de généralisation puis de maintenance (dans laquelle le renforçateur n’est plus nécessaire, le comportement est porteur de sa propre motivation).
Ça paraît simple comme ça, alors pourquoi parfois cela ne marche t il pas?
La première source d’ennui est la phase d’acquisition.
De l’importance du timing.
Commençons par le commencement: le moment et la zone de récompense. Suivant quand on récompense et où on récompense, nous n’enseignons pas le même comportement.
-Je travaille la marche au pied (et non pas la position au pied), je commence par mettre mon chien en position, je fais quelques pas et je récompense. Sauf qu’une personne aussi douée en coordination que moi a le réflexe de s’arrêter pour récompenser. Du coup j’ai renforcé la position mais pas le fait d’avancer dans cette position.
– J’enseigne à mon chien à ne pas descendre du trottoir sans moi, je le laisse sur le trottoir, m’éloigne et reviens le récompenser directement dans la gueule si il n’est pas descendu. Au départ bien sûr je ne m’éloigne pas beaucoup, pour ne pas être mon chien en échec. Il n’a donc pas appris que ne pas descendre sans signal contraire c’était bien, il a juste appris qu’être à côté de moi est bien. Et donc lorsque que j’ai commencé à m’éloigner, il m’a bien évidemment suivi, logique ce chien.
J’ai changé de zone de renforcement et lancé la récompense sur le trottoir, et là il a fait l’association que je voulais: le trottoir, c’est cool!
(Mes chiens ont fait ces associations, d’autres ne feraient peut être pas le même, le propos est que suivant où et quand je récompense mes chiens, ils ne font pas la même association).
On progresse, et on se retrouve dans la phase d’automatisation.
Un renforcement aléatoire précoce
Une erreur assez classique est de passer à une distribution de récompenses aléatoire trop rapidement.
On ne passe au renforcement aléatoire que lorsqu’un comportement est bien maîtrisé . Si le chien n’a pas compris, si il est encore dans l’essai, le fait que la récompense ne soit plus systématique va le mettre en doute et il risque de se désengager.
L’humain muet
Lorsque nous sommes en renforcement aléatoire, nous ne passons pas du tout au rien, notre chien ne passe pas de la pluie à un silence radio et 0 interaction. Nous allons continuer à le féliciter oralement, avec plus ou moins d’effluve, et pourquoi pas lui faire une petite grattouille (si il aime ça). Sauf que, cachés derrière nos friandises durant la période d’acquisition (ou juste trop concentrés sur ce que nous sommes en train de faire), nous sommes souvent muets. Nous n’apprenons pas à féliciter nos chiens oralement (je ne sais pas vous mais moi, à la base ce n’est pas dans ma nature de m’exclamer « C’est bien loulou » ou de prendre une voie aigue et enjouée pour dire « Oui »). Du coup, lorsque nous diminuons l’apparition des friandises notre chien se retrouve face à un « C’est bien » platonique (et il n’a pas appris ce que signifie ce mot puisque nous ne parlons pas lorsque les friandises sont là), et effectivement on peut le comprendre qu’il ne soit pas franchement motivé.
Vous n’êtez pas obligé de parler durant la phase d’acquisition, personnellement en shapping j’ai du mal avec la fréquence du click, mais lorsque vous récompensez à la voix, récompensez vraiment.
La friandise parasite
Ce qui peut se produire lorsque l’on a tendance à travailler avec les mains pleines, c’est qu’on ne passe en réalité jamais en aléatoire puisque le chien sait prédire quand il sera récompensé et quand il ne le sera pas.. Outre le fait que cela risque de déconcentrer le chien va peut être vous sortir tout son répertoire pour obtenir le truc qui sent bon dans votre main, cela rend la récompense très prévisible: friandise dans la main = récompense, pas de friandise en main = pas de récompense.
Et ce n’est pas que votre chien ne veut pas/ ne sait pas apprendre sans friandises, bien au contraire. Vous travaillez avec récompense en main, une fois que vous estimez le comportement sur signal vous voulez passer en aléatoire et là hop d’un seul coup votre main se vide. Au bout de quelques répétitions, votre chien a compris que si il n’y a rien dans la main, il n’y a rien dans la gueule non plus à la fin. Il se démotive dans ce cas de figure, ne réalise plus le comportement, vous revenez en arrière et la récompense est à nouveau dans votre main. Il a non seulement appris que lorsque vous avez les mains vides, il n’obtient pas de récompense mais il a également appris à attendre qu’elle réapparaisse pour réaliser le comportement. Si c’est pas un chien intelligent ça. Il a appris. Mais pas quelque chose que vous souhaitiez.
Facilitez vous la vie, utilisez une pochette pratique et préparez vos friandises en amont. Piocher et récompenser doit être un geste facile et rapide. Et cela vous aidera en outre à avoir un bon timing.
Et plus que de travaillez les mains pleines de friandises, vous pouvez également utiliser ces mains pleines de trucs trop bons pour amener votre chien à réaliser un comportement, c’est ce qu’on appelle le leurre et là c’est encore plus piégeux.
La problématique du leurre.
Le leurre n’est pas une mauvaise chose en soi, honnêtement certains comportements sont extrêmement difficiles à obtenir en shapping/capture, pas impossibles bien sûr mais il faut être très ingénue/ réactif.
Cela paraît facile d’enseigner un comportement en leurrant, mais il est surtout très facile de ralentir l’apprentissage ou d’enseigner autre chose que ce que l’on souhaite.
Tout d’abord le fait de leurrer l’animal nuit à sa concentration, il n’est pas aussi actif dans son apprentissage et plus ou moins obnubilé par ce qu’il suit. Il fait, mais sans avoir totalement conscience de ce qu’il est en train de faire.
Ensuite, si on conserve le leurre sur un nombre de répétition trop élevé, celui devient une partie du comportement ou tout du moins du signal qui amène à ce comportement. Le chien n’a pas appris à faire un tour sur lui même par exemple, il a appris que quand vous faites un cercle au dessus de sa tête avec une croquette, il doit la suivre.
Amener un comportement un guidant le chien étant quand même bien pratique, le propos ici n’est pas de bannir le guide, mais de l’utiliser de façon à ce qu’il ne se retourne pas contre nous:
– En le retirant rapidement lors de l’apprentissage.
– En le remplaçant par une cible, cela peut être la main ou un target stick.
Pour la faire courte, si entrainer votre chien avec des friandises ne donne pas de résultat, vérifiez si:
Bien utilisé le renforcement positif en général, avec l’usage de friandises en particulier, donne des apprentissages qui sont solides et durables. Si vous êtes cohérents, progressifs et attentifs, les comportements que vous enseignez auront un historique positif pour votre chien et il les produira pour eux mêmes: pas besoin d’avoir de saucisse dans la main :).
Maintenant que nous avons fait un détour sur les choses qui peuvent faire qu’un chien ne travaille que lorsque de la nourriture est dans les parages, faisons un détour par ceux qui ne travaillent pas pour la nourriture. Je suis tombée sur un article intéressant sur le sujet (ici), et je trouve que le complément est pertinent.
Comme le souligne très justement l’auteur, tous les chiens mangent. Tous les chiens ont donc un intérêt pour la nourriture. Que peut il bien se passer pour qu’un chien ne considère pas une récompense comme un renforcement positif? Là encore c’est notre gestion des friandises qui est en cause. Lorsque nous utilisons l’attirance naturelle de notre chien pour la nourriture pour le tromper et l’amener là où il ne veut pas aller, nous entachons cette association positive. Et à force de répétitions, un nombre plus ou moins élevé suivant les individus, nous empoissons le signal friandise: l’arrivée d’une récompense n’est plus forcément une bonne nouvelle. Comme rien n’est plus explicite que le concret et que les exemples de l’article sont très parlants, je vais les reprendre.
– Votre chien ne revient pas à votre appel, vous sortez sa friandise préférée, la brandissez en criant « Biscrok » (je ne sais pas ce qu’ils mettent là dedans mais sérieux, les chiens ont une addiction à ces trucs). Votre chien rapplique et vous en profitez pour le chopper par le collier. Biscrok n’est alors pas suivi du Biscrok, mais signifie la fin d’un moment plaisant.
– Vous partez et voulez mettre votre chien en cage, vous l’amenez à vous avec une friandise, l’attrapez et l’enfermez. Venir chercher la friandise n’est plus juste un moment agréable, c’est le prémisse à un quelque chose de non souhaité (la cage nécessite un apprentissage).
Ne travailler que pour des bonbeks, ne pas travailler pour des bonbeks, les deux sont des comportements acquis.
Rédigé par Shoucka, de flappysfriend
http://flappysfriend.blogspot.fr/2016/07/ne-pas-se-leurrer-sur-le-leurre.html