yes, therapy helps!
Conditionnement opérant: concepts et techniques principales

Conditionnement opérant: concepts et techniques principales

Février 28, 2024

Dans les procédures comportementales, le conditionnement opératoire ou instrumental est probablement celui qui a les applications les plus nombreuses et les plus variées.

Du traitement des phobies au dépassement des dépendances telles que le tabagisme ou l'alcoolisme, le schéma de fonctionnement permet de conceptualiser et de modifier pratiquement n'importe quelle habitude de l'intervention sur quelques éléments.

Mais Quel est exactement le conditionnement opérant? Dans cet article, nous passons en revue les concepts clés pour comprendre ce paradigme et détailler ses applications les plus fréquentes, à la fois pour augmenter les comportements et pour les réduire.

Antécédents de conditionnement opérant

Le conditionnement opérant tel que nous le connaissons a été formulé et systématisé par Burrhus Frederic Skinner sur la base des idées précédemment avancées par d'autres auteurs.


Ivan Pavlov et John B. Watson avaient décrit la Conditionnement classique, également appelé conditionnement simple ou pavlovien.

Pour sa part, Edward Thorndike a introduit la loi de l'effet, l'antécédent le plus clair du conditionnement opérant. La loi de l'effet stipule que si un comportement a des conséquences positives pour la personne qui le pratique, il aura plus de chance de se répéter, tandis que s'il a des conséquences négatives, cette probabilité diminue. Dans le contexte du travail de Thorndike, le conditionnement opérant s'appelle "instrumental".

  • Article connexe: "Behaviorism: histoire, concepts et principaux auteurs"


Différence entre le conditionnement classique et le conditionnement opérant

La principale différence entre le conditionnement classique et le conditionnement opérant réside dans le fait que le premier se réfère à l'apprentissage d'informations sur un stimulus, tandis que le second implique d'apprendre sur les conséquences de la réponse .

Skinner pensait que le comportement était beaucoup plus facile à modifier si ses conséquences étaient manipulées que si des stimuli lui étaient simplement associés, comme dans le conditionnement classique. Le conditionnement classique est basé sur l'acquisition de réponses réflexes, ce qui explique une quantité d'apprentissage inférieure et ses utilisations sont plus limitées que celles de l'opérateur, car il s'agit de comportements que le sujet peut contrôler à sa guise.

  • Article connexe: "Le conditionnement classique et ses expériences les plus importantes"

Notions de conditionnement opérant

Ensuite, nous définirons les concepts de base du conditionnement opérant pour mieux comprendre cette procédure et ses applications.


Bon nombre de ces termes sont partagés par les directives comportementales en général, bien qu'ils puissent avoir des connotations spécifiques dans le paradigme opérant.

Réponse instrumentale ou opérante

Ce terme désigne tout comportement qui entraîne une certaine conséquence et il est susceptible de changer en fonction de cela. Son nom indique qu'il sert à obtenir quelque chose (instrumental) et qu'il agit sur le médium (opérant) au lieu d'en être provoqué, comme cela se produit dans le cas du conditionnement classique ou du défendeur.

Dans la théorie comportementale, le mot "réponse" est fondamentalement équivalent à "comportement" et "action", bien que "réponse" semble se référer davantage à la présence de stimuli antécédents.

La conséquence

En psychologie comportementale et cognitivo-comportementale, une conséquence est le résultat d'une réponse. La conséquence peut être positive (renforcement) ou négative (punition) pour le sujet qui exécute le comportement; dans le premier cas, la probabilité que la réponse soit donnée augmentera et dans le second cas elle diminuera.

Il est important de garder à l'esprit que les conséquences affectent la réponse et que, par conséquent, ce qui est renforcé ou puni est dit comportement, et non la personne ou l'animal qui l'exécute. En tout temps, nous travaillons dans l’intention de influencer la manière dont les stimuli et les réponses sont liés , puisque la philosophie comportementale évite de s’écarter de la vision essentialiste du peuple, insistant davantage sur ce qui peut changer que ce qui semble toujours rester le même.

Renfort

Ce terme désigne conséquences des comportements quand ils le rendent plus probable qu'ils se donnent à nouveau. Le renforcement peut être positif, auquel cas nous allons parler d'obtenir une récompense ou une récompense pour l'exécution d'une réponse, ou négatif, ce qui inclut la disparition de stimuli aversifs.

Dans le renfort négatif on peut distinguer les réponses d'évitement et d'évasion . Les comportements d'évitement empêchent ou empêchent l'apparition d'un stimulus aversif; Par exemple, une personne atteinte d'agoraphobie qui ne quitte pas son domicile parce qu'elle ne ressent pas d'anxiété évite cette émotion. Au lieu de cela, les réponses d'échappement provoquent la disparition du stimulus alors qu'il est déjà présent.

La différence avec le mot "renforçateur" est qu’il fait référence à l’événement qui résulte du comportement au lieu de la procédure de récompense ou de punition. Par conséquent, "renforçant" est un terme plus proche de "récompense" et "récompense" que de "renforcement".

Punition

Une punition est n'importe quelle conséquence d'un comportement déterminé qui diminue la probabilité de se répéter.

En tant que renforcement, la punition peut être positive ou négative. La punition positive correspond à la présentation d'un stimulus aversif après la réponse, tandis que la punition négative est le retrait d'un stimulus appétitif en raison du comportement.

La punition positive peut être liée à l’utilisation qui est généralement donnée au mot "punition", tandis que la punition négative se réfère davantage à un type de sanction ou d’amende. Si un enfant n'arrête pas de crier et reçoit une gifle de la part de sa mère, il appliquera une punition positive, tandis que s'il retire la console sur laquelle il joue, il recevra une punition négative.

  • Article connexe: "8 raisons de ne pas utiliser les châtiments corporels à l'égard des enfants"

Stimulus discriminant et delta stimulus

En psychologie, le mot "stimulus" est utilisé pour désigner des événements qui provoquent une réponse d'une personne ou d'un animal. Dans le paradigme opérant, le stimulus discriminatif est un stimulus dont la présence indique au sujet de l’apprentissage que, s’il adopte un certain comportement, il aura pour effet conséquence l'apparition d'un renfort ou d'une punition .

Au contraire, l'expression "stimulus delta" désigne les signaux qui, lorsqu'ils sont présents, informent que l'exécution de la réponse n'entraînera pas de conséquences.

Quel est le conditionnement opérant?

Le conditionnement instrumental ou opérant est une procédure d'apprentissage basée sur la probabilité qu'il se produise une certaine réponse dépend des conséquences attendu. Dans le conditionnement opérant, le comportement est contrôlé par des stimuli discriminants présents dans la situation d'apprentissage qui transmettent des informations sur les conséquences probables de la réponse.

Par exemple, un signe "Ouvrir" sur une porte nous indique que si nous essayons de tourner le bouton, celui-ci s'ouvrira très probablement. Dans ce cas, l’affiche serait le stimulus discriminant et l’ouverture de la porte servirait de renforcement positif de la réponse instrumentale lorsqu’on tourne le bouton.

L'analyse comportementale appliquée de B. F. Skinner

Skinner a développé des techniques de conditionnement opérant qui sont englobés dans ce que nous appelons "analyse appliquée du comportement". Cela s'est avéré particulièrement efficace dans l'éducation des enfants, avec un accent particulier sur les enfants ayant des difficultés de développement.

Le schéma de base de l'analyse comportementale appliquée est le suivant. En premier lieu, un objectif comportemental est proposé, qui consistera en une augmentation ou une réduction de certains comportements. Sur cette base, les comportements à développer seront renforcés et les incitations existantes à la performance des comportements à inhiber seront réduites.

En général le retrait des renforts est plus souhaitable que la peine positif car il génère moins de rejet et d’hostilité de la part du sujet. Cependant, la punition peut être utile dans les cas où le comportement problématique est très perturbant et nécessite une réduction rapide, par exemple en cas de violence.

Tout au long du processus, il est essentiel de suivre systématiquement les progrès afin de vérifier de manière objective si les objectifs souhaités sont atteints. Cela se fait principalement par l'enregistrement de données.

Techniques opérantes pour développer des comportements

Compte tenu de l’importance et de l’efficacité du renforcement positif, les techniques opérantes visant à améliorer le comportement ont une utilité démontrée. Ensuite, nous décrirons les plus pertinentes parmi ces procédures.

1. Techniques d'instigation

Les techniques incitatives sont considérées comme celles qui ils dépendent de la manipulation des stimuli discriminants augmenter la probabilité qu'un comportement se produise.

Ce terme inclut les instructions qui augmentent certains comportements, le guidage physique, qui consiste à déplacer ou à placer des parties du corps de la personne formée, et la modélisation, dans laquelle un modèle est observé en train de reproduire un comportement afin de l’imiter et d’en apprendre le conséquences. Ces trois procédures ont en commun de se concentrer sur enseigner directement au sujet comment exécuter une action déterminé, verbalement ou physiquement.

2. moulage

Elle consiste à approcher progressivement un comportement donné du comportement objectif, en commençant par une réponse relativement similaire que le sujet peut effectuer et en le modifiant peu à peu. Il est réalisé par étapes (approximations successives) auxquelles le ferraillage est appliqué .

La mise en forme est considérée comme particulièrement utile pour établir des comportements chez des sujets qui ne peuvent pas communiquer verbalement, tels que les personnes ayant une déficience intellectuelle profonde ou les animaux.

3. décoloration

La décoloration fait référence à la retrait progressif des aides ou des instigateurs qui avait été utilisé pour renforcer un comportement objectif. Il est prévu que le sujet consolide une réponse et puisse ensuite l'exécuter sans recourir à une aide extérieure.

C’est l’un des concepts clés du conditionnement opérant , car elle permet de généraliser les progrès réalisés en thérapie ou en formation à de nombreux autres domaines de la vie.

Cette procédure consiste essentiellement à remplacer un stimulus discriminant par un stimulus différent.

4. chaîne

Une chaîne comportementale, c'est-à-dire un comportement composé de plusieurs comportements simples, est séparée en différentes étapes (liens). Ensuite, le sujet doit apprendre à exécuter les liens un par un jusqu'à ce que la chaîne complète soit terminée.

Le chaînage peut être fait en avant ou en arrière et a la particularité que chaque lien renforce le précédent et fonctionne comme un stimulus discriminatif de la prochaine

À certains égards, de nombreuses compétences considérées comme des talents pour leur montrer un haut degré de compétence et une spécialisation (comme jouer très bien d'un instrument de musique, très bien danser, etc.) peuvent être considérées à la suite d'une forme de chaînage, depuis les compétences de base, il progresse jusqu'à atteindre d'autres beaucoup plus travaillé.

5. Programmes de renforcement

Dans une procédure d’apprentissage opérant, les programmes de renforcement sont les des directives qui établissent quand le comportement sera récompensé et quand non.

Il existe deux types de base de programmes de renforcement: ceux de la raison et ceux de l'intervalle. Dans les programmes de motif, le renforçateur est obtenu après qu'un nombre spécifique de réponses a été donné, tandis que dans les programmes d'intervalle, cela se produit après qu'un certain temps s'est écoulé depuis le dernier comportement renforcé et que cela s'est reproduit.

Les deux types de programme peuvent être fixes ou variables, ce qui indique que le nombre de réponses ou l'intervalle de temps nécessaire pour obtenir le renforçateur peut être constant ou osciller autour d'une valeur moyenne. Ils peuvent aussi être continus ou intermittents; cela signifie que la récompense peut être donnée à chaque fois que le sujet adopte le comportement objectif ou occasionnellement (bien que toujours à la suite d'une diffusion de la réponse souhaitée).

Le renforcement continu est plus utile pour établir des comportements et l'intermittent pour les garder. Ainsi, théoriquement, un chien apprendra plus vite à donner la jambe si nous lui donnons un prix à chaque fois qu'il nous offre la jambe, mais une fois appris, le comportement sera plus difficile à arrêter si nous donnons au renforçateur une tentative sur trois ou cinq. .

Techniques opérantes pour réduire ou éliminer les comportements

Lors de l’application de techniques opérantes visant à réduire les comportements, il convient de garder à l’esprit que, ces procédures pouvant être désagréables pour les sujets, il est toujours préférable d’utiliser celles qui sont moins aversives lorsque cela est possible. De même ces techniques sont préférables aux punitions positives .

Nous présentons ci-dessous une liste de ces techniques par ordre croissant d’aversion.

1. Extinction

Il cesse de récompenser un comportement qui avait été renforcé avant. Cela réduit la probabilité que la réponse se reproduise. Formellement, l'extinction est le contraire du renforcement positif.

Extinction à long terme est plus efficace pour éliminer les réponses que les punitions et le reste des techniques opérantes pour réduire les comportements, bien que cela puisse être plus lent.

Un exemple fondamental d'extinction consiste à faire arrêter un enfant à un enfant en l'ignorant jusqu'à ce qu'il réalise que son comportement n'a pas les conséquences souhaitées (par exemple, la colère des parents, qui ferait office de renforçateur) et qu'il en a marre.

2. Formation à l'omission

Dans cette procédure, le comportement du sujet est suivi de l'absence de la récompense; c'est-à-dire, si la réponse est donnée, le renforcement ne sera pas obtenu . Un exemple de formation aux omissions pourrait être que les parents empêchent leur fille de regarder la télévision ce soir-là en leur ayant parlé de manière irrespectueuse. Un autre exemple serait le fait de ne pas acheter les jouets demandés par les enfants s’ils se comportent mal.

Dans les environnements éducatifs, il sert également à favoriser que les efforts que font les autres sont plus valorisés pour faire plaisir aux petits et que ceux-ci, habitués à ces affaires, ne valent rien.

3. Programmes de renforcement différentiel

Il s’agit d’un sous-type particulier de programme de renforcement utilisé pour réduire (pas éliminer) les comportements cibles en augmentant le nombre de personnes réponses alternatives Par exemple, un enfant pourrait être récompensé pour sa lecture et ses exercices physiques et non pour jouer de la console si ce dernier comportement est destiné à perdre de la valeur de renforcement.

Dans le renforcement différentiel des taux bas, la réponse est renforcée s'il reste un certain temps après la dernière fois. Dans le renforcement différentiel d'omission, le renforcement est obtenu si, après un certain temps, la réponse ne s'est pas produite. Le renforcement différentiel des comportements incompatibles consiste en renforcer les réponses incompatibles avec le comportement problématique ; Cette dernière procédure est appliquée aux tics et aux onicofagias, entre autres troubles.

4Coût de la réponse

Variante de la peine négative dans laquelle l'exécution du comportement problématique provoque la perte d'un renfort . La carte de points de conducteur introduite en Espagne il y a quelques années est un bon exemple de programme de coûts de réponse.

5. Temps mort

Le temps mort consiste à isoler le sujet, en général les enfants, dans un environnement non stimulant en cas de comportement problématique. Aussi une variante de la peine négative, elle diffère du coût de la réponse en ce que ce qui est perdu est la possibilité d'accéder au ferraillage , pas le renforcement lui-même.

6. Saciation

Le renforcement obtenu en effectuant le comportement est si intense ou grand qu'il perd de la valeur J'ai eu pour un sujet. Cela peut se faire par une réponse satisfaisante ou une pratique de masse (répétez le comportement jusqu'à ce qu'il cesse d'appétit) ou par satiété de stimulus (le renforçateur perd l'appétit d'excès).

7. Surcorrection

La surcorrection consiste à appliquer un punition positive liée au comportement problématique . Par exemple, il est largement utilisé en cas d’énurésie, dans laquelle on demande à l’enfant de laver les draps après avoir uriné pendant la nuit.

Techniques d'organisation des imprévus

Les systèmes d’organisation des imprévus sont des procédures complexes à travers lesquelles vous pouvez renforcer certains comportements et punir les autres .

L'économie de la puce est un exemple bien connu de ce type de technique. Il consiste à distribuer des puces (ou d’autres renforçateurs génériques équivalents) en récompense des performances des comportements cibles; les sujets ultérieurs peuvent échanger leurs jetons contre des prix de valeur variable. Il est utilisé dans les écoles, les prisons et les hôpitaux psychiatriques.

Les contrats comportementaux ou de contingence sont des accords passés entre plusieurs personnes, généralement deux, par lesquels ils s'engagent à exécuter (ou non) certains comportements. Les conséquences sont détaillées dans les contrats si les conditions convenues sont remplies ou non.

Références bibliographiques:

  • Domjam, M. (2010). Principes de base de l'apprentissage et du comportement. Madrid: Thomson.
  • Labrador, F. J. (2008). Techniques de modification du comportement. Madrid: pyramide.

The difference between classical and operant conditioning - Peggy Andover (Février 2024).


Articles Connexes