Le conditionnement opérant, parfois appelé conditionnement instrumental, est une méthode dapprentissage qui utilise des récompenses et des punitions pour le comportement. Grâce au conditionnement opérant, une association est établie entre un comportement et une conséquence (négative ou positive) de ce comportement.1
Par exemple, lorsque des rats de laboratoire appuient sur un levier lorsquun voyant vert est allumé, ils reçoivent une boulette de nourriture en récompense. Lorsquils appuient sur le levier lorsquun voyant rouge est allumé, ils reçoivent un léger choc électrique. En conséquence, ils apprennent à appuyer sur le levier lorsque le feu vert est allumé et évitent le feu rouge.
Mais le conditionnement opérant nest pas seulement quelque chose qui se déroule dans des cadres expérimentaux tout en entraînant des animaux de laboratoire. Il joue également un rôle important dans lapprentissage quotidien. Le renforcement et la punition ont toujours lieu dans des environnements naturels, ainsi que dans des environnements plus structurés tels que des salles de classe ou des séances de thérapie.
Lhistoire du conditionnement opérant
Le conditionnement opérant a été décrit pour la première fois par le comportementaliste B.F. Skinner, cest pourquoi vous pouvez parfois lentendre parler de conditionnement skinnérien.1 En tant que comportementaliste, Skinner pensait quil nétait pas vraiment nécessaire dexaminer les pensées et les motivations internes pour expliquer le comportement. Au lieu de cela, a-t-il suggéré, nous ne devrions examiner que les causes externes et observables du comportement humain.
Au cours de la première partie du 20e siècle, le behaviorisme est devenu une force majeure au sein de la psychologie. Les idées de John B. Watson ont très tôt dominé cette école de pensée. Watson sest concentré sur les principes du conditionnement classique, suggérant autrefois quil pouvait prendre nimporte quelle personne, quelle que soit son origine, et la former à ce quil choisirait.2
Les premiers comportementalistes ont concentré leurs intérêts sur lapprentissage associatif. Skinner sintéressait davantage à la façon dont les conséquences des actions des gens influençaient leur comportement.
Skinner a utilisé le terme opérant pour désigner tout « comportement actif qui agit sur lenvironnement pour générer des conséquences ». La théorie de Skinner expliquait comment nous acquérons la gamme de comportements appris que nous exhibons chaque jour.
Sa théorie a été fortement influencée par les travaux du psychologue Edward Thorndike, qui avait proposé ce quil a appelé la loi de leffet.3 Selon ce principe, les actions qui sont suivies de résultats souhaitables sont plus susceptibles dêtre répétées tandis que celles suivies de résultats indésirables sont moins susceptibles de se répéter.
Le conditionnement opérant repose sur une prémisse assez simple : les actions qui sont suivies dun renforcement seront renforcées et plus susceptibles de se reproduire à lavenir. Si vous racontez une histoire amusante en classe et que tout le monde rit, vous aurez probablement plus de chances de raconter cette histoire à nouveau à lavenir.
Si vous levez la main pour poser une question et que votre professeur fait léloge de votre comportement poli, vous aurez plus de chances de lever la main la prochaine fois que vous aurez une question ou un commentaire. Parce que le comportement a été suivi dun renforcement, ou dun résultat souhaitable, laction précédente est renforcée.
Inversement, les actions qui entraînent des sanctions ou des conséquences indésirables seront affaiblies et moins susceptibles de se reproduire à lavenir. Si vous racontez à nouveau la même histoire dans une autre classe mais que personne ne rit cette fois-ci, vous aurez moins de chances de répéter lhistoire à lavenir. Si vous criez une réponse en classe et que votre professeur vous gronde, vous risquez moins dinterrompre à nouveau le cours.
Types de comportements
Skinner distingue deux types de comportements différents
- Les comportements des répondants sont ceux qui se produisent automatiquement et par réflexe, comme retirer votre main dun poêle chaud ou secouer votre jambe lorsque le médecin tape sur votre genou. Vous nêtes pas obligé dapprendre ces comportements. Ils se produisent simplement automatiquement et involontairement.
- Les comportements opérants, dautre part, sont ceux sous notre contrôle conscient. Certaines peuvent se produire spontanément et dautres volontairement, mais ce sont les conséquences de ces actions qui influencent alors si elles se reproduisent ou non dans le futur. Nos actions sur lenvironnement et les conséquences de cette action constituent une partie importante du processus dapprentissage.
Alors que le conditionnement classique pouvait expliquer les comportements des répondants, Skinner sest rendu compte quil ne pouvait pas expliquer une grande partie de lapprentissage. Au lieu de cela, Skinner a suggéré que le conditionnement opérant avait une bien plus grande importance.
Skinner a inventé différents appareils au cours de son enfance et il a mis ces compétences à lœuvre lors de ses études sur le conditionnement opérant. Il a créé un dispositif connu sous le nom de chambre de conditionnement opérant, souvent appelée aujourdhui boîte de Skinner. La chambre pouvait contenir un petit animal, comme un rat ou un pigeon. La boîte contenait également une barre ou une clé sur laquelle lanimal pouvait appuyer pour recevoir une récompense.
Afin de suivre les réponses, Skinner a également développé un appareil appelé enregistreur cumulatif. Lappareil enregistrait les réponses sous la forme dun mouvement ascendant dune ligne afin que les taux de réponse puissent être lus en regardant la pente de la ligne.
Composants du conditionnement opérant
Il existe plusieurs concepts clés dans le conditionnement opérant.
Renforcement en conditionnement opérant
Le renforcement est tout événement qui renforce ou augmente le comportement quil suit. Il existe deux sortes de renforçateurs. Dans ces deux cas de renforcement, le comportement augmente.
- Les renforçateurs positifs sont des événements ou des résultats favorables qui sont présentés après le comportement. Dans les situations de renforcement positif, une réponse ou un comportement est renforcé par lajout déloges ou dune récompense directe. Si vous faites du bon travail au travail et que votre manager vous donne un bonus, ce bonus est un renforcement positif.
- Les renforçateurs négatifs impliquent la suppression dévénements ou de résultats défavorables après laffichage dun comportement. Dans ces situations, une réponse est renforcée par la suppression de quelque chose considéré comme désagréable. Par exemple, si votre enfant commence à crier au milieu dun restaurant, mais sarrête une fois que vous lui donnez une friandise, votre action a conduit à la suppression de la condition désagréable, renforçant négativement votre comportement (pas celui de votre enfant).
Punition dans le conditionnement opérant
La punition est la présentation dun événement ou dun résultat indésirable qui entraîne une diminution du comportement quil suit. Il existe deux sortes de punitions. Dans ces deux cas, le comportement diminue.
- La punition positive, parfois appelée punition par application, présente un événement ou un résultat défavorable afin daffaiblir la réponse quil suit. La fessée pour mauvaise conduite est un exemple de punition par application.
- La punition négative, également connue sous le nom de punition par suppression, se produit lorsquun événement ou un résultat favorable est supprimé après quun comportement se soit produit. Le retrait du jeu vidéo dun enfant à la suite dune mauvaise conduite est un exemple de punition négative.
Programmes de renforcement
Le renforcement nest pas nécessairement un processus simple, et il existe un certain nombre de facteurs qui peuvent influencer la rapidité et la qualité de lapprentissage de nouvelles choses. Skinner a découvert que le moment et la fréquence de renforcement des comportements jouaient un rôle dans la vitesse et la force de lacquisition. En dautres termes, le moment et la fréquence du renforcement ont influencé la façon dont les nouveaux comportements ont été appris et comment les anciens comportements ont été modifiés.
Skinner a identifié plusieurs programmes de renforcement différents qui ont un impact sur le processus de conditionnement opérant :4
- Le renforcement continu consiste à fournir un renforcement à chaque fois quune réponse se produit. Lapprentissage a tendance à se produire relativement rapidement, mais le taux de réponse est assez faible. Lextinction se produit également très rapidement une fois le renforcement arrêté.
- Les échéanciers à rapport fixe sont un type de renforcement partiel. Les réponses ne sont renforcées quaprès quun nombre spécifique de réponses ait eu lieu. Cela conduit généralement à un taux de réponse assez stable.
- Les horaires à intervalles fixes sont une autre forme de renforcement partiel. Le renforcement nintervient quaprès un certain intervalle de temps. Les taux de réponse restent assez stables et commencent à augmenter à mesure que le temps de renforcement approche, mais ralentissent immédiatement après la livraison du renforcement.
- Les horaires à rapport variable sont également un type de renforcement partiel qui implique le renforcement du comportement après un nombre varié de réponses. Cela conduit à la fois à un taux de réponse élevé et à des taux dextinction lents.
- Les programmes à intervalles variables sont la forme finale de renforcement partiel décrite par Skinner. Ce calendrier consiste à fournir des renforts après un laps de temps variable. Cela a également tendance à conduire à un taux de réponse rapide et à un taux dextinction lent.
Exemples de conditionnement opérant
Nous pouvons trouver des exemples de conditionnement opérant à lœuvre tout autour de nous. Prenons le cas denfants qui terminent leurs devoirs pour gagner une récompense dun parent ou dun enseignant, ou demployés qui terminent des projets pour recevoir des éloges ou des promotions. Voici dautres exemples de conditionnement opérant en action :
- Après avoir joué dans une pièce de théâtre communautaire, vous recevez les applaudissements du public. Cela agit comme un renforçateur positif, vous inspirant à essayer des rôles plus performants.
- Vous entraînez votre chien à aller chercher en lui offrant des éloges et une tape sur la tête chaque fois quil exécute le comportement correctement. Cest un autre renforçateur positif.
- Un professeur dit aux étudiants que sils ont une assiduité parfaite tout le semestre, ils nont pas à passer lexamen de synthèse final. En supprimant un stimulus désagréable (le test final), les étudiants sont négativement renforcés pour assister régulièrement aux cours.
- Si vous ne remettez pas un projet à temps, votre patron se met en colère et réprimande votre performance devant vos collègues. Cela agit comme une punition positive, ce qui rend moins probable que vous finissiez des projets tard dans le futur.
- Une adolescente ne nettoie pas sa chambre comme on lui a demandé, alors ses parents lui confisquent son téléphone pour le reste de la journée. Ceci est un exemple de punition négative dans laquelle un stimulus positif est retiré.
Dans certains de ces exemples, la promesse ou la possibilité de récompenses provoque une augmentation du comportement. Le conditionnement opérant peut également être utilisé pour diminuer un comportement via la suppression dun résultat souhaitable ou lapplication dun résultat négatif. Par exemple, on peut dire à un enfant quil perdra ses privilèges de récréation sil parle hors de son tour en classe. Ce potentiel de punition peut conduire à une diminution des comportements perturbateurs.
Un mot de Verywell
Alors que le béhaviorisme a peut-être perdu une grande partie de la domination quil détenait au début du 20e siècle, le conditionnement opérant reste un outil important et souvent utilisé dans le processus dapprentissage et de modification du comportement. Parfois, les conséquences naturelles entraînent des changements dans notre comportement. Dans dautres cas, les récompenses et les punitions peuvent être consciemment distribuées afin de créer un changement.
Le conditionnement opérant est quelque chose que vous pouvez immédiatement reconnaître dans votre propre vie, que ce soit dans votre approche pour enseigner à vos enfants un bon comportement ou dans le dressage du chien de la famille. Noubliez pas que tout type dapprentissage prend du temps. Considérez le type de renforcement ou de punition qui convient le mieux à votre situation unique et évaluez quel type de programme de renforcement pourrait donner les meilleurs résultats.