Tabla de Contenidos
Le conditionnement opérant se produit lorsqu’il existe une association entre un certain comportement et une conséquence dudit comportement . Cette association s’exprime dans le renforcement du comportement ou dans sa punition, pour encourager ou décourager le comportement. Le premier à définir et à étudier le conditionnement opérant a été le psychologue comportemental Burrhus Frederic Skinner, qui a mené plusieurs expériences sur des animaux pour développer sa théorie.
La théorie de Burrus Skinner
Skinner était un psychologue du comportement, une école de psychologie basée sur l’étude du comportement des gens. Contrairement à d’autres psychologues du comportement qui, comme John B. Watson, se sont concentrés sur l’étude du conditionnement classique, Skinner a concentré son travail sur l’apprentissage par le conditionnement opérant. Le psychologue a observé que dans le conditionnement classique, les réponses ont tendance à être déclenchées par des réflexes innés, qui se produisent automatiquement ; il appelait cela un comportement exigé . Il a fait une distinction entre le comportement de demande et le comportement opérant.. Skinner a inventé le terme de comportement opérant pour décrire un comportement conditionné dans sa reproduction par les conséquences qu’il engendre ; ainsi, les conséquences du comportement jouent un rôle clé dans la réitération du comportement.
La théorie de Skinner était basée sur la loi de l’effet d’Edward Thorndike , qui stipulait qu’un comportement entraînant des conséquences positives serait plus susceptible de se répéter tandis qu’un comportement entraînant des conséquences négatives, à l’inverse, serait moins susceptible de se répéter. Skinner a introduit le concept de renforcement dans les thèses de Thorndike, établissant que le comportement renforcé aura une plus grande probabilité de se répéter.
Burrhus Skinner a mené une série d’expériences pour étudier le conditionnement opérant en utilisant la soi-disant « boîte de Skinner », une boîte qui avait un levier à une extrémité qui fournissait de la nourriture ou de l’eau lorsqu’elle était pressée. Un animal, un pigeon ou un rat, était placé dans la boîte où il pouvait se déplacer librement. L’animal pourrait appuyer sur le levier et ensuite obtenir une récompense. Skinner a observé que dans ce processus, le résultat était que l’animal appuyait plus fréquemment sur le levier, et il a mesuré le degré d’apprentissage en enregistrant le taux de réponse de l’animal associé au renforcement. Grâce aux expériences qu’il a développées, Skinner a identifié les différents types de renforcement et de punition, qui encouragent ou découragent le comportement.
Le renforcement
Le renforcement résultant d’un comportement encouragera et renforcera ce comportement. Il existe deux types de renforts. Le renforcement positif , qui se produit lorsqu’un comportement génère un résultat favorable ; Par exemple, un chien recevant une friandise après avoir obéi à un ordre, ou un élève recevant des éloges de l’enseignant après avoir bien performé en classe. Ce type de renforcement augmente la probabilité que l’individu répète le comportement souhaité afin de recevoir à nouveau la récompense.
L’autre type de renforcement est le renforcement négatif , qui se produit lorsqu’un comportement entraîne la suppression d’une expérience défavorable ; par exemple, un expérimentateur qui arrête de donner des décharges électriques à un singe lorsque le singe appuie sur un certain levier. Dans ce cas le comportement d’appui sur le levier est renforcé car le singe voudra à nouveau retirer les décharges électriques.
Skinner a classé les renforts en deux groupes. Les renforçateurs primaires stimulent naturellement le comportement car ils sont intrinsèquement désirables, comme la nourriture. De leur côté, les renforts conditionnés sont ceux que l’on incorpore en les associant à des renforts primaires. Un exemple de renforcement conditionné est la compensation monétaire, puisque l’argent n’est pas un élément intrinsèquement désirable, mais il peut être utilisé pour acquérir des biens intrinsèquement désirables, tels que de la nourriture ou un abri.
Punition
La punition est définie comme la réponse à un comportement opposé au renforcement. La punition associée à un certain comportement implique le découragement et affaiblit ce comportement.
Il existe deux types de punition. La punition positive ou punition par application, qui survient lorsqu’un comportement génère un résultat défavorable ; par exemple, un parent punit un enfant après que l’enfant a utilisé un mot inapproprié. Le deuxième type de punition est la punition négative ou la punition par retrait, qui est associée à la suppression de quelque chose de favorable à la suite d’un comportement. Par exemple, un parent ne donne pas à un enfant son allocation hebdomadaire parce que l’enfant s’est mal conduit.
Bien que la punition ait été largement utilisée, Burrhus Skinner et d’autres chercheurs ont souligné qu’elle n’est pas toujours efficace. La punition peut supprimer un comportement pendant un certain temps, mais il arrive souvent que le comportement indésirable se reproduise après un certain temps. La punition peut également avoir des effets secondaires indésirables. Par exemple, un enfant qui est puni par un enseignant peut devenir anxieux et craintif, ne sachant pas quoi faire pour éviter une future punition dans des situations qui ne reproduisent pas le comportement puni. Burrhus Skinner et d’autres ont suggéré qu’au lieu de mettre l’accent sur la punition, il est préférable de renforcer les comportements souhaités et d’ignorer les comportements indésirables. Le renforcement indique à un individu quel est le comportement souhaitable,
façonner le comportement
Le conditionnement opérant peut conduire à des comportements de plus en plus complexes par mise en forme, également connue sous le nom de méthode des approximations. La mise en forme se produit lorsque chaque instance d’un comportement de structure complexe est renforcée. La mise en forme commence par renforcer la première partie du comportement. Une fois que cette partie du comportement est maîtrisée, le renforcement ne se produit que lorsque la deuxième partie du comportement se produit. Et ainsi de suite avec les étapes qui composent le comportement. Ce schéma de renforcement se poursuit jusqu’à ce que l’ensemble du comportement soit maîtrisé.
Voyons un exemple. Lorsqu’un enfant apprend à nager, il peut d’abord être félicité juste pour être entré dans l’eau. Il est ensuite félicité lorsqu’il apprend à donner des coups de pied, et le renforcement est répété lorsqu’il apprend à caresser. Enfin, des éloges sont décernés pour se propulser dans l’eau grâce à des mouvements coordonnés de frappe et de coup de pied. Le résultat de l’ensemble du processus est la conformation d’un comportement.
La stratégie de renforcement
Dans notre vie de tous les jours, les comportements ne sont pas constamment renforcés. Skinner a découvert que la fréquence du renforcement peut affecter la rapidité et le succès avec lesquels vous apprenez un nouveau comportement. Il a spécifié plusieurs stratégies d’application de renforcement, chacune avec des moments et des fréquences différents.
L’une de ces stratégies est le renforcement continu, dans lequel une réponse particulière est appliquée systématiquement à chaque résultat d’un certain comportement. Le renforcement continu génère un apprentissage rapide. Cependant, si le renforcement est retiré, le comportement s’affaiblit rapidement et disparaît complètement, ce que l’on appelle l’extinction.
Une autre stratégie est le taux constant de récompense par lequel un renforcement du comportement est donné après un nombre donné de réponses. Par exemple, un enfant peut gagner une récompense pour avoir terminé cinq fois ses devoirs. Dans ce type de stratégie, la réponse ralentit une fois la récompense donnée.
Dans la stratégie à taux variable, le nombre de réponses est modifié pour obtenir une certaine récompense. Cette stratégie génère de bonnes réponses difficiles à éteindre, car la variation de l’exigence d’obtenir la récompense entretient le comportement. C’est la stratégie de renforcement utilisée par les machines à sous.
La stratégie de renforcement à intervalle fixe attribue une récompense après qu’un laps de temps donné s’est écoulé. La rémunération horaire du travail est un exemple de ce type de stratégie de renforcement. Comme la stratégie à taux constant, la réponse augmente à mesure que le temps de récompense approche, mais ralentit après avoir reçu la récompense.
La dernière stratégie à considérer est le renforcement à intervalle variable, dans lequel le temps de renforcement assigné est variable. Un exemple est le cas d’un enfant qui reçoit une affectation à divers moments de la semaine, mais tant qu’il a manifesté certains comportements considérés comme positifs; l’enfant maintiendra son comportement positif pour recevoir un renforcement dans un délai plus court.
exemples
Il est courant de voir l’application du conditionnement opérant pour dresser un animal de compagnie ou pour inculquer un certain comportement à un enfant. Le conditionnement opérant est fréquemment utilisé dans les écoles ou dans le cadre d’une thérapie.
Par exemple, un enseignant peut attribuer un renforcement aux élèves qui font régulièrement leurs devoirs en prenant des tests périodiques avec des questions incluses dans les devoirs récents. Un autre exemple est le cas dans lequel un enfant fait une crise de colère pour attirer l’attention ; le parent peut ignorer le comportement et ensuite renforcer l’enfant une fois que la colère s’est arrêtée.
Le conditionnement opérant est également utilisé dans la modification du comportement, une approche utilisée dans le traitement de nombreux problèmes psychologiques chez les adultes et les enfants, tels que les phobies, l’anxiété ou l’énurésie. Une façon de mettre en œuvre la modification du comportement consiste à attribuer des récompenses, dans lesquelles les comportements souhaités sont renforcés par des récompenses telles que des badges, des boutons ou d’autres objets.
critiques
Bien que le conditionnement opérant puisse expliquer de nombreux comportements et soit toujours utilisé, il a reçu de nombreuses critiques. L’un de ces critiques souligne que le conditionnement opérant fournit une explication incomplète du processus d’apprentissage, car il ne tient pas compte du rôle des aspects biologiques et cognitifs.
De plus, le conditionnement opérant s’appuie sur une figure d’autorité pour renforcer le comportement et ignore le rôle de la curiosité et la capacité d’un individu à faire ses propres découvertes. Les critiques s’opposent à l’accent mis par le conditionnement opérant sur le contrôle et la manipulation du comportement, arguant qu’il peut conduire à des pratiques autoritaires. Skinner croyait que les environnements contrôlent naturellement le comportement et que les gens peuvent choisir comment utiliser ces connaissances, positivement ou négativement.
Parce que les observations systématiques de Skinner sur le conditionnement opérant étaient basées sur des expérimentations animales, il est critiqué pour avoir extrapolé le comportement observé chez les animaux aux humains, car il existe des différences substantielles de comportement et de capacité cognitive.
Sources
Kendra Cerise. Qu’est-ce que le conditionnement opérant et comment ça marche ? Verywell Mind, 2018. https://www.verywellmind.com/operant-conditioning-a2-2794863
Guillaume Crain. Théories du développement : concepts et applications. Cinquième édition, Pearson Prentice Hall, 2005.
Jason G. Goldman. Qu’est-ce que le conditionnement opérant ? (Et comment cela explique-t-il la conduite de chiens ?) . Scientific American, 2012. https://blogs.scientificamerican.com/thoughtful-animal/what-is-operant-conditioning-and-how-does-it-explain-driving-dogs/
Saul McLeod. Skinner – Conditionnement opérant . Simplement Psychologie, 2018. https://www.simplypsychology.org/operant-conditioning.html#class