Condicionamiento instrumental en psicología

Aprenda cómo funciona el condicionamiento instrumental (otro término utilizado para el proceso de condicionamiento operante).

El condicionamiento instrumental es otro término para el condicionamiento operante, un proceso de aprendizaje descrito por primera vez por B. F. Skinner. En el condicionamiento instrumental, el refuerzo o el castigo se utilizan para aumentar o disminuir la probabilidad de que una conducta vuelva a ocurrir en el futuro.

Ejemplos de condicionamiento operante

Por ejemplo, si un estudiante es recompensado con elogios cada vez que levanta la mano en clase, es más probable que vuelva a levantar la mano en el futuro.

Si también la regañan cuando habla fuera de turno, es menos probable que interrumpa la clase. En estos ejemplos, el maestro utiliza el refuerzo para fortalecer el comportamiento de levantar la mano y el castigo para debilitar el comportamiento de hablar fuera de turno.

El acondicionamiento instrumental también se usa a menudo en el entrenamiento de animales. Por ejemplo, entrenar a un perro para que se dé la mano implicaría ofrecer una recompensa cada vez que se produzca el comportamiento deseado.

Historia del condicionamiento operante

El psicólogo E.L. Thorndike fue uno de los primeros en observar el impacto del refuerzo en los experimentos de cajas de rompecabezas con gatos. Durante estos experimentos, Thorndike observó un proceso de aprendizaje al que se refirió como aprendizaje de prueba y error.

Los experimentos consistieron en colocar un gato hambriento en una caja de rompecabezas y, para liberarse, el gato tuvo que descubrir cómo escapar. Thorndike luego anotó cuánto tardaron los gatos en liberarse en cada prueba experimental. Inicialmente, los gatos utilizaron métodos de escape ineficaces, rascando y cavando en los lados o en la parte superior de la caja. Eventualmente, la prueba y error llevaría a los gatos a empujar o tirar con éxito de la ruta de escape. Después de cada prueba sucesiva, los gatos se involucraron cada vez menos en los comportamientos de escape ineficaces y respondieron más rápidamente con las acciones de escape correctas.

Thorndike se refirió a sus observaciones como la Ley del Efecto. La fuerza de una respuesta aumenta cuando es seguida inmediatamente por un "satisfactorio" (reforzador). Por otro lado, las acciones que van seguidas de efectos desagradables tienen más probabilidades de debilitarse.

En los experimentos de la caja de rompecabezas de Thorndike, escapar de la caja era lo más satisfactorio. Cada vez que los gatos lograron escapar de la caja, el comportamiento que precedió inmediatamente a la fuga se reforzó y fortaleció.

El trabajo de Thorndike tuvo un efecto tremendo en la investigación posterior de B.F. Skinner sobre el condicionamiento operante. Skinner incluso creó su propia versión de las cajas de rompecabezas de Thorndike, a las que se refirió como una cámara operante, también conocida como caja de Skinner.

Cómo funciona el acondicionamiento operante

Skinner identificó dos tipos clave de comportamientos. El primer tipo son los comportamientos de los encuestados. Estas son simplemente acciones que ocurren reflexivamente sin ningún aprendizaje. Si toca algo caliente, inmediatamente retirará la mano en respuesta. El condicionamiento clásico se centra en estos comportamientos de los encuestados.

En los experimentos clásicos de Pavlov con perros, el comportamiento del encuestado era salivar ante la presentación de la comida. Sin embargo, al formar una asociación entre el sonido de un timbre y la presentación de la comida, Pavlov pudo entrenar a los perros para que realmente salivaran simplemente con el sonido de ese timbre.

Skinner se dio cuenta de que, si bien el condicionamiento clásico podía explicar cómo los comportamientos de los encuestados podían conducir al aprendizaje, no podía explicar todos los tipos de aprendizaje. En cambio, sugirió que eran las consecuencias de las acciones voluntarias las que conducían a la mayor cantidad de aprendizaje.

El segundo tipo de comportamientos es lo que Skinner denominó comportamientos operantes. Los definió como cualquier comportamiento voluntario que actúa sobre el medio ambiente para crear una respuesta. Estos son los comportamientos voluntarios que están bajo nuestro control consciente. Estas también son acciones que se pueden aprender. Las consecuencias de nuestras acciones juegan un papel importante en el proceso de aprendizaje.

Refuerzo y Castigo

Skinner identificó dos aspectos clave del proceso de condicionamiento operante. El refuerzo sirve para aumentar el comportamiento, mientras que el castigo sirve para disminuir el comportamiento. También hay dos tipos diferentes de refuerzo y dos tipos diferentes de castigo.

El refuerzo positivo implica presentar un resultado favorable, como darle un premio a un niño después de que limpia su habitación.

El refuerzo negativo implica la eliminación de un estímulo desagradable, como decirle a un niño que si se come todas sus patatas, no tendrá que comerse el brócoli. Dado que el niño considera que comer brócoli es desagradable y comer patatas conduce a la eliminación de esta tarea indeseable, comer patatas se ve reforzado negativamente.

El castigo positivo significa aplicar un evento desagradable después de un comportamiento. Azotar, por ejemplo, es un ejemplo común de castigo positivo. Este tipo de castigo a menudo se denomina castigo por aplicación. Se aplica directamente una consecuencia negativa para reducir el comportamiento no deseado.

El castigo negativo implica quitar algo agradable después de que ocurre un comportamiento. Por ejemplo, si un niño no limpia su habitación, sus padres podrían decirle que no puede ir al centro comercial con sus amigos. Quitar la actividad deseable actúa como un castigo negativo sobre el comportamiento anterior.