¿Qué es el condicionamiento operante y cómo funciona

El condicionamiento operante es uno de los conceptos fundamentales de la psicología del comportamiento. Obtenga más información sobre los efectos de las recompensas y los castigos en el comportamiento.

El condicionamiento operante, a veces denominado condicionamiento instrumental, es un método de aprendizaje que emplea recompensas y castigos por el comportamiento. A través del condicionamiento operante, se establece una asociación entre un comportamiento y una consecuencia (ya sea negativa o positiva) de ese comportamiento.

Por ejemplo, cuando las ratas de laboratorio presionan una palanca cuando una luz verde está encendida, reciben una pastilla de comida como recompensa. Cuando presionan la palanca cuando hay una luz roja encendida, reciben una leve descarga eléctrica. Como resultado, aprenden a presionar la palanca cuando la luz verde está encendida y a evitar la luz roja.

Pero el condicionamiento operante no es solo algo que tiene lugar en entornos experimentales mientras se entrenan animales de laboratorio. También juega un papel importante en el aprendizaje diario. El refuerzo y el castigo tienen lugar en entornos naturales todo el tiempo, así como en entornos más estructurados, como aulas o sesiones de terapia.

La historia del condicionamiento operante

El condicionamiento operante fue descrito por primera vez por el conductista B.F. Skinner, por lo que es posible que ocasionalmente escuche que se lo conoce como condicionamiento skinneriano. Como conductista, Skinner creía que no era realmente necesario observar los pensamientos y motivaciones internas para explicar el comportamiento. En cambio, sugirió, deberíamos mirar solo las causas externas y observables del comportamiento humano.

Durante la primera parte del siglo XX, el conductismo se convirtió en una fuerza importante dentro de la psicología. Las ideas de John B. Watson dominaron esta escuela de pensamiento desde el principio. Watson se centró en los principios del condicionamiento clásico, y una vez sugirió que podía tomar a cualquier persona independientemente de sus antecedentes y entrenarla para que fuera lo que quisiera.

Los primeros conductistas centraron sus intereses en el aprendizaje asociativo. Skinner estaba más interesado en cómo las consecuencias de las acciones de las personas influían en su comportamiento.

Skinner usó el término operante para referirse a cualquier "comportamiento activo que opera sobre el medio ambiente para generar consecuencias". La teoría de Skinner explicaba cómo adquirimos la gama de comportamientos aprendidos que exhibimos todos los días.

Su teoría estuvo fuertemente influenciada por el trabajo del psicólogo Edward Thorndike, quien había propuesto lo que él llamó la ley del efecto. De acuerdo con este principio, es más probable que se repitan las acciones que van seguidas de resultados deseables, mientras que es menos probable que se repitan las seguidas de resultados no deseados.

El condicionamiento operante se basa en una premisa bastante simple: las acciones seguidas de refuerzo se fortalecerán y es más probable que vuelvan a ocurrir en el futuro. Si cuenta una historia divertida en clase y todos se ríen, probablemente será más probable que vuelva a contar esa historia en el futuro.

Si levanta la mano para hacer una pregunta y su maestro elogia su comportamiento cortés, será más probable que levante la mano la próxima vez que tenga una pregunta o comentario. Debido a que la conducta fue seguida por un refuerzo o un resultado deseable, la acción anterior se fortalece.

Por el contrario, las acciones que dan como resultado un castigo o consecuencias indeseables se debilitarán y es menos probable que vuelvan a ocurrir en el futuro. Si vuelves a contar la misma historia en otra clase, pero esta vez nadie se ríe, será menos probable que vuelvas a repetir la historia en el futuro. Si gritas una respuesta en clase y tu maestro te regaña, es menos probable que vuelvas a interrumpir la clase.

Tipos de comportamientos

Skinner distinguió entre dos tipos diferentes de comportamientos

  • Las conductas de respuesta son aquellas que ocurren automáticamente y por reflejo, como retirar la mano de una estufa caliente o sacudir la pierna cuando el médico le da golpecitos en la rodilla. No es necesario que aprenda estos comportamientos. Simplemente ocurren de forma automática e involuntaria.
  • Los comportamientos operantes, por otro lado, son aquellos que están bajo nuestro control consciente. Algunas pueden ocurrir espontáneamente y otras intencionalmente, pero son las consecuencias de estas acciones las que luego influyen en si ocurren nuevamente o no en el futuro. Nuestras acciones sobre el medio ambiente y las consecuencias de esa acción constituyen una parte importante del proceso de aprendizaje.

Si bien el condicionamiento clásico podría explicar los comportamientos de los encuestados, Skinner se dio cuenta de que no podía explicar una gran cantidad de aprendizaje. En cambio, Skinner sugirió que el condicionamiento operante tenía una importancia mucho mayor.

Skinner inventó diferentes dispositivos durante su niñez y puso en práctica estas habilidades durante sus estudios sobre condicionamiento operante. Creó un dispositivo conocido como cámara de acondicionamiento operante, a menudo denominada hoy caja Skinner. La cámara podría contener un animal pequeño, como una rata o una paloma. La caja también contenía una barra o tecla que el animal podía presionar para recibir una recompensa.

Para rastrear las respuestas, Skinner también desarrolló un dispositivo conocido como registrador acumulativo. El dispositivo registró las respuestas como un movimiento ascendente de una línea para que las tasas de respuesta pudieran leerse observando la pendiente de la línea.

Componentes del condicionamiento operante

Hay varios conceptos clave en el condicionamiento operante.

Refuerzo en condicionamiento operante

El refuerzo es cualquier evento que fortalece o aumenta el comportamiento que sigue. Hay dos tipos de reforzadores. En ambos casos de refuerzo, el comportamiento aumenta.

  • Los reforzadores positivos son eventos o resultados favorables que se presentan después del comportamiento. En situaciones de refuerzo positivo, una respuesta o comportamiento se fortalece con la adición de un elogio o una recompensa directa. Si hace un buen trabajo en el trabajo y su gerente le da una bonificación, esa bonificación es un refuerzo positivo.
  • Los reforzadores negativos implican la eliminación de eventos o resultados desfavorables después de la demostración de un comportamiento. En estas situaciones, la respuesta se ve reforzada por la eliminación de algo que se considera desagradable. Por ejemplo, si su hijo comienza a gritar en medio de un restaurante, pero se detiene una vez que le da una golosina, su acción llevó a la eliminación de la condición desagradable, reforzando negativamente su comportamiento (no el de su hijo).

Castigo en condicionamiento operante

El castigo es la presentación de un evento o resultado adverso que causa una disminución en el comportamiento que sigue. Hay dos tipos de castigo. En ambos casos, el comportamiento disminuye.

  • El castigo positivo, a veces denominado castigo por aplicación, presenta un evento o resultado desfavorable para debilitar la respuesta que sigue. Azotar por mala conducta es un ejemplo de castigo por aplicación.
  • El castigo negativo, también conocido como castigo por remoción, ocurre cuando un evento o resultado favorable se elimina después de que ocurre un comportamiento. Retirar el videojuego de un niño después de una mala conducta es un ejemplo de castigo negativo.

Horarios de refuerzo

El refuerzo no es necesariamente un proceso sencillo y hay una serie de factores que pueden influir en la rapidez y la eficacia con que se aprenden cosas nuevas. Skinner descubrió que cuándo y con qué frecuencia se reforzaban los comportamientos influía en la velocidad y la fuerza de la adquisición. En otras palabras, el momento y la frecuencia del refuerzo influyeron en cómo se aprendieron los nuevos comportamientos y cómo se modificaron los comportamientos antiguos.

Skinner identificó varios programas diferentes de refuerzo que impactan el proceso de condicionamiento operante:

  • El refuerzo continuo implica entregar un refuerzo cada vez que ocurre una respuesta. El aprendizaje tiende a ocurrir con relativa rapidez, pero la tasa de respuesta es bastante baja. La extinción también ocurre muy rápidamente una vez que se detiene el refuerzo.
  • Los programas de razón fija son un tipo de refuerzo parcial. Las respuestas se refuerzan solo después de que se haya producido un número específico de respuestas. Por lo general, esto conduce a una tasa de respuesta bastante constante.
  • Los programas de intervalo fijo son otra forma de refuerzo parcial. El refuerzo ocurre solo después de que ha transcurrido un cierto intervalo de tiempo. Las tasas de respuesta permanecen bastante estables y comienzan a aumentar a medida que se acerca el momento del refuerzo, pero disminuyen inmediatamente después de que se ha entregado el refuerzo.
  • Los programas de razón variable también son un tipo de refuerzo parcial que implica reforzar el comportamiento después de un número variado de respuestas. Esto conduce tanto a una tasa de respuesta alta como a tasas de extinción lentas.
  • Los programas de intervalo variable son la forma final de refuerzo parcial que describió Skinner. Este programa implica la entrega de refuerzo después de que haya transcurrido una cantidad variable de tiempo. Esto también tiende a conducir a una tasa de respuesta rápida y una tasa de extinción lenta.

Ejemplos de condicionamiento operante

Podemos encontrar ejemplos de condicionamiento operante en funcionamiento a nuestro alrededor. Considere el caso de los niños que completan la tarea para ganar una recompensa de un padre o maestro, o de los empleados que terminan sus proyectos para recibir elogios o promociones. Más ejemplos de condicionamiento operante en acción incluyen:

  • Después de actuar en una obra de teatro comunitaria, recibe aplausos de la audiencia. Esto actúa como un reforzador positivo, inspirándote a probar más roles de desempeño.
  • Entrena a su perro para que vaya a buscarlo ofreciéndole un elogio y una palmada en la cabeza cada vez que realiza el comportamiento correctamente. Este es otro reforzador positivo.
  • Un profesor les dice a los estudiantes que si tienen asistencia perfecta durante todo el semestre, entonces no tienen que tomar el examen final completo. Al eliminar un estímulo desagradable (la prueba final), los estudiantes reciben un refuerzo negativo para que asistan a clases con regularidad.
  • Si no entrega un proyecto a tiempo, su jefe se enoja y reprende su desempeño frente a sus compañeros de trabajo. Esto actúa como un castigo positivo, por lo que es menos probable que termine los proyectos tarde en el futuro.
  • Una adolescente no limpia su habitación como le pidieron, por lo que sus padres le quitan el teléfono por el resto del día. Este es un ejemplo de un castigo negativo en el que se quita un estímulo positivo.

En algunos de estos ejemplos, la promesa o posibilidad de recompensas provoca un aumento en el comportamiento. El condicionamiento operante también se puede utilizar para disminuir un comportamiento mediante la eliminación de un resultado deseable o la aplicación de un resultado negativo. Por ejemplo, a un niño se le puede decir que perderá los privilegios del recreo si habla fuera de turno en clase. Este potencial de castigo puede conducir a una disminución de los comportamientos perturbadores.

Una palabra de Googlawi

Si bien el conductismo puede haber perdido gran parte del dominio que tenía durante la primera parte del siglo XX, el condicionamiento operante sigue siendo una herramienta importante y de uso frecuente en el proceso de aprendizaje y modificación de la conducta. A veces, las consecuencias naturales provocan cambios en nuestro comportamiento. En otros casos, las recompensas y los castigos se pueden repartir conscientemente para crear un cambio.

El condicionamiento operante es algo que puede reconocer inmediatamente en su propia vida, ya sea en su enfoque para enseñar a sus hijos el buen comportamiento o en el entrenamiento del perro de la familia. Recuerda que cualquier tipo de aprendizaje requiere tiempo. Considere el tipo de refuerzo o castigo que puede funcionar mejor para su situación particular y evalúe qué tipo de programa de refuerzo podría conducir a los mejores resultados.