Refuerzo positivo y negativo en el condicionamiento operante

El refuerzo es un concepto importante en el condicionamiento operante y una parte importante del proceso de aprendizaje. Aprenda cómo se usa y vea ejemplos.

Una de las muchas formas diferentes en que las personas pueden aprender es a través de un proceso conocido como condicionamiento operante (también conocido como condicionamiento instrumental). Esto implica aprender mediante refuerzo o castigo. El tipo de refuerzo utilizado puede desempeñar un papel importante en la rapidez con la que se aprende un comportamiento y la fuerza general de la respuesta resultante.

Entendiendo el refuerzo

El refuerzo es un término que se usa en el condicionamiento operante para referirse a cualquier cosa que aumente la probabilidad de que ocurra una respuesta. El psicólogo B.F. Skinner es considerado el padre de esta teoría. Tenga en cuenta que el refuerzo se define por el efecto que tiene sobre el comportamiento: aumenta o fortalece la respuesta.

Por ejemplo, el refuerzo puede implicar presentar un elogio (el reforzador) inmediatamente después de que un niño guarda sus juguetes (la respuesta). Al reforzar el comportamiento deseado con elogios, será más probable que el niño vuelva a realizar las mismas acciones en el futuro.

El refuerzo puede incluir cualquier cosa que fortalezca o aumente un comportamiento, incluidas recompensas, eventos y situaciones concretas y tangibles. En un salón de clases, por ejemplo, los tipos de refuerzo pueden incluir elogios, salir del trabajo no deseado, recompensas simbólicas, dulces, tiempo de juego adicional y actividades divertidas.

Refuerzo primario y secundario

Aquí hay algunos antecedentes sobre los dos tipos principales de refuerzo.

Refuerzo primario

El refuerzo primario a veces se denomina refuerzo incondicional. Ocurre de forma natural y no requiere aprendizaje para funcionar. Los reforzadores primarios a menudo tienen una base evolutiva en el sentido de que ayudan a la supervivencia de la especie.

Ejemplos de reforzadores primarios incluyen:

  • Aire
  • Comida
  • Dormir
  • Sexo
  • Agua

La genética y la experiencia también pueden influir en cómo funciona el refuerzo de tales cosas. Por ejemplo, mientras que a una persona le puede resultar muy gratificante cierto tipo de comida, a otra puede no gustarle en absoluto.

Refuerzo secundario

El refuerzo secundario, también conocido como refuerzo condicionado, implica estímulos que se han vuelto gratificantes al ser emparejados con otro estímulo de refuerzo. Por ejemplo, al adiestrar a un perro, los elogios y las golosinas pueden usarse como reforzadores primarios. El sonido de un clicker se puede asociar con los elogios y golosinas hasta que el sonido del clicker mismo comienza a funcionar como reforzador secundario.

Tipos de refuerzo

En el condicionamiento operante, hay dos tipos diferentes de refuerzo. Ambas formas de refuerzo influyen en el comportamiento, pero lo hacen de diferentes formas. Los dos tipos incluyen:

  • Refuerzo positivo: esto implica agregar algo para aumentar la respuesta, como darle un caramelo a un niño después de que haya limpiado su habitación.
  • Refuerzo negativo: describe la eliminación de algo para aumentar la respuesta, como cancelar una prueba si los estudiantes entregan todas sus tareas de la semana. Al eliminar el estímulo aversivo (la prueba), el maestro espera aumentar el comportamiento deseado (completar todas las tareas).

Si bien estos términos involucran las palabras positivo y negativo, es importante notar que Skinner no los utilizó para significar "bueno" o "malo". En su lugar, piense en lo que estos términos significarían cuando se usaran matemáticamente.

Positivo es el equivalente a un signo más, lo que significa que algo se agrega o se aplica a la situación. Negativo es el equivalente a un signo menos, lo que significa que algo se quita o se resta de la situación.

Ejemplos del mundo real

Aquí hay algunos ejemplos del mundo real de cómo se puede utilizar el refuerzo para cambiar el comportamiento.

Refuerzo positivo

Durante la práctica para el equipo de softbol de su oficina, el entrenador grita: "¡Buen trabajo!" después de lanzar un lanzamiento. Debido a esto, es más probable que vuelvas a lanzar la pelota de la misma manera. Este es un ejemplo de refuerzo positivo.

Otro ejemplo es, mientras trabaja, excede la cuota de ventas de su gerente para el mes y, por lo tanto, recibe una bonificación como parte de su cheque de pago. Esto hace que sea más probable que vuelva a intentar superar la cuota mínima de ventas el próximo mes.

Reforzamiento negativo

Acude a su médico para que le aplique la vacuna anual contra la gripe a fin de evitar contraer la gripe. En este caso, está participando en un comportamiento (recibir una inyección) para evitar un estímulo aversivo (enfermarse). Este es un ejemplo de refuerzo negativo.

Otro ejemplo es si aplica un poco de gel de aloe vera en una quemadura solar para evitar que la quemadura duela. La aplicación del gel sobre la quemadura evita un resultado aversivo (dolor), por lo que este es un ejemplo de refuerzo negativo. Debido a que participar en el comportamiento minimiza un resultado aversivo, es más probable que vuelva a usar gel de aloe vera en el futuro.

También se puede ver un refuerzo negativo si tomó acetaminofén para deshacerse de un terrible dolor de cabeza. Después de unos 15 o 20 minutos, el dolor de cabeza finalmente desaparece. Debido a que tomar las pastillas le permitió eliminar una situación aversiva, es más probable que vuelva a tomar las pastillas para el dolor en el futuro para lidiar con el dolor físico.

Fuerza de la respuesta

Cómo y cuándo se administra el refuerzo puede afectar la fuerza general de la respuesta. Esta fuerza se mide por las siguientes cualidades de la respuesta después de que se detiene el refuerzo:

  • Exactitud
  • Duración
  • Frecuencia
  • Persistencia

Refuerzo continuo

En situaciones en las que se controla el refuerzo presente, como durante el entrenamiento, se puede manipular el momento en que se presenta un refuerzo. Durante las primeras etapas del aprendizaje, a menudo se usa el refuerzo continuo, como cuando le enseñas a tu perro un truco nuevo por primera vez. Este horario implica reforzar una respuesta cada vez que ocurre.

Refuerzo parcial

Una vez que se ha adquirido un comportamiento, a menudo es una buena idea cambiar a un programa de refuerzo parcial. Los cuatro tipos principales de refuerzo parcial incluyen:

  • Horarios de intervalo fijo: Reforzar un comportamiento después de que haya transcurrido un período de tiempo específico.
  • Horarios de razón fija: Reforzar un comportamiento después de que se haya producido un número específico de respuestas.
  • Horarios de intervalo variable: Reforzar el comportamiento después de que haya transcurrido un período de tiempo impredecible.
  • Horarios de razón variable: Reforzar el comportamiento después de un número impredecible de respuestas.

Una palabra de Googlawi

El refuerzo juega un papel vital en el proceso de condicionamiento operante. Cuando se usa de manera apropiada, el refuerzo puede ser una herramienta de aprendizaje eficaz para fomentar los comportamientos deseables y desalentar los indeseables.

Es importante recordar que lo que constituye un refuerzo puede variar de una persona a otra. En un salón de clases, por ejemplo, un niño puede encontrar una recompensa reforzadora mientras que otro puede ser indiferente a dicha recompensa. En algunos casos, lo que refuerza puede resultar una sorpresa.

Si un niño solo recibe atención de sus padres cuando lo regañan, esa atención puede reforzar la mala conducta. Al aprender más sobre cómo funciona el refuerzo, puede comprender mejor cómo los diferentes tipos de refuerzo contribuyen al aprendizaje y la conducta.