Programas de reforzamiento: ¿qué son y cómo se utilizan?

En función de si queremos instaurar una conducta o mantenerla, o del tipo de comportamiento del que se trate, deberemos usar un programa de reforzamiento diferente.
Programas de reforzamiento: ¿qué son y cómo se utilizan?
Elena Sanz Martín

Escrito y verificado por la psicóloga Elena Sanz Martín.

Última actualización: 02 noviembre, 2022

El conductismo es una corriente psicológica que ofrece diversas técnicas para la modificación de conductas. Muchas de ellas son utilizadas en la educación de los niños, tanto en el ámbito escolar como en el hogar. Una de las más ampliamente conocidas es el refuerzo (premiar la conducta que queremos incrementar). Sin embargo, este puede aplicarse de diferentes maneras en función del objetivo. Por eso, hoy vamos a hablar de los distintos programas de reforzamiento.

Existen muchos estímulos que pueden actuar como reforzadores. Desde elementos tangibles, como una golosina o un juguete, hasta aspectos inmateriales, como un halago o una felicitación. Pero, además, el criterio que se sigue para aplicar el reforzador da lugar a diferentes procedimientos. En función del comportamiento que deseamos incrementar, unos pueden sernos de mayor utilidad que otros.

Programas de reforzamiento

Es un procedimiento mediante el cual es posible lograr el aprendizaje e incremento de la probabilidad de realizar una conducta con base en la asociación de esta con una consecuencia. Un programa de refuerzo es una regla que establece qué instancias de comportamiento, si las hay, se reforzarán.

Continuo e intermitente

El programa más conocido es el de reforzamiento continuo: la conducta se premia (se refuerza) siempre que aparece. Por ejemplo, cada vez que el niño hace la cama, se le felicita por su tarea. Este es el tipo de programa más efectivo para instaurar conductas nuevas, pues genera una mayor tasa de respuestas.

Niña recibiendo una galleta como parte de uno de los programas de reforzamiento.

Por otro lado, encontramos los programas de reforzamiento intermitente. En este caso, el reforzador no siempre sigue a la conducta; a veces se entrega y a veces no. Es más apropiado para mantener conductas ya instauradas, de forma que estas vayan dependiendo, cada vez en menor medida, del refuerzo.

Por ejemplo, cuando alabamos al niño por lo bien que ha recogido su habitación. Aunque esta ya sea una rutina para él, obtener ese premio social de vez en cuando ayudará a mantener la conducta.



De razón o de intervalo

Dentro de los programas de reforzamiento intermitente encontramos dos modalidades distintas, en función del criterio a seguir. Hablamos de reforzamiento de razón cuando la aparición del premio depende del número de veces que se emite la conducta. Por ejemplo, si reforzamos al niño con una pegatina por lavarse los dientes tras cada comida, deberá realizar la conducta tres veces para obtener el regalo.

Por otra parte, nos referimos a reforzamiento de intervalo cuando el criterio para reforzar es el tiempo transcurrido desde el último refuerzo. Pongamos un ejemplo: el menor está estudiando y el padre pasa por su habitación, de vez en cuando, para felicitarlo y darle ánimos. El refuerzo va apareciendo tras un intervalo de tiempo, pero el niño tiene que estar realizando la conducta cuando esto ocurra para poder obtenerlo.

El problema que aparece con el reforzamiento de intervalo es que se genera una pausa de conducta tras obtener el premio. Como el niño sabe que entre la aparición de un reforzador y del siguiente transcurrirá un tiempo, se permite parar su conducta al recibir el primero. Esta dificultad es menos frecuente cuanto menor es el intervalo.

Fijo o variable

Tanto los programas de razón como los de intervalo pueden ser de tipo fijo o variable. Un programa de razón fija otorga el premio cada X repeticiones de la conducta (por ejemplo, cada tres veces que te cepilles los dientes, obtienes una pegatina). Y, en el de razón variable, el reforzador aparece tras varias repeticiones, pero no se especifica cuántas (a veces cada dos, a veces cada cinco…).

Niño lavándose los dientes.

Del mismo modo, sería un programa de intervalo fijo si el premio se obtiene siempre tras el mismo espacio de tiempo. Por ejemplo, si a un niño no le gusta leer, cada 10 minutos de lectura obtiene un punto que luego podrá intercambiar por premios. Por el contrario, si el tiempo del intervalo no está especificado, será variable (el niño está estudiando y pasamos a animarlo de vez en cuando, a veces cada 15 minutos, otras cada 25…).



Programas de reforzamiento complejos

Programas complejos

Se entienden como programas compuestos aquellos en los que se presentan diversos programas a la vez y en relación a una única conducta.

  • Programas alternantes: dentro de este tipo de programa compuesto el sujeto obtiene reforzador cuando cumple con uno de los criterios de cualquiera de los dos o más programas de reforzamiento que se están aplicando a la vez.
  • Programas conjuntivos: este tipo de programa es algo más exigente: se precisa de que el sujeto cumpla con las dos o más condiciones procedentes de los diversos programas para obtener el refuerzo.
  • Programas entrelazados: en este caso las condiciones necesarias para obtener el reforzador van cambiando: la condición de un programa va a ir variando en función del avance que se haga en los otros.
  • Programas de ajuste: en este caso al igual que en el anterior el sujeto obtiene el reforzador dependiendo con condiciones que van variando, pero en vez de depender de cómo avanza la condición de uno para cambiar la del otro en este caso solo se depende de la actuación precedente.

Programas secuenciales

Los programas secuenciales son tipos de programa de reforzamiento que se caracterizan porque en ellos las condiciones necesarias para obtener el reforzador van variando.

  • Programas mixtos: dos o más programas se van alternando al azar independientemente de lo que haga el sujeto.
  • Programas múltiples: en este caso dos o más programas se van alternando, sin necesidad de que el sujeto haya hecho o no hecho la conducta para cambiar de programa.
  • Programas tándem: dos o más programas que se van alternando siempre con un mismo patrón y en el que para pasar de uno a otro el sujeto primero tiene que haber cumplido con la condición propuesta en el anterior.
  • Programas encadenados: se alternan dos programas con un patrón fijo y con base en que el sujeto haya cumplido la condición anterior para poder cambiar de programa.

Programas concurrentes

Este tipo de programa de reforzamiento se caracteriza por el hecho de que el sujeto está sometido a varios programas al mismo tiempo, de manera que puede obtener reforzadores en función de que realice diferentes conductas.

La extinción de respuestas reforzadas en diferentes horarios

La resistencia a la extinción se refiere a cuánto tiempo continúa mostrándose un comportamiento incluso después de que ya no se refuerce. Una respuesta alta en resistencia a la extinción tardará más tiempo en extinguirse por completo.

Diferentes programas de refuerzo producen diferentes niveles de resistencia a la extinción. En general, los horarios que se refuerzan de manera impredecible son más resistentes a la extinción.

Por lo tanto, el programa de razón variable es más resistente a la extinción que el programa de razón fija. El programa de intervalo variable es más resistente a la extinción que el programa de intervalo fijo siempre que los intervalos promedio sean similares.

En el programa de proporción fija, la resistencia a la extinción aumenta a medida que aumenta la proporción. En el programa de intervalo fijo, la resistencia a la extinción aumenta a medida que el intervalo se prolonga en el tiempo.

De los cuatro tipos de programas de reforzamiento parcial, el programa de relación variable es el más resistente a la extinción. Esto puede ayudar a explicar la adicción al juego.

Incluso si los jugadores pueden no recibir refuerzos después de un gran número de respuestas, tienen la esperanza de que pronto serán reforzados.

Utilidad de los programas de reforzamiento

Como vemos, cada tipo de programa tiene unas características y una utilidad diferente. Para instaurar conductas, el refuerzo continuo es más efectivo, pero para lograr un mantenimiento en el tiempo es preferible el intermitente.

Los programas de razón proporcionan tasas de respuesta más altas que los de intervalo, pero ambos, si son fijos, presentan una pausa tras el refuerzo. Para evitarlo, es preferible emplear intervalos cortos y pocas repeticiones, o utilizar programas variables. En función de la modificación de conducta que desees hacer, puedes analizar cuál es el tipo de programa que más te conviene emplear.

En líneas generales, la validez de los programas cognitivos conductuales ha sido estudiada como método eficaz para promover conductas positivas nuevas y, a su vez, lograr que se mantengan. Lo cual repercute en una mejor calidad de vida para los niños y su entorno, mediante la estrategia del reforzamiento que, en el caso del reconocimiento continuo, convierte en hábitos determinadas acciones que trascienden significativamente en su educación.

Te podría interesar...
Diferencias entre refuerzo positivo y negativo
Eres Mamá
Leerlo en Eres Mamá
Diferencias entre refuerzo positivo y negativo

El refuerzo es una técnica muy eficaz para modificar la conducta de los niños. Pero ¿sabes cuáles son las diferencias entre refuerzo positivo y neg...



  • Figueroa Salvador, D. (2018). Una revisión de estudios de tratamientos cognitivo-conductuales de eficacia para el abordaje del Trastorno Negativista Desafiante. In X Congreso Internacional de Investigación y Práctica Profesional en Psicología XXV Jornadas de Investigación XIV Encuentro de Investigadores en Psicología del MERCOSUR. Facultad de Psicología-Universidad de Buenos Aires. https://www.aacademica.org/000-122/14
  • Lim, A (2020, July 02). Schedules of reinforcement. Simply Psychology. www.simplypsychology.org/schedules-of-reinforcement.html
  • Torres, C., Villamil, W., & Calleros, K. (2009). Efectos de la disminución de la probabilidad y la disponibilidad de reforzamiento en programas temporales de distinta duración. Revista mexicana de análisis de la conducta35(SPE), 87-100.
  • Rodríguez, E. M. (2018b, 23 octubre). ¿Qué es el condicionamiento operante o instrumental. Recuperado 8 enero, 2020, de https://lamenteesmaravillosa.com/que-es-el-condicionamiento-operante-o-instrumental/