Documente Academic
Documente Profesional
Documente Cultură
PROGRAMAS DE INTERVALO
El Er+ no depende exclusivamente del n de Rs que d el sujeto (esfuerzo) sino que algunas
Rs se refuerzan en momentos determinados, transcurrida una determinada cantidad de
tiempo.
Cuando ya tiene suficiente experiencia, el sujeto aprende que, despus del reforzamiento,
tiene que dar un n determinado de Rs para recibir el siguiente reforzador.
PROGRAMA DE INTERVALO FIJO: cantidad de tiempo constante de una ocasin a
otra.
Ej.: IF 2 min: se refuerza la primera respuesta transcurridos 2 min desde la ltima
recompensa.
Dado que las respuestas que se ejecutan despus de la recompensa, no son reforzadas,
los animales aprenden a esperar a dar la R instrumental hasta el momento en que se
aproxima el final del intervalo fijo de 2 min. Se dan muy pocas respuestas al principio del
intervalo posterior a la recompensa. Acelera las respuestas al final del intervalo. Este
patrn de respuestas se llama festn del intervalo fijo.
Importante: el programa de intervalo fijo no asegura que el animal vaya a ser reforzado a
intervalos fijos, sino que lo que es fijo es el tiempo y se refuerza la primera respuesta que
el animal d, pasado ese intervalo (es necesario que d la respuesta instrumental). El
intervalo solo determina el momento en que el reforzador esta disponible.
Ej.: lavadora. Por muchas veces, que abramos la puerta, la ropa no estar limpia hasta
terminar el ciclo de lavado.
Ej.: tarta que tiene que cuajar. Por muchas veces que abramos la nevera, hasta que no
pase el tiempo necesario no estar lista para comer. Si estamos ansiosos por probarla, las
veces que abramos las puertas de la nevera se asemejarn al festn del intervalo fijo.
Las pausas post-reforzamiento pueden ocurrir porque una vez que se entrega la
recompensa, no hay posibilidades de ms hasta pasado un tiempo.
2
Ej.: exmenes. Se estudia antes del examen y se recompensa con la nota. Estudiar al
principio de curso o despus del examen no tiene recompensa. Una frecuencia mayor de
estudio est motivada por una frecuencia mayor de exmenes. Habra mayor tasa de
respuesta si se hicieran exmenes sin previo aviso de forma anloga a los programas de
intervalo variable (control por sorpresa).
PROGRAMA DE INTERVALO VARIABLE: el reforzador se suministra cuando se da la
primera respuesta despus de que transcurra una cantidad variable de tiempo desde el
reforzador anterior. El intervalo medio que tiene que pasar antes de que est disponible la
recompensa es de 4 min (IV 4 min).
No hay pausas = tasas estables y continuas de respuesta.
Ej.: mecnico no puede decirnos cunto tardar en arreglarnos el coche.
Tanto a los programas de intervalo fijo como a los programas de intervalo variable se le puede
aplicar la duracin limitada: restriccin del tiempo que est disponible la recompensa. Esto
ocurre en situaciones fuera de laboratorio.
Ej.: restaurante solo sirve comida en horas determinadas.
COMPARACION
PREGUNTAS
Qu tipo de programa es ms adecuado para instaurar una nueva conducta, continuo o
parcial? CONTINUO.
qu tipos de programas son ms resistentes a la extincin, fijos o variables? VARIABLES.
Qu tipos de programas producen mayor tasa de R, razn o intervalo? RAZN.
Qu tipos de programas producen una mayor estabilidad en la respuesta, fijos o
variables? VARIABLES.
Los programas de razn fomentan tasas de respuesta ms altas que los programas de
intervalo. Pero ninguno de los dos exige que los sujetos acten con una tasa especfica de
respuesta para ser reforzados. Las diferencias son un efecto indirecto de los programas. Hay
otros programas que exigen una tasa especfica de respuestas para ser reforzados =
programa de reforzamiento de tasas de respuesta.
Tiempo interrespuesta (ITR): tiempo entre las sucesivas respuestas.
Ej.: la R se reforzar solo si se presenta antes de 5 seg desde la ultima respuesta. Si da
respuestas cada 5 seg, su tasa de respuesta ser de 12 por min.
REFORZAMIENTO DIFERENCIAL DE TASAS ALTAS (RDA): una R se refuerza solo
si aparece en un periodo de tiempo determinado despus de la ltima R.
Ej.: cadena de montaje. Trabajador se adapta a la velocidad de movimiento de la cadena.
REFORZAMIENTO DIFERENCIAL DE TASAS BAJAS (RDB): depende de que se
espere el tiempo preciso entre R, de no adelantarse.
*Oscar Berman (1980) us los RDB para estudiar los dficits en el sndrome de Korsakoff
(producido por alcohol, prdida de memoria de hechos recientes). Se interes por estudiar
hasta qu punto el dficit de memoria de hechos recientes era secundario a otros
problemas. Plante la hiptesis de que el dficit neurolgico de los Korsakoff les hace
responder prematuramente a la informacin que les llega (una salida en falso). Palanca
reforzada con peniques segn distintos programas RBD (3 seg, 6, seg., 12 seg., 18 seg.). 3
grupos:
a) Normales: resultados normales.
b) Alcohlicos sin Korsakoff: resultados intermedios.
c) Alcohlicos con Korsakoff: mucho menos capaces de esperar el tiempo suficiente para el
reforzamiento.
Interpretacion resultados: los dficits en las actuaciones con RBD son las primeras seales
de aviso de un deterioro neurolgico previo a la enfermedad de Korsakoff.
Programa concurrente de reforzamiento: el sujeto es libre de cambiar de una alternativa
de R a otra.
Laberintos en T. Manipulador hacia la derecha o izquierda cada uno con un programa de
reforzamiento distinto. La preferencia se mide por la tasa alternativa de respuesta en cada
manipulador o por el tiempo que pasa respondiendo en cada una de ellas.
En su artculo los determinantes de la conducta en el punto de eleccin, Tolman (1938)
avanza que toda conducta es esencialmente una conducta de eleccin.