Documente Academic
Documente Profesional
Documente Cultură
CAPTULO 4
REFORZAMIENTO*
Este captulo ha sido traducido por Javier Virus Ortega, University of Manitoba y St.
accionar la palanca y abrir la puerta. Finalmente, el gato manipulaba la palanca tan pronto
se le pona en la jaula (Thorndike, 1911). Thorndike llam a este fenmeno ley del
efecto.
El ejemplo muestra que cuando el gato era puesto nuevamente en la jaula (Figura
4-1) tena cada vez ms probabilidades de accionar con xito la palanca ya que el
comportamiento de apretar la palanca daba acceso a una consecuencia inmediata: escapar
de la jaula y obtener alimentos. El acceso a comida fue la consecuencia que reforz
(fortaleci) el comportamiento de accionar la palanca con la pata.
Pgina 74
Page 75
DEFINICIN DE REFORZAMIENTO
Pgina 77
Pgina 78
Hay quien confunde el reforzamiento negativo con el castigo (vase el captulo 6).
Debemos tener presente que son procesos diferentes. El reforzamiento negativo, al igual
que el reforzamiento positivo, aumenta o refuerza una conducta, mientras que el castigo
disminuye o debilita una conducta. La confusin proviene del uso de la palabra
"negativo" para describir el reforzamiento negativo. En este contexto, la palabra negativo
no hace referencia a nada malo o desagradable, sino a la retirada del estmulo aversivo
despus de la ocurrencia de la conducta.
Pgina 79
Lee cada ejemplo de la Tabla 4-1 e identifica cules son ejemplos de reforzamiento positivo y
cules son ejemplos de reforzamiento negativo razonando tus respuestas. Puedes encontrar las
respuestas en el Apndice B al final de este captulo.
1. Cul es el comportamiento?
2. Qu sucedi inmediatamente despus de la conducta? (Apareci un estmulo
o se retir un estmulo que estaba presente previamente?).
3. Qu pas con el comportamiento posteriormente? (Fue reforzado? es decir,
increment la probabilidad de que ocurriera?).
Pgina 80
Como ya hemos visto, durante el reforzamiento la conducta puede ser seguida por
la aparicin de un reforzador en casos de reforzamiento positivo, o la eliminacin de un
estmulo aversivo en casos de reforzamiento negativo. En ambos casos la conducta es
fortalecida. Tanto durante el reforzamiento positivo como durante el reforzamiento
negativo la consecuencia reforzante puede ser el resultado de las acciones de otra persona
o el resultado de la interaccin directa con el entorno fsico (p.ej., Iwata, Vollmer y
Zarcone, 1990; Iwata, Vollmer, Zarcone y Rodgers, 1993). Cuando un comportamiento
produce una consecuencia reforzante a travs de las acciones de otra persona hablamos
de un proceso de reforzamiento social. Un ejemplo de reforzamiento social sera pedirle a
nuestro compaero de piso que nos pase la bolsa de patatas fritas. Un ejemplo de
reforzamiento social negativo sera que le pidisemos a nuestro compaero de piso que
baje el volumen de la televisin cuando est demasiado alto. En ambos casos, la
consecuencia de la conducta se produce a travs de las acciones de otra persona. Por el
contrario, cuando el comportamiento produce una consecuencia reforzante que resulta del
contacto directo con el entorno fsico, el proceso se denomina reforzamiento automtico.
Un ejemplo de reforzamiento automtico positivo sera ir uno mismo a la cocina a traer
las patatas fritas. Un ejemplo de reforzamiento automtico negativo sera el bajar uno
mismo el volumen de la televisin usando el mando a distancia. En ambos casos, la
consecuencia reforzante no fue producida por otra persona.
Un tipo de reforzamiento positivo especial consiste en la posibilidad de realizar
un comportamiento muy probable, es decir, un comportamiento preferido, como
consecuencia de realizar un comportamiento poco probable o poco preferido. Este
Pgina 81
Despus de una serie de ensayos en los que el tono se presenta justo antes de la
descarga, la rata comienza a ir al otro lado de la caja tan pronto oye el tono, de este modo,
la rata evita la descarga saltando al otro lado tan pronto como el estmulo de advertencia
se presenta.
Pgina 82
varias veces, el clic llega a convertirse en un reforzador condicionado. Una vez el clic se
ha establecido como reforzador condicionado, el entrenador emparejar el sonido con el
reforzador incondicionado espordicamente, en este caso el pescado, a fin de que el clic
contine funcionando como reforzador condicionado (Pryor, 1985). Un estmulo
inicialmente neutro, como un disco de plstico o una tarjeta de cartn, puede utilizarse
como reforzador condicionado (fichas) para modificar la conducta en un programa de
reforzamiento que use una economa de fichas. En una economa de fichas, se da la ficha
despus de que se haya realizado una conducta deseada. Posteriormente, la persona
intercambiar la ficha por otros reforzadores, llamados reforzadores recuperables. El
emparejamiento de las fichas con los reforzadores recuperables hace que estas se
conviertan en reforzadores de la conducta (vase una revisin de los programas de
reforzamiento con fichas en Kazdin [1982]). El Captulo 22 explica los programas de
reforzamiento con fichas en mayor detalle.
Pgina 83
La efectividad del reforzamiento est influida por una serie de factores tales como
la inmediatez y la consistencia con la que se presenta la consecuencia, las operaciones de
establecimiento, la magnitud del reforzador y las diferencias individuales.
Inmediatez
Pgina 84
Contingencia
Operaciones de Establecimiento
Ciertos eventos pueden hacer que una consecuencia concreta sea ms reforzante
en algunos momentos que en otros. Por ejemplo, la ingesta de alimento es un reforzador
ms poderoso para una persona que no ha comido recientemente que para una persona
que acaba de ingerir una copiosa comida. Del mismo modo, el agua es un reforzador ms
potente para alguien que no ha bebido en todo el da, que para alguien que acaba de beber
medio litro de agua. Anlogamente, el agua u otras bebidas sern ms reforzantes para
una persona que acaba de comer palomitas de maz saladas que para alguien que no lo
hizo (ello explica porqu en algunos bares den aperitivos salados gratuitamente). En estos
ejemplos, la privacin de alimentos y comer palomitas saladas hacen que el alimento y
los lquidos adquieran valor reforzante. Estos acontecimientos, que tienen la propiedad de
cambiar el valor de un estmulo como reforzador, se denominan operaciones de
establecimiento (Michael, 1982, 1993b). En otras palabras, se trata de operaciones que
establecen la efectividad de un reforzador en un momento determinado incrementando la
probabilidad de que ocurra el comportamiento que permite acceder al reforzador.
individuo, por ejemplo, debido a un gasto inesperado, incrementa el valor del dinero
como reforzador.
Pgina 85
Las instrucciones o las reglas tambin puede funcionar como una operacin de
establecimiento y afectar el valor reforzante de un estmulo (Schlinger, 1993). Por
ejemplo, las monedas de cntimo no son reforzadores potentes para la mayora de la
gente, sin embargo, si te dijeran que hay escasez de monedas de cobre y que ahora valen
50 cntimos cada una, el valor reforzante de estas monedas aumentara, y se
incrementara la probabilidad de que realizases conductas que permitan adquirir ms
monedas de cntimo. Otro ejemplo, imagina que acabas de comprar una nueva mesa para
el ordenador y la impresora y cuando lees las instrucciones de montaje caes en la cuenta
de que necesitas un destornillador para montarla. Esta circunstancia aumentara el valor
reforzante del destornillador requerido y se hara probable que fueras a buscar uno.
Buscar el destornillador estara reforzado por encontrarlo y poder montar la mesa.
Diferencias Individuales
aunque no lo sern para un nio que sea alrgico al chocolate y se enferme cuando los
tome. El Captulo 15 presenta varias formas de identificar qu consecuencias funcionan
como reforzadores.
Pgina 86
Magnitud
PROGRAMAS DE REFORZAMIENTO
Pgina 87
Pgina 88
Razn fija
Ferster y Skinner (1957) hallaron que las tasas de respuesta de palomas bajo programas
de razn fija era elevada. Tambin observaron que a menudo se produca una breve pausa
en las respuestas despus de la entrega del reforzador. Replicaron esta anlisis con
programas de razn fija que requeran de 2 a 400 respuestas para obtener el reforzador
observndose generalmente que la tasa de respuestas se incrementaba de forma paralela
al incremento de la razn del programa.
Podemos ver ejemplos de programas de reforzamiento de razn fija en el mbito
acadmico o de trabajo con el propsito de mantener un comportamiento adecuado.
Consideremos el ejemplo de Pablo, un joven de 26 aos de edad con retraso mental grave
que trabaja en una fbrica embalando piezas. Como las piezas llegan a travs de una cinta
transportadora, Pablo los recoge y las mete en cajas. El supervisor de Pablo le da una
ficha (reforzador condicionado) despus de cada 20 piezas empaquetadas. Este sera un
caso de programa de reforzamiento de razn fija 20 (RF 20). Durante el y despus del
trabajo, las fichas pueden intercambiarse por reforzadores recuperables (p.ej., aperitivos,
palomitas de maz). Programas parecidos pueden usarse en el entorno escolar dando a los
estudiantes reforzadores (p.ej., estrellas, pegatinas, buenas notas) para la correcta
realizacin de un nmero fijo de problemas u otras tareas escolares. Otro ejemplo de
programa de reforzamiento de razn fija se da en el trabajo a destajo cuando se paga a los
trabajadores una cantidad determinada de dinero por cada nmero fijo de respuestas
(p.ej., 5 por cada 12 piezas ensambladas).
Razn Variable
Al igual que en los programas de razn fija, en los programas de razn variable
la entrega del reforzador depende del nmero de respuestas que se producen, solo que en
este caso, el nmero de respuestas necesarias para obtener el reforzador vara en torno a
un nmero promedio de respuestas. Es decir, el reforzador se presenta despus de que una
media de X respuestas se han emitido. Por ejemplo, en un programa de razn variable 10
(RV 10), el reforzador se proporciona despus de un promedio de 10 respuestas. El
nmero de respuestas necesarias para obtener cada reforzador podr variar de entre 2 o 3
hasta 20 o 25, no obstante, el nmero promedio de respuestas ser igual a 10. Ferster y
Skinner (1957) evaluaron programas de razn variable en palomas y hallaron que estos
programas generan una tasa de respuestas elevada y constante. A diferencia de los
programas de razn fija, en los programas de razn variable la pausa tras la entrega del
reforzador es mnima. Ferster y Skinner evaluaron programas de razn variable
incluyendo algunos que requeran un gran nmero de respuestas para obtener el
reforzador (p.ej., la RV 360).
Pgina 89
Intervalo fijo
Pgina 90
frecuente durante la primera parte del intervalo. Este patrn de comportamiento (mayor
tasa de respuesta al final del intervalo) es caracterstico de los programas de
reforzamiento de intervalo fijo. Por esta razn, estos programas rara vez se utilizan en
enseanza o durante el entrenamiento de habilidades. Por el contrario, los programas de
razn fija y razn variable se usan ms frecuentemente, ya que producen tasas de
respuesta ms altas y estables. Pablo aprendi a embalar ms piezas y a recibir ms fichas
bajo programas de razn fija y razn variable. Por el contrario, bajo el programa de
intervalo fijo, Pablo aprendera a embalar piezas en un perodo limitado en torno al final
de cada intervalo de 30 minutos.
Intervalo variable
una tecla) se produjo a un ritmo constante, mientras que en el programa de intervalo fijo
se observ una disminucin en la frecuencia durante la primera parte del intervalo y un
aumento de frecuencia hacia el final del intervalo. Dado que la duracin del intervalo, y
por tanto la disponibilidad del reforzador, es imprevisible en un programa de intervalo
variable, esta bimodalidad en el patrn de respuesta no se desarroll. Una vez ms,
consideremos el caso de Pablo y el embalaje de piezas.
Pgina 91
Pgina 92
Pgina 93
5. El reforzamiento puede ser programado para ocurrir cada vez que se produce el
comportamiento (refuerzo continuo) o puede ocurrir de forma intermitente. Los
programas de reforzamiento continuo se usan durante la adquisicin, es decir, durante el
aprendizaje de un nuevo comportamiento. Los programas intermitentes se utilizan para
mantener la conducta, una vez que esta ha sido aprendida. Hay cuatro programas bsicos
de reforzamiento intermitente. En los programas de razn se requieren varias respuestas
para que se presente el reforzador. En un programa de razn fija, el nmero de respuestas
PALABRAS CLAVE
Adquisicin, 87
Conducta de escape, 80
Conducta de evitacin, el 80
Conducta operante, 75
Consecuencia, el 73
Esfuerzo de respuesta, 92
Estmulo aversivo, 78
Estmulo, 78
Ficha, 82
Mantenimiento, 87
Operacin de establecimiento, 84
Principio de Premack, 80
Privacin, 84
Programa de intervalo fijo, 89
Programa de intervalo variable, 90
Programa de razn fija, 88
Programa de razn variable, 88
Programa de reforzamiento continuo 84, 86
Programa de reforzamiento intermitente, 86
Programa de reforzamiento, 86
Programas concurrentes de reforzamiento, 92
Reforzador condicionado generalizado, 83
Reforzador condicionado, 82
Reforzador condicionado, 82
Reforzador positivo, 78
Reforzador recuperable, 82
Reforzador, 75
Reforzamiento negativo, 78
Reforzamiento positivo, 78
Reforzamiento, 73
Respuesta, 83
Saciedad, 84
TEST PRCTICO
Pgina 94
APNDICE A
Conducta Operante
Reforzador
1. Llanto de un nio.
2. Abrir un paraguas.
Pgina 95
3. Encender el extractor.
pregunta de clase.
Ganan dinero.
La rabieta para.
APNDICE B
Pgina 97
Captulo 4
Cuestionario 1
Nombre: ___.
De entre los cinco programas de reforzamiento estudiados (continuo, razn fija, razn
variables, intervalo fijo, e intervalo variable), indica a cules se refieren los siguientes
ejemplos:
8. ___ El reforzador se entrega despus de cada respuesta.
9. ___ El reforzador se entrega despus de un promedio x de respuestas.
10. ___ El reforzador se entrega coincidiendo con la primera respuesta despus de
un periodo de tiempo x.
Pgina 98
Captulo 4
Cuestionario 2
Nombre: ___.
Pgina 99
Captulo 4
Cuestionario 3
Nombre: ___.
10. Roberto vende productos por telfono y nunca sabe cuando alguien se
comprometer a comprar un producto. No obstante, sabe que hace una venta como media
cada 13 llamadas. Qu programa est reforzando el comportamiento de Roberto de
hacer llamadas? ___.
MARCO 4-1
MARCO 4-2
Reforzamiento
Respuesta Consecuencia
Resultados: Es ms probable que la conducta es ms probable de que ocurra en el futuro.
Respuesta Consecuencia
El gato golpea la palanca con una pata // e inmediatamente // la puerta se abre y hay
acceso a la comida.
Resultado: Es ms probable que el gato le de a la palanca cuando se le pone en la jaula en
el futuro.
Respuesta Consecuencia
La rata presiona la palanca // e inmediatamente // se presenta la comida.
Resultados: Es ms probable que la rata presione la palanca en el futuro.
Escape.
Respuesta Consecuencia
Cuando recibe una descarga elctrica, la rata salta al otro lado de la caja // e
inmediatamente // logra escapar de la descarga.
Evitacin.
Respuesta Consecuencia
Cuando se presenta el tono, la rata salta al otro lado y // de inmediato // evita la descarga
elctrica.
Resultados: La rata tiene ms probabilidades de saltar a la otra parte de la caja en futuras
ocasiones en las que se presente un tono.
MARCO 4-3
Escape
Evitacin
Escape
Evitacin
Escape
Evitacin
MARCO 4-4
Inmediatez
Contingencia
El establecimiento de
las operaciones de
Las diferencias
individuales
Magnitud
MARCO 4-5
PROGRAMAS DE REFORZAMIENTO.
Razn fija
Razn variable
Intervalo fijo
Intervalo variable
TABLA 4-1
FIGURA 4-1
Un gato con hambre est en la jaula con comida a la vista fuera de la jaula.
Cuando el gato acciona la palanca, la puerta de la jaula se abre y el gato se come la
comida. Como resultado, el gato tiene ms probabilidades de accionar la palanca cuando
se le pone en la jaula.
FIGURA 4-2
FIGURA 4- 3
FIGURA 4- 4