Sunteți pe pagina 1din 9

CONDICIONAMIENTO OPERANTE

El condicionamiento operante o condicionamiento instrumental es un tipo de


aprendizaje donde el comportamiento se controla con las consecuencias. Se basa en la
idea de que los comportamientos que se refuerzan tienden a mostrarse en más
ocasiones, mientras que los comportamientos que son castigados se extinguen.

¿Cuál es la diferencia entre el condicionamiento operante y el condicionamiento clásico?


En el condicionamiento operante, una respuesta voluntaria es seguida por un reforzador.
De esta manera, la respuesta voluntaria (por ejemplo, estudiar para un examen) es más
probable que se realice en el futuro. Al contrario, en el condicionamiento clásico un
estímulo activa automáticamente una respuesta involuntaria.

El condicionamiento operante puede describirse como un proceso que intenta


modificar el comportamiento mediante el uso del refuerzo positivo y negativo.
A través del condicionamiento operante, un individuo hace una asociación
entre un comportamiento particular y una consecuencia. Ejemplos:

 Los padres recompensan las buenas calificaciones de un niño con


dulces o algún otro premio.
 Un maestro premia a aquellos estudiantes que son tranquilos y
educados. Los estudiantes se dan cuenta que al comportarse así
reciben más puntos.
 Un alimento se da a un animal cada vez que presiona una palanca.

FUENTE: LIFEDER.COM
B.F. Skinner (1938) acuñó el término acondicionamiento operante. Skinner
identificó tres tipos de respuestas o operantes que pueden seguir el
comportamiento:

 Operantes neutrales: respuestas del entorno que no aumentan ni


disminuyen la probabilidad de que se repita un comportamiento.
 Reforzadores: respuestas del entorno que incrementan la
probabilidad de repetición de un comportamiento. Los reforzadores
pueden ser positivos o negativos.
 Castigos: respuestas del entorno que disminuyen la probabilidad
de que se repita un comportamiento. El castigo debilita el
comportamiento.

Antecedentes del condicionamiento operante

Thorndike fue el primero en reconocer que este condicionamiento incluye algo


más que una respuesta y un reforzador. La respuesta se da en presencia de
unos estímulos determinados, considerándose tres sucesos: el estímulo, la
respuesta y la consecuencia de la respuesta o reforzador.

Esta estructura facilita el desarrollo de diferentes vinculaciones como sería la


asociación entre el estímulo y la respuesta, la cual fue para Thorndike clave
para la formulación de la ley del efecto. A través de ésta afirmó que las
respuestas que vayan seguidas de consecuencias reforzantes, tendrán mayor
probabilidad de ocurrencia cuando el estímulo vuelva a aparecer.

FUENTE: LIFEDER.COM
Por el contrario, aquellas respuestas que son seguidas de consecuencias
negativas, tendrán una menor probabilidad de ocurrencia cuando el estímulo
vuelva a aparecer. La ley del efecto es el antecedente del condicionamiento
operante o condicionamiento instrumental, como era nombrado por
Thorndike.

Pero para Skinner, psicólogo del conductismo, el condicionamiento era el


fortalecimiento de las conductas según las consecuencias que anteriormente
se hubieran obtenido.

En esta línea, existen dos formas de condicionamiento:

 El clásico o pavloviano: se basa en la asociación de estímulos


incondicionados y condicionados, siendo las respuestas controladas
por los estímulos antecedentes.
 El condicionamiento operante: los estímulos consecuentes o
reforzadores hacen que se emita una conducta
determinada. Skinner explica que si la conducta es seguida de un
reforzador positivo, aumentaría la probabilidad de emisión de dicha
conducta en un futuro. Al contrario, si una respuesta no va seguida
de un reforzador o ese reforzador es negativo, la probabilidad de
emitir dicha conducta en un futuro será menor.

Conceptos básicos del condicionamiento operante

FUENTE: LIFEDER.COM

Refuerzo

Es el responsable de la emisión de respuestas, es decir, de la probabilidad de


que sucedan, sea mayor o menor en un futuro. Es un estímulo reforzante y
consecuente, ya que se da una vez se ha producido la respuesta.

Es imposible saber si un reforzador determinado influye en la conducta hasta


que no se presenta de manera contingente con una respuesta y se comprueba
que el comportamiento cambia a consecuencia del reforzador.

Existen dos tipos de refuerzo: positivo y negativo. Ambos tienen la misma


finalidad de aumentar la probabilidad de que la respuesta se emita en
situaciones futuras. Además, para Skinner los reforzadores se definen por
medio de las conductas que son observables y medibles.

Refuerzo positivo

El refuerzo positivo refuerza un comportamiento proporcionando una


consecuencia que un individuo encuentra gratificante.

Refuerzo negativo

La eliminación de un reforzador desagradable también puede fortalecer un


comportamiento. Esto se conoce como refuerzo negativo porque es la
eliminación de un estímulo adverso que es «gratificante» para el animal o la
persona. El refuerzo negativo refuerza el comportamiento porque detiene o
elimina una experiencia desagradable.

Reforzadores primarios

Serían todos aquellos reforzadores básicos que no necesitan de ninguna


historia de condicionamiento previa para funcionar como tales. Algunos
ejemplos serían el agua, la comida y el sexo.

Reforzadores secundarios

FUENTE: LIFEDER.COM
Los reforzadores secundarios si estarían basados en historias previas de
condicionamiento gracias a la asociación con estímulos incondicionados.
Algunos ejemplos serían el dinero y las calificaciones.

Contingencia de tres términos

Es el modelo básico del condicionamiento operante y está formado por tres


componentes: el estímulo discriminativo, la respuesta y el estímulo
reforzador.

Un estímulo discriminativo sería aquel que va a indicar al sujeto que el


reforzador está disponible, señalando que si lleva a cabo una determinada
conducta podrá obtener dicho reforzador. En contraposición tenemos el
estímulo delta o estímulos que indican que la conducta no va a llevar a la
obtención de ningún tipo de reforzador.

La respuesta sería la conducta que realizará el sujeto, cuya ejecución le


llevará o no a la obtención del estímulo reforzador.

Un estímulo reforzador, como se ha mencionado anteriormente, es el


responsable de la emisión de la conducta ya que gracias a su aparición la
probabilidad de emisión de una respuesta aumentará o disminuirá en el
futuro.

Conceptos a conocer del condicionamiento operante

Castigo

El castigo también se mide por sus efectos en la conducta del sujeto. En cambio, a
diferencia del refuerzo, lo que se pretende es la disminución o supresión de una
determinada conducta.

Un castigo reduce la probabilidad de emisión de una conducta en situaciones


posteriores. No obstante, no elimina la respuesta ya que si la amenaza de castigo
disminuye, la conducta puede volver a aparecer.

FUENTE: LIFEDER.COM
En el castigo también existen dos tipos o procedimientos diferentes, castigo positivo y
castigo negativo.

Castigo positivo

Este implica la presentación de un estímulo aversivo tras la realización de un


determinado comportamiento. Es dado de manera contingente a la respuesta dada por
el sujeto.

Castigo negativo

Consiste en la eliminación de un estímulo como consecuencia de un determinado


comportamiento, es decir, consiste en la retirada de un estímulo positivo tras la
realización de una determinada conducta.

Extinción

En la extinción se deja de emitir una respuesta debido a que el reforzador ya no aparece.


Este proceso se basa en dejar de proporcionar el reforzador correspondiente que se
espera conseguir y que ha hecho que ese comportamiento se mantenga a lo largo del
tiempo.

Cuando una respuesta se extingue, el estímulo discriminativo pasa a ser estímulo de


extinción. Este proceso no debe confundirse con el olvido, que es dado cuando la fuerza
de un comportamiento disminuye al no haber sido emitido en un período de tiempo.

Generalización

Ante una situación o estímulo determinado se condiciona una respuesta, que puede
aparecer ante otros estímulos o situaciones parecidas.

Discriminación

Este proceso es el opuesto al de generalización, en él se responde de manera diferente


según el estímulo y el contexto.

FUENTE: LIFEDER.COM
Programas de refuerzo

Skinner también estableció gracias a sus investigaciones diversos programas de


refuerzo, entre los que están los programas de reforzamiento continuo y los programas
de reforzamiento intermitente.

Programas de refuerzo continuo

Están basados en el reforzamiento constante de la respuesta cada vez que se presente,


es decir, cada vez que el sujeto ejecute la conducta deseada obtendrá un estímulo
reforzador o positivo.

Programas de refuerzo intermitente

En cambio, aquí el sujeto no siempre obtiene el reforzador al realizar la conducta


deseada. Estos se definen en base al número de respuestas dadas o al intervalo de
tiempo transcurrido entre respuestas, dando lugar a diferentes procedimientos.

Programas de razón fija

En estos programas el reforzador se proporciona cuando el sujeto genera respuestas


fijas y constantes. Por ejemplo, en un programa de razón 10 la persona obtiene el
reforzador tras haber realizado diez respuestas cuando se presenta el estímulo.

Programas de razón variable

Éste se construye igual que el anterior, pero en este caso el número de respuestas que
el sujeto debe dar para obtener el reforzador es variable.

El reforzador seguiría dependiendo del número de respuestas emitidas por el sujeto


pero con una razón variable, gracias a la cual se evita que el sujeto llegue a predecir
cuándo obtendrá el reforzador.

Programas de intervalo fijo

FUENTE: LIFEDER.COM
En los programas de intervalo la obtención del reforzador no depende del número de
respuestas que el sujeto dé, sino que está determinado por el tiempo transcurrido. En
consecuencia, se refuerza la primera respuesta producida después de haber pasado un
periodo de tiempo determinado.

En los programas de intervalo fijo el tiempo entre reforzador y reforzador es siempre el


mismo.

Programas de intervalo variable

En estos programas el reforzador se obtiene después de un tiempo, aunque el tiempo


es distinto para cada reforzador recibido.

Cambio conductual

Aproximaciones sucesivas o moldeamiento

El moldeamiento consiste en el cambio conductual a través del moldeamiento de


conductas o el refuerzo diferencial de aproximaciones sucesivas.

Para moldear una conducta concreta se siguen una serie de pasos. En primer lugar se
identifica cuál es la conducta inicial que se pretende moldear para saber a cuál se quiere
llegar.

Después, se delimitan los posibles reforzadores que se van a emplear y se separa en


pasos o etapas el proceso para llegar a la conducta final, reforzando cada etapa o
aproximación sucesiva hasta llegar a la última.

Con este procedimiento dinámico se van transformando tanto las conductas como sus
consecuencias. En este sentido, se refuerzan las aproximaciones sucesivas hacia una
conducta objetivo.

No obstante, para que se pueda llevar a cabo, es necesario partir de una conducta previa
que ya realice el sujeto, para así ir reforzando poco a poco sus conductas hasta llegar
a la meta.

FUENTE: LIFEDER.COM
Encadenamiento

Con él se forma una nueva conducta a partir de la descomposición en pasos o


secuencias más sencillas, reforzando cada respuesta dada en cada uno de los pasos
para así llevar al establecimiento de una respuesta más compleja en el repertorio
conductual del sujeto.

Se pueden llegar a formar cadenas largas de respuestas utilizando reforzadores


condicionados, adoptando una unidad funcional y cuyo establecimiento lleva a la
adquisición y definición de una destreza particular.

Referencias

1. Condicionamiento operante. Recuperado de wikipedia.org


2. Condicionamiento operante. Recuperado de e-torredebabel.com.
3. Recuperado de biblio3.url.
4. Ley del efecto. Recuperado de wikipedia.org.
5. Extinción. Recuperado de wikipedio.org.
6. Domjan, M. Principios de aprendizaje y conducta. Paraninfo. 5ª edición.

FUENTE: LIFEDER.COM

S-ar putea să vă placă și