El aprendizaje por las consecuencias, o condicionamiento
operante, constituye un nivel superior en el análisis del aprendizaje al
establecido en el condicionamiento clásico.
Historia:
En 1991, Thorndike,
que trabajaba con gatos, formuló su ley
del efecto, indicando que de entre las distintas respuestas que se dan en
una situación, aquéllas a las que acompaña, o a las que sigue de inmediato, la
satisfacción del animal, manteniéndose constantes todos los demás elementos, se
asociarán de modo más firme con la situación, de modo que cuando la situación
vuelva a aparecer será más probable que se presenten. En cambio, aquellas otras
a las que acompaña o a las que sigue de inmediato una insatisfacción,
debilitarán sus conexiones con la situación, de modo que cuando ésta se vuelva
a presentar será menos probable que aquellas respuestas vuelvan a aparecer.
El experimento básico que realizó Thorndike consistía en
encerrar en una caja, desde la que se podía ver un recipiente con comida, a un
gato motivado (hambriento); la caja disponía de una palanca que si era pulsada
abría la puerta; el gato se movía inquieto por la caja, hasta que por azar
presionaba la palanca que abría la puerta; entonces el gato salía y comía.
Después de algunos ensayos como el descrito, el gato abría la puerta nada más
ser encerrado: había aprendido la conducta de escapar para obtener su comida.
Procedimiento:
No es suficiente la contigüidad temporal de dos sucesos,
sino que es la contingencia (relación temporal) respuesta- consecuencias lo que
determina este tipo de aprendizaje. La respuesta que produce una consecuencia
recompensante será aprendida y se hará cada vez más frecuente con un
entrenamiento prolongado. Si la respuesta deja de producir la recompensa, la
conducta disminuye consecuentemente en vigor y probabilidad de ocurrencia.
Existen dos clases de consecuencias o reforzadores: a) Las
apetitivas (positivas, agradable, premios) y b) las aversivas. Las consecuencias
apetitivas o premios son las que resultan agradables para el sujeto que las
recibe, mientras que las consecuencias aversivas son las que resultan
desagradables.
En este contexto de aprendizaje, se llama reforzamiento, o refuerzo, al proceso
de fortalecimiento de la asociación entre el reforzador y la respuesta; este
fortalecimiento determina que se produzca un aumento en la probabilidad de
emisión de la conducta reforzada. El refuerzo puede ser de dos tipos: a) refuerzo positivo, cuando el aumento
en la probabilidad de la respuesta se logra mediante la presencia de un
reforzador apetitivo y b) refuerzo
negativo, cuando el aumento de la probabilidad de la respuesta se logra
mediante la terminación o ausencia de un reforzador aversivo.
Como fenómeno opuesto al de refuerzo, el castigo es aquel proceso de fortalecimiento de la asociación
entre el reforzador y la respuesta, que tiene como resultado la disminución o
desaparición de una conducta, tras la administración de una consecuencia
aversiva; puede ser de dos tipos: a)castigo
positivo (conocido simplemente como castigo), es cuando la disminución o
desaparición de la conducta se logra mediante la presencia de un reforzador
aversivo, y b) castigo negativo, que
es cuando la disminución o desaparición de la conducta se logra mediante la
eliminación de un reforzador apetitivo.
Algunas veces, los estímulos cercanos a un reforzador pueden
condicionarse, mediante los mecanismos de condicionamiento clásico que ya hemos
descrito, y llegar a producir los mismos efectos de reforzamiento que el
reforzador primario. Esto se conoce como refuerzo
secundario. Se entiende por reforzadores primarios aquellos que son
incondicionados para el organismo (por ej., el agua o la comida). Así, algunos
estímulos se convierten en reforzadores para el sujeto por su asociación con un
reforzador en la experiencia previa; esos estímulos reciben el nombre de
reforzadores secundarios o condicionados (p ej., el dinero, los aplausos,
etc.). El condicionamiento operante establecido por reforzadores secundarios se
denomina condicionamiento de segundo orden. La importancia del reforzador
secundario es clara desde el momento en que la compleja conducta humana no
siempre es modificada por reforzadores primarios.
La extinción es el procedimiento consistente en suspender el
refuerzo o castigo después de una respuesta, de forma que el sujeto no pueda
obtener el reforzador sea cual sea su conducta. La consecuencia resultante es
una disminución gradual de la respuesta aprendida, e inversamente, un incremento
de las respuestas alternativas que compiten con ella.
Para que la extinción se produzca es necesario que el cambio
de situación de refuerzo, o castigo, a no refuerzo, o no castigo, debe ser
fácil de distinguir; cualquier señal que está presente durante la extinción y
no durante la adquisición, acelera la extinción.
A.M.J.
No hay comentarios:
Publicar un comentario