viernes, 15 de julio de 2016

APRENDIZAJE POR LAS CONSECUENCIAS:


El aprendizaje por las consecuencias, o condicionamiento operante, constituye un nivel superior en el análisis del aprendizaje al establecido en el condicionamiento clásico.
Historia:
En 1991, Thorndike, que trabajaba con gatos, formuló su ley del efecto, indicando que de entre las distintas respuestas que se dan en una situación, aquéllas a las que acompaña, o a las que sigue de inmediato, la satisfacción del animal, manteniéndose constantes todos los demás elementos, se asociarán de modo más firme con la situación, de modo que cuando la situación vuelva a aparecer será más probable que se presenten. En cambio, aquellas otras a las que acompaña o a las que sigue de inmediato una insatisfacción, debilitarán sus conexiones con la situación, de modo que cuando ésta se vuelva a presentar será menos probable que aquellas respuestas vuelvan a aparecer.
El experimento básico que realizó Thorndike consistía en encerrar en una caja, desde la que se podía ver un recipiente con comida, a un gato motivado (hambriento); la caja disponía de una palanca que si era pulsada abría la puerta; el gato se movía inquieto por la caja, hasta que por azar presionaba la palanca que abría la puerta; entonces el gato salía y comía. Después de algunos ensayos como el descrito, el gato abría la puerta nada más ser encerrado: había aprendido la conducta de escapar para obtener su comida.
Procedimiento:
No es suficiente la contigüidad temporal de dos sucesos, sino que es la contingencia (relación temporal) respuesta- consecuencias lo que determina este tipo de aprendizaje. La respuesta que produce una consecuencia recompensante será aprendida y se hará cada vez más frecuente con un entrenamiento prolongado. Si la respuesta deja de producir la recompensa, la conducta disminuye consecuentemente en vigor y probabilidad de ocurrencia.
Existen dos clases de consecuencias o reforzadores: a) Las apetitivas (positivas, agradable, premios) y b) las aversivas. Las consecuencias apetitivas o premios son las que resultan agradables para el sujeto que las recibe, mientras que las consecuencias aversivas son las que resultan desagradables.
En este contexto de aprendizaje, se llama reforzamiento, o refuerzo, al proceso de fortalecimiento de la asociación entre el reforzador y la respuesta; este fortalecimiento determina que se produzca un aumento en la probabilidad de emisión de la conducta reforzada. El refuerzo puede ser de dos tipos: a) refuerzo positivo, cuando el aumento en la probabilidad de la respuesta se logra mediante la presencia de un reforzador apetitivo y b) refuerzo negativo, cuando el aumento de la probabilidad de la respuesta se logra mediante la terminación o ausencia de un reforzador aversivo.
Como fenómeno opuesto al de refuerzo, el castigo es aquel proceso de fortalecimiento de la asociación entre el reforzador y la respuesta, que tiene como resultado la disminución o desaparición de una conducta, tras la administración de una consecuencia aversiva; puede ser de dos tipos: a)castigo positivo (conocido simplemente como castigo), es cuando la disminución o desaparición de la conducta se logra mediante la presencia de un reforzador aversivo, y b) castigo negativo, que es cuando la disminución o desaparición de la conducta se logra mediante la eliminación de un reforzador apetitivo.
Algunas veces, los estímulos cercanos a un reforzador pueden condicionarse, mediante los mecanismos de condicionamiento clásico que ya hemos descrito, y llegar a producir los mismos efectos de reforzamiento que el reforzador primario. Esto se conoce como refuerzo secundario. Se entiende por reforzadores primarios aquellos que son incondicionados para el organismo (por ej., el agua o la comida). Así, algunos estímulos se convierten en reforzadores para el sujeto por su asociación con un reforzador en la experiencia previa; esos estímulos reciben el nombre de reforzadores secundarios o condicionados (p ej., el dinero, los aplausos, etc.). El condicionamiento operante establecido por reforzadores secundarios se denomina condicionamiento de segundo orden. La importancia del reforzador secundario es clara desde el momento en que la compleja conducta humana no siempre es modificada por reforzadores primarios.
La extinción es el procedimiento consistente en suspender el refuerzo o castigo después de una respuesta, de forma que el sujeto no pueda obtener el reforzador sea cual sea su conducta. La consecuencia resultante es una disminución gradual de la respuesta aprendida, e inversamente, un incremento de las respuestas alternativas que compiten con ella.

Para que la extinción se produzca es necesario que el cambio de situación de refuerzo, o castigo, a no refuerzo, o no castigo, debe ser fácil de distinguir; cualquier señal que está presente durante la extinción y no durante la adquisición, acelera la extinción.

A.M.J.

No hay comentarios:

Publicar un comentario