Aprendizaje II Flashcards
¿Será que el ser humano sólo responde automáticamente a estímulos… una conducta involuntaria? ¿O nuestra conducta también tiene propósito?
Definición de Condicionamiento Operante
Parte de la crítica al condicionamiento clásico fue la falla en explicar conductas voluntarias o con propósito o por el elección propia, más allá de un reflejo. El Condicionamiento Operante intenta explicar este otro aspecto del aprendizaje.
Las investigaciones de B. F. Skinner y Edward L. Thorndike sentaron las bases para el Condicionamiento Operante, que se define como el aprendizaje de conductas voluntarias a través del efectode las consecuencias de dicha conducta las cuales pueden ser agradables o desagradables.
El experimento de la caja de Thorndike
Dentro de la caja había un gato hambriento, fuera de la caja el plato de comida, y para salir de la caja había que presionar una palanca. ¿qué observó?
- ‐El gato se movía por la caja explorando y tratando de salir
- ‐Eventualmente por accidente presionaba la palanca, escapaba y comía
- ‐La palanca es estímulo, presionar la palanca es la respuesta y las consecuencias eran positivas… escapar (buena) y la comida (¡mucho mejor!)
- ‐Sin embargo, el gato no aprendió a presionar la palanca y escapar rápido
- ‐Luego de muchos intentos y muchas fallas al gato le tomaba menos tiempo lograr escapar
- ‐Esto no quiere decir que el gato descifró la conexión entre la palanca y ser libre (en cada intento se le movía la palanca de sitio y el gato en cada ocasión tenía que aprender el proceso nuevamente)
- ‐En cada nuevo intento el gato buscaba la palanca en el mismo lugar en el que la encontró la última vez.
Ley del Efecto de Thorndike
En base a estas observaciones Thorndike propuso la Ley del Efecto: Si una acción es seguida por una consecuencia agradable tiende a repetirse y por el contrario si la consecuencia es desagradable no se repetirá. Esta es la base principal del aprendizaje de la conducta voluntaria.
Condicionamiento Operante según Skinner
Skinner encontró que el trabajo de Thorndike servía para explicar que toda conducta es producto del aprendizaje, y lo llamó Condicionamiento Operante.
Cuando las personas emiten una conducta voluntaria es para recibir algo que quieren o evitar algo que no desean.
Diferencia entre Condicionamiento Clásico y Operante
A diferencia del Condicionamiento Clásico que se centraba en lo que precedía a una conducta (estímulo incondicionado que luego se convertiría en condicionado), en el Condicionamiento Operante se centra en lo que ocurre después de la respuesta, es decir, en la consecuencia.
Refuerzo
Según Skinner, el refuerzo que puede ser cualquier evento o estímulo que cuando sigue a una respuesta hace que aumente la posibilidad de que esa respuesta vuelva a repetirse. Esta es la clave para que se logre el aprendizaje.
Ej. Alimento cuando se tiene hambre, el sueldo cuando se necesita dinero.
Ejemplo: Imagina que una madre le pide a su hijo que lave el carro. A cambio le ofrece $20 o un bizcocho de chocolate. ¿Qué escogerá el hijo como recompensa? Depende de qué edad tenga… si es un joven de 16 años aceptará $20… pero es pequeño cabe la posibilidad que desee el bizcocho. Esto si el niño no tiene idea del valor real del dinero. Aunque ambos son dos reforzador es se diferencian en que el bizcocho es un refuerzo inmediato (satisfacer el hambre) y el dinero es un refuerzo aprendido (medio para adquirir otra recompensa).
Refuerzo Primario
Cualquier refuerzo que naturalmente satisface una necesidad biológica básica, como el hambre, sed, etc.
Refuerzo Secundario
Cualquier refuerzo se parea con un refuerzo primario para satisfacer una necesidad, como el dinero, tokens, etc.
Los refuerzos pueden usarse de forma diferente para aumentar la probabilidad de que la conducta se repita, estos son:
–Reforzador Positivo –estímulo agradable que se agrega o añade (dinero, alimento, agua, felicitaciones, reconocimiento).
Ej. El recibir un pago de dinero por trabajar-‐
–Reforzador Negativo – estímulo desagradable que se elimina (dolor que se alivia con hielo, picazón que se elimina con una pomada). Este tipo de reforzador le enseña al individuo que realizar una acción elimina una condición negativa que existe en el ambiente.
Ej. Pagar los taxes para evitar penalidades
El momento en que se aplica el refuerzo es importante para que el aprendizaje ocurra y para que se fortalezca la respuesta aprendida.
Ej. Los $20 por pagar el carro se debe dar en el momento (o lo más pronto posible vs Esperar 6 meses por una recompensa es posible que no tenga la fuerza suficiente para que se aprenda la conducta.
Recompensar cada vez que se da la conducta hace que el aprendizaje se de más rápido, pero no necesariamente fortalece el aprendizaje de forma que perdure en el tiempo, pues en el momento en que se elimine la recompensa la conducta se extinguirá.
Ej. Si se le da un postre al niño todos los días para que coma los vegetales… en el momento que no se le de postre dejará de comer sus vegetales.
Ej. (1) Recibir el cheque de trabajo mensual = Refuerzo Parcial (no te pagan todos los días que vas al trabajo) de Intervalo (mensual) Fijo (los 30 de cada mes).
(2) Darle el biberón de leche cada vez el bebé llora –Refuerzo continuo
(3) Darle una galleta al perro cada 10 veces que se sienta para que le ponga el collar –Refuerzo Parcial de Ración Fijo
(4) Darle un $1 por sacar A en exámenes algunas veces –Refuerzo Parcial de Ración Variable
Refuerzo Continuo
Recompensar cada vez que se presenta la respuesta/conducta correcta.
Efecto del Refuerzo Parcial
Recompensar una respuesta/conducta alguna, pero no todas las veces, será más resistente a extinguirse. Es el tipo de refuerzo más común en la vida cotidiana.
–Por intervalo de tiempo
–Por ración o cantidad de veces (ratio)
–Puede ser fijo (cada semana, cada 5 conductas correctas ) o variable (esta semana si y las próximas dos no)
Ejemplos de Refuerzos
Ej.
(1) Recibir el cheque de trabajo mensual = Refuerzo Parcial (no te pagan todos los días que vas al trabajo) de Intervalo (mensual) Fijo (los 30 de cada mes).
(2) Darle el biberón de leche cada vez el bebé llora –Refuerzo continuo
(3) Darle una galleta al perro cada 10 veces que se sienta para que le ponga el collar –Refuerzo Parcial de Ración Fijo
(4) Darle un $1 por sacar A en exámenes algunas veces –Refuerzo Parcial de Ración Variable
Castigo
Cualquier evento u objeto que disminuye la probabilidad que la conducta se repita nuevamente. Es lo opuesto al refuerzo.