Condicionamiento instrumental: refuerzo positivo Flashcards
Quién inició el estudio empírico del CI
Thorndike, y luego lo analizó en profundidad Skinner.
Qué experimentó llevo a cabo Thorndike
Encerró a gatos hambrientos, que al principio tenían comportamientos erráticos. Finalmente, presionaban una palanca por azar que les daba comida, siendo un refuerzo al que al final acaban por asociar con comida.
Que ley formuló Throndike gracias al experimento con gatos
La ley del efecto.
En qué consiste la ley del efecto
Si el efecto (Er) es satisfactorio, aumenta la conexión EC-R y aumentará la probabilidad de R.
Econtexctual -> R -> Ereforzador
Qué es la ley del ejercicio
cuantas más veces se repita la acción de presionar la palnca y recibir la comida, más intensa será la satisfacción y más se fortalecerá la asociación
Qué eran los ensayos directos de Throndike
se estudiaba el aprendizaje mediante CI como los corredores y laberintos, así investigaba errores, latencia de respuestas, velocidad y orientación espacial.
Qué problema tenían los ensayos directos de Throndike
Que le limitaba mucho, pues no podían hacerlo muchas veces.
Qué creó Skinner
La caja de Skinner
En qué consiste la caja de skinner
los animales podían ejectur en ella tantas veces como quisieran una conducta operante que les proporcionara un refuerzo. Además incluye un registro acumulativo.
Qué contenía la caja de skinner
una palanca (u otra respuesta), dispensador de Er (comida, descargas) y un registro acumulativo.
Qué se podía observar en la caja de skinner
- extinción: una reducción gradual de su fuerza, pero nunca llegando a su total desaparición.
-Recuperación espontánea
Por eso, para borrar el APZ original se recomienda sobreimponer otro aprendizaje incompatible con el anterior.
Tipos de condicionamientos Instrumentales
- recomepnsa
- castigo positivo
- evitación/escape
- omisión
En qué consisten los condicionamientos instrumentales
Se maneja una relación de contengencia entre una acción y un suceso ulterior, que puede resultar agradable (estímulo apetitivo) o desagradable (estímulo aversivo)
Además la acción instrumental puede general el evento ambiental (contingencia positiva) o evitarlo suprimirlo (contingencia negativa)
Recompensa, explicación y varios ejemplos
Se recompensa una conducta. Contingencia positiva y estímulo apetitivo.
Es el más usado para promover conductas.
Dar golosinas (estímulo apetitivo y positivo, porque doy) a un niño porque se comporta bien (una buena respuesta que quiero recompensar).
No dar golosinas porque no ha hecho los deberes. NO + NO = Hacer los deberes y dar golosinas.
no estudias, no apruebas –> estudias, apruebas (recompensa)
Por tanto, deben ser ambos sí.
Castigo positivo
se maneja una contingencia positiva y un estímulo aversivo.
Promueve eliminar conductas indeseables.
Si escupes, te pego.
Si molestas en clase, te mando más tarea.
Si no molestas, no te mando tarea.
Escape/evitación
maneja una contingencia negativa y un estímulo aversivo (porque se quita algo que no gusta).
Si presionas la palanca, dejas de sufrir descargas (escape)
Si no estudia, bofetada -> respuesta sí -> Si estudia, no hay bofetada.
Si presionas la palanca, no recibes descarga (evitación)
Escapar de la cárcel
Evitar la cárcel
Si lo haces bien, no tendrás que trabajar.
Omisión
contingencia negativa, estímulo apetitivo (porque se quita algo que gusta)
Disminuye la tendencia a realizar la conducta instrumental.
Si pegas a tu amigo, te quito el peluche.
Si molestas en clase, te vas de esta.
Si no te saltas el semáfoto, no te quitan dinero -> si te saltas el semáfoto, te quitan dinero.
Qué hay que saber de los tipos de CI
Que positivo y negativo no hacen referencia a la naturaleza agradable o desagradable de las consecuencias de la acción, sino al signo de la contingencia entre la conducta instrumental y un determinado evento ambiental.
Qué tres componentes intervienen en el CI
Respuesta (r); refuerzo (Er); y el conector (Ec) en el que se da la relación entre los dos primeros elementos.
En qué se enfoca la CI en la conducta
se trata de conductas dirigidas a METAS, controladas por el SNC y el somático, las cuales se consideran deliberadas (no reacciones reflejas)
Tipos de respuestas de los elementos del CI
Respuestas ya existentes
Respuestas nuevas promovidas por el MOLDEAMIENTO: se refuerzan progresivamente aprocimaciones a las conductas perseguidas, hasta conseguirlas (sniffy dando vueltas)
Qué es el concepto de pertinencia
explica por qué unas conductas se condicionan con más que otras
La pertinencia varía en función del tipo de refuerzos, espeie, estado de motivación, etc.
Qué pasa con el principio de equipotencialidad con el CI
No funciona el principio de equipotencialidad.
Qué dice Hull de la homeostasis
se basa en ella y postula la teoría de la reducción del impilso. Según él, resultan reforzantes los estímulos que reducen algún estado impulsivo, es decir, que ayudan a recuperar la homeostasis.
Qué tipos de estímulos existen
- refuerzos primarios
- refuerzos secundarios
- refuerzos sociales
- estimulación sensorial
- estimulación eléctrica directa.
refuerzos primarios
estímulos que reducen impulsos que tienen un valor incentivo INNATO (comida, agua,) esto disminuy ese sentimiento de hambre, gracias a la comida.
refuerzos secundarios
valor incentivo mediante la asociación con refuerzo primario (dinero aporta comida)
refuerzos sociales
recibidos por otros miembros de la especie (atención, cariño, sonrisa…)
estimulación sensorial
música estimula determinadas estructuras cerebrales relacionadas con placer.
estimulación eléctrica directa
“centros cerebrales de gratificación”
Qué dos actividades encontramos dentro del CI
- Principio de la probabilidad diferencial.
- Principio de la privación de la respuesta.
Qué es el principio de la probabilidad diferencial
la oportunidad condicional de realizar la conducta más probable puede ser utilizada como refuerzo de la menos probable.
Podrás jugar a la play si estudias.
Si a un niño le gusta el deporte, pero lee poco, se le dejará hacer ejercicio siempre y cuando lea un capítulo.
Qué es el principio de privación de la respuesta
restringir el tiempo de una que gusta para dar paso a otra.
Para que una actividad resulte potenciada por dar acceso a otra, basta con que sufran restricciones en esta última, y solo pueden recuperar su realización habtiual si llevan a cabo la primera
De qué parámetros depende la eficacia de los refuerzos
La experiencia
La cantidad
La calidad
Habla de la experiencia y su importancia en los refuerzos
La experiencia favorece mediante aprendizaje asociativo las conductas que generan refuerzos mayores y de más calidad, tambiémn influten los incentivos.
Habla de la cantidad y su importancia en los refuerzos
la influencia de una determinada cantidad de refuerzo depende de la historia de reforzamiento previo (.
Qué es la historia de reforzamiento
Es a lo que estoy acostumbrado. No voy a aceptar ir a por algo del profe por cinco euros, porque estoy acostumbrada a que me den veinte euros.
Qué es el fenómeno del contraste negativo
Cuando hay una recompensa menor, el esfuerzo es menor.
Qué es el fenómeno del contraste positivo
Cuando hay una recompensa mayor, el esfuerzo es mayor.