Sitzung 3 Lernen 2 Flashcards
Evaluative Konditionierung
Bei evaluativen Konditionieren wird durch die gemeinsame Präsentation ein wertendes Urteil gegenüber Objekten, Personen und Situationen auf vorher neutrale Stimuli übertragen
Evaluative Konditionierung bezieht sich auf die
Übertragung der affektiven Reaktion auf einen US auf einen zuvor neutralen Stimulus (CS) durch eine gemeinsame Präsentation der beiden Stimuli
Untersuchte Stimuli im Kontext von evaluativen Konditionieren
- Visuelle Reize
- Geschmacksreize
- Crossmodale Effekte: Musik auf visuell oder ver. Befunde zu Gerüchen als US
EK Wurde bei diesen Stimuli schon gezeigt
Kritik an Studien zu evaluativer Konditionierung
Aufforderungscharakter der Untersuchungssituation (Sorge um Erwartungseffekte) -> Lösungsansatz: Affektive Priming
Affektives Priming
-> implizite Einstellungsmessung
Vp wird ein Prime gezeigt (z.B.: Werder Bremen Logo), bevor sie einen Zielreiz bezeigt bekommen (z.B.: das Wort “Gewinn”), dem sie eine Valenz zuordnen müssen (positiv o. negativ)
Annahme: Die Antwort ist schneller, wenn Valenz von Prime & Zielreiz übereinstimmen
Anwendungsbereiche Evaluativer Konditionierung
Werbung: z.B.: Kopplung von beliebten Personen mit Produkten
Vergleich evaluative und klassische Konditionierung
- Löschresistenz: sehr hoch bei evaluativer Konditionierung, da geringere Kosten als bei einer körperlichen Reaktion wie bei der KK
- Kontingenz: Vorhersagekraft bei KK wichtig, bei EK teilweise egal
- Lernmechanismen: KK und EK beruhen wahrscheinlich beide auf expliziten Lernmechanismen, ist jedoch noch nicht abschließend geklärt, beim KK ist die Aufmerksamkeit wichtig, beim EK ist nicht sicher, ob einem die Paarung zw. CS & US bewusst werden muss
Instrumentelles Lernen (Operantes Konditionieren)
Vertreter: Thorndike & Skinner
Veränderung von Latenz(=Auftreten), Geschwindigkeit, Wahrscheinlichkeit oder Häufigkeit von bestimmten Verhalten, nachdem eine Verstärkung kontingent zu diesem Verhalten gemacht wird
durch Bestrafung und Verstärkung werden die Auftretenshäufigkeiten von Verhaltensweisen reduziert oder erhöht
Wann liegt Kontingenz vor?
Wenn die Wahrscheinlichkeit für eine Verstärkung nach Verhalten höher ist als ohne Verhalten
= Verhalten das belohnt wird, ist wahrscheinlicher
Law of Effect (Thorndike)
postuliert, dass erfolgreiches (d.h. verstärktes) Verhalten dazu tendiert, häufiger aufzutreten
Belohnende Ereignisse (=Verstärker): verstärken Situations-Reaktion Verknüpfung = mehr verhalten
Aversive Ereignisse (=Bestrafung) verringern Situations-Reaktions Verknüpfung = weniger Verhalten
Erklärung von Aberglaube (Skinner)
gab Tauben Futter unabhängig davon, welches Verhalten sie zeigten
Ergebnis: 6 von 8 Tauben entwickelten Ticks
Skinner-Box
Versuchskäfig mit Hebel und Futtermagazin, z.T. mit Licht und elektrifizierbarem Rost als Boden
Positive Verstärkung
hinzufügen eines angenehmen Reizes
Bestrafung
Typ 1: Hinzufügen eines unangenehmen Reizes
Typ 2: Entfernen eines angenehmen Reizes
Negative Verstärkung
Entfernen eines unangenehmen Reizes
Phasen einer operanten Konditionierung
- Bestimmung der Basisrate
- Trainingsphase
- Löschung
- Spontanerholung
Phasen der Operanten Konditionierung: 1. Bestimmung der Basisrate
wie oft tritt das zu konditionierende Verhalten ohne Verstärkung auf
Phasen der Operanten Konditionierung: 2. Trainingsphase
Verstärkung des Verhaltens
Häufigkeit des zu konditionierenden Verhaltens nimmt zu
Phasen der Operanten Konditionierung: 3. Löschung
Verhalten wird nicht weiter verstärkt
Abschwächung des Verhaltens bis kein Effekt der Verstärkung mehr gezeigt wird
Phasen der Operanten Konditionierung: 4. Spontanerholung
Abgeschwächte Reaktion nach einiger Zeit ohne Verstärkung
Primäre Verstärker
wirken verstärkend ohne dass man ihre Bedeutung erlernen muss, dass wir diese Dinge als Bestrafend oder Belohnenden wahrnehmen ist angeboren (z.B.: Schmerz, Essen, Lob, beliebte Aktivitäten)
Sekundäre Verstärker
wirken erst verstärkend, nachdem man die Bedeutung der Dinge erlernt hat (z.B.: Geld, ETCS,…)
Welche Faktoren haben Einfluss auf die Effektivität von instrumentellem Lernen?
- Zeitliche Nähe: sofortiges Feedback
- Transparenz: klare Beziehung zwischen Handlung und Verstärkung
- Intensität: besseres Lernen mit besserer Belohnung
Verstärkerpläne Definition
Regeln, die festlegen, nach welchen Kriterien eine Verstärkung stattfindet
Kriterien von Verstärkerplänen
- Qualität: Welche Art von Verhalten wird verstärkt
- Quantität: Wie häufig muss eine Verhalten ausgeübt werden, damit es belohnt wird? (Quotenpläne)
- Zeit: Wie viel Zeit vergeht bis zur Verstärkung (Intervallpläne)
Arten von Verstärkerplänen
- Kontinuierliche Verstärkung: jedes korrekte Verhalten wird verstärkt (Effekt: schnelles Lernen, schnelles Verlernen)
- intermittierende Verstärkung: nicht jedes korrekte Verhalten wird verstärkt (Effekt: langsames Lernen, langsames Verlernen)
Wichtige Verstärkerpläne
- Fixed Ratio (FR)
- Variable Ratio (VR)
- Fixed Interval (FI)
- Variable Interval (VI)
- Löschung
- Fixed Ratio
Es gibt eine fixe Quote zur Verstärkung z.B.: jede dritte Reaktion wird verstärkt
-> Stufenweiser Anstieg der Lernkurve
- Variable Ratio
Es gibt eine durchschnittliche Quote nach der verstärkt wird, z.B.: durchschnittlich nach jedem dritten mal
-> relative linearer und steiler Anstieg der Lernkurve
- Fixed Interval
Es gibt ein festes Intervall nachdem wieder eine Verstärkung stattfindet z.B.: nach 5 Minuten nachdem die erste Reaktion gezeigt wird und verstärkt wurde wird wieder verstärkt, egal wie viel Reaktionen dazwischen lagen
-> umgekehrter Stufenweiser
Anstieg der Lernkurve
- Variable Interval
Das Intervall ist hier variable es wird also im durchschnitt z.B.: alle 5 Minuten verstärkt
-> relative linearer aber flacher Anstieg der Lernkurve
- Löschung
fließender Übergang von FR-1000 (Fixed Ratio 1000) zur Löschung
Optimale Verstärkerpläne für Verhaltensaufbau
-> Ziel: schnellst möglich ein stabiles Verhalten erreichen
Verhaltensaufbau: kontinuierliche Verstärkung
Stabilisierung des Verhaltens: abnehmende intermittierende Verstärkung
resondentes Verhalten
wird beim klassischen Konditionieren beobachtet weil das Verhalten hier eine Reaktion auf einen Reiz ist
operantes Verhalten
Findet beim operanten Konditionieren statt. keine Reaktion auf einen Reiz, sondern ein (instrumentelles) Verhalten, das eine Konsequenz in der Umwelt herbeiführt, die ohne dieses Verhalten nicht eintreten würde
Verstärkung: Definition
ein Reiz, der die Auftretenswahrscheinlichkeit einer Reaktion verändert
Welche Paradigmen werden beim klassischen & operanten Konditionieren eingesetzt?
Paradigmen zur Untersuchung des assoziativen Lernens, mit denen traditionell erforscht wird, wie neue Verhaltensweisen erworben werden
Merkmale instrumenteller Reaktionen
es wird nicht eine spezifische Reaktion lernen, sondern eine instrumentelle Relation
Beispiel: Ratten, die erst lernen einen Weg zu schwimmen, den Weg aber genauso gut im Trockenen finden
Löschung evaluativer Konditionierung
Geht nur im Gegenkonditionierung mit einer Gegentieligen valenz