Lernen 2 Flashcards
Was sind Grundprinzipien der operanten Konditionierung?
= Erwerb von zielgerichtetem, instrumentellem Verhalten
- Konsequenz einer Handlung bestimmt P, mit der diese in Zukunft eintritt (Kind darf spielen, wenn Zimmer aufgeräumt)
- Kontrollierbarkeit: Reaktionen des Organismus bestimmen, ob ein Reiz präsentiert wird
Was besagt das Effektgesetz von Thorndike?
- Verbindung zw. einer Reizsituation und einem Verhalten bzw. einer Reaktion wird
verstärkt, wenn dies zu einer Belohnung führt („reinforcement“) - geschwächt, wenn dies zu einer Bestrafung führt („punishment“)
Welche weiteren Effekte hat Thorndike formuliert?
- Gesetz der Wirkung
- Gesetz der Bereitschaft
- Gesetz der Übung
Welche Arten von positiven Verstärkern gibt es? Beschreibe.
- Primäre positive Verstärker: Reize, die ohne vorherige Lernvorgänge verstärkend wirken (zB Nahrung)
- Sekundäre positive Verstärker: ursprünglich neutrale Reize, die mit primären Reizen zusammen präsentiert wurden und dadurch ebenfalls verstärkend wirken (zB Geld)
- Generalisierte Verstärker: verstärkende Reize, die auf eine Vielzahl von Verhaltensweisen modifiziert werden können (z.B. Geld oder soziales Prestige)
Was versteht man unter dem “Premack-Prinzip”?
= häufig gezeigtes Verhalten kann weniger häufig gezeigtes Verhalten verstärken (zB. Musik hören als Belohnung nach dem Joggen)
Beschreiben Sie die Skinner-Box.
Versuch: Ratte im Käfig mit Signallampen, Fressnapf und Hebel
- Pos. Verstärkung: Ratte bekommt wenn Hebel betätigt Futter -> Verhalten häufiger
- Neg. Verstärkung: Käfigboden ständig unter Strom, geht weg wenn Hebel betätigt -> Verhalten häufiger
- Pos. Bestrafung: bekommt immer Stromschlag, wenn Hebel betätigt -> Verhalten seltener
- Neg. Bestrafung: immer Futter weggenommen, wenn Hebel betätigt -> Verhalten seltener (nicht durchgeführt von Skinner
Zählen Sie die Verstärkerpläne auf. Welche sind am effektivsten?
-
Fester Verhältnis-/ Quotenplan
-> nach einer festen Anzahl von Reaktionen erfolgt Verstärkung
+beständiges moderates Verhalten
-nach jeder Verstärkung kurze Pause
-schnelle Löschung -
Variabler Quotenplan
-> Anzahl Reaktion zwischen Verstärkung unterschiedl.
+höchste Reaktionsrate
+fast keine Pause nach Verstärkung
+größter Löschungswiderstand -
fester Intervallplan
-> Verstärkung erfolgt auf 1. Reaktion nach festem Zeitintervall
-vermehrte Reaktionen zum Ende der Pause
-nach Verstärkung keine Reaktion -
variabler Intervallplan
-> Verstärkung erfolgt in unregelmäßigen Zeitabständen
-mäßige aber stabile Verhaltensrate
+fast keine Pause nach Verstärkung
+größerer Löschungswiderstand
-> Quotenpläne höhere Verhaltensraten
-> variable Pläne höhere Löschungsresistenz
Erklären Sie die Dreifachkontingenz der operanten Konditionierung an einem Beispiel.
OK führt zum Erwerb von Dreifachkontingenzen
- gelernt wird Zshg. von Hinweisreiz (Licht an), einer darauffolgenden Reaktion (Hebeldruck) und einer Konsequenz (Futter) am Ende
Erkläre kausales Lernen im Zshg. mit OK und der Studie von Wassermann et al..
OK erweckt Eindruck, dass Lebewesen, den kausalen Zusammenhang zw. ihrem
Verhalten und Konsequenzen lernen
- Versuch: VP soll Taste drücken, manchmal geht das Licht an, manchmal nicht
- UV1 (Licht, Taste), UV2 (Licht, keine Taste)
- VP soll einschätzen, Ob Handeln Licht verursacht/verhindert
- Ergebnis: Einschätzungen hängen von beiden UVs ab
-> Lernen ist damit nicht nur der Aufbau von Assoziationen, sondern auch der
Erwerb von Wissen über instrumentelle Mittel-Zweck-Relationen
Erkläre Shaping am Beispiel von Skinner.
= Methode, um Versuchstieren neue Verhaltensweisen beizubringen, die sie normalerweise nicht ausführen
- stufenweise Annäherung des Verhaltens
- zuerst Belohnung des Verhaltens (hin zum Hebel)
- dann Anpassung (Berühren, später Hebeldrücken)
Belohnung vs. Bestrafung: Untersuchung durch das Paradigma der Serial Reaction Time Task (SRT) anhand der Studie von Wächter et al.
- Versuch: bei schneller Reaktionszeit +4 cent, bei langsamer -4 cent in 2 Gruppen
-> nur Belohnungsgruppe zeigt schnellere Reaktionszeiten
-> nur Belohnung verbessert implizites Lernen, nicht Bestrafung
Was zeigen MRT-Studien im Zshg. mit Wirkung von Belohnung im Gehirn?
- am Anfang starke Dopaminausschüttung durch Belohnung
- später der Stimulus, der Belohnung ankündigt, mit höchster Aktivität verbunden (Prinzip der Vorhersage)
- positive prediction error führt dazu, dass Verhalten häufiger gezeigt wird
Wann hilft Bestrafung?
- muss negativ, unmittelbar & begründet sein
- intensivere Bestrafung -> schnellere Abnahme der Verhaltensauffälligkeit
- langsame Steigerung der Intensität -> wenig effektiv
- ungewollte Konsequenzen:
-> Generalisierung (Übertragung auf gewünschtes Verhalten)
-> neg. Emotionen (Angst, Wut)
-> Korrelation zw. Bestrafung & Aggression
->Bestrafung führt zu Unterdrückung des unerwünschten Verhaltens, nicht zum Erlernen von Alternativen
Beschreibe Vermeidungslernen am Beispiel der Studie von Solomon, Kamin & Wynne.
= Lernen durch negative Verstärkung
- Verhalten bewirkt, dass neg. Reiz verschwindet
- Studie:
-> Lernphase: Licht geht an, Elektroschock linke Kammer -> Hund konnte in rechte Kammer fliehen
-> Testphase: Licht geht an -> Sprung in rechte Kammer (Vermeidungsverhalten) - sehr löschungsresistent: Vermeidung verhindert zu erfahren, dass neg. Konsequenz ausbleibt
Erkläre erlernte Hilflosigkeit am Beispiel der Studie von Overmier & Seligman.
= Lehre, dass eigenes Verhalten keinen Effekt hat
Studie:
- VPs bekommen Reiz mit neg. Konsequenz, welches nicht vermieden werden kann
- Kontrollgruppe: neg. Konsequenz durch Verhalten vermeidbar
- Phase 2: Vermeidungstraining
- Ergebnis: Kontrollgruppe lernt Vermeidungsverhalten, Experimentalgruppe zeigt neg. Emotion, aber keine Vermeidung
-> erlernte Hilflosigkeit (Bestrafung nicht durch eigenes Verhalten beeinflussbar)