Lernen 2 Flashcards

Question 1

Q

Was sind Grundprinzipien der operanten Konditionierung?

Answer

A

= Erwerb von zielgerichtetem, instrumentellem Verhalten

Konsequenz einer Handlung bestimmt P, mit der diese in Zukunft eintritt (Kind darf spielen, wenn Zimmer aufgeräumt)
Kontrollierbarkeit: Reaktionen des Organismus bestimmen, ob ein Reiz erscheint

Question 2

Q

Was besagt das Gesetz der Wirkung von Thorndike?

Answer

A

Verbindung zw. einer Reizsituation und einem Verhalten bzw. einer Reaktion wird
verstärkt, wenn dies zu einer Belohnung führt („reinforcement“)
geschwächt, wenn dies zu einer Bestrafung führt („punishment“)

Question 3

Q

Welche weiteren Effekte hat Thorndike formuliert?

Answer

A

Gesetz der Bereitschaft
Gesetz der Übung

Question 4

Q

Welche Arten von positiven Verstärkern gibt es? Beschreibe.

Answer

A

Primäre positive Verstärker: Reize, die ohne vorherige Lernvorgänge verstärkend wirken (zB Nahrung)
Sekundäre positive Verstärker: ursprünglich neutrale Reize, die mit primären Reizen zusammen präsentiert wurden und dadurch ebenfalls verstärkend wirken (z.B. Geld)
Generalisierte Verstärker: verstärkende Reize, die auf eine Vielzahl von Verhaltensweisen modifiziert werden können (z.B. Geld oder soziales Prestige)

Question 5

Q

Was versteht man unter dem “Premack-Prinzip”?

Answer

A

= häufig gezeigtes Verhalten kann weniger häufig gezeigtes Verhalten verstärken (zB. immer Musik hören als Belohnung nach dem Joggen)

Question 6

Q

Beschreiben Sie die Skinner-Box.

Answer

A

Versuch: Ratte im Käfig mit Signallampen, Fressnapf und Hebel

Pos. Verstärkung: Ratte bekommt wenn Hebel betätigt Futter -> Verhalten häufiger
Neg. Verstärkung: Käfigboden ständig unter Strom, geht weg wenn Hebel betätigt -> Verhalten häufiger
Pos. Bestrafung: bekommt immer Stromschlag, wenn Hebel betätigt -> Verhalten seltener
Neg. Bestrafung: immer Futter weggenommen, wenn Hebel betätigt -> Verhalten seltener (nicht durchgeführt von Skinner)

Question 7

Q

Zählen Sie die Verstärkerpläne auf. Welche sind am effektivsten?

Answer

A

Fester Verhältnis-/ Quotenplan
-> nach einer festen Anzahl von Reaktionen erfolgt Verstärkung
+beständiges moderates Verhalten
-nach jeder Verstärkung kurze Pause
-schnelle Löschung
Variabler Quotenplan
-> Anzahl Reaktion zwischen Verstärkung unterschiedl.
+höchste Reaktionsrate
+fast keine Pause nach Verstärkung
+größter Löschungswiderstand
fester Intervallplan
-> Verstärkung erfolgt auf 1. Reaktion nach festem Zeitintervall
-vermehrte Reaktionen zum Ende der Pause
-nach Verstärkung keine Reaktion
variabler Intervallplan
-> Verstärkung erfolgt in unregelmäßigen Zeitabständen
-mäßige aber stabile Verhaltensrate
+fast keine Pause nach Verstärkung
+größerer Löschungswiderstand

-> Quotenpläne höhere Verhaltensraten
-> variable Pläne höhere Löschungsresistenz

Question 8

Q

Erklären Sie die Dreifachkontingenz der operanten Konditionierung an einem Beispiel.

Answer

A

OK führt zum Erwerb von Dreifachkontingenzen

gelernt wird Zshg. von Hinweisreiz (Licht an), einer darauffolgenden Reaktion (Hebeldruck) und einer Konsequenz (Futter) am Ende

Question 9

Q

Erkläre kausales Lernen im Zshg. mit OK und der Studie von Wassermann et al..

Answer

A

OK erweckt Eindruck, dass Lebewesen, den kausalen Zusammenhang zw. ihrem
Verhalten und Konsequenzen lernen

Versuch: VP soll Taste drücken, manchmal geht das Licht an, manchmal nicht
UV1 (Licht, Taste), UV2 (Licht, keine Taste)
VP soll einschätzen, Ob Handeln Licht verursacht/verhindert
Ergebnis: Einschätzungen hängen von beiden UVs ab

-> Lernen ist damit nicht nur der Aufbau von Assoziationen, sondern auch der
Erwerb von Wissen über instrumentelle Mittel-Zweck-Relationen

Question 10

Q

Belohnung vs. Bestrafung: Untersuchung durch das Paradigma der Serial Reaction Time Task (SRT) anhand der Studie von Wächter et al.

Answer

A

Versuch: bei schneller Reaktionszeit +4 cent, bei langsamer -4 cent in 2 Gruppen
-> nur Belohnungsgruppe zeigt schnellere Reaktionszeiten
-> nur Belohnung verbessert implizites Lernen, nicht Bestrafung

Question 11

Q

Was zeigen MRT-Studien im Zshg. mit Wirkung von Belohnung im Gehirn?

Answer

A

Dopaminerger Vorhersagefehler
- am Anfang starke Dopaminausschüttung durch Belohnung
- später der Stimulus, der Belohnung ankündigt, mit höchster Aktivität verbunden (Prinzip der Vorhersage)
- positive prediction error führt dazu, dass Verhalten häufiger gezeigt wird

-> Theory of predicted processing

Question 12

Q

Wann hilft Bestrafung?

Answer

A

muss negativ, unmittelbar & begründet sein
intensivere Bestrafung -> schnellere Abnahme der Verhaltensauffälligkeit
langsame Steigerung der Intensität -> wenig effektiv
ungewollte Konsequenzen:
-> Generalisierung (Übertragung auf gewünschtes Verhalten)
-> neg. Emotionen (Angst, Wut)
-> Korrelation zw. Bestrafung & Aggression

->Bestrafung führt zu Unterdrückung des unerwünschten Verhaltens, nicht zum Erlernen von Alternativen

Question 13

Q

Beschreibe Vermeidungslernen am Beispiel der Studie von Solomon, Kamin & Wynne.

Answer

A

= Lernen durch negative Verstärkung

Verhalten bewirkt, dass neg. Reiz verschwindet
Studie:
-> Lernphase: Licht geht an, Elektroschock linke Kammer -> Hund konnte in rechte Kammer fliehen
-> Testphase: Licht geht an -> Sprung in rechte Kammer (Vermeidungsverhalten)
sehr löschungsresistent: Vermeidung verhindert zu erfahren, dass neg. Konsequenz ausbleibt

Question 14

Q

Erkläre erlernte Hilflosigkeit am Beispiel der Studie von Overmier & Seligman.

Answer

A

= Lehre, dass eigenes Verhalten keinen Effekt hat

Studie:
- VPs bekommen Reiz mit neg. Konsequenz, welches nicht vermieden werden kann
- Kontrollgruppe: neg. Konsequenz durch Verhalten vermeidbar
- Phase 2: Vermeidungstraining
- Ergebnis: Kontrollgruppe lernt Vermeidungsverhalten, Experimentalgruppe zeigt neg. Emotion, aber keine Vermeidung

-> erlernte Hilflosigkeit (Bestrafung nicht durch eigenes Verhalten beeinflussbar)

Question 15

Q

Was sind biologische Einschränkungen des OK?

Answer

A

Instinktiver Drift: adaptive Verhaltensweisen dringen in das neu konditionierte wieder ein
versch. Verhaltensweisen untersch. gut geeignet, um als Vermeidungsverhalten gelernt zu werden
nicht alle Reize eignen sich gleich gut als diskriminative Hinweisreize
neues Verhalten kann auch ohne direkte Verstärkung erworben werden
OK kann durch kogn. Prozesse beeinflusst werden

Question 16

Q

Vergleich KK & OK

Answer

Study These Flashcards

A

KK:

Assoziationen zw. Stimuli (SS)
Reaktion unwillkürlich, automatisch
gelernt wird NS -> CS
Löschung: CR nimmt ab, wenn CS wdh. alleine dargeboten
Spontanerholung
Generalisierung: Tendenz, CR auch bei Stimuli zu zeigen, die CS ähnlich sind

OK:

Assoziationen zw. Stimuli, Verhalten & Konsequenz (Dreifachkontingenz)
Reaktion willentlich
gelernt, welche Reaktion in Situation welche Konsequenz hat
Löschung: Reaktion nimmt ab, wenn pos. Verstärkung aufhört
Spontanerholung
Generalisierung: Reaktion wird auch in ähnlichen Situationen gezeigt

Question 17

Q

Generalisierung und Diskrimination bei OK

Answer

Study These Flashcards

A

Tendenz zur Generalisierung auf ähnliche Situationen (ähnliche Hinweisreize) und Fähigkeit zur Diskrimination zw. Hinweisreizen) auch bei OK
Diskrimination nur nach zusätzlichen Lerndurchgängen möglich
-> Es wird gelernt, unter welchen Bedingungen ein Verhalten erfolgreich ist

Question 18

Q

Was bedeutet “Shaping” im Zshg. mit dem Erlernen von komplexen Verhaltensweisen (OK)?

Answer

Study These Flashcards

A

= Veränderung des Verhaltens durch stufenweise Annäherung

zuerst wird Verhalten belohnt, das grob in Richtung des gewünschten Verhaltens weist
danach sukzessive Anpassung des Verstärkungskriteriums: Verhalten muss dem Gewünschten immer ähnlicher werden, um verstärkt zu werden

Question 19

Q

Was bedeutet “Chaining” im Zshg. mit dem Erlernen von komplexen Verhaltensweisen (OK)?

Answer

Study These Flashcards

A

Grundidee: komplexe Verhalten = Kette aus Teilschritten

Backward Chaining:

letzter Schritt primär verstärkt
vorherige Schritte werden sekundär verstärkt
jeder Schritt: sekundärer Verstärker (vorheriger) + diskriminativer Hinweisreiz (nächster)

Forward Chaining:

erster Schritt primär verstärkt
Schritte nacheinander hinzugefügt
jeder Schritt diskriminativer Hinweisreiz für nächsten

Kritik: Shaping & Chaining erklären nicht alle komplexen Verhalten (andere Lernformen nötig)

Lernen 2 Flashcards

(19 cards)