Lernen 2 Flashcards

1
Q

Was sind Grundprinzipien der operanten Konditionierung?

A

= Erwerb von zielgerichtetem, instrumentellem Verhalten

  • Konsequenz einer Handlung bestimmt P, mit der diese in Zukunft eintritt (Kind darf spielen, wenn Zimmer aufgeräumt)
  • Kontrollierbarkeit: Reaktionen des Organismus bestimmen, ob ein Reiz präsentiert wird
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was besagt das Effektgesetz von Thorndike?

A
  • Verbindung zw. einer Reizsituation und einem Verhalten bzw. einer Reaktion wird
    verstärkt, wenn dies zu einer Belohnung führt („reinforcement“)
  • geschwächt, wenn dies zu einer Bestrafung führt („punishment“)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Welche weiteren Effekte hat Thorndike formuliert?

A
  • Gesetz der Wirkung
  • Gesetz der Bereitschaft
  • Gesetz der Übung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Welche Arten von positiven Verstärkern gibt es? Beschreibe.

A
  • Primäre positive Verstärker: Reize, die ohne vorherige Lernvorgänge verstärkend wirken (zB Nahrung)
  • Sekundäre positive Verstärker: ursprünglich neutrale Reize, die mit primären Reizen zusammen präsentiert wurden und dadurch ebenfalls verstärkend wirken (zB Geld)
  • Generalisierte Verstärker: verstärkende Reize, die auf eine Vielzahl von Verhaltensweisen modifiziert werden können (z.B. Geld oder soziales Prestige)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was versteht man unter dem “Premack-Prinzip”?

A

= häufig gezeigtes Verhalten kann weniger häufig gezeigtes Verhalten verstärken (zB. Musik hören als Belohnung nach dem Joggen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Beschreiben Sie die Skinner-Box.

A

Versuch: Ratte im Käfig mit Signallampen, Fressnapf und Hebel

  1. Pos. Verstärkung: Ratte bekommt wenn Hebel betätigt Futter -> Verhalten häufiger
  2. Neg. Verstärkung: Käfigboden ständig unter Strom, geht weg wenn Hebel betätigt -> Verhalten häufiger
  3. Pos. Bestrafung: bekommt immer Stromschlag, wenn Hebel betätigt -> Verhalten seltener
  4. Neg. Bestrafung: immer Futter weggenommen, wenn Hebel betätigt -> Verhalten seltener (nicht durchgeführt von Skinner
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Zählen Sie die Verstärkerpläne auf. Welche sind am effektivsten?

A
  1. Fester Verhältnis-/ Quotenplan
    -> nach einer festen Anzahl von Reaktionen erfolgt Verstärkung
    +beständiges moderates Verhalten
    -nach jeder Verstärkung kurze Pause
    -schnelle Löschung
  2. Variabler Quotenplan
    -> Anzahl Reaktion zwischen Verstärkung unterschiedl.
    +höchste Reaktionsrate
    +fast keine Pause nach Verstärkung
    +größter Löschungswiderstand
  3. fester Intervallplan
    -> Verstärkung erfolgt auf 1. Reaktion nach festem Zeitintervall
    -vermehrte Reaktionen zum Ende der Pause
    -nach Verstärkung keine Reaktion
  4. variabler Intervallplan
    -> Verstärkung erfolgt in unregelmäßigen Zeitabständen
    -mäßige aber stabile Verhaltensrate
    +fast keine Pause nach Verstärkung
    +größerer Löschungswiderstand

-> Quotenpläne höhere Verhaltensraten
-> variable Pläne höhere Löschungsresistenz

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Erklären Sie die Dreifachkontingenz der operanten Konditionierung an einem Beispiel.

A

OK führt zum Erwerb von Dreifachkontingenzen

  • gelernt wird Zshg. von Hinweisreiz (Licht an), einer darauffolgenden Reaktion (Hebeldruck) und einer Konsequenz (Futter) am Ende
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Erkläre kausales Lernen im Zshg. mit OK und der Studie von Wassermann et al..

A

OK erweckt Eindruck, dass Lebewesen, den kausalen Zusammenhang zw. ihrem
Verhalten und Konsequenzen lernen

  • Versuch: VP soll Taste drücken, manchmal geht das Licht an, manchmal nicht
  • UV1 (Licht, Taste), UV2 (Licht, keine Taste)
  • VP soll einschätzen, Ob Handeln Licht verursacht/verhindert
  • Ergebnis: Einschätzungen hängen von beiden UVs ab

-> Lernen ist damit nicht nur der Aufbau von Assoziationen, sondern auch der
Erwerb von Wissen über instrumentelle Mittel-Zweck-Relationen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Erkläre Shaping am Beispiel von Skinner.

A

= Methode, um Versuchstieren neue Verhaltensweisen beizubringen, die sie normalerweise nicht ausführen

  • stufenweise Annäherung des Verhaltens
  • zuerst Belohnung des Verhaltens (hin zum Hebel)
  • dann Anpassung (Berühren, später Hebeldrücken)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Belohnung vs. Bestrafung: Untersuchung durch das Paradigma der Serial Reaction Time Task (SRT) anhand der Studie von Wächter et al.

A
  • Versuch: bei schneller Reaktionszeit +4 cent, bei langsamer -4 cent in 2 Gruppen
    -> nur Belohnungsgruppe zeigt schnellere Reaktionszeiten
    -> nur Belohnung verbessert implizites Lernen, nicht Bestrafung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was zeigen MRT-Studien im Zshg. mit Wirkung von Belohnung im Gehirn?

A
  • am Anfang starke Dopaminausschüttung durch Belohnung
  • später der Stimulus, der Belohnung ankündigt, mit höchster Aktivität verbunden (Prinzip der Vorhersage)
  • positive prediction error führt dazu, dass Verhalten häufiger gezeigt wird
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wann hilft Bestrafung?

A
  • muss negativ, unmittelbar & begründet sein
  • intensivere Bestrafung -> schnellere Abnahme der Verhaltensauffälligkeit
  • langsame Steigerung der Intensität -> wenig effektiv
  • ungewollte Konsequenzen:
    -> Generalisierung (Übertragung auf gewünschtes Verhalten)
    -> neg. Emotionen (Angst, Wut)
    -> Korrelation zw. Bestrafung & Aggression

->Bestrafung führt zu Unterdrückung des unerwünschten Verhaltens, nicht zum Erlernen von Alternativen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Beschreibe Vermeidungslernen am Beispiel der Studie von Solomon, Kamin & Wynne.

A

= Lernen durch negative Verstärkung

  • Verhalten bewirkt, dass neg. Reiz verschwindet
  • Studie:
    -> Lernphase: Licht geht an, Elektroschock linke Kammer -> Hund konnte in rechte Kammer fliehen
    -> Testphase: Licht geht an -> Sprung in rechte Kammer (Vermeidungsverhalten)
  • sehr löschungsresistent: Vermeidung verhindert zu erfahren, dass neg. Konsequenz ausbleibt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Erkläre erlernte Hilflosigkeit am Beispiel der Studie von Overmier & Seligman.

A

= Lehre, dass eigenes Verhalten keinen Effekt hat

Studie:
- VPs bekommen Reiz mit neg. Konsequenz, welches nicht vermieden werden kann
- Kontrollgruppe: neg. Konsequenz durch Verhalten vermeidbar
- Phase 2: Vermeidungstraining
- Ergebnis: Kontrollgruppe lernt Vermeidungsverhalten, Experimentalgruppe zeigt neg. Emotion, aber keine Vermeidung

-> erlernte Hilflosigkeit (Bestrafung nicht durch eigenes Verhalten beeinflussbar)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was sind biologische Einschränkungen des OK?

A
  • Instinktiver Drift: adaptive Verhaltensweisen dringen in das neu konditionierte wieder ein
  • versch. Verhaltensweisen untersch. gut geeignet, um als Vermeidungsverhalten gelernt zu werden
  • nicht alle reize eignen sich gleich gut als diskriminative Hinweisreize
  • OK kann durch kogn. Prozesse beeinflusst werden
17
Q

Vergleich KK & OK

A

KK:

  • Assoziationen zw. Stimuli (SS)
  • Reaktion unwillkürlich, automatisch
  • gelernt wird NS -> CS
  • Löschung: CR nimmt ab, wenn CS wdh. alleine dargeboten
  • Spontanerholung
  • Generalisierung: Tendenz, CR auch bei Stimuli zu zeigen, die CS ähnlich sind

OK:

  • Assoziationen zw. Stimuli, Verhalten & Konsequenz (Dreifachkontingenz)
  • Reaktion willentlich
  • gelernt, welche Reaktion in Situation welche Konsequenz hat
  • Löschung: Reaktion nimmt ab, wenn pos. Verstärkung aufhört
  • Spontanerholung
  • Generalisierung: Reaktion wird auch in ähnlichen Situationen gezeigt