Lernen 2 Flashcards

(19 cards)

1
Q

Was sind Grundprinzipien der operanten Konditionierung?

A

= Erwerb von zielgerichtetem, instrumentellem Verhalten

  • Konsequenz einer Handlung bestimmt P, mit der diese in Zukunft eintritt (Kind darf spielen, wenn Zimmer aufgeräumt)
  • Kontrollierbarkeit: Reaktionen des Organismus bestimmen, ob ein Reiz erscheint
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was besagt das Gesetz der Wirkung von Thorndike?

A
  • Verbindung zw. einer Reizsituation und einem Verhalten bzw. einer Reaktion wird
    verstärkt, wenn dies zu einer Belohnung führt („reinforcement“)
  • geschwächt, wenn dies zu einer Bestrafung führt („punishment“)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Welche weiteren Effekte hat Thorndike formuliert?

A
  • Gesetz der Bereitschaft
  • Gesetz der Übung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Welche Arten von positiven Verstärkern gibt es? Beschreibe.

A
  • Primäre positive Verstärker: Reize, die ohne vorherige Lernvorgänge verstärkend wirken (zB Nahrung)
  • Sekundäre positive Verstärker: ursprünglich neutrale Reize, die mit primären Reizen zusammen präsentiert wurden und dadurch ebenfalls verstärkend wirken (z.B. Geld)
  • Generalisierte Verstärker: verstärkende Reize, die auf eine Vielzahl von Verhaltensweisen modifiziert werden können (z.B. Geld oder soziales Prestige)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was versteht man unter dem “Premack-Prinzip”?

A

= häufig gezeigtes Verhalten kann weniger häufig gezeigtes Verhalten verstärken (zB. immer Musik hören als Belohnung nach dem Joggen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Beschreiben Sie die Skinner-Box.

A

Versuch: Ratte im Käfig mit Signallampen, Fressnapf und Hebel

  1. Pos. Verstärkung: Ratte bekommt wenn Hebel betätigt Futter -> Verhalten häufiger
  2. Neg. Verstärkung: Käfigboden ständig unter Strom, geht weg wenn Hebel betätigt -> Verhalten häufiger
  3. Pos. Bestrafung: bekommt immer Stromschlag, wenn Hebel betätigt -> Verhalten seltener
  4. Neg. Bestrafung: immer Futter weggenommen, wenn Hebel betätigt -> Verhalten seltener (nicht durchgeführt von Skinner)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Zählen Sie die Verstärkerpläne auf. Welche sind am effektivsten?

A
  1. Fester Verhältnis-/ Quotenplan
    -> nach einer festen Anzahl von Reaktionen erfolgt Verstärkung
    +beständiges moderates Verhalten
    -nach jeder Verstärkung kurze Pause
    -schnelle Löschung
  2. Variabler Quotenplan
    -> Anzahl Reaktion zwischen Verstärkung unterschiedl.
    +höchste Reaktionsrate
    +fast keine Pause nach Verstärkung
    +größter Löschungswiderstand
  3. fester Intervallplan
    -> Verstärkung erfolgt auf 1. Reaktion nach festem Zeitintervall
    -vermehrte Reaktionen zum Ende der Pause
    -nach Verstärkung keine Reaktion
  4. variabler Intervallplan
    -> Verstärkung erfolgt in unregelmäßigen Zeitabständen
    -mäßige aber stabile Verhaltensrate
    +fast keine Pause nach Verstärkung
    +größerer Löschungswiderstand

-> Quotenpläne höhere Verhaltensraten
-> variable Pläne höhere Löschungsresistenz

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Erklären Sie die Dreifachkontingenz der operanten Konditionierung an einem Beispiel.

A

OK führt zum Erwerb von Dreifachkontingenzen

  • gelernt wird Zshg. von Hinweisreiz (Licht an), einer darauffolgenden Reaktion (Hebeldruck) und einer Konsequenz (Futter) am Ende
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Erkläre kausales Lernen im Zshg. mit OK und der Studie von Wassermann et al..

A

OK erweckt Eindruck, dass Lebewesen, den kausalen Zusammenhang zw. ihrem
Verhalten und Konsequenzen lernen

  • Versuch: VP soll Taste drücken, manchmal geht das Licht an, manchmal nicht
  • UV1 (Licht, Taste), UV2 (Licht, keine Taste)
  • VP soll einschätzen, Ob Handeln Licht verursacht/verhindert
  • Ergebnis: Einschätzungen hängen von beiden UVs ab

-> Lernen ist damit nicht nur der Aufbau von Assoziationen, sondern auch der
Erwerb von Wissen über instrumentelle Mittel-Zweck-Relationen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Belohnung vs. Bestrafung: Untersuchung durch das Paradigma der Serial Reaction Time Task (SRT) anhand der Studie von Wächter et al.

A
  • Versuch: bei schneller Reaktionszeit +4 cent, bei langsamer -4 cent in 2 Gruppen
    -> nur Belohnungsgruppe zeigt schnellere Reaktionszeiten
    -> nur Belohnung verbessert implizites Lernen, nicht Bestrafung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was zeigen MRT-Studien im Zshg. mit Wirkung von Belohnung im Gehirn?

A

Dopaminerger Vorhersagefehler
- am Anfang starke Dopaminausschüttung durch Belohnung
- später der Stimulus, der Belohnung ankündigt, mit höchster Aktivität verbunden (Prinzip der Vorhersage)
- positive prediction error führt dazu, dass Verhalten häufiger gezeigt wird

-> Theory of predicted processing

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Wann hilft Bestrafung?

A
  • muss negativ, unmittelbar & begründet sein
  • intensivere Bestrafung -> schnellere Abnahme der Verhaltensauffälligkeit
  • langsame Steigerung der Intensität -> wenig effektiv
  • ungewollte Konsequenzen:
    -> Generalisierung (Übertragung auf gewünschtes Verhalten)
    -> neg. Emotionen (Angst, Wut)
    -> Korrelation zw. Bestrafung & Aggression

->Bestrafung führt zu Unterdrückung des unerwünschten Verhaltens, nicht zum Erlernen von Alternativen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Beschreibe Vermeidungslernen am Beispiel der Studie von Solomon, Kamin & Wynne.

A

= Lernen durch negative Verstärkung

  • Verhalten bewirkt, dass neg. Reiz verschwindet
  • Studie:
    -> Lernphase: Licht geht an, Elektroschock linke Kammer -> Hund konnte in rechte Kammer fliehen
    -> Testphase: Licht geht an -> Sprung in rechte Kammer (Vermeidungsverhalten)
  • sehr löschungsresistent: Vermeidung verhindert zu erfahren, dass neg. Konsequenz ausbleibt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Erkläre erlernte Hilflosigkeit am Beispiel der Studie von Overmier & Seligman.

A

= Lehre, dass eigenes Verhalten keinen Effekt hat

Studie:
- VPs bekommen Reiz mit neg. Konsequenz, welches nicht vermieden werden kann
- Kontrollgruppe: neg. Konsequenz durch Verhalten vermeidbar
- Phase 2: Vermeidungstraining
- Ergebnis: Kontrollgruppe lernt Vermeidungsverhalten, Experimentalgruppe zeigt neg. Emotion, aber keine Vermeidung

-> erlernte Hilflosigkeit (Bestrafung nicht durch eigenes Verhalten beeinflussbar)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was sind biologische Einschränkungen des OK?

A
  • Instinktiver Drift: adaptive Verhaltensweisen dringen in das neu konditionierte wieder ein
  • versch. Verhaltensweisen untersch. gut geeignet, um als Vermeidungsverhalten gelernt zu werden
  • nicht alle Reize eignen sich gleich gut als diskriminative Hinweisreize
  • neues Verhalten kann auch ohne direkte Verstärkung erworben werden
  • OK kann durch kogn. Prozesse beeinflusst werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vergleich KK & OK

A

KK:

  • Assoziationen zw. Stimuli (SS)
  • Reaktion unwillkürlich, automatisch
  • gelernt wird NS -> CS
  • Löschung: CR nimmt ab, wenn CS wdh. alleine dargeboten
  • Spontanerholung
  • Generalisierung: Tendenz, CR auch bei Stimuli zu zeigen, die CS ähnlich sind

OK:

  • Assoziationen zw. Stimuli, Verhalten & Konsequenz (Dreifachkontingenz)
  • Reaktion willentlich
  • gelernt, welche Reaktion in Situation welche Konsequenz hat
  • Löschung: Reaktion nimmt ab, wenn pos. Verstärkung aufhört
  • Spontanerholung
  • Generalisierung: Reaktion wird auch in ähnlichen Situationen gezeigt
17
Q

Generalisierung und Diskrimination bei OK

A
  • Tendenz zur Generalisierung auf ähnliche Situationen (ähnliche Hinweisreize) und Fähigkeit zur Diskrimination zw. Hinweisreizen) auch bei OK
  • Diskrimination nur nach zusätzlichen Lerndurchgängen möglich
    -> Es wird gelernt, unter welchen Bedingungen ein Verhalten erfolgreich ist
18
Q

Was bedeutet “Shaping” im Zshg. mit dem Erlernen von komplexen Verhaltensweisen (OK)?

A

= Veränderung des Verhaltens durch stufenweise Annäherung

  • zuerst wird Verhalten belohnt, das grob in Richtung des gewünschten Verhaltens weist
  • danach sukzessive Anpassung des Verstärkungskriteriums: Verhalten muss dem Gewünschten immer ähnlicher werden, um verstärkt zu werden
19
Q

Was bedeutet “Chaining” im Zshg. mit dem Erlernen von komplexen Verhaltensweisen (OK)?

A

Grundidee: komplexe Verhalten = Kette aus Teilschritten

Backward Chaining:

  • letzter Schritt primär verstärkt
  • vorherige Schritte werden sekundär verstärkt
  • jeder Schritt: sekundärer Verstärker (vorheriger) + diskriminativer Hinweisreiz (nächster)

Forward Chaining:

  • erster Schritt primär verstärkt
  • Schritte nacheinander hinzugefügt
  • jeder Schritt diskriminativer Hinweisreiz für nächsten

Kritik: Shaping & Chaining erklären nicht alle komplexen Verhalten (andere Lernformen nötig)