Allgemeine Psychologie Sem2.2 - Lernen 2 (Operantes Konditionieren) Flashcards

1
Q

Operante Konditionierung

A
  • Lernprozess, bei dem die Konsequenz einer Handlung die Wahrscheinlichkeit bestimmt, mit der diese zukünftig wiederholt wird
    • Reaktionen des Organismus bestimmen, ob ein Reiz präsentiert wir
    • Assoziationen zwischen kontrollierbaren Ereignissen werden gelernt (z.B ein Kind darf Computer spielen, wenn es das Zimmer aufgeräumt hat)
    • Erwerb von zielgerichtetem und damit instrumentellem Verhalten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

operantes konditionieren - Erste Experimente von Edward Thorndike (1898)

A
  • In der Puzzle Box von Thorndike lernen die Tiere nach Versuch und Irrtum (Trial and Error)
  • Puzzle Box:
    • Käfige, die verschiedene Öffnungsmechanismen hatten, die die Tiere betätigen konnten
    • Interesse, wie lange die Tiere brauchen, um herauszubekommen, wie der Mechanismus funktioniert, mit dem sie aus dem Käfig kommen können
    • i.d.R. mit (hungrigen) Katzen → Futter vor Käfig
    • Zeitmessung
  • Nach fünf Minuten erfolgloser Versuche, berührte die Katze meist den Hebel und öffnete die Tür
  • ABER: Im 2. Trial öffnete Katze nicht direkt Tür → verringerte Latenz
    • Katze hat kausale Mechanismen nicht bewusst verstanden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

operantes konditionieren - Thorndikes Lerngesetze (1927)

A
  • reinforcement“: Verbindung zw. Reizsituation & Verhalten/ Reaktion verstärkt, wenn dieses zu einer Belohnung führt
  • punishment“: Verbindung zw. Reizsituation & Verhalten/ Reaktion geschwächt, wenn Verhalten in der Situation zu keiner Belohnung bzw. zu Bestrafung führt
  • Lerngesetze:
    • Gesetz der Wirkung (Law of Effekt): Positive Konsequenzen (z.B. Futter) stärken Verknüpfung (Assoziation) zw. Situation (im Käfig eingeschlossen) und Reaktion (Pedale drücken); negative Konsequenzen (z.B. Elektroschock) schwächen Verknüpfung
      • Gilt für S-R Situationen, in denen auf Reiz (z.B. Käfig, Hebel) eine Reaktion (Hebeldrücken) folgt
      • Häufigkeit des gemeinsamen Auftretens von S & R ist nicht für Stärke der Verbindung entscheidend, sondern alleine hedonische Qualität
    • Gesetz der Bereitschaft: Individuum muss Bereitschaft (= Bedürfnis) zeigen zu lernen / Zustand zu verbessern
    • Gesetz der Übung: Eine Verhaltensweise muss wiederholt werden, um sie dauerhaft aufrecht zu erhalten → Übungseffekte
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

operantes konditionieren - Skinner-Box

A
  • Systematisches Studieren von Erwerb und Löschung operanten Verhaltens als Funktion von Verstärkungsart und Verstärkungsplan
  • Skinner unterschied zwischen respondentem (KK) und operantem Verhalten (OK)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

operantes konditionieren - Dreifachkontingenz

A
  • OK führt zum Erwerb von Dreifachkontingenzen
  • Individuum lernt, dass unter bestimmter Reizbedingung (S) bestimmte Reaktion (R) Konsequenz (C) herbeiführt (Belohnung oder Bestrafung)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

operantes konditionieren - Primäre, sekundäre und generalisierte Verstärker

A
  • Primäre positive Verstärker: Reize, die ohne vorherige Lernvorgänge verstärkend wirken
    • z.B. Nahrung, Flüssigkeit, sexuelle Aktivität (→ befriedigen Grundbedürfnisse)
  • Sekundäre positive Verstärker: ursprünglich neutrale Reize, die mit primären Verstärkern zusammen präsentiert wurden und dadurch ebenfalls verstärkend wirken (bunte Papierscheine = Geld)
  • Generalisierte Verstärker: verstärkende Reize, die auf eine Vielzahl von Verhaltensklassen modifizierend einwirken können
    • z.B. Geld, soziales Prestige etc
  • Nicht nur Objekte können als Verstärker genutzt werden:
    • häufig gezeigtes Verhalten kann weniger häufiges Verhalten verstärken
      • Premack-Prinzip: Haben 2 Verhaltensweisen versch. Auftretenswahrscheinlichkeiten, verstärkt das wahrscheinlichere Verhalten das weniger wahrscheinliche, wenn das wahrscheinlichere Verhalten dem unwahrscheinlichen folgt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

operantes konditionieren - Verstärkerpläne

A
  • Ähnlich wie bei KK auch bei OK Phasen von Erwerb und Löschung:
  • Anwesenheit von Verstärkung → Erwerb
  • Abwesenheit von Verstärkung → Löschung
  • Genauer Verlauf der Verhaltensänderung in der Erwerbs- und Löschungsphase ist vom Verstärkerplan abhängig
  • Verhalten wird entweder
    • basierend auf Auftretenshäufigkeit (Quote)
    • oder basierend auf einem Zeitintervall verstärkt,
    • erfolgt entweder nach einem festen oder variablen plan
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

operantes konditionieren - Generalisierung und Diskriminierung

A
  • Auch bei OK kann ähnlich wie bei KK Tendenz zur Generalisierung auf ähnliche Situationen und die Fähigkeit zur Diskrimination beobachtet werden
  • Diskrimination ist nur nach zusätzlichen Lerndurchgängen möglich
  • Es wird gelernt, unter welchen Bedingungen ein Verhalten erfolgreich ist
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

operantes konditionieren - Kausales Lernen

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

operantes konditionieren - Shaping und Ausbildung von Verhaltensfolgen

A
  • Verhalten kann nur dann verstärkt werden, wenn es zufällig gezeigt wird
    • Skinner entwickelte Methode des Shapings, um Versuchstiere neue Verhaltensweisen beizubringen, die sie normalerweise nicht (oder nur ganz selten) ausführen
  • Shaping: stufenweise Annäherung des Verhaltens
  • Durch Kombination von KK und OK können Verhaltensketten gelernt werden:
    • Belohntes Verhalten wird durch Paarung mit Verstärker zum sekundären Verstärker, das ermöglicht Kettenkonditionierung (Chaning)
    • Nach Skinner erklärt Shaping und Chaning den Erwerb komplexer Verhaltensweisen (was heute anders gesehen wird)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

operantes konditionieren - Verstärkung und Bestrafung

A
  • Wirkung von Bestrafung ist von mehreren Einflüssen abhängig:
    • Sie muss negativ, unmittelbar und begründet sein (kontingent)
    • Studien an Ratten haben gezeigt, dass intensivere Bestrafung (stärkerer Elektroschock) zu schnellerer Abnahme der Verhaltenshäufigkeit führte
    • Wird Intensität der Bestrafung langsam gesteigert, ist sie weniger effektiv
  • Ungewollte Konsequenzen:
    • Generalisierung (z.B. Übertragung auf eigentlich erwünschtes Verhalten)
    • Diskriminierungseffekte (z.B. wird Verhalten nur unterdrückt, wenn Eltern da
      sind)
    • Negative Emotionen wie Angst, Wut, Zorn ggü. der strafenden Person
      • Korrelation zw. Bestrafung und aggressivem Verhalten beobachtet
  • Bestrafung führt NUR zu einer Unterdrückung des unerwünschten Verhaltens, nicht
    zum Erlernen von Alternativen
    • Abbau unerwünschten Verhaltens ist besonders erfolgreich, wenn gleichzeitig alternatives Verhalten positiv verstärkt wird
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

operantes konditionieren - Vermeidungslernen

A
  • Lernen durch negative Verstärkung wird auch als Vermeidungslernen bezeichnet
  • Lernphase: Licht geht an, Elektroschock in linker Kammer → Hunde konnten in rechte Kammer fliehen
  • Testphase: Licht geht an → Sprung in rechte Kammer → Vermeidungsverhalten gelernt
  • Vermeidungsverhalten kann sehr löschungsresistent sein: Hunde sprangen weiter in sichere Kammer, auch wenn kein Schock mehr gegeben wurde
  • Verhindert zu erfahren, dass es keine negative Konsequenz mehr gibt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

operantes konditionieren - Erlernte Hilflosigkeit

A
  • Nach Seligmann: Erfahrung, dass Bestrafung nicht durch eigenes Verhalten beeinflusst werden kann
    • Dadurch wird Erwerb und / oder Ausführung instrumenteller Reaktionen erschwert
    • Es wird gelernt, dass eigenes Verhalten keinen Effekt hat
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

operantes konditionieren - Biologische Einschränkungen

A
  • Instinktiver Drift: Werden Tiere neue Verhaltensweisen beigebracht, kann oft beobachtet werden, dass adaptive Verhaltensweisen in das neu konditionierte Verhalten „eindringen“
  • Versch. Verhaltensweisen sind unterschiedlich gut geeignet, um als Vermeidungsverhalten gelernt zu werden (Bspw. Tauben lernen nur sehr schwer, dass Picken auf Tasten Elektroschocks vermeidet, geht einfacher mit Schlagen der Flügel)
  • Nicht alle Reize eignen sich gleich gut als diskriminative Hinweisreize → Lebewesen haben biologische Prädispositionen für bestimmte Reize
  • Studien zum latenten, Beobachtungs- und Einsichtslernen haben gezeigt, dass neues Verhalten auch ohne direkte Verstärkung erworben werden kann → Belohnung wirkt stärker beim Ausführen/Anwenden als beim Erwerb neuer Verhaltensweisen
  • Operantes Konditionieren kann durch kognitive Prozesse beeinflusst werden
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

operantes konditionieren - Vergleich Klassische und Operante Konditionierung

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly