Allgemeine Psychologie Sem2.2 - Lernen 2 (Operantes Konditionieren) Flashcards
Operante Konditionierung
- Lernprozess, bei dem die Konsequenz einer Handlung die Wahrscheinlichkeit bestimmt, mit der diese zukünftig wiederholt wird
- Reaktionen des Organismus bestimmen, ob ein Reiz präsentiert wir
- Assoziationen zwischen kontrollierbaren Ereignissen werden gelernt (z.B ein Kind darf Computer spielen, wenn es das Zimmer aufgeräumt hat)
- Erwerb von zielgerichtetem und damit instrumentellem Verhalten
operantes konditionieren - Erste Experimente von Edward Thorndike (1898)
- In der Puzzle Box von Thorndike lernen die Tiere nach Versuch und Irrtum (Trial and Error)
-
Puzzle Box:
- Käfige, die verschiedene Öffnungsmechanismen hatten, die die Tiere betätigen konnten
- Interesse, wie lange die Tiere brauchen, um herauszubekommen, wie der Mechanismus funktioniert, mit dem sie aus dem Käfig kommen können
- i.d.R. mit (hungrigen) Katzen → Futter vor Käfig
- Zeitmessung
- Nach fünf Minuten erfolgloser Versuche, berührte die Katze meist den Hebel und öffnete die Tür
-
ABER: Im 2. Trial öffnete Katze nicht direkt Tür → verringerte Latenz
- Katze hat kausale Mechanismen nicht bewusst verstanden
operantes konditionieren - Thorndikes Lerngesetze (1927)
- „reinforcement“: Verbindung zw. Reizsituation & Verhalten/ Reaktion verstärkt, wenn dieses zu einer Belohnung führt
- „punishment“: Verbindung zw. Reizsituation & Verhalten/ Reaktion geschwächt, wenn Verhalten in der Situation zu keiner Belohnung bzw. zu Bestrafung führt
-
Lerngesetze:
-
Gesetz der Wirkung (Law of Effekt): Positive Konsequenzen (z.B. Futter) stärken Verknüpfung (Assoziation) zw. Situation (im Käfig eingeschlossen) und Reaktion (Pedale drücken); negative Konsequenzen (z.B. Elektroschock) schwächen Verknüpfung
- Gilt für S-R Situationen, in denen auf Reiz (z.B. Käfig, Hebel) eine Reaktion (Hebeldrücken) folgt
- Häufigkeit des gemeinsamen Auftretens von S & R ist nicht für Stärke der Verbindung entscheidend, sondern alleine hedonische Qualität
- Gesetz der Bereitschaft: Individuum muss Bereitschaft (= Bedürfnis) zeigen zu lernen / Zustand zu verbessern
- Gesetz der Übung: Eine Verhaltensweise muss wiederholt werden, um sie dauerhaft aufrecht zu erhalten → Übungseffekte
-
Gesetz der Wirkung (Law of Effekt): Positive Konsequenzen (z.B. Futter) stärken Verknüpfung (Assoziation) zw. Situation (im Käfig eingeschlossen) und Reaktion (Pedale drücken); negative Konsequenzen (z.B. Elektroschock) schwächen Verknüpfung
operantes konditionieren - Skinner-Box
- Systematisches Studieren von Erwerb und Löschung operanten Verhaltens als Funktion von Verstärkungsart und Verstärkungsplan
- Skinner unterschied zwischen respondentem (KK) und operantem Verhalten (OK)
operantes konditionieren - Dreifachkontingenz
- OK führt zum Erwerb von Dreifachkontingenzen
- Individuum lernt, dass unter bestimmter Reizbedingung (S) bestimmte Reaktion (R) Konsequenz (C) herbeiführt (Belohnung oder Bestrafung)
operantes konditionieren - Primäre, sekundäre und generalisierte Verstärker
-
Primäre positive Verstärker: Reize, die ohne vorherige Lernvorgänge verstärkend wirken
- z.B. Nahrung, Flüssigkeit, sexuelle Aktivität (→ befriedigen Grundbedürfnisse)
- Sekundäre positive Verstärker: ursprünglich neutrale Reize, die mit primären Verstärkern zusammen präsentiert wurden und dadurch ebenfalls verstärkend wirken (bunte Papierscheine = Geld)
-
Generalisierte Verstärker: verstärkende Reize, die auf eine Vielzahl von Verhaltensklassen modifizierend einwirken können
- z.B. Geld, soziales Prestige etc
-
Nicht nur Objekte können als Verstärker genutzt werden:
- häufig gezeigtes Verhalten kann weniger häufiges Verhalten verstärken
- Premack-Prinzip: Haben 2 Verhaltensweisen versch. Auftretenswahrscheinlichkeiten, verstärkt das wahrscheinlichere Verhalten das weniger wahrscheinliche, wenn das wahrscheinlichere Verhalten dem unwahrscheinlichen folgt
- häufig gezeigtes Verhalten kann weniger häufiges Verhalten verstärken
operantes konditionieren - Verstärkerpläne
- Ähnlich wie bei KK auch bei OK Phasen von Erwerb und Löschung:
- Anwesenheit von Verstärkung → Erwerb
- Abwesenheit von Verstärkung → Löschung
- Genauer Verlauf der Verhaltensänderung in der Erwerbs- und Löschungsphase ist vom Verstärkerplan abhängig
- Verhalten wird entweder
- basierend auf Auftretenshäufigkeit (Quote)
- oder basierend auf einem Zeitintervall verstärkt,
- erfolgt entweder nach einem festen oder variablen plan
operantes konditionieren - Generalisierung und Diskriminierung
- Auch bei OK kann ähnlich wie bei KK Tendenz zur Generalisierung auf ähnliche Situationen und die Fähigkeit zur Diskrimination beobachtet werden
- Diskrimination ist nur nach zusätzlichen Lerndurchgängen möglich
- Es wird gelernt, unter welchen Bedingungen ein Verhalten erfolgreich ist
operantes konditionieren - Kausales Lernen
operantes konditionieren - Shaping und Ausbildung von Verhaltensfolgen
- Verhalten kann nur dann verstärkt werden, wenn es zufällig gezeigt wird
- Skinner entwickelte Methode des Shapings, um Versuchstiere neue Verhaltensweisen beizubringen, die sie normalerweise nicht (oder nur ganz selten) ausführen
- Shaping: stufenweise Annäherung des Verhaltens
- Durch Kombination von KK und OK können Verhaltensketten gelernt werden:
- Belohntes Verhalten wird durch Paarung mit Verstärker zum sekundären Verstärker, das ermöglicht Kettenkonditionierung (Chaning)
- Nach Skinner erklärt Shaping und Chaning den Erwerb komplexer Verhaltensweisen (was heute anders gesehen wird)
operantes konditionieren - Verstärkung und Bestrafung
- Wirkung von Bestrafung ist von mehreren Einflüssen abhängig:
- Sie muss negativ, unmittelbar und begründet sein (kontingent)
- Studien an Ratten haben gezeigt, dass intensivere Bestrafung (stärkerer Elektroschock) zu schnellerer Abnahme der Verhaltenshäufigkeit führte
- Wird Intensität der Bestrafung langsam gesteigert, ist sie weniger effektiv
-
Ungewollte Konsequenzen:
- Generalisierung (z.B. Übertragung auf eigentlich erwünschtes Verhalten)
-
Diskriminierungseffekte (z.B. wird Verhalten nur unterdrückt, wenn Eltern da
sind) -
Negative Emotionen wie Angst, Wut, Zorn ggü. der strafenden Person
- Korrelation zw. Bestrafung und aggressivem Verhalten beobachtet
- Bestrafung führt NUR zu einer Unterdrückung des unerwünschten Verhaltens, nicht
zum Erlernen von Alternativen- Abbau unerwünschten Verhaltens ist besonders erfolgreich, wenn gleichzeitig alternatives Verhalten positiv verstärkt wird
operantes konditionieren - Vermeidungslernen
- Lernen durch negative Verstärkung wird auch als Vermeidungslernen bezeichnet
- Lernphase: Licht geht an, Elektroschock in linker Kammer → Hunde konnten in rechte Kammer fliehen
- Testphase: Licht geht an → Sprung in rechte Kammer → Vermeidungsverhalten gelernt
- Vermeidungsverhalten kann sehr löschungsresistent sein: Hunde sprangen weiter in sichere Kammer, auch wenn kein Schock mehr gegeben wurde
- Verhindert zu erfahren, dass es keine negative Konsequenz mehr gibt
operantes konditionieren - Erlernte Hilflosigkeit
-
Nach Seligmann: Erfahrung, dass Bestrafung nicht durch eigenes Verhalten beeinflusst werden kann
- Dadurch wird Erwerb und / oder Ausführung instrumenteller Reaktionen erschwert
- Es wird gelernt, dass eigenes Verhalten keinen Effekt hat
operantes konditionieren - Biologische Einschränkungen
- Instinktiver Drift: Werden Tiere neue Verhaltensweisen beigebracht, kann oft beobachtet werden, dass adaptive Verhaltensweisen in das neu konditionierte Verhalten „eindringen“
- Versch. Verhaltensweisen sind unterschiedlich gut geeignet, um als Vermeidungsverhalten gelernt zu werden (Bspw. Tauben lernen nur sehr schwer, dass Picken auf Tasten Elektroschocks vermeidet, geht einfacher mit Schlagen der Flügel)
- Nicht alle Reize eignen sich gleich gut als diskriminative Hinweisreize → Lebewesen haben biologische Prädispositionen für bestimmte Reize
- Studien zum latenten, Beobachtungs- und Einsichtslernen haben gezeigt, dass neues Verhalten auch ohne direkte Verstärkung erworben werden kann → Belohnung wirkt stärker beim Ausführen/Anwenden als beim Erwerb neuer Verhaltensweisen
- Operantes Konditionieren kann durch kognitive Prozesse beeinflusst werden
operantes konditionieren - Vergleich Klassische und Operante Konditionierung