VL4: Operantes Lernen: Verstärkung Flashcards
Law of Effect (Gesetz des Effekts, Thorndike, 1911)
Verhaltensweisen in einer bestimmten Situation, werden, sofern auf diese Befriedigung folgt, eher mit Merkmalen der Situatiom verknüpft, sodass, wenn sie Situation wieder auftaucht, diese Verhaltensweisen wieder auftauchen
->je größer die Befriedigung, desto ausgeprägter ist der Zusammenhang zwischen Verhaltensweisen und der Situation
Thorndikes Problemlösekäfig
- spez. Türmechanismus, um diese zu öffnen
- außerhalb der Käfigs Nahrung
- im Käfig Katzen
- Katzen müssen Käfig öffnen, um an Nahrung zu gelangen
Beobachtung: -zuerst unzielstrebiges Verhalten, nach 5-10 Minuten zufällig richtige Reaktiom
-nächste Durchgänge: zunächst wieder unzielstrebig, aber richtige Reaktion zunehmend schneller
Thorndikes Fazit: -offenbar kein rationales Verständnis der Situation
-Nahrung führt zu wachsender Assoziation zwischen Merkmalen des Käfigs und der richtigen Reaktion
Verstärker
Ereignis, welches auf ein Verhalten folgt und dessen Auftretenswahrscheinlichkeit erhöht
Unterscheidung klassische und operante Konditionierung
Klassisch: Folgt ein wichtiges Ereignis auf einen Reiz, löst der Reiz allein irgendwann die Reaktion aus, die normalerweise auf das Ereignis folgen würde
Operant: Folgt ein wichtiges Ereignis auf ein bestimmtes Verhalten, ändert sich die Wahrscheinlichkeit des Verhaltens
- > pos. Ereignis führt zu Verstärkung
- > neg. Ereignis führt zu Bestrafung
- wenig Generalisierbarkeit
Primäre Verstärker
- angeboren
- dienen dem Überleben: Nahrung, Wasser, sexuelle Befriedigung
- aber auch “sensory reinforcers”: Präferenz, dass unsere Umwelt nicht langweilig ist, Anziehungskraft neuer unbekannter Dinge
Sekundäre Verstärker
- erlernt, sogenannte konditionierte Verstärker
- zB Geld (erlernt als Zugang zu primären Verstärkern)
- nicht weniger wirksam als primäre Verstärker
Soziale Verstärker
- Mischform aus primären und sekundären Verstärkern
- entstehen aus sozialem Kontext
- zB Lob, Zuneigung, Anerkennung
- können sehr mächtig/wirksam sein
Positive Verstärker
Einsatz dieser erhöht die Verhaltenswahrscheinlichkeit (Nahrung, Geld)
Negative Verstärker
Entfernen dieser erhöht die Verhaltenswahrscheinlichkeit (Schmerz, negative Emotionen)
Skinner Box (nach Burrhus Frederic Skinner)
Weiterentwicklung von Thorndikes Käfig
- Knopf, der, wenn ausgelöst, Futter gibt
- gemessen wird Reaktionshäufigkeit
Operante Konditionierung/instrumentelle Konditionierung
Wenn Lebewesen in bestimmter Art und Weise operieren, also auf die Umwelt einwirken, und dafür belohnt/bestraft werden
Kontiguität bei operanter Konditionierung?
- bei Tieren vorhanden (je mehr Zeit vergeht, desto mehr mögliches Verhalten, das zum Verstärker führt)
- bei Menschen bedingt:
- -viel Gegenevidenz: Lernen-Noten, Anstrengung-Bezahlung
- ->möglich durch: Sprache und Kommunikation (Ersatz für Kontiguität; überbrücken Mangel)
- -aber für komplexes Verhalten (zB motorisch) ist zeitnahes Feedback essenziell (siehe Sport)
Verstärkerpläne
- Zufallsbefund durch Skinner, weil Futter ausgegangen ist in Skinner Box
- Verringerung der Futtergabe
- Futter entweder durch zeitlichen Abstand (Intervallplan) oder nach gewisser Anzahl von Reaktionen (Quotenplan)
- insgesamter Befund: operante Konditionierung kann kontinuierlich (jede Reaktion führt zur Verstärkung) oder intermittierend (partielle Verstärkung; Intervallplan, Quotenplan) sein
Löschungsresistenz
- Lewis und Duncan (1956): partial reinforcement effect
- Verhalten ist deutlich resistenter gegen Löschung des Verhaltens (also bei Abwesenheit des Verstärkers), wenn der Verstärker ohnehin weniger oft auf das Verhalten folgte
Token Economy
Praktisches Anwendungsbeispiel von Verstärkung
- statt sozialer Verstärker wie Lob einfach sekundäre Verstärker (Punktesystem)
- ->erfolgreich eingesetzt
- ->aber Problem der Aufrechterhaltung in bestimmten Situationen wegen begrenzter Generalisierbarkeit ->notwendig: irgendwann müssen die sekundären durch primäre Verstärker ersetzt werden