Lernen - Operantes Konditionieren Flashcards
Skinners Experiment/Entdeckung
Ratte wurde in eine Box gesteckt. Beim Drücken des roten Hebels, erhielten sie Futter.
Skinner entdeckte, dass die Häufigkeit der Hebeldrücker nicht allein von vorhergehenden Stimuli abhängig war, sondern vor allem von Reizen, die nach einem Hebeldruck folgten.
Verhalten wird von den Umwelteinflüssen (auf die eine Reaktion folgende Konsequenz) beeinflusst
Operantes Konditionieren
Instrumentelles Konditionieren
Wahrscheinlichkeit eines zufällig gezeigten Verhaltens wird erhöht, wenn eine Verstärkung folgt.
Operantes Verhalten passiert, ohne das ein angeborener, unbedingter Reiz (US) erkennbar wäre.
Phasen des operanten Konditionieren
- Bestimmung der Basisrate (zufällige Auftrittsrate des zu konditionierenden Verhalten)
- Verstärkung des Verhaltens in der Trainingsphase (gezielte Verstärkung, Wahrscheinlichkeit des Verhaltens nimmt zu)
- Löschung des Verhaltens (Verhalten wird nicht weiter belohnt -> Wahrscheinlichkeit des Verhaltens wird bis auf null reduziert
- Spontanerholung/-remission
Verstärkung
Verstärker: Ein Reiz, der die Auftrittswahrscheinlichkeit erhöht.
- Positive Verstärkung: Hinzufügen eines angenehmen Reizes (Essen, gute Note, Lob, …)
- Negative Verstärkung: Entfernen eines unangenehmen Reizes (Schmerzmittel einnehmen, Lärm entfernen, Gitternetz, …)
primärer, sekundärer und tertiärer Verstärker
Primärer Verstärker: Verstärkung der unmittelbar ein organismisches oder soziales Bedürfnis befriedigt (Futter, Streicheln, …)
Sekundärer Verstärker: Verstärker wird nur vermittelnd ein organismisches Bedürfnis befriedigt (Schulnoten -> gibt dann Anerkennung, Geld -> kann sich damit etwas kaufen)
Tertiärer Verstärker: kann nicht direkt eingelöst werden -> es befriedigt aber etwas (Prestige, Macht, Status)
Bestrafung
Reiz, der die Auftrittswahrscheinlichkeit reduziert.
- Positive Bestrafung (1. Art): Hinzufügen eines unangenehmen Reizes (Schimpfen, Strafzettel)
- Negative Bestrafung (2. Art): Entfernen eines angenehmen Reizes (Handyverbot)
Verstärkungsplan: Kontinuierlich
Jede gewünschte Reaktion wird verstärkt
Verstärkungsplan: Intermittierend
Nur einige Reaktionen werden verstärkt
- Quotenplan: Bestimmte Anzahl von Reaktionen wird verstärkt (Konstant -> jede 5.; Variabel -> im Schnitt 1/5)
- Intervallplan: Nach einem bestimmten Zeitintervall wird verstärkt (Konstant -> erste Reaktion nach Ablauf von 5min; Variabel -> im Schnitt nach 5min
Shaping
Der Verstärker führt das Verhalten immer näher ans das gewünschte Ziel. Nicht die vollständige Abfolge wird verstärkt, sondern jede Annäherung -> Verhaltenskette
Beispiel: Tierdressur
Tokensystem
Prinzip der intermittierenden Verstärkung, bei denen “tokens” (Chips, Spielmarken) verwendet werden, die gegen die eigentlichen Verstärker eingetauscht werden können