Operantes Konditionieren Flashcards
Interesse des OK
nicht-reflexives, willkürliches Verhhalten, S-R-Assoziationen (Situations-Reaktions)
Law of Effect
Reaktionen denen ein befriedigender Zustand folgt werden stärker mit der Situation verknüpft und vice versa; je intensiver der befriedigende/aversive Zustand desto intensiver die Verknüpfung
Lerninhalt Skinner
bei vorliegen einer Situation führt die Reaktion R zur Konsequenz K
Positive Verstärkung
(angenehmer) Stimulus wird präsentiert, verhalten nimmt zu
Negative Verstärkung
(aversiver) Stimulus wird entfernt, Verhalten nimmt zu
Bestrafung Typ I
(aversiver) Stimulus wird präsentiert, Verhalten nimmt ab
Bestrafung Typ II
(angenehmer) Stimulus wird entfernt, Verhalten nimmt ab
Primäre Verstärker
Stellen unmittelbar den (un-)befriedigenden Zustand dar
Konditionierte Vestärker
erlernte Hinweisreize, kündigen den primären Verstärker an
Generalisierte Verstärker
konditionierte Verstärker höherer Ordnung
Problem OK
nur bereits gezeigte Verhalten können gestärkt oder abgeschwächt werden
Verhaltensketten
oftmals Rückwärtsverkettung
Shaping
nutzt die natürliche Variabilität des Verhaltens, (positive) Verstärkung aller Reaktionen die “in die richtige Richtung gehen”
kontinuierliche Verstärkung
jede Reaktion wird verstärkt
intermittierende Verstärkung
nicht jede Reaktion, Quotenpläne oder intervallpläne
Quotenpläne
Verstärkung abhängig von Häufigkeit der Reaktion; Feste Quote (FR), variable Quote (VR)
Intervallpläne
Verstärkung abhängig von Zeit seit letzter Verstärkung, Festes Intervall (FI), variables intervall (VI)
DHR-Plan
differential reinforcement of higher response rate, in bestimmten Zeitraum muss Mindestanzahl an Reaktionen erfolgen, sonst Zähler auf Null
Auswirkung FR
Stufenmuster, hohe Reaktionsrate, Nachverstärkungspause
Auswirkung VR
kontinuierlich hohe Rate, kaum Pausen
Auswirkung FI
Bogenmuster, schnelle Zunahme gegen Ende des Intervalls
Auswirkung VI
kontinuierlich niedrige Rate
Flucht
beendet aversiven Reiz
Vermeidung
verhindert aversiven Reiz
Vermeidungsparadox
Erfolgreiche Vermeidung verhindert das Auftreten des aversiven Reizes;
Vermeidungsverhalten sollte also durch Wegfall der negativen Verstärkung
bald gelöscht werden -> ABER Vermeidungsverhalten extrem stabil
Mowrer, Zweifaktorentheorie der Vermeidung
KK der CR Furcht auf CS (Dunkelheit), Negative Verstärkung durch Furchtreduktion
Seligman und Johnston, Kognitive Theorie der Vermeidung
Vermeidungslernen bildet zwei Erwartungen: 1) Nach Reaktion kommt kein Schock, 2) Nack Nicht-Reaktion kommt ein Schock
-> Verhalten ändert sich nicht, solange beide Erwartungen nicht verletzt werden
Seligman, Erlernte Hilflosigkeit
widerholte, unkontrollierbare, aversive Reize, Individuum verliert Fähigkeit zur Flucht/Vermeidung, Erwartung: “Eigenes Verhalten hat keinen Einfluss auf Umwelt”
Möglichkeiten der Verhaltensreduktion
Löschung, Verstärkung von Alternativverhalten, Sättigung (Verstärkerabwertung), Bestrafung (?)
Azrin und Holz, Wirksamkeit von Bestrafung
intensiver Bestrafungsreiz, unmittelbare Bestrafung, hohe Intensität von Beginn, kontinuierliche Bestrafung, keine Ausweichsmöglichkeit, Kombination mit Sättigung des ursprünglichen Verstärkers, Verstärkung von Alternativverhalten
Probleme von Bestrafung
Ethik, Bestrafung führt zu Furcht führt zu allgemeiner Verhaltensreduktion, würde permanente Kontrolle erfordern, Bestrafung ist Form von Aufmerksamkeit
Bolles (1970)
SSDR Konzept; Instrumentelles Lernen von Flucht/Vermeidung effektiver, wenn aufzubauende Reaktion der artspezifische Abwehrreaktionen ähnlich ist
Breland, Instinktverschiebung
Erbe (Instinkte) und Umwelt (Lernen) wirken gemeinsam auf Verhalten ein
Warum widerspricht Instinktverschiebung nicht der Konditionierungstheorie?
zu Beginn OK, Objekt als hinweisreiz (S) für R-K-Assoziation, dann wird Assoziation zwischen CS (S) und US (K) gebildet, CS löst sann natürliche Verhaltensweisen ab, dies ist als CR zu verstehen
Tolman & Honzik
Latentes Lernen, Labyrinth drei Gruppen unterscheidlich Verstärkt (Beginn, 11. Durchgang, nie), Nach Beginn schnelle Fehlerabnahme: nie hat schwächste Kurve, aber Labyrinth wurde gelernt -> Verstärkung nicht notwendig
Was wird beim OK gelernt?
S-R-K Assoziationen (Situationen-Reaktionen-Konsequenzen), evtl. reine S-K-Assoziationen
Premack-Prinzip
Ein Verhalten (das a-priori oft gezeigt wird) kann ein anderes
Verhalten (das a-priori seltener gezeigt wird) verstärken.
anwendunen operanter Prinzipien
Token-Economies, Verhaltenstherapie, Biofeedback
Bandura, Beobachtungslernen
Aus der Beobachtung von Artgenossen wird gelernt, welches Verhalten zu welcher Konsequenz führt
Stimulus Enhancement
ein Modell, das an einem Objekt manipuliert, lenkt die Aufmerksamkeit des Beobachters auf dieses Objekt
Tomasello & Carpenter, Mimikry
Beobachter ahmt reflexiv motorisches Muster nacht, zunächst ohne dasselbe Ziel wie das Modell
Thrope
echte imitation, ein beobachtetes neues Verhalten wird mit dem selben Ziel wie das Modell nschgeahmt
Tomasello & Carpenter, Emulationslernen
Beobachter lernt über Objekt, zeigt daraufhin modell-äquivalentes Verhalten
Bandura, stellvertretende Verstärkung
Bobo-Doll, Individuum beobachtet anderes Individuum, dass sich für Verhaltensweise belohnt/belohnt wird
Bandura, Aufmerksamkeit
Salienz, Valenz und funktionaler Wert des Verhaltens, Macht oder Ähnlichkeit Modell
Aneignungsphase Bandura
Aufmersamkeitsprozesse, Gedächtnisprozesse
Bandura, Gedächtnis
Kodierung: Visuell-analog (unmittelbare Imitation, kurze Sequenzen), verbal-symbolisch (komplexer/länger, flexibler)
Bandura, Audführungsphase
Reproduktion, Motivation
Bandura Reproduktion
körperliche/kognitive Fähigkeiten, Verfügbarkeit von Teilreaktionen ggf. Übung, Feedback zur Güte der Reproduktion
Bandura, Motivation
Verstärkung (Selst-Verstärkung, extern stellvertretend erlebte), Verstärker-Erwartung