Sitzung 4 Lernen 3 Flashcards
Methoden des komplexen Verhaltensaufbaus
- Shaping
2. Chaining
- Shaping
Verhaltensformung durch stufenweise Annäherung
Eine Verhaltensformung, in der eine komplexe Verhaltensweise gelernt wird. Anfangs werden alle leicht ähnliche Verhaltensweisen belohnt; später werden nur noch ähnliche Verhaltensweisen und
zuletzt nur noch das Zielverhalten belohnt.
- Chaining
Aneinanderkettung von neuen Verhaltensfolgen.Einen Lernvorgang, in dem eine komplexe Verhaltensweise
aufgebaut wird. Es wird mit einer Verhaltensweise begonnen und diese mit weiteren verknüpft bis schrittweise eine komplexe Verhaltenskette erreicht wird.
- Forword- Chaining:
Man baut die komplexe Verhaltensweise von Anfang an auf (sprich in der “richtigen” Reihenfolge) - Backword-Chaining: Man baut die Verhaltensweise vom Ende her auf. Es wird mit einem Zielverhalten begonnen und davon ausgehend schrittweise eine Verhaltenskette aufgebaut
- > oft bei Dressur eingesetzt
Verhaltensaufbau durch negative Verstärkung
- > Anstelle von Belohnung wird Verhalten durch Flucht und Vermeidung verstärkt
1. Fluchttraining: z.B.: Feueralarm
2. Vermeidungslernen: Lernen einen aversiven Reiz zu meiden, bevor er auftritt
Methoden der Verhaltensreduktion
- Löschung
- Differentielle Verstärkung alternativer Verhaltensweisen
- Sättigung
- Bestrafung
- Methode der Auszeit (Time-out)
Methoden der Verhaltensreduktion: 1. Löschung
- Schritt: Indentifizierung von Verstärkern des unerwünschten Verhaltens
- Schritt: Beseitigen der kontingenz (= der Wahrscheinlichkeit, dass ein Verhalten zu einer Bestimmten Konsequenz führt)
Methoden der Verhaltensreduktion: 2. Differenzielle Verstärkung alternativer Verhaltensweisen
Verstärkung von alternativen Verhaltensweisen
-> ist möglich, wenn beide Verhaltensweisen (alternative und unerwünschte) nicht gleichzeitig ausgeführt werden können
Methoden der Verhaltensreduktion: 3. Sättigung
Herabsetzen des Wertes des Verstärkers durch die Schaffung der Möglichkeit die positive Konsequenz des unerwünschten Verhaltens so oft zu bekommen wie man möchte
Folge: Reduktion des Bedürfnisses nach dem Verstärker
!Achtung: Nicht immer eine gute Idee !
Methoden der Verhaltensreduktion: 4. Bestrafung Wirksamkeit & Probleme
Ultimo Ratio
Wirksamkeit: vorübergehende Unterdrückung solange bestraft wird
Probleme: 1. heimliches Verhalten statt Verhaltensreduktion
2. Furcht
3. Ethische Probleme: Fließende Grenze zu Gewalt und Missbrauch
Methoden der Verhaltensreduktion: 5. Methode der Auszeit (Time-out)
Kombination von Löschung durch Verstärkerentzug und Bestrafung
Wann ist Bestrafung effektiv?
-> Ähnliche Gesetzmäßigkeiten wie bei Verstärkung
- mit hoher Intensität: Studie von Azrin & Holz (1966)
» Tauben lernten auf Scheibe zu picken
» 80 Volt: sofort aufgehört
» Langsame Steigerung: erst bei 130 Volt aufgehört - mit Unmittelbarkeit
- mit Kontinuierlichkeit: Die Bestrafung jedes Verhaltens ist schneller als intermittierende Bestrafung
- mit niedriger Motivation für das unerwünschte Verhalten
- mit Angebot für Alternativverhalten
Indikatoren für die Rolle von Kognition beim instrumentellen Lernen
- Latentes Lernen
2. Verstärkererwartung
- Latentes Lernen
= verborgenes Lernen
Es wurde gelernt, das gelernte Verhalten wird jedoch nicht gezeigt
Lernen braucht also keine Verstärkung aber die Performanz schon
- Verstärkererwartung
Im Laufe der Zeit baut sich eine Erwartung über die Güte der Belohnung auf. Wird diese enttäuscht, nimmt die Leistung ab, wird diese übertroffen nimmt die Leistung zu
Rescorla-Wagner-Modell: Erklärung
beschreibt die Veränderung der Assozitionsstärke zwischen CS & US über die Lerndurchgänge in Abhängigkeit der Qualität des CS und des US, Lernen ist nach diesem Modell die Zunahme an Assoziationsstärke zw. CS & US
mathematisches Modell, dass Assozialtionsbildung bei der klassischen & operanten Konditionierung beschreibt
versucht Lernvorgänge mathematisch abzubilden & quantitative systematische Vorhersagen zu treffen
Möglichkeiten/Vorteile von RW-Modell
- Erweiterung auf mehrere CS möglich
- US wird durch die Summe der CS-US Assoziationsstärker vorhergesagt
- CS konkurrieren miteinander
- Erklärt Blocking Phänomen: Durch erste Trials ist CS1-US Assoziationsstärke schon ziemlich
hoch ➡ reduziert Lernzuwachs
➡ CS1 und CS2 konkurrieren
➡ CS2-US Assoziation wird nicht mehr gelernt - vermag den idealtypischen Akquisitionsverlauf bei der klassischen Konditionierung abzubilden:
Erstens nimmt die Assoziationsstärke mit jedem Trainingsdurchgang zu und nähert sich dabei der maximalen Assoziationsstärke an. Zweitens ist
der Zuwachs anfangs groß und wird mit jedem neuen Trainingsdurchgang ein wenig kleiner: Die Lernkurve ist negativ beschleunigt. Beide Vorhersagen des Modells stimmen mit den experimentellen Daten überein.
-> sehr erfolgreiches Modell, aber neuere Forschung zeigt, dass Grenzen da sind und Erweiterung notwendig ist
Grenzen des RW-Modells
- Kontextlernen (Verknüpfung von CS & US findet nur in einem bestimmten Kontext statt) kann es nicht erklären
- Unterschiedliche Differenzierungen im Lernen auch nicht (z.B.: Ton a = Futter, Ton b = Futter, Ton a +b = kein Futter; das kann gelernt werden, das Modell kann diese Lernkurve aber nicht erklären)
Vermeidungslernen
Definition
Das Vermeidungslernen baut auf das Furchtlernen auf, nachdem mal gelernt hat etwas zu fürchten, lernt man oft etwas zu vermeiden
Vermeidungslernen
Erklärung
Vermeidung und Flucht kann durch negative Verstärkung erklärt werden, das Individuum vermeidet oder beendet eine unangenehme Situation
Eigenschaft von Vermeidungslernen
ist sehr löschresistent
-> Grund: Vermeidungsparadox
Vermeidungsparadox
Flucht und Vermeidung treten vor dem Ereignis ein, sodass das Nichteintreten des Ereignisses als negative Verstärkung wirkt, so wird das Vermeidungshalten verstärkt wird und gleichzeitig wird verhindert zu erkennen, dass der US inzwischen gar nicht mehr vorliegt
Zweifaktor-/ Zweiprozesstheorie des Vermeidungslernens
- Klassische Konditionierung: Übertragung von Furcht vor negativem Reiz auf Hinweisreiz
- Vermeidung: Reduktion von Furcht durch Vermeidung des Hinweisreizes (negative Verstärkung)
- > Erklärt Vermeidungsverhalten jedoch nur teilweise, da vermeidungsverhalten auch dann gezeigt wird, wenn keine Furchtereignis vorlag
Stabilität des Vermeidungsverhaltens
Ist sehr Stabil, da die Vermeidung nicht nur verhindert, dass die Erfahrung des negativen Reizes während der Akquisition gemacht wird, sondern auch die Feststellung, dass der US inzwischen nicht mehr da ist
Auf andere Kontexte Übertragen: Wenn man die Situation vermeidet kann man auch keine positiven Erfahrungen machen
Kognitive Erklärung für Löschungsresistenz von Vermeidungsverhalten
-> Füllt die Erklärungslücke der Zweifaktortheorie
Seligman & Johnston (1973)
Es werden schon Verhaltensweisen, bei denen eine aversive Reaktion erwartet wird, vermieden
Diese Vermeidung erlaubt es diese Erwartung aufrechtzuerhalten. Die Erwartung kann also nicht gelöscht werden, da man gar nicht die Erfahrung macht, dass die Erwartung falsch ist
Behandlung von Angststörungen
- Konfrontationstherapie
2. systematische Desensibilisierung
- Konfrontationstherapie
-> direkte Exposition und Reaktionsverhinderung
Gezielte Aussetzung mit angstauslösenden Reizen, um zu lernen, dass der konditionierte Reiz nicht mit aversiven Konsequenzen gekoppelt ist
-> muss schrittweise und am besten in professioneller Betreuung stattfinden
- systematische Desensibilisierung
zusätzlich zur Konfrontation: Gegenkonditionierung
z.B.: Entspannungtechnicken, die in der Situation eingesetzt werden um zu lernen, dass der Stimulus nicht angsteinflößend ist
Gelernte Hilflosigkeit
Definition
Man ist nicht oder nur eingeschränkt in der Lage ein adäquates Vermeidungsverhalten aufzubauen und Vermeidungsmöglichkeiten zu erkennen
Erklärungsansätze erlernter Hilflosigkeit
1. erste interpretation Seligman
1975
- Menschen und Tiere lernen, dass ihre Reaktion und die aversiven Reize voneinander unabhängig sind
- Führt zu Hilflosigkeitserwartung mit motivationalen, emotionalen und kognitiven Defiziten
- Wird auf andere Situationen generalisiert
Erklärungsansätze gelernte Hilflosigkeit
2. neuere Ansatz
erster Ansatz nicht so einfach auf den Menschen übertragbar
Wichtig ist wohl auch die Attribution (Interpretation) der fehlenden Kontrolle
Bei gelernter Hilflosigkeit wird die fehlende Kontrolle über negative Ereignisse internal, global und stabil attributiert
Kausallernen
Es geht darum, wann Menschen eine Kausalbeziehung zwischen Verhalten und Reaktion annehmen.
geschätzte Kausalität
Ist eine Funktion des Verhältnis der beiden Wahrscheinlichkeiten, dass Reaktion auf Verhalten folgt, und dass Reaktion ohne Verhalten folgt
Das Verhältnis dieser beiden Wahrscheinlichkeiten bestimmt wie hoch das Kausalurteil ausfällt
Implikation: Menschen scheinen beim operanten konditionieren kausale Regeln zu erwerben
Welcher der folgenden Verstärkungspläne beschreibt einen festen Quotenverstärkungsplan?
A) Eine Belohnung wird immer gegeben, wenn das gewünschte Verhalten 10 mal gezeigt wurde.
B) Eine Belohnung wird alle 10 Minuten gegeben, wenn da gewünschte Verhalten in diesem Zeitraum gezeigt wurde.
C) Eine Verstärkung wird am Anfang nach jedem Verhalten und dann immer seltener gegeben.
D) Eine Verstärkung wird im Mittel alle 10 Minuten gegeben, aber die genauen Zeiten schwanken
A)
Um welche Art der Verstärkung/Bestrafung handelt es sich in der folgenden Situation: “Die Mutter nimmt Benni das Handy weg, weil er sein Zimmer nicht aufgeräumt hat.“
A) positive Verstärkung
B) negative Verstärkung
C) Bestrafung Typ 1
D) Bestrafung Typ 2
D)
Rescolra-Wagner-Modell: Was passiert wenn a sich verändert?
a = Lernrate des CS
wenn a groß ist (z.B.: 0,5) dann klassische Lernkurve, steiler Anstieg und dann abflachen und halten auf gleichem Niveau
Wenn a kleiner wird (z.B.: 0,1) dann steigt die Lernkurve langsamer an und flacht erst spät wieder ab
(siehe auch F. 29 & 30)
Die Nachahmung von motorischen Mustern ohne natürliches Ziel wird bezeichnet als... A) Echte Nachahmung B) Soziale Erleichterung C) Mimikry D) Emulationslernen
C)
RW-Modell: Formel
∆V = a *b * (1-V)
V = aktuelle Assoziationsstärke zwischen spezifischen CS & US
ΔV = Veränderung der Assoziationsstärke zwischen CS & US nach einem Lerndurchgang
a = Lernrate des CS zw. 0 -1 (ist abhängig von der Salienz des CS)
b = Intensität des US (abhängig von Merkmalen des US)
Maximale Stärke der CS-US Assoziation: hier auf 1 gesetzt
Lernzuwachs nimmt mit Stärke von V ab
Gelernte Angst
Der kleine Albert
klassische (und berüchtigte) Untersuchung von Watson und Rayner (1920):
Albert (9-13 Monate)
-> Keine Angst vor Tieren
Konditionierung
Mehrere Durchgänge: weiße Ratte gezeigt + Lärm
Ergebnis:
- Vermeidungsverhalten = Albert weint, wenn er nur die Ratte sieht
- Teilweise Generalisierung auf andere Tiere/Objekte mit
weißen Fell