Operante Konditionierung Flashcards
Was ist operantes Konditionieren und wie unterscheidet es sich von klassischem Konditionieren?
Operante Konditionierung= ist ein Lernprozess, bei dem Verhalten durch Konsequenzen geformt wird. Es basiert auf der Idee, dass Verhalten durch Belohnungen oder Bestrafungen verstärkt oder abgeschwächt werden kann. Der Prozess des operanten Konditionierens beinhaltet die Verknüpfung von Verhalten mit Konsequenzen, um die Wahrscheinlichkeit des Auftretens dieses Verhaltens in Zukunft zu erhöhen oder zu verringern.
- die Ereignisse (Konsequenzen) sind abhängig von der Ausführung von Verhalten
- Das Verhalten entscheidend dafür, welche Konsequenzen folgen (oder nicht)
- Instrumentelles Lernen: Verhalten als „Instrument“, um bestimmte Konsequenzen herbei zu führen
- Organismus reagiert nicht (nur) auf Reize in der Umwelt, sondern führt ein (instrumentelles) Verhalten aus, um eine bestimmte Konsequenz herbeizuführen (die sonst nicht aufgetreten wäre).
- Operant = Beeinflussung der Umwelt durch Lernen
Unterschiede:
1.Art des Lernens:
-Klassisches Konditionieren ist assoziatives Lernen, bei dem eine Verbindung zwischen zwei Reizen hergestellt wird.
-Operantes Konditionieren ist verhaltensbasiertes Lernen, bei dem die Folgen eines Verhaltens die Wahrscheinlichkeit beeinflussen, dass das Verhalten in der Zukunft auftritt.
2. Beispielhafte Reaktionen:
- Beim klassischen Konditionieren wird eine natürliche Reaktion (z.B. Speichelfluss) durch einen neuen Reiz ausgelöst.
- Beim operanten Konditionieren wird ein Verhalten durch Verstärkung oder Bestrafung geformt und aufrechterhalten.
3. Rolle des Individuums:
- Beim klassischen Konditionieren ist das Individuum passiv und reagiert automatisch auf Reize.
- Beim operanten Konditionieren ist das Individuum aktiv und zeigt ein Verhalten, um bestimmte Konsequenzen zu erreichen oder zu vermeiden.
Erklären Sie folgende Begriffe und geben Sie je ein Alltagsbeispiel sowie ein
psychologisch relevantes Beispiel dazu:
Negative Verstärkung, positive Verstärkung, Bestrafung 1. Art und Bestrafung 2. Art
- Positive Verstärkung: Bestärkung eines Verhaltens durch hinzufügen eines angenehmen Reizes
- Psychologisch relevantes Beispiel: Ein Angestellter erhält ein Lob und eine Bonuszahlung vom Chef für die erfolgreiche Durchführung eines Projekts. Das Hinzufügen der Belohnung (Lob und Bonuszahlung) verstärkt das Verhalten der erfolgreichen Projektdurchführung. - Negative Verstärkung: Bestärkung eines Verhaltens durch Entfernung eines unangenehmen Reizes
- Psychologisch relevantes Beispiel: Ein Student bekommt von seinem Lehrer eine Hausaufgabe, die er erledigen muss, um eine schlechte Note zu vermeiden. Das Entfernen der drohenden Bestrafung (schlechte Note) verstärkt das Verhalten des Hausaufgabenmachens. - Bestrafung 1. Art: Abschwächung eines Verhaltens durch hinzufügen eines negativen Reizes
- Psychologisch relevantes Beispiel: Ein Schüler spricht im Unterricht und wird vom Lehrer zurechtgewiesen. Das Hinzufügen der unangenehmen Zurechtweisung soll das Verhalten des Sprechens unterbrechen. - Bestrafung 2. Art: Abschwächung eines Verhaltens durch entfernen eines angenehmen Reizes
- Psychologisch relevantes Beispiel: Ein Mitarbeiter verhält sich unangemessen am Arbeitsplatz und wird von seinem Chef für eine Woche ohne Bezahlung suspendiert. Das Entfernen des angenehmen Gehalts soll das unangemessene Verhalten reduzieren.
Welche Verstärkerpläne gibt es und wodurch unterscheiden sie sich?
- Fixierte Quotenpläne (fixed ratio, FR)
= Verstärkung erfolgt nach einer festgelegten Anzahl von Reaktionen (Quote)
=> FR-1-Plan: Verstärkung nach jeder Reaktion
=> FR-10-Plan: Verstärkung nach jeder 10. Reaktion
=> FR-20-Plan: Verstärkung nach jeder 20. Reaktion
- Schneller Erwerb neuer Verhaltensweisen (insbesondere im FR-1-Plan); aber auch schnelle Löschung, wenn Verstärker wegbleibt.
- Aber: Ist Verhältnis zwischen Handlung und Verstärkung zu gering, kann das den Lernprozess behindern, da geringe Kontingenz zwischen Handlung und Konsequenz besteht (z.B. wenn nur jede 100. Reaktion verstärkt wird (FR-100 Plan), findet kein/kaum Lernen statt).
Bsp.: Verkäufer, die nach fixer Anzahl verkaufter Produkte bezahlt werden. - Variable Quotenpläne (variable ratio, VR)
= Verstärkung erfolgt im Mittel nach einer festgelegten Anzahl von Reaktionen
=> VR-10-Plan: Verstärkung im Durchschnitt nach jeder 10. Reaktion
=> VR-20-Plan: Verstärkung im Durchschnitt nach jeder 20. Reaktion
- VR-Pläne erzeugen die höchste Auftretenswahrscheinlichkeiten und höchsten Löschungswiderstand.
Bsp.: Glücksspielautomat - Fixierte Intervallpläne (fixed intervall, FI)
= Verstärkung erfolgt nach einem bestimmten Zeitintervall nach der ersten Reaktion
=> FI-10-Plan: Verstärkung erfolgt nach der ersten Reaktion nach 10 Zeiteinheiten (unabhängig davon, wie viele Reaktionen in der Zwischenzeit gezeigt wurden)
=> FI-20-Plan: Verstärkung erfolgt nach der ersten Reaktion nach 20 Zeiteinheiten (unabhängig davon, wie viele Reaktionen in der Zwischenzeit gezeigt wurden) - Reaktionsraten passen sich an: Unmittelbar nach Verstärkung kaum Reaktion, gegen Ende des Zeitintervalls verstärkte Reaktionen.
Bsp.: Tiefkühlpizza im Ofen, Timer auf 10min: in den ersten 9 Minuten schauen Sie kaum nach, zum Ende der Zeit um so öfter. - Variable Intervallpläne (variable interval, VI)
= Verstärkung erfolgt nach einem bestimmten mittleren Zeitintervall nach der ersten Reaktion
=> VI-10-Plan: Verstärkung erfolgt nach der ersten Reaktion nach im Durchschnitt 10 Zeiteinheiten (unabhängig davon, wie viele Reaktionen in der Zwischenzeit gezeigt wurden)
=> VI-20-Plan: Verstärkung erfolgt nach der ersten Reaktion nach im Durchschnitt 20 Zeiteinheiten (unabhängig davon, wie viele Reaktionen in der Zwischenzeit gezeigt wurden)
- Mäßige, aber stabile Verhaltensrate; Löschung üblicherweise langsamer als unter fixierten Intervallplänen
Bsp.: Lehrer macht gelegentlich und in unregelmäßigen Abständen Vokabeltest
Was sind primäre und sekundäre Verstärker?
Primäre Verstärker= sind Biologisch determinierte Verstärker, wie z.B. Nahrung, Wasser, Schmerz
Sekundäre= sind konditionierte oder kulturelle Verstärker z.B. Geld
Was ist ein diskriminativer Stimulus?
Diskriminative Stimuli= sind Reize mit Signalcharakter.
Sie zeigen dem Organismus an, ob ein Verstärker (oder eine Bestrafung) folgen wird, wenn eine bestimmte Reaktion ausgeführt wird.
Bsp. Ampel
Was ist shaping und chaining?
Shaping = ist die Schrittweise Annäherung an gewünschtes Verhalten durch Verstärkung
Chaining = Erlernen komplexer Verhaltensweisen indem Zielverhalten in einzelne Teilschritte „zerlegt“ wird, die dann verstärkt und miteinander verknüpft werden
Was ist der sog. instinctive drift und wie interagiert er mit operanter Konditionierung?
Instinctive drift (Instinktverschiebung): „Eindringen“ natürlicher Verhaltensweisen in das durch shaping und chaining operant konditionierte Verhalten.
Es zeigt die Grenzen bzw. Biologische Einschränkung der Lernmöglichkeiten bei beispielsweise operanter Konditionierung. Die Passung zwischen Verhalten und Verstärkung ist wichtig damit Konditionierung funktioniert.
Was ist time-out, wie funktioniert es und was muss man beachten?
Time-out ist eine Form der operanten Konditionierung. Es wird ein angenehmer Stimulus entfernt, um eine Verhaltensform abzuschwächen (Bestrafung 2. Art).
Die Funktionsweise von Time-out besteht darin, dass das Kind für eine kurze Zeit an einen ruhigen und langweiligen Ort gebracht wird, fern von positiven Verstärkern wie Spielzeug, elektronischen Geräten oder sozialer Interaktion. Dies soll dem Kind eine Gelegenheit zum Nachdenken über sein Verhalten geben und ihm die Möglichkeit bieten, sich zu beruhigen und neu zu fokussieren.
Bei der Umsetzung von Time-out müssen mehrere Dinge beachtet werden:
1. Klare Regeln und Erklärungen: Das Kind sollte im Voraus wissen, welche
Verhaltensweisen zu einem Time-out führen und warum es angewendet wird.
2. Konsistenz: Time-out sollte konsequent angewendet werden, damit das Kind lernt, dass bestimmte Verhaltensweisen immer zu dieser Konsequenz führen.
3. Angemessene Dauer: Die Dauer des Time-outs sollte altersgerecht sein und das Kind nicht überfordern. Typischerweise wird empfohlen, dass die Dauer des Time-outs eine Minute pro Lebensjahr des Kindes beträgt.
4. Ruhe und Sicherheit: Der Ort des Time-outs sollte ruhig, sicher und frei von Ablenkungen sein, damit das Kind sich auf das Nachdenken über sein Verhalten konzentrieren kann.
5. Nachbesprechung: Nach dem Time-out ist es wichtig, mit dem Kind zu sprechen, um das unerwünschte Verhalten zu besprechen, alternative Verhaltensweisen zu erörtern und die Beziehung zu stärken.