Lernen Flashcards
Universalismus
bestimmte Verhaltens- und Denkmuster sind universell und kulturell unabhängig
Funktionalismus
Verhaltens- und Denkmuster passen sich an die jeweilige Umwelt und kulturelle
Gegebenheiten an
Definition Lernen
ein Prozess, der zu relativ stabilen Veränderungen im Verhalten oder im Verhaltenspotenzial/der Verhaltensmöglichkeit führt und auf Erfahrung aufbaut
Nicht-Assoziatives Lernen
Einfacher Lernakt, bei dem nur Informationen über die Eigenschaften eines einzigen Reizes bekommen werden und das Verhalten daran orientiert wird
-> Es erfolgt keine Verknüpfung zweier Reize
- Sensitivierung
- Habituation
- Dishabituation
Assoziatives Lernen
Bildung neuronaler Verknüpfungen zwischen einem neutralen Reiz und einem zweiten Stimulus, der entweder positive oder negative Auswirkungen auf den Organismus hat
- klassische & operante Konditionierung
- auch Rückbildung von neuroyalen Verbindungen -> Effizienzsteigerung
Habituation
= Abnahme der Reaktionsbereitschft bei wiederholter Stimulusdarbietung
-> Reiz erweist sich als unbedeutend
-> wenn Reiz längere Zeit ausbleibt nimmt Reaktionsbereitschaft wieder zu
-> zentralnervöse Gewöhnung, nicht Ermüdung der Muskulatur etc.
-> Bsp.: Städtelärm, Parfum, …
Dishabituation
= Aufhebung einer Habituation; vollständige Auslösung einer zuvor
durch Habituation (Gewöhnung) verminderten oder vollständig ausbleibenden Verhaltensreaktion
-> durch längeres Ausbleiben/Präsentation eines neuen Reizes
-> Bsp.: Ändern des Hintergrundbilds am Handy
Sensitivierung/Sensibilisierung
Zunahme der Stärke einer Reaktion bei wiederholter Darbietung desselben Reizes
-> Gegenteil der Habituation
-> Bsp.: Schmerzempfinden, kratzender Pullover
Sensitivierung - State-System Theorie
der aktuelle State beeinflusst den Lernprozess
(State = die Kombination der
Faktoren Stimmung, Emotionen, Wahrnehmungen und körperliche Empfindungen)
-> Sensitivierung führt zu Veränderung des States und führt generell zu gehobener Bereitschaft auf Reize zu reagieren
synaptische Plastizität
wiederholte Aktivierung von Nervenzellen führt zu Verstärkung und gesteigerter Effektivität der Verbindungen
-> LTP
-> LTD
synaptische Plastizität - Experiment Rosenzweig, Bennet & Diamond
- untersuchten Auswirkung von Umweltreizen auf die Hirnentwicklung bei jungen Ratten
Experimentaldesign:
- Gruppe 1: 10-20 Tiere pro Käfig, viele Reize und Lerngelegenheiten (Gegenstände zum Spielen & Erforschen: Leitern, Labyrinthe, Räder etc.)
- Gruppe 2: 1 Tier pro Käfig ohne Sozialkontakt, reizarme Umwelt, weniger Möglichkeiten zum Spielen & Lernen
Ergebnisse:
- Gehirne der Ratten aus Gruppe 1 waren signifikant schwerer als die der Vergleichsgruppe
- Besonders deutliche Gewichtsunterschiede im zerebralen Kortex (-> Lernen)
- Gehirne der 1. Gruppe: signifikant ausgeprägtere kortikale Tiefe
- Verzweigung von Dendriten (Anzeichen für die Zunahme der synaptischen Verbindungen
zwischen Axonen und Dendriten)
- Vergrößerung der Synapsenoberfläche
Klassische Konditionierung - Pawlow
- Arbeite ursprünglich an einer Funktion zur Untersuchung von tierischen Drüsen, die an der Verdauung von Futter beteiligt sind.
- Jeder Reiz, der regelmäßig dem Fütterungsprozess vorgeschaltet war, führte zur selben Reaktion: Der vorzeitigen Speichelabsonderung
Klassische Konditionierung - Definition
Die Form des Lernens, bei der der Organismus durch wiederholte, zeitlich kontingente Darbietung von einem zunächst neutralen Reiz (CS) und einem bereits eine Reaktion auslösendem (unkonditioniertem) Stimulus (US) eine Assoziation (Verknüpfung) zwischen diesen bildet, sodass der CS die Reaktion schließlich auch allein auslöst
Unkonditionierter Reflex
- US & UR
- statt erlernte angeborene Reaktion auf Stimulus
CS - Konditionierter Stimulus/NS - Neutraler Stimulus
hat vor der Konditionierung keinen entsprechenden UR ausgelöst & kann erst nach Konditionierung entsprechende CR auslösen
CR - Konditionierter Reiz
wurde als Reaktion auf CS erlernt
ISI - Interstimulus Intervall
zeitlicher Abstand zwischen dem CS und dem einsetzen des US
Konditionierter Reflex
Verbindung zwischen Stimulus & Reaktion nicht angeboren sondern erlernt
Phasen der klassischen Konditionierung
- Kontrollphase
- Konditionierungsphase
- Auswirkungen der Konditionierungsphase
- Extinktion (Löschungsphase)
- Spontanerholung / Rekonditionierung
Phasen der klassischen Konditionierung - 1. Kontrollphase
- Überprüfung, ob US→UR
- Überprüfung, ob CS eine Orientierungsreaktion (OR) auslöst
- Überprüfung, ob CS schon →UR
Phasen der klassischen Konditionierung - 2. Konditionierungsphase
- CS + US, US = UR
- Wichtig: Zeitliche Beziehung zwischen CS und US (wird als Interstimulusintervall (ISI)
bezeichnet) - Dabei gilt das Gesetzt der Kontinuität: Räumlich (im Zusammenhang) und zeitlich (kurz
nacheinander) müssen CS und US mehrmals wiederholt auftreten.
Phasen der klassischen Konditionierung - 3. Auswirkungen der Konditionierungsphase
CS→CR
Phasen der klassischen Konditionierung - 4. Extinktion (Löschungsphase)
- CS x → US führt zu einer Abnahme der CR in ihrer Stärke, bis hin zu ihrer Löschung
Phasen der klassischen Konditionierung - 5. Spontanerholung / Rekonditionierung
- Nochmalige Darbietung von CS (ohne US) nach einiger Zeit löst erneute CR aus (Spontanerholung), wobei CR < als CR zu Beginn der Löschungsphase
Die Löschung einer CR ist kein Prozess des Vergessens, sondern kann als weitere Phase eines Lernvorgangs aufgefasst werden. Der Organismus lernt, dass CS und US nicht mehr gekoppelt sind, der Reiz verliert seinen Signalcharakter. Lässt man bloß Zeit vergehen, beeinflusst dies die Stärke einer CR nur gering.
Klassische Konditionierung - Generationalisierung
CR erfolgt auch auf Stimuli die dem CS ähnlich sind
-> je ähnlicher zu CS desto stärker die Reaktion
Klassische Konditionierung - Reizdiskrimination
bedingt dass Reaktion nur durch genau definierten Reiz und nicht durch ihm ähnliche Reize ausgelöst wird
Klassische Konditionierung - Diskriminationstraining
zwei ähnliche Reize werden in unregelmäßiger Folge dargeboten, nur auf einen erfolgt US - somit erfolgt lernen diese Reize zu unterscheiden
Klassische Konditionierung - Konditionierung höherer/zweiter Ordnung
CS1 wird zusammen mit CS2 dargeboten sodass dieser ebenfalls Reaktion hervorruft
Klassische Konditionierung - aktuelle Forschung - CS-US-CS oder CS-CR? (Kamin)
Kamin: CS-US-CR
- Experiment: Ratten zeigten andere Reaktionen auf CS (langsamerer Herzschlag, Anspannung, eingeschränkte Bewegung) als auf US (Stromschlag; kleine Sprünge, schnellerer Herzschlag)
* Die Reaktionen auf den CS unterscheiden sich also von denen auf den US und zeigen in diesem Falle eher eine angstvolle Antizipation als eine Fluchtreaktion
Weitere Hinweise auf die CS-US(-CR)-Verbindung
- Wird die Ausführung der UR verhindert (z.B. durch lokale Betäubung von Gliedmaßen), funktioniert die Konditionierung trotzdem (aus Pawlows Sicht sollte eine Kopplung nur entstehen, wenn die Reaktion tatsächlich erfolgt)
- sensorische Vorkonditionierung (präkonditionierung): Mehrmalige gemeinsame Präsentation neutraler Reize (CS1 und CS2) wird der klassischen Konditionierung von CS2 vorangestellt, die CS1 löst ebenfalls Reaktion aus
- Die CR entspricht selbst beim klassischen Pawlowschen Experiment nicht der UR, die Speichelzusammensetzung unterscheidet sich deutlich und ist bei der UR vergleichsweise enzymreicher
Bedingungen für effektive Konditionierung in der Werbung
- CS sollte in zeitlicher und räumlicher Nähe zum US dargeboten werden (Kontiguität), damit starke Assoziation entstehen kann
- Klassische Konditionierung ist am effektivsten, wenn der neutrale Reiz neu ist -> noch keine anderen Assoziationen vorhanden, die den Konditionierungsprozess stören können
- Die Verbindung zwischen neutralem und unkonditioniertem Reiz wird umso stärker, je öfter sie zusammen dargeboten werden
little Albert Experiment
Experiment: Angstkonditionierung
1. Albert wurden verschiedene Tiere gezeigt - Reaktion: neutral/interessiert (mochte weiße Ratte am liebsten)
2. weiße Ratte (US) wurde mit Knall/lautem Geräusch (CS) präsentiert
3. weiße Ratte löst Angstreaktion bei Little Albert aus
-> Fazit: Phobien sind konditionierte Reaktionen
systematische Desensibilisierung
- Methode zur Gegenkonditionierung
- angstauslösende Reize sollen mit Verhalten gepaart werden welches mit Reiz nicht kompatibel ist, z.B. Entspannung
- Bsp.: Droge mit Mittel verabreichen welches zu Übelkeit führt
Assoziatives Lernen - Geschmacksaversion Experiment Garcia & Koelling
2 Gruppen von Ratten, beiden Gruppen werden beim Wassertrinken gleichzeitig Reize dargeboten
* Gesüßtes Wasser (Geschmacksreiz)
* Töne und helles Licht (Audiovisueller Reiz)
Gruppe 1: Elektrische Schocks
Gruppe 2: induzierte Übelkeit
Verbinden sich Übelkeit und Schockreiz gleichermaßen mit den neutralen Reizen?
Ergebnis:
* Übelkeit wird mit Geschmacksreiz gekoppelt
* Elektrische Schocks mit audiovisuellem Reiz
Erklärung
* Preparedness (Seligman): Angeborene Vorbereitung (preparedness), bestimmte Arten von Verknüpfungen
eher zu bilden als andere.
Behaviorismus - Grundannahmen
- Verhalten resultiert aus vergangenen Lernerfahrungen, nur das Verhalten ist wissenschaftlich untersuchbar
- Lernen basiert auf dem Erwerb von Reiz-Reaktions-Verknüpfungen
Behaviorismus - Persönlichkeit
= Resultat der Verstärkergeschichte einer Person
-> Interpersonelle Unterschiede aufgrund unterschiedlicher Verstärkungserfahrungen
Thorndike
- Gründer des Behaviorismus
- untersuchte Lernprozesse an Tieren
- Kerngedanke: Lernen beruht auf Versuch und Irrtum, Lernen erfordert kein Bewusstsein
The law of effect - das Gesetz des Effekts
Belohnung fördert das Lernen von Verhalten, keine Konsequenz oder Bestrafung mindern es
- zuerst: planloses erkunden der Versuchsbox, Katze braucht lange Zeit um Lösung zu finden
- erste richtige Reaktion entsteht rein zufällig
The law of readiness - das Gesetz der Bereitschaft
Die Bereitschaft zum Lernen muss vorhanden sein. Lernen ist nur möglich wenn ein Individuum einen angenehmen Zustand herstellen oder einen unangenehmen Zustand vermeiden möchte.
Law of exercise - das Gesetz der Übung
die Verhaltensweise muss oft wiederholt werden um sie dauerhaft zu erlernen
betrifft einerseits die Verstärkung von Verknüpfungen durch Übung (Gesetz des Gebrauchs: law of use), andererseits deren Schwächung, also das Vergessen, wenn die Übung nicht fortgeführt wird (Gesetz des Nichtgebrauchs: law of disuse)
Skinner: operante Konditionierung
- Baut auf Arbeiten Thorndikes auf, nimmt aber an, dass situationsspezifisch gelernt wird
-> Operante Konditionierung / instrumentelles Lernen bezieht sich auf den Umstand, dass eine Verstärkung dann resultiert, wenn das Individuum richtig auf seine Umwelt einwirkt (operiert)
-> Durch die Verstärkung des Verhaltens wird dieses Verhalten intensiviert
* Verstärker: erhöht die Auftretenswahrscheinlichkeit eines
bestimmten Verhaltens
* Strafreiz: verringert die Auftretenswahrscheinlichkeit eines
bestimmten Verhaltens
* Neutraler Reiz: Hat keinen Einfluss auf die
Auftretenswahrscheinlichkeit eines bestimmten Verhaltens
Skinner box
- Magelzustand: Hunger -> große Grundbereitschaft zur Nahrungssuche
- Zufällige Betätigung eines Hebels (neuartige Verhaltensweise, Erkundungsverhalten)
- Roter Hebel: Stromschlag
- Gründer Hebel: Belohnung mit Futterkorn
- Einige Wiederholungen
- Erneuter Hunger: Zeigt erfolgreiches Verhalten sofort = positive Verstärkung der Verhaltensweise
Kontingenz:
* Beschreibt Zusammenhang zwischen Verhalten und nachfolgender Konsequenz
* Beziehung wirkt sich auf die Auftretenswahrscheinlichkeit des Verhaltens aus
Strategien zum Verhaltensaufbau - Fading
- Ziel: verschiedene Reize unterscheiden zu lernen
-> zusätzliche unterscheidende Reize werden schrittweise zurückgenommen - Eine Stimulusdiskrimination kann durch den zeitweisen Einsatz von „prompts“ (zusätzliche Hinweisreize) erreicht werden
- Folge: Differenzierte Wahrnehmung kleiner Unterschiede
Fading - Versuch von Ellen Reese (1966)
- Taube, die bereits gelernt hat, durch Picken auf Scheibe Futter zu erhalten, soll nur dann picken, wenn das Wort „peck“ an die Wand des Käfig projiziert wird. Bei dem Wort „don ́t peck“ soll sie dagegen nicht picken.
- Dies lernt die Taube dadurch, dass ein Picken auf die Scheibe nur dann zu einer Futtergabe führt, wenn der Reiz „peck“ erscheint. Pickt sie dagegen, solange „don ́t peck“ an der Wand zu sehen ist, erhält sie kein Futter.
- Um den Unterschied zwischen beiden Reizen „beizubringen“, werde beide Wörter zunächst sehr unterschiedlich gestaltet: „peck“ z.B. in großen schwarzen Buchstaben und „don ́t peck“ in kleinen roten Buchstaben. Durch diese zusätzlichen Hinweisreize (Farbe, Größe), ist es der Tauber leichter möglich, zwischen diesen beiden Wörtern zu unterscheiden.
- Die Unterschiede zwischen beiden Reizen werden zunehmend vermindert, bis beide Wörter gleich aussehen. Die Taube hält das Verhaltensmuster über alle Änderungen hinweg bei.
Shaping
= Methode der sukzessiven (stufenweisen) Annäherung an das gewünschte Endziel der Konditionierung
* Verhaltensweise nicht im natürlichen Verhaltensrepertoire, wird jedoch durch stufenweise Belohnung erreicht
Chaining
- Schrittweises Erlernen einer komplexen neuen Verhaltensweise durch Verkettung einfacherer Teile
- Erwünschte Verhaltensweisen werden hierzu in mehrere Teilglieder zerlegt, das letzte Verhalten der Kette wird
primär verstärkt - Das letzte Verhalten der Kette wird damit sekundärer Verstärker für die davorliegende Reaktion
- Jedes Glied der Kette wird zum diskriminativen Reiz für die nächste Reaktion und zum Verstärker für die
vorhergehende Reaktion
Prompting
- Es werden Signale zum Abruf bestimmter Gedächtnisinhalte gegeben um zu bestimmten Handlung zu veranlassen
operante Konditionierung - diskriminatives Belohnungstraining
- Verhalten erfährt nur dann eine positive Verstärkung, wenn der diskriminative Hinweisreiz (z.B. Licht) vorliegt
Untersuchungen mit aversiven Reizen:
* Beispielsweise Licht, bevor Stromstoß durch Käfiggitter erfolgt
* Ratte lernt, bei Aufleuchten des Lichtes von einem Käfig in den anderen zu fliehen
* Wen dies rechtzeitig geschieht, kann die den Schmerzreiz ganz vermeiden = aktives Vermeidungslernen
operante Konditionierung - Spontanerholung
Wird das Versuchstier nach einer Erholungsphase wieder in die Experimentalsituation zurückversetzt, lässt sich relativ zur Basisrate eine erhöhte Auftretenswahrscheinlichkeit des konditionierten Verhaltens feststellen. Diese Auftretenswahrscheinlichkeit ist jedoch keineswegs so hoch wie die nach der Trainingsphase beobachtete Wahrscheinlichkeit
Wirkung von Bestrafung - Estes
- Lernphase: 16 Ratten wurden in einer Skinner-Box mit elektifizierbarem Bodengitter ausgesetzt; wurden durch Futtergabe (zunächst kontinuierlich, später intermittierend) operant konditioniert, einen Hebel in der Box zu betätigen
-> Ergebnis: Stabil hohe Reaktionsfrequenz
- Löschungsphase:
a. 8 Tiere (EG) wurden nicht mehr verstärkt, sondern von der 5. bis zur 20. Minute bei Hebeldruck elektrisch geschockt.
b. 8 Tiere (KG) wurden während der gleichen Zeit für Helebdrüvken weder verstärkt noch bestraft (Löschung) - und 3. Löschungsphase: Verhalten beider Gruppen wurde weder verstärkt noch bestraft
Ergebnisse:
* Begrenzte Wirksamkeit: Verhalten wird lediglich unterdrückt; Spontanerholung bei Ausbleiben der Bestrafung
* Aufmerksamkeit wird auf unerwünschtes Verhalten gelenkt, anstatt Hinweise zu geben, wie gewünschtes
Verhalten aussehen soll
* Nebenwirkungen: Führt zu Frustration und Aggression oder zu generalisierter Angst und veranlasst das
Individuum dazu, die betreffende Situation (den Bestrafenden) zu vermeiden
Verstärkungspläne - primäre Verstärker
- Befriedigen physiologische Bedürfnisse, abhängig vom Zustand des Organismus (Deprivation!!)
- Wirken ohne vorhergehenden Lernprozess
- Z.B. Hunger, Durst
Verstärkungspläne - sekundäre Verstärker
- Werden durch häufige gemeinsame Darbietung mit einem primären Verstärker zu einem sekundären Verstärker (z.B. Geräusch im Futtermagazin, das Futter vorausgeht)
- Ermöglichen den Aufbau von Verhaltensketten (Chaining)
Verstärkungspläne - generalisierte Verstärker
- Beziehen ihre Wirksamkeit aus der Verknüpfung mit mehreren primären und sekundären Verstärkern (z.B. Geld, Status)
das Premack Prinzip
besagt dass jedes Verhalten ein potentieller Verstärker sein und ein anderes Verhalten motivieren
- Ein Verhalten mit höherer Auftretenswahrscheinlichkeit (eine bevorzugte Handlung) kann davon abhängig gemacht werden, dass ein Verhalten mit relativ niedriger Auftretenswahrscheinlichkeit gezeigt wird
- Das (zu einem gegebenen Zeitpunkt) wahrscheinlichere Verhalten wird zum Verstärker für das unwahrscheinlichere Verhalten
kontinuierliche Verstärkungspläne
Verstärkung jeder gewünschten Reaktion
intermittierende Verstärkungspläne