Kapitel 4 "Sehen, Objektwahrnehmung und - erkennung Flashcards
was macht der Primäre visuelle Cortex?
der V1
- AUFFINDEN VON KANTENKANTEN, TEILE UND LÖCHER
- Gruppierung und Mustererkennung
- Trennung von Figur und Hintergrund
- Objekterkennung
was gehöt zum Extrastriären Cortex)
was ist ihre aufgabe?
- alle cortexbereiche die außerhalb des V1 liegen ( V2, V3, V4, etc.)
- v2, v3, v4 usw.. überlegen jetzt wie die vom v1 aufgefunden kanten zusammengehören. setzt die arbeit des VISUAL PROSESSING fort
was sit der “Was Pfaad”?
- verläuft ventral
- Objektidentifikation (endet im Temporallappen/IT Cortex)
- beschäftigt sich mit NAMEN UND BEDEUTUNG
was ist der “Wo Pfaad”?
- verläuft dorsal
- Objektlokalisation/Manipulation (Parietallappen/par. Cortex)Wo
- beschäftigt sich mit ORTEN & FORM VON OBJEKTEN und Handlungen,
- wichtig für Aufmerksamkeit
► Rezeptive Felder in extrastriären Arealen
sag was dazu
was sit der “ boundary/border ownership”
• Rezeptive Felder in extrastriären Arealen sind komplizierter als im striären Cortex
z.B. BOUNDARY/BORDER OWNERSHIP: welche Seite einer Grenze ist Teil des Objekt/Hintergrund?
► Rezeptive Felder in extrastriären Arealen
was macht das “ownership neuron (v2)”
offene frage… kein plan
es reagiert stärker und erkennt dass der schwarze fleck im kreis zum quadrat gehört.
► Inferotemporaler Cortex (IT)
was sit das ?
nach v2 v3 v4 … komt IT… sehr großes bild ( teil des was pfaades)
► Inferotemporaler Cortex (IT)
was ist eine laision in diesem zusammenhang?
- Laisionen im IT Cortex führen zu AGNOSIEN
Unfähigkeit, Objekte zu erkennen, obwohl man die Fähigkeit hat, sie zu sehen bzw. auf sie zu reagieren
Prosopagnosia
was ist das?
Unfähigkeit Gesichter zu erkennen
Klausurfrage!!!
Eigenschaften rezeptiver Felder von IT Neuronen (Einzelzellableitungen)
- sehr groß: einige decken (mehr als) die Hälfte des Gesichtsfeldes ab (↔ V1: sehr begrenzt)
- reagieren NICHT GUT AUF PUNKTE ODER LINIEN ((↔ V1: einfache Eigenschaften wie Linien)
- REAGIEREN GUT AUF KOMPLEXERE REIZE wie HÄNDE, GESICHTER, OBJEKTE (Zelle präferiert Klobürste)
homologe Regionen:
- Hirnregionen die scheinbar gleiche Funktion bei verschd. Arten haben
- funktion ist die eigene art zu erkennen. also affe hat zellen im It die affen besser erkennen können. fpferd-pfert etc.. homologe region im IT
► Grandmother cells (Großmutterzellen)
es gibt Zellen, die selektiv auf ein ganz SPEZIFISCHES OBJEKT ANTWORTET (für derartige Zellen steht Begriff)
- bsp schlangenform = gefahr = überleben = wichtig
- Andere Zellen haben Präferenz für andere Personen
- Zellen in den Hirnstrukturen des Temporallappens sind entscheidend für Objekterkennung
was ist holistische Verarbeitung?
was ist der unterschied?
erkennen von GesichterR (genau bezeichnung von merkmalen im gesicht: Augen,Nase,Mund)
- Unterschied: Bloße sammlung von Teilen (tastatur,bildschirm,box)
was bedeutet hardwired?
- hardwired heißt das mans seit der geburt kann. sonst muss man sie erlernen.
- bei v1 zellen kanne s so sein dass linienerkennung angeboren ist.
- IT Zellen müssen erlernt werden
Klausurfrage!!!!
ist die Objekterkennung schnell?
was ist der Feed Forward Process?
- Objektkategorisierung (z.B. belebt/unbelebt) kann in nur 150 ms vorgenommen werden
- Feed-forward-Prozess (ZU IMMER HÖHEREN EBENEN)
- Objektkategorisierung läuft eher linear ab (Retina → LGN → V1 → V2)
- erste Aktivierungswelle von Retina zu höheren Arealen ermöglicht grobe Objekterkennung
- EVOLUTIONSPSYCHOLOGISCH ERKLÄRBAR.
► das Problem der Objektwahrnehmung und -erkennung
- Gegenstand konstruieren: Punkte (Gangli.) → Linien (V1) → Ecke → … → Haus (≙ Prozesse!)
- man braucht erinnerungen
low-middle-High vision erklären!
- low/ early vision ist die erste stufe der visuellen verarbeitung.
- auf dieser stufe FILTERN GANGLIONZELLEN in der retina lgn zellen und v1 zellen, PUNKTE LINIEN UND KANTEN aus dem bild. - dann kommt middle vision. DIESE FÜGT LINIEN UND PUNKTE ZU REGIONEN OBERFLÄCHEN UND OBJEKTEN ZUSAMMEN,
- kann aber noch nciht die objekte erkennen
dazu gehört v2 v3 - high vision. objekterkennung
- und damit auch VERSTÄNDNIS VON DER SZENE.
- BALL - MENSCHEN = BALLSPIEL
► Auffinden/Konstruktion von Kanten (edges)
Illusorische Konturen:
Optische täuschung ( viele komische Kreise, Pfeil ist sichtbar)
- Kontur ist deutlich sichtbar, obwohl kein physikalischer Unterschied
- V2 zellen sagen es gibt dieses objekt (pfeil) , obwohkl die v1 zellen nicht diese info geliefert haben ( keine durchgängige kante
► Gestaltpsychologie
was sagt die Gestaltpsychologie?
“Das Ganze ist mehr als die Summe seiner Teile”
Klausurfrage!!!
was sind Heuristische Gestaltprinzipien (Gestaltgesetze)
- input strukturieren, unterteilen, gruppieren
- diese Regeln REFLEKTIEREN GESETZMÄSSIGKEITEN in Welt:
Klausurfrage!!!
► Gestaltprinzip: Prinzip des guten Verlaufs
- Linien so gesehen, als folgen sie dem EINFACHSTEN WEG (knicken nicht einfach ab)
- man gruppiert Kanten mit derselben Orientierung (setzt sie fort
Klausurfrage!!!
was bedeutet “Occlusion”
- Linie stoppt plötzlich? → wird durch anderes Objekt verdeckt (occluded)
- ist ein komplexer Prozess, den input in Objekte und Hintergrund zu teilen
Klausurfrage!!!!
► Gestaltprinzipien: Textursegmentierung und -gruppierung
- was bedeutet “Textursegmentierung”:
- Textursegmentierung basiert auf 2 Gestaltprinzipien für Gruppierung:
- was sind schwächere Gruppierungsprinzipien?
• Textursegmentierung: Ein Bild in Regionen gemeinsamer Textureigenschaften unterteilen
- Ähnlichkeit:
- nähe
schwächere Gruppierungsprinzipien
- paralletität
- symmetrie
► Gestaltprinzipien: Dynamische Gruppierungsprinzipien
- Gemeinsames Schicksal. zwei pinkte bewegen sich hinund her. der rest nicht
- Synchronizität: Gruppiere Elemente, die sich zur selben Zeit verändern
► Moderne Gestaltprinzipien
- gemeinsamme Region ( elemente werden als gruppe wahrgenommen)
- verbundenheit (connectedness)
- Tarnung ( Tiere nutzen dies um segmentierung zu verhindern )
Objektambiguität:
- Mehrdeutige Obj.
(Würfel vorne/ hinten? Treppe hoch/runter? Hase/Ente?
Necker Cube:
- mehrdeutiger würfel
Kippfigur. was bedeutet das?
- nicht beide Perzepte können gleichzeitig aktiv sein, bei Würfel beide ca gleich stark
Accidental viewpoint:
Accidental viewpoint:
Blick Position, die Regelmäßigkeit im vis. Bild produziert, die nicht real existiert.
was hilft bei der Wahrnehmung einer Ambiguität?
- WAHRSCHEINLICHKEIT: dass das 2D Bild zufällig Repräsentation der 3D Szene ist, ist so gering, dass das vis. System diese Möglichkeit nicht in Betracht zieht.
- IMPLIZITES PHYSIK-VERSTÄNDNIS
- Man muss von der KANONISCHEN ANSICHT schauen um sich nicht zu täuschen.
- Jedes bild ist Ambig. es kommt auf die perspektive an. bsp Bierflasche von oben.
► Gestaltprinzipien werden auch für FIGUR-GRUND-TRENNUNG genutzt:
6 punkte
Bezieht sich auf die frau/vase
- Umgebenheit
- Größe
- Symmetrie
- Parallelität
- Extremale Ränder
- Relative Bewegung
Es ist ein Komplizierter Prozess
► Umgang mit Occlusion/Verdeckung
– das Relatability-Prinzip
- was bedeutet Reliabilität?
- was geht bei Bei 3D Objekten?
- RELATABILITÄT = Der Grad, in dem 2 Linien Segmente als TEILE DER GLEICHEN KONTUR ERSCHEINEN
→ man vervollständigt verdeckte Kanten, wenn sie relatable sind
Bei 3D Objekten:
- T-junction: Verdeckt
- Y- & arrow-junction: gehören fast immer zu ECKEN, die keine Occlusion signalisieren
!!!
- Die junction-Typen SIND NONACCIDENTAL FEATURES (Eigenschaften eines Obj., die nicht von Betrachtungsposition abhängt;
► Die Teile und das Ganze
as ist der Global superiority effect (Navon, 1977)?
HHHCCCCLLLLLL
- Eigenschaften des ganzen Objektes haben Vorrang vor Eigenschaften von Teilen des Objektes:
HHHCCCCLLLLLL
► Zwischenfazit: middle level vision
5 Prinzipien vom Bild zum Objekt und seinen Teilen
- Fasse zusammen, was zusammengehört
- Unterteile, was unterteilt werden sollte:
- Nutze Vorwissen
- Vermeide Extreme und Zufälle:
- Suche Konsens, vermeide Ambiguität:
Formel der Bayerische Regel?
P(AlO) = P(A) x P(OlA)/(P(O)
Einflussfaktiren:
- Vermutung, welche reale Situation am ehesten zum beobachteten Reizmuster geführt hat
- Vorwissen wird berücksichtigt, ebenso wie aktueller Reiz
► High-Level Vision
Prozesse der Objekterkennung: Von low zu High
- Areale des menschlichen Kortex sind auf was genau spezialisiert?
- Bestimme die vorhandenen Merkmale innerhalb eines Bildes (“Low-level vision”)
- Gruppiere Merkmale zu Objekten (“Middle vision”)
- VERGLEICHE wahrgenommene mit enkodierten (gespeichert) Repräsentationen (“Highlevel“) (V4 Zellen )
- Areale des menschlichen Kortex sind auf Gesichter (FFA), Orte (PPA), Körperteile (EBA) und Bewegung (MT) spezialisiert. Zellen im Temporallappen antworten auf sehr spezifische Objekte (Quiroga)
BEI DER OBJEKTERKENNUNG geht es immer um welchen Pfaad?
- bei Objekterkeknnung gehts immer um den WAS PFAAD. ASPEKTE der high level vision.
- liegen zum teil im temporallappen
► Naive Template (Schablonen) Theory der Objekt Erkennung
was ist das für ne theorie?
- ich hab ne schablone für jedes bild was ich erkenne
- theorie kann nicht funktionieren weil man nicht unendlich viele schablonen hat die zu jedem winkel jedes einzelnen objektes passen.
► Theorie der puren strukturellen Beschreibung (structural description model)
- recognition-by-components (RBC, Biederman): Erkennung des Objektes durch die Identität & Beziehungen seiner Komponenten
- korrektes Modell liegt zwischen Extremen des template matching & strucutral description
► Multiple Recognition Committees – Ebenen der Objektkategorisierung
Man kann ein Objekt in verschiedenen Weisen (teilweise gleichzeitig) erkennen: was wird am schnellsten abgerufen?
und dann?
- Eingangsstufe: Vogel ( identifizierung ) meißt scheller wegen GEONS ( andere hirnregionen)
- Untergeordnete Kategorie: Spatz/Strauß (spezifischer) System für PRÄZISE DETAILS
- Übergeordnete Kategorie: Tiere (allgemeiner)
Man braucht dafür verschiedene gespeicherte Repräsentationen & andere Analysen/Kommitees
► Sonderfall der Gesichtserkennung
The Face Inversion Effect:
- Inversion & Verzerrung spielen keine Rolle um ein Gesicht als Gesicht zu identifizieren
- aber um es einer spezifischen Person zuzuordnen ist die PRÄZISE KONFIGURATION VON AUGEN, NASE & MUND UND DER BLICKWINKEL BESONDERS WICHTIG (AUFRECHTE GESICHTER SIND wesentlich einfacher zu erkennen als verkehrte)
- einige Hirnregionen/Verarbeitungsprozesse scheinen sich speziell für Gesichter zu interessieren:
- Zellen in der FFA (fusiform face area)
Prosopagnosie:
- Unfähigkeit zur Erkennung von Gesichtern