VL 6: Objektwahrnehmung Flashcards

1
Q

Welche Schwierigkeiten ergeben sich bei dem Versuch die menschliche Fähigkeit zur Objekterkennung in Computer zu programmieren?

A
  • Objekt- und Formwahrnehmung scheinen völlig mühelos, sind aber kompliziert (z.B. für Computer)

Probleme:
1. 2D ind 3D Repräsentationen “rück”transformieren
2. Entscheiden, ob Konturen, die sich treffen, zu einem oder zu verschiedenen Objekten gehören
3. Verborgene Objektteile bestimmen und ergänzen
-> “Objektdedektoren”: bisher wurden noch keine gefunden, möglicherweise aufgrund verteilter Speicherung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Problem der inversen Projektion

A

Der Stimulus an den Rezeptoren ist mehrdeutig.

Verschiedene Objekte erzeugen je anch Winkel das gleiche Abbild auf der Retina.

Trotzdem können Menschen problemlos zwischen den Formen/Winkeln der Objekte unterscheiden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was ist die grundlegende Annahme der Gestaltpsychologie und gegen welche Denkströmungen richtet sie sich damit?

A

Gestaltpsychologie: Forschungsansatz der um 1900 entstand. Betont das Erleben von Ganzheit als Forschungsgegenstand.
- Aristoteles: “Das Ganze ist mehr als die Summe seiner Teile.” (Beispiel: Scheinbewegung)
- Als Alternative zum Strukturalismus
- (Was ist Strukturalismus (seeehr vereinfacht): Ganzes ist nicht mehr als Summe seiner Teile; Wahrnehmung ist nur Kombination elementarer Empfindungen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Welche 7 Gestaltgesetze kennst du?

A
  • Gesetz der guten Gestalt (Prägnanz)
  • Gesetz der Nähe
  • Gesetz der Ähnlichkeit
  • Gesetz der guten Fortsetzung/des guten Verlaufs
  • Gesetz des gemeinsamen Schicksals
  • Scheinbewegung
  • Gesetz der Bedeutungshaltigkeit/Vertrautheit
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Stelle das Gesetz der guten Gestalt (Prägnanz) dar!

A

Jedes Reizmuster wird so gesehen, dass die resultierende Struktur möglichst einfach ist.

Beispiel: Bei zwei überlappenden Kreisen werden 2 Objekte wahrgenommen, nicht 3 (Schnittfläche wird nicht als Objekt wahrgenommen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was besagt das Gesetz der Ähnlichkeit?

A

Ähnliche Reize gruppieren sich.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Beschreibe das Gesetz der guten Fortsetzung!

A

Punkte, die, wenn verbunden, Geraden oder leicht geschwungene Linien ergeben, scheinen zusammenzugehören und Linien werden so gesehen, dass sie dem Weg des geringsten Widerstandes folgen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was besagt das Gesetz der nähe?

A

Objekte, die nah beieinander stehen, werden als Gruppe gesehen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Stelle das Gesetz des gemeinsamen Schicksals dar!

A

Reize, die sich in die gleiche Richtung bewegen, erscheinen zusammengehörig.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was besagt das Gesetz der Bedeutungshaltigkeit/Vertrautheit?

A

Elemente bilden eher Gruppen, wenn sie bedeutsam oder vertraut wirken.

Beispiel: Person wird erkannt, obwohl sie von Wand verdeckt wird (Striche die zur Zeichnung des Kopfes gehören werden nicht der Wand zugehörig empfunden, sondern gruppiert als “Mensch”)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Bewerte die Gestaltgesetze

A
  • Bessere Bezeichnung: Gestaltprinzipien. -> beste Bezeichnung: Gestaltheuristiken
  • Heuristik: die Kunst, mit begrenztem Wissen und wenig Zeit zu guten Lösungen zu kommen (= Daumenregel)

Positiv: Optimale Passung an Umwelt (schnell, einfach, meistens richtig)

Kritik:
- Gestalttheorie ist beschreibend, nicht erklärend
- trennt nicht zwischen Alternativen
- Konflikt zwischen Gestaltgesetzen: Anwendbarkeit auf das reale Leben ist fragwürdig (-> denn: im Alltag lassen sich auf einzelne Situationen eine Menge Gestaltgesetze anwenden. Es stellt sich die Frage: “Welches Gesetz überwiegt?”)

Unklarheit, welches Gesetz überwiegt:
- Z.B. sehen wir ein Papier, welches ein anderes Papier verdeckt. Aber: dem Gesetz der Einfachheit nach müssten wir ein Kopfstehendes L sehen und ein Rechteck. Dem Gesetz der Vertrautheit nach nimmt man jedoch zwei Papiere wahr.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Nenne ein Beispiel für neuere Forschung zu den Gestaltgesetzen!

A

Frage: Welche Stimulus-Eigenschaften sind für die Gruppierung verantwortlich?

Beispiel aus der Folie: 3 Symbole sidn gruppeirt (T, schräges T, L). Frage an Vpn: Was ähnelt sich mehr?
-> Olson & Attneave: Orientierung ist entscheidend (wenn gruppiert; ansonsten Gruppierung nach Buchstaben)

-> somit: unklar, welches Gestaltgesetz überwiegt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Perzeptuelle Gliederung - wie trennen wir visuelle Objekte?

A
  • Figur-Grund
  • Rolle der Aufmerksamkeit
  • Geone (Biedermann)
  • Algorythmischer Ansatz (David Marr)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Anhand welcher 4 Anhaltspunkte erfolgt eine Figur-Grund-Unterscheidung?

A
  1. Eine Figur hat eher Objektcharakter als der Grund und wird besser behalten
  2. Die Figur wird vor dem Grund gesehen
  3. Der Grund ist kein konformes Material und scheint sich hinter der Figur auszudehnen
  4. Die Kontur, welche Figur und Grund trennt, geört offensichtlich zur Figur
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was sind 5 Eigenschaften von Figuren, die uns helfen die Figur vom Grund zu unterscheiden?

A

Faktoren, die zur Figurbildung beitragen (= Faktoren, die die Wahrscheinnlichkeit erhöhen, dass ein Gebiet als Figur gesehen wird.

  1. Symmetrie
  2. Konvexität (übertrifft Symmetrie)
  3. Geringere Größe
  4. Orientierung (senkrecht oder waagerecht)
  5. Bedeutung
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Wie beeinflusst Symmetrie die Figur-Grund Unterscheidung?

A

Symmetrische Objekte werden eher als Figur wahrgenommen.

17
Q

Wie wirkt sich Konvexität auf die Figur-Grund-Unterscheidung aus?

A
  • konvexe Formen eher als Figur wahrgenommen
18
Q

Welchen Einfluss hat Bedeutung auf die Figur-Grund-Unterscheidung?

A

Formen mit Bedeutung werden eher als eine Figur wargenommen.

19
Q

Stelle ein Experiment dar, welches veranschaulicht, dass die Figur eingehender analysiert wird als der Grund!

A
  • Julesz (1978): In der Figur werden mehr Details gesehen
  • Weisstein & Wong (1986) bestätigten dies an Rubins Kelch:
  • Projektion vertikaler und gekippter Linien auf Zeichnung von Rubins Kelch
  • Frage an Vpn: Gerade oder gekippte Linie? Was erscheint als Figur?

-> Antwort um das dreifache korrekter, wenn die Linie auf der als Figur erkannten Form erschie.

20
Q

Gibt es im V1 Neurone für die Figur-Grund-Unterscheidung? (Experiment)

A
  • Reize wurden so präsentiert, dass im rezeptiven Feld eines Neurons im V1 jeweils exakt der gleiche visuelle Input gegeben war
  • UV: variiert, ob auf das rezeptive Feld die visuellen Reize einer Figur oder vom Grund fielen
  • Ergebnisse: Neurone feuern nur, wenn sie eine Figur im rezeptiven Feld haben

Neurone im V1 sollten gar nicht zwischen Figur/Grund unterscheiden können (visueller Input immer der gleiche)
-> Lösung: V1 selbst zwar für simple Verarbeitung zuständig, erhält jedoch Info aus höheren Arealen (Feedbackproektion: dadurch können Neurone im V1 zwischen Figur/Grund unterscheiden)

21
Q

Welche Stufen der Aufmerksamkeit unterscheidet Treisman?

A

Präattentiv:
- automatisch, schnell, Extraktion elementarer Reizkomponenten (Primitive)

Fokussiert:
- nicht automatisch, erfordert Aufmerksamkeit, Kombination der Primitive

22
Q

Welche 8 Primitive unterscheidet Treisman?

A

Primitive: Elementare Reizkomponenten

  • Kurven
  • Orientierung
  • Farben
  • Begrenzung von Linien
  • Bewegung
  • Geschlossenheit von Flächen
  • Kontrast
  • Helligkeit
23
Q

Stelle ein Experiment zur visuellen Suche nach Treisman dar!

A

Methode:
- pop-out Bedingung: eindeutig erkennbarer Zielreiz “O” unter vielen Distraktoren “V” gemischt
- non-pop-out Bedingung: weniger erkennbarer Zielreiz “R” unter viele Distraktoren “P” und “Q” gemischt
-> Proband soll jeweils den Zielreiz finden

Ergebnis:
- pop-out Bedingung: Reaktionszeit unabhängig von Anzahl der Distraktoren -> parallele Verarbeitung
- non-pop-out Bedingung: Vpn braucht länger, je mehr Distraktoren vorhanden sind -> serielle Verarbeitung (d.h. jeder einzelne Stimuli wird nacheinander geprüft; fokussierte Aufmerksamkeit nötig)

24
Q

Beschreibe das Phänomen der fälschlichen Kombination!

A

Fälschliche Kombination = illusionary conjunction

  • kurzzeitige Darbietung mehrerer Reize (z.B. rotes S, grünes X, blaues T)
  • Primitive werden z.T. falsch kombiniert (ca. 1/3 der Fälle)
  • Vpn könnten z.B. antworten, ein rotes X gesehen zu haben
    -> jedes Primitiv existiert also im präattentiven Stadium völlig unabhängig
25
Q

Stelle ein Experiment dar, welches die Unterscheidung nach Treisman in präattentive und fokussierte Verarbeitung stützt!

A

Experiment, bei welchem zwei Bedingungen manipulieren, on präattentiv bzw. fokussiert evrarbeitet werden muss
-> Unterschiede in den Leistungen geben Hinweise auf zwei Verarbeitungsprozesse

Bedingung 1 (präattentiv) - “Merkmalssuche”
- kurze Darbietung: ein grünes X, viele rote O, viele blaue X
- Frage: Ist ein günes X vorhanden? Wenn ja, wo?
Ergebnisse:
- Präsenz wurde leicht bestimmt, Lokation nur schwer
-> Schlussfolgerung: Präsenz ist durch ein Primitiv (hier Farbe) zu bestimmen (da nur ein grünes Objekt präsentiert wurde, reicht ein Primitiv (“grün”))
-> keine fokussierte Aufmerksamkeit notwendig
-> keine Bestimmung der Lokation

Bedingung 2 (fokussiert) - “Konjunktionssuche”
- kurze Darbietung: ein blaues O, viele blaue X, viele rote O
- Frage: Ist ein blaues O vorhanden? Wenn ja, wo?
Ergebnisse: Präsenz und Lokation wurden leicht bestimmt (dauert aber länger) -> Lokation automatisch mitbestimmt
Schlussfolgerung
- Aufgabe erfordert mehr Aufmerksamkeit
- Objekt mit zwei Eigenschaften soll identifiziert werden (O und blau) -> Lokation automatisch bestimmt

26
Q

Was sind grundlegende Annahmen von Biedermanns “Recognition-by-Components” - Theorie?

A

Auf Deutsch: Erkennung durch Komponenten
- Geometric Icons (Geons) sind hypothetische primitive Körper, Basiskomponenten, aus denen viele (alle?) Körper gebildet werden
- Biedermann unterscheidet 36 Geons, wobei jedes durch ebstimmte Merkmale gekennzeichnet ist und sich aus (fast allen) Blickwinkeln von anderen unterscheidet!

Prinzip der Komponenten = Principle of Componential Recovery
-> können die Geone eines Objektes identifiziert werden, wird das Objekt schnell und richtig erkannt

27
Q

Gibt es Evidenz für Biedermanns Annahmen?

A

1. Objekte in ungewöhnlicher Perspektive: schlechtes Erkennen von Objekten, wenn in einer Perspektive nicht alle Geone eines Objekts zu sehen sind
2. Wenige Geone genügen zur Identifikation
3. Bei kurzzeitiger/halbverdeckter Darbietung: Erkennensleistung steigt mit der Zahl der Geone

28
Q

Zwei Merkmale der Theorie des algorithmischen Ansatzes von Marr

A

Die Theorie:
1. ist modular (d.h. sein Modul “löst” ein bestimmtes Problem der Wahrnehmung; ein Output ist der Input des nächsten)
2. hat eine starke Betonung von bottom up-Prozessen (aber keine Leugnung von top down-Prozessen): d.h. dass das Objekt erst in seine Einzelteile (bzw. Elementarteile) zerlegt wird und diese anschließend verarbeitet werden, ohne Vorwissen über die Bedeutung des Gegenstandes einzubeziehen.

29
Q

Der algorithmische Ansatz von David Marr (grob)

A

Marr geht in seinem Ansatz davon aus, dass Wahrnehmung in mehreren Stufen abläuft. In diesen Prozessstufen wird der proximale Reiz (= das Netzhautbild) mathematisch analysiert. Am Ende der Verarbeitung resultiert eine dreidimensionale Repräsentation des realen Gegenstandes.

Netzhautbild -> über Merkmalsextraktion zu primärer Rohskizze -> über Tiefeninformationen zur 2,5D Skizze -> durch Gestaltprinzipien zur 3D Modellrepräsentation (dann schließlich vergleich mit Objektmodellen im Gedächtnis, wenn Überienstimmung -> erkennen)

Alles unbewusst bis auf Ergebnis (Wahrnehmung des Objektes).

30
Q

Algorithmischer Ansatz - Primäre Rohskizze

A

Primäre Rohskizze: 2D Beschreibung von Kanten, Ecken, dunklen/hellen Bereichen und Konturen.

2D Netzhautbild als Input für primäre Rohskizze -> durch Merkmalsextraktion Bildung der Primären Rohskizze

Ziel: Identifikation der Elementarmerkmale (wie Kanten, Konturen, Flächen) des Gegenstandes. Erreicht durch: Analyse des zugehörigen Netzhautbildes nach Intensitäts- bzw. Helligkeitsunterschieden (mit Hilfe der “zerocrossings”)

Zerocrossings: Berechnung der “Zerocrossings” kann man sich approximativ vorstellen als Anwendung von neuronalen Filtermechanismen.

31
Q

Algorithmischer Ansatz - 2,5D Skizze

A

Wird unter Zuhilfenahme von Tiefeninformationen erstellt.
Enthält keine Informationen über nicht sichtbare Tiefe.

  • zweite Stufe des Objekterkennungsprozesses
  • globale Flächen der Rohskizze unter den Gesichtspunkten der Tiefe und Orientierung verarbeitet
    -> zustande kommendes 2,5D Bild: subjektzentrierte Reizstruktur (d.h. eine Reizstruktur, welche vom Blickwinkel des Beobachters abhängig ist)
32
Q

Algorithmischer Ansatz: 3D-Modellrepräsentation

A

Ist (perspektivisch) beobachterunabhängig. (-> Objektzentriert)

  • erstellt mit Hilfe der Gestaltprinzipien

ZurIdentifikation des Gegenstandes: abgeleitetes 3D-Modell vergleichen mit im Gedächtnis abgespeicherten Objektmodellen
- nur das Ergebnis dieses Stadiums (Wahrnehmung des Objektes) ist dem Betrachter bewusst.

33
Q

Problem am algorithmischen Ansatz von Marr

A

Problem: Wie kann man eine Interne Repräsentation von Objekten erreichen, die perspektivunabhängig ist, aber weitgehend bottom up erzielt wird?

Vorschlag von Marr: 3D-Modell enthält Hierarchie von objekt-zentrierten Achsen
-> Primitive (=einfachste Einheiten) zu internen Repräsentationen von Objekten sind laut Marr Zylinder, deren Hauptachsen die Ausrichtung des Objektes (bzw. des Objektteiles) repräsentiert. Diese Primitive sind hierarchsich organisiert.

34
Q

Mit welchen Fragen beschäftigt sich moderne Forschung zur Objektwahrnehmung?

A
  • erkennen vs. wahrnehmen
  • Phänomenales Erleben vs. Stimulusinformationen
  • Neuropsychologische Perspektive