02 - Kamerakalibrierung Flashcards
Was versteht man unter Kamerakalibrierung?
Man versucht eine mathematische Beziehung zwischen 2D Bildpositionen und der 3D Szenengeometrie zu finden. Man erhält eine Formel für die Abbildungsgleichung der Kamera.
Was braucht man für die Kamerakalibrierung?
- Fotografiere ein Objekt mit exakt bekannter Geometrie
- Lokalisiere Merkmalspunkte im Bild
- Bilde Paare von 2D und 3D Koordinaten
- Berechne Kameraparameter
Welche Kameramodelle gibt es?
Perspektivische Projektion und Parallelprojektion bzw. Orthografische Projektion
Was ist die perspektivische Projektion?
- Sehstrahlen verlaufen durch Projektionszentrum
- Winkel eines Strahles in den Raum wird auf 2D Position im Foto abgebildet
- Bilder paralleler Linien konvergieren in Fluchtpunkt
Was ist die Parallelprojektion/ Orthografische Projektion?
- Parallele Sehstrahlen, z.B. immer senkrecht zur Bildebene
- Gilt näherungsweise, wenn Objekte klein gegenüber ihrer Entfernung sind (Teleobjektiv)
- Spezialfall: orthografische Projektion
Was ist wichtig über die Lochkamera?
- 3D Geraden werden auf 2D Geraden abgebildet
- Winkelerhaltend für jede Ebene parallel zur Bildebene
- Doppelter Objektabstand -> Halbe Bildgröße
- Doppelte Brennweite -> doppelte Bildgröße
- Kamerarotation um das Projektionszentrum in beliebiger Richtung führt zu einfacher 2D Verschiebung der Punkte in der Bildebene
- 3D Objekttranslation führt zu komplizierter Änderung der Perspektive
Was sind die Vorteile der Lochkamera?
- Einfach zu beschreiben
- Ideale geometrische Abbildung
- Fokussierung kein Problem, da Brennweite eigentlich nur Bildweite
Was sind die Nachteile der Lochkamera?
- Geringe Lichtausbeute
- Beugung der Lichtwellen am Loch führt zu Unschärfe
- Bei zu großer Öffnung: ebenfalls Unschärfe (Faltung mit Bild des Loches)
Was ist Brechung?
- Strahlenoptischer Effekt
- An Grenzflächen zweier Medien mit unterschiedlichem Brechungsindex
Was ist Beugung?
- Wellenoptischer Effekt
- Erfolgt an allen Strukturen des Raumes, also an Kanten und Blenden
- Begrenzt die Auflösung eines optischen Systems (deswegen baut man Spiegelteleskope mit großen Durchmesser)
Wie lautet die Definition für die Brennweite f?
Die Brennweite f definiert den Abstand von der Linsenebene, in dem parallele ankommende Strahlen konvergieren.
Was macht man gegen Linsenfehler?
Man baut Objektive aus einer Kombination vieler Linsen, die sich gegenseitig korrigieren
Welche Linsenfehler gibt es?
- Chromatic Aberration
- Spherical Aberration
- Distortion
Was ist Chromatic Aberration?
Ein Linsenfehler, bei dem die Linse verschiedene Werte für die Brennweite f für verschiedene Farben hat
Was ist Spherical Aberration?
Ein Linsenfehler, bei dem die Linse eine falsche Form hat
Was ist Distortion?
Ein Linsenfehler, bei dem ein rechteckiges Grid nicht korrekt auf ein rechteckiges Grid gemapped wird
Was bestimmt die Brennweite f?
Die Brennweite f bestimmt nur den Abbildungsmaßstab (= simple 2D Skalierung). Erfolgt durch drehen am Zoom-Objektiv.
Was bestimmt der Kameraabstand z?
Der Kameraabstand z bestimmt die relativen Größen der Objekte auf dem Bild und deren gegenseitige Verdeckung (= Perspektive)
Was sind die Extrinsischen Parameter?
- Weltkoordinaten des Projektionszentrums (3D)
- Richtung der optischen Achse (2D)
- Rotation der Bildebene um die optische Achse (1D)
= 6 Parameter = Rigide Transformation
Was sind Intrinsische Parameter?
- Alles was fix in der Kamera ist
- Brennweite in Pixelbreite und -höhe (2D)
- Verschiebung der Bildebene (2D) = Position des Hauptpunktes
Was ist der Hauptpunkt (Principal Point)?
Der Hauptpunkt ist der Punkt, in dem die optische Achse durch die Bildebene stößt. Die Sehstrahlen stehen dort senkrecht zur Bildebene
Warum verwendet man Homogene Koordinaten in 2D?
- Translation und perspektive Projektion können als Matrizenoperationen dargestellt werden
- Einfache Beschreibung von Linien etc.
Was versteht man unter der Direct Linear Transform (DLT)?
Die Abbildung wird so umformuliert, dass lineare Gleichung bezüglich der Kameraparameter entsteht
Was ist der Trick, der bei der DLT angewendet wird?
Man hat eine Anzahl an Eingabe-Ausgabe-Paaren gegeben und kann nach den Kameraparametern auflösen
Was ist das Problem bei vielen Bildern von unterschiedlichen Ansichten und wie löst man das?
Das Problem ist, dass man ein unbekanntes Objekt und unbekannte extrinsische und intrinsische Kameraparameter hat. Man berechnet die Kamerakalibrierung und die Objektform. Für jede Ansicht bekommt man eine Kameraposition mit gleichem Fehler. Die Wahrscheinlichkeitsverteilung der Kameraposition für jede Ansicht kann als Ellipsoid visualisiert werden