Multimedia Information Retrieval Flashcards
1
Q
Nicht-textuelle Dokumente
A
- automatisch erzeugte Annotationen meist nur syntaktische Informationen (Dateigröße, Pixelanzahl, Dauer, Bitrate)
- Semantische Information (Aussehen, Funktion/Einsatzzweck, Stil, Genre) manuell annotiert
- Sprache ist ungenau
2
Q
Ansatz Inhaltsbasierte Suche
A
- Eigenschaften ableiten, die die Dokumente (sinnvoll & semantisch) beschreiben
- Mathematische Deskriptoren werden aus dem Inhalt der Dokumente mit Hinblick auf diese Eigenschaften berechnet
- Ein Distanzmaß über diese Deskriptoren erlaubt einen inhaltlichen Vergleich der Dokumente
3
Q
Mathematische Beschreibung von Bildern
A
- Darstellung eines Bild als Funktion (r,g,b)
- Durchschnittsfarben-Feature-Vektor
- Distanz zwischen zwei Bildern mit euklidischem Abstand
4
Q
Distanzmaße
A
- Beschreibung von Dokumenten mittels Feature Vektoren
- Ähnlichkeitsbestimmung über Distanz der FV
- Welches Distanzmaß?
- Typische Distanzmaße (euklidische Distanz, City-Block) sind Metriken
5
Q
Distanzmaße - Metriken
A
- Menge S von Features und Metrik d: S x S -> R
- Metrik erfüllt:
-> Nicht-Negativität d(x,y) >= 0
-> Definitheit d(x,y) = 0 <-> x=y
-> Symmetrie d(x,y) = d (y,x)
-> Dreiecksungleichung d(x,y) <= d(x,z) + d(z,y)
6
Q
Query-Modalitäten
A
- Query by text
- Manuell annotierte Metadaten
- Darstellung als Zeichenfolge
- Algorithmisch gelernte Annotationen
7
Q
Query-Modalitäten: Text
A
- Eingabe: Notenscans/Audiofiles
- Zwischenschritt: MIDI Extraktion
- Output: Zeichenfolge
- Syntaktisch, nicht semantisch textuell
- gut für Suchindizes
- automatische Annotation
- gelabelte Daten
- ML
- Anwendung: image tagging, Übersetzungen
8
Q
Query Modalitäten: Example
A
- Suchen anhand eines Beispielobjekts
- ähnliche Objekte aus der DB holen
-> Distanz der Feature Vektoren
9
Q
Query Modalitäten: Example - Bilder
A
- Suche anhand eines Beispielbildes
- Berechnung der n-D Feature Vektoren aller Bilder der DB
- Bestimmung der ähnlichsten Bilder mittels k-nearest-neighbors
- Cosine Distance
10
Q
Query Modalitäten: Sketch
A
- Kein Beispielobjekt erforderlich
- Nutzer hat Vorstellung davon, was er sucht
- Algorithmus Idee: Konvertierung der Objekte in Bilder, die Skizzen ähnlich sind
- Bilder: Canny-Edge-Alg.
- 3D Modelle: Non-photorealistic Render
- Problem: zeichnerische Fähigkeiten entscheidend
11
Q
Explorative Suche
A
- Im Vergleich zum Querying (Retrieval) Keine konkrete Suchanforderung
-> Auffinden von interessanten Objekten
-> Clustering für Überblick
-> Details on Demand
12
Q
Explorative Suche - Research Data
A
- Riesige Datenmengen
- Textueller Zugang gegeben
- Funktionale Zusammenhänge der Daten mit FV beschreiben, Gruppierung, Scatterplots
13
Q
Metriken, die nicht (immer) der menschlichen Wahrnehmung entsprechen
A
- Dreieckungleichung
- Symmetrie
14
Q
Weitere Query Modalitäten
A
- Sing/hum
- Math
- Speech