Informationsvisualisierung Flashcards
Womit befasst sich die Informationsvisualisierung?
Zielt dabei nicht nur auf die Erstellung von Abbildungen und Schaubildern ab, sondern beschreibt die generelle Problemstellung, abstrakte Erkenntnisse auf eine anschauliche und verständliche Weise darzustellen.
Welche Prozesse gehören zum KDD Prozess?
ETL + Data Warehousing + Datenanalyseprozess
Was ist das übergeordnete Ziel von Visual Analytics?
Die visuelle Bereitstellung relevanter Informationen auf eine Weise, die das Handeln im betreffenden Arbeitssystem optimal unterstützt.
-> Abstrakte Informationen durch gute Visualisierung greifbar und umsetzbar machen
Was gehört zu Visual Analytics?
Kombination automatisierter Analyseverfahren mit Werkzeugen, Techniken zu interaktiven Visualisierungen für effektives Verstehen, Schlussfolgern und Entscheiden auf Basis sehr großer und komplexer Datensätze
Welche Ziele gibt es bei Visual Analytics?
Gewinnung synthetischer Erkenntnisse aus großen, dynamischen oft widersprüchlichen Datenbeständen
Bestätigung erwarteter und Entdeckung unerwarteter Zusammenhänge in den Daten
Bereitstellung zeitnaher, nachvollziehbarer und verständlicher Auswertungen von Daten
Vermittlung von betrieblich umsetzbaren Schlussfolgerungen aus den Daten
Was sind Herausforderungen der Informationsvisualisierung?
Datenvolumen und Dimensionsqualität (Effizient und interaktiv)
Informationsqualität und graphische Darstellbarkeit
Detailgrad der visuellen Darstellung (Balance Übersichtlichkeit & Detailliertheit)
Benutzeroberflächen und Interaktionsmöglichkeiten
Anzeigegeräte (Smartphones, Leinwand etc.)
Was hat es mit Dimensionalität auf sich?
Ähnlich wie beim Data Cube beschreibt die Dimensionalität bei der der Visualisierung von Informationen wie die Informationen kategorisiert sind.
Je höher die Dimensionalität desto schwieriger eine übersichtliche Visualisierung!
Wie unterscheiden sich Informationen?
Hinsichtlich ihres Typs und ihres Skalenniveaus
Welche Informationstypen gibt es?
Kategorial (Endliche Zahl von Kategorien, üblicherweise keine Reihenfolge z.B. Kundensegmente)
Diskret (Numerische Größe, Abzählbare Zahl möglicher Werte z.B. Jahr)
Stetig (Numerische Größe, nahezu beliebig genaue Werte z.B. Umsatz, Uhrzeit)
Welche Skalenniveaus gibt es?
Nominalskaliert (Einzelne Werte, Keinerlei Rangfolge z.B. Farbe)
Ordinalskaliert (Relative Reihenfolge, kein Distanzmaß z.B. Tabellenplatz, Note)
Intervallskaliert (Zahlen mit Distanzmaß, kein echter Nullpunkt, z.B. Temperatur, Jahr)
Verhältnisskaliert (Zahlen mit Distanzmaß, relativer Nullpunkt z.B. Umsatz, Alter)
Was sind Bestands- und Stromgröße?
Bestandgröße: Mengengröße, die zu einem bestimmten (diskreten) Zeitpunkt gemessen wird z.B. Inventar, Kapital, Marktanteil
Stromgröße: Größe die die Veränderung einer Bestandsgröße über einen (kontinuierlichen) Zeitraum angibt z.B. Verkaufszahl, Umsatz, Wachstumsrate)
Wie stellt man Bestands- und Stromgrößen dar?
Bestandsgrößen: als diskrete Säulen/Balken -> lineare Skala
Stromgrößen: als kontinuierliche Line -> log. Skala
Weil Balken geben die absolute Höhe (=Bestandsgröße) und Linien die (relative) Veränderung der Größe über die zeit (=Stromgröße)
Welche Techniken gibt es zur Informationsvisualisierung und wann setzt man sie ein?
Schaubilder für spezifische Sachverhalte
Diagramme zur Visualisierung großer und/oder komplexer Datensätze
Dashboards zur interaktiven Darstellung (prozess)-relevanter Kennzahlen
Was sind Eigenschaften von Schaubildern?
Manuell gezeichnet
Datensatzspezifisch
Ästhetisch ansprechend
Relativ kleine Datenbasis
Was sind Eigenschaften von Diagramme?
Algorithmisch generiert
Reproduzierbar für andere Daten
Schlicht gehalten
Relativ große Datenbasis
Was sind Eigenschaften von Dashboards?
Viele verschiedene Abbildungen (z.B. Kombination aus Schaubildern & Diagrammen)
Relevant für konkrete Fragestellungen
Kontextualisierung der Daten
Heterogene Datenbasis
Was ist der erste Schritt bei der Informationsvisualisierung?
Formulierung eines Ziels und Auswahl der entsprechenden Daten.
Folgende Fragen beantworten:
- Welche Werte/Dimensionen sind relevant?
- Welche Dimensionen sind besonders wichtig/unwichtig?
- Welche sind die wichtigsten Beziehungen zwischen den Dimensionen?
- Gibt es bestimmte Datenpunkte von besonderem Interesse?
- Wie unterstützt die vorgenommene Visualisierung ein Arbeitssystem und auf welche Weise?
Wovon ist die Wahl des Diagrammtypen abhängig?
Wie viele Werte dargestellt werden und um welche Arten von Werten es sich handelt