Umsetzung statistischer Daten in thematischen Karten Flashcards
Skalenniveaus Unterscheidung Daten
Die Grundlagendaten werden unterschieden:
Nicht-metrische, diskrete, kategoriale, „qualitative“ Datenniveaus
• Nominalskala/Nominale Daten
• Ordinalskala/Ordinale Daten
Metrische, kontinuierliche, „quantitative“ Datenniveaus
• Intervallskala/Intervall-Daten
• Verhältnisskala/Ratio-/Absolutdaten
Nominaldaten
• Die Ausprägungen beschreiben verschiedene Zustände oder Situationen (rein qualitative
Unterscheidung)
• keine Hierarchisierung der Daten
• Die Daten können aber kategorisiert werden (A, B, C, etc.)
• Kodierung der Wertausprägungen der Variablen häufig über Zahlen (z.B. Burgenland = 1,
Kärnten = 2, …)
◦ Rechenoperationen (z.B. Mittelwertberechnungen) mit diesen Zahlen sind nicht sinnvoll.
◦ Was sinnvoll ist: Häufigkeitsauszählungen, Berechnung des Modus (= häufigster Wert)
• Beispiele: Geschlecht, Beruf, Sprachfamilien
Ordinaldaten
• Ausprägungen der Variable können über „größer/kleiner“-Relationen miteinander verglichen werden → Rangordnung möglich
• „scheinbar quantitativ“, aber nicht numerisch
• klassifizierte, qualitative Unterscheidung
• Erstellung einer Rangfolge ist möglich
• Zahlen, die den Wertausprägungen zugeordnet werden, müssen im Sinne einer größenmäßigen Ordnung interpretierbar sein
- Größenabstände zwischen den Werten sagen aber nicht unbedingt etwas über die tatsächlichen Wertunterschiede aus
- → Ordnungsrelationen (=, ) sind erlaubt
- → Berechnung von Differenzen und Mittelwerten nicht sinnvoll
• Beispiele: Eignung des Bodens als Weideland, Höhe des Schulabschlusses, Fahrzeugklasse
Metrische Daten
• Es muss eine konstante Messeinheit zugrundeliegen
Intervalldaten: kein absoluter Nullpunkt, z.B. Temperaturskala, Jahreszahlen
• Addition und Subtraktion von Variablenwerten inhaltlich sinnvoll
• Multiplikation und Division nicht sinnvoll
Absolut-/Ratiodaten: Wert 0 ist der absolute Nullpunkt (z.B. Lebensalter, Einwohnerzahl, Entfernung von Orten, Temperatur in Kelvin, Stunden/Jahren)
• Multiplikationen und Divisionen möglich und sinnvoll
• Bsp: Die Entfernung von 30km ist doppelt so weit wie 15km
→ Daten auf Wertskala ablesbar
→ Klassifizierung (mit Informationsverlust) möglich
Zusammenfassung Skalenniveaus
• Skalenniveaus → Hierarchie mit zunehmendem Informationsgehalt
• Eine Variable eines bestimmten Skalenniveaus kann immer in eine Variable eines
niedrigeren Skalenniveaus überführt werden
• Umgekehrter Schritt ist nicht möglich!
Skalenniveaus»_space; grafische Variablen
Die korrekte Identifikation des Skalenniveaus ist Grundlage für die Wahl der geeigneten grafischen Darstellung.
Grafische Grundelemente
• Die drei Grafik-Primitive Punkte, Linie und Fläche sind die Bausteine jeglichen graphischen Ausdrucks • Diese können entsprechend der folgenden sechs grafischen Variablen modifiziert werden: - Größe - Helligkeit - Farbe - Muster - Richtung - Form
Graphische Wirkungen
Das Skalenniveau ist die Grundlage für die Wahl der geeigneten grafischen Variablen
Grafischen Variablen rufen unterschiedliche Wirkungen hervor:
Grafische Wirkung „unterscheidend“ (Nominaldaten):
→ Form, Orientierung, Muster, Farbe
Grafische Wirkung „ordnend“ (Ordinaldaten):
→ Größe, Tonwert, Muster
Grafische Wirkung „quantitativ“ (intervall-/ratio-skalierter Daten):
→ Größe, Tonwert
Von Daten zur Karte
Schritt 1: Datenaufbereitung
Überprüfung der Daten
• Qualität der Daten: Genauigkeit, Richtigkeit, Gültigkeit, Aktualität, Verlässlichkeit bzw.
Glaubwürdigkeit → Plausibilitätsprüfung, Gebietsabdeckung, Vollständigkeit, Lesbarkeit,
Datenformat
• Eignen sich die Daten dazu, das gewünschte Thema in ausreichender Genauigkeit und in
adäquater Form darzustellen?
• Welche Daten liegen vor? (Skalenniveau)
Von Daten zur Karte
Schritt 1: Datenaufbereitung
Vorbereitung zur Weiterverarbeitung
• Zusammenführen von vorhandenenen Tabellen, Kombinieren von Merkmalen, Auswahl
relevanter Daten, Vereinfachung (z.B. Runden), Werte nach Größe sortieren
• Ziel: übersichtliche, gut lesbare und sachgerechte räumlich differenzierter Darstellung
• Methode: Reduktion der Informationsmenge durch Klassifizierung der Daten
Von Daten zur Karte
Schritt 2: Datenauswertung: Klassifizierung
Definition: Klassifizierung ist die systematische Gruppierung bzw. Aggregation von Daten zur
Reduktion der Informationsmenge
- Ziel: klareres Kartenergebnis
Allgemeines zur Klassenbildung
Klassenbildung besteht aus:
• Wahl der Klassenanzahl
• Setzen der Klassengrenzen, Intervallbreite der Klassen
Je nach Festlegung dieser Parameter kann das Kartenbild und damit auch die Aussage der Karte anders ausfallen → daher ist Sorgfalt geboten!
Wahl der Klassenanzahl
Anzahl Klassen abhängig von Größe des Datensatzes und der Signatur, mit der das Merkmal dargestellt wird
• zu viele Klassen → schwierig zu erfassen
• zu wenige Klassen: Informationen werden weggeneralisiert → Verlust der Aussagekraft
Empfehlung variiert nach Gesichtspunkt:
− Statistik: 6–8 (einpolig) bzw. 10–12 Klassen (mehrpolig)
− Kartographie: 4–8 ist okay, 5–6 ist Standard
Regeln zur Klassenbildung
• Jeder Wert darf nur in einer Klasse vorkommen → Klassengrenzen dürfen nicht
überlappen.
• Klassen untereinander möglichst verschieden
• Daten innerhalb einer Klassen so ähnlich wie möglich
• Der gesamte Wertebereich des Merkmals muss abgedeckt und dargestellt werden können.
• Klassenbreiten möglichst so wählen, dass jede Klasse mehrfach besetzt ist. Eine
Ausnahme bilden die Randklassen.
• Häufungen und Extremwerte sollten sichtbar werden oder bleiben.
• Falls es sinnvoll erscheint sind einheitliche Klassengrößenanzustreben.
• Natürliche Grenzen im Datensatz sollten vorrangig beachtet und als Intervallgrenze in
Betracht gezogen werden.
Prinzipien der Klassenbildung I
Wahl der Klassengrenzen und Intervallbreiten in Abhängigkeit von Verteilung der Originaldaten:
nach A.) Sinngruppen
◦ Klassenbildung nach inhaltlich-sachlichen Gesichtspunkten (Sinngruppen) oder gesetzlich vorgeschriebenen Richtwerten.
◦ Festlegung ohne Berechnung, sondern aus Tradition oder Vereinbarung
◦ z.B. Abgrenzung der Bevölkerungsverteilung nach Großstädten, kreisfreien Städten, dicht besiedelten Landkreisen,…
◦ Nachteile: Klassierung kann bereits eine Interpretation der Daten beinhalten.
nach B.) Häufigkeitsgruppen
◦ Einfachste Methode: Strichlisten; Visualisierung über Häufigkeitsdiagramm
◦ Häufigkeitsdiagramme als Grundlage für die Klassifizierung