Umsetzung statistischer Daten in thematischen Karten Flashcards

1
Q

Skalenniveaus Unterscheidung Daten

A

Die Grundlagendaten werden unterschieden:

Nicht-metrische, diskrete, kategoriale, „qualitative“ Datenniveaus
• Nominalskala/Nominale Daten
• Ordinalskala/Ordinale Daten

Metrische, kontinuierliche, „quantitative“ Datenniveaus
• Intervallskala/Intervall-Daten
• Verhältnisskala/Ratio-/Absolutdaten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Nominaldaten

A

• Die Ausprägungen beschreiben verschiedene Zustände oder Situationen (rein qualitative
Unterscheidung)
• keine Hierarchisierung der Daten
• Die Daten können aber kategorisiert werden (A, B, C, etc.)
• Kodierung der Wertausprägungen der Variablen häufig über Zahlen (z.B. Burgenland = 1,
Kärnten = 2, …)
◦ Rechenoperationen (z.B. Mittelwertberechnungen) mit diesen Zahlen sind nicht sinnvoll.
◦ Was sinnvoll ist: Häufigkeitsauszählungen, Berechnung des Modus (= häufigster Wert)
• Beispiele: Geschlecht, Beruf, Sprachfamilien

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Ordinaldaten

A

• Ausprägungen der Variable können über „größer/kleiner“-Relationen miteinander verglichen werden → Rangordnung möglich
• „scheinbar quantitativ“, aber nicht numerisch
• klassifizierte, qualitative Unterscheidung
• Erstellung einer Rangfolge ist möglich
• Zahlen, die den Wertausprägungen zugeordnet werden, müssen im Sinne einer größenmäßigen Ordnung interpretierbar sein
- Größenabstände zwischen den Werten sagen aber nicht unbedingt etwas über die tatsächlichen Wertunterschiede aus
- → Ordnungsrelationen (=, ) sind erlaubt
- → Berechnung von Differenzen und Mittelwerten nicht sinnvoll
• Beispiele: Eignung des Bodens als Weideland, Höhe des Schulabschlusses, Fahrzeugklasse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Metrische Daten

A

• Es muss eine konstante Messeinheit zugrundeliegen

Intervalldaten: kein absoluter Nullpunkt, z.B. Temperaturskala, Jahreszahlen
• Addition und Subtraktion von Variablenwerten inhaltlich sinnvoll
• Multiplikation und Division nicht sinnvoll

Absolut-/Ratiodaten: Wert 0 ist der absolute Nullpunkt (z.B. Lebensalter, Einwohnerzahl, Entfernung von Orten, Temperatur in Kelvin, Stunden/Jahren)
• Multiplikationen und Divisionen möglich und sinnvoll
• Bsp: Die Entfernung von 30km ist doppelt so weit wie 15km
→ Daten auf Wertskala ablesbar
→ Klassifizierung (mit Informationsverlust) möglich

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Zusammenfassung Skalenniveaus

A

• Skalenniveaus → Hierarchie mit zunehmendem Informationsgehalt
• Eine Variable eines bestimmten Skalenniveaus kann immer in eine Variable eines
niedrigeren Skalenniveaus überführt werden
• Umgekehrter Schritt ist nicht möglich!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Skalenniveaus&raquo_space; grafische Variablen

A

Die korrekte Identifikation des Skalenniveaus ist Grundlage für die Wahl der geeigneten grafischen Darstellung.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Grafische Grundelemente

A
• Die drei Grafik-Primitive Punkte, Linie und Fläche sind die Bausteine jeglichen graphischen
Ausdrucks
• Diese können entsprechend der folgenden sechs grafischen Variablen modifiziert werden:
- Größe
- Helligkeit
- Farbe
- Muster
- Richtung
- Form
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Graphische Wirkungen

A

Das Skalenniveau ist die Grundlage für die Wahl der geeigneten grafischen Variablen
Grafischen Variablen rufen unterschiedliche Wirkungen hervor:

Grafische Wirkung „unterscheidend“ (Nominaldaten):
→ Form, Orientierung, Muster, Farbe

Grafische Wirkung „ordnend“ (Ordinaldaten):
→ Größe, Tonwert, Muster

Grafische Wirkung „quantitativ“ (intervall-/ratio-skalierter Daten):
→ Größe, Tonwert

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Von Daten zur Karte
Schritt 1: Datenaufbereitung
Überprüfung der Daten

A

• Qualität der Daten: Genauigkeit, Richtigkeit, Gültigkeit, Aktualität, Verlässlichkeit bzw.
Glaubwürdigkeit → Plausibilitätsprüfung, Gebietsabdeckung, Vollständigkeit, Lesbarkeit,
Datenformat
• Eignen sich die Daten dazu, das gewünschte Thema in ausreichender Genauigkeit und in
adäquater Form darzustellen?
• Welche Daten liegen vor? (Skalenniveau)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Von Daten zur Karte
Schritt 1: Datenaufbereitung
Vorbereitung zur Weiterverarbeitung

A

• Zusammenführen von vorhandenenen Tabellen, Kombinieren von Merkmalen, Auswahl
relevanter Daten, Vereinfachung (z.B. Runden), Werte nach Größe sortieren
• Ziel: übersichtliche, gut lesbare und sachgerechte räumlich differenzierter Darstellung
• Methode: Reduktion der Informationsmenge durch Klassifizierung der Daten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Von Daten zur Karte

Schritt 2: Datenauswertung: Klassifizierung

A

Definition: Klassifizierung ist die systematische Gruppierung bzw. Aggregation von Daten zur
Reduktion der Informationsmenge
- Ziel: klareres Kartenergebnis

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Allgemeines zur Klassenbildung

A

Klassenbildung besteht aus:
• Wahl der Klassenanzahl
• Setzen der Klassengrenzen, Intervallbreite der Klassen
Je nach Festlegung dieser Parameter kann das Kartenbild und damit auch die Aussage der Karte anders ausfallen → daher ist Sorgfalt geboten!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wahl der Klassenanzahl

A

Anzahl Klassen abhängig von Größe des Datensatzes und der Signatur, mit der das Merkmal dargestellt wird
• zu viele Klassen → schwierig zu erfassen
• zu wenige Klassen: Informationen werden weggeneralisiert → Verlust der Aussagekraft

Empfehlung variiert nach Gesichtspunkt:
− Statistik: 6–8 (einpolig) bzw. 10–12 Klassen (mehrpolig)
− Kartographie: 4–8 ist okay, 5–6 ist Standard

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Regeln zur Klassenbildung

A

• Jeder Wert darf nur in einer Klasse vorkommen → Klassengrenzen dürfen nicht
überlappen.
• Klassen untereinander möglichst verschieden
• Daten innerhalb einer Klassen so ähnlich wie möglich
• Der gesamte Wertebereich des Merkmals muss abgedeckt und dargestellt werden können.
• Klassenbreiten möglichst so wählen, dass jede Klasse mehrfach besetzt ist. Eine
Ausnahme bilden die Randklassen.
• Häufungen und Extremwerte sollten sichtbar werden oder bleiben.
• Falls es sinnvoll erscheint sind einheitliche Klassengrößenanzustreben.
• Natürliche Grenzen im Datensatz sollten vorrangig beachtet und als Intervallgrenze in
Betracht gezogen werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Prinzipien der Klassenbildung I

A

Wahl der Klassengrenzen und Intervallbreiten in Abhängigkeit von Verteilung der Originaldaten:

nach A.) Sinngruppen
◦ Klassenbildung nach inhaltlich-sachlichen Gesichtspunkten (Sinngruppen) oder gesetzlich vorgeschriebenen Richtwerten.
◦ Festlegung ohne Berechnung, sondern aus Tradition oder Vereinbarung
◦ z.B. Abgrenzung der Bevölkerungsverteilung nach Großstädten, kreisfreien Städten, dicht besiedelten Landkreisen,…
◦ Nachteile: Klassierung kann bereits eine Interpretation der Daten beinhalten.

nach B.) Häufigkeitsgruppen
◦ Einfachste Methode: Strichlisten; Visualisierung über Häufigkeitsdiagramm
◦ Häufigkeitsdiagramme als Grundlage für die Klassifizierung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Prinzipien der Klassenbildung

A
  • Natürliche Gruppenbildung (natural breaks): Sprünge oder Unstetigkeiten im Datensatz werden als Klassengrenzen verwendet
  • Ermittlung computergestützt (z.B. mittels Jenks-Algorithmus) oder von KartenerstellerIn nach subjektiven Aspekten
  • Vorteile: Wertunterschiede innerhalb der Klassen minimiert, Unterschiede zwischen den Klassen betont
  • Nachteile: Umständen sehr unterschiedliche Klassenbreiten und -größen
17
Q

Prinzipien der Klassenbildung II

A

bei manueller Definition: Ergebnisse variieren je nach KartenerstellerIn

nach C.) mathematischen Regeln
◦ Intervalle gleicher Breite (equal intervals)
◦ Quantile
◦ Mittlere Standardabweichung (mean-standard deviation)
◦ Maximum Breaks
In der Regel liefern diese Klassierungsverfahren unrunde Klassengrenzen → Anpassung auf
runde Werte sinnvoll!

18
Q

Einheitliche Klassenbreiten (Equal Interval)

A

• Jede Klasse ergibt sich durch die gleiche Distanz auf der Werteskala
• Berechnung: Datenumfang / Anzahl Klassen
Wann sinnvoll?
• Datenverteilung im Histogramm hat rechteckige Form (im Kontext geographischer
Phänomene allerdings selten)
• Nachteil: Klassengrenzen orientieren sich nicht an den vorhandenen Werten, d.h., einige
Klassen könnten nicht vertreten sein → was unbedingt vermieden werden sollte!

19
Q

Quantilen-Klassifikation

A

• Jede Klasse hat gleiche Anzahl an Werten
• Ordnen der Datensätze nach Größe und platzieren der Werte in Klassen
• Vorteile: einfach in der Berechnung, jede Klasse ist ungefähr gleich in der Karte
repräsentiert
• Nachteil: teilweise große Lücken innerhalb der Klassen

20
Q

Standardabweichung-Klassifizierung (Mean-Standard Deviation)

A

• Orientiert sich an der tatsächlichen Verteilung der Werte:
◦ 1. Ermittlung des Mittelwerts
◦ 2. Ausgehend vom Mittelwert → setzen der Klassengrenzen in beiden Richtungen (=
schrittweise addieren bzw. subtrahieren der Standardabweichung vom statistischen
Mittel des Datensets)
• Sinnvoll, wenn speziell die Abweichung vom Mittel betont werden soll
• Nachteil: Sollte nur bei einer standardisierten Normalverteilung (Gaußsche Verteilung)
angewandt werden

21
Q

Weitere Klassifizierungen…

A
  • Maximum Breaks: Versuch, alle ähnlichen Werte zu gruppieren; Berechnung von Unterbrechungen - die größten dienen als Klassengrenzen; einfach zu berechnen, übersieht aber natürliche Unterbrechungen
  • Optimal: Versuch, die Nachteile der Maximum Breaks mit einem Algorithmus auszugleichen, z.B. in QGIS „Natural Breaks (Jenks)“
  • Pretty Breaks: Klassifizierung der Daten mit „schönen“ (leicht lesbaren) Klassengrenzen