Deskriptive Statistik Flashcards
Definition statistische Einheit
Objekte, (z. B. Personen, Firmen, Haushalte usw.) auf die sich eine statistische Analyse bezieht
Definition Grundgesamtheit
(statistische Masse, Population, Kollektiv): Zusammenfassung aller für eine statistische
Analyse relevanten statistischen Einheiten
Definition Stichprobe
Wenn nicht die Grundgesamtheit erfasst werden, wird ein teil davon, eine Stichprobe befragt
Definition Vollerhebung
Befragung der Grundgesamtheit
Definition Teilerhebung
Befragung eines Anteils der Grundgesamtheit
Definition Bestandsmasse + Beispiel
Grundgesamtheit, die zu einem bestimmten Zeitpunkt erfasst wird.
Beispiele: Einwohner in XY, Angemeldete PKWs
Definition Bewegungsmasse + Beispiel
Grundgesamtheit, die über einen bestimmten Zeitraum erfasst wird.
Beispiele: Geburten innerhalb eines Jahres, Neuzulassungen innerhalb eines Jahres
Definition Merkmalsträger
Synonym statistische Einheit: Objekte, z. B. Personen, Firmen, Haushalte usw. auf die sich eine statistische Analyse bezieht
Definition Merkmal
„messbare“ Eigenschaft der zu untersuchenden Stichprobe. Ein Merkmal kann
unendlich viele unterscheidbare Ausprägungen annehmen
Bezeichnung der Merkmalsausprägungen
Xi, i = 0 1,2,3,…,n
Definition dichotom, polytom
Dichotom:
Das Merkmal kann nur 2 Ausprägungen annehmen
Polytom:
Das Merkmal kann mehr als 2 Ausprägungen annehmen
Synonyme Merkmalsausprägungen
Beobachtungswerte, Realisierungen, Merkmalswerte
Definition diskretes Merkmal + Beispiel
Ein Merkmal heißt diskret, falls es nur abzählbar endlich viele oder abzählbar unendlich viele Realisierungen annehmen kann (also abzählen). Ausserdem wenn die Realisierungen verbal ausgedrückt werden können.
Beispiele:
• Anzahl der Menschen (endlich viele Realisierungen auf der Erde)
• Farben wie rot, blau, gelb usw. - verbale Ausdrücke
• Versuche bis zum Lösen einer Aufgabe (abzählbar unendlich)
Definition stetiges Merkmal + Beispiele
Ein Merkmal heißt stetig, falls es (theoretisch) alle reellen Zahlen in einem Intervall als Realisierung annehmen kann. Dies bedeutet, es gibt überabzählbar unendlich viele Realisierungen, also Merkmale, die in zeit, Mengen oder Längeneinheiten gemessen werden können.
Beispiele:
• Körpergröße (Genauigkeit bis auf mm, usw.),
• Alter eines Menschen
Definition Gruppieren
Bei Variablen mit vielen Ausprägungen werden diese häufig gruppiert (Zusammenfassung der Messwerte zu Messwertklassen). Man spricht dann von gruppierten oder klassierten oder auch kategorisierten Daten.
Definition latente Variablen
Lassen sich nicht beobachten, sie stellen hypothetische Konstrukte dar. Eine latente Variable muss sich erst irgendwie äußern, damit sie zur Kenntnis genommen wird. Sie muss messbar gemacht werden.
Beispiele: Intelligenz, Motive, Meinungen
Gegenteil: Manifeste Variablen, sie sind beobachtbar und messbar
Definition manifeste Variablen
Manifeste Variablen lassen sich beobachten. Sie sind messbar.
Definition Skalieren
Um die Realisierungen eines Merkmals untereinander zu vergleichen, muss eine Maßeinteilung der Messwerte vorgenommen werden. Dieses heißt Skalieren.
Definition Skalieren
Um die Realisierungen eines Merkmals untereinander zu vergleichen, muss eine Maßeinteilung der Messwerte vorgenommen werden. Dieses heißt Skalieren.
Nenne die 3 Skalierungsniveaus
Nominal
Ordinal
Metrisch
-unterteilt in Intervall und Verhältnisskala
Definiere nominal skalierte Merkmale
Es darf nur nach gleich und ungleich geprüft werden
Rechenoperationen:
=
Definiere ordinal skalierte Merkmale
Ordinal skalierte Merkmalen können in eine natürliche oder sinnvoll festzulegende Rang- oder Reihenfolge gebracht werden. Um diese Rangfolge zu bezeichnen, werden häufig Zahlen, z.B. Rang 1, Rang 2 usw. verwendet. Diese Zahlen haben hier nur Bezeichnungscharakter.
Rechenoperationen:
= ; <>
Definiere metrisch skalierte Merkmale
Unterteilung in
Intervallskala:
- willkürlicher Nullpunkt
- nur = , <> , + -
- Beispiel: Temperatur in °C, Jahreszahlen
Verhältnisskala:
- absoluten natürlichen Nullpunkt
- = , <> , + -, * :
Definition Urliste
Eine Urliste gibt die (ungeordneten) Merkmalsausprägungen 𝑥1, 𝑥2, … wider
Häufigkeitsvariablen
h(xi) = absolute Häufigkeit von xi f(xi) = relative Häufigkeit von xi [h(xi)/n] H(xi) = Absolute Summenhäufigkeit F(xi) = Relative Summenhäufigkeit
Definition eindimensionale Häufigkeitsverteilung
-Nur ein Merkmal wird betrachtet
Definition Histogramm
- Grafische Darstellung einer Häufigkeitsverteilung in Form von Säulen, die den Häufigkeiten der Messwerte entsprechen (relative Häufigkeit)
- Keine Lücken
- für relative Häufigkeit Fläche der Rechtecke ausrechnen
Benötigte Werte für ein Histogramm
1) Intervalle
2) absolute Häufigkeit
3) relative Häufigkeit
4) (Klassenbreite)
5) (Relative Häufigkeit bezüglich Klassenbreite f(x)/Klassenbreite)
Benötigte Werte Lorenzkurve
1) Nummer
2) Merkmalsträger
3) Merkmalsausprägung
4) Anteil der Merkmalsträger
5) kumulierter Anteil der Merkmalsträger uj
6) kumulierte Merkmalssumme
7) kumulierte relative Merkmalssumme vj
8) i*xi