Basics Flashcards
Grundgesamtheit
Alle Individuen, denen ein zu untersuchendes Merkmal gemeinsam ist
Stichprobe
Teilmenge der Grundgesamtheit
Stichprobenumfang (n)
Anzahl der vorliegenden Beobachtungen
Beobachtungseinheit
eine Person ; ein KH-Fall
Merkmal
eine Variable (Kenngröße), die verschiedene Werte (Merkmalsausprägungen) annehmen kann
Merkmalsausprägung
verschiedene Werte eines Merkmals
Beispiele
Grundgesamtheit: Haushalte einer Stadt
Merkmal: Anzahl der Haushaltsmitglieder
Stichprobenumfang 5: H1, H2, H3, H4, H5
Merkmalsausprägung: 3, 5, 6, 5 Haushaltsmitglieder
Qualitatives Merkmal
Müssen mit Worten beschrieben werden = Namen oder Kategorien
Quantitatives Merkmal
Messbare oder zählbare Merkmale mit metrischer Skala
Konstante Abstände zwischen den Skaleneinheiten sind Voraussetzungen für statistische Verfahren.
Sind nur bei quantitativen Merkmalen zulässig!
Diskretes Merkmal
Springen in Stufen von einer Merkmalsausprägung zur anderen
Merkmale mit Nominal- oder Ordinalskala sind diskret Diskretes quantitatives Merkmal
Zähldaten
Stetige quantitative Merkmale
Stufenlos, können beliebige Werte in einem bestimmten Bereich annehmen.
Messdaten
Die selben Merkmalsausprägungen wiederholt im gleichen Datenbestand, bezeichnet man als Bindung. Viele Bindungen machen ein Merkmal zu einem diskreten Merkmal.-
Skala
Anordnung von Zahlen, denen die Merkmalsausprägungen eindeutig zugeordnet werden
Nominalskala = Kategorienskala
Merkmalsausprägungen haben verbal bezeichnete Namen mit mehr oder weniger beliebige Reihenfolge
= Geschlecht: männlich & weiblich
Skaleneinheiten und Merkmalsausprägungen gleich
Ordinalskala
Merkmalsausprägungen haben eine eindeutige Reihenfolge (order).
Abstände zwischen den Merkmalsausprägungen unterschiedlich und oft unbekannt.
Skaleneinheiten und Merkmalsausprägungen gleich
Intervallskala
Eindeutige Reihenfolge: Abstand ist bekannt und stets gleich!
Abstand kann gezählt werden, ist daher eine metrische Skala.
Skaleneinheiten und Merkmalsausprägungen decken sich nicht immer.
Willkürlicher Nullpunkt = Pseudo-Nullpunkt z.B. mittlere Tagestemperatur -1,7 °C
Verhältnisskala = Rationalskala
Natürlicher absoluter Nullpunkt
Alle Werte haben das gleiche Vorzeichen, deshalb kann das Verhältnis zwischen 2 MErkmalsausprägungen sinnvoll interpretiert werden
Länge in cm Verhältnisskala: 12cm ist dreimal so lang wie 4cm
12°C ist nicht dreimal so warm wie 4°C = Intervallskala
Umwandlungsmöglichkeiten
Merkmale mit höherem Informationsgehalt können in Merkmale mit niedrigerem Informationsgehalt umgewandelt werden, dabei geht Informationen verloren
Das stetige Merkmal „Rektaltemperatur“ in Alternativ-Merkmal „Fieber“ mit Merkmalsausprägungen „ja“ oder „nein“
Ordnen von Daten
Univariat: 1 Merkmal (1-dimensional)
Arithmetisches Mittel, Spannweite, einfache Häufigkeitstabellen
Bivariat: 2 Merkmale (2-dimensional)
Korrelationskoeffizient, Punktwolke (Scatterplot), Odds Ratio
Multivariat: 3 oder mehr Merkmale (multidimensional):
multiple Regression
Häufigkeiten
Absolute Häufigkeit (f): Anzahl gleichartiger Beobachtungen, Summe der f beträgt n
relative Häufigkeit (p =f/n): absolute Häufigkeit / Stichprobenumfang (0 bis 1), Summe der p beträgt 1 : in Prozent 100 x p
kumulierte absolute Häufigkeit: f1 + f2 der Klasse fi
kumulierte relative Häufigkeit: p1 + p2 der Klasse pi
Maßzahlen der zentralen Tendenz (Lage, Lokalisation)
Arithmetisches Mittel: Summe der Einzelbeobachtungen dividiert durch die Fallzahl n
Median: Mitte der von n der Größe nach geordneten Einzelbeobachtungen. Ordinalskalenniveau, da eine feste Reihenfolge gegeben sein muss
Modalwert: häufigste Merkmalsausprägung
Quantile: Index des Quantils i =q (n+1) ; q = Quartil/Quantil
Wert des Quantils_ i-te der nach der Größe sortierten
Beobachtung
Streuung oder Dispersion
Spannweite: Maximum - Minimum
Quantil:
Interquartilabstand: 3 - 1. Quartil
Standardabweichung: positive Wurzel aus der Varianz