Univariate Deskriptivstatistik (nominal und ordinal) Flashcards
Sitzungen 1-3
Was ist Statistik?
Methoden zum Beschreiben und Interpretieren von Daten
Was ist beschreibenden (deskriptiven) Statistik?
- Beschreiben & graph Aufbereitung von Daten
- Bsp. Häufigkeitsverteilung, Gruppenunterschiede bezüglich eines Merkmals
Mit was beschäftigt sich die schliessende Statistik? (=Inferenzstatistik)
- Allg. Schlussfolgerungen über Grundgesamtheiten (Populationen) unter Einbezug Wahrscheinlichkeitstheorie)
Was für Daten werden in der Statistik ausgewertet?
numerische Daten
Was ist eine Variabel?
veränderliche Grösse, Objekt unterscheiden sich
Was sind interindividuelle Unterschiede?
Unterscheide zw. ver. Individuen.
Bsp. Intelligenz, Extraversion
Was sind intraindividuelle Veränderungen?
Unterschiede innerhalb der gleichen Person.
Bsp. Stimmung
Was ist eine Intervenierende Variabel?
- dazwischen gehend
- gleichzeitig Wirkung und Ursache
Was ist eine Moderatorvariabel?
Variablen, von deren Ausprägung der Zusammenhang zweier anderer Variablen abhängt (von lat. moderator = Lenker)
Was sind diskrete Variablen?
endlich viele Ausprägungen oder abzählbar unendlich viele Ausprägungen (z.B. „Versuche bis zum richtigen Lösen einer Aufgabe“)
Was sind stetige Variablen?
überabzählbar viele Ausprägungen innerhalb eines Intervalls (z.B. Gewicht,)
– Stetige Variablen sind immer quantitative/metrische Variablen (s.u. Messtheorie)
Was sind qualitative Variabeln?
durch Qualität und nicht durch Ausmass gekennzeichnet
– endliche Anzahl von Ausprägungen
Was sind quantitative Variabeln?
im Sinne einer Intensität oder eines Ausmasses interpretierbar
– Ausprägungen daher immer Zahlen
Was kann die univariate statistische Methode?
Beschreibung eines Merkmals
Häufigkeit einer Krankheit
Was kann die bivariate statistische Methode?
Zusammenhang von zwei Merkmalen beschreiben (Anstrengung und Leistung)
Was kann die multivariate statistische Methode?
Zusammenhang mehrerer Merkmale beschreiben (Schulden, Vermögen, Finanzielle Zufriedenheit)
Was sind Skalenwerte?
Das was man gemessen hat, kann man einem Skalenweert zuordnen
Was gilt es bei der Zuordung von Messdaten zu Skalenwerten zu beachten?
Empirische Relationen zwischen den Messobjekten müssen durch numerische Relationen der Skalenwerte repräsentiert werden (=relationelles System)
Was ist ein Skalenniveau?
Das Skalenniveau definiert die Art und Weise, in der Unterschiede zwischen Messwerten interpretiert werden können.
In welchen Skalenniveaus gibt es kardinalskalierte, metrische Daten?
Intervall, Verhältnis, Absolut
In welchem Skalenniveau werden folgende Daten ausgewertet: Geschlecht, Lieblingsfarbe
Nominal: Gleich- oder Verschiedenheit
- weder Ordnung noch quantitative Bedeutung
Was macht man mit einer Urliste?
Häufigkeit von Merkmalsträger kann zusammengefasst
werden.
- Man kann daraus iene primäre Häufigkeitsverteilung machen
Was ist die zentrale Tendenz?
- zentralen Tendenz kennzeichnen das Zentrum einer Verteilung
- ist eine Angabe über die Verteilung
- Ist ein Lagemass
Bsp. durchschnittlicher Messwert, mittlerer Messwert
Was ist die zentrale Tendenz bei einer Nominalskala?
Das ist der Modus, die Merkmalsausprägung, die am häufigsten vorkommt
Wann kann de Modus nicht eindeutig bestimmt werden bei Nominalskalen?
Wenn mehrere Kategorien gleichhäufig besetzt sind
Wie kann eine Verteilung beschrieben werden?
- mit Lagemassen (zentrale Tendenz)
- mit Streuungsmassen (Dispersion)
Was sind singuläre Daten?
Bei singulären Daten kommt jeder beobachtete Wert (prinzipiell) nur
einmal vor
Was haben wir für Daten bei einer Ordinalskala, Bsp. Satisfaction-with-Life Scale? (/ vorgegebene Kategorien, möglichst gleichabständig)
Wir haben kategoriale Daten mit geordneten Kategorien
What isch der Median?
- Kennwert der zentralen Tendenz (ein Lagemass)
- Zentralwert
- Wert genau in der Mitte
- dort wo kumulierte Häufigkeit von 0,5 überschritten wird
Warum ist bei singulären Daten (ohne Bindung) die eindeutige Bestimmung des Modus nicht möglich?
Weil z.B Rangplätze, alle gleichhäufig
Ist es sinnvoll die Streuung bei singulär ordinalskalierten Daten zu berechnen?
Nicht wirklich, weil jeder Wert ist ja nur einmal vorhanden
Was ist der rel. Info.gehalt H?
Zeigt Streuung von 0-1
Was sind sekundäre Häufigkeitsverteilungen?
Ausgehend von der primären Häufigkeits- verteilung werden Kategorien gebildet und unter diesen werden die Messwerte zusammengefasst
> Kategorienbildung mehr oder weniger willkürlich (meistens 10-20 Kategorien)
Wie kann man sekundäre Häufigkitsverteilungen graphische darstellen?
In einem Histogramm oder in einem Polygonzug
Wann macht ein Polygonzug sinn?
Wenn man eine kontinuierliche Variabel darstellen will, wie z.B Reaktionszeit
Ein anderes Wort für rechtsschief:
linkssteil, inksgipflig
Wie ist die Verteilung, wenn es viele Werte um den Modalwert hat?
breitgipflig
Was heisst unimodal, bimodal, multimodal?
Je nach Gipfelanzahl
J, L, U, Umgekehrt-U sind Verteilungsformen, die nicht auf einem Haufen basieren, stimmt das?
yap
Was ist die Spitze des Polygonzugs?
Der Modus=häufigst Besetzte Kategorie
Was hat der Median für eine tolle Eigenschaft?
Die Summe der Abweichungsbeträge aller Messwerte vom Median ist kleiner als die Summe der Abweichungsbeträge von irgendeinem
anderen Wert
Was ist das arithmetische Mittel?
Das arithmetische Mittel ist gleich der Summe aller beobachteten Merkmalswerte dividiert durch die Anzahl der Beobachtungen
- Das arithmetische Mittel repräsentiert die Lage einer Verteilung nach dem Kriterium der kleinsten Quadrate.
Was hat das aritmetische Mittel für eine Eigenschaft?
- Die Summe der Abweichungen aller Messwerte vom Mittelwert beträgt stets 0:
- Die Summe der quadrierten Abweichungen der Messwerte vom Mittelwert ist stets kleiner als die Summe der quadrierten Abweichungen von irgendeinem anderen Wert:
Was ist der Median?
Der Median repräsentiert die Lage einer Verteilung nach dem Kriterium der kleinsten Absolutabweichung.
Wann ist das arithmetische Mitttel besonders aussagekräftig?
Bei symmetrischen unimodalen Verteilungen
- sensitiv auf Ausreisser
Welcher Wert schätzt die Lage eienr Verteilung am besten, wenn es extreme Ausreisser hat?
Median
Für was ist das GAM gut?
Mittelwerte aus mehreren Messwertreihen mitteln, die aus einer unterschiedlichen Anzahl von Objekten (“) bestehen
Warum gibt es das getrimmte und das winsorische Mittel?
Weil Mittelwert (aaritmetisches Mittel) sensitiv auf Ausreisser reagiert, kann man die abschneiden oder auf einen Wert festfrieren
Was versteht man unter robusten Lagemassen?
- winsorisches Mittel
- getrimmtes Mittel
Sind Quantile ein Lagemass oder ein Streuungsmass?
Lagemass und Basis für Dispersionsmasse (Streuungsmasse)
Was ist die emp. Varianz?
Die empirische Varianz auch Stichprobenvarianz (lateinisch: „Verschiedenheit“) genannt, ist eine statistische Angabe für die Streubreite von Werten einer Stichprobe und in der deskriptiven Statistik eine Kennzahl einer Stichprobe. Sie gehört zu den Streuungsmaßen und beschreibt die mittlere quadratische Abweichung der einzelnen Messwerte vom empirischen Mittelwert. Sie stellt damit eine Art durchschnittliches Abweichungsquadrat dar.
Was ist die emp. Standartabweichung?
- Ist ein Mass dafür, wie weit die Werte um den Mittelwert streuen. (NICHT: durchschnittliche Abw. vom Mittelwert)
reagieren Varianz und Standartabweichung sensibel auf Ausreisserwerte?
Ja, weil bei der Standartabweichung geht es ja darum wie weit die Werte vom Mittelwert entfernt liegen.
Und die Varianz errechnet sich ja dann aus der Standartabw.
Für was braucht man die Stichprobenvarianz und Stichprobenstandardabweichung?
Werden zur Schätzung der Varianz und Standardabweichung in der Population herangezogen. Man will von der Stichprobe auf andere schliessen können-
Wozu braucht es eine z-Transformation?
Man will die Werte in eine einheitliche Form bringen, besser zum Vergleichen. Auch zum Vergleich von Messwerten, die mit unterschiedlichen Messinstrumenten gewonnen wurden
Die Verteilung “-transformierter Werte hat einen Mittelwert von 0 und eine Standardabweichung von 1 (standardisierte Werte)
Masse der zentralen Tendenz:
Modus, Median, Mittelwert (+ gewogenes, getrimmtes, winsorisiertes Mittel)
Dispersionsmasse:
Streubereich, Variationsbreite, Quantile, !”#/%”#, Varianz,
Standardabweichung, relativer Informationsgehalt