Statistik Flashcards
Prozentrang
Gibt an wie viel Prozent eines Messwertes kleiner, oder gleich gross sind.
Prozentrang berechnen
- Bilde eine Rangliste
- Wenn Werte mehrmals auftreten bilde Verbundsränge
- Dividiere den Rang durch gesamte Anzahl Ränge & multipliziere mit 100
- Subtrahiere das Ergebnis von 100% um den Prozentrang zu erhalten
Perzentil
Das Perzentil ist die Umkehrung des Prozentranges. Das 50. Perzentil beschreibt den Median.
Perzentil berechnen
Beispiel: Gehen wir davon aus, dass nach dem 1. Jahr des Psychologiestudiums 56% der Studenten ausscheiden.
Zudem gehen wir für die Prüfung von einer Gesamtpunktzahl von 400 Punkten aus.
-> Ab dem 56. Perzentil hat man bestanden.
Perzentil = 56% der Gesamtpunktzahl
400 x 0.56 = 224
Mittelwert
- Summe aller Messwerte dividiert durch die Anzahl Objekte
- Erwartungsgemässer Schätzwert für den Populationsmittelwert
- Die Berechnung des Mittelwerts macht nur für Intervall- und Verhältnisskalen Sinn
Median
- Der Median entspricht dem 50. Perzentil (50% aller Messwerte liegt darüber, oder darunter.
- Die Berechnung des Median setzt mindestens ein Ordinalskalenniveau voraus.
Median berechnen
Beispiel: Skirennen mit 35 Fahrern
Zeit des 18. Platzierten = Median
Modus
- Messwert, welcher am häufigsten auftritt
- Stabil gegenüber Ausreissern
- Es sind mehrere Modus möglich
- Auch auf Nominaldaten berechenbar
Streuungsmasse (Varianz, Standardabweichung & Range)
Wie stark streuen die Messwerte?
- Kleine Streuung = grosse Tendenz
- Grosse Streuung = keine Tendenz
Varianz
Misst die Abweichung der Messwerte zum Mittelwert
Standardabweichung
Wurzel der Varianz. (Die Varianz wird immer in x^2 angegeben)
Range
Gibt an in welchem Intervall sich die Messwerte befinden.
Beispiel: Altersverteilung (19-54) ergibt einen Range von 35 (54-19)
Interdezilbereich
Entfernt die unteren und die oberen 10% des Range und verkleinert somit die Streuung, da Ausreisser eliminiert werden, was die Aussagekraft erhöht.
Schiefe
Dient zur Bestimmung der zentralen Tendenz
- rechtssteile Verteilung = negative Schiefe
- linkssteile Verteilung = positive Schiefe
- bei einer symmetrischen Verteilung ist die Schiefe immer 0
Schiefe berechnen
(Mittelwert - Modus) / genaue Stichprobenstandardabweichung
Normalverteilung
Ist unimodal und hat die höchste Eintretenswahrscheinlichkeit beim Mittelwert
- Modus = Mittelwert = Median
Standardnormalverteilung
- Wird genutzt, um verschiedene Stichproben mit unterschiedlichen Mittelwerten und Standardabweichungen miteinander vergleichen zu können.
- Die Werte auf der x-Achse werden in Standardabweichungen umgewandelt
- Durch die z-Transformation wird der Mittelwert der Funktion 0 und die Standardabweichung 1
Z-Transformation
Durch die Normierung der Stichproben entsteht eine Funktion mit Mittelwert = 0 und Standardabweichung = 1
- Die zu den Z-Werten zugehörigen Wahrscheinlichkeiten müssen aus einer Tabelle abgelesen werden.
Inferenzstatistik
In der Inferenzstatistik schätzt man über Stichprobenkennwerte Populationskennwerte und führt mit Hilfe dieser Schätzungen Hypothesenprüfungen durch.
Stichprobenkennwertverteilung
Man ziehe aus der Grundgesamtheit (Population) beliebig viele Stichproben. Die Stichprobenkennwertverteilung bezieht sich nun auf die Unterschiede der Kennwerte (Mittelwert, Varianz, …) der verschiedenen Stichproben.
- Das Streuungsmass dieser Verteilung ist der Standardfehler.
- Desto grösser der Stichprobenumfang, desto eher gleicht die Kennwertverteilung einer Normalverteilung (erst möglich ab 30N)
Mittelwertverteilung
Verteilung der Mittelwerte beliebig vieler Stichproben aus einer Population
- Ist eine häufige Form der Kennwertverteilung
Standardfehler
Der Standardfehler ist die Streuung der Kennwertverteilung und berechnet sich stets aus der Standardabweichung.
Alternativhypothese
Hypothesen sollen den bisherigen Wissensstand ergänzen/erweitern.
Hypothesen die innovative Aussagen beinhalten, werden als Gegen- oder Alternativhypothesen bezeichnet.
Nullhypothese
Die Nullhypothese ist stets die absolute Negation der Alternativhypothese (nicht das Gegenteil).
Beispiel: Neue Lernmethode höchstens gleich gut, oder schlechter.
α - Fehler
- Die Wahrscheinlichkeit auf Grund der Stichprobe zugunsten von H1 zu entscheiden, obwohl H0 gilt.
- Alpha Fehler = Fläche unter der Funktion links ( 1 - Wert aus der Tabelle = α - Fehler )
β - Fehler
Die Wahrscheinlichkeit auf Grund der Stichprobe zugunsten von H0 zu entscheiden, obwohl H1 gilt.
Signifikanzniveau und Konventionen
(Alpha & Beta
- Alpha meist 1% oder 5%
- Beta meist 20%
Einseitige Hypothese
- Etwas ist besser, oder schlechter als…
- Wird einseitig getestet
- Berechnung durch z- oder t-Transformation
Konfidenzintervall
Bereiche in denen sich Populationsparameter (Populationsmittelwert) befinden, die als Erzeuger eines empirisch bestimmten Stichprobenkennwerts mit einer bestimmten Wahrscheinlichkeit in Frage kommen.
- Häufig 95% oder 99%