Lage-, Streuungsmaße und Korrelation Flashcards
Was zeichnet statistische Maßzahlen aus?
Statistische Maßzahlen sind Parameter die Eigenschaften einer Häufigkeitsverteilung durch eine einzige numerische Größe kennzeichnen
Was charakterisiert die Lagemaße?
Ein Lagemaß charakterisiert diejenige Ausprägung eines Untersuchungsmerkmals, welche für die ermittelten Häufigkeitsverteilungen am typischsten sind.
Was ist das Ziel der Berechnung des Lagemaßes?
Die Häufigkeitsverteilung eines Merkmals hinsichtlich seines Zentrums zu kennzeichnen
Wozu dienen Streuungsmaße?
Sie dienen dazu die Brandbreite der Verteilung zu erklären und Abweichungen der Werte von ihrer Mitte zu erfassen
Nenne die Formel für das arithmetische Mittel
mü = 1/N * Summe von ai
Nenne die Vor- und Nachteile des arithmetischen Mittels
Vorteile:
- Kann leicht und einfach erfasst werden
- Kann fast bei allen Verteilungen und mathematischen Entwicklungen angewandt werden
- Summe reicht wenn Einzelwerte einer Ermittlung nicht bekannt sind
Nachteile:
- Nur rechnerische Mittelwert
- Unrealistische Werte können herauskommen (1,3 Kinder)
- Nicht für Zeitreihen geeignet (Eher Index)
Was sagt der Median aus?
Ist der Zentralwert einer der Größe nach geordneten Zeitreihe
Nenne die Formel des Medians bei ungeraden und geraden N
Ungerade N: Me = a_[(N+1)/2]
Gerade N: Me = 1/2*(a_[N/2]+a_[N/2+1])
Nenne die Formel des kleinberechneten Medians
Me = x^u_i + (0,5-F(x^u_i))/((F(x^o_i)-F(x^u_i))*(x^o_i-x^u_i) -> Nur bei der Klasse bei dem der Relative Summenhäufigkeit 50 % überschreitet
Nenne die Vor- und Nachteile des Medians.
Vorteile:
- Er ist nicht “ausreißerempfindlich”
- Der Median ist einfach zu bestimmen nach der Ordnung der Daten
- Ist meistens ein tatsächlich existierender Wert
Nachteile:
- Bei geraden N können sich theoretische Werte ergeben
- Nicht für alle Skalenniveaus geeignet
Definiere den “Modus”
Der Modus ist die häufigste Merkmalausprägung
Nenne die Vor- und Nachteile des Modus
Vorteile:
- Der Modus kann schnell und einfach aus einer Datentabelle abgelesen werden
- Einzige Lagemaß das auf Nominal Skalen angewandt werden kann
- Sehr stabil gegenüber extremwerten
Nachteile:
- Wird nur von dem Größenverhältnis an einer Stelle beeinflusst
- Nur vergleichbar mit anderen Untersuchungen wenn gleiche Dimensionen vorliegen
- Nicht für umfangreiche Fragestellungen geeignet
Nenne die Formel für die Varianz
Sigma^2 = 1/N*Summe von a^2_i - Mü^2
Nenne die Formel für die Standardabweichung
Sigma = Wurzel von Sigma^2
Was ist der Unterschied zwischen der empririschen und der stichproben Varianz
Empirische Varianz: Bezieht sich auf die Grundgesamtheit, wird durch N geteilt
Stichprobenvarianz: Die Varianz wird als “Schätzer” genomme und zusätzlich durch N-1 dividiert (Freiheitsgrad)
Nenne die Vor- und Nachteile der Varianz/Standardabweichung
Vorteile:
- Da jeder einzelner Messwert beeinflusst = Ergebnisse sehr exakt
- Sehr hilfreich wo Abweichungen wichtig sind zu registrieren (Quality)
Nachteile:
- Sehr empfindlich gegenüber Messwerten (Wenn Genauigkeit nicht so wichtig ist)
Was macht der Variationskoeffizient?
Der Variationskoeffizient normiert die Standardabweichung und macht diese Vergleichbar
Wie lautet die Formel für den Variationskoeffizienten?
VC = Sigma/Mü
Was ist die Spannweite und wie wird diese Berechnet?
Die Spannweite ist die Differenz zwischen dem kleinsten und dem größten Merkmalswert einer Datenerhebung
Was sind die Vor- und Nachteile der Spannweite?
Vorteil: - Unkomplizierte Berechnungsweise Nachteil: - Sehr empfindlich gegen Ausreißer - Nur für einen ersten und schnellen Überblick geeignet
Was wird mit der Korrelationsrechnung erfasst?
Die Stärke einer Beziehung zwischen zwei oder mehreren Merkmalausprägungen. Die wechselseitige Variation der Merkmale wird betrachtet
Was ist das Ziel der Regressionsrechnung?
Die Wirkungsrichtung und das Ausmaß des Einflusses eines unabhängigen Merkmals auf ein oder mehrere abhängige Merkmale festzustellen
Wie lautet die Formel für den Korrelationskoeffizienten nach Fechner (Vorzeichenkoeffizient)?
r_F = (Ü-N)/(Ü+N) Ü = Anzahl der in den Vorzeichen übereinstimmenden Paare (x-X̅)(y-Y̅) N = Anzahl der in den Vorzeichen nicht übereinstimmenden Paare (x-X̅)(y-Y̅)
Nenne die Vor- und Nachteile des Korrelationskoeffizienten nach Fechner
Vorteile:
- Übersichtlich und relativ schnell berechnet
Nachteile:
- Die exakten Abstände der Beobachtungen bleiben unberücksichtigt