Lage-, Streuungsmaße und Korrelation Flashcards
Was zeichnet statistische Maßzahlen aus?
Statistische Maßzahlen sind Parameter die Eigenschaften einer Häufigkeitsverteilung durch eine einzige numerische Größe kennzeichnen
Was charakterisiert die Lagemaße?
Ein Lagemaß charakterisiert diejenige Ausprägung eines Untersuchungsmerkmals, welche für die ermittelten Häufigkeitsverteilungen am typischsten sind.
Was ist das Ziel der Berechnung des Lagemaßes?
Die Häufigkeitsverteilung eines Merkmals hinsichtlich seines Zentrums zu kennzeichnen
Wozu dienen Streuungsmaße?
Sie dienen dazu die Brandbreite der Verteilung zu erklären und Abweichungen der Werte von ihrer Mitte zu erfassen
Nenne die Formel für das arithmetische Mittel
mü = 1/N * Summe von ai
Nenne die Vor- und Nachteile des arithmetischen Mittels
Vorteile:
- Kann leicht und einfach erfasst werden
- Kann fast bei allen Verteilungen und mathematischen Entwicklungen angewandt werden
- Summe reicht wenn Einzelwerte einer Ermittlung nicht bekannt sind
Nachteile:
- Nur rechnerische Mittelwert
- Unrealistische Werte können herauskommen (1,3 Kinder)
- Nicht für Zeitreihen geeignet (Eher Index)
Was sagt der Median aus?
Ist der Zentralwert einer der Größe nach geordneten Zeitreihe
Nenne die Formel des Medians bei ungeraden und geraden N
Ungerade N: Me = a_[(N+1)/2]
Gerade N: Me = 1/2*(a_[N/2]+a_[N/2+1])
Nenne die Formel des kleinberechneten Medians
Me = x^u_i + (0,5-F(x^u_i))/((F(x^o_i)-F(x^u_i))*(x^o_i-x^u_i) -> Nur bei der Klasse bei dem der Relative Summenhäufigkeit 50 % überschreitet
Nenne die Vor- und Nachteile des Medians.
Vorteile:
- Er ist nicht “ausreißerempfindlich”
- Der Median ist einfach zu bestimmen nach der Ordnung der Daten
- Ist meistens ein tatsächlich existierender Wert
Nachteile:
- Bei geraden N können sich theoretische Werte ergeben
- Nicht für alle Skalenniveaus geeignet
Definiere den “Modus”
Der Modus ist die häufigste Merkmalausprägung
Nenne die Vor- und Nachteile des Modus
Vorteile:
- Der Modus kann schnell und einfach aus einer Datentabelle abgelesen werden
- Einzige Lagemaß das auf Nominal Skalen angewandt werden kann
- Sehr stabil gegenüber extremwerten
Nachteile:
- Wird nur von dem Größenverhältnis an einer Stelle beeinflusst
- Nur vergleichbar mit anderen Untersuchungen wenn gleiche Dimensionen vorliegen
- Nicht für umfangreiche Fragestellungen geeignet
Nenne die Formel für die Varianz
Sigma^2 = 1/N*Summe von a^2_i - Mü^2
Nenne die Formel für die Standardabweichung
Sigma = Wurzel von Sigma^2
Was ist der Unterschied zwischen der empririschen und der stichproben Varianz
Empirische Varianz: Bezieht sich auf die Grundgesamtheit, wird durch N geteilt
Stichprobenvarianz: Die Varianz wird als “Schätzer” genomme und zusätzlich durch N-1 dividiert (Freiheitsgrad)
Nenne die Vor- und Nachteile der Varianz/Standardabweichung
Vorteile:
- Da jeder einzelner Messwert beeinflusst = Ergebnisse sehr exakt
- Sehr hilfreich wo Abweichungen wichtig sind zu registrieren (Quality)
Nachteile:
- Sehr empfindlich gegenüber Messwerten (Wenn Genauigkeit nicht so wichtig ist)
Was macht der Variationskoeffizient?
Der Variationskoeffizient normiert die Standardabweichung und macht diese Vergleichbar
Wie lautet die Formel für den Variationskoeffizienten?
VC = Sigma/Mü
Was ist die Spannweite und wie wird diese Berechnet?
Die Spannweite ist die Differenz zwischen dem kleinsten und dem größten Merkmalswert einer Datenerhebung
Was sind die Vor- und Nachteile der Spannweite?
Vorteil: - Unkomplizierte Berechnungsweise Nachteil: - Sehr empfindlich gegen Ausreißer - Nur für einen ersten und schnellen Überblick geeignet
Was wird mit der Korrelationsrechnung erfasst?
Die Stärke einer Beziehung zwischen zwei oder mehreren Merkmalausprägungen. Die wechselseitige Variation der Merkmale wird betrachtet
Was ist das Ziel der Regressionsrechnung?
Die Wirkungsrichtung und das Ausmaß des Einflusses eines unabhängigen Merkmals auf ein oder mehrere abhängige Merkmale festzustellen
Wie lautet die Formel für den Korrelationskoeffizienten nach Fechner (Vorzeichenkoeffizient)?
r_F = (Ü-N)/(Ü+N) Ü = Anzahl der in den Vorzeichen übereinstimmenden Paare (x-X̅)(y-Y̅) N = Anzahl der in den Vorzeichen nicht übereinstimmenden Paare (x-X̅)(y-Y̅)
Nenne die Vor- und Nachteile des Korrelationskoeffizienten nach Fechner
Vorteile:
- Übersichtlich und relativ schnell berechnet
Nachteile:
- Die exakten Abstände der Beobachtungen bleiben unberücksichtigt
Was erfasst die Kovarianz?
Die Kovarianz informiert über die gemeinsame Variabilität von zwei Merkmalen -> Ändert sich tendenziell das Merkmal X wenn sich Merkmal Y ändert
Wie lautet die Formel für die Kovarianz?
Cov(x,y) = (Summe von (xi- X̅)*(yi-Y̅))/n
Wie ist das Ergebnis der Kovarianz zu interpretieren?
- Nur das Vorzeichen ist ausschlaggebend nicht der Wert an sich
- Der Wert liegt im positiven Bereich gibt es einen gleichgerichteten lineare Zusammenhang
- Der Wert ist negativ wenn die Merkmale einen gegenläufigen linearen Zusammenhang haben
- Ist der Wert 0 besteht kein linearer Zusammenhang
Nenne die Vor- und Nachteile der Kovarianz
Vorteile:
- Gibt die Richtung einer Beziehung an
Nachteile:
- Wenig anschaulich da Größe des Wertes von der größe der Variablen abhängig sind
- Wird als alleiniger Parameter sehr selten verändert
Wozu dient der Bravais-Pearson-Korrelationskoeffizient?
Durch diese Kennzahl können die Stärke und die Richtung des Zusammenhangs zwischen zwei Variablen untersucht werden
Wie wird der Bravais-Pearson-Korrelationskoeffizient berechnet?
r = Kovarianz/(Standardabweichung X) * Standardabweichung Y
Wie ist das Ergebnis des Bravais-Pearson-Korrelationskoeffizienten zu interpretieren?
- r = -1: Werte von Y nehmen tendenziell ab wenn die Werte von X zunehmen
- r = 0: Es besteht kein Zusammenhang
- r = +1: Die Werte von Y nehmen tendenziell zu wenn die Werte von x zunehmen
Nenne die Vor- und Nachteile des Bravais-Pearson-Korrelationskoeffizienten.
Vorteile:
- Lineare Zusammenhänge von Merkmalen sind in einer Zahl zusammengefasst
- Wahrscheinliche Zusammenhänge werden erkannt
Nachteile:
- Aussagen sind nur tendenzen
- Prognose von Werten außerhalb des Wertebereiches ist nicht möglich