Statistik Flashcards
Bedeutung statistischer Analysen für die Soziologie
> dient, nach der Datenerhebung, der Auswertung und Analyse der meist standardisierten Daten
> die statistische Analyse trägt dazu bei Zusammenhänge aufzudecken und zu verdeutlichen
> Statistische Analyse hat eine zusammenführende Wirkung
> Statistik in der Soziologie hat auch im Hinblick auf die Darstellung von Wissen einen hohen Stellenwert
Wo liegen die Stärken statistischer Analyse?
> hoher Verallgemeinerungsgrad
(Abbildung des großen Ganzen/Vogelperspektive)
—>verborgene Strukturen
> Zusammenführung von (begrenzten) Informationen vieler Einzelfälle
> Analyse von Trends
>
Wo liegen die Schwächen statistischer Analysen?
> durch hohe Verallgemeinerung = Vernachlässigung individueller Besonderheiten, welche wichtig für das Phänomen sind
> Fehler in erhobenen Daten —> doppelte Hermeneutik
(Interpretation des Beforschten, wenn Fragebogen)
> Statistische Ergebnisse müssen so “übersetzt” werden, dass man mit ihnen Hypothesen/Theorien/Fragen beantworten kann
Skizzieren sie die Entwicklung statistischen Wissens?
> Entstanden durch unterschiedliche Praxisfelder
> Zählbarkeit gewann im Laufe der Geschichte immer mehr an Relevanz
> Zählbarkeit brachte neue Möglichkeiten
> Institutionalisierung (Forschungseinrichtungen und akademischen Institute) sorgte für Zusammenführung und Kanonisierung des gesammelten Wissens (der Verfahren) aus den verschiedenen Praxisfeldern
> Statistik = Dynamische Wissenschaft —> ständige Entwicklung neuer Methoden, Verflechtung mit alten Methoden
> durch Dynamik gibt es verschiedene Strömungen die sich im Laufe der Zeit entwickelt haben
Skizzieren sie die historischen Entwicklungen an Hand verschiedener Anwendungsfelder statistischen Wissens.
> Koordination von Regionen eines Herrschers (mit Universitätsstatistik)
> Universitätsstatistik = Lehre ü. den Staat /
(Schwächen und Stärken, sowie Nützlichkeit für das Reich)
> Beschreibung von Ländern und Regionen (Politische Arithmetik)
> Politische Arithmetik = nur zähl & messbare Gegenstände
> Politische Arithmetik = Vorläufer der amtlichen Statistik
> Amtliche Statistik = erste Professionalisierung von statistischem Wissen
> ab dem 19. Jhd. Befasste sich unter anderem mit Volkszählung
Erläutern sie die verschiedenen Verwendungsweisen des Begriffs Statistik.
> Statistische Auswertungen bzw. das Produkt dieser wird als Statistik eines Bereiches bezeichnet.
> Auswertung und Zusammenstellung von Daten, anhand statistischer Analyse Methoden
Klären sie die Herkunft des Begriffs Statistik.
> statisdique (frz.) —> Staatswissenschaft
Systematische Beschreibung eines Staates und dessen Bevölkerung auf zahlenmäßiger Ebene.
Klären sie die Begriffe induktive und deduktive Statistik.
INDUKTIV:
> schließende Statistik
Beziehung zwischen Eigenschaften einer Stichprobe
Das Schätzen und das Testen sind die beiden Formen der schließenden Statistik
DEDUKTIVE/DESKRIPTIVE:
> Beschreibende Statistik
Ordnung und Darstellung von Daten
Gewinnung von Überblicksinformationen großer Datenmengen
Verdichtung numerischer Informationen
Erläutern sie, was ein Kodeplan ist.
> Auflistung aller verwendeten Variablen mit einer eindeutigen inhaltlichen Bedeutung der numerischen Codes
> evtl. weitere Informationen, welche sich auf den Messvorgang beziehen
Was sind Untersuchungseinheiten, Merkmale, Variablen, Merkmalsausprägungen?
UNTERSUCHUNGSEINHEITEN:
= Untersuchungsgegenstand z.B Menschen, Familien, Städte…
MERKMALE:
= Dimensionen der Untersuchungseinheiten z.B Alter, Bildungsgrad…
VARIABLEN:
= mathematischer Begriff für Merkmale
MERKMALSAUSPRÄGUNGEN:
= Ausprägung die eine Untersuchungseinheit in einer Merkmalsdimension aufweist
(Inhaltliche Ausprägung der Merkmalsdimensionen)
Erläutern sie den Begriff der Datenmatrix und legen sie dar, welche Informationen in den Zeilen, den Spalten und den Feldern der Matrix enthalten sind.
> enthält Daten über mehrere Merkmale, mehrer Personen oder Objekte und die dazugehörige Merkmalsausprägung
> ZEILEN
Untersuchungseinheit
> SPALTEN
Dimensionen der Untersuchungseinheit/ Merkmale/ Variablen
> FELDER
Merkmalsausprägung
Was versteht man im Sinne der klassischen Messtheorie unter messen?
> Versuch der Abbildung von sozialen Phänomenen im metrischen Raum
Wie hängen die Rechenregeln im numerischen Raum mit dem Messprozess zusammen?
> Symbole, Zahlen usw. dienen als Übersetzung von Beobachtungen von Phänomenen des sozialen Raums
Abstrakte Darstellungsform des sozialen Raums
Rechenregeln =≠,<>,+-,*:
Stellen sie verschiedene Skalenniveaus und die möglichen Rechenoperationen dar; geben sie Beispiele und begründen diese.
NOMINAL :
>gleich oder ungleich
> z.B Religion, Wohnort
> f(x)=f(y), f(x)≠(y)
ORDINAL:
>gleich oder ungleich, kleiner oder größer
> z.B Schulabschluss, Noten
> f(x)>f(y), f(x)gleich oder ungleich, kleiner oder größer, Abstand des Grrößenunterschieds
> z.B IQ
>f(x)-f(y)>_f(w)-f(z)
Intervall
RATIO:
>gleich o. ungleich, kleiner o. größer, Abstand des Größenunterschieds, Beziehung des Größenunterschieds —> Verhältnisaussagen
> z.B doppelt, halb so viel Einkommen
>f(x)=a*f(y)
Was ist eine dichotome Variable?
> ordinal oder nominal skaliertes Merkmal
> lediglich ZWEI Ausprägungen
(JA o. NEIN)
Was sind diskrete und stetige Daten?
STETIG
> metrisch skaliert
> innerhalb eines Intervalls unendlich viele Ausprägungen, weil immer Zwischenwerte vorliegen (Körpergröße)
DISKRET
> metrisch skaliert
> nimmt nur einzelne Zahlenwerte an (Alter in Jahren)
Diskutieren Sie das Problem, auf welchem Skalenniveau das Ergebnis einer Einstellungsfrage, zu der in der Abstufungen eher zustimmend oder eher ablehnend Stellung genommen wird, anzusiedeln ist.
> eher ordinal (oder eventuell metrisch diskret), weil die Größe des Abstands nicht definierbar ist.
Man kann keine Aussage über die “gefühlten” Abstände machen
Schwer vergleichbar
Erläutern Sie an diesem Beispiel Eigenschaften des arithmetischen Mittels und des Medians
ARITHMETISCHES MITTEL: > wird auch Durchschnitt genannt > Voraussetzung: metrisch skaliert > stärker durch Extremwerte beeinflusst, kein Informationsverlust >Nachteil: Verzerrung
MEDIAN:
> der Wert der in der Mitte steht, wenn die Messwerte der Größe nach geordnet sind
> Voraussetzung: ordinal oder metrisch skaliert
>
Was spricht dafür/dagegen bei einer repräsentativen Stichprobe den Einkommensmedian bzw. das arithmetische Mittel des Einkommens zu verwenden?
MEDIAN:
>Informationsverlust
(Nicht so sehr vom Extremwert abhängig, zeigt an auf welchen Wertebereich Verteilung konzentriert ist
ARITHMETISCHES MITTEL:
> stärker durch Extremwerte beeinflusst, dadurch kein Informationsverlust
Nachteil: Verzerrung —> kein Schluss darauf, zB. Wie groß die Mehrheit ist/ wie viel die “Allgemeinheit” verdient
In welcher Beziehung stehen Median und ar. Mittel in einer links/rechtssteilen Verteilung?
> eine Verteilung von Messwerten wird als schief bezeichnet wenn sie in der Weise asymmetrisch ist, dass links oder rechts des Durchschnitts eine Häufung der Messwerte auftritt
Stellen Sie verschiedene Maßzahlen zur Beschreibung von Streuungen dar und beschreiben sie ihre Eigenschaften.
Streuung beschreibt Abweichung der Werte einer Verteilung vom Mittelwert.
> Range (Spannweite)
Maximaler Wert minus Minimaler Wert, nur Extremwerte
> Quartilsabstand:
Q3-Q1, 50 % der Fälle, Fokus auf mittlere Werte, keine Ausreißer
> Quantilsverhältnisse:
z.B. Q90/Q10, Rand der Verteilung ohne Ausreißer
> Durschnittliche Abweichung vom arithm. Mittel:
Summe der absoluten Abweichung vom Mittelwert jedes Falles durch die Fallzahl
> Varianz
Das gleiche wie, nur mit quadriertem Abständen, anfälliger für große Abstände
Summe der quadrierter Abstände = Variation
> Standardabweichung
= Wurzel der Varianz (s)
Gibt Auskunft über die Aussagekraft des Mittelwerts
Was ist ein Varianzkoeffizient und wozu dient er?
> Setzt die Standartabweichung in Verhältnis zu Mittelwert
(s/xquer), um Steuungen vergleichbar zu machen
Beschreiben Sie, welche Eigenschaften von Verteilungen mit Konzentrationsmaßen erfasst werden können.
> Wie ist die Summe der Merkmalsausprägungen auf UEs verteilt?
Was unterscheidet Streuungs- und Konzentrationsmaße?
Streuung:
wie verteilen sich UEs auf verschiedne Merkmalsausprägungen und wie stark weichen sie vom Mittelwert ab
Konzentration:
Wie ist die Summe der Merkmalsausprägungen auf EUs verteilt
Geben Sie ein Beispiel für die sinnvolle Anwendung eines absoluten Konzentrationsmaßes.
> Aufsummierung der Marktanteile
> sinnvolle Anwendung ist die Monopolbildung
Wo liegen die Schwächen eines absoluten Konzentrationsmaß?
> Es wird jeweils nur eine Seite des Konzentrationsprozesses beleuchtet, offenbleibt, wie viele Zeitungen sich den Rest des Marktes teilen.
Geben sie Beispiele für die sinnvolle Anwendung eines summarischen Konzentrationsmaßes?
> Summe der quadrierter Marktanteile
Marktanteil von Zeitungen
nicht nur Monopolbildung wird betrachtet, sondern die Summe aller Zeitungen
Wo liegen die Schwächen eines summarischen Konzentrationsmaßes?
Nachteil: Untergrenze ist abhängig von der Fallzahl, bedingt vergleichbar, daher Anwendung bei Verteilungen höheren Fallzahlen
Geben sie ein Beispiel für die sinnvolle Anwendung eines relativen Konzentrationsmaßes?
Beispiel: Welcher Anteil der Merkmalssumme fällt auf einen bestimmten Anteil der Merkmalsträger
Häufig Lorenzkurve
Einkommensverteilung kann man damit Darstellen
Wie viel Einkommen sìch auf wie viele Personen verteilt
Je stärker die Lorenzkurve von der Diagonalen abweicht desto ungleicher ist die Verteilung
Stellen sie den Grundgedanken des Lorenzkurvenmaßes schriftlich und graphisch dar und beschreiben sie den Wertebereich.
> Relatives Konzentrationsmaß
Visualisierung von Konzentrationen
Gerade Linie steht für keine Konzentration
je stärker die Kurve von gerader Linie abweicht, desto stärker ist die Merkmalssumme konzentriert
Y-Achse: kum Anteil Merkmalssumme
X-Achse: kum. Anteil Fälle
> GINI INDEX
Fläche oberhalb der Kurve(F1) durch Gesammtfläche F1+F2
Wenn F1=0, GINI=0, keine Konzentration
Wenn F2=0; GINI= 1, völlige Konzentration
Erklären sie das Konzept der Äquivalenzgewichtung für die Analyse von Haushaltseinkommen.
Ökonomische Technik, bei der die Haushaltsmitglieder verschiedene Gewichtungen bekommen.
Anhand von OECD-Skala
(1. Erwachsener 1,0; jeder weitere Erwachsene ü. 15 0,5; Kinder unter 15 0,3)
> Gesammter Haushalt wird durch die Summe der Gewichtung geteilt um ein repräsentatives Einkommen zu bekommen (Einkommen steigen dadurch)
Welche Folgen hat die Wahl der beiden OECD-Skalen für die Messung von Kinderarmut?
Die Gewichtung der neuen OECD-Skala sorgt dafür, dass die Familien reicher wirken, weil weitere Erwachsene und Kinder weniger zählen, dass hat zur Folge dass man durch einen geringeren Wert teilt und somit zu einem höheren einkommen kommt.
Das sorgt dafür das Kinderarmut schlechter aufgedeckt werden kann.
Erläutern sie die Entscheidungen, die der Bestimmung von Armutsquoten zu Grunde liegt.
Methodische Entscheidungen:
> Ressourcen-basierte vs. Lebenslagen-basierte Bestimmung von Armut
> relative vs. absolute Armutsgrenze
> Individualperspektive vs. Haushaltsperspektive
> Entscheidung der Äquivalenzgewichtung (neue vs. alte OECD Skala)
> Entscheidung über Flächeneinheit, für die das Maß bestimmt wird
(National, regional)
> Entscheidung über rel. Armutsgrenze (50,60%..) und die Maßzahl
(Median, ar. 🖕🏽)
Wie kann das Armutsmaß interpretiert werden, wenn als Parameter 0/1 gewählt werden?
Verschiedene Parameter: (FGT Armutsmaß)
0=Armutsquote ( Wie viel % sind unter der Armutsgrenze?)
1= Armutslücke (Wie viel % des Grenzeinkommens muss umverteilt werden?/ Wie viel Grenzeinkommen fehlt den Armen um durchschnittlich nicht mehr arm zu sein?)
2=Armutsintensität, durchschnittliche quadrierte Einkommenslücke
Erläutern sie an dem Beispiel Lohnzufriedenheit das Konzept der unabhängigen und der abhängigen Variable.
Lohnzufriedenheit ist abhängig von der Anstellung des Menschen, somit ist Lohnzufriedenheit die abhängige und die Anstellung die unabhängige Variable
Was versteht man unter einer Kreuztabelle?
= systematische Darstellung der Ausprägungskombinationen zweier Merkmale
Für Daten welchen Skalenniveaus lassen sich Kreuztabellen aufstellen?
Beliebige Skalenniveuas, weil pro Variable eine Ausprägung reicht
Was ist damit gemeint (im soziologischen Sinne), wenn man sagt, es bestehe ein Zusammenhang zwischen Schulbildung und Einkommen?
> das würde Bedeuten dass jemand mit einer höheren Schulbildung auch automatisch ein höheres Einkommen hat
In welchem Zusammenhang stehen Zusammenhangs- und Kausalitätsaussagen?
Zusammenhangsaussagen:
>Aussagen aus statistischen Analysen (nicht alle Merkmale sondern ein paar selektierte)
Kausalaussagen:
Einbindung aller Bestandteile eines Phänomens
Zusammenhangsaussagen können Bestandteil einer Konstruktion einer Kausalaussagen sein. Es ist aber sehr kühn aus einer einzigen Zusammenhangsaussagen eine Kausalaussage zu formulieren