Arbeitsbuch Flashcards
In welchen Fällen ist der Gini-Index nur bedingt aussagekräftig?
Ganz unterschiedliche Verteilungen können den gleichen Gini-Index besitzen. Die Gestalt der Verteilung muss zusätzlich zur Maßzahl untersucht werden. Zudem ist der Gini-Koeffizient ein Maß der relativen Konzentration. Aussagen über die absolute Konzentration sind damit nicht möglich. Diese können aber unter Umständen von großer Relevanz sein.
Signifikanz eines Zusammenhangs
Wahrscheinlichkeit, mit der ein vermuteter Zusammenhang (Korrelation) auch in Wirklichkeit besteht.
Stärke eines Zusammenhangs
Korrelation
Kausalität
Wirkungsrichtung
Freiheitsgrade ablesen:
t-Test auf Mittelwertdifferenzen für unabhängige Stichproben
Df = n1 + n2 - 2
Freiheitsgrade ablesen:
T-test auf Mittelwertdifferenzen (abhängig)
Df = n - 1
Freiheitsgrade ablesen:
T-test der Regressionskoeffizienten
Df = n - 1 - p
Freiheitsgrade ablesen:
F-Test
Spalte: Anzahl UV
Zeile: Df = n - 1 - p
Modus > Median > a.M.
Linksschief/rechtssteil
Modus < Median < a.M.
Rechtsschief/linkssteil
Warum muss man R^2 bei multipler Regression adjustieren?
Weil bei mehreren UVs R^2 steigt
Standard Error
Standardfehler der Schätzung
Nicht das Gleiche wie Standardfehler der Koeffizienten
A) Je mehr …… vorhanden, desto stabiler die Regression.
B) mindestens …….. für die Residuen
C) auf jede UV sollten ……. Df kommen
A) Freiheitsgrade
B) 10
C) 10
Was prüft der F-Test?
Die Signifikanz der Regression, d.h. Ob R^2 = 0 oder nicht
Beta
Standardisierte Regressionskoeffizienten
Geben den Wert der Regressionskoeffizienten an, wenn alle Werte mittels einer z-förmigen Transformation standardisiert wurden und die Regressionsschätzung noch einmal durchgeführt wurde
Je höher Beta, desto größer der Einfluss auf die AV
T-Test der Regressionskoeffizienten
Prüft, ob die Steigungsparameter signifikant von 0 unterschiedlich sind
Was muss man für eine doppelt so genaue Schätzung einer Stichprobe machen?
Sie vervierfachen
Für die Bildung einer Indifferenztabelle zur Berechnung von CHI setzen Sie voraus, dass zwischen den Merkmalen … herrscht.
A Korrelation
B Unabhängigkeit
C Indifferenz
B
Das RLD-Verfahren, das bei Telefonumfragen angewandt wird, ist dazu da, eine … sicherzustellen.
A echte Zufallsauswahl
B geschichtete Auswahl
C mehrstufige Auswahl
C
Welche wichtige Eigenschaft unterscheidet das arithmetische Mittel con anderen Lagemaßen?
A minimale Varianz
B 0-Wert-Eigenschaft der Varianz
C hoher Bekanntheitsgrad
A
Beim Boxplot ist ein Extremwert dadurch definiert, dass er …
A mehr als 4 Kastenlängen vom 1. Oder 3. Quartil entfernt ist.
B mehr als 1,5 Kastenlängen vom 1. Oder 3. Quartil entfernt ist.
C mehr als 3 Kastenlängen vom 1. Oder 3. Quartil entfernt ist.
C
Welche dieser Aussagen ist richtig?
A Eine hohe Korrelation bedeutet nicht notwendigerweise einen starken kausalen Zusammenhang.
B Scheinkorrelationen zeigen einen direkten kausalen Zusammenhang zwischen zwei Variablen auf.
C Mit Hilfe einer Partialkorrelation kann man den indirekten Einfluss einer dritten Variablen auf die AV identifizieren.
D Bei einer konvergenten Kausalstruktur gibt es zwischengeschaltete Variablen, die auf die AV einwirken.
A, B, C
Was ist unter der SChwerpunkteigenschaft der Regressionsgerade zu verstehen?
A y = a + bx
B yStrich = a + bxStrich
C yDach = a + b*xDach
B
Was versteht man unter “goodness of fit”?
A R Quadrat
B Güte des Modells
C Determinationskoeffizienten
D Verhältnis von erklärter und Gesamtstreuung
A, B, C, D