3 Logistische Regressionsanalyse Flashcards
Was ist die logistische Regression?
Eine Regressionsmethode zur Vorhersage der Wahrscheinlichkeit mittels, eine bestimmte Ausprägung einer kategorialen (meist dichotomen, z. B. Ja/Nein, 0/1) abhängigen Variable anzunehmen.
Was ist binär logistisch vs. multinominal logistisch?
binär logistisch: dichotome AV, z.B. Aufgabe nicht gelöst (=0) vs. Aufgabe gelöst (=1)
multinominal logistisch: mehrkategoriale AV, z.B. Antworten “ja”, “nein”, “weiss nicht”
Wann verwendet man eine logistische Regression?
Wenn die abhängige Variable kategorial (meist binär) ist und eine lineare Regression nicht geeignet wäre.
Wie lautet die Grundform der logistischen Regression?
logit(P) = ln(P / (1-P)) = β0 + β1X
Was ist der Unterschied zwischen einfacher und multipler logistischer Regression?
Einfache logistische Regression hat nur eine unabhängige Variable, multiple logistische Regression mehrere unabhängige Variablen.
Wie werden die Parameter in der logistischen Regression geschätzt?
Mit der Maximum-Likelihood-Methode (ML), die Werte findet, die die beobachteten Daten am wahrscheinlichsten machen.
Was ist die Maximum-Likelihood-Schätzung?
Ähnlich wie die Kleinste-Quadrate-Schätzung -> Es wird versucht, eine Funktionskurve zu finden, die möglichst gut zu den Daten passt. ABER: Sie ist keine gerad emehr, sondern eine logistische Funktion!
-> Sie saget für die beobachteten y-Werte mölglichst hohe Wahrscheinlichkeiten voraus, wenn y = 1 ist und möglichst tiefe, wenn y = 0 ist.
Wie ist die Regressionsgleichung bei der logistischen Regression darstellbar?
- in Form bedingter Wahrscheinlichkeiten der AV (häufig nicht möglich in Jamovi)
- in Form bedingter Wettquatienten (Odds, Odds-Ratio)
- in Form von Logits (Log-Odds, logarithmierte bedingte Wettquotienten) -> als einzige eine lineare Regressionsfunktion
Was ist die Darstellung der bedingten Wahrscheinlichkeit der AV?
- Den Kategorien Werte zuordnen (z.B. 1 für die interessierende Kategorie, 0 für die andere Kategorie)
- Gleichung siehe Bild
Wie könnte eine Darstellung der Bedingten Wahrscheinlichkeit aussehen?
- Krümmung weist auf die logistische Regression hin
- eine Person, die 0 positive Tagesereignisse zuv erzeichnen hatte, hat trotzdem eine wahrscheinlichkeit von 50% anzugeben, dass er/sie zufrieden mit dem Leben ist. Die Wahrscheinlichkeit steigt mit jedem positiven Lebensereigniss (aber nicht auf einer geraden/linear), da die Kurve abflacht.
Was bedeutet beta0 bei der “bedingten Wahrscheinlichkeit” der logistischen Regression?
wie überall auch “das allgemeine Niveau”
-> meist weniger interessant als b1
Was ist beta1 bei der “bedingten Wahrscheinlichckeit” der logistischen Regression
Stellt die Steigung dar
b1 zeigt Zunahme/Abnahme der Wahrscheinlichkeit bei steigendem X
-> Wenn b1 > 0, dann ist die Wahrscheinlichkeit von Y = 1 eine monoton steigende Funktion
-> wenn b1< 0. dann ist die wahrscheinlichkeit von Y = 1 eine monoton fallende funktion
Was sind bedingte Wettquotienten (Odds)?
Verhältnis aus der Wahrscheinlichkeit eines Ereignisses (trifft ein) und seiner Gegenwahrscheinlichkeit (trifft nicht ein) in Abhängigkeit der Ausprägung von X.
Wie könnte eine Darstellung der Wettquotienten aussehen?
- anders als bei der Bedingten Wahrscheinlichkeit bewegt man sich auf der y-Achse nicht mehr zwischen 0 und 1
- Mit dem Wechsel von 0 auf 1 positives Tagesereignis steigt die Angabe der Lebenszufriedenheit nur wenig.
Was ist b0 bei den bedingten Wettquotienten der logistischen Regression?
entspricht den Odds an der Stelle von X0 (Beispiel: Wie ist die Wahrscheinlichkeit zu erfrieren bei X=0 = Temperatur 0 Grad)
Was ist b1 bei den bedingten Wettquotienten der logistischen Regression?
entspricht dem Odds-Ratio
(z.B. Was ist die Wahrscheinlichkeit zu erfrieren, wenn die unabhängige Variable um einen Grad erhöht wird?)
Was ist der logarithmierte Wettquotient? Formel?
Was bedeutet ein Wettquotient von 1?
Die Wahrscheinlichkeit von Erfolg und Misserfolg ist gleich gross.
Odds > 1 → Erfolg ist wahrscheinlicher als Misserfolg
Odds < 1 → Erfolg ist unwahrscheinlicher als Misserfolg
Odds = 1 → Erfolg und Misserfolg sind gleich wahrscheinlich
Wie könnte die Darstellung der Logits aussehen?
- nun haben wir eine Gerade, die wir viel einfacher Interpretierten können
Was bedeutet b0 bei den Logits der logistischen Regression?
Logit an der Stelle X = 0
Was bedeutet b1 bei den Logits der logistischen Regression?
Veränderung des Logits, wenn X um eine Einheit erhöht wird.
Welche Effektgrössen gibt es in der logistischen Regression für einzelne UVs?
-Odds Ratio (OR)
Welche Effektstärken gibt es in der logistischen Regression für das Gesamtmodell?
- McFadden-Index
- Cox & Snell-Index
- Nagelkerke-Index
Was ist ein Nullmodell (Basismodell, Intercept-only-Modell)?
- Modell ohne Prädikatoren
- Es sagt nur, wie viele Fälle zu einer Kategorie gehören (Berückstigtigt nur das Gesamtmodell von 1ern und 0ern)
- McFadden Index misst z.B., wie viel besser ein Modell mit Prädiktoren ist im Vergleich zum Nullmodell.