Logistische Regression Flashcards
Wozu dient eine Logistische Regression
dient dazu eine dichotome abhängige Variable Y (mit den Ausprägungen 0 und 1) durch eine metrische unabhängige Variable X vorherzusagen.
Doch anstatt die abhängige Variable direkt vorherzusagen, wird die Wahrscheinlichkeit für eine der beiden Kategorien vorhergesagt.
𝑃(𝑌=1/𝑋=𝑥) =1−𝑃(𝑌=0/𝑋=𝑥)
Die WSK (1Darstellung) liegen auf einer
Exponentialfunktion &nicht auf einer Linie (vorhergesagten Werte zwishcen 0&1)
Der Parameter e𝛽0/1+eb0 ist die
bedingte Wahrscheinlichkeit 𝑃 (𝑌 = 1 /𝑋 = 0)
Je größer 𝛽0 , desto
größer ist die Wahrscheinlichkeit.
Parameter 𝛽1 beschreibt
die Steigung der Wahrscheinlichkeitsfunktion.
(1darstellungsform)Größere Werte stehen für
eine stärkere Steigung am Punkt 0 des Prädiktors
Darstellung in Form der bedingten Wettquotienten
Basis von Wettquotienten
Die vorhergesagten Werte liegen zwischen 0 und +∞.
Die Wahrscheinlichkeitswerte (als Odds) liegen auf einer Exponentialfunktion und steigen immer weiter an.
Bedeutung der Parameter: 𝒆𝜷𝟎
Darstellung mit Wettquotienten sind die Parameter anders zu interpretieren.
Der Parameter 𝑒𝛽0 entspricht der Wettquotienten an der Stelle 𝑋 = 0.
Ein Wettquotient von 1 bedeutet, dass beide Kategorien der AV gleich wahrscheinlich sind.
Ein Wettquotient über 1 bedeutet, dass die Kategorie 1 wahrscheinlicher ist als die Kategorie 0.
Bedeutung der Parameter: 𝒆𝜷𝟏 (Wettquotienten)
Der Parameter 𝑒𝛽1 gibt die Veränderung des Wettquotienten an, wenn die unabhängige Variable um eine Einheit erhöht wird.
Der Parameter 𝑒𝛽1 ist also ein Wettquotientenverhältnis (Odds-Ratio).
In der logistischen Regression erfolgt dieÜberprüfung der
Regressionskoeffizienten durch
den Wald-Test.
Wie ist die Prüfgröße Die Wald Statistik verteilt
asymptotisch chi quadrat verteilt
Darstellung in Form des Logit
logarithmierten Wettquotienten. Die Wahrscheinlichkeitswerte (als Logit) liegen auf einer Graden und steigen immer weiter an.
Eigenschaften der Darstellung mit Logit
Der Logit selbst ist als logarithmierter Wettquotient nicht intuitiv verständlich. Der Vorteil ist allerdings, dass die Funktion zur Beschreibung des Logit eine Grade wie in der normalen Regression ist.
Die Regressionskoeffizienten 𝑏0 und 𝑏1 zeigen also den Achsenabschnitt und die Steigung zur Beschreibung des Logit an
KI Logistische Regression
Wenn der Test sig. ist dann ist die 1 nicht im Intervall