logistische Regression Flashcards
Worum geht es in der logistischen Regression?
binäres Kriterium: In der logistischen Regression sagen wir ein Kriterium vorher, welches nur zwei Werte, nämlich 1 oder Null annehmen kann.
Probleme einer normalen linearen Regression auf ein binäres Kriterium
- unzulässiger Wertebereich
- Normalverteiltheit der Residuen nicht möglich
- Homogenität der bedingten Varianzen
Probleme einer normalen linearen Regression auf ein binäres Kriterium: 1. unzulässiger Wertebereich
wendet man auf ein binäres Kriterium eine normale Regression an, treten Werte in einen unzulässigen Wertebereich auf (also einem Wertebereich für das Kriterium der außerhalb von 0 oder 1 liegt) –> wir müssen also eine Funktion finden, die die Daten möglichst gut beschreibt
Probleme einer normalen linearen Regression auf ein binäres Kriterium: 2. Normalverteiltheit der Residuen nicht möglich
Um Nullhypothesen-Signifikanztests über Parameter durchführen zu können, haben wir nämlich eine Normalverteiltheit der Residuen Die Normalverteiltheit von Residuen setzt eine kontinuierliche Variable voraus. Da keine kontinuierliche Variable bei einem binären Kritierum vorliegt, sondern die Variable nur zwei Werte annehmen kann, können auch die bedingten Residuen nur zwei Werte annehmen.
Probleme einer normalen linearen Regression auf ein binäres Kriterium: 3. Homogenität der bedingten Varianzen
die Zweite Voraussetzung für Nullhypothesen-Signifikanztests über Parameter ist die Homogenität der bedingten Varianzen. Da die Varianz einer binären Variable wie folgt berechnet wird: 〖S²〗_X=P*(1-p)
Dies bedeutet, dass die Varianz eine Funktion von P ist. Sie erreicht ihr Maximum 0.25 bei P = 0.5 und wird ansonsten kleiner
Wie löst die logistische Regression die beschriebenen Probleme?
Indem die „Zielfunktion“ der logistischen Funktion durch eine sog. Link-Funktion linearisiert wird und das Ergebnis wiederum durch eine Linearkombination von Prädiktoren modelliert werden kann. Insofern kann das Verallgemeinerte Lineare Modell mit drei Komponenten beschrieben werden als: E(Y)=g(µ)=a+b_1 X_1+⋯+b_q X_q
Zusammensetzung der logistischen Funktion
- systematische Komponente (ganz rechts)
- zufällige Komponente (ganz links)
- Link-Funktion g(µ)
Zusammensetzung der logistischen Funktion: 1. systematische Komponente (ganz rechts)
als Linearkombination von Prädiktoren, ganz ähnlich wie bei der multiplen linearen Regression
Zusammensetzung der logistischen Funktion: 2. zufällige Komponente
(ganz links): die das Kriterium und dessen Verteilung spezifiziert. Auch dies ist analog zum linken Teil der linearen Regression, wo eben eine Normalverteilung des Kriteriums angenommen wird.
(i) binären Kriteriums: Binominalverteilung wird angenommen
(ii) intervallskaliertes Kriterium: Normalverteilung wird angenommen (wie bei linearer Regression)
(iii) Häufigkeiten als Kriterium: Posson-Verteilung wird angenommen
Zusammensetzung der logistischen Funktion: Link-Funktion g(µ)
- spezifiziert die Beziehung zwischen der zufälligen und der systematischen Komponente. Dadurch wird erreicht, dass die zufällige Komponente nicht mehr normalverteilt sein muss.
Die logistische Funktion: Eigenschaften
- Verteilungsfunktion: ist die Verteilungsfunktion der logistischen Verteilung ist.
- Werte von 0 und 1: kann nur Werte von 0 und 1 annimmt, also Werte im zulässigen Wertebereich.
- Eine stetige Zufallsvariable sei logistisch verteilt mit den Parametern a und b (wobei b > 0 sei),
für die Formel:
a = Lageparmeter
b= Skalierungsparamter
e = Euler´sche Zahl (ungefähr 2.71828)
Wofür brauchen wir in der logistischen Regression Odds und Logits?
Um nun mit einer Linearkombination eine logistische Funktion modellieren zu können, müssen die Werte der Kriteriums so transformiert werden, dass aus der logistischen Funktion eine Gerade wird. Dazu wenden wir zwei Transformationen an, die dafür sorgen, dass der Wertebereich von −∞ bis +∞ geht.
Odds: Definition
(Wettchance): Verhältnis einer Wahrscheinlichkeit P zu ihrer Gegenwahrscheinlichkeit 1 – P:
O = P/(1-P)
Umgekehrt, kann aus Odds auch die Wahrscheinlichkeit berechnet werden:
P=O/(1+O)
Odds tragen also Informationen über Wahrscheinlichkeiten in sich, haben aber einen weiteren Vorteil: Sie haben 0 als untere Grenze, nach oben geht der Wertebereich aber bis +∞.
Logits: Definition
natürlicher Logarithmus der Odds:
Logit=In(0)=In(P/(1-P))
Dadurch wird bewirkt, dass der Wertebreich auch seine untere Grenze verliert und nun also von −∞ bis +∞ geht
Beziehung zwischen logistischer Funktion und Logits
- Die logit-Transformation ist die Umkehrfunktion der logistischen Funktion
- Das bedeutet auch: werden wir auf die Werte einer logistische Funktion die Logit-Transformation an, so resultiert eine Gerade – und diese Gerade können wir mit einer Linearkombination von Prädiktoren modellierten