2. Regressionsanalyse Flashcards

1
Q

Regression?

A

=die Schätzung einer numerischen Zielvariable (z.B. das Gewicht einer Person) basierend auf mehrere Prädiktorvariablen.

Nicht hingegen einer nominalen Zielvariable wie Kreditwürdig ja /nein

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Lineare Regression?

A

=wird ein linearer Zusammenhang zwischen einer Inputgröße X und einer Outputgröße Y unterstellt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Beispiel für die Lineare Regression

A

Die Größe einer Person und das Gewicht einer Person stehen um Zusammenhang.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Lineare Regression Grafik?

A

Graphisch lässt sich der Zusammenhang als Gerade darstellen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Wieso liegen nicht alle Punkte auf der Geraden?

A

Das Epsilon ist der Fehler bzw. Das Residium. Dies liegt daran, dass die Punkte ja leider nicht auf der Geraden liegen. Damit also die Gleichung für alle tatsächlichen Punkte gilt muss das Residium angegeben werden. Desto kleiner das Residium desto besser.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Dürfen weitere Attribute der Linearen Regression hinzugefügt werden?

A

weitere Attribute dürfen bei der Regression nicht mitbrachtet werden, da es zu einer Verzerrung des Ergebnisses führt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Ergebnis Lineare Regression? (Beispiel Zuckergehalt)

A

Koeffizient = -2,1 = Mit Jedem Gramm Zucker sinkt das Rating um 2,1

Squared Correlation = 0,45 = Zwischen 0-1, 45% der Variation im Rating wird erklärt durch die Variation des Zuckergehalts

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wann Polynomregression?

A

Ist der Zusammenhang zwischen Input und Zielvariable definitiv nicht linear
–> polynomiale Regression

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Polynomregressionsgleichung?

A

Die Regressionsgleichung beinhaltet Polynome n-ter Ordnung. Die Ordnung bestimmt hierbei die Komplexität des Modells.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Logistische Regression?

A

ist eine Klassifikation, bei der zunächst eine lineare Regression durchgeführt wird und das Ergebnis dann auf zwei Klassen abgebildet wird

–> zu welcher von zwei Klassen gehört ein Datenpunkt

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Welchen Einfluss hat die Ordnung?

A

Das bedeutet, dass über die Veränderung der Ordnung, die Modellkomplexität angepasst werden kann.
Dadurch kann Overfitting und Underfitting vermieden werden.

Ordnung 1 ist beispielsweise dann eine Lineare Regression die in diesem Fall natürlich fehlerhaft sein würde.
Bei einer zu hohen Ordnung entsteht Overfitting.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Schritt 1 Logistische Regression?

A

Lineare Näherung der Beziehung zwischen Eingabevariablen und (numerischer) Zielvariable durch lineare Regression.

Bei der Kreditwürdigkeit könnte dies bedeuten, dass wir anhand verschiedener Faktoren (wie Einkommen, Schulden, usw.) eine Punktzahl von 0 bis 100 berechnen, die die Kreditwürdigkeit darstellt –> Schwellenwert bsp 50

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Schritt 2 Logistische Regression?

A

Um im zweiten Schritt die Wahrscheinlichkeit pro Klasse präziser zu berechnen, wird mit der logistischen/SIGMOID Funktion gearbeitet

–> wandelt die lineare Regressionsergebnisse in Wahrscheinlichkeiten um, die zwischen 0 und 1 liegen

–> Die Sigmoid-Funktion nimmt den linearen Regressionswert und wandelt ihn in eine Wahrscheinlichkeit um, die ausdrückt, wie wahrscheinlich es ist, dass ein Datenpunkt zu einer bestimmten Klasse gehört (z.B. “kreditwürdig”).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Fazit zur Regression?

A

Mithilfe der Regression lassen sich aus vorhandenen Daten Modelle erstellen, die in der Lage sind für neue Datensätze Vorhersagen zu treffen

–> In der Praxis müssen deshalb Ausreißer erkannt werden und viele verschiedene Modelle angewandt werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly