LogisticRegression Flashcards

1
Q

Welchen Ansatz wählt die logistic regression für Klassifikation?

A
  • Es ist ein diskremenitatives Modell
  • Es gibt eine Funktion die Eingänge direkt auf Ausgänge mappt
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was ist der erse Schritt in der Logistischen Regression?

A
  • Bestimme eine geeignete Funktion für y basierend auf x
  • (gerne wird die Sigmoid Aktivierungsfunktion genommen)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was ist der zweite Schritt der logistischen Regression?

A

Baue das Model p(y|x, θ)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was ist der dritte Schritt der logistischen Regression?

A
  • Bestimme die parameter der funktion
  • Dafür wird ein ML-Estimator benutzt
  • Im Grunde addieren wir die Wahrscheinlichkeiten aller Trainingsdaten.
  • Im Gegensatz zur Loss funktion wollen wir die Funktion maximieren
  • Es gibt keine Geschlossene Form (Lösung: iterative none linear optimization durch Gradienten Abstieg)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was ist die Cross-Entropy?

A
  • Cross-Entropy, ist eine Verlustfunktion. Sie misst, wie gut ein Modell die tatsächlichen Klassenlabel der Daten vorhersagt.
  • Wenn eine Vorhersage perfekt ist, beträgt der Cross-Entropy-Verlust 0, und je weiter die Vorhersage von der Realität abweicht, desto höher ist der Verlust.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Wo ist die Verbindung zwischen GDA und logistischer Regression?

A

TODO

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Wie wird die logit-Funktion in der logistischen Regression verwendet?

A

Die logit-Funktion (oder log-odds) ist der Logarithmus des Verhältnisses von p(y=1|x) zu 1-p(y=1|x) und wird zur Transformation der Wahrscheinlichkeiten in eine lineare Skala verwendet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was ist die Sigmoid-Funktion und welche Rolle spielt sie in der logistischen Regression?

A

Die Sigmoid-Funktion transformiert Werte in das Intervall [0,1], was die Modellierung von Wahrscheinlichkeiten für die binäre Klassifikation ermöglicht.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Wie wird der Gradientenabstieg in der logistischen Regression angewendet?

A

Der Gradientenabstieg wird genutzt, um die Parameter θ der logistischen Regression zu optimieren, indem die Cross-Entropy Verlustfunktion minimiert wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Was versteht man unter Regularisierung in der logistischen Regression?

A

Regularisierung (wie L1 und L2) wird angewendet, um Überanpassung zu verhindern und die Generalisierungsfähigkeit des Modells zu verbessern.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wie wird die Leistung eines logistischen Regressionsmodells bewertet?

A

Die Leistung wird oft durch Metriken wie Genauigkeit, Präzision, Recall und die AUC (Area Under the Curve) des ROC (Receiver Operating Characteristic) bewertet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Welche Rolle spielt die Konfusionsmatrix in der logistischen Regression?

A

Die Konfusionsmatrix zeigt die Anzahl der korrekten und inkorrekten Vorhersagen und hilft, die Leistung des Modells detailliert zu analysieren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Wie wird die logistische Regression für Multiklassen-Klassifikation angepasst?

A

Für die Multiklassen-Klassifikation wird oft die Softmax-Funktion verwendet, die die logistische Regression auf mehrere Klassen erweitert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was ist der Unterschied zwischen der binären und der multinomialen logistischen Regression?

A

Die binäre logistische Regression behandelt zwei Klassen, während die multinomiale logistische Regression für Probleme mit mehr als zwei Klassen verwendet wird.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Wie beeinflussen Hyperparameter die logistische Regression?

A

Hyperparameter wie die Lernrate und die Regularisierungsstärke beeinflussen die Modellanpassung und müssen oft durch Kreuzvalidierung optimiert werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Welche Rolle spielt die Feature-Skalierung in der logistischen Regression?

A

Die Feature-Skalierung verbessert die Konvergenz des Gradientenabstiegs und sorgt für eine gleichmäßigere Bewertung der Merkmale.

17
Q

Wie kann die logistische Regression mit unbalancierten Daten umgehen?

A

Methoden wie das Über- und Unterabtasten oder das Anpassen von Klassenwichtungen helfen, die Herausforderungen unbalancierter Daten in der logistischen Regression zu bewältigen.

18
Q

Welche Vor- und Nachteile hat die logistische Regression?

A

Vorteile: Einfachheit, Interpretierbarkeit und Effizienz. Nachteile: Schwierigkeiten bei nichtlinearen Problemen und Begrenzung auf die Klassifikation.

19
Q

Wie werden fehlende Daten in der logistischen Regression behandelt?

A

Fehlende Daten können durch Imputation, Ausschluss oder Modellierungstechniken, die mit Unvollständigkeit umgehen können, behandelt werden.

20
Q

Wie beeinflussen Ausreißer die Leistung der logistischen Regression?

A

Ausreißer können die Schätzung der Regressionskoeffizienten verzerren und zu irreführenden Vorhersagen führen.

21
Q

Was ist der Unterschied zwischen parametrischen und nicht-parametrischen Ansätzen in der logistischen Regression?

A

Parametrische Modelle, wie die logistische Regression, verwenden eine feste Anzahl von Parametern, während nicht-parametrische Modelle, wie Entscheidungsbäume, die Modellkomplexität flexibel anpassen können.