LogisticRegression Flashcards

Question 1

Q

Welchen Ansatz wählt die logistic regression für Klassifikation?

Answer

A

Es ist ein diskremenitatives Modell
Es gibt eine Funktion die Eingänge direkt auf Ausgänge mappt

Question 2

Q

Was ist der erse Schritt in der Logistischen Regression?

Answer

A

Bestimme eine geeignete Funktion für y basierend auf x
(gerne wird die Sigmoid Aktivierungsfunktion genommen)

Question 3

Q

Was ist der zweite Schritt der logistischen Regression?

Answer

A

Baue das Model p(y|x, θ)

Question 4

Q

Was ist der dritte Schritt der logistischen Regression?

Answer

A

Bestimme die parameter der funktion
Dafür wird ein ML-Estimator benutzt
Im Grunde addieren wir die Wahrscheinlichkeiten aller Trainingsdaten.
Im Gegensatz zur Loss funktion wollen wir die Funktion maximieren
Es gibt keine Geschlossene Form (Lösung: iterative none linear optimization durch Gradienten Abstieg)

Question 5

Q

Was ist die Cross-Entropy?

Answer

A

Cross-Entropy, ist eine Verlustfunktion. Sie misst, wie gut ein Modell die tatsächlichen Klassenlabel der Daten vorhersagt.
Wenn eine Vorhersage perfekt ist, beträgt der Cross-Entropy-Verlust 0, und je weiter die Vorhersage von der Realität abweicht, desto höher ist der Verlust.

Question 6

Q

Wo ist die Verbindung zwischen GDA und logistischer Regression?

Question 7

Q

Wie wird die logit-Funktion in der logistischen Regression verwendet?

Answer

A

Die logit-Funktion (oder log-odds) ist der Logarithmus des Verhältnisses von p(y=1|x) zu 1-p(y=1|x) und wird zur Transformation der Wahrscheinlichkeiten in eine lineare Skala verwendet.

Question 8

Q

Was ist die Sigmoid-Funktion und welche Rolle spielt sie in der logistischen Regression?

Answer

A

Die Sigmoid-Funktion transformiert Werte in das Intervall [0,1], was die Modellierung von Wahrscheinlichkeiten für die binäre Klassifikation ermöglicht.

Question 9

Q

Wie wird der Gradientenabstieg in der logistischen Regression angewendet?

Answer

A

Der Gradientenabstieg wird genutzt, um die Parameter θ der logistischen Regression zu optimieren, indem die Cross-Entropy Verlustfunktion minimiert wird.

Question 10

Q

Was versteht man unter Regularisierung in der logistischen Regression?

Answer

A

Regularisierung (wie L1 und L2) wird angewendet, um Überanpassung zu verhindern und die Generalisierungsfähigkeit des Modells zu verbessern.

Question 11

Q

Wie wird die Leistung eines logistischen Regressionsmodells bewertet?

Answer

A

Die Leistung wird oft durch Metriken wie Genauigkeit, Präzision, Recall und die AUC (Area Under the Curve) des ROC (Receiver Operating Characteristic) bewertet.

Question 12

Q

Welche Rolle spielt die Konfusionsmatrix in der logistischen Regression?

Answer

A

Die Konfusionsmatrix zeigt die Anzahl der korrekten und inkorrekten Vorhersagen und hilft, die Leistung des Modells detailliert zu analysieren.

Question 13

Q

Wie wird die logistische Regression für Multiklassen-Klassifikation angepasst?

Answer

A

Für die Multiklassen-Klassifikation wird oft die Softmax-Funktion verwendet, die die logistische Regression auf mehrere Klassen erweitert.

Question 14

Q

Was ist der Unterschied zwischen der binären und der multinomialen logistischen Regression?

Answer

A

Die binäre logistische Regression behandelt zwei Klassen, während die multinomiale logistische Regression für Probleme mit mehr als zwei Klassen verwendet wird.

Question 15

Q

Wie beeinflussen Hyperparameter die logistische Regression?

Answer

A

Hyperparameter wie die Lernrate und die Regularisierungsstärke beeinflussen die Modellanpassung und müssen oft durch Kreuzvalidierung optimiert werden.

Question 16

Q

Welche Rolle spielt die Feature-Skalierung in der logistischen Regression?

Answer

Study These Flashcards

A

Die Feature-Skalierung verbessert die Konvergenz des Gradientenabstiegs und sorgt für eine gleichmäßigere Bewertung der Merkmale.

Question 17

Q

Wie kann die logistische Regression mit unbalancierten Daten umgehen?

Answer

Study These Flashcards

A

Methoden wie das Über- und Unterabtasten oder das Anpassen von Klassenwichtungen helfen, die Herausforderungen unbalancierter Daten in der logistischen Regression zu bewältigen.

Question 18

Q

Welche Vor- und Nachteile hat die logistische Regression?

Answer

Study These Flashcards

A

Vorteile: Einfachheit, Interpretierbarkeit und Effizienz. Nachteile: Schwierigkeiten bei nichtlinearen Problemen und Begrenzung auf die Klassifikation.

Question 19

Q

Wie werden fehlende Daten in der logistischen Regression behandelt?

Answer

Study These Flashcards

A

Fehlende Daten können durch Imputation, Ausschluss oder Modellierungstechniken, die mit Unvollständigkeit umgehen können, behandelt werden.

Question 20

Q

Wie beeinflussen Ausreißer die Leistung der logistischen Regression?

Answer

Study These Flashcards

A

Ausreißer können die Schätzung der Regressionskoeffizienten verzerren und zu irreführenden Vorhersagen führen.

Question 21

Q

Was ist der Unterschied zwischen parametrischen und nicht-parametrischen Ansätzen in der logistischen Regression?

Answer

Study These Flashcards

A

Parametrische Modelle, wie die logistische Regression, verwenden eine feste Anzahl von Parametern, während nicht-parametrische Modelle, wie Entscheidungsbäume, die Modellkomplexität flexibel anpassen können.

LogisticRegression Flashcards

(21 cards)