Vorlesung 2 Flashcards

1
Q

Beschreib kurz die Polynomiale Regression

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Beschreib mathematisch die lineare Methode der kleinsten Fehlerquadrate für die Polynomiale Regression

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was erhalten wir dann bei der Polynomialen Regression?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Wie kann man den Abbildungstrick, den wir bei der Polynomialen Regression verwendet haben für beliebige Basisfunktionen verwenden?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was ist Underfitting?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was ist Overfitting?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Beschreib den Zusammenhang von Vorhersagefehler und Modellkomplexität für Trainings- und Testdaten

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

In was werden Trainingsdaten aufgeteilt, um Overfitting zu erkennen?

A

In Trainings- und Validierungsdaten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Was tun, wenn man wenige Daten hat, aber Validierungsdaten braucht?

A

Kreuzvalidierung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Wie funktioniert die Kreuzvalidierung?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Wie geht man allgemein vor bei der Regression?

unmathematisch

A
  1. beste Modellkomplexität finden: Kreuzvalidierung und Beste Modellkomplexität mit minimalem Validierungsfehler auswählen
  2. Mit dieser Modellkomplexität das Training auf allen Trainingsdaten (Trainings- und Validierungsdaten) durchführen, um die besten Parameter w* zu erhalten
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was ist Regularisierung/Regularisierte Risikominimierung?

A

Eine Beschränkung der Modellparameter w zur Reduzierung der Modellkomplexität, zur Reduzierung des Overfittings

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was sind Regularisierungspfade?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was ist die Empirische Risikominimierung (ERM)?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was ist die Regularisierte Risikominimierung (RRM)?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Was ist der bias-variance tradeoff?

A
  • Modelle mit hoher Varianz können Trainingsdaten beliebig gut erfassen, neigen jedoch zum Overfitting (hohe Modellkomplexität)
  • Modelle mit hoher Verzerrung (Bias) haben eine geringe Modellkomplexität, können sich jedoch an die Daten nicht genau anpassen (Underfitting)
17
Q

Was sind Herausforderungen bei der leave-one-out cross-validation?

A
  • hohen Rechenleistung, die für große Datensätze erforderlich ist
  • Anfälligkeit für Overfitting
18
Q

Was sind Herausforderungen bei der stratified cross-validation?

A

es kann schwierig sein, eine angemessene Stratifizierung für seltene Features oder Gruppen sicherzustellen, was zu verzerrten Ergebnissen führen kann

19
Q

In der Praxis wird bei polynomialer Regression selten mit Polynomen über einem Grad von 3 gearbeitet, also meistens linear, Grad 2 oder 3. Welche möglichen Gründe könnte das haben?

A
  • Rechenaufwand
  • Overfitting, erhöhte Modellkomplexität