Optimierungen Flashcards

Question 1

Q

Wie sollten Gewichte initialisiert werden?

Answer

A

Gewichte sollten “zufällig” initialisiert werden mit einer starken Streuung

Question 2

Q

Um welchen Wert sollte die Streuung sein?

Answer

A

Bestenfalls Streuung um den Nullpunkt

Besser für den Trainingsverlauf
Kleine Gewichtswerte um 0

Question 3

Q

Datengetriebener Entwurf (Lernverfahren)

Answer

A

Modell lernt Zusammenhang zwischen Eingangs- & Ausgangsdaten
Mehrfaches Iterieren notwendig
Kein garantierter Weg zur besten Lösung
Vergleich mit anderen Methoden: hoher Rechenaufwand, aber oft notwendig

Question 4

Q

Unterschied Backpropagation zu Datengetriebener Entwurf

Answer

A

Fehlerrückführung zur Gewichtsoptimierung
Gradientenabstieg zur Fehlerreduktion
Gefahr: lokale Minima, Konvergenzproblem
Hoher Rechenaufwand, besonders bei großen Netzen

Question 5

Q

Was ist der Flache Plateaus?

Answer

A

Geringer Fehlergradient → Gewichtsaktualisierungen sind minimal
Lernprozess verzögert sich oder stagniert
Besonders problematisch bei Gradientenabstieg, da keine klare Richtung zur Fehlerreduktion vorgegeben ist

Question 6

Q

Folgen einer nicht angepassten Schrittweite?

Answer

A

gute Minima können übersprungen werden
Ergebnis wird sup-optimal

-> Das Verfahren konvergiert
gegen ein lokales Minimum

Question 7

Q

Was ist Oszillation?

Answer

A

Oszillation
* Schrittweite, ungünstige Auswahl
* „Hin und her springen“
* Korrekturterm hat dauerhaft
den gleichen Betrag
* oszillierendes Vorzeichen

Question 8

Q

Was ist Indirekte Oszillation?

Answer

A

Ähnlich wie beim direkten Oszillieren
springt das Verfahren über mehrere
Schritte wieder zum Ausgangspunkt
zurück

Question 9

Q

Was geschieht bei einem Sattelpunkt?

Answer

A

Partielle Ableitungen sind am
Sattelpunkt null
* Das Verfahren stagniert, obwohl
kein Minimum der Fehlerfunktion
erreicht ist

Question 10

Q

Was sind Lösungsansätze für Optimierungsprobleme? (Schrittweite, Oszillation, Sattelpunkt, etc..)

Answer

A

Lösungsansätze:
* Variation der Gewichte
* Variation der Datenauswahl (Startpunkt des Verfahrens)
* Variation der Netzstruktur (Komplexität)
* Veränderung der Lernparameter, Gewichtungsfaktor

Question 11

Q

Was hat das erhöhen der Lernrate für Auswirkungen?

Answer

A

Erhöhen der Lernrate (Korrektursprünge erhöhen)
* Plateaus werden schneller durchlaufen
* Lokale Minima werden gegebenenfalls übersprungen
* Gegebenenfalls schnellere Konvergenz

Question 12

Q

Was hat das reduzieren der Lernrate für Auswirkungen?

Answer

A

Reduktion der Lernrate (Korrektursprünge reduzieren)
* Gegebenenfalls wird das globale Minimum gefunden
* Gegebenenfalls wird Oszillation vermieden

Question 13

Q

Was ist das Adaline Lernen?

Answer

A

Verändern der Lernrate über der Zeit (vgl. Adaline Lernen)
* „grob-fein“ Lernen

Question 14

Q

Vorgehen Backpropagation mit variabler Schrittlänge

Answer

A

Die Schrittlänge (Lernrate σ) wird während des Trainings dynamisch angepasst, um die Konvergenz zu verbessern.

Mehrfaches Wiederholen der Gewichtsaktualisierung, bis die Fehlerkurve steigt (Anzeichen für zu große Schritte).

Anpassung der Lernrate je nach Anzahl der Iterationen:

Viele Iterationen (langsames Lernen) → Erhöhung von σ, um schneller zu konvergieren.
Wenige Iterationen (instabiles Lernen) → Verringerung von σ, um Überspringen guter Minima zu vermeiden.

Question 15

Q

Was ist Batch mode Backpropagation?

Answer

A

Batch mode Backpropagation (Off-Line)
* Betrachtung aller Trainingsbeispiele
* Berechnung des Korrekturterms
in Abhängigkeit aller Beispiele

Question 16

Q