Bestärktes Lernen Flashcards
1
Q
Bestärktes Lernen
Agent
A
führt Aktion in Umgebung aus,
erhält Belohung
2
Q
Bestärktes Lernen
Aktion A
A
Die Menge der Aktionen die ein Agent ausführen kann
3
Q
Bestärktes Lernen
Umwelt E
Enviroment E
A
das Szenario das der Agent erkunden muss
4
Q
Bestärktes Lernen
Zustand S
State S
A
aktueller Zustand des Agenten in der Umgebung
5
Q
Bestärktes Lernen
Belohnung R
Reward R
A
Unmittelbares Feedback aus der Umgebung um Aktion zu Belohnen
6
Q
Bestärktes Lernen
Policy π
A
Policy (Strategie)
Verfahren das der Agent verwendet um nächste Aktion auf der Grundlage des aktuellen Zustands zu bestimmen
7
Q
Bestärktes Lernen
Wert V
Value
A
der langfristige Wert des aktuellen Zustands S unter Verwendung der Policy π