Bestärktes Lernen Flashcards

1
Q

Bestärktes Lernen

Agent

A

führt Aktion in Umgebung aus,
erhält Belohung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Bestärktes Lernen

Aktion A

A

Die Menge der Aktionen die ein Agent ausführen kann

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Bestärktes Lernen

Umwelt E

Enviroment E

A

das Szenario das der Agent erkunden muss

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Bestärktes Lernen

Zustand S

State S

A

aktueller Zustand des Agenten in der Umgebung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Bestärktes Lernen

Belohnung R

Reward R

A

Unmittelbares Feedback aus der Umgebung um Aktion zu Belohnen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Bestärktes Lernen

Policy π

A

Policy (Strategie)
Verfahren das der Agent verwendet um nächste Aktion auf der Grundlage des aktuellen Zustands zu bestimmen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Bestärktes Lernen

Wert V

Value

A

der langfristige Wert des aktuellen Zustands S unter Verwendung der Policy π

How well did you know this?
1
Not at all
2
3
4
5
Perfectly