Reinforcement Learning Flashcards

1
Q

Was ist Reinforcement Learning?

A

Lernen von sequenziellen Entscheidungen
Entscheidungen werden nicht isoliert betrachtet, sondern der gesamte Prozess

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was nutzt reinforcement Learning im Gegensatz zu (Un)supervised Learning?

A

“belohnende” Lernmethode

Aktionen sollen Belohnung maximieren
Ziel: Automatische Entwicklung einer möglichst optimalen Steuerung (“Policy”)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Was ist die Policy bei Reinforcement Learning?

A

Aus allen möglichen Aktionen soll die bestmögliche gewählt werden
-> „Taktik“ oder „Steuerung“
-> Für jede Taktik existiert eine erwartende kumulative Belohnung

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Kumulative Belohnung

A

aufsummierte Belohnung, die ein Agent über eine gesamte Episode oder über mehrere Zeitschritte hinweg erhält.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Bewertung von Zuständen und Aktionen bei Recurrent Networks

A

Gebrauch bei RL
- Wie gut ist ein bestimmter zustand: langsfristige Belohnung
- Wie ist eine Aktion innerhalb eines Zustands

How well did you know this?
1
Not at all
2
3
4
5
Perfectly