Decision Theory Flashcards
Was ist die Aufgabe der Entscheidungstheorie?
- Einen belief in eine aktion umzuführen
- Dies geschieht durch das berechnen eines Loss für eine falsche Entscheidung ohne zu wissen ob wir uns falsch entschieden haben
Wovon geht die Bayese Entscheidungstheorie aus?
- Der wahre Wert eines Parameters wird als Zufallsvariable betrachtet.
- Diese Zufallsvariable θ hat eine Wahrscheinlichkeitsverteilung, die basierend auf den beobachteten Daten D bestimmt wird.
- Die Daten D sind fest und nicht zufällig
- das Ziel besteht darin, eine Entscheidungsmethode oder einen Schätzwert zu wählen, die systematisch aus den beobachteten Daten D abgeleitet wird.
Was ist eine optimale Entscheidung im Bayeschen ansatz?
Die Beste Aktion ist jene die man nach beobachten der Daten bekommt und den minimalen posterior expected loss hat.
Was ist eine reject option?
- Wenn es um sicherheitskritische aktionen geht macht es sinn eine Handlung bei Unsicherheit zurückzuweisen
- Also sagen wir “ich weiß es nicht” wenn wir unsicher sind
- Kostenfunktion: Siehe Abbildung
Wie ist die bayes decision rule bei False Postive vs. False Negative tradeoff?
Wovon geht die Frequentistische Entscheidungstheorie aus?
- Die Werte der Parameter sind Fest und unterliegen keiner Verteilung
- Die Daten unterliegen einer wahren aber unbekannten Verteilung
- Es gibt nicht den einen Weg einen estimator zu wählen. Wir dürfen diesen frei wählen
Was ignoriert der frequentistische ansatz?
Der frequentistische Ansatz ignoriert alle Informationen, welche wir aus den Daten ziehen
Welches Problem gibt es beim auswählen eines frequentistic estimator?
Der risk kann nicht berechnet werden um ihn mit anderen estimator zu vergleichen, da wir den wahren Parameter nicht kennen.
Es gibt keinen systematischen Weg einen estimator auszuwählen.
Welche Arten gibt es einen Estimator zu wählen?
- Bayes Risk
- Minimax risk
- Admissible estimator + desirable properties
- empirical risk minimization
Wie funktioniert der Bayes Risk?
- Wir nutzen den Bayes ansatz um einen estimator auszuwählen
- Frequentisten mögen diesebn Ansatz nicht, da wir hier ein prior annehmen müssen
- Bei diesem Vorgehen treffen sich der Bayes und frequentistische Ansatz
- Wir minimieren den posterior expected loss für jedes Datenset D
Wie funktioniert der minimax risk?
Wir wählen den Estimator, welcher den geringsten worst-case hat also den kleineren hochpunkt
Welche Eigenschaften sollte ein Estimator haben?
- Konsistenz: Bei unendlichen vielen Daten soll sich unser Parameter dem wahren Parameter annähern
- unbiased: Der Erwartungswert unseres geschätzten Parameter ist der wahre Parameter
- minimum variance: Die Varianz sollte minimal sein
Was ist der Bias-Variance Tradeoff?
- Unser Risk für die quadratic loss kann in Varianz und Bias aufgeteilt werden
- Es kann nur eines von beiden minimiert werden nicht aber beides
Was ist ein admissible estimator?
Wenn ein Estimator im vergleich zu anderen immer “schlechter” ist ist dieser admissible und sollte somit nicht gewählt werden.
In der Abbildung sind δ1 und δ3 admissible
Was ist empirical risk minimization?
- Der frequenztistische loss (risk) kann approximiert werden
- Dies ist nur möglich, wenn wir annotierte Daten haben bzw zu den Daten x die zugehörigen werte y kennen
- Dies kann zum lernen genutzt werden