Trade Off Bias-Variance Flashcards
Cosa intendiamo per varianza?
Cosa determina un alta varianza? Può causare…
Di quanto varia la predizione del nostro modello al variare dei dati nel training set.
Se la predizione cambia molto (high variance), è stata data molta attenzione al dataset e il modello è incapace di generalizzare.
Rischio di overfitting.
Cosa è il bias?
Cosa determina un alto bias? Può causare…
Differenza tra la predizione media del nostro modello e il valore corretto che volevamo predire.
Se la predizione media si discosta molto dal valore corretto da predire allora high bias.
Rischio di underfitting.
Situazione ideale che cerchiamo di raggiungere con il modello.
- Catturare con precisione le regolarità del training set.
- Saper generalizzare bene anche con dati non visti
Ovvero -> Low Bias, Low Variance.
Situazione reale.
Realtà:
- Modello che rappresenta bene il training set (low bias) ma si adatta eccessivamente ai dati rumorosi (high variance)
- Modello che non cattura le regolarità importanti del training set (high bias) ed è molto semplice (low variance).
Matematicamente l’errore del modello da cos dipende?
MSE= Bias^2 + Variance + Err.Irriducibile^2