Modelli Lineari e Residui Flashcards
Quali sono i modelli lineari e quelli non lineari.
I modelli lineari sono i modelli che sono lineari nei parametri B0,B1, B2… e non necessariamente lineari nelle variabili esplicative.
Come posso esprimere in forma matriciale la y?
y= XB +e
X è la matrice disegno delle osservazioni per ogni variabile (1 x11 x12 x1k)
B è la matrice colonna dei coefficienti di regressione.
e è la matrice colonna dei residui.
Residui cosa sono e ipotesi
I residui sono la differenza tra i valori osservati della variabile risposta e i valori stimati dal modello.
E(e)=0 nullo.
Var(e)= o^2 costante.
ei indipendente da ej per ogni i!=j.
ei indipendente dai valori assunti dalla y, o dalla x.
ei distribuito come una VA Normale.
Grafico QQ Plot, cosa verifica, cosa illustra il grafico, esempi di commenti.
Verifica la normalità della distribuzione dei residui.
Vengono rappresentati graficamente i residui ordinati standardizzati e vengono messi a confronto con i valori attesi sulla normale (retta a 45*).
Se osservazioni sopra la retta: la distribuzione dei residui a code più pesanti della normale.
Se osservazioni sotto la retta: code più leggere.
Residuals vs Fitted, cosa verifica, cosa illustra il grafico, cosa altro sarebbe utile confrontare?
Verifica che la varianza dei residui sia costante e che quindi non ci siano tendenze sistematiche nei valori std dei residui al variare del “fitted value” ovvero del valore y.
Sarebbe anche utile confrontare i residui std e
- ciascuna variabile esplicativa xi.
- rispetto al tempo.
Scale Location, cosa verifica, cosa illustra. Ipotesi di base.
Verifica la presenza di valori anomali o outliers.
Sappiamo che i residui standardizzati si trovano al 95% nell’intervallo (-2, 2).
Se consideriamo la radice quadrata dei residui allora si dovrebbero trovare nell’intervallo (0, rad2 ca1.4).
Residuals vs Leverage, cosa verifica, cosa illustra il grafico.
Distanza di cook di cosa è funzione, cosa indica, livelli alert.
Verifica l’influenza delle osservazioni sul modello di regressione.
Grafico illustra:
- i residui std (ci fa capire quali sono i valori outliers).
- la leverage (quali sono le osservazioni che influenzano le stime dei parametri).
La distanza di cook è una funzione sia dei residui std che della leverage dell’osservazione i.
Indica quanto un osservazione influisce sui coefficienti di regressione del modello.
Livelli allert: 0.5 , 1, (controllare oss che le superano).
Aic e Bic, cosa misurano, quando servono, meglio se xxx, come si differenziano
Sono due indicatori della semplicità e dell’accuratezza dei modelli statistici.
Non servono da soli, servono per confronto di modelli.
Più piccoli meglio è.
Bic penalizza maggiormente i modelli con più variabili esplicative.