MISURE DI DISPERSIONE / DI VARIABILITA' Flashcards
associa a ogni v.s. la misura di dispersione corretta
ordinali, quantitative, quantitative sconnesse
qualitative ordinali = range interquantilico
quantitative = varianza
qualitative sconnesse = eterogeneità
qual è la definizione di range?
il range è la differenza tra l’ultima e la prima modalità della serie ordinata.
qual è la definizione di outlier?
l’outlier è l’osservazione che ricade
al più di 1,5 x IQR al di sopra del 3 quartile
o
al più di 1,5 x IQR al di sotto del 1 quartile
qual è la definizione di varianza?
la varianza è la minima funzione quadratica di perdita di informazione intorno alla media aritmetica.
è la somma di scarti al quadrato ponderati per fi.
che valori può assumere la varianza?
la varianza assume valori positivi o nulli (alla seconda).
qual è la definizione operativa della varianza e perchè è più facile?
la varianza è uguale alla differenza tra il momento secondo e il quadrato del momento primo.
è più semplice perchè, non essendoci gli scarti, non ci sono decimali.
qual è la definizione di deviazione standard / scarto mediatico medio?
la deviazione standard è la radice quadrata della varianza e misura l’unità standard di dispersione della v.s. intorno alla media.
quali significati ha la deviazione standard?
la deviazione standard è sia la misura sintetica della dispersione (x valutare la dispersione), sia l’unità di misura della dispersione (x valutare lo scostamento di una singola osservazione dal polo centrale).
qual è la definizione di coefficiente di variazione?
il coefficiente di variazione è la deviazione standard normalizzata. non risente dell’udm ed è utile per il confronto.
qual è il limite della deviazione standard?
non è un indice adatto per confrontare la dispersione di due distribuzioni i cui punteggi sono espressi in udm diverse
qual è la definizione di eterogeneità?
l’eterogeneità misura la variabilità di una v.s. qualitativa.
che caratteristiche deve avere una misura di eterogeneità?
deve essere maggiore o uguale e uguale a 0 in caso di assenza di variabilità
deve essere massima quando la popolazione si distribuisce equamente tra le m modalità con frequenza 1/m o N/m.
qual è la definizione dell’indice di Gini?
è l’indice utilizzato per misurare l’eterogeneità.
formula range
R=xN-x1
formula outlier
valore > 4Q3+1.5IQR
valore <4Q1-1.5IQR
formula varianza
sigma^2=Sommatoria per i che va da 1 a m di [(xi-mx)^2] * fi
formula operativa varianza
sigma^2 = m2x-m^2x
formula scarto quadratico medio / deviazione standard
sigma = rad. quad. sigma^2
formula coefficiente di variabilità
CV=sigma/media mu
formula indice di gini
Ex=sommatoria per i che va da 1 a m di (fi*(1-fi) = 1 - sommatoria di fi^2.
formula indice di gini massimo
Emax = m-1/m
formula indice di relativo
E* = Ex/ Emax
la varianza ha un massimo?
no, l’indice di gini si invece. Emax è sempre <1.
cosa vuol dire che l’indice di gini è massimo?
che la popolazione si distribuisce equamente tra le m con uguale frequenza.
il range risente tanto dei valori anomali?
si, infatti conviene prendere come estremi i valori più interni alla serie che sono equidistanti dalla mediana
perchè si usa la varianza come misura di dispersione?
perchè la varianza è la funzione quadratica centrata sulla media aritmetica. la media aritmetica rende minima la funzione quadratica di perdita di informazione.