Slide lezione 4: Indici di variabilità Flashcards
La variabilità di una distribuzione
La variabilità di una distribuzione esprime la tendenza delle unità di un collettivo ad assumere diverse modalità del carattere.
Indice di variabilità
Un indice di variabilità deve soddisfare almeno due requisiti:
1. deve assumere il suo valore minimo se e solo se tutte le unità della distribuzione presentano la stessa modalità;
2. deve aumentare tanto più diverse e disperse sono le modalità rilevate.
La varianza può essere negativa?
La varianza non può mai essere negativa, al limite e’ nulla , valore che viene raggiunto solo nel caso in cui X sia variabile degenere.
La deviazione standard o scarto quadratico medio
sigma è uguale alla radice quadrata di sigma elevato al quadrato.
Di cosa risente la varianza? Cosa non è possibile quindi?
Lavarianza è un indice di variabilità che risente:
▶ dell’unità di misura
▶ dell’ordine di grandezza dei dati
* Pertanto non è possibile
▶ confrontare la variabilità tra fenomeni con unità di misura diverse ▶ confrontare la variabilità tra popolazioni che, pur essendo misurate con la stessa unità di misura, possiedono valori medi molto diversi.
Considerazioni sul coefficiente di variazione
- Il CV è utilizzato quando tutti i valori della distribuzione sono positivi, perché per caratteri che assumono valori sia positivi sia negativi ¯ x non rappresenta l’ordine di grandezza effettivo.
- Il CV (così come la varianza e la deviazione standard) ha il minimo pari a zero, ma il massimo non è definito, per cui nulla ci può dire circa l’intensità della variabilità.
la Standardizzazione
A volte è utile applicare ai dati originali una particolare trasformazione lineare, chiamata standardizzazione, che riconduce qualsiasi variabile ad avere media nulla e varianza unitaria.
Il campo di variazione
Dato un insieme di n valori osservati ordinati in senso crescente x1<x2<…<xn definiamo campo di variazione la differenza tra il più grande ed il più piccolo di tali valori:
R=xn-x1
R=0 se tutte le unità presentano lo stesso valore
Differenza interquartile
Dato un insieme di n valori osservati x1,x2,…,xn, definiamo differenza interquartile la differenza fra il terzo e il primo quartile: W =Q3−Q1.
- W rappresenta il campo di variazione per il 50% delle unità centrali (le osservazioni estreme vengono escluse)
- È un indice piuttosto approssimativo
Il box-plot
Un modo per rappresentare graficamente la variabilità di una distribuzione è dato dal box-plot.
* Il box-plot è un grafico caratterizzato da tre elementi:
1. una linea che indica la posizione della mediana
2. un rettangolo (box) la cui altezza è data dalla distanza interquartilica
3. due segmenti che partono dal rettangolo e i cui estremi sono determinati in base ai valori estremi della distribuzione