Slide lezione 3: Indici di posizione Flashcards
Indicatore o indice di posizione
Valore in grado di riassumere la distribuzione invariata dei dati ed identificare l’ordine di grandezza del carattere.
Come può essere l’indicatore o indice di posizione?
- una delle modalità osservate che risulta privilegiata, perché più frequente o perché occupa una posizione particolare;
- il risultato di una manipolazione dei dati, e quindi anche non coincidente con nessuna delle modalità osservate.
Principio di Cauchy o Proprietà di internalità
In entrambi i casi il requisito che l’indicatore deve soddisfare è detto Principio di Cauchy o Proprietà di Internalità: Un indicatore di posizione deve essere necessariamente compreso tra il più piccolo ed il più grande valore osservato.
Medie di posizione e medie analitiche
- Medie di posizione: non richiedono operazioni algebriche sulle modalità.
*Sia per caratteri qualitativi che quantitativi. - Medie analitiche: sono calcolate con operazioni algebriche sulle modalità.
*Solo per caratteri quantitativi.
La media aritmetica
La media aritmetica di un insieme di n valori x1, x2 , …, xn d un carattere quantitativo X è data da: xa = 1/n(x1 +x2 +… +xn)
Se il carattere X è quantitativo discreto e conosciamo la sua distribuzione di frequenza.
Non e’ un indice robusto
Quando media aritmetica e media ponderata coincidono?
La media aritmetica e quella ponderata coincidono nel caso in cui i pesi sono tutti uguali.
Proprietà della media aritmetica
- La somma dei valori osservati è uguale al valore medio moltiplicato per il numero di unità.
- La somma delle differenze tra i valori e la loro media aritmetica, è pari a zero.
- La somma dei quadrati degli scarti delle modalità da una costante c è minima quando c è uguale alla media aritmetica.
- Se un collettivo viene suddiviso in L sottoinsiemi disgiunti di numerosità n1, n2,… nL, dove sommatoria L con h=1nh = n, allora la media aritmetica generale si può ottenere come media ponderata delle medie dei sottoinsiemi, con pesi uguali alle loro numerosità.
La mediana
Il calcolo della mediana è possibile solo per caratteri quantitativi o qualitativi ordinabili. Restano dunque escluse le variabili qualitative sconnesse.
- La mediana è la modalità associata all’unità statistica che occupa la posizione centrale nella popolazione, dopo aver ordinato le unità in senso crescente rispetto alle modalità.
- La mediana divide la popolazione in due sottoinsiemi di uguale numerosità: una parte formata dalle unità che presentano una modalità precedente o uguale a quella dell’unità centrale e una parte formata dalle unità che presentano una modalità successiva o uguale a quella dell’unità centrale.
Il calcolo della mediana
- Si ordinano le n unità in senso crescente rispetto alle modalità.
- Si individua l’unità in posizione centrale: *se n è dispari la posizione è n + 1/2
*se n è pari si hanno due unità centrali con posizione n/2 e n/2 + 1. - Si osserva la modalità posseduta dall’unità centrale:
- se n è dispari la mediana è Me = xn+1/2
*se n è pari
- Caso qualitativo- Se la modalità posseduta dalle unità è la stessa, quella è la mediana.- Se la modalità posseduta dalle unità NON è la stessa, la mediana non esiste!
- Caso quantitativo discreto
*Se la modalità posseduta dalle unità è la stessa, quella è la mediana. - Se la modalità posseduta dalle unità NON è la stessa, ogni valore compreso tra le due modalità è mediana, anche se di solito si sceglie il valore centrale.
La moda
- La moda è la modalità del carattere che presenta la massima frequenza (assoluta, relativa o percentuale).
- Non si può calcolare per dati singoli non ripetuti.
- L’indice perde significato quando tutte le frequenze assumono valori prossimi a n K . - Qualora esistano due o più modalità associate alle frequenze più alte si parla di caratteri bimodali o plurimodali.
- Si può calcolare per variabili qualitative (sconnesse e ordinali) che quantitative.
Mediana per un carattere suddiviso in classi
- Se il carattere è quantitativo (continuo) ed è suddiviso in classi non è possibile individuare esattamente la mediana, perché di ogni unità conosciamo solo la classe a cui appartiene ma non la sua modalità.
- In pratica disponiamo solo delle classi e delle rispettive frequenze ma non sappiamo nulla della distribuzione delle unità all’interno delle classi.
- Facendo ricorso all’ipotesi di equidistribuzione delle unità statistiche entro ogni classe, si può considerare come Mediana il valore centrale della classe individuata come Classe Mediana.
Considerazioni sulla moda
- Se le modalità sono suddivise in classi si ricerca la classe modale definita come quella a cui corrisponde la densità di frequenza più alta.
- Come valore rappresentativo della classe si sceglie quello che corrisponde al valore centrale della classe (ipotesi di equidistribuzione nelle classi).
Altre considerazioni sulla moda
- Se rappresentiamo la distribuzione di frequenze in termini grafici, mediante un istogramma di frequenze, la moda rappresenta il picco della distribuzione.
- Se c’è un unico picco la distribuzione si dice unimodale.
- Se la distribuzione presenta due picchi di uguale altezza, ovvero due modalità che presentano uguale frequenza massima, la distribuzione si dice bimodale.
I percentili
- La mediana divide in due parti uguali l’insieme delle unità statistiche ordinate per grandezza.
- Definiamo percentili quei valori che dividono la distribuzione in cento parti di uguale numerosità.
- La mediana corrisponde quindi al 50 esimo percentile.
- I percentili di uso più frequente sono il 25 esimo e il 75 esimo, detti anche primo, Q1 e terzo quartile, Q3 che insieme alla mediana (secondo quartile) dividono la distribuzione in quattro parti uguali.
- Il primo e il terzo quartile individuano un intervallo centrale che contiene circa il 50% delle unità statistiche (e che viene considerato una misura di dispersione dei dati).