Lezione 3: Statistica Univariata Flashcards
Quali sono i 3 tipi di indicatori per descrivere una variabile e quali sono le loro funzioni?
-indicatori di centralità/tendenza centrale—-> danno informazioni sul centro di un numero di informazioni
-indicatori di variabilità—-> danno informazioni sulla dispersione/variabilità dei valori
-indicatori di standardizzazione——> non hanno unità di misura e si usano per i confronti
Dimmi gli indicatori di centralità e a quale tipo di variabile si riferiscono
-Media—->solo per variabili quantitative
-moda—->per tutte le variabili
-mediana—-> per tutte le variabili quantitative+ variabili categoriali ordinali
-quartili
Dimmi gli indicatori di variabilità e a quale tipo di variabile si riferiscono
-campo di variazione/range
-differenza interquartile (IQR)
-varianza—-> solo variabili quantitative (come la media)
-deviazione standard—-> solo variabili quantitative (come la media)
-coefficiente di variazione
dimmi gli indicatori standardizzati e a quante variabili si riferiscono
-IQR/RANGE—-> 1 variabile alla volta
-Z-score—-> 1 variabile alla volta
-coefficiente di variazione—->è un indice quindi si riferisce ad un set di variabili
Quali sono gli indicatori influenzati dagli outliers?
Media
Range
Varianza
Deviazione standard
Dimmi le 2 proprietà della media
-La somma degli scarti dalla media è zero
-operatore lineare
Fammi la dimostrazione della media come operatore lineare
Cos’è la mediana
-è la valore centrale in una lista ordinata di valori
ATTENZIONE—->posizione centrale è diversa dal valore della media
Dimmi 3 cose sulla moda?
-È il valore più frequente
-può non esserci se i valori hanno tutti la stessa frequenza
-ce ne può essere più di una (se più di un valore ha la frequenza massima)
Cosa significa se la distribuzione è
-simmetrica
-coda a dx
-coda a sx
-simmetrica—->media=mediana
-coda a dx—->media>mediana
-coda a sx—->media <mediana
Cosa fanno i quartili e come si calcolano
-dividono la sequenza ordinata dei dati in 4 segmenti contenenti lo stesso neutro di valori
La posizione centrale e il valore della mediana sono la stessa cosa?
No!
Dimmi 3 cose sul campo di variazione
-è un indicatore di variabilità
-È anche detto range
-si calcola come R=Xmax-Xmin
Dimmi 3 cose sulla differenza interquartile
-è un indicatore di variabilità
-considera l’intervallo che contiene il 50% dei dati centrali (=ampiezza scatola boxplot)
- si calcola come IQR=Q3-Q1
Dimmi 4 cose su IQR/RANGE (%)
-è un indicatore standardizzato (lo uso per i confronti)
-si riferisce ad una variabile alla volta
-più si avvicina a 1,maggiore è la dispersione
-si calcola come
Dimmi 4 cose sulla varianza
-è la media degli scarti al quadrato
-indica quanto un valore si discosta dalla media (ossia la dispersione del campione dalla media)
-è sensibile agli outliers
Dimmi le due proprietà della varianza
-la varianza di una costante è zero (una costante non può variare)
-operatore quadratico
Fammi la dimostrazione della varianza come operatore quadratico
Dimmi 4 cose sulla deviazione standard
-mostra la variabilità rispetto alla media
-è anche detto scarto quadratico medio
-è sensibile agli outliers
-si calcola come:
Disegna il grafico se la deviazione standard è
-piccola
-grande
I
Dimmi 4 cose sul coefficiente di variazione
-è un indicatore di variabilità standardizzato
-indica la variabilità relativa rispetto alla media
-è un indicatore (per questo viene usato per confrontare tra loro delle variabili con unità di misura diverse o con diverso ordine di grandezza
-si calcola come
Che cos’è la standardizzazione?
È una trasformazione lineare che traduce una variabile aleatoria distribuita secondo una media e una varianza, ad una variabile aleatoria con distribuzioni standard (ossia una variabile standardizzata con media=0 e varianza=1)
Dimmi 2 motivi per cui serve la standardizzazione
-per avere un’idea della posizione che un soggetto occupa in un gruppo
-per confrontare diverse caratteristiche di un solo oggetto
Quanto valgono la media e la varianza dello z-score?
Media=0 e varianza=1
Cos’è lo Z-score?
-è il numero di deviazioni standard di cui un dato vale è sopra o sotto la media
-si calcola come
Fammi la dimostrazione per calcolare la media e la varianza dello Z-score
Cosa significa che l’IQR/RanGE è vicino a 1
Più si avvicina a 1, maggiore è la dispersione