Slide lezione 2: La presentazione dei dati Flashcards
Definizione di rilevazione
Rilevazione: l’operazione che associa una modalità di X a ciascuna unità statistica della popolazione.
Come si scrivono le modalità di X
Le modalità di X si scrivono con lettere minuscole con pedice: x1,x2,…,Xn dove 1,2, N indicano le unità statistiche.
Le distribuzioni statistiche
Le distribuzioni statistiche descrivono come uno o più caratteri si distribuiscono in una popolazione. Se osserviamo:
* un singolo carattere- distribuzioni semplici * due caratteri- distribuzioni doppie
* più di due caratteri- distribuzioni multiple.
La distribuzione unitaria
L’elenco delle modalità di un carattere, osservate unità per unità, si chiama distribuzione unitaria, e si scrive
X1, X2,…,Xn.
Distribuzione di frequenze assolute, visione d’insieme
Per avere però una visione d’insieme è necessario aggregare unità statistiche che presentino modalità identiche. Si tratta di:
(1) individuare le K modalità effettivamente rilevate (indicizzate con j : j = 1,…, K);
(2) contare il numero di volte nj in cui la modalità xj di un carattere viene osservata nel collettivo (N). Il numero nj è chiamato frequenza assoluta;
(3) associare alle modalità x1,x2,…,xk che può assumere il carattere X, le corrispondenti frequenze assolute n1,n2,…, nk.
Frequenza relativa
La frequenza relativa fj è la frazione di collettivo che presenta la modalità j-esima, ossia
fj= nj/N
Frequenza percentuale
La frequenza percentuale pj è uguale alla frequenza relativa moltiplicata per 100, ossia
pj = fj * 100
Frequenza cumulata
La frequenza cumulata di una classe è data dalla somma della frequenza della classe con quella delle classi precedenti.
Essa può essere:
- assoluta;
- relativa;
Tipi di rappresentazioni grafiche
- Grafici a nastri: per caratteri qualitativi non ordinati.
- Grafici a barre: per caratteri qualitativi ordinati, (a bastoncini) caratteri quantitativi discreti.
- Istogrammi: per caratteri quantitativi continui suddivisi in classi.
- Grafici a torta: per caratteri qualitativi non ordinati o ordinati ciclici.
- Diagrammi cartesiani: per serie storiche.
In ognuno di questi casi l’altezza o la dimensione di ciò che si rappresenta deve essere proporzionale all’intensità del fenomeno, che è rappresentata dalla frequenza assoluta o relativa.
Caso di fenomeni quantitativi di tipo continuo (classi e non modalità)
Nel caso di fenomeni quantitativi di tipo continuo, si può usare un tipo di rilevazione che ripartisce l’intervallo iniziale delle osservazioni in K sotto-intervalli, assegnando le unità statistiche al sotto-intervallo a cui appartengono.
Quindi Sotto-Intervalli = Modalità di X.
Esempio: X: Altezza (in cm.) (150 160) (160 170) (170 180) (180 190) Occorre però conoscere se gli estremi delle classi sono compresi oppure no.
L’istogramma
L’istogramma è un grafico costituito da barre non distanziate, dove ogni barra possiede un’area proporzionale alla frequenza della classe.
L’istogramma nel caso in cui l’ampiezza delle classi e’ diversa
- Se l’ampiezza delle classi è diversa, si usa la densità (indicata con h).
- La densità si ottiene come rapporto tra la frequenza e l’ampiezza della classe ( hj = pj/ aj).