Lezione 2: Tipi Di Variabili E Rappresentazioni Grafiche Flashcards
Quali sono i tipi di variabili descrittive?
Qual è la differenza tra statistica descrittiva e statistica inferenziale?
DESCRITTIVA: presentazione+organizzazione+ sintesi dei dati
INFERENZIALE: passare da n( campione) a N(popolazione) attraverso STIMA+VERIFICA DELLE IPOTESI
Cosa sono:
Carattere/variabile
Unità statistica
Modalità del carattere
Campione o collettivo statistico
CARATTERE/VARIABILE—-> informazione di interesse
UNITÀ STATISTICA—-> entità elementare a cui si riferiscono le variabili
MODALITÀ DEL CARATTERE—->modo in cui si manifesta il carattere nell’unità statistica
CAMPIONE/COLLETTIVO STATISTICO—-> insieme di unità statistiche omogenee rispetto ad una variabile
Dimmi 2 cose sulla distribuzione di frequenza per le variabili categoriche
-tabella contendente catergorie (i) e le relative frequenze (assolute: ni/ relative:pi)
-Permette una veloce interpretazione dei dati
Dimmi 3 cose sui diagrammi a barre
-si usano quando ci sono più categorie per una sola variabile!!!!
-sulle ascisse si mettono le categorie/sulle ordinate si mette la frequenza relativa di ogni categoria
-CARATTERISTICHE:
*tutte le barre hanno la stessa larghezza
*l’altezza delle barre è proporzionale alla frequenza relativa
Dimmi 2 cose sul diagramma di Pareto
-si usa per le variabili categoriali
-Diagramma a barre particolare in cui sulle ascisse si mettono le categorie in ordine decrescente di importanza all’interno del campione, vedi immagine
Dimmi 2 cose sui diagrammi a torta
-la torta è divisa in tante fette quante sono le categorie della variabile
-l’ampiezza delle fette è proporzionale alle frequenze relative delle categorie
Cos’è la distribuzione di frequenza per le variabili numeriche?
-è una tabella contenente le classi di peso e le relative frequenze (assoluta,relativa, relativa cumulativa)
Dimmi 2 cose sulle classi di peso
-sono gli intervalli in cui suddivido i valori numerici che la variabile può assumere
-sono intervalli disgiunti tra loro ma che ricoprono l’intero intervallo di valori
Cosa succede alla rappresentazione grafica se ho
-troppe classi di intervallo
-poche classi di intervallo?
- troppe (e piccole)—->
*distribuzione frastagliata - cattiva indicazione di come varia la frequenza
-poche (e grandi)—->
*distribuzione a blocchi
*non si vedono gli andamenti della frequenza
Dimmi 3 cose sulle ogive
-sono grafici utilizzati per rappresentare le frequenze relative cumulate
-la linea spezzata rappresenta le frequenze relative cumulate
-sulle ascisse si mettono gli estremi dell’intervallo e sulle ordinate la frequenza relativa cumulativa
Dimmi 4 cose sull’istogramma
-è il corrispettivo del diagramma a barre per le variabili numeriche
-sulle ascisse ci sono gli estremi dell’intervallo
-sulle ordinate ci sono le frequenze relative
-l’altezza delle barre è proporzionale alle frequenze relative
Dimmi due differenze tra diagramma a barre e istogramma
-DIAGRAMMA A BARRE—->
*usato per le variabili continue (sulle ascisse metto le categorie della variabile)
*le barre sono separate tra loro
-ISTOGRAMMA—->
*usato per le variabili numeriche (sulle ascisse metto gli intervalli/classi di peso)
*le barre sono tutte unite tra loro
Dimmi 4 cose sul boxplot
-rappresentazione graffi a dei quartili
-la scatola contiene il 50% delle osservazioni (AMPIEZZA SCATOLA: Q3-Q1)
-Q2 coincide con la mediana
-serve per confrontare contemporaneamente più gruppi di dati invece che uno solo
Come può essere la forma della distribuzione di un istogramma?
-simmetrica e asimmetrica