Capitolo 1 - Statistica Descrittiva Flashcards

1
Q

Definizione di statistica descrittiva

A

La statistica descrittiva descrive,rappresenta e sintetizza in maniera opportuna un insieme o campione di dati relativamente ad un problema (popolazione) di interesse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Cosa si intende con “popolazione”?

A

Si intende la TOTALITÀ dei CASI, ossia le unità sulle quali è possibile rilevare una variabile di interesse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Cosa si intende con “campione”?

A

È un INSIEME FINITO di n unità che si può ritenere rappresentativo dell’intera popolazione.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Cos’è la statistica INFERENZALE?

A

Utilizza le informazioni della statistica descrittiva per fare delle affermazioni più generali riguardanti i parametri della popolazione, da cui il campione è stato estratto.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Che cosa afferma la statistica inferenziale?

A

STIMA:si vuole indicare un valore plausibile per il parametro della popolazione, sotto una delle 2 forme:
1. STIMA PUNTUALE: valore ben definito.
2.STIMA INTERVALLARE: un intervallo in cui molto verosimilmente il parametro sia incluso.
VERIFICA DI IPOTESI: indicare quale tra due specifiche ipotesi sul parametro (nulla o alternativa) sia da accettare.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qual è la differenza tra parametri e stime dei parametri?

A

I parametri sono quantità non osservabili ( solitamente μ e σ).Le stime dei parametri ( media e deviazione standard campionaria) invece, sono valori plausibili per un parametro della popolazione e che possiamo calcolare attraverso i dati campionari.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Su cosa si focalizza la statistica descrittiva?

A

Si focalizza su tre aspetti principali:

  1. La descrizione e la forma della distribuzione
  2. La posizione o tendenza centrale
  3. La variabilità o dispersione
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quali strumenti utilizza la statistica descrittiva?

A
Grafici:
- Dotplot
- Tabella ed istogramma di frequenza:
   - frequenza assoluta, frequenza relativa, cumulata
- Boxplot
- Probability plot
INDICI DI SINTESI
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quali sono gli indici di sintesi?

A

INDICI DI POSIZIONE O TENDENZA
- media, media, moda

INDICI DI VARIABILITÀ O DISPERSIONE
- varianza, deviazione standard (scarto quadratico medio), range, range interquartile

INDICI DI ASIMMETRIA

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Definizione di FREQUENZA ASSOLUTA

A

È il numero di unità che cadono in una determinata classe.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Definizione di FREQUENZA RELATIVA

A

La frazione o la percentuale di unità (rispetto al numero totale di unità) che cade in una determinata classe.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Definizione di FREQUENZA CUMULATA

A

Il numero di unità che sono inferiori ad una data soglia. Può essere sia assoluta che relativa.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Cos’è la MEDIANA?

A

È la media dei due valori nella posizione centrale:
Se pari, la media tra i due centrali.
Se dispari, il valore centrale.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Cos’è il PRIMO QUARTILE?

A

Il valore più vicino alla posizione 1/4:
Se n+1 è divisibile per 4, Q1 è il valore (n+1)/4.
Se n+1 non è divisibile per 4, cadono esattamente tra 2 posizioni.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Cos’è il TERZO QUARTILE?

A

Il valore più vicino alla posizione 3/4:
Se n+1 è divisibile per 4, cade nella posizione (n+1)*3/4.
Se n+1 non è divisibile per 4, cade esattamente tra due posizioni.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Cosa si rappresenta nel boxplot ?

A

Rappresenta i 5 numeri di sintesi:MIN, Q1, MEDIANA, Q3 e MAX.
ALL’interno della scatola è contenuto il 50% dei dati osservati.
Sono rappresentati anche i valori che oltrepassano il minimo ed il massimo: questi prendono il nome di OUTLIER.

17
Q

Che informazioni danno la posizione, dimensione e forma della scatola?

A

Danno rispettivamente un’indicazione della TENDENZA CENTRALE, della VARIABILITÀ (“intensità “ della dispersione) e della SIMMETRIA della distribuzione.

18
Q

Perché utilizziamo il box plot o il dotplot?

A

Perché sono particolarmente efficaci nel confronto tra due o più serie di dati.

19
Q

Cos’è un indicatore robusto?

A

È un indicatore non influenzato dalla presenza di dati anomali.

20
Q

La MEDIANA è un indicatore ROBUSTO?

A

Si, è un indicatore robusto.

21
Q

Cos’è la MEDIA CAMPIONARIA?

A

È la sommatoria di tutte le osservazioni diviso il loro numero.
È una sorta di BARICENTRO dei dati e tende ad essere “trascinata” verso i dati anomali.

22
Q

Cos’è la MODA?

A

È il valore più frequente in una serie di dati.

23
Q

Cosai rappresentano gli INDICI DI DISPERSIONE O VARIABILITÀ?

A

Indica il grado di “oscillazione” o varianza dei valori rispetto alla loro tendenza centrale.

24
Q

Cos’è la VARIANZA CAMPIONARIA?

A

Si indica con la lettera s^2:

È data dalla sommatoria al quadrato della frequenza relativa meno la media campionaria, il tutto diviso da (n-1).

25
Q

Cos’è la DEVIAZIONE STANDARD o lo SCARTO QUADRATICO MEDIO?

A

È la radice quadrata della varianza campionaria.

26
Q

Cos’è il RANGE INTERQUARTILE?

A

È definito come: IQR=Q3-Q1.

È sempre maggiore o uguale a zero ed è tanto più grande quanto più i dati sono variabili rispetto alla mediana.

27
Q

Cos’è il RANGE?

A

Range=MAX-MIN

È di scarso rilievo data la sua forte dipendenza dall’eventuale presenza di dati anomali.

28
Q

Come determinò la simmetria della distribuzione?

A

-mediamediana: asimmetria positiva o distribuzione obliqua a destra.

29
Q

Cos’è il COEFFICIENTE DI CORRELAZIONE?

A

Il coefficiente di correlazione lineare campionaria permette di determinare il grado di intensità del legame tra coppie di variabili.

La correlazione, varia tra -1 e +1:
- r = − 1 (+1): perfetta correlazione negativa (positiva)
- -1