Lezione 4-5:Statistica Bivariata (Analisi Di Correlazione E Regressione) Flashcards

1
Q

Qual è lo scopo della statistica bivariata?

A

Studia se esiste una correlazione tra 2 variabili:
-2 variabili quantitative
-2 variabili qualitative
-1 variabile quantitativa e 1 qualitativa

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Dipendenza e causalità sono la stessa cosa?

A

No
-DIPENDENZA—-> studia se c’è una associazione tra x e y
-CAUSALITÀ—->studia se c’è un rapporto causa-effetto tra le variabili
Il fatto che ci sia dipendenza non vuol dire che ci sia causalità, infatti potrebbe esistere una terza variabile Z da cui dipendono X e Y e che le mette in correlazione tra loro

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qual è la differenza tra correlazione e regressione?

A

-CORRELAZIONE—->studia se esiste una relazione tra le 2 variabili, quindi se la relazione è lineare o no(COME VARIA X AL VARIARE DI Y, OVICEVERSA?)—-> studio della co-variazione RELAZIONE SIMMETRICA

-REGRESSIONE—-> studia la forma della relazione (subentra il concetto di variabili dipendente o indipendente) (es. i valori di y dipendono da x?) RELAZIONE ASIMMETRICA

QUINDI SI VA A VALUTARE PRIMA LA CORRELAZIONE E POI LA REGRESSIONE!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Come si chiama l’analisi di 2 variabili quantitative?

A

Analisi della correlazione e della regressione

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Dimmi 4 modi per valutare la relazione tra 2 variabili quantitative

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Dimmi 4 cose sul digramma a dispersione

A

-è anche detto scatterplot
-è la rappresentazione grafica dell’andamento congiunto delle due variabili quantitative.
-Gli assi cartesiani del diagramma a dispersione
rappresentano i valori delle variabili
-L’insieme dei punti nel diagramma a
dispersione si chiama nuvola di punti.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Come si interpretano i dati dello scatterplot?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Dimmi 3 cose che si possono dedurre dall’osservazione della nuvola di punti dello scatterplot

A
  • forma ( lineare o non lineare)
    -forza
    -direzione (diretta o inversa)
    Della relazione tra le variabili quantitative
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Com’è la relazione tra queste variabili?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Come sono la forza e la direzione di queste due variabili?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quali informazione dà lo studio della covarianza?

A

Studia il segno/direzione della relazione (ossia se è diretta o inversa)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Dimmi 3 cose sulla covarianza

A

-indica come varia X al variare di Y e viceversa (ossia se esiste una relazione lineare diretta o lineare inversa tra le variabili)
-È un indicatore sintetico sulla variazione
contemporanea dei valori di due variabili quantitative
-si calcola come:

Indica come le variabili si discostano dai loro valori medi (ossia dalla loro media)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Che vuol dire se
Sxy>0
Sxy<0
Sxy=0

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qual è il limite della covarianza?

A

-non dà risultati standardizzati (ossia dà risultati legati alle loro unità di misura)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Cos a indica il coefficiente di correlazione di Pearson?

A

-il segno/ direzione della relazione
-la forza della relazione

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Dimmi 4 cose sul coefficiente di correlazione di Pearson

A

-è un indice standardizzato (senza unità di misura)
-varia tra -1 e 1
-è influenzato dagli outliers e dal range delle variabili
- si calcola come

17
Q

Che vuol dire se

A

-ρX,Y = 1 = correlazione lineare DIRETTA perfetta
-ρ X,Y = -1 = correlazione lineare INVERSA perfetta

18
Q

Quali sono i due obiettivi della regressione lineare?

A

-scopo esplicativo—-> descrivere la relazione tra x e y
-scopo predittivo—< stimare il valore di Y in base a quello di X

19
Q

Da cosa è rappresentata la relazione delle due variabili nello studio della regressione lineare?

A

Da una retta (è una stima approssimativa della relazione)

20
Q

Qual è l’obiettivo della retta dei minimi quadrati?

A

Trovare la retta migliore di tutte (ossia quella che minimizza l’errore)

Infatti la retta dei minimi quadrati è quella che minimizza l’errore

21
Q

Cosa vuol dire se
-a (cappuccio)> 0
-a (cappuccio)< 0

A
22
Q

Cosa misura a (cappuccio)?

A

La forza dell’impatto
(Infatti:

23
Q

Come faccio a fare una previsione rispetto ad un valore Xi?

A

Infatti la retta di regressione prevede il valore medio di Y sulla base del valore di Xi

24
Q

Cosa indica la bontà di adattamento?

A

Indica quanto sia veritiera la previsione lineare della retta dei minimi quadrati

25
Q

Cosa fa b (cappuccio?

A
26
Q

Cosa sono SST, SSR,SSE e quali sono le loro formule?

A

SST—->somma totale dei quadrati
SSR—->somma dei quadrati spiegata con la regressione (ciò che catturo con la previsione della retta di regressione lineare)
SSE—> somma dei quadrati non spiegata (ossia ciò che perdo con la previsione della retta di regressione)

27
Q

Cosa vuol dire se
-SST=SSR
-SST è simile a SSR
-SST è simile ad SSE

A
28
Q

Cosa misura l’indice di adattamento?

A

-misura quanta parte della variabilità totale di Y si riesce a spiegare attraverso la retta dei minimi quadrati (o retta di regressione)

29
Q

Cosa vuol dire se
-R^2 tende a 0
-R^2 tende a 1

A

R2 → 1 indica che la quota di variabilità spiegata dalla retta si avvicina molto alla variabilità totale, quindi siamo in presenza di ottima bontà di adattamento lineare (SST è simile a SSR)
R2 → 0 indica che la retta spiega una quota piccola
della variabilità totale (quindi SST è simile ad SSE)

30
Q

Qual è la relazione tra l’indice di adattamento e il coefficiente di correlazione di pearson?

A
31
Q

Come varia R^2?

A
32
Q

Qual è la differenza tra coefficiente di adattamento e coefficiente di correlazione?

A

Coefficiente di correlazione di pearson—->pxy
Coefficiente di adattamento—-> o indice di regressione (R^2)