legame fra due variabili Flashcards

1
Q

cosa sono i metodi di correlazione?

A

sono metodi che servono a capire se una certa variabile ne influenza un’ altra.

la correlazione permette di studiare qual’è il grado di influenza tra due variabili, o permette di valutare il grado di associazione tar due variabili influenzate da una causa esterna.

La relazione fra due variabili può essere in prima analisi analizzata tramite un diagramma a dispersione chiamata anche scatter plot.

tuttavia questo non basta a definire il tipo di correlazione esistente fra le due variabili.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

A cosa serve il coefficiente di correlazione di Pearson?

A

si indica con r è indica la “forza “ di associazione fra due variabili.

ha una certa formula e un valore che va da -1 ad 1 compreso lo 0

più lo scostamento è vicino al valor medio, più sarà vicino a -1 o ad 1

più si avvicina a 0 tanto meno le due variabili saranno correlate.

se r=1 allora tutti i punti si troveranno su una retta. in questo caso si parla di proporzionalità diretta.

se r=-1 ci sarà massima correlazione ma di correlazione inversa.

se r=0 non c’è correlazione fra le due variabili.

tuttavia questo r è solo una stima nel campione e non basta per stabilire se vi è una correlazione tra le due variabili nell’intera popolazione.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

la distribuzione normale bivariata

A

per poter ampliare il risultato della correlazione alla popolazione , è necessario usare le distribuzioni di probabilità.

la distribuzione fra due variabili è definita come distribuzione congiunta.

essa può essere o non essere nota come distribuzione .

la punta di questa distribuzione è rappresentato dal valore edio di x e da quello di y, ogni incrocio corrsiponde ad una certa probabilità di x e di y.

In questo caso la media di enyrambi i valori è centrata in 0, quindi si parla di distribuzione bivariata standard.

nel momento in cui entrambe le variabili hanno distribuzione bivariata standard, nel momento in cui non vengano più correlate si può assumere che siano tra loro indipendenti.

se non sono rappresentate da una normale bivariata allora di deve pensare ad una altra forma di legame che potrà essere sigmoide, esponenziale, parabolica.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

test di verifica di ipotesi per la normale bivariata

A

tra le assunzioni si pone una normale bivariata

ciò che si vuole capire è se esiste la relazione fra le due variabili nella popolazioni RHO

r rappresenta invece la stima relativa al campione

questo test cercherà anche la indipendenza delle due variabili.

la distribuzione che si ottiene ha una funzione che contiene 5 parametri tra cui la media di x, la deviazione standard di x, la media di y, la deviazione standard di y , il coefficiente rho nella popolazione.

si tratta di una funzione esponenziale

Il T = r radice di n-2 su 1- r quadro

T poi andrà confrontato con il valore tabulato per stabilire o meno ola possibilità di una correlazione.

se il valore calcolato è molto superiore al valore tabulato è possibile rifiutare l’ipotesi nulla dunque le grandezze saranno correlate.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

come passo da r nel campione al RHO della popolazione?

A

per poter passare al rho nella popolazione è necessario usare un test t student, che valuta la dipendenza o indipendenza delle variabili.

nelle ipotesi si afferma che p=0 cioè la relazione non c’è nella popolazione

se la distribuzione è normale bivariata.

Si può affermare che quindi le due variabili sono indipendenti solo e soltanto quando seguono la distribuzione normale bivariata.

di conseguenza RHO uguale a 0 indica non solo l’assenza di relazione lineare ma anche di qualsiasi altro tipo di relazione e che quindi le variabili siano indipendenti.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

coefficiente di correlazione di Spearman

A

quando non è possibile assumere che le variabili abbiano distribuzione normale bivariata si usa un metodo non parametrico

ci sarà un nuovo coefficiente chiamato di di Spearman che è pari ad 1- 6 volte la sommatoria delle differenze al quadrato diviso n per n quadro meno 1

anche il coefficiente si spearman varia tra -1 e +1.

se i valori sono prossimi a meno 1 è presente una correlazione inversa

se i valori sono prossimi a 0 non c’è correlazione,

se i valori sono prossimi a +1 allora c’è una correlazione direttamente proporzionale.

il coefficiente si spearman si basa quindi sulla differenza DEI RANGHI ovviament eperchè è un metodo non parametrico.

si assegnano i ranghi ai valori della variabile x e la variabile y , al valore più piccolo si assegna rango 1.

si individuano le differenze fra ranghi, per ogni osservazione si esegue la differenza fra il rango attribuito allaa variabile x e quello della y per una osservazione.

ogni differenza è poi elevata al quadrato, e poi si esegue la sommatoria.

si ottiene poi rs che è il risultato del campione, in base ad esso si stabilisce se la correlazione è positiva o negativa o assente

per fare una inferenza allora si può fare un test dove si confronta il valore di rs con il valore di rs tabulato.

se il valore calcolato è maggiore, allora si rifiuta l’ipotesi nulla.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly