Statistica Flashcards

1
Q

Dimmi cos’è la statistica (scienza dello stato)

A

insieme dei principi e dei metodi per la raccolta, elaborazione, utilizzazione e interpretazione di informazioni riguardanti fenomeni collettivi.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Dimmi cosa sono le unità statistiche

A

le entità elementari a cui si riferiscono le informazioni di interesse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Dimmi cos’è una variabile

A

Una variabile è l’informazione di interesse di un’indagine

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Dimmi cosa fa la statistica descrittiva

A

Fornisce gli strumenti per rappresentare, sintetizzare ed interpretare il modo in cui un fenomeno di interesse si è manifestato nel collettivo osservato

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Dimmi cosa fa la statistica inferenziale

A

Ha l’obiettivo di generalizzare i risultati osservati sul campione all’intera popolazione (rappresentata dal campione). Per fare questo si basa sulla teoria della probabilità

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Dimmi cos’è la popolazione

A

La popolazione è l’insieme di tutte le unità che costituiscono il gruppo che si è interessati ad analizzare

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Dimmi cos’è il campione

A

Il campione è l’insieme delle unità statistiche omogenee rispetto a qualche circostanza di interesse

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Dimmi come si dividono le variabili

A
  • categoriche/qualitative (nominali: sì/no e ordinali: presentano un grado o livello)
  • numeriche/quantitative (discrete: ottenute tramite conteggio e continue: hanno unità di misura)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Dimmi come si rappresentano le variabili categoriche

A
  • Distribuzione di frequenze
  • Diagramma a barre
  • Diagramma a torta
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Dimmi come si rappresentano le variabili numeriche

A
  • Distribuzione di frequenze
  • Istogramma
  • Ogiva
  • Box-plot
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Dimmi cos’è una distribuzione di frequenza

A

è una tabella contenente le categorie (o intervallo di valori) che si osservano nei dati e le corrispondenti frequenze con cui i dati appartengono alle categorie (o intervallo di valori)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Dimmi cos’è la frequenza assoluta (ni)

A

Il numero di volte in cui in una categoria di n unità statistiche è osservata la variabile di indagine

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Dimmi cos’è la frequenza relativa

A

Frequenza relativa(pi) = Frequenza assoluta (ni) / n. totale di osservazioni (n)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Dimmi 3 cose sui diagrammi a barre

A
  • Ciascuna barra è associata ad una categoria della variabile considerata
  • Tutte le barre hanno la stessa larghezza
  • L’altezza delle barre è proporzionale alle frequenze
    delle categorie
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Dimmi 2 cose sui diagrammi a torta

A
  • La torta è divisa in tante fette quante sono le categorie della variabile categorica considerata
  • L’ampiezza di ciascuna fetta è proporzionale alla frequenza della categoria corrispondente
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Dimmi cosa sono le classi e quando sono necessarie

A

intervalli disgiunti e che coprono l’intero intervallo di valori. Per le variabili numeriche le osservazioni possono assumere molti valori diversi tra loro. In questi casi si suddivide l’insieme dei valori che la variabile può assumere in intervalli, detti classi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Dimmi come si determina l’ampiezza di ciascuna classe

A

Ampiezza dell’intervallo = valore massimo−valore minimo / numero di classi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Dimmi com’è la notazione degli intervalli per i valori numerici

A

a ⊣ b indica tutti i valori da a (escluso) a b (incluso),
a ⊢ b indica tutti i valori da a (incluso) a b (escluso),
a ⊢⊣ b indica tutti i valori da a (incluso) a b (incluso).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Dimmi 3 cose sull’istogramma

A
  • Un grafico dei dati contenuti in una distribuzione di frequenze per dati numerici suddivisi in classi è chiamato istogramma
  • Gli estremi degli intervalli sono rappresentati sull’asse orizzontale.
  • L’asse verticale rappresenta la frequenza delle classi. L’altezza delle barre rappresentare il numero di osservazioni in ciascuna classe (o la frequenza relativa di ciascuna classe).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Dimmi cos’è la frequenza relativa cumulativa

A

La frequenza cumulativa per ogni classe, è la frequenza relativa fino alla classe considerata inclusa

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Dimmi cos’è un’Ogiva

A

Linea che rappresenta le frequenze cumulative. Graficamente si presenta come una spezzata che unisce i punti che hanno per ascisse gli estremi degli intervalli e per ordinate le corrispondenti frequenze relative cumulative

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Dimmi quando la forma della distribuzione è simmetrica o asimmetrica

A

La forma della distribuzione si dice simmetrica se le osservazioni sono bilanciate, o distribuite in modo approssimativamente regolare attorno al centro.

La forma della distribuzione è detta asimmetrica se le osservazioni non sono distribuite in modo simmetrico rispetto al centro. (Con coda a sx o a dx)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Dimmi quali sono gli obiettivi per una presentazione efficace dei dati

A

• Presentare i dati in modo da mostrare le informazioni essenziali.
•Comunicare idee complesse chiaramente ed in modo accurato.
• Evitare distorsioni che possono comunicare il messaggio sbagliato.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Dimmi quali sono degli errori nella presentazione dei dati

A

•Diversa ampiezza delle classi di intervallo in un istogramma che rappresenta le frequenze/freq. relative
• Compressione o distorsione dell’asse verticale
• Omissione dello zero sull’asse verticale
• Non fornire una base di riferimento per il confronto di
dati di diversi gruppi.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Dimmi come si descrivono numericamente i dati (2)

A
  • tendenza centrale
  • variabilità
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Dimmi quali sono le misure di tendenza centrale (centralità)/ indici di posizione (3)

A
  • media
  • mediana
  • moda
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Dimmi 4 cose sulla media

A
  • è la misura di tendenza centrale più comune
  • somma dei valori diviso il numero di valori
  • Può essere calcolata solo per variabili quantitative
  • è influenzata dai valori estremi (outlier)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Dimmi qual è la prima proprietà della media

A
  • la somma degli scarti delle osservazioni (i valori xi) dalla relativa media è uguale a zero
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Dimmi qual è la seconda proprietà della media

A
  • la media è un operatore lineare
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Dimmi 5 cose sulla mediana

A
  • In una lista di numeri ordinati in ordine crescente, la mediana è il valore “centrale” (50% prima, 50% dopo)
  • Non influenzata da valori estremi
  • posizione centrale = (n+1)/2
  • Se n è dispari, la mediana è l’osservazione al centro della lista ordinata
  • Se n è pari la mediana è la media delle due osservazioni che hanno la posizione attorno a quella centrale.

N.B. (n+1)/2 non è il valore della mediana, ma la posizione della mediana nella sequenza ordinata.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Dimmi 3 cose sulla moda

A
  • Valore che ricorre più frequentemente
  • non influenzata da valori estremi
  • può non esserci una moda (quando tutti i valori hanno la stessa frequenza)
  • ci può essere più di una moda (quando più di un valore ha la frequenza massima) (distribuzione plurimodale)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

Dimmi come individuare asimmetrie nella forma di distribuzione

A
  • se mediana < media si ha un’asimmetria con coda a destra
  • Se si osserva che mediana > media la distribuzione è asimmetrica con coda a sinistra
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Dimmi quali sono le misure di variabilità (5)

A
  • campo di variazione
  • differenza interquartile
  • varianza
  • deviazione standard
  • coefficiente di variazione
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Dimmi cosa fanno le misure di variabilità

A

Misurano grado con cui le variabili si dispongono intorno a un indice di centralità. Forniscono informazioni sulla dispersione o variabilità dei valori

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Dimmi 2 cose sul campo di variazione

A
  • Il campo di variazione (o Range) è la più semplice misura di variabilità
  • È la differenza tra il massimo e il minimo dei valori osservati
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Dimmi quali sono gli svantaggi del campo di variazione

A
  • Ignora il modo in cui i dati sono distribuiti
  • Sensibile agli outlier
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Dimmi cosa sono i quartili

A

I quartili dividono la sequenza ordinata dei dati in 4 segmenti contenenti lo stesso numero di valori

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Dimmi 1 cosa per ogni quartile

A

• Il primo quartile, Q1, è il valore per il quale 25% delle osservazioni sono minori e 75% sono maggiori di esso.
• Q2 coincide con la mediana (50% sono minori, 50% sono maggiori).
• Solo 25% delle osservazioni sono maggiori del terzo quartile, Q3

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

Dimmi come si calcolano i quartili

A

Un quartile si trova determinando il valore della sua posizione nella sequenza ordinata dei dati, dove
Posizione primo quartile (Q1) = n+1/4 = 0.25(n+1)
Posizione secondo quartile (Q2) = 2(n+1)/4= 0.50(n+1) (la posizione della mediana)
Posizione terzo quartile (Q3) = 3(n+1)/4= 0.75(n+1)
dove n è il numero di valori osservati

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

Dimmi 4 cose sul boxplot

A
  • Il boxplot visualizza minimo, massimo e quartili di una variabile numerica
  • È costruito in maniera tale che la scatola (che si estende da Q1 a Q3) contenga il 50% delle osservazioni
  • La mediana è rappresentata da una linea che attraversa la scatola centrale.
  • Le linee che si estendono a partire dalla scatola sono chiamate baffi e vanno fino al massimo e fino al minimo.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

Dimmi 4 cose sulla differenza interquartile

A
  • Diversamente dal campo di variazione, la differenza interquartile non risente della presenza di outlier
    • Considera solo l’intervallo che contiene il 50% dei dati centrali e rappresenta l’ampiezza di questo intervallo.
    • Differenza Interquartile (IQR) = 3° quartile – 1° quartile IQR=Q3 –Q1
  • Si può valutare la % di IQR rispetto al campo di variazione: IQR/Range (%). Più IQR/Range (%) si avvicina ad 1 maggiore è la dispersione.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
42
Q

Dimmi cos’è la varianza

A
  • Si basa sulla differenze tra ciascuna osservazione e la loro media (scarto)
  • VARIANZA = media degli scarti al quadrato
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
43
Q

Dimmi la formula ridotta della varianza

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
44
Q

Dimmi quali sono le proprietà della varianza

A
  • la varianza di una costante è pari a zero
  • la varianza è un operatore quadratico
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
45
Q

Dimmi 3 cose sulla deviazione standard

A
  • Misura di variabilità comunemente usata
  • Mostra la variabilità rispetto alla media
  • Ha la stessa unità di misura dei dati originali
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
46
Q

Dimmi 2 cose sulla deviazione standard (pt 2)

A
  • sensibile agli outlier
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
47
Q

Dimmi 3 cose sul coefficiente di variazione

A
  • Misura la variabilità relativa rispetto alla media
  • È espresso in percentuale (%)
  • Può essere usato per confrontare due o più variabili misurate con unità di misura diversa o con un diverso ordine di grandezza delle misurazioni
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
48
Q

Dimmi cos’è lo Z-score o valore standardizzato e come si trova

A
  • è il numero di deviazioni standard di cui un dato valore x è sopra o sotto la media
  • si trova traducendo un dato in una scala standardizzata
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
49
Q

Dimmi quali sono media e varianza dello Z-score

A
  • M= 0
  • s^2= 1
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
50
Q

Dimmi a cosa serve l’analisi bivariata

A
  • L’analisi bivariata ci consente di valutare se esiste una relazione tra due variabili. In particolare, le due variabili sono indipendenti oppure dipendenti?
  • Vogliamo sapere se la distribuzione di una delle due variabili (Y) varia in base ai diversi valori dell’altra variabile (X).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
51
Q

Dimmi perché dipende da non vuol dire causalità

A

l’esistenza di un’associazione tra X e Y non significa dimostrare che tra X e Y c’è un rapporto di causa-effetto …
… potrebbe esserci anche una variabile Z (latente o non nota) da cui dipendono sia X che Y che mette in relazione le due variabili

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
52
Q

Dimmi come si valuta relazione tra due variabili quantitative (4)

A
  • diagramma a dispersione
  • covarianza
  • coefficiente di correlazione lineare di Pearson
  • regressione lineare e R^2
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
53
Q

Dimmi cosa si intende con il termine correlazione

A

Ciò che analizza se esiste una relazione tra due variabili (come e quanto due variabili variano insieme, studio della co-variazione)
- relazione simmetrica

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
54
Q

Dimmi cosa si intende con il termine regressione

A

Ciò che analizza la forma della relazione tra variabili, assumendo il ruolo delle variabili (i valori di una variabile dipendono dai valori dell’altra variabile)
- relazione asimmetrica

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
55
Q

Dimmi 3 cose sul diagramma a dispersione o scatterplot

A
  • fornisce una rappresentazione grafica dell’andamento congiunto delle due variabili quantitative
  • Gli assi cartesiani del diagramma a dispersione rappresentano i valori delle due variabili (una ascissa, una ordinata)
  • L’insieme dei punti nel diagramma a dispersione si chiama nuvola di punti
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
56
Q

Dimmi 3 cose sul diagramma a dispersione (pt 2)

A

• Se le due variabili sono statisticamente indipendenti, i punti si presentano sparpagliati sul diagramma, senza alcuna struttura
• Se tra le due variabili c’è una relazione statistica, la nuvola di punti si presenta strutturata. Questa struttura ci dà informazioni sul tipo di relazione esistente
• Osservando la nuvola di punti possiamo dedurre informazioni sulla forma, sulla forza e sulla direzione della relazione fra due variabili quantitative

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
57
Q

Dimmi 2 cose sulla sommatoria

A
  • il simbolo di sommatoria viene utilizzato per indicare in maniera compatta la somma di più elementi
  • il parametro i è un intero e rappresenta l’indice della sommatoria
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
58
Q

Dimmi la prima proprietà della sommatoria

A
  • Se tutti i termini della sommatoria hanno lo stesso valore c che non dipende dall’indice (ossia
    x1 = c, x2 = c, . . .), allora
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
59
Q

Dimmi la seconda proprietà della sommatoria

A
  • la sommatoria può essere scomposta
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
60
Q

Dimmi la terza proprietà della sommatoria

A
  • la sommatoria è un operatore lineare
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
61
Q

Dimmi quali sono gli indici di dispersione (2)

A
  • varianza
  • deviazione standard
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
62
Q

Dimmi 3 cose sulla covarianza

A
  • indica come varia X al variare di Y
  • misura il segno della relazione lineare tra 2 variabili (se diretta o inversa)
  • misura come le 2 variabili si discostano dai loro valori medi
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
63
Q

Dimmi quali sono i 3 scenari in base al valore della covarianza

A
  • positiva: al crescere di X, Y cresce (direttamente correlate)
  • negativa: al crescere di X, Y decresce (inversamente correlate)
  • uguale a 0: X e Y non sono linearmente correlate
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
64
Q

Dimmi 4 cose sul coefficiente di Pearson

A
  • si calcola sulla base dei valori della covarianza
  • fornisce indicazione se relazione lineare è diretta o inversa tra 2 variabili e quanto è forte la relazione
  • non ha unità di misura
  • varia tra -1 e 1
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
65
Q

Dimmi i 3 scenari in base al valore del coefficiente di Pearson

A
  • positivo: al crescere di X, cresce anche Y. Quanto più è vicino a 1 tanto è più forte la relazione lineare
  • negativo: al crescere di X, Y decresce. Quanto è più vicino a -1, tanto è più forte la relazione lineare negativa
    = uguale a 0: X e Y non sono linearmente correlate
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
66
Q

Dimmi se il coefficiente di Pearson è influenzato dagli outliers

A

Si fortemente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
67
Q

Dimmi qual è l’obiettivo dell’analisi di regressione

A

Esprimere la relazione tra due o più variabili in forma matematica (equazione)
Y= f(X)

Y= variabile di risposta / dipendente
X= variabile esplicativa / indipendente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
68
Q

Dimmi qual è lo scopo della statistica

A

La conoscenza quantitativa dei fenomeni collettivi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
69
Q

Dimmi cosa è necessario per estendere un indagine campionaria a tutta la popolazione

A

Un campione casuale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
70
Q

Dimmi cosa si intende per campionamento stratificato

A

Campionamento su popolazione di riferimento su cui si possiedono già alcune informazioni a priori

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
71
Q

Dimmi il modo principale per acquisizione dati

A

Intervista

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
72
Q

Dimmi quali sono i principali obiettivi di un’analisi statistica (2)

A
  • sintetizzare dati
  • minimizzare perdita di informazione
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
73
Q

Dimmi tra cosa sono compresi i valori della frequenza assoluta

A

Tra 0 e il numero totale di osservazioni

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
74
Q

Dimmi tra cosa sono compresi i valori della frequenza relativa è la frequenza relativa cumulativa

A

Tra 0 e 1

75
Q

Dimmi a cosa è uguale la somma delle frequenze assolute

A

Al numero di osservazioni

76
Q

Dimmi a cosa è uguale la somma delle frequenze relative

A

A 1

77
Q

Dimmi se le classi devono per forza avere la stessa ampiezza

A

No

78
Q

Dimmi quando i dati sono grezzi e quando raggruppati

A

Grezzi appena raccolti, raggruppati quando sono nelle tavole di frequenza

79
Q

Dimmi quali sono i grafici di distribuzioni di frequenza

A

Istogrammi e diagrammi a barre

80
Q

Dimmi quale grafico viene utilizzato per distribuzione di frequenza di variabili discrete

A

Diagramma a barre:
- rappresentazione quantitativa (ascisse: valore variabili, ordinata: frequenza assoluta)
- rappresentazione qualitativa (diagramma a barre di Pareto) (ascisse: valore variabili in ordine decrescente di frequenza)

81
Q

Dimmi quale grafico viene utilizzato per distribuzione di frequenza di variabili continue

A

Istogramma: rettangoli adiacenti, altezza indica frequenza, la larghezza indica la classe (dipende dal numero di classi e dalla loro ampiezza)

82
Q

Dimmi quale grafico si usa per la distribuzione di frequenze di variabili qualitative

A

Diagramma a barre: basi delle barre sono tutte uguali (perché non ho bisogno di rappresentare ampiezza classi), altezza indica frequenza

83
Q

Dimmi quali osservazioni descrivono un istogramma

A
  • simmetria
  • centralità
  • concentrazione
  • anomalie
84
Q

Dimmi quando la mediana è preferibile alla media

A

Quando si vogliono eliminare gli effetti di valori estremi

85
Q

Dimmi cosa sono varianza e deviazione standard

A

Indici di dispersione

86
Q

Dimmi in quali casi si usa coefficiente di variazione (2)

A
  • quando misurazione variabile è basata su diverse unità di misura
  • quando c’è diverso ordine di grandezza delle misurazioni
87
Q

Dimmi come sono rappresentati outliers nel boxplot

A

Con asterischi

88
Q

Dimmi quando conviene usare boxplot

A

Per confrontare popolazioni simili

89
Q

Dimmi cosa si intende per analisi bivariata

A

Osservazione congiunta di due variabili

90
Q

Dimmi come si chiama l’analisi di due variabili congiunte qualitative

A

Analisi di associazione

91
Q

Dimmi come si chiama l’analisi di due variabili congiunte quantitative

A

Analisi di correlazione e regressione

92
Q

Dimmi cos’è una retta di regressione

A

Retta che si disegna quando c’è relazione lineare tra le variabili

93
Q

Dimmi cos’è il coefficiente di correlazione delle variabili X e Y

A
94
Q

Dimmi cos’è il coefficiente di correlazione delle variabili X e Y

A
95
Q

Dimmi se la covarianza è il coefficiente di correlazione hanno lo stesso segno

A

Si

96
Q

Dimmi quali sono i 3 scenari possibili in base al valore della covarianza

A
  • se >0 sono direttamente correlate
  • se <0 sono inversamente correlate
  • se =0 non sono correlate
97
Q

Dimmi cos’è il coefficiente di correlazione

A

Un indice normalizzato che quando vale -1 o +1 indica che la correlazione tra le variabili X e Y è massima o perfetta e che le osservazioni Yi sono funzioni lineari delle Xi

98
Q

Dimmi qual è l’obiettivo dello studio della regressione

A

Sintetizzare l’informazione della variabilità dello scatterplot scegliendo la retta che minimizzi la perdita di informazioni

99
Q

Dimmi cos’è il metodo dei minimi quadrati

A

Il metodo con cui si trova una retta che minimizzi al massimo la perdita di informazioni, passando approssimativamente vicino a tutti i punti XiYi

100
Q

Dimmi qual’è l’espressione per trovare la somma dei quadrati delle distanze tra il punto XiYi e il punto di uguale ascissa che si trova sulla retta y= ax + b

A
101
Q

Dimmi quali sono i 2 obiettivi dell’analisi di regressione

A
  • Esprimere la relazione tra due o più variabili in forma matematica (un’equazione)
  • prevedere il valore della variabile Y conoscendo il valore della variabile X
102
Q

Dimmi com’è un’equazione di regressione

A

Y= f(X)

Y è la variabile di risposta/ dipendente (outcome) ed è espressa come funzione di una variabile esplicativa/ indipendente (X)

103
Q

Dimmi 2 cose sulla regressione lineare

A
  • la relazione tra variabili è rappresentata da una linea retta
  • equazione: Y= aX + b
    a= coefficiente angolare, rappresenta pendenza retta
    b= intercetta
104
Q

Dimmi cos’è il residuo o errore

A

La differenza tra il valore predetto (y^i) dalla retta di regressione in base al valore di Xi e il valore di Y osservato in corrispondenza del valore di Xi

105
Q

Dimmi come si calcola la pendenza della retta della regressione lineare

A
106
Q

Dimmi 2 cose sull’intercetta della retta di regressione lineare

A
  • stima il valore medio atteso di Y quando X=0
  • la retta passa sempre per il punto di incontro delle medie delle due variabili
107
Q

Dimmi 3 cose sul coefficiente di regressione “a”

A
  • a>0 se aumenta X, aumenta anche Y
  • a<0 se aumenta X, Y diminuisce
  • indica il cambiamento medio di Y in base al valore X, non è una relazione esatta
108
Q

Dimmi quando usare retta di regressione

A

Quando si vuole prevedere un valore di Y dato un valore di X (ex: prevedere il peso di un soggetto alto 168 cm)

109
Q

Dimmi quando è meglio non usare retta di regressione

A

Quando si vuole prevedere valori di Y in corrispondenza di valori di X molto al di fuori dell’intervallo delle osservazioni

110
Q

Dimmi cos’è l’indice di determinazione della bontà di adattamento lineare

A

Un indice che misura la quota di informazione trattenuta dalla retta di regressione in percentuale dell’informazione sulla variabilità totale

111
Q

Dimmi a cosa corrisponde la deviazione non spiegata della regressione

A

All’errore o residuo
Yi - Y^i

112
Q

Dimmi a cosa corrisponde deviazione totale

A
113
Q

Dimmi come trovare deviazione spiegata dalla regressione

A
114
Q

Dimmi 3 cose sull’indice di adattamento R^2

A

misura quanta parte della variabilità totale di Y il modello di regressione riesce a spiegare

115
Q

Dimmi cosa vuol dire se R^2 tende a 1

A

Indica che la quota di variabilità spiegata dalla retta si avvicina molto alla variabilità totale, quindi siamo in presenza di ottima bontà di adattamento lineare

116
Q

Dimmi cosa vuol dire se R^2 tende a 0

A

Indica che la retta spiega una quota infinitesimale della variabilità totale che nella scomposizione precedente sarà contenuta tutta nella quantità residuale SSE

117
Q

Dimmi qual è il rapporto tra indice di adattamento R^2 e coefficiente di correlazione

A
118
Q

Dimmi quali tipi di analisi si fanno se X e Y sono quantitative (2)

A
  • analisi di correlazione
  • analisi di regressione
119
Q

Dimmi quale tipo di analisi di fa se X e Y sono qualitative

A

Analisi di associazione

120
Q

Dimmi quali tipi di associazione esistono (3)

A
  • CAUSALE: esposizione causa malattia
  • SPURIA: esposizione non causa malattia
  • NON CAUSALE: - malattia causa l’espozione - terzo fattore
121
Q

Dimmi cos’è una tabella di contingenza

A

Metodo usato per verificare associazioni tra variabili qualitative ma anche quantitative

122
Q

Dimmi cosa sono riportate nelle tabelle di contingenza

A

Frequenze assolute congiunte (nij)

123
Q

Dimmi cosa sono le frequenze assolute marginali nelle tabelle di contingenza

A

Somma delle frequenze di una riga (frequenza assoluta marginale per riga) o di una colonna (frequenza assoluta marginale per colonna)

124
Q

Dimmi se esistono anche le frequenze relative e relative marginali nelle tabelle di contingenza

A

Si esistono

125
Q

Dimmi cos’è la frequenza relativa condizionata di colonna o di riga (stessa roba per la condizionata assoluta)

A

La frequenza relativa di una caratteristica nella riga sul totale della colonna di quella caratteristica

126
Q

Dimmi quando 2 variabili si dicono statisticamente indipendenti

A
  • se le frequenze relative condizionate sono uguali alle frequenze relative marginali
127
Q

Dimmi formula frequenza assoluta congiunta attesa

A
128
Q

Dimmi formula frequenza relativa congiunta attesa

A
129
Q

Dimmi cosa si trova quando le 2 variabili sono dipendenti nelle tabelle di contingenza

A
130
Q

Dimmi da cosa è dato lo scostamento tra le frequenze assolute congiunte osservate e quelle attese

A
131
Q

Dimmi cos’è l’indice chi-quadrato

A
  • indice usato per valutare associazione di 2 variabili
132
Q

Dimmi un’altra formula dell’indice chi-quadrato

A
133
Q

Dimmi cos’è la sensibilità di un test

A

Probabilità che una persona malata riceva un risultato positivo al test

134
Q

Dimmi cos’è la specificità di un test

A

Probabilità che una persona che non ha la malattia riceva un test negativo

135
Q

Dimmi 2 cose sulla specificità e sensibilità nell’interpretazione dell’accuratezza

A
  • più la sensibilità è vicina a 1 più il test è accurato a identificare individui malati
  • più la specificità è vicina a 1 più il test è accurato a identificare individui sani
136
Q

Dimmi cos’è il valore predittivo positivo

A

Probabilità che una persona positiva al test abbia la malattia

137
Q

Dimmi cos’è il valore predittivo negativo

A

Probabilità che una persona negativa al test sia effettivamente sana

138
Q

Dimmi quanto deve essere la prevalenza perché sia effettivo e rappresentativo della popolazione

A

Vicino a 50%

139
Q

Dimmi la definizione di probabilità

A

Rapporto tra numero di casi favorevoli affinché un evento si verifichi è il numero di casi possibili

140
Q

Dimmi cosa sono eventi equiprobabili

A

Eventi che hanno la stessa probabilità di verificarsi individualmente

141
Q

Dimmi cosa si intende per spazio degli eventi o spazio campionario

A

Insieme di tutti i risultati possibili di un evento aleatorio (si indica con E)

142
Q

Dimmi cos’è un evento

A

Ogni possibile sottoinsieme dello spazio campionario

143
Q

Dimmi quando due eventi si dicono incompatibili o disgiunti

A

Quando non possono verificarsi contemporaneamente

144
Q

Dimmi quando due eventi si dicono compatibili

A

Quando possono verificarsi contemporaneamente

145
Q

Dimmi come calcolare la probabilità di eventi compatibili

A
146
Q

Dimmi cos’è il prodotto logico di eventi

A

È l’evento che si verifica se si verificano contemporaneamente sia l’evento E1 che l’evento E2 e si indica

147
Q

Dimmi quando due eventi sono indipendenti

A

Quando il verificarsi di uno non influenza l’altro

148
Q

Dimmi quando due eventi si dicono dipendenti o correlati

A

Quando il verificarsi di un evento influenza il secondo evento modificandone la probabilità (ex: estrazione con o senza reimbussolamento)

149
Q

Dimmi la formula della probabilità condizionata

A

La probabilità condizionata riduce lo spazio degli eventi

150
Q

Dimmi cosa fa il teorema di Bayes

A

Permette di quantificare la probabilità che un dato evento abbia alla sua origine una determinata causa

151
Q

Dimmi quali sono i 3 step della conduzione di uno studio epidemiologico

A
  • definizione degli obiettivi della ricerca
  • analisi delle condizioni
  • scelta del tipo di disegno dello studio
152
Q

Dimmi quali sono esempi di studi sperimentali in uno studio epidemiologico

A
  • prova randomizzata controllata
  • prova con intervento
153
Q

Dimmi quali sono esempi di studi osservazionali analitici in uno studio epidemiologico

A
  • studi trasversali
  • studi di coorte
  • studi di caso-controllo
154
Q

Dimmi un esempio di studio osservazionale di correlazione in uno studio epidemiologico

A

Ecologico

155
Q

Dimmi cos’è uno studio sperimentale

A

Un’indagine che permette di confrontare 2 o più gruppi di individui riguardo all’esito di trattamenti diversi

156
Q

Dimmi cosa si intende per trattamento in uno studio sperimentale

A

Qualunque intervento di tipo terapeutico, profilattico o altro, volto a modificare lo stato di salute dell’uomo

157
Q

Dimmi per cosa sono anche usati gli studi sperimentali

A

Per valutare l’efficacia di procedure diagnostiche, test di laboratorio, ecc…

158
Q

Dimmi in cosa consiste uno studio sperimentale

A

In un set di osservazioni condotto sotto circostanze controllate in cui lo sperimentatore manipola le condizioni per indagare gli effetti che tali manipolazioni hanno sugli elementi in studio

159
Q

Dimmi cosa è importante perché uno studio sia valido

A

È importante che l’unico fattore che varia tra i gruppi sotto osservazione sia quello in studio. Ciò è garantito dalla randomizzazione

160
Q

Dimmi la differenza tra clinical trial e field trial VS community trial

A

Clinical e field trial riguardano singoli soggetti, i community riguardano gruppi

161
Q

Dimmi cosa riguardano i clinical trial

A

I soggetti che hanno una patologia

162
Q

Dimmi cosa riguardano i field e community trial

A

La prevenzione primaria

163
Q

Dimmi quali sono le procedure per rimuovere le possibili fonti di bias negli studi sperimentali

A

Il blinding (single, double, triple)

164
Q

Dimmi cosa sono gli studi osservazionali

A

Fotografano in un dato tempo le dimensioni di parametri definiti in un gruppo di soggetti selezionati in funzione di ampi criteri di inclusione. Permette di ottenere informazioni più aderenti perché avviene in condizioni normali

165
Q

Dimmi 3 limiti degli studi osservazionali

A
  • validità statistica è ridotta dal limitato rigore e dall’alto numero di variabili ma aumentata dall’alto numero di soggetti
  • completano gli studi sperimentali con i loro lunghi periodi di osservazione
166
Q

Dimmi cosa sono gli studi di correlazione

A

Studi che mettono in relazione la distribuzione di uno o più fattori di rischio e una patologia. È possibile verificare le relazioni solo di un gruppo

167
Q

Dimmi quali sono i vantaggi di uno studio caso-controllo (6)

A
  • adatti a studi di malattie rare o a lunga latenza
  • veloci da condurre
  • poche risorse economiche
  • pochi soggetti
  • possono essere usati dati già esistenti
  • si possono studiare cause potenziali di malattia
168
Q

Dimmi quali sono gli svantaggi di uno studio caso-controllo

A
  • si affidano a dati già rilevati in passato o al ricordo
  • validazione delle info è quasi impossibile
  • selezione di un gruppo appropriato è difficile
  • non si può stabilire sequenza eventi
169
Q

Dimmi 2 cose sugli studi di coorte

A
  • Il gruppo di persone da studiare (coorte) sono selezionate in funzione delle caratteristiche presenti prima della comparsa della malattia
  • la coorte viene osservata per un periodo di tempo per determinare e confrontare frequenza malattia in studio
170
Q

Dimmi quali sono i vantaggi degli studi di coorte (5)

A
  • adatti per lo studio di esposizioni comuni, malattie multifattoriali
  • si possono valutare effetti multipli di singole esposizioni
  • si può dimostrare relazione temporale tra esposizione e malattia
  • permette di misurare direttamente incidenza della malattia negli esposti e non esposti nella popolazione
171
Q

Dimmi cos’è la funzione cumulativa

A

La probabilità che X assuma un valore minore di un generico valore Xo

172
Q

Dimmi come si calcola valore atteso di una variabile casuale discreta

A
173
Q

Dimmi come si calcola varianza variabile aleatoria discreta

A
174
Q

Dimmi come si calcola deviazione standard o scarto quadratico medio di una variabile discreta

A
175
Q

Dimmi come trovare media e varianza del,a variabile X + Y (indipendenti)

A
176
Q

Dimmi quali sono distribuzioni di probabilità discrete

A
  • binomiale
  • Poisson
177
Q

Dimmi 3 cose sulla distribuzione di Bernoulli (caso particolare di binomiale)

A
  • 2 esiti: successo (S) o insuccesso (INS)
  • S= p INS= 1-p
  • variabile aleatoria di Bernoulli X= 1 (successo), X=0 (insuccesso)
178
Q

Dimmi quali sono media e varianza della distribuzione di Bernoulli

A
179
Q

Dimmi cos’è variabile aleatoria binomiale

A

Numero di successi in n numero di prove ripetute

180
Q

Dimmi 3 caratteristiche della sequenza di n prove ripetute nella distribuzione binomiale

A
  • ogni prova può essere S o INS, oppure 1 o 0
  • probabilità S e INS è la stessa
  • prove sono indipendenti
181
Q

Dimmi coeff. binomiale per trovare il numero di sequenze con X successi in n prove

A
182
Q

Dimmi formula distribuzione di probabilità binomiale (probabilità di X successi in n prove)

A
183
Q

Dimmi quando si ha una diagnosi diretta

A

Quando si ha una dimostrazione del patogeno direttamente nel campione

184
Q

Dimmi quando si ha diagnosi indiretta

A

Quando sintomi paziente rivelano presenza patogeno (ex: produzione anticorpi)