Statistica Flashcards
Dimmi cos’è la statistica (scienza dello stato)
insieme dei principi e dei metodi per la raccolta, elaborazione, utilizzazione e interpretazione di informazioni riguardanti fenomeni collettivi.
Dimmi cosa sono le unità statistiche
le entità elementari a cui si riferiscono le informazioni di interesse
Dimmi cos’è una variabile
Una variabile è l’informazione di interesse di un’indagine
Dimmi cosa fa la statistica descrittiva
Fornisce gli strumenti per rappresentare, sintetizzare ed interpretare il modo in cui un fenomeno di interesse si è manifestato nel collettivo osservato
Dimmi cosa fa la statistica inferenziale
Ha l’obiettivo di generalizzare i risultati osservati sul campione all’intera popolazione (rappresentata dal campione). Per fare questo si basa sulla teoria della probabilità
Dimmi cos’è la popolazione
La popolazione è l’insieme di tutte le unità che costituiscono il gruppo che si è interessati ad analizzare
Dimmi cos’è il campione
Il campione è l’insieme delle unità statistiche omogenee rispetto a qualche circostanza di interesse
Dimmi come si dividono le variabili
- categoriche/qualitative (nominali: sì/no e ordinali: presentano un grado o livello)
- numeriche/quantitative (discrete: ottenute tramite conteggio e continue: hanno unità di misura)
Dimmi come si rappresentano le variabili categoriche
- Distribuzione di frequenze
- Diagramma a barre
- Diagramma a torta
Dimmi come si rappresentano le variabili numeriche
- Distribuzione di frequenze
- Istogramma
- Ogiva
- Box-plot
Dimmi cos’è una distribuzione di frequenza
è una tabella contenente le categorie (o intervallo di valori) che si osservano nei dati e le corrispondenti frequenze con cui i dati appartengono alle categorie (o intervallo di valori)
Dimmi cos’è la frequenza assoluta (ni)
Il numero di volte in cui in una categoria di n unità statistiche è osservata la variabile di indagine
Dimmi cos’è la frequenza relativa
Frequenza relativa(pi) = Frequenza assoluta (ni) / n. totale di osservazioni (n)
Dimmi 3 cose sui diagrammi a barre
- Ciascuna barra è associata ad una categoria della variabile considerata
- Tutte le barre hanno la stessa larghezza
- L’altezza delle barre è proporzionale alle frequenze
delle categorie
Dimmi 2 cose sui diagrammi a torta
- La torta è divisa in tante fette quante sono le categorie della variabile categorica considerata
- L’ampiezza di ciascuna fetta è proporzionale alla frequenza della categoria corrispondente
Dimmi cosa sono le classi e quando sono necessarie
intervalli disgiunti e che coprono l’intero intervallo di valori. Per le variabili numeriche le osservazioni possono assumere molti valori diversi tra loro. In questi casi si suddivide l’insieme dei valori che la variabile può assumere in intervalli, detti classi
Dimmi come si determina l’ampiezza di ciascuna classe
Ampiezza dell’intervallo = valore massimo−valore minimo / numero di classi
Dimmi com’è la notazione degli intervalli per i valori numerici
a ⊣ b indica tutti i valori da a (escluso) a b (incluso),
a ⊢ b indica tutti i valori da a (incluso) a b (escluso),
a ⊢⊣ b indica tutti i valori da a (incluso) a b (incluso).
Dimmi 3 cose sull’istogramma
- Un grafico dei dati contenuti in una distribuzione di frequenze per dati numerici suddivisi in classi è chiamato istogramma
- Gli estremi degli intervalli sono rappresentati sull’asse orizzontale.
- L’asse verticale rappresenta la frequenza delle classi. L’altezza delle barre rappresentare il numero di osservazioni in ciascuna classe (o la frequenza relativa di ciascuna classe).
Dimmi cos’è la frequenza relativa cumulativa
La frequenza cumulativa per ogni classe, è la frequenza relativa fino alla classe considerata inclusa
Dimmi cos’è un’Ogiva
Linea che rappresenta le frequenze cumulative. Graficamente si presenta come una spezzata che unisce i punti che hanno per ascisse gli estremi degli intervalli e per ordinate le corrispondenti frequenze relative cumulative
Dimmi quando la forma della distribuzione è simmetrica o asimmetrica
La forma della distribuzione si dice simmetrica se le osservazioni sono bilanciate, o distribuite in modo approssimativamente regolare attorno al centro.
La forma della distribuzione è detta asimmetrica se le osservazioni non sono distribuite in modo simmetrico rispetto al centro. (Con coda a sx o a dx)
Dimmi quali sono gli obiettivi per una presentazione efficace dei dati
• Presentare i dati in modo da mostrare le informazioni essenziali.
•Comunicare idee complesse chiaramente ed in modo accurato.
• Evitare distorsioni che possono comunicare il messaggio sbagliato.
Dimmi quali sono degli errori nella presentazione dei dati
•Diversa ampiezza delle classi di intervallo in un istogramma che rappresenta le frequenze/freq. relative
• Compressione o distorsione dell’asse verticale
• Omissione dello zero sull’asse verticale
• Non fornire una base di riferimento per il confronto di
dati di diversi gruppi.
Dimmi come si descrivono numericamente i dati (2)
- tendenza centrale
- variabilità
Dimmi quali sono le misure di tendenza centrale (centralità)/ indici di posizione (3)
- media
- mediana
- moda
Dimmi 4 cose sulla media
- è la misura di tendenza centrale più comune
- somma dei valori diviso il numero di valori
- Può essere calcolata solo per variabili quantitative
- è influenzata dai valori estremi (outlier)
Dimmi qual è la prima proprietà della media
- la somma degli scarti delle osservazioni (i valori xi) dalla relativa media è uguale a zero
Dimmi qual è la seconda proprietà della media
- la media è un operatore lineare
Dimmi 5 cose sulla mediana
- In una lista di numeri ordinati in ordine crescente, la mediana è il valore “centrale” (50% prima, 50% dopo)
- Non influenzata da valori estremi
- posizione centrale = (n+1)/2
- Se n è dispari, la mediana è l’osservazione al centro della lista ordinata
- Se n è pari la mediana è la media delle due osservazioni che hanno la posizione attorno a quella centrale.
N.B. (n+1)/2 non è il valore della mediana, ma la posizione della mediana nella sequenza ordinata.
Dimmi 3 cose sulla moda
- Valore che ricorre più frequentemente
- non influenzata da valori estremi
- può non esserci una moda (quando tutti i valori hanno la stessa frequenza)
- ci può essere più di una moda (quando più di un valore ha la frequenza massima) (distribuzione plurimodale)
Dimmi come individuare asimmetrie nella forma di distribuzione
- se mediana < media si ha un’asimmetria con coda a destra
- Se si osserva che mediana > media la distribuzione è asimmetrica con coda a sinistra
Dimmi quali sono le misure di variabilità (5)
- campo di variazione
- differenza interquartile
- varianza
- deviazione standard
- coefficiente di variazione
Dimmi cosa fanno le misure di variabilità
Misurano grado con cui le variabili si dispongono intorno a un indice di centralità. Forniscono informazioni sulla dispersione o variabilità dei valori
Dimmi 2 cose sul campo di variazione
- Il campo di variazione (o Range) è la più semplice misura di variabilità
- È la differenza tra il massimo e il minimo dei valori osservati
Dimmi quali sono gli svantaggi del campo di variazione
- Ignora il modo in cui i dati sono distribuiti
- Sensibile agli outlier
Dimmi cosa sono i quartili
I quartili dividono la sequenza ordinata dei dati in 4 segmenti contenenti lo stesso numero di valori
Dimmi 1 cosa per ogni quartile
• Il primo quartile, Q1, è il valore per il quale 25% delle osservazioni sono minori e 75% sono maggiori di esso.
• Q2 coincide con la mediana (50% sono minori, 50% sono maggiori).
• Solo 25% delle osservazioni sono maggiori del terzo quartile, Q3
Dimmi come si calcolano i quartili
Un quartile si trova determinando il valore della sua posizione nella sequenza ordinata dei dati, dove
Posizione primo quartile (Q1) = n+1/4 = 0.25(n+1)
Posizione secondo quartile (Q2) = 2(n+1)/4= 0.50(n+1) (la posizione della mediana)
Posizione terzo quartile (Q3) = 3(n+1)/4= 0.75(n+1)
dove n è il numero di valori osservati
Dimmi 4 cose sul boxplot
- Il boxplot visualizza minimo, massimo e quartili di una variabile numerica
- È costruito in maniera tale che la scatola (che si estende da Q1 a Q3) contenga il 50% delle osservazioni
- La mediana è rappresentata da una linea che attraversa la scatola centrale.
- Le linee che si estendono a partire dalla scatola sono chiamate baffi e vanno fino al massimo e fino al minimo.
Dimmi 4 cose sulla differenza interquartile
- Diversamente dal campo di variazione, la differenza interquartile non risente della presenza di outlier
• Considera solo l’intervallo che contiene il 50% dei dati centrali e rappresenta l’ampiezza di questo intervallo.
• Differenza Interquartile (IQR) = 3° quartile – 1° quartile IQR=Q3 –Q1 - Si può valutare la % di IQR rispetto al campo di variazione: IQR/Range (%). Più IQR/Range (%) si avvicina ad 1 maggiore è la dispersione.
Dimmi cos’è la varianza
- Si basa sulla differenze tra ciascuna osservazione e la loro media (scarto)
- VARIANZA = media degli scarti al quadrato
Dimmi la formula ridotta della varianza
Dimmi quali sono le proprietà della varianza
- la varianza di una costante è pari a zero
- la varianza è un operatore quadratico
Dimmi 3 cose sulla deviazione standard
- Misura di variabilità comunemente usata
- Mostra la variabilità rispetto alla media
- Ha la stessa unità di misura dei dati originali
Dimmi 2 cose sulla deviazione standard (pt 2)
- sensibile agli outlier
Dimmi 3 cose sul coefficiente di variazione
- Misura la variabilità relativa rispetto alla media
- È espresso in percentuale (%)
- Può essere usato per confrontare due o più variabili misurate con unità di misura diversa o con un diverso ordine di grandezza delle misurazioni
Dimmi cos’è lo Z-score o valore standardizzato e come si trova
- è il numero di deviazioni standard di cui un dato valore x è sopra o sotto la media
- si trova traducendo un dato in una scala standardizzata
Dimmi quali sono media e varianza dello Z-score
- M= 0
- s^2= 1
Dimmi a cosa serve l’analisi bivariata
- L’analisi bivariata ci consente di valutare se esiste una relazione tra due variabili. In particolare, le due variabili sono indipendenti oppure dipendenti?
- Vogliamo sapere se la distribuzione di una delle due variabili (Y) varia in base ai diversi valori dell’altra variabile (X).
Dimmi perché dipende da non vuol dire causalità
l’esistenza di un’associazione tra X e Y non significa dimostrare che tra X e Y c’è un rapporto di causa-effetto …
… potrebbe esserci anche una variabile Z (latente o non nota) da cui dipendono sia X che Y che mette in relazione le due variabili
Dimmi come si valuta relazione tra due variabili quantitative (4)
- diagramma a dispersione
- covarianza
- coefficiente di correlazione lineare di Pearson
- regressione lineare e R^2
Dimmi cosa si intende con il termine correlazione
Ciò che analizza se esiste una relazione tra due variabili (come e quanto due variabili variano insieme, studio della co-variazione)
- relazione simmetrica
Dimmi cosa si intende con il termine regressione
Ciò che analizza la forma della relazione tra variabili, assumendo il ruolo delle variabili (i valori di una variabile dipendono dai valori dell’altra variabile)
- relazione asimmetrica
Dimmi 3 cose sul diagramma a dispersione o scatterplot
- fornisce una rappresentazione grafica dell’andamento congiunto delle due variabili quantitative
- Gli assi cartesiani del diagramma a dispersione rappresentano i valori delle due variabili (una ascissa, una ordinata)
- L’insieme dei punti nel diagramma a dispersione si chiama nuvola di punti
Dimmi 3 cose sul diagramma a dispersione (pt 2)
• Se le due variabili sono statisticamente indipendenti, i punti si presentano sparpagliati sul diagramma, senza alcuna struttura
• Se tra le due variabili c’è una relazione statistica, la nuvola di punti si presenta strutturata. Questa struttura ci dà informazioni sul tipo di relazione esistente
• Osservando la nuvola di punti possiamo dedurre informazioni sulla forma, sulla forza e sulla direzione della relazione fra due variabili quantitative
Dimmi 2 cose sulla sommatoria
- il simbolo di sommatoria viene utilizzato per indicare in maniera compatta la somma di più elementi
- il parametro i è un intero e rappresenta l’indice della sommatoria
Dimmi la prima proprietà della sommatoria
- Se tutti i termini della sommatoria hanno lo stesso valore c che non dipende dall’indice (ossia
x1 = c, x2 = c, . . .), allora
Dimmi la seconda proprietà della sommatoria
- la sommatoria può essere scomposta
Dimmi la terza proprietà della sommatoria
- la sommatoria è un operatore lineare
Dimmi quali sono gli indici di dispersione (2)
- varianza
- deviazione standard
Dimmi 3 cose sulla covarianza
- indica come varia X al variare di Y
- misura il segno della relazione lineare tra 2 variabili (se diretta o inversa)
- misura come le 2 variabili si discostano dai loro valori medi
Dimmi quali sono i 3 scenari in base al valore della covarianza
- positiva: al crescere di X, Y cresce (direttamente correlate)
- negativa: al crescere di X, Y decresce (inversamente correlate)
- uguale a 0: X e Y non sono linearmente correlate
Dimmi 4 cose sul coefficiente di Pearson
- si calcola sulla base dei valori della covarianza
- fornisce indicazione se relazione lineare è diretta o inversa tra 2 variabili e quanto è forte la relazione
- non ha unità di misura
- varia tra -1 e 1
Dimmi i 3 scenari in base al valore del coefficiente di Pearson
- positivo: al crescere di X, cresce anche Y. Quanto più è vicino a 1 tanto è più forte la relazione lineare
- negativo: al crescere di X, Y decresce. Quanto è più vicino a -1, tanto è più forte la relazione lineare negativa
= uguale a 0: X e Y non sono linearmente correlate
Dimmi se il coefficiente di Pearson è influenzato dagli outliers
Si fortemente
Dimmi qual è l’obiettivo dell’analisi di regressione
Esprimere la relazione tra due o più variabili in forma matematica (equazione)
Y= f(X)
Y= variabile di risposta / dipendente
X= variabile esplicativa / indipendente
Dimmi qual è lo scopo della statistica
La conoscenza quantitativa dei fenomeni collettivi
Dimmi cosa è necessario per estendere un indagine campionaria a tutta la popolazione
Un campione casuale
Dimmi cosa si intende per campionamento stratificato
Campionamento su popolazione di riferimento su cui si possiedono già alcune informazioni a priori
Dimmi il modo principale per acquisizione dati
Intervista
Dimmi quali sono i principali obiettivi di un’analisi statistica (2)
- sintetizzare dati
- minimizzare perdita di informazione
Dimmi tra cosa sono compresi i valori della frequenza assoluta
Tra 0 e il numero totale di osservazioni
Dimmi tra cosa sono compresi i valori della frequenza relativa è la frequenza relativa cumulativa
Tra 0 e 1
Dimmi a cosa è uguale la somma delle frequenze assolute
Al numero di osservazioni
Dimmi a cosa è uguale la somma delle frequenze relative
A 1
Dimmi se le classi devono per forza avere la stessa ampiezza
No
Dimmi quando i dati sono grezzi e quando raggruppati
Grezzi appena raccolti, raggruppati quando sono nelle tavole di frequenza
Dimmi quali sono i grafici di distribuzioni di frequenza
Istogrammi e diagrammi a barre
Dimmi quale grafico viene utilizzato per distribuzione di frequenza di variabili discrete
Diagramma a barre:
- rappresentazione quantitativa (ascisse: valore variabili, ordinata: frequenza assoluta)
- rappresentazione qualitativa (diagramma a barre di Pareto) (ascisse: valore variabili in ordine decrescente di frequenza)
Dimmi quale grafico viene utilizzato per distribuzione di frequenza di variabili continue
Istogramma: rettangoli adiacenti, altezza indica frequenza, la larghezza indica la classe (dipende dal numero di classi e dalla loro ampiezza)
Dimmi quale grafico si usa per la distribuzione di frequenze di variabili qualitative
Diagramma a barre: basi delle barre sono tutte uguali (perché non ho bisogno di rappresentare ampiezza classi), altezza indica frequenza
Dimmi quali osservazioni descrivono un istogramma
- simmetria
- centralità
- concentrazione
- anomalie
Dimmi quando la mediana è preferibile alla media
Quando si vogliono eliminare gli effetti di valori estremi
Dimmi cosa sono varianza e deviazione standard
Indici di dispersione
Dimmi in quali casi si usa coefficiente di variazione (2)
- quando misurazione variabile è basata su diverse unità di misura
- quando c’è diverso ordine di grandezza delle misurazioni
Dimmi come sono rappresentati outliers nel boxplot
Con asterischi
Dimmi quando conviene usare boxplot
Per confrontare popolazioni simili
Dimmi cosa si intende per analisi bivariata
Osservazione congiunta di due variabili
Dimmi come si chiama l’analisi di due variabili congiunte qualitative
Analisi di associazione
Dimmi come si chiama l’analisi di due variabili congiunte quantitative
Analisi di correlazione e regressione
Dimmi cos’è una retta di regressione
Retta che si disegna quando c’è relazione lineare tra le variabili
Dimmi cos’è il coefficiente di correlazione delle variabili X e Y
Dimmi cos’è il coefficiente di correlazione delle variabili X e Y
Dimmi se la covarianza è il coefficiente di correlazione hanno lo stesso segno
Si
Dimmi quali sono i 3 scenari possibili in base al valore della covarianza
- se >0 sono direttamente correlate
- se <0 sono inversamente correlate
- se =0 non sono correlate
Dimmi cos’è il coefficiente di correlazione
Un indice normalizzato che quando vale -1 o +1 indica che la correlazione tra le variabili X e Y è massima o perfetta e che le osservazioni Yi sono funzioni lineari delle Xi
Dimmi qual è l’obiettivo dello studio della regressione
Sintetizzare l’informazione della variabilità dello scatterplot scegliendo la retta che minimizzi la perdita di informazioni
Dimmi cos’è il metodo dei minimi quadrati
Il metodo con cui si trova una retta che minimizzi al massimo la perdita di informazioni, passando approssimativamente vicino a tutti i punti XiYi
Dimmi qual’è l’espressione per trovare la somma dei quadrati delle distanze tra il punto XiYi e il punto di uguale ascissa che si trova sulla retta y= ax + b
Dimmi quali sono i 2 obiettivi dell’analisi di regressione
- Esprimere la relazione tra due o più variabili in forma matematica (un’equazione)
- prevedere il valore della variabile Y conoscendo il valore della variabile X
Dimmi com’è un’equazione di regressione
Y= f(X)
Y è la variabile di risposta/ dipendente (outcome) ed è espressa come funzione di una variabile esplicativa/ indipendente (X)
Dimmi 2 cose sulla regressione lineare
- la relazione tra variabili è rappresentata da una linea retta
- equazione: Y= aX + b
a= coefficiente angolare, rappresenta pendenza retta
b= intercetta
Dimmi cos’è il residuo o errore
La differenza tra il valore predetto (y^i) dalla retta di regressione in base al valore di Xi e il valore di Y osservato in corrispondenza del valore di Xi
Dimmi come si calcola la pendenza della retta della regressione lineare
Dimmi 2 cose sull’intercetta della retta di regressione lineare
- stima il valore medio atteso di Y quando X=0
- la retta passa sempre per il punto di incontro delle medie delle due variabili
Dimmi 3 cose sul coefficiente di regressione “a”
- a>0 se aumenta X, aumenta anche Y
- a<0 se aumenta X, Y diminuisce
- indica il cambiamento medio di Y in base al valore X, non è una relazione esatta
Dimmi quando usare retta di regressione
Quando si vuole prevedere un valore di Y dato un valore di X (ex: prevedere il peso di un soggetto alto 168 cm)
Dimmi quando è meglio non usare retta di regressione
Quando si vuole prevedere valori di Y in corrispondenza di valori di X molto al di fuori dell’intervallo delle osservazioni
Dimmi cos’è l’indice di determinazione della bontà di adattamento lineare
Un indice che misura la quota di informazione trattenuta dalla retta di regressione in percentuale dell’informazione sulla variabilità totale
Dimmi a cosa corrisponde la deviazione non spiegata della regressione
All’errore o residuo
Yi - Y^i
Dimmi a cosa corrisponde deviazione totale
Dimmi come trovare deviazione spiegata dalla regressione
Dimmi 3 cose sull’indice di adattamento R^2
misura quanta parte della variabilità totale di Y il modello di regressione riesce a spiegare
Dimmi cosa vuol dire se R^2 tende a 1
Indica che la quota di variabilità spiegata dalla retta si avvicina molto alla variabilità totale, quindi siamo in presenza di ottima bontà di adattamento lineare
Dimmi cosa vuol dire se R^2 tende a 0
Indica che la retta spiega una quota infinitesimale della variabilità totale che nella scomposizione precedente sarà contenuta tutta nella quantità residuale SSE
Dimmi qual è il rapporto tra indice di adattamento R^2 e coefficiente di correlazione
Dimmi quali tipi di analisi si fanno se X e Y sono quantitative (2)
- analisi di correlazione
- analisi di regressione
Dimmi quale tipo di analisi di fa se X e Y sono qualitative
Analisi di associazione
Dimmi quali tipi di associazione esistono (3)
- CAUSALE: esposizione causa malattia
- SPURIA: esposizione non causa malattia
- NON CAUSALE: - malattia causa l’espozione - terzo fattore
Dimmi cos’è una tabella di contingenza
Metodo usato per verificare associazioni tra variabili qualitative ma anche quantitative
Dimmi cosa sono riportate nelle tabelle di contingenza
Frequenze assolute congiunte (nij)
Dimmi cosa sono le frequenze assolute marginali nelle tabelle di contingenza
Somma delle frequenze di una riga (frequenza assoluta marginale per riga) o di una colonna (frequenza assoluta marginale per colonna)
Dimmi se esistono anche le frequenze relative e relative marginali nelle tabelle di contingenza
Si esistono
Dimmi cos’è la frequenza relativa condizionata di colonna o di riga (stessa roba per la condizionata assoluta)
La frequenza relativa di una caratteristica nella riga sul totale della colonna di quella caratteristica
Dimmi quando 2 variabili si dicono statisticamente indipendenti
- se le frequenze relative condizionate sono uguali alle frequenze relative marginali
Dimmi formula frequenza assoluta congiunta attesa
Dimmi formula frequenza relativa congiunta attesa
Dimmi cosa si trova quando le 2 variabili sono dipendenti nelle tabelle di contingenza
Dimmi da cosa è dato lo scostamento tra le frequenze assolute congiunte osservate e quelle attese
Dimmi cos’è l’indice chi-quadrato
- indice usato per valutare associazione di 2 variabili
Dimmi un’altra formula dell’indice chi-quadrato
Dimmi cos’è la sensibilità di un test
Probabilità che una persona malata riceva un risultato positivo al test
Dimmi cos’è la specificità di un test
Probabilità che una persona che non ha la malattia riceva un test negativo
Dimmi 2 cose sulla specificità e sensibilità nell’interpretazione dell’accuratezza
- più la sensibilità è vicina a 1 più il test è accurato a identificare individui malati
- più la specificità è vicina a 1 più il test è accurato a identificare individui sani
Dimmi cos’è il valore predittivo positivo
Probabilità che una persona positiva al test abbia la malattia
Dimmi cos’è il valore predittivo negativo
Probabilità che una persona negativa al test sia effettivamente sana
Dimmi quanto deve essere la prevalenza perché sia effettivo e rappresentativo della popolazione
Vicino a 50%
Dimmi la definizione di probabilità
Rapporto tra numero di casi favorevoli affinché un evento si verifichi è il numero di casi possibili
Dimmi cosa sono eventi equiprobabili
Eventi che hanno la stessa probabilità di verificarsi individualmente
Dimmi cosa si intende per spazio degli eventi o spazio campionario
Insieme di tutti i risultati possibili di un evento aleatorio (si indica con E)
Dimmi cos’è un evento
Ogni possibile sottoinsieme dello spazio campionario
Dimmi quando due eventi si dicono incompatibili o disgiunti
Quando non possono verificarsi contemporaneamente
Dimmi quando due eventi si dicono compatibili
Quando possono verificarsi contemporaneamente
Dimmi come calcolare la probabilità di eventi compatibili
Dimmi cos’è il prodotto logico di eventi
È l’evento che si verifica se si verificano contemporaneamente sia l’evento E1 che l’evento E2 e si indica
Dimmi quando due eventi sono indipendenti
Quando il verificarsi di uno non influenza l’altro
Dimmi quando due eventi si dicono dipendenti o correlati
Quando il verificarsi di un evento influenza il secondo evento modificandone la probabilità (ex: estrazione con o senza reimbussolamento)
Dimmi la formula della probabilità condizionata
La probabilità condizionata riduce lo spazio degli eventi
Dimmi cosa fa il teorema di Bayes
Permette di quantificare la probabilità che un dato evento abbia alla sua origine una determinata causa
Dimmi quali sono i 3 step della conduzione di uno studio epidemiologico
- definizione degli obiettivi della ricerca
- analisi delle condizioni
- scelta del tipo di disegno dello studio
Dimmi quali sono esempi di studi sperimentali in uno studio epidemiologico
- prova randomizzata controllata
- prova con intervento
Dimmi quali sono esempi di studi osservazionali analitici in uno studio epidemiologico
- studi trasversali
- studi di coorte
- studi di caso-controllo
Dimmi un esempio di studio osservazionale di correlazione in uno studio epidemiologico
Ecologico
Dimmi cos’è uno studio sperimentale
Un’indagine che permette di confrontare 2 o più gruppi di individui riguardo all’esito di trattamenti diversi
Dimmi cosa si intende per trattamento in uno studio sperimentale
Qualunque intervento di tipo terapeutico, profilattico o altro, volto a modificare lo stato di salute dell’uomo
Dimmi per cosa sono anche usati gli studi sperimentali
Per valutare l’efficacia di procedure diagnostiche, test di laboratorio, ecc…
Dimmi in cosa consiste uno studio sperimentale
In un set di osservazioni condotto sotto circostanze controllate in cui lo sperimentatore manipola le condizioni per indagare gli effetti che tali manipolazioni hanno sugli elementi in studio
Dimmi cosa è importante perché uno studio sia valido
È importante che l’unico fattore che varia tra i gruppi sotto osservazione sia quello in studio. Ciò è garantito dalla randomizzazione
Dimmi la differenza tra clinical trial e field trial VS community trial
Clinical e field trial riguardano singoli soggetti, i community riguardano gruppi
Dimmi cosa riguardano i clinical trial
I soggetti che hanno una patologia
Dimmi cosa riguardano i field e community trial
La prevenzione primaria
Dimmi quali sono le procedure per rimuovere le possibili fonti di bias negli studi sperimentali
Il blinding (single, double, triple)
Dimmi cosa sono gli studi osservazionali
Fotografano in un dato tempo le dimensioni di parametri definiti in un gruppo di soggetti selezionati in funzione di ampi criteri di inclusione. Permette di ottenere informazioni più aderenti perché avviene in condizioni normali
Dimmi 3 limiti degli studi osservazionali
- validità statistica è ridotta dal limitato rigore e dall’alto numero di variabili ma aumentata dall’alto numero di soggetti
- completano gli studi sperimentali con i loro lunghi periodi di osservazione
Dimmi cosa sono gli studi di correlazione
Studi che mettono in relazione la distribuzione di uno o più fattori di rischio e una patologia. È possibile verificare le relazioni solo di un gruppo
Dimmi quali sono i vantaggi di uno studio caso-controllo (6)
- adatti a studi di malattie rare o a lunga latenza
- veloci da condurre
- poche risorse economiche
- pochi soggetti
- possono essere usati dati già esistenti
- si possono studiare cause potenziali di malattia
Dimmi quali sono gli svantaggi di uno studio caso-controllo
- si affidano a dati già rilevati in passato o al ricordo
- validazione delle info è quasi impossibile
- selezione di un gruppo appropriato è difficile
- non si può stabilire sequenza eventi
Dimmi 2 cose sugli studi di coorte
- Il gruppo di persone da studiare (coorte) sono selezionate in funzione delle caratteristiche presenti prima della comparsa della malattia
- la coorte viene osservata per un periodo di tempo per determinare e confrontare frequenza malattia in studio
Dimmi quali sono i vantaggi degli studi di coorte (5)
- adatti per lo studio di esposizioni comuni, malattie multifattoriali
- si possono valutare effetti multipli di singole esposizioni
- si può dimostrare relazione temporale tra esposizione e malattia
- permette di misurare direttamente incidenza della malattia negli esposti e non esposti nella popolazione
Dimmi cos’è la funzione cumulativa
La probabilità che X assuma un valore minore di un generico valore Xo
Dimmi come si calcola valore atteso di una variabile casuale discreta
Dimmi come si calcola varianza variabile aleatoria discreta
Dimmi come si calcola deviazione standard o scarto quadratico medio di una variabile discreta
Dimmi come trovare media e varianza del,a variabile X + Y (indipendenti)
Dimmi quali sono distribuzioni di probabilità discrete
- binomiale
- Poisson
Dimmi 3 cose sulla distribuzione di Bernoulli (caso particolare di binomiale)
- 2 esiti: successo (S) o insuccesso (INS)
- S= p INS= 1-p
- variabile aleatoria di Bernoulli X= 1 (successo), X=0 (insuccesso)
Dimmi quali sono media e varianza della distribuzione di Bernoulli
Dimmi cos’è variabile aleatoria binomiale
Numero di successi in n numero di prove ripetute
Dimmi 3 caratteristiche della sequenza di n prove ripetute nella distribuzione binomiale
- ogni prova può essere S o INS, oppure 1 o 0
- probabilità S e INS è la stessa
- prove sono indipendenti
Dimmi coeff. binomiale per trovare il numero di sequenze con X successi in n prove
Dimmi formula distribuzione di probabilità binomiale (probabilità di X successi in n prove)
Dimmi quando si ha una diagnosi diretta
Quando si ha una dimostrazione del patogeno direttamente nel campione
Dimmi quando si ha diagnosi indiretta
Quando sintomi paziente rivelano presenza patogeno (ex: produzione anticorpi)