La verifica delle ipotesi Flashcards
a cosa serve la verifica delle ipotesi?
ad esempio serve a capire se la proporzione dei casi di trombosi nella popolazione vaccinata è uguale o differente dalla proporzione dei casi di trombosi nella popolazione non vaccinata.
quindi serve a stabilire se la differenza tra le due proporzioni è statisticamente significativa oppure è una differenza solo dovuta al caso.
la percentuale di eventi trombotici nel campione vaccinato rappresenta il parametro della popolazione.
la verifica delle ipotesi è un processo che mira a stabilire se la diversità osservata nel confronto fra i campioni, è vera anche nella popolazione.
la significatività statistica
consideriamo di voler confrontare l’efficacia di due farmaci, per stabilire quale è più efficace
si possono verificare 3 situazioni:
il farmaco A è superiore a quello B
esiste un fattore nei campioni che influenza la diversità dei due farmaci
la differenza potrebbe essere una variazione casuale.
Le fasi della verifica delle ipotesi
1 Analisi dei dati e assunzioni sul modello probabilistico, sui parametri >( media varianza proporzione) sul campione
2 si formula una ipotesi alternativa e una ipotesi nulla
3 si costruisce una statistica test e la sua distribuzione di probabilità
4 si definisce la regola di precisione, e si valutano gli errori ovvero alfa che riguarda il rifiuto dell’ipotesi nulla vera
oppure beta, accettare l’ipotesi nulla falsa.
la regola di decisione permette di dare oggettività al risultato.
Decisione statistica e decisione clinica
la decisione statistica ci dice se accettare l’ipotesi nulla o rifiutarla.
per quanto riguarda la decisione clinica si può affermare ad esempio che la trombosi nei soggetti vaccinati pari alla percentuale di trombosi nei soggetti non vaccinati oppure no.
come scelgo il test da applicare?
assunzioni sul tipo di variabile che sto considerando( gaussiana o binomiale?)
se la variabile non segue nessuna distribuzione nota si usano i test non parametrici
bisogna capire se la varianza è nota
( se usare t o z)
se la varianza incognita è omogeneo o non omogenea ( confronto far due medie )che si dimostra tramite un test
se i campioni sono appaiati o non appaiati ( se i dati vengono da soggetti differenti o da misurazioni sullo stesso soggetto)
come formulo l’ipotesi statistica?
si formula una ipotesi nulla detta anche ipotesi di uguaglianza
la seconda invece è chiamata ipotesi alternativa ed è una ipotesi di diuguaglianza.
si parte dal presupposto che la ipotesi nulla sia vera per giungere poi ad affermare che è falsa ovvero a rifiutarla.
l’ipotesi alternativa può essere una ipotesi di diversità generica, se nell’ambito del confronto interessa solo sapere se i parametri sono diversi.
l’ipotesi generica è detta anche bilaterale o bidirezionale
oppure l’ipotesi alternativa può avere una unica direzione ( unidirezionale) >/<
come costruisco lo statistica test e la sua distribuzione di probabilità?
è una formula matematica che si calcola a partire dai dati del campione
il risultato di questa formula è casuale,perchè dipende dal campione.
inoltre ogni statistica test ha una sua distribuzione di probabilità che ci permette di accettare o rifiutare l’ipotesi nulla.
definizione regola di decisone e valutazione degli errori
viene confrontato il valore numerico della statistica test, con un termine di riferimento che dipende:
dal tipo di distribuzione della statistica test
dal livello di significatività
il livello di significatività alfa è anche detto errore del 1 tipo ( rischio di prima specie) e consiste nella probabilità di commettere errore, rifiutando l’ipotesi nulla quando questa è vera nella realtà.
il valore di alfa è stabilito dal ricercatore e solitamente ha un valore di 0.05, che vuol dire che l’operatore accetta la probabilità di commettere un errore non superiore al 5% qualora rifiutasse l’ipotesi nulla.
rifiutare l’ipotesi nulla vorrebbe dire che la diversità fra i dati campionari è statisticamente significativa. quindi alfa è la percentuale massima che la differenza osservata sia casuale.
A seconda del livello di significatività scelto, sulla curva si individuano dei limiti sull’asse delle ascisse.
Le zone esterne ai limiti sono dette zone di rifiuto dell’ipotesi nulla, cioè è bassa la probabilità che l’ipotesi nulla sia vera nella popolazione.
le zone interne sono quelle di non rifiuto dell’ipotesi nulla, vale a dire che hanno una alta probabilità che l’ipotesi nulla sia vera nella popolazione.
in cosa consiste l’errore beta di secondo tipo?
consiste nella probabilità di accettare l’ipotesi nulla che nella realtà invece è falsa.
cioè accettare l’uguaglianza di due trattamenti quando in realtà sono diversi.
è determinato dall’operatore e solitamente è maggiore di alfa ma comunque piccolo, circa il 20%. beta è la percentuale di errore del test statistico, di non riconoscere una differenza significativa realmente presente nella popolazione.
beta è anche detta percentuale di falsi negativi per il test statistico
si verifica per campioni di piccole dimensioni.
la grandezza dell’errore beta dipende quindi dalla numerosità campionaria: più è piccola n maggiore è beta. Abbiamo detto poi che maggiore è beta, minore è la potenza del test. Più grande è la grandezza del campione, maggiore è la potenza del test.
cosa è la potenza del test?
è pari al complementare di 1 - beta
è la probabilità di rifiutare l’ipotesi nulla H0 quando è vera quella alternativa.
ovvero la probabilità con cui il test individua delle differenze statisticamente significative fra i dati campionari a confronto che sono reali nella popolazione
cosa succede se provo a diminuire l’errore di primo tipo
s esposto alfa a 0.01 succede che aumenta la probabilità del test di non vedere una differenza fra i due dati in analisi.
al ridursi di alfa aumenta beta e viceversa
Cosa è il pvalue ?
corrisponde alla probabilità, cioè all’area nella curva sottesa nella coda, a partire dai valori di statistica test trovati.
esprime la probabilità effettiva che la differenza osservata nei campioni sia dovuta solo al caso.
se ad esempio in un test in cui si è posto alfa uguale a 0.05, si trova un pvalue di 0.03, vuol dire che si è rifiutati l’ipotesi nulla.
quindi vuol dire che la probabilità che la differenza sia dovuta al caso è del 3%.
più piccolo è il valore di p, più è precisa la decisione statistica, ovvero minori sono le probabilità che le differenze siano dovute al caso.
questo vuol dire che ripetendo l’esperimento con campioni diversi, si otterranno gli stessi risultati. Questo se p< 0.01
se p > 0.1 implica invece che soltanto il caso può realmente spiegare la differenza osservata, che non sarà statisticamente significativa.
p< indica la probabilità di una conclusione falsamente positiva ( nell’esempio un trattamento risulta migliore dall’altro quando nella realtà della popolazione non lo è.)
è il più basso livello di significatività al quale l’ipotesi nulla può essere respinta.
cosa si intende per differenza statisticamente non significativa?
è una differenza che non è soltanto attribuibile al caso
infatti in questo caso è importante considerare il campione
il risultato di una differenza non statisticamente significativa non conclusivo, ecco perchè si parla più di non rifiuto che di accettazione dell’ipotesi nulla.
cosa accade alla significatività nel caso di campioni numerosi?
dal punto di vista clinico non è detto che una differenza significativa, lo si anche in ambito medico
con campioni molto numerosi, piccolissime differenze, che possiedono poca o nessuna importanza clinica, possono rivelarsi significative
a cosa serve il test di fischer?
serve a confrontare campioni indipendenti:
è il test di verifica dell’omogeneità delle varianze.
anche qui si pone una ipotesi nulla dove la varianza 1 è uguale alla varianza 2.
F è pari a stima della deviazione standard più grande al quadrato diviso la stima della deviazione standard 2 al quadrato.
la distribuzione di fischer ha una curva a destra più lunga quindi è asimmetrica e positiva. essa dipende dai gradi di libertà di numeratore e denominatore.
l’errore alfa quindi va a trovarsi in suna sola coda ed è quindi fisso.
f sarà il valore che lascia a destra un’area pari a 0.05.
cerco il valore tabulato di f con n1-1 ed n2-2
nelle colonne ci saranno i gradi di libertà del numeratore nelle righe ci saranno i gradi di libertà del denominatore.
più le varianze sono omogenee, più sono simili, più il rapporto si avvicina ad 1, più f rientrerà nella zona di accettazione dell’ipotesi nulla.
se le varianze sono omogenee quindi fcalcolato è minore di ftabulato, allora posso calcolare la devianza pooled.
Il test della somma dei ranghi o di Wilcoxon
si usa quando non è possibile fare nessuna assunzione riguardo alla distribuzione della variabili ( che quindi non segue nè una binomiale nè una gauss)
di conseguenza non si conoscono nè media nè deviazione standard.
Questo test si basa sulla mediana, che è un indice di posizione, ci permette di fare test tra campioni INDIPENDENTI.
Questo test si dice non parametrico.
nelle ipotesi, pongo mediana 1 = mediana 2
si crea un campione combinato mettendo dei segni per ricordarsi a quale gruppo appartengono i valori.
successivamente si creano i ranghi, cioè si assegna una posizione alle osservazioni, ordinate precedentemente in maniera crescente.
a valori uguali dei ranghi si assegna ad entrambi la media dei due ranghi come se fossero diversi.
se le variabile è realmente differente, le osservazioni si stratificano, cioè quelle appartenenti ad un gruppo si trovano nella prima parte e quelle dell’altro nelle seconda parte della graduatoria.
si sommano allora i ranghi dei rispettivi gruppi ottenendo 2 somme di ranghi. Avremo una somma dei ranghi maggiore e una somma dei ranghi minore.
si stabilisce una soglia oltre cui le osservazioni sono stratificate o no.
si stabilisce poi l’accettazione o il rifiuto dell’ipotesi nulla.
si osservano le tavole di wilcoxon, se il valore, si ottiene un untervallo e se la somma dei ranghi del campione con numerosità minore cade fuori dall’intervallo si rifiuta l’ipotesi nulla.