Slide 11: la verifica delle ipotesi Flashcards
Test d’ipotesi
Attraverso un campione di osservazioni si cercherà di stabilire, con un certo grado di attendibilità, se poter rifiutare o meno un’ipotesi privilegiata, detta ipotesi nulla, a favore di un’ipotesi alternativa.
Ipotesi statistica
Un’ipotesi statistica è una congettura riguardante un parametro θ della popolazione. Un’ipotesi statistica impone dunque un vincolo su un parametro: i valori che soddisfano il vincolo sono quelli per i quali la congettura è vera.
Approccio di Neyman- Pearson
Nell’approccio di Neyman-Pearson si distinguono, quindi, due ipotesi contrapposte:
▶ l’ipotesi nulla, indicata con H0
▶ l’ipotesi alternativa, indicata con H1
* L’ipotesi nulla è preesistente all’osservazione dei dati campionari ed è l’ipotesi ritenuta vera fino a prova contraria. * L’ipotesi alternativa può essere vista come la negazione dell’ipotesi nulla.
La verifica di un’ipotesi
La verifica di un’ipotesi statistica consiste nello stabilire se un dato campione casuale (semplice) contiene abbastanza evidenza empirica per rifiutare l’ipotesi in questione.
Spazio parametrico
l’insieme di tutti ipossibilivalorichepuòassumereilparametroθ.
Sistema di ipotesi
Si dice sistema di ipotesi la bipartizione dello spazio parametrico in ipotesi nulla e ipotesi alternativa: sistema
H0 : θ ∈ Θ0
H1 : θ ∈ Θ1
Come può essere un’ipotesi
▶ semplice, quando propone un singolo valore numerico per il parametro. In questo caso è definita da un vincolo di uguaglianza.
▶ composta, quando non specifica completamente la popolazione. In questo caso viene definita da un vincolo di disuguaglianza (specifica un intervallo di valori).
Ipotesi composta
Un’ipotesi composta può essere
▶ unidirezionale, quando specifica un intervallo di valori.
▶ bidirezionale, quando specifica due intervalli di valori.
Test statistico
Un test statistico è una regola che permette di discriminare i campioni che, se osservati, portano al rifiuto dell’ipotesi nulla da quelli che, se osservati, portano alla sua accettazione.
* Il test si basa sul valore assunto da una statistica test.
* La statistica test è una statistica campionaria la cui distribuzione deve essere completamente nota sotto l’ipotesi nulla H0.
Regione di accettazione e di rifiuto
Un test statistico è una regola che permette di discriminare i campioni che, se osservati, portano al rifiuto dell’ipotesi nulla da quelli che, se osservati, portano alla sua accettazione.
* Il test si basa sul valore assunto da una statistica test.
* La statistica test è una statistica campionaria la cui distribuzione deve essere completamente nota sotto l’ipotesi nulla H0.
Valori critici
I valori critici dipendono dalla distribuzione della statistica test sotto H0 e dal livello di significatività α.
* Se indichiamo con T la statistica test, allora, se l’ipotesi alternativa è bilaterale (H1 : θ= θ0) dobbiamo scegliere due valori critici c1 e c2 in modo tale che P(c1 ≤ T ≤c2) =1−α
- Se l’ipotesi alternativa è unilaterale (H1 : θ > θ0 o H1 : θ < θ0), dobbiamo scegliere un valore critico c1 in modo tale che P(T ≥c1) = α o P(T ≤c1) = α
P-value o livello di significatività osservato
Il p-value è dato dalla probabilità di osservare un valore della statistica test uguale o più estremo del valore ottenuto dal campione, sotto l’ipotesi nulla.
* Il p-value non è quindi una quantità fissata, ma un modo per misurare l’evidenza fornita dai dati contro l’ipotesi nulla H0. Minore è il valore del p-value, più è forte l’evidenza contro H0.
* In pratica: Analisi di dati- a.a. 2024/2025 se il p-value < α ⇒ rifiuto H0
Il livello di significatività α
Il livello di significatività α rappresenta la probabilità di osservare valori della statistica test interni alla zona di rifiuto quando H0 è vera.
Due tipi di errori nella verifica di ipotesi
Nella verifica d’ipotesi possiamo distinguere due tipi di errori:
▶ Errore di I tipo: si rifiuta H0 quando è vera
▶ Errore di II tipo: non rifiutiamo H0 quando è falsa
- Il livello di significatività α del test è la probabilità di commettere l’errore del I tipo. * 1−α è detto coefficiente di confidenza del test.
- β è la probabilità di commettere l’errore del II tipo.
- 1−β viene detto potenza del test e corrisponde alla probabilità di rifiutare l’ipotesi nulla quando questa è falsa.
Relazione che intercorre tra alfa e beta
- Tra α e β sussiste una relazione inversa: minore è il valore di α, maggiore è il valore di β.
- Le probabilità di commettere errori corrispondono ad aree.
Logica alla base dei test nei confronti dell’innovazione
Poiché H0, di solito, definisce l’ipotesi di assenza di cambiamento e H1 quella che porta a qualche risultato, la logica alla base dei test è cauta nei confronti dell’innovazione: suggerisce di rifiutare l’ipotesi nulla solo quando il campione non è compatibile con essa.
* La verifica delle ipotesi segue una ratio simile a quella di un processo legale
Passi da seguire nella verifica di ipotesi
- Definizione del sistema d’ipotesi
- Scelta della statistica test
- Scelta del livello di significatività (e della numerosità campionaria)
- Definizione della regione di rifiuto
- Estrazione del campione casuale semplice * Calcolo della statistica test
- Decisione