13. Campionamento Flashcards
Campionamento
Definizione e vantaggi
Procedimento attraverso il quale si estrae, da un insieme di unità costituenti l’oggetto dello studio, un numero ridotto di casi scelti con criteri tali da consentire la generalizzazione all’intera popolazione dei risultati ottenuti studiando il campione. Essa presenta i seguenti vantaggi rispetto al censimento:
- costi di rilevazione bassi
- tempi di raccolta dati ed elaborazione meno lunghi
- organizzazione più semplice
- approfondimento ed accuratezza maggiori
Qual è stato il primo caso di campionamento?
La rivista Literary Digest vuole predire il risultato delle elezioni del 1936. Per farlo, manda un questionario postale usando i registri automobilistici e telefonici in quanto negli USA non esistono anagrafi o liste elettorali complete. Negli anni ‘30 però l’auto e il telefono erano beni poco diffusi, questo produce un errore di copertura (il campione non è rappresentativo) e un errore di non risposta (non raggiunge una parte di popolazione e quindi non ne raccoglie le risposte. Nello stesso periodo, un’altra azienda fu in grado, tramite il campionamento, di predirre il risultato delle elezioni con costi molto minori di quelli di Literary Digest.
Quali errori sono stati compiuti dalla rivista Literary digest durante il campionamento?
3 errori:
- Errore di copertura: la lista dei soggetti non è completa o non è corretta e non ci permette di campionare in maniera adeguata
- Errore di campionamento: errore sempre presente che deriva dal fatto che stiamo usando solo una parte della popolazione, ma è minimizzabile
- Errore di non risposta: per alcune osservazioni non ci sarà un valore da rilevare perchè i soggetti non rispondono per vari motivi
Popolazione
Nell’ambito del campionamento si intende l’insieme di ampiezza N di unità di analisi che costituiscono l’oggetto del nostro studio.
Svantaggi del campionamento
- Non si conoscono i valori esatti ma si fa una stima di un fenomeno
- è presente un errore che va aggiunto o sottratto alla stima per trovare l’intervallo in cui è presente il valore vero
Incertezza
L’errore di campionamento è il margine di incertezza che circonda il calore di un parametro ottenuto in un campione e il valore effettivo (che non conosciamo) del parametro nella popolazione
Campione casuale semplice
Uso e vantaggi
È possibile utilizzarlo se abbiamo una lista completa della popolazione e gli individui possono essere tutti contattati e non rifiutano l’intervista -> situazione molto improbabile.
Il campione casuale semplice presenta il vantaggio di non aumentare di dimensione in base alla popolazione.
Errore di campionamento del campione casuale semplice
Si può stimare con la formula e=z(s/√n)(√1-f) per variabili cardinali e e=z(√(pq/n-1))(√1-f)
In queste formule z è il coefficiente dipendente dal livello di fiducia della sima, s è la deviazione standard campionaria della variabile studiata, 1-f è il fattore di correzione per popolazione finite, p è la proporzione nel campione per la categoria in esame e q=1-p
In questo caso quindi l’ampiezza del campione determina l’errore
Ampiezza del campione casuale semplice
È possibile calcolare l’ampiezza del campione usando le formule dell’errore di campionamento per determinare l’ampiezza in modo che il campione sia sufficientemente grande da ottenere stime precise.
Possiamo usare la formula n=(zs/e)^2 in cui s è la variabilità del fenomeno studiato, z è il livello di fiducia che vogliamo avere ed e è l’errore della stima.
In questo caso l’ampiezza del campione è direttamente proporzionale al livello di fiducia desiderato per la stima e alla variabilità del numero studiato, mentre è inversamente proporzionale all’errore che siamo disposti ad accettare.
Per le variabili nominali possiamo usare la formula n=(z^2pq/e^2)
Quando usiamo il fattore di correzione √1-f?
Se il campione costituisce più del 5% della popolazione bisogna applicare il fattore di correzione.
Per determinare l’ampiezza di un campione, è necessario consocere la popolazione totale?
No, perchè il campione non è proporzionale alla popolazione N, essa entra in gioco solo nel caso in cui per il campione sia richiesta una ampiezza non trascurabile rispetto alla dimensione della popolazione, cioè superiore al 5% di N
Campionamento sistematico
Modalità e condizioni
Campioni probabilistici
È equivalente al campione casuale semplice ma usa una diversa tecnica di estrazione delle unità -> Si scorre la lista delle unità e se ne estraggono una ogni dato intervallo dato da N/n finchè non abbiamo estratto gli individui che ci servono.
Questo criterio funziona solo se le liste non hanno un criterio di ordine per cui l’intervallo si può sovrapporre.
Le due condizoni per usare questo tipo di campionamento sono:
- tutte le unità devono avere la stessa probabilità di essere estratte
- Evitare ogni scelta diversa da quella determinata dall’intervallo di campionamento
È il tipo di campionamento usato per gli exit poll.
Campionamento stratificato
Campioni probabilistici
Si suddivide la popolazione in sotto-popolazioni detti strati, che siano omogenei rispetto ad una variabile da noi scelta, correlata alla variabile che vogliamo studiare. Estraiamo poi con un procedimento casuale semplice un campione da ogni strato e li uniamo. La somma dei campioni più piccoli è inferiore all’ampiezza del campione che avremmo estratto sulla popolazione totale.
Il campionamento stratificato può essere:
- proporzionale: riproduce la stessa composizione degli strati della popolazione
- non proporzionale: si sovrarappresentano alcuni strati ponendo tutti gli strati con n uguale e si usa la ponderazione, applicando un peso ad ogni unità estratta.
Campionamento a stadi
Modalità, vantagi e svantaggi
Campioni probabilistici
La popolazione viene suddivisa su più livelli ordinati gerarchicamente ed estratti in successione, si estae ogni unità dei diversi livelli in successione dal livello più elevato al meno elevato (in modo probabilistico).
I vantaggi sono:
- non serve lista popolazione totale ma sono liste delle sub-popolazioni delle unità d’ordine superiore estratte
- rilevazione si concentra su unità estratte
Gli svantaggi sono:
- si perde di efficienza, perchè il campione potrebbe essere più numeroso di quello ottenuto con campionamento stratificato
- i casi appartenenti ad una stessa unità d’oridne superiore tendono ad assomigliarsi
- teoria statistica utilizzata è molto complessa
Campionamento a grappoli
Campioni probabilistici
Campionamento che sfrutta il fatto che le popolazioni sono spesso naturalmente suddivise in unità contigue -> si estraggono dei grappoli e si includono nel campione tutte le unità elementari del grappolo. Tecnica usata dall’istat per studaire le famiglie italiane.