13. Campionamento Flashcards

1
Q

Campionamento

Definizione e vantaggi

A

Procedimento attraverso il quale si estrae, da un insieme di unità costituenti l’oggetto dello studio, un numero ridotto di casi scelti con criteri tali da consentire la generalizzazione all’intera popolazione dei risultati ottenuti studiando il campione. Essa presenta i seguenti vantaggi rispetto al censimento:
- costi di rilevazione bassi
- tempi di raccolta dati ed elaborazione meno lunghi
- organizzazione più semplice
- approfondimento ed accuratezza maggiori

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qual è stato il primo caso di campionamento?

A

La rivista Literary Digest vuole predire il risultato delle elezioni del 1936. Per farlo, manda un questionario postale usando i registri automobilistici e telefonici in quanto negli USA non esistono anagrafi o liste elettorali complete. Negli anni ‘30 però l’auto e il telefono erano beni poco diffusi, questo produce un errore di copertura (il campione non è rappresentativo) e un errore di non risposta (non raggiunge una parte di popolazione e quindi non ne raccoglie le risposte. Nello stesso periodo, un’altra azienda fu in grado, tramite il campionamento, di predirre il risultato delle elezioni con costi molto minori di quelli di Literary Digest.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quali errori sono stati compiuti dalla rivista Literary digest durante il campionamento?

A

3 errori:
- Errore di copertura: la lista dei soggetti non è completa o non è corretta e non ci permette di campionare in maniera adeguata
- Errore di campionamento: errore sempre presente che deriva dal fatto che stiamo usando solo una parte della popolazione, ma è minimizzabile
- Errore di non risposta: per alcune osservazioni non ci sarà un valore da rilevare perchè i soggetti non rispondono per vari motivi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Popolazione

A

Nell’ambito del campionamento si intende l’insieme di ampiezza N di unità di analisi che costituiscono l’oggetto del nostro studio.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Svantaggi del campionamento

A
  • Non si conoscono i valori esatti ma si fa una stima di un fenomeno
  • è presente un errore che va aggiunto o sottratto alla stima per trovare l’intervallo in cui è presente il valore vero
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Incertezza

A

L’errore di campionamento è il margine di incertezza che circonda il calore di un parametro ottenuto in un campione e il valore effettivo (che non conosciamo) del parametro nella popolazione

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Campione casuale semplice

Uso e vantaggi

A

È possibile utilizzarlo se abbiamo una lista completa della popolazione e gli individui possono essere tutti contattati e non rifiutano l’intervista -> situazione molto improbabile.
Il campione casuale semplice presenta il vantaggio di non aumentare di dimensione in base alla popolazione.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Errore di campionamento del campione casuale semplice

A

Si può stimare con la formula e=z(s/√n)(√1-f) per variabili cardinali e e=z(√(pq/n-1))(√1-f)
In queste formule z è il coefficiente dipendente dal livello di fiducia della sima, s è la deviazione standard campionaria della variabile studiata, 1-f è il fattore di correzione per popolazione finite, p è la proporzione nel campione per la categoria in esame e q=1-p
In questo caso quindi l’ampiezza del campione determina l’errore

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Ampiezza del campione casuale semplice

A

È possibile calcolare l’ampiezza del campione usando le formule dell’errore di campionamento per determinare l’ampiezza in modo che il campione sia sufficientemente grande da ottenere stime precise.
Possiamo usare la formula n=(zs/e)^2 in cui s è la variabilità del fenomeno studiato, z è il livello di fiducia che vogliamo avere ed e è l’errore della stima.
In questo caso l’ampiezza del campione è direttamente proporzionale al livello di fiducia desiderato per la stima e alla variabilità del numero studiato, mentre è inversamente proporzionale all’errore che siamo disposti ad accettare.
Per le variabili nominali possiamo usare la formula n=(z^2pq/e^2)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quando usiamo il fattore di correzione √1-f?

A

Se il campione costituisce più del 5% della popolazione bisogna applicare il fattore di correzione.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Per determinare l’ampiezza di un campione, è necessario consocere la popolazione totale?

A

No, perchè il campione non è proporzionale alla popolazione N, essa entra in gioco solo nel caso in cui per il campione sia richiesta una ampiezza non trascurabile rispetto alla dimensione della popolazione, cioè superiore al 5% di N

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Campionamento sistematico

Modalità e condizioni

Campioni probabilistici

A

È equivalente al campione casuale semplice ma usa una diversa tecnica di estrazione delle unità -> Si scorre la lista delle unità e se ne estraggono una ogni dato intervallo dato da N/n finchè non abbiamo estratto gli individui che ci servono.
Questo criterio funziona solo se le liste non hanno un criterio di ordine per cui l’intervallo si può sovrapporre.
Le due condizoni per usare questo tipo di campionamento sono:
- tutte le unità devono avere la stessa probabilità di essere estratte
- Evitare ogni scelta diversa da quella determinata dall’intervallo di campionamento
È il tipo di campionamento usato per gli exit poll.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Campionamento stratificato

Campioni probabilistici

A

Si suddivide la popolazione in sotto-popolazioni detti strati, che siano omogenei rispetto ad una variabile da noi scelta, correlata alla variabile che vogliamo studiare. Estraiamo poi con un procedimento casuale semplice un campione da ogni strato e li uniamo. La somma dei campioni più piccoli è inferiore all’ampiezza del campione che avremmo estratto sulla popolazione totale.
Il campionamento stratificato può essere:
- proporzionale: riproduce la stessa composizione degli strati della popolazione
- non proporzionale: si sovrarappresentano alcuni strati ponendo tutti gli strati con n uguale e si usa la ponderazione, applicando un peso ad ogni unità estratta.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Campionamento a stadi

Modalità, vantagi e svantaggi

Campioni probabilistici

A

La popolazione viene suddivisa su più livelli ordinati gerarchicamente ed estratti in successione, si estae ogni unità dei diversi livelli in successione dal livello più elevato al meno elevato (in modo probabilistico).
I vantaggi sono:
- non serve lista popolazione totale ma sono liste delle sub-popolazioni delle unità d’ordine superiore estratte
- rilevazione si concentra su unità estratte

Gli svantaggi sono:
- si perde di efficienza, perchè il campione potrebbe essere più numeroso di quello ottenuto con campionamento stratificato
- i casi appartenenti ad una stessa unità d’oridne superiore tendono ad assomigliarsi
- teoria statistica utilizzata è molto complessa

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Campionamento a grappoli

Campioni probabilistici

A

Campionamento che sfrutta il fatto che le popolazioni sono spesso naturalmente suddivise in unità contigue -> si estraggono dei grappoli e si includono nel campione tutte le unità elementari del grappolo. Tecnica usata dall’istat per studaire le famiglie italiane.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Campionamento per aree

Campioni probabilistici

A

Variante del campionamento a strati da applicare quando manca del tutto la lista della popolazione -> dividiamo in aree l’area geografica che vogliamo coprire, le aree sono poi divise in locations, che sono poi divise in chuncks che sono poi divisi in segmenti che contengono dalle 4 alle 16 abitazioni, tra cui vengono poi scelte le abitazioni su cui condurre l’intervista.
Tutte le scelte ai vari livelli vengono fatte con una procedura probabilistica che genera un campionamento casuale semplice.

17
Q

Campionamento complesso

Campioni probabilistici

A

Grandi ricerche che utilizzano congiuntamente le tecniche probabilistiche, combinando la stratificazione con l’estrazione a probabilità variabili, con il campionamento a stadi, ecc. in funzione di esigenze organizzative, costi di rilevazione, efficienza delle stime, sfruttamento delle conoscenze che si hanno sulla popolazione, ecc. Ciò produce dei campioni complessi che, malgrado questa complessità, per il fatto di avere sempre alla base criteri di tipo probabilistico, mettono il ricercatore nella condizione di poter calcolare l’errore di campionamento delle stime.

18
Q

Campionamento per quote

Campioni non probabilistici

A

Probabilmente il disegno campionario più diffuso -> si parte da un campionamento stratificato, in cui la popolazione è divisa in sottogruppi sulla base di alcune variabili. Questi gruppi vengono poi trasportati proporzionalmente nel campione determinando delle quote, ovvero il numero di interviste da effettuare in ogni strato.
L’intervistatore è poi libero di scegliere a sua discrezione i soggetti da intervistare e non c’è quindi casualità nell’estrazione.
Il limite principale di questa procedura è che l’intervistatore scegliera i casi più facilmente reperibili.

19
Q

Disegno fattoriale

Campioni non probabilistici

A

Può essere sia probabilistico che non.
Esso permette di creare un campione stratificato ma con strati volutamente non proporzionali, in modo da avere un numero uguale di soggetti in ogni cella -> questo permette di trovare relazioni non spurie tra le variabili.
Il disegno fattoriale quindi agevola l’analisi delle relazioni tra variabili indipendenti che sono state poste alla base della definizione degli strati.

20
Q

Altri campioni non probabilistici

No per quote e fattoriale

A
  • Campionamento a scelta ragionata: le unità campionarie vengono scelte in modo non probabilistico sulla base delle loro caratteristiche
  • Campionamento bilanciato: si selezionano le unità in modo che la media del campione per determinate variabili sia prossima alla media della popolazione
  • Campionamento a valanga: campionamento utile nel caso di popolazione clandestine (immigrati illegati, membri di sette, gruppi politici illegali, minoranze). Pochi individui vengono usati come informatori per identificarne altri -> rischio che la catena di individuazione sia troppo specifica.
  • Campionamento telefonico: campionamento gestito dal sistema Cati
  • Campionamento di convenienza: non esiste nessun disegno, ma un gruppo di persone scelte con il solo criterio di essere facimelmente accessibili vengono scelte
21
Q

Ponderazione

A

Procedura con la quale modifichiamo artificilamente la composizione del campione per renderla più prossima alla distribuzione della popolazione.

22
Q

Situazioni che richiedono ponderazione

A
  • Probabilità di inclusione del campione: se ci serve includere una determinata sub-popolazione in uno studio in modo non proporzionale a quello presente nella popolazione
  • Conoscenze che si hanno sulla popolazione -> caso più comune è la post-stratificazione: si conosce da fonte esterna la distribuzione di alcune variabili nella popolazione e si confronta questa distribuzione con il campione correggendo i dati campionari per farli corrispondere
  • Conoscenze che si hanno sulle non risposte: si verifica quando la ponderazione viene effettuata sulla base della conoscenza di caratteristiche dei non rispondenti per contrastare l’errore di non risposta. In questo modo non si assegna ai non rispondenti il comportamento medio dei rispondenti, ma il comportamento medio degli appartenenti allo steso gruppo sociale
23
Q

Bontà di un campionamento

A

I due fattori che concorrono a determinare la bontà di un campione sono:
- ampiezza del campione -> campione troppo piccolo porta ad un errore delle stime trippo elevato
- accuratezza della procedura di campionamento -> minimizzazione degli errori di copertura o di non risposta
È necessario raggiungere un equilibrio tra le due cose -> meglio usare un campione probabilistico ma ristretto