1L: Introduzione e raccolta dati Flashcards
Variabili categoriali o qualitative
Le variabili categoriali (qualitative) assumono valori come “sì”, “no”, o “blu”, “marrone”, “verde”
Variabili numeriche o quantitative
Le variabili numeriche (quantitative) hanno valori che rappresentano una quantità derivante da un conteggio oppure misurata.
▪ Le variabili discrete derivano da un processo di conteggio;
▪ Le variabili continue derivano da un processo di misurazione;
Definizione operativa
Una definizione operativa è una affermazione chiara e precisa che offre una interpretazione condivisa del significato del concetto definito ■ In assenza di una definizione operativa, è probabile che si verifichino errori e disguidi.
Fonti dei dati
▪ Fonti primarie: Il raccoglitore dei dati è colui che utilizza i dati per l’analisi.
▪ Fonti secondarie: La persona che esegue l’analisi dei dati non è il raccoglitore dei dati.
Categorie nelle quali rientrano le fonti di dati
■ Dati distribuiti da un’organizzazione o da un individuo;
■ I risultati di un esperimento;
■ Le risposte di un sondaggio;
■ I risultati ottenuti da uno studio osservazionale;
■ Dati raccolti da attività economiche correnti;
Popolazione
Una popolazione è costituita da tutti gli elementi o gli individui sui quali si vuole trarre una conclusione. La popolazione è il “grande gruppo”
Campione
Un campione è la porzione di una popolazione selezionata per l’analisi. Il campione è il “piccolo gruppo”
Quando avviene la raccolta dati attraverso campionamento
Quando selezionare un campione:
■ Richiede meno tempo rispetto alla selezione di ogni elemento della popolazione.
■ È meno costoso che selezionare tutti gli elementi della popolazione.
■ È meno macchinoso e più pratico che analizzare l’intera popolazione.
Ricodifica di variabili
Dopo la raccolta è spesso utile ricodificare alcune variabili
■ La ricodifica di una variabile può integrare o sostituire la variabile originale. ■ La ricodifica di una variabile categorica comporta la ridefinizione delle categorie.
■ La ricodifica di una variabile quantitativa comporta la sua trasformazione in una variabile categorica.
■ Quando si ricodifica, bisogna assicurarsi che le nuove categorie siano mutuamente esclusive (le categorie non si sovrappongono) e collettivamente esaustive (le categorie coprono tutti i valori possibili).
Schema di campionamento
Un processo di campionamento inizia con uno schema di campionamento
■ Lo schema di campionamento è una lista di elementi che compongono la popolazione.
■ Tali schemi sono fonti di dati come liste demografiche, elenchi o mappe.
■ Se uno schema esclude alcune porzioni della popolazione, si possono ottenere risultati imprecisi o distorti
■ L’uso di schemi differenti per generare i dati può portare a conclusioni diverse.
Tipi di campioni
- campioni non probabilistici: soggettivo, convenienza.
- campioni probabilistici: casuale semplice, sistematico, stratificato, cluster.
Campione non probabilistico
■ In un campione non probabilistico, gli elementi inclusi sono scelti senza tener conto della loro probabilità di accadimento. - Nel campionamento di convenienza, gli articoli vengono selezionati solo in base al fatto che sono facili, poco costosi o comodi da campionare.
- In un campione soggettivo, si ottengono le opinioni di esperti preselezionati in materia.
Campione probabilistico
In questo caso gli elementi del campione sono scelti sulla base di probabilità note prima che tale scelta abbia luogo.
Campione casuale semplice
■ Ogni individuo o elemento dello schema ha la stessa probabilità di essere selezionato.
■ La selezione può avvenire con reinserimento (l’individuo selezionato viene reinserito nello schema per un’eventuale riselezione) o senza reinserimento (l’individuo selezionato non viene reinserito nello schema).
■ Campioni ottenuti usando una tabella di numeri casuali o da generatori informatici di numeri casuali.
Campione sistematico
■ Decidere la dimensione del campione: n
■ Dividere lo schema di N individui in gruppi di k individui: k=N/n
■ Selezionare a caso un individuo dal gruppo 1
■ Selezionare successivamente un individuo ogni k
Campione stratificato
■ Dividere la popolazione in due o più sottogruppi (chiamati strati) in base ad alcune caratteristiche comuni.
■ Da ogni sottogruppo viene selezionato un campione casuale semplice, con dimensioni del campione proporzionali alle dimensioni degli strati.
■ I campioni provenienti dai sottogruppi vengono combinati in un unico campione
■ Si tratta di una tecnica comune quando si campiona una popolazione di elettori, stratificandola per etnie o condizioni socio-economiche.
Campione a cluster (grappolo)
■ La popolazione è suddivisa in diversi “cluster”, ciascuno rappresentativo della popolazione.
■ Viene selezionato un campione casuale semplice di cluster
■ Possono essere utilizzati tutti gli elementi dei cluster selezionati, oppure gli elementi possono essere scelti da un cluster utilizzando un’altra tecnica di campionamento probabilistico.
■ Un’applicazione comune del campionamento a grappolo riguarda gli exit poll elettorali, in cui vengono selezionati e campionati alcuni distretti elettorali.
Campione probabilistico: Metodi di campionamento a confronto
■ Campione casuale semplice e campione sistematico
- Semplice da usare
- Può non essere una buona rappresentazione delle caratteristiche di base della popolazione.
■ Campione stratificato
- Assicura la rappresentazione degli individui dell’intera popolazione
■ Campione a grappolo
- Più conveniente
- Meno efficiente (necessita di un campione più ampio per acquisire lo stesso livello di precisione)
Tipi di errori di indagine
■ Errore di copertura o distorsione da selezione
- Esiste se alcuni gruppi sono esclusi dallo schema e non hanno alcuna possibilità di essere selezionati
■ Errore o distorsione di non risposta
- Le persone che non rispondono possono essere diverse da quelle che rispondono
■ Errore campionario
- Esiste sempre una variazione da campione a campione
■ Errore di misura
- A causa di carenze nella progettazione delle domande e/o di errori dei rispondenti