9. Dati e disegni di ricerca Flashcards
Disegno di ricerca
L9
Insieme di procedure e regole che hanno a che fare con l’organizzazione dei dati, l’analisi dei dati e l’esposizione dei risultati
Quali sono le dimensioni di un disegno di ricerca?
L9
- Temporale: analisi sincronica (trasversale) vs. diacronica (longitudinale)
- Spaziale: contesto (caso singolo) vs. più contesti (più casi)
- Di livelllo: individuale vs. aggregato
Studio sincronico non comprato individuale
L9
Usiamo un disegno di ricerca che studia un contesto in cui le osservazioni sono gli individui e raccogliamo informazioni rilevante in un momento e contesto specifici.
Es: Studio sul comportamento di voto alle elezioni politiche italiane del 2022; indagine post-elettorale; indagine multiscopo sulle famiglie italiane.
Studio sincronico non comparato aggregato
L9
l’unità di analisi è di tipo aggregato, ad esempio un paese o una organizzazione, che studio in un dato momento del tempo → studio del caso
Es: studiare le elezioni politiche italiane del 2022; volatilità, frammentazione, disproporzionalità, astensionismo etc.
Studio sincronico comparato individuale
L9
Indagine campionaria svolta su individui in più contesti in un dato momento, con uso di variabili aggregate
Es: studiare il comportamento di voto alle elezioni europee del 2019; European Social Survey
Questo tipo di studio permette di svolgere una analisi multilivello, ovvero studiare un fenomeno come influenzato da variabili attribuibili di unità appartenenti a livelli diversi. In questo modo possiamo valutare il rapporto micro-macro, gli effetti contestuali, di composizione e cross-level.
Studio sincronico comparato aggregato
L9
L’unità di analisi è di tipo aggregato e analizzo la variazione tra diversi contesti utilizzano variabili aggregate o globali e misurando a livello dell’unità
Es: studiare la variazione del numero di donne in parlamento
Studio diacronico non-comparato individuale
L9
Inchiesta campionaria ripetuta nel tempo per valutare il cambiamento individuale in un solo contesto. Un’indagine di questo tipo è l’indagine elettorale panel, in cui l’individuo viene intervista prima e dopo un fenomeno per osservare la variazione della loro opinione.
Es: indagine elettorale pre- e post- elezioni
Studio diacronico non-comparato aggregato
L9
Studio tipico in cui si usano le serie storiche per analizzarne i trend e descrivere, spiegare o predirre.
Es: studiare il cambiamento della popolazione di un paese, i consumi, i prezzi, la partecipazione elettorale, la natalità etc.
Studio diacronico comparato individuale
L9
Estensione dello studio individuale in più contesti con più fonti di variazione per valutare la variazione individuale o in un determinato momento tra i contesti oppure tra i contesti nel tempo.
Studio diacronico comparato aggregato
L9
Si tratta dei time-sieries-cross-sectional design, ovvero studi che combinano la prospettiva dell’analisi aggregato trasversale e quella dell’analisi aggregata temporale.
Es: paesi come unità di analisi per i quali sono disponibili più osservazioni
Dati primari
L9
Dati raccolti dal ricercatore che poi li analizza
Dati secondari
L9
Dati già disponibili e organizzati in modo sistematico rispetto ad un’unità di analisi con lo scopo di rispondere ad una domanda di ricerca
Analisi secondaria
L9
Analisi che parte da dati già raccolti e disponibili, organizzati in matrici o dataset e può riguardare diverse unità di analisi. I dati possono essere provenienti da una o più fonti statistiche, per cui è necessario combinare le informazioni o armonizzare i dataset che usano unità diverse. Ciò avviene anche perché con l’analisi secondaria rispondiamo ad una domanda di ricerca definita indipendentemente dalle finalità per cui i dati sono stati originariamente raccolti.
Vantaggi e svantaggi dell’analisi secondaria
L9
Vantaggi
- economico -> non bisogna sostenere i costi della raccolta dati
- cumulatività -> l’analisi secondaria permette di analizzare il cambiamento nel tempo di un dato fenomno sviluppando la teoria e la conoscenza del problema
- comparazione
- ruolo delle istituzioni -> ci si può rivolgere alle istituzioni per avere dati controllati
Svantaggi
- interrogativi sono limitati
- prima si hanno i dati e poi la domanda di ricerca
Quali sono i 3 criteri con cui scegliere i dati dell’analisi secondaria?
L9
- Conformità alla domanda di ricerca
- Qualità dei dati
- Diffusione pubblica dei dati
Dove possono essere ottenuti i dati per l’analisi secondaria?
L9
- Archivio online → può essere con o senza registrazione/firma
- Archivio offline → può essere con firma o richiesta formale da parte di una istituzione
L’accesso dipenden quindi dalla fonte, le più affidabili sono ICPSR, Gesis, EUROSTAT
Analisi replicata
Disegni di ricerca trasversali
L9
Qui l’analisi secondaria cerca di riprodurre i risultati del ricercatore primario sulla base degli stessi dati. Per fare ciò è necessario sapere come sono stati selezionati i rispondenti, come è stata definita la variabile dipendente e come sono stati selezionati i casi → necessario definire uno standard di replicabilità che garantisca la possibilità del controllo fra membri della comunità scientifica. È un tipo di analisi che favorisce il processo di cumulatività della ricerca scientifica.
Analisi di indagini parallele
Disegni di ricerca trasversali
L9
-> analisi della stessa domanda di ricerca con diversa indagine: ha l’obiettivo di controllare e migliorare l’attendibilità dei dati, ponendo una possibile risposta all’incertezza delle stime, cioè all’errore fra il valore osservatore e quello reale. Esso può nascere dalla selezione dei casi, nel processo di osservazione o nel trattamento dei dati. L’analisi parallela verifica se le stesse analisi condotte su campioni diversi portino agli stessi risultati.
Analisi con diversa domanda di ricerca della stessa indagine
Disegni di ricerca trasversali
L9
Caso classico dell’analisi secondaria, ovvero rispondere ad una domanda nuova con dati vecchi con l’obiettivo di sviluppare o confutare una teoria pregressa. L’analista può intervenire nei seguenti modi:
- Specificazione dell’oggetto di ricerca
- Migliore definizione dei concetti chiave
- Approfondire la relazione causale tra due variabili introducendo una terza variabile
- Progresso delle tecniche di analisi dei dati
Analisi di indagini cumulate
Disegni di ricerca trasversali
L9
Si combinano file dati provenienti da diverse indagini per rispondere ad una determinata domanda di ricerca. È possibile compiere questa indagine soprattutto nelle situazioni in cui vi sia una scarsa numerosità di casi che potrebbe minacciare l’affidabilità dell’analisi. La cumulazione che pone meno problemi è quella delle edizioni differenti della stessa survey. I problemi principali che possono presentarsi sono: struttura dei dati (gestirli e unirli), comparabilità delle survey.
Analisi multilivello
Disegni di ricerca trasversali
L9
Nasce per trattare il problema di studiare un fenomeno influenzato da elementi appartenenti a livelli gerarchici diversi → interessa studiare l’effetto di fattori collocati a ciascun livello e l’interazione di fattori posti a livelli diversi. In questo contesto l’analisi secondaria permette di specificare le domande di ricerca nei termini micro-macro, sfruttando la Coleman Boat, un modello secondo cui, per spiegare i cambiamenti a livello macro, è necessario scendere a livello micro disegnando graficamente una sorta di barca. Per fare ciò è necessario considerare gli effetti sugli individui degli eventi e delle condizioni macro, considerare le azioni individuali che ne seguono e infine gli effetti macro delle interazioni individuali
Analisi di indagini ripetute
Disegni di ricerca longitudinali e comparati
L9
Prevede che siano compiute misure simili in punti diversi del tempo su di una popolazione equivalente. Queste indagini si prestano meglio dei panel a rilevare il cambiamento aggregato, e in particolare a misurare il cambiamento netto, ovvero il cambiamento al netto dei flussi di cambiamento individuale. Le più frequenti analisi di indagini ripetute sono:
- Analisi dei trend: descrive l’andamento nel tempo a livello aggregato di un certo fenomeno
- Analisi di coorte: riguarda la distinzione tra gli effetti età, periodo e coorte → la coorte è formata da individui nati in certi anni, che tendono a differire dagli altri perché sono inquadrati in contesti storici via via diversi.
Analisi di panel
Disegni di ricerca longitudinali e comparati
L9
Si tratta di interviste ripetute sugli stessi soggetti, per cogliere il cambiamento individuale. I panel sono estremamente costosi, e comportano impegno dal punto di vista organizzativo. Hanno inoltre il problema del logoramento (intervistati interrompono la partecipazione per diversi motivi) e dell’interferenza (intervistato può cambiare il proprio atteggiamento perché sa di essere oggetto di studio).
Fra le varie tecniche possibili, le più utilizzate sono:
- Event history analysis → analisi dei dati di durata. Essa registra la durata di episodi, ossia la permanenza dell’unità di analisi in un particolare stato che termina con un evento (es: occupazione termina con la pensione/licenziamento). È però vero che in questa analisi spesso l’inizio o la fine del periodo non è osservabile dal ricercatore perché distante di molti anni, oppure si tratta di variabili che cambiano nel tempo.
- Analisi delle sequenze → analizzare una successione di eventi che marcano il passaggio tra diversi stati
Analisi di indagini comparate
Disegni di ricerca longitudinali e comparati
L9
Analisi secondaria che permette di studiare lo stesso problema in contesti diversi o in punti diversi nel tempo. Essa consente di sviluppare una specifica domanda di ricerca estendendola ad una nuova popolazione. Es: comparazione tra nazioni, regioni, città. Si presenta problemi per quanto riguarda la struttura dei dati e la comparabilità.
In che modo è possibile integrare dati primari e secondari nella stessa ricerca?
L9
- Applicare all’analisi secondaria una survey primaria
- Utilizzare l’analisi secondaria per definire il quadro di riferimento dell’analisi primaria
- Utilizzare l’analisi secondaria per migliorare il disegno di ricerca dell’analisi primaria operando sugli strumenti di rilevazione e sul campionamento
Tipologia di dati secondari di Hakim
L9
- Indagini trasversali: gruppo di dati più ampio ed eterogeneo, sia per temi che per qualità. Il problema principale di questi dati è la mancata diffusione (in Italia sono raramente accessibili e spesso non istituzionali)
- Indagini longitudinali da fonti non istituzionali: maggiormente omogenei di quelli trasversali e per lo più pubblicamente accessibili → indagini spesso concentrate sulla popolazione
-
Indagini longitudinali e comparate da fonti non istituzionali: indagini ripetute e focalizzate sui valori e gli orientamenti politici, o indagini multiscopo che trattano i principali temi di interesse per le scienze sociali
-Indagini longitudinali da fonti istituzionali: il carattere istituzionale della fonte garantisce qualità e diffusione pubblica- Indagini longitudinali e comparate da fonti istituzionali: usate per lo studio dell’opinione pubblica, sono volte a cogliere le condizioni di vita e di lavoro in Europa (es: Eurostat)
- Censimenti ISTAT: ISTAT mette a disposizione molti dati ma spesso estremamente essenziali e circoscritti, dalle applicazioni molto specifiche
- Dataset costruiti a partire da archivi amministrativi: archivi che provengono da organizzazioni burocratiche ed utilizzati da queste utile per sviluppare i loro compiti (es: INPS). Il problema principale di questi dati è che sono ad accesso severamente ristretto, ed è difficile collegare fonti diverse.
Quali presupposti bisogna prendere in considerazione quando si sceglie un dataset?
L9
- Sovrapposizione tra contenuto informativo del disegno di ricerca e quello del dataset
- Conformità del campione rispetto al disegno di ricerca
- Dimensione longitudinale e comparata
- Struttura del dataset
È comunque sempre necessario porre attenzione alla qualità dei dati e sulle modalità di diffusione (meglio se i dati sono più facilmente accessibili).
Quali sono i 3 modi con cui è possibile combinare i dataset?
L9
- Aggiungendo casi: si aggiungono casi mentre le variabili rimangono le stesse. Avviene spesso in inchieste ripetute, comparate o cumulate.
- Aggiungendo variabili per variabile chiave di stesso livello: i casi rimangono gli stessi, ma si aggiungono variabili chiave dello stesso livello. Avviene spesso per i panel elettorali, dove si combinano diverse ondate per sapere cosa ha votato lo stesso individuo al tempo t e in seguito al tempo t+1
- Aggiungendo variabili per variabile chiave di livello diverso: si aggiungono variabili ma per una variabile chiave di diverso livello. Tipico delle analisi multilevel, dove variabili contenute nel dataset appartengono a due livello diversi (es: una individuale e l’altra regionale/nazionale)
Quali sono i problemi da risolvere nella combinazione dei dataset?
L9
- Comparabilità della domanda
- Comparabilità dei campioni → in questo caso le possibili distorsioni sono due:
- Procedure di campionamento: influiscono sui tassi di non risposta e sulla composizione del campione. Vi sono poi problemi di comparabilità dei campione che possono derivare da cambiamenti della definizione di popolazione da campionare- Modalità di rilevazione dei dati: le caratteristiche dell’intervistato influenzano le sue risposte, così come le modalità di somministrazione dell’intervista