8) metodi di raccolta e analisi dei dati: Flashcards
i dati in sociolinguistica:
Un dato è qualsiasi fenomeno o fatto che abbia caratteri che lo rendono pertinente per una certa teoria o una certa analisi;
- dati autentici = ricavati in una situazione effettiva di realizzazione del sistema linguistico da parte dei parlanti
- corpus di riferimento = è l’insieme di dati su cui si svolge l’analisi
Si applica dapprima una prospettiva di descrizione del dato in base a tutti i suoi caratteri esterni, visibili all’osservazione, indipendenti dal contesto in cui è prodotto (prospettiva etica); e poi una prospettiva di interpretazione del dato nei termini che risultano rilevanti nel contesto specifico della comunità parlante e che consentono quindi di determinare il valore sistemico e funzionale (prospettiva emica).
analisi qualitativa e analisi quantitativa:
- qualitativa = ricavata da quanto si sa preliminarmente della situazione
- quantitativa = fondata sui numeri, su entità misurabili oggettivamente, specie coi metodi della statistica
dati naturalistici, elicitati e sperimentali (NES):
- dati naturalistici/autentici = osservati nel comportamento spontaneo dei parlanti
- dati elicitati/stimolati = ricavati da interviste e fatti produrre dai parlanti attraverso un determinato input o opportune domande
- dati sperimentali = ottenuti secondo determinati requisiti tecnici, in una situazione i cui parametri sono tenuti sotto controllo ed evetualmente con l’impiego di strumentazione apposita
raccolta dei dati: osservazione:
paradosso dell’osservatore = il compito della sociolinguistica è studiare come la gente parla spontaneamente, quando non è sottoposta ad osservazione; ma solo mediante osservazione sistematica possiamo constatare come la gente parla. Quindi o noi non possiamo studiare in effetti come la gente parla, o rinunciamo alla ricerca, visto che non possiamo ottenere i dati se non tramite l’osservazione.
al fine di contenere questo paradosso, si sono sviluppati vari esempi di osservazione:
* osservazione occulta = cioè a microfono nascosto.
* osservazione partecipante = il ricercatore partecipa per un certo lasso di tempo in maniera diretta, intesiva e continua alla vita quotidiana della comunità indagata, immergendosi nel contesto da descrivere e condividendo gli eventi e le azioni dei memti della comunità, immedesimandos con le loro prospettive e consuetudini, in un certo senso diventandone membro egli stesso.
è poi vero che le risposte dei parlanti non spesso condizionate da atteggiamenti ideologici e proiezioni, e quindi dovute dal pensiero di quale sia la risposta che l’intervistatore vuole ricevere,
raccolta dei dati: campionamento:
Il campionamento ha vari problemi;
Molto usato in sociolinguistica è il campionamento cosiddetto ‘accidentale’, che si avvale dei soggetti di una popolazione che più facilmente e immediatamente si possono contattare.
Tuttavia, spesso è necessario avere invece un campione stratificato.
Non è consigliabile un campione ‘casuale’, costituito da soggetti scelti a sorte.
metodo ‘matched guise’:
consiste nel sottoporre a valutatori (che non sanno che il parlante è sempre la medesima persona, e devono fornire dopo l’ascolto le loro reazioni in base a una serie di domande) registrazioni dello stesso brano letto da uno stesso parlante in più varietà di lingua.
trascrizione dei dati:
- trascrizione fonetica
- trascrizione conversazionale (etnotesti = testi orali)
i corpora nell’indagine sociolinguistica:
In sociolingustica, e in particolare nello studio della variazione, è prassi consolidata condurre ricerche sulla base di corpora linguistici, generalmente accessibili via internet.
La gamma dei corpora oggi a disposizione consente di condurre ricerche su testi di vario genere.
L’interrogazione di un corpus, cioè il rinvenimento e l’estrazione dei dati pertinenti per la ricerca che si intende svolgere, avviene generalmente attraverso una maschera predisposta per tale operazione.
La maschera consente di formulare una richiesta di estrazione, detta più tecnicamente ‘query’.
(ex. formulare una query che richieda di estrarre da un corpus le occorrenze del lemma ‘adolescente’ (cioè sia la forma ‘adolescente’ che la forma ‘adolescenti’)
semantica distribuzionale:
= i modelli di analisi fondati sull’ipotesi distribuzionale, secondo cui la somiglianza semantica fra due parole è funzione della somiglianza fra i contesti linguistici in cui queste compaiono (due parole hanno significati tanto più simili quanto più tendono a comparire in contesti simili/a essere simili semanticamente).
analisi multivariate:
esistono programmi per analizzare i corpora; essi effettuano un’analisi multivariata, cioè analizzano il rapporto di co-variazione fra una variabile dipendente e più variabili indipendenti.
Tale analisi ha come obiettivi principali:
1. stabilire quali variabili indipendenti, ovvero quali gruppi di fattori, esercitino un’influenza statisticamente significativa sulla realizzazione del fenomeno e quali no
2. calcolare con quale probabilità i singoli fattori influenzano, positivamente o negativamente, la realizzazione del fenomeno.