lezione 1 Flashcards
cos’è un dato linguistico?
prodotto della facoltà del linguaggio, oggetto di un processo di analisi da parte di un linguista
che valore ha un dato linguistico? A cosa serve?
estraggo la teoria a partire dal dato o verifico la mia teoria sull’evidenza di dati racconti
quali sono i tipi di fonti per la linguistica?
- testi che i parlanti producono, dati ecologici e naturali
- osservazione del parlante, non è materiale naturale o spontaneo
cos’è un corpus linguistico?
è una metodologia d’analisi che si può applicare a ogni livello della lingua.
il dato linguistico: cosa differenzia l’approccio razionalista da quello empirista?
Approccio razionalista: basato su dati artificiali comportamentali, significa che un parlante nativo fa riflessioni sulla propria lingua basandosi sulla propria competenza (Chomsky). È un’abilità innata presente per comprendere il linguaggio, si discute se è innato il linguaggio come facoltà oppure sono innati i presupposti ma non l’imprendimento. Per i razionalisti la facoltà del linguaggio è una facoltà innata. Utilizza un approccio deduttivo
Approccio empirista: ragionamento di tipo deduttivo, costruisco la teoria e la provo attraverso i dati che raccolgo, è un ragionamento di tipo induttivo. I dati che raccolgo sono raccolti naturalmente secondo il contesto e sono chiamati corpora, da questi estraggo la regolarità.
cos’è la competenza?
insieme di conoscenze internalizzate che ciascun parlante ha della propria lingua
Cos’è l’esecuzione?
produzione pratica di enunciati reali, resa possibile dalla competenza
Chomsky e la critica ai corpora
si basa sull’approccio del parlante ideale senza raccogliere mai i dati, il corpus è sempre deviato rispetto alla realtà perché non sempre la competenza porta all’esecuzione
cosa si oppone all’approccio di Chomsky?
In alcuni campi d’indagine l’osservazione è l’unica scelta, per esempio in dominii come quelli della grammatica clinica. In generale possiamo dire che Gli approcci razionalisti prediligono lo studio della competenza, quelli empiristi studiano l’esecuzione.
quali sono le caratteristiche che deve avere un corpus per essere considerato tale?
un corpus è per forza digitale ed ha una dimensione predeterminata. Deve coinvolgere un campione della popolazione rappresentativo e contenere solo atti linguistici reali.
cosa si intende per rappresentatività di un corpus?
è l’atto di prendere un sottoinsieme che sia specchio dell’intero, comprendendo anche le proporzioni. Un corpus per essere valido deve essere creato a tavolino
Cos’è la frequenza?
Più un fenomeno è frequente meno è soggetto ad oscillazioni all’interno di un corpus. Per osservare ciò che è meno frequente sono costretto a raccogliere corpora molto grandi.
cos’è una lista di frequenza?
lista per cui ordino secondo un rango le parole in maniera decrescente in base alla loro frequenza
cos’è la legge di Zipf?
legge matematica secondo la quale trovo un rapporto tra rango e frequenza. Più alto è il rango più è bassa la frequenza
Perché servono corpora molto grandi?
le parole di classe aperta (quindi i lessemi di base) hanno bassa frequenza, per trovarle bisogna raccogliere corpora enormi (problema della sparsità dei dati)