Lezione 7 Flashcards
cosa sono le espressioni regolari?
sono una notazione algebrica che permette di definire in maniera formale un pattern, vengono sviluppate da Kleene nel 1956 e sono supportate da molti programmi e linguaggi di programmazione
per cosa si usano le espressioni regolari?
- specificare un pattern di stringhe da ricercare all’interno di testi o corpora
- definire le regole che governano la tokenizzazione
- trasformare stringhe di testo
cos’è AntConc e come si usa?
AntConc è uno strumento che consente di scoprire informazioni sulla lingua utilizzata, come le parole più frequenti, le combinazioni di parole e le strutture grammaticali. Qui possiamo interrogare espressioni regolari per interrogare i corpora
Punti deboli dei software per interrogare espressioni regolari
le espressioni regolari sono molto sensibili (es. maiuscole/ minuscole), sono notazioni sintetiche. Le espressioni regolari analizzano il contesto il più largamente possibile
Cos’è Sketch engine?
strumento di analisi linguistica che permette di esplorare in modo approfondito grandi quantità di testo, come corpus linguistici e dizionari, per studiare la lingua, tradurre testi e sviluppare risorse linguistiche.
principio di Sketch engine
interrogazione e costruzione di corpora, uno strumento per esplorare come funzionano le lingue e identificare quali usi linguistici sono rari o poco comuni. All’interno vi si trovano molti corpora già pronti all’uso ma se ne possono anche caricare di propri per interrogarli
come funziona Sketch engine?
ci metto la parola che mi interessa cercare e mi dà anche una sintesi del comportamento grammaticale e lessicale di questa parola. Fa dei raggruppamenti basati sulle peculiarità grammaticali delle relazioni tra parole. Posso anche confrontare parole in lingue diverse purché nello stesso contesto)
utilità ulteriori di Sketch engine?
se si impostano bene i sotto-parametri si possono fare valutazioni sul registro che si utilizza oltre che sulla variazione diatopica
cos’è un therasaurus?
parola che appertiene allo stesso campo semantico di quello ricercato su SE e che può essere considerato sinonimo o antonimo
caratteristiche delle traduzioni su Sketch engine
non sono traduzioni letterali, si possono paragonare scelte traduttive più adeguate in base ad un uso specifico di un dominio, non si usano corpus bilingui per conoscere il significato di una parola ma per capire come la si utilizza in un contesto specifico
cos’è CQL?
programma che uso all’interno di Sketch engine, è un linguaggio che permette di fare interrogazioni più complesse, i criteri vanno messi tra parentesi quadre