Cap 1 Chiari Flashcards

1
Q

Da dove deriva il termine ‘computazionale’?

A

Latino CUM/PUTARE –> “assieme a/misurare”
Computare –> Calcolare
Computazione –> Elaborazione elettronica dei dati

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Con quali discipline si lega la Linguistica Computazionale (LC)?

A

Informatica, Scienze Cognitive, Linguistica, Intelligenza Artificiale.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quali sono le sue applicazioni?

A

2 applicazioni:
1. tecniche informatiche per svolgere compiti linguistici
2. conoscenze linguistiche per elaborare applicazioni informatiche

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Che ruolo ha l’informatica nella LC?

A

L’informatica, che è il trattamento di informazioni tramite calcolatori elettronici è il nucleo tecnologico di questa disciplina.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quando avvenne l’incontro tra Linguistica e Informatica?

A

Intorno agli anni ‘50 del Novecento.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

In che anno si dice sia nata la LC?

A

Nel ‘62, fatta coincidere con la nascita di ACL.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Cosa significa ACL?

A

ACL sta per Association for Computational Linguistics, nata nel ‘62, si occupa di AI e TA (Intelligenza Artificiale e Traduzione Automatica).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

La linguistica computazionale è legata ad un solo settore?

A

No, è radicalmente interdisciplinare e multidisciplinare. Non c’è un dominio preciso.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Cosa sono le applicazioni destinate a specialisti del linguaggio?

A

Sono strumenti computazionali che portano alla luce aspetti delle LSN (Lingue Storico-Naturali) che altrimenti non sarebbero rilevabili.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Perché la ‘Linguistica dei Corpora’ si serve di questi strumenti?

A

Per esaminare con più facilità testi scritti o parlati, studiandone le caratteristiche. Per esempio, tramite software elementari, possiamo sapere quante volte una parola è ripetuta in un testo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

In cosa consiste il secondo approccio della Linguistica Computazionale?

A

Nell’uso di conoscenze linguistiche formalizzate per l’elaborazione di applicazioni informatiche di uso comune (spell-checkers, dizionari informatizzati su CD-ROM, testi che vengono letti, o <sistemi>.</sistemi>

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qual è l’oggetto della linguistica?

A

Le LSN, come si stratificano nel tempo e come vengono tramandate.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qual è una delle ambizioni umane?

A

Fare in modo che la facoltà linguistica possa essere insegnata alle macchine, fino a creare veri e propri automi.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quando si comincia a pensare che lingue e calcoli siano simili?

A

Nel Seicento si sviluppò un interesse per le lingue perfette e artificiali. Filosofi come Thomas Hobbes e Gottfried Leibniz pensano che alcune caratteristiche delle lingue siano simili ai calcoli. È solo a partire dalla fine degli anni ‘40 del Novecento che si pensa concretamente alla costruzione di macchine per compiti linguistici.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Cos’è un modello?

A

Un modello permette a una macchina di produrre comportamenti linguistici. È un quadro astratto e formale che contempli in dettaglio tutte le possibilità dell’interazione.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Cosa fa la LC con i modelli?

A

La LC usa i modelli per rendere possibile una performance adeguata da parte della macchina.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

I modelli forniti alla macchina sono gli stessi umani?

A

Non necessariamente. Noi non ci aspettiamo che una macchina usi la lingua come un umano, quindi può anche discostarsi dal modello linguistico degli esseri umani.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Qual è il ruolo del modello linguistico?

A

Dato un input (dato fornito), il modello fa da mediatore, filtra l’input e lo analizza tramite una serie di algoritmi, e poi fa in modo che la macchina fornisca un output, una produzione.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Cos’è un algoritmo?

A

Un algoritmo è una serie finita di operazioni per la risoluzione di un problema, prevedendo tutti i passi necessari e contemplando tutti i possibili input di dati.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Cos’è un linguaggio formale?

A

L’algoritmo può essere pensato come ‘programma’ e un programma ha bisogno di un linguaggio formale, un codice che definisce in modo astratto e univoco classi e relazioni tra classi di elementi estratti da un inventario I e seguendo regole R.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Com’è detta la somma di I+R.

A

Le regole possono essere pensate come la sintassi del linguaggio formale L, e la somma di I+R è la grammatica di L. Un linguaggio formale conterrà tutte le stringhe dell’inventario R. Grammatica e sintassi in questo caso sono termini presi in prestito dalla linguistica ma hanno un significato diverso dal consueto.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Fai un esempio.

A

Dato I (a,b,c) e regola di poter combinare solo due elementi alla volta, avremo le stringhe (aa,ab,ac,ba,bb,bc,ca,cb,cc).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Cos’è un linguaggio di programmazione?

A

Un linguaggio formale per descrivere algoritmi che devono essere eseguiti un calcolatore. L’algoritmo è il programma espresso tramite tale linguaggio di programmazione. Codifica in binario di istruzioni per operazioni elementari eseguibili.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Che ruolo ha il programmatore?

A

Il programmatore conosce 1+ linguaggi formali e insegna algoritmi ai calcolatori scrivendo programmi.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Differenza tra regole di un linguaggio formale e regole linguistiche?

A

Anche la linguistica umana si basa su delle regole linguistiche, tuttavia possono introdurre molte innovazioni, opacizzare fenomeni e preservarne altri. Tuttavia, essendo presenti regole si può ipotizzare la possibilità di riprodurre le competenze linguistiche nel caso di un automa.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Cos’è una regola linguistica?

A

È la descrizione di una pratica linguistica.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Cosa si intende per posizione debole?

A

Secondo la posizione debole, la linguistica prevede semplicemente la scelta di una regolarità rispetto ad un’altra. Questo approccio è tipico di strumenti statistici e probabilistici.

28
Q

Cos’è una regola linguistica in senso forte?

A

In senso forte la regola linguistica è l’effetto di una regola grammaticale. Una regola linguistica non è sempre rispecchiata nel comportamento linguistico, quindi può essere intesa come generalizzazione dell’esperienza.

29
Q

Chi è che afferma la posizione in senso forte?

A

Noam Chomsky.

30
Q

In che senso Noam Chomsky parla della centralità della competenza linguistica?

A

La competenza linguistica è per Chomsky la capacità di produrre frasi ben formate ed esprimere giudizi. La nozione di regola è quindi alla base della grammatica, ma sempre come approccio descrittivo, non prescrittivo.

31
Q

Quali sono i due modelli che derivano da queste posizioni?

A

Nella posizione debole abbiamo i modelli linguistici di tipo statistico, nel secondo caso quelli rule-based.

32
Q

Cos’è un modello linguistico di tipo statistico?

A

Si basa su dati estratti da testi reali. È un modello induttivo e mira a riprodurre comportamenti che simulino le tendenze proprie della produzione linguistica concreta.

33
Q

Cos’è un modello grammaticale?

A

In un modello grammaticale, rule-based, la regola sarà rappresentata da una serie di condizioni necessarie e sufficienti a specificare una data produzione. È un approccio deduttivo: dato un insieme finito e astratto di regole, posso formulare un numero infinito di frasi ben formate.

34
Q

Cos’è la creatività linguistica?

A

I due modelli di prima si scontrano in modo diverso con la creatività linguistica, tipica delle LSN.

35
Q

Quali sono le due tipologie di creatività?

A

Rule-based creativity e Rule-changing creativity.

36
Q

In quale opera Chomsky parla di creatività e cosa dice?

A

Negli Aspetti della teoria della sintassi (1965), Chomsky parla di creatività basata su regole che permette l’uomo di esprimere un numero potenzialmente infinito di pensieri per far fronte a nuove situazioni. La creatività si poggia e accomoda sulle regole ma può anche generare frasi mai prodotte prima.

37
Q

In cosa consiste la Rule-changing creativity?

A

La creatività che cambia e regole muta queste ultime all’occorrenza. In date circostanze è, dunque, possibile rompere le regole e ristrutturare il sistema dalle sue fondamenta. In questo modo la creatività si muove all’interno ed esterno di sistemi e codici linguistici e non linguistici diversi.

38
Q

Cos’è la ridondanza?

A

La ridondanza è una caratteristica che dipende dalla prevedibilità di molti aspetti dei testi linguistici. Tramite prevedibilità è possibile capire il senso di un testo in cui sono presenti errori o rumori. Ha quindi una funzione contro rumori ed errori, permettendo un’adeguata comprensione anche in condizioni poco ottimali.

39
Q

Perché lingue e calcoli differiscono?

A

Perché vi sono degli aspetti della lingua che sono incalcolabili e questi mettono in difficoltà soprattutto gli automi. I casi di incalcolabilità sono sicuramente una sfida in LC.

40
Q

Cos’è un calcolo?

A

Un calcolo, per essere definito tale prevede un inventario I di simboli finito e un insieme finito di regole R. Le lingue spesso si allontanano da questo modello per la loro flessibilità e dinamicità.

41
Q

In quali aspetti calcoli e lingue sono simili?

A

Entrambi calcoli e lingue possono produrre un numero potenzialmente infinito di segni. (Es. x+1; o in lingua la creazione di lessemi etc.). Per i calcoli possiamo generare sempre segni più lunghi, per le lingue inoltre abbiamo un inventario aperto, tramite cui possiamo aggiungere sempre nuove forme. Tuttavia, il sistema dei fonemi non solo è finito, ma è ridotto.

42
Q

Quali sono fenomeni di flessibilità nelle lingue?

A

Sinonimie, polisemie, omonimie etc.

43
Q

Cosa si intende per accezioni?

A

Le accezioni sono le polarizzazioni dei sensi in famiglie che si specializzano in direzioni poco prevedibili. “Calcio” ha due accezioni: calcio con il piede o come sport. Questi fenomeni aumentano l’imprevedibilità delle accezioni. Inoltre, si incontrano differenze in altre lingue: se in italiano abbiamo una sola parola e due accezioni, in inglese avremo due parole per le due accezioni (kick e soccer).

44
Q

Cosa si intende per estensibilità degli usi e dei sensi?

A

In alcuni casi abbiamo bisogno di nuove parole o espressioni sul momento, in un secondo caso invece apportiamo un’estensione al sistema linguistico vero e proprio, quindi alla base. Il caso di ‘navigare’ che ora significa anche ‘surf the net’.

45
Q

Cosa sono le sinonimie?

A

Alcune volte nella lingua troviamo asimmetrie tra forma e contenuto. Le sinonimie, per esempio, sono parziali sovrapposizioni di possibili sensi. Quindi due sinonimi possono veicolare lo stesso senso. Però non sempre è vero (dizionario e vocabolario). Le sinonimie sono più o meno cristallizzate e si stabiliscono sul piano della parole.

46
Q

Perché le sinonimie sono una sfida in LC?

A

Le sinonimie sono imprevedibili e incalcolabili. Sono possibili anche nei calcoli, ma sono sempre calcolabili.

47
Q

Cosa sono le ominimie?

A

Le omonimie sono asimmetrie a livello formale. Abbiamo la stessa forma ma contenuti diversi. Esistono omonimi assoluti (calcio - parole omografe e omofone) ed omonimi testuali (faccia - diversa categoria grammaticale). In LC questi fenomeni portano a problemi di disambiguazione.

48
Q

Cosa sono le polirematiche?

A

Sono più parole grafiche che si comportano come un unico lessema. Queste co-occorrono sempre insieme: es. stare a cuore, prigioniero politico, scala mobile.

49
Q

Quali sono i due gradi di polirematiche?

A

Il primo grado vede il significato come non riconoscibile facilmente. Nel secondo caso sono riconoscibili (in particolare nei linguaggi settoriali, es. colonna montante).

50
Q

Cosa sono le collocazioni?

A

Le collocazioni sono più libere rispetto alle polirematiche. Il termine collocazione è stato introdotto da John Rupert Firth. In questo caso le parole occorrono solitamente insieme come preferenza: es. obliterare il biglietto. In altre lingue non vi sarà sempre corrispondenza: compilare un modulo –> fill a form.

Polirematiche e collocazioni sono importanti su più livelli ma comunque danno problemi a livello di Traduzione Automatica.

51
Q

Cosa sono le ambiguità sintattiche?

A

Ci troviamo di fronte ad ambiguità sintattiche quando alcune frasi prese in isolamento possono avere diverse interpretazioni, quindi verranno rappresentate con un diverso albero sintattico. Solitamente le frasi si disambiguano facilmente mediante ricorso a contesto e cotesto.

52
Q

Perché le ambiguità sintattiche sono molto problematiche per le macchine?

A

Se gli umani possono ricorrere alla pragmatica e semantica per disambiguare le frasi, in fase di Traduzione Automatica ci potrebbero essere delle complicazioni, perché non si può ricorrere alla pragmatica.

53
Q

Quali sono le ambiguità di tipo pragmatico?

A

Quelle ambiguità dipendenti dalle concrete circostanze di enunciazione, per esempio tramite riferimenti anaforici e cataforici, (Il giovane ha ringraziato l’amico e sua moglie –> sua a chi si riferisce?), o i quantificatori (nessuno, pochi, tutti). Solitamente il contesto risolve i dubbi, ma quando l’intervento umano non c’è la disambiguazione è più complicata.

54
Q

Cos’è la metalinguisticità riflessiva?

A

Un ulteriore punto di distacco tra lingue e calcoli è il fatto che le lingue sono dotate di metalinguisticità riflessiva (MR), ovvero si usa la lingua per parlare della lingua (es. Cosa intendevi prima?).

55
Q

Perché i calcoli non hanno la MR?

A

I calcoli sono codici semiologici in cui non possono coesistere diversi livelli di metalinguaggio.

56
Q

Che ruolo ha la MR nella TA?

A

La MR è importante ma spesso ciò che è riconoscibile da un cervello umano, non lo è per una macchina, per cui la Traduzione Automatica può avere dei problemi.

57
Q

Perché la conoscenza della pragmatica è un problema per la TA?

A

Se l’uomo ricorrendo alle conoscenze linguistiche ed extralinguistiche può disambiguare le forme facilmente, perché ha delle abitudini e conoscenze esperienziali che glielo permettono, una macchina avrà più problemi.

58
Q

Quali sono i problemi di natura pragmatica che la LC deve affrontare?

A

Il riconoscimento degli atti linguistici (In questa aula si soffoca) –> perché spesso il valore di un atto linguistico non è quello che si vede in superficie.

59
Q

La LC privilegia scritto o parlato?

A

La LC ha da sempre privilegiato l’analisi dello scritto, nonostante si parli della prevalenza degli usi parlati. Il sistema di scrittura è, infatti, trattato con più felicità dalla Traduzione Automatica.

60
Q

Perché l’orale è difficile da analizzare in TA?

A

Perché l’orale si presenta come un continuum e un continuum è difficilmente discretizzabile.

61
Q

Quali sono i parametri per il successo di un modello?

A

Abbiamo una serie di parametri in un’applicazione computazionale che sono in relazione con la sua prestazione, il suo rendimento e potenziale teorico. Noi ne esamineremo 6:

Robustezza

Potenza

Portabilità

Generalizzabilità

L’Economia di programmazione

La complessità della computazione.

62
Q

Perché la robustezza è un parametro importante?

A

Perchè permette di gestire anche materiale di input che presenta errori o aberrazioni. I sistemi probabilistici riescono ad avere una certa robustezza anche quando l’input è spontaneo, difforme, incompleto o frammentario.

63
Q

In che senso la potenza è legata alla nozione di robustezza?

A

Perché descrive il raggio d’azione della lingua dell’applicazione, ovvero quanta della lingua viene trattata accuratamente senza dover ogni volta riprogrammare manualmente.

64
Q

Cosa si intende per portabilità?

A

La portabilità è la possibilità di applicare un’applicazione a nuovi domini senza modificare o modificando al minimo la struttura. Anche questo è tipico di sistemi probabilistici.

65
Q

Cos’è la generalizzabilità?

A

È la capacità di dare conto di fenomeni linguistici nuovi applicando modelli e testi da cui si ricavano regolarità riferibili a un universo più ampio di testi. Quindi si hanno dei campioni rappresentativi.

66
Q

A cosa si riferisce l’economia di programmazione?

A

Riguarda l’architettura del sistema, ovvero la sua semplicità o complessità e come si riesce a perfezionarlo affinché il risultato abbia una percentuale di errore veramente bassa, ricorrendo poco a interventi.