analisi spettrografica Flashcards
cos’è uno spettrografo
è uno strumento che scompone mediante l’analisi di Fourier le onde complesse del parlato in onde semplici. Il primo risale al 1946
cos’è uno spettrogramma
rappresentazione della variazione dello spettro acustico istante per istante. Il tempo in ordinata segna ora frequenza, l’annerimento del tratto segna l’intensità
quanti e quali tipi di spettrogrammi ci sono?
- passabanda stretti: mi mostra cosa succede a livello della glottide, le armoniche del segnale dipendono dalle pliche vocali.
- passabanda ampli: in base alla frequenza con cui faccio i campionamenti. Non vedo armoniche o formanti ma solo quello che succede nel vocal tract
cos’è uno spettrografo
strumento che scompone mediante l’analisi di Fourier le onde complesse del parlato in onde semplici, il primo viene distribuito in commercio nel 1946
cos’è lo spettrogramma
è una rappresentazione della variazione dello spettro acustico istante per istante. Le singole frequenze vengono isolate attraverso dei filtri
tipi di spettrogramma
- a passabanda stretti: mostrano ciò che succede a livello della glottide
- a passabanda ampli: in base alla frequenza con cui faccio il campionamento non mi mostra le armoniche ma le formanti
banda stretta
mette in evidenza la struttura armonica del segnale. Le armoniche sono multipli interi della F0 di un suono e dipendono dalle caratteristiche del suono prodotto dal movimento delle pliche vocali. ci sono una serie di strutture orizzontali.
banda larga
non sono più visibili le singole armoniche ma si evidenziano le formanti, ovvero picchi di intensità che dipendono dal risonatore (conformazione della cavità)
vocoide centrale [ə]
le formanti (annerimenti) sono equidistanti tra loro, il loro valore dipende dalla lunghezza del canale
vocoide [i]
(chiuso, anteriore). restringimento all’altezza del palato dure e ampliamento ad altezza faringe.
F1 più bassa di [ə] perché vicino ad un anti-nodo
F2 più alta di [ə] perché restringimento è vicino a un nodo
vocoidi [e], [ε], [a]
(anteriori semichiusa, semiaperta e aperta)
dalla i alla a c’è un abbassamento del dorso della lingua e arretramento della radice.
la prima formante si alza progressivamente, la seconda si abbassa perché si abbassa il dorso della lingua e arretra la radice
Vocoidi [ɔ], [o], [u]
(posteriori, semiaperta/semichiusa/chiusa)
Da[a]a[u]:
1. sollevamento del post-dorso della lingua in direzione del velo. Si tratta di un punto equidistante dal nodo e dall’antinodo > l’effetto della costrizione non è rilevante
2. Protrusione delle labbra: riduzione in corrispondenza di un antinodo + allungamento del canale
Qual è la sequenza vocalica
[ieεaɔou]
con cosa correla F1
correla con il grado di apertura
del vocoide
valore massimo nel vocoide [a] , minimo nei vocoidi [i] e [u]
con cosa correla F2
correla con il grado di anteriorità
valore massimo nel fono [i], minimo nel fono [u]
cosa si intende per zone di esistenza vocalica
In realtà il parlante non produce sempre la stessa vocale: non è un punto ma un’area -> area/zona di esistenza vocalica: lo stesso parlante, in contesti differenti, non produce sempre la stessa frequenza.
Le altezze formantiche dei vocoidi variano in funzione del parlante e dell’enunciato
Si fa riferimento non a valori assoluti, ma a zone di esistenza vocalica!
le approssimanti
stanno dentro la tabella dei contoidi, ma non sono vere e proprie consonanti. Sono articolate un po’ più in alto rispetto al trapezio delle vocali.
Da [i] e [u] lieve sollevamento della lingua (che però non genera turbolenza) > [j] [w]
tracciato spettrografo delle approssimanti
simile a quello di una vocale per quanto riguarda la periodicità del segnale e le risonanze. Cambia l’intensità (smorzamento di 10 dB che porta alle volte a scomparire)
approssimanti laterali
[l] [ʎ], hanno le caratteristiche spettro-acustiche dei fono approssimanti ma con una diversa dislocazione delle formanti
[l] F2 1600 Hz
Costrizione a livello degli alveoli è equidistante da nodi e antinodi (cfr. F2 generata da canale uniforme [ə]) Variazione contestuali: 1800-1500 (cfr. fig. c)
[ʎ] F2 2000 Hz
Costrizione a livello di un nodo, F2 più alta rispetto a [ə]
fricative
è un fruscio: non c’è formante perché non c’è armonia nel segnale
Passaggiod’aria turbolento
Segnale irregolare
Ma diversa dislocazione del segnale sulla scala delle frequenze
maggiore è la lunghezza del contatto più la risonanza è bassa (= interessa le frequenze basse). Il secondo parametro da considerare è quanto spazio c’è tra la costrizione/il contatto e l’uscita: più è ampio/lungo questo spazio, più bassa è la risonanza.
affricate
con l’occlusione il segnale corrisponde a un silenzio (= fase di tenuta): vedrò uno spazio bianco seguito da una fricativa
occlusive
Fase di occlusione: assenza di segnale, spazio bianco
Fase di rilascio: violenta fuoriuscita dell’aria, che genera segnale intenso di breve durata.
Nelle sonore ho un annerimento a bassa frequenza, che è sempre la banda di sonorità
cos’è il VOT?
Voice Time Onset
è l’ntervallo di tempo tra lo scoppio dell’occlusiva e l’inizio delle vibrazioni
glottidali della vocale che segue.
se i valori sono positivi c’è un ritardo nell’inizio delle vibrazioni, se sono negativi c’è un anticipo
vibranti
Polivibrante: rapide aperture e rilasci in successione
Monovibrante: una apertura soltanto, lo scoppio dipende dalla lingua. In italiano per esempio è meno marcato che in spagnolo
nasali
somma di risonanza nasale ed orale, c’è un secondo risonatore perché abbasso il velo. hanno le formanti (perché sono sonoranti) ma vedo una formante molto chiara in basso (risonanza tra i 200 e i 300 hz) e riconosco le altre formanti, ma sono scolorite: è un fenomeno di anti-risonanza
cosa si intende per formanti
componenti del timbro di un suono che dipendono dalla conformazione della cavità epilaringea. Sono indipendentir rispetto alle armoniche
cosa si intende per armoniche
componenti dell’onda sonora periodica complessa prodotta dalla vibrazione delle pliche vocali. Dipendono dalle caratteristiche del suono a livello laringeo.