Cours 7 Flashcards
Synthèse auditive
Aptitude à former le tout d’un stimulus sonore à partir de ses parties présentées séparément.
Il semble que le cerveau a des réseaux différents pour les 3 catégories de sons:
- Son de l’environnement
- La parole
- La musique
Bregman: en utilisant principes de la Gestalt, l’organisation des évènements acoustiques:
- Dimension horizontale: intégration séquentielle, en fonction du temps (+ HG)
- Dimensions verticale: intégration spectrale, en fonction des fréquences (+ HD)
Donc, distance dans le temps et distance en fréquence (spectrale)
Heuristiques dans la synthèse auditive
Heuristiques de la Gestalt appliqués à la perception de l’objet auditif:
- Continuité
- Proximité temporelle
- Proximité tonale
- Familiarité
Il peut y avoir des synergies et des compétitions entre les différents principes lors de la synthèse auditive
Continuité et effet de restauration
Continuité illusoire des tons: provoquée lorsqu’une tonalité est interrompue pendant une courte période pendant laquelle une bande étroite de bruit est joué.
Pas de continuité si l’interromption est un trou (silence)
Proximité tonale
L’alternance entre deux fréquences conduit à la perception de:
- 2 flots sonores si les fréquences sont très différentes
- 1 seul flot sonore (galop) si les fréquences sont proches
Des éléments distincts sont perçus de façon groupée sir leur fréquence est similaire.
Notion de capture et relâchement de capture:
- Ajouter un distracteur pour déterminer si 2 notes sont ascendantes ou descendantes, rend la tâche d’identification difficile.
- Mais si l’on rajoute une série d’éléments similaires au distracteur, ça provoque un flux sonore ségrégué qui emprisonne le distracteur (relâchement de la capture et donc la tâche redevient plus facile)
Notion de prédominance des fréquences graves
Proximité temporelle
Des éléments distincts sont perçus de façon groupée s’ils sont rapprochés dans le temps, signalant le début ou la fin d’un objet auditif
Familiarité
Des éléments distincts sont perçus de façon groupée s’ils forment un objet familier (comme pour les figures ambiguës):
- Modulation descendante du traitement du stimulus auditif
Principe de similarité
Dans un flux sonore comprenant plusieurs évènements:
- Les sons qui se ressemblent fortement et qui sont rapprochés dans le temps sont considérés comme provenant de la même source.
- Exemple: similarité du timbre de la voix au fil du temps permet de suivre la conversation.
Le système de production du langage
Processus complexe. Trois parties:
- Le système sous-glottal (poumon, trachée)
- Le larynx au niveau duquel on a la glotte et les cordes vocales
- Le tractus vocal supra-laryngual (cavités nasale, orale et pharynx)
- La fréquence d’ouverture et de fermeture de la glotte correspond à la fréquence fondamentale: détermine la tonie (fréquences)
- La voix plus grave des hommes résulte de cordes vocales plus épaisses et plus longues
- La sonie (volume sonore) de la voix dépend de la pression sous-glottale et de la période durant laquelle les cordes vocales sont ouvertes. Plus la période est courte, plus la sonie est forte (intensité)
Les sons du langage
- Phonème: plus petit segment de la parole qui s’il est changé modifie la signification du mot
- La prononciation des voyelles résulte de la vibration des cordes vocales et d’une ouverture spécifique du tractus vocal
- La prononciation des consonnes implique une obstruction du tractus vocal et dépend de l’emplacement de l’articulation, la manière d’expulser l’air, le niveau de vibrations
Perception de la parole
- La parole est un signal réel, continu, d’énergie finie et non stationnaire
- Le spectrogramme montre que sa structure est variable dans le temps
- Caractérisée par les FORMANTS (similaires aux harmoniques = le max d’énergie spectrale de fréquences de résonance vocale distinctives)
- Les formants sont la signature de la prononciation des voyelles
- Les transitions de formants sont la signature des consonnes
Importante des harmoniques pour le timbe de la voix: illusion de la fondamentale manquante (si on met juste les fréquences sans la fondamentale on peut quand même reconnaître)
La catégorisation dans la perception de la parole
Percevoir la parole c’est percevoir des catégories.
- La multitude de signaux acoustiques auxquels nous sommes exposés ne conduit qu’à la perception d’un nombre limité de catégories. Cela permet d’optimiser ce qu’on entend (simplifier)
Le cerveau est capable de percevoir des distinctions très faibles (si on modifie un peu les formants)
Lorsqu’on enregistre avec une électrode dans le cerveau on voit que la réponse des neurones est davantage catégorielle que continue lorsqu’on écoute des sons différents
L’impact des connaissances antérieures
Il est impossible d’avoir une bonne perception de la parole sans connaissance et compréhension préalable (effet top-down)
Effet très fort: on peut reconnaitre même si on supprime la moitié des informations sensorielles d’un texte par exemple.
Hallucinations auditives lorsqu’on apprend une langue: en raison de l’influence de nos connaissances préalables
L’importance de la lecture labiale dans la perception de la parole
- La perception du langage est influencée par des informations provenant d’autres modalités sensorielles (vision par ex). Viennent faciliter la compréhension auditive. Surtout chez les adultes car connaissances.
- L’observation visuelle ou même tactile du mouvement des lèvres peut aider à réduire l’ambiguïté des sons du langage
- L’info visuelle aide à un niveau intermédiaire de bruit en même temps que la parole (si trop faible elle n’est pas nécessaire, si trop fort n’aide plus)
L’effet McGurk
Même si le son est toujours le même, le rajout d’un visuel qui semble dire autre chose va venir modifier la perception (le cerveau va faire un mélange des deux)
Illusion multimodale mettant en évidence les interactions entre la vision et l’audition.
Existe dans:
- différentes langues
- avec des enfants
- avec composantes auditives et visuelles provenant d’une femme et d’un homme
- en touchant le visage plutôt qu’en regardant
- effet sur la représentation auditive dans le cortex auditif: dans le temporal, qui est donc déjà suffisamment sophistiqué pour interpréter
Effet cocktail party
- Capacité à percevoir la parole dans un environnement bruyant
- Exemple de ségrégation figure-fond
Facteurs déterminants la capacité de ségrégation figure-fond de la parole:
- position spatial des sources sonores
- accès à la lecture labiale
- timbre du signal cible
- accent du signal cible
- rythme du signal cible
- attention (le + déterminant)