cours 8 Flashcards
Qu’est-ce que la synthèse auditive?
1.Aptitude à former le tout d’un stimulus sonore à partir de ses parties présentées séparément (ex.: phonèmes -> mots, notes -> musique)
-tout est plus grand que somme des parties
2.Comment fait-on pour ségréger des objets sonores dont les signaux acoustiques émis sont fusionnés?
-Il semble que le cerveau ne traite pas de la même manière les 3 grands types de son dans notre environnement
3.3 types de sons : 1 pour enviro, 1 pour voix humaine, 1 pour musique (donc à 3 diff endroits et traiter de maniere diff, aide à ségréguer)
Expliquez le modèle de Bregmann (1990) pour la synthèse auditive.
1.Bregman (1990) a conceptualisé la façon dont les sons s’organisent en éléments perceptifs chargés de sens en se basant notamment sur plusieurs principes énoncés par les psychologues de la Gestalt.
2.Son modèle identifie pour l’organisation des évènements acoustiques:
-Une dimension HORIZONTALE (intégration séquentielle) et
Une dimension VERTICALE (intégration simultanée ou spectrale)
3.La notion de DISTANCE (ou séparation) en vision se décline alors pour un objet auditif en:
-Distance dans le TEMPS
-Distance en FRÉQUENCE (distance spectrale)
Cmt peut-on voir la synthèse auditive sur un spectrogramme?
1.Signature horizontale en terme de variation tempo et signature verticale en terme de variation spectrale
2.Plus c rouge, plus il y a présence de cette fréquence ds le son
**voir diapo 4
Quels sont les heuristiques de la Gestalt appliqués à la perception de l’objet auditif?
1.Continuité
2.Proximité temporelle
3.Proximité tonale
4.Familiarité
**Permettent de lier les notes ensemble et avoir synthèse auditive
Qu’est-ce que la continuité et l’effet de restauration?
1.Des éléments sont perçus de façon groupée s’ils sont continus dans le temps (~ ‘bonne continuité’ en vision).
2.On a une onde sonore, meme sil manque certains segments, le cerveau les remplit, pour créer un effet de continuité
3.Effet de restauration : on remplit les sons manquants (occlusions) par un bruit blanc (un pchi)
Qu’est-ce que la proximité tonale?
1.Dans cet exemple (diapo 7), l’alternance entre deux fréquences conduit à la perception de:
-2 flots sonores si les fréquences sont très différentes
-1 seul flot sonore (ressemblant à un GALOP) si les fréquences sont proches
2.Des éléments distincts sont perçus de façon groupée si leur fréquence est similaire
3.On a l’impression de 2 streams ou flots distincts lorsque fréquence est trop diff
Qu’est-ce que la capture et le relâchement de capture auditive?
- 3 temps à l’expérience (voir diapo 9):
A)Variation tonale tres petite entre X et Y, diff de discriminer
B)Capture : distracteurs (son basse fréquence ajouté avant ou après) viennent dominer perception, on perd discrimination x et y (on a tendance à faire une synthèse)
C Relachement de capture : On peut annuler l’effet de capture en ajoutant des sons de meme fréquences (distracteurs) qqs un avant et autres apres, ca permet ségrégation des X et Y
2.Donc :
-Capture = par les distracteurs (D)
-Relachement de capture = par l’addition de distracteurs (capteurs) (C)
3.Lorsqu’on rajoute une série d’éléments similaires au distracteur D, cela provoque la création d’un flux sonore ségrégué emprisonnant le distracteur. Ainsi, un «relâchement de la capture» se produit et il est alors de nouveau plus facile d’effectuer la tâche de ségrégation.
Qu’est-ce que la proximité temporelle?
1.Des éléments distincts sont perçus de façon groupée s’ils sont rapprochés dans le temps, signalant le début ou la fin d’un objet auditif
2.Il y a un flot temporel liant les éléments les uns aux autres
-Qd on ajoute rythme ca solidifie ce lien la
Qu’est-ce que la familiarité?
1.Des éléments distincts sont perçus de façon groupée s’ils forment un objet familier
(Modulation descendante du traitement du stimulus auditif)
2.Ds l’Exemple de la diapo 11, Les variations sont assez subtiles entre les diff mélodies, c tres diff de distinguer les 2 mélodies (si c juste 1-2 notes qui varient), mais si on connait la mélodie, c plus facile de distinguer (à variation égale)
3.Durant apprentissage langue seconde, c tres diff de ségréguer à l’int du discours les diff mots VS lorsque c’est une langue familière
Qu’est-ce que le principe de similarité?
1.Dans un flux sonore comprenant plusieurs évènements:
Les sons qui se ressemblent fortement et qui sont rapprochés dans le temps sont considérés comme provenant de la même source.
2.Similarité : signature spectrale, variation du son ex: timbre
3.Ds une convo simultanée avec plusieurs ind il y a trjs une distinction de timbre entre chq voix, on peut reconnaitre pers d’1 autre à l’aide du timbre
4.Ségrégation par le timbre sapplique à dautres stimuli que voix
Ds quel partie du cerveau se déroule la production du langage et la perception de la lecture?
1.Aspect prod langage = aires antérieures
2.Perception lect = aires postérieures
Expliquez les trois parties principales de production du langage.
1.Le système sous-glottal (poumon, trachée)
2.Le larynx au niveau duquel se trouve la glotte et les cordes vocales
-partie la plus impo pour prod du langage
3.Le tractus vocal supra-laryngual (cavité nasale, cavité orale et pharynx)
Cmt explique-t-on de manière anatomique la fréquence fondamentale, la tonie et la sonie?
1.La fréquence d’ouverture et de fermeture de la glotte (cordes vocales) correspond à la FRÉQUENCE FONDAMENTALE de la voix et détermine la TONIE.
2.La voix plus grave des hommes résulte de cordes vocales plus épaisses et plus longues (hommes ~120 Hz; femmes ~ 250 Hz; enfants jusqu’à 400 Hz).
3.La SONIE (volume sonore) de la voix dépend de la pression sous-glottale et de la période durant laquelle les cordes vocales sont ouvertes. Plus cette période est courte et plus la sonie est forte.
Est-il vrai que : Les autres especes animales nont pas de langage aussi complexe que les EH?
Oui, mais ils ont une forme de comm mais diff
Pk, car prod parole = extremement complexe, demande appareil avec centaine muscles, dizaine de structure
Quels sont les diff sons du langage et leurs caracs?
1.Le phonème est …
2.La prononciation des voyelles résulte de …
3.La prononciation des consonnes implique une ___ du ___ et dépend de:
1.Le phonème est le plus petit segment de la parole qui, s’il est changé modifie la signification du mot.
2.La prononciation des voyelles résulte de la vibration des cordes vocales et d’une ouverture spécifique du tractus vocal.
3.La prononciation des consonnes implique une obstruction du tractus vocal et dépend de:
-L’emplacement de l’articulation (labial /b/, dental /d/, labio-dental /v/)
-La manière d’expulser l’air (douce -> fricative /f/; abrupte -> occlusives /b/, /t/)
-Le niveau de vibrations (voisement des cordes vocales ( /z/ = voisées; /s/ = non voisée)
Qu’Est-ce que la parole?
1.La parole est un …
2.Le spectrogramme montre …
3.Caractérisée par les…
4.F1 du i …
- I vs U …
1.La parole est un signal réel, continu, d’énergie finie et non stationnaire
2.Le spectrogramme montre que sa structure est variable dans le temps
3.Caractérisée par les formants (similaires aux harmoniques; = le max d’énergie spectrale de fréquences de résonance vocale distinctives).
-Les formants sont la signature de la prononciation des voyelles
-Les transitions de formants sont la signature des consonnes.
4.F1 du i par exemple, c la fréquence la plus basse
-Les 3-4 premiers formants c les plus impo pour reconnaitre/distinction sons complexes
- I vs u ce nest pas dutt la meme signature spectrale:
-Il y a bcp plus énergie pour i que pour u, les cordes vocales sont bcp plus sollicités pour le i
Quelle est la diff entre voyelles et consonnes?
1.Voyelles:
-Toutes les voyelles sont ___ c’est-à dire qu’il s’agit de sons ___. Cette ___ est issue de …
-Les voyelles sont caractérisées par la présence de …
-La configuration des ___ étant différente pour chaque voyelle, chacune d’elle va être caractérisée par des …
2.Consonnes:
-Les consonnes peuvent être___ ou___:
-3 grandes classes sont distinguées:
1.Voyelles:
-Toutes les voyelles sont voisées c’est-à dire qu’il s’agit de sons périodiques. Cette périodicité est issue de la vibration des cordes vocales.
-Les voyelles sont caractérisées par la présence de zones d’harmoniques renforcées appelées “formants.
-La configuration des cavités bucco-pharyngales étant différente pour chaque voyelle, chacune d’elle va être caractérisée par des valeurs de formants différentes.
2.Consonnes:
-Les consonnes peuvent être périodiques ou apériodiques:
-3 grandes classes sont distinguées:
1) pour les occlusives, le conduit phonatoire est fermée durant une partie de l’émission de la consonnes
2) pour les fricatives (ou constrictives), le resserrement est important et donne lieu à un bruit turbulent
3) les consonnes vocaliques présentent un rétrécissement ponctuel et/ou peu important du conduit vocal.
Pk on est extremement habile à discriminer et percevoir la parole?
car c probablement objet sonore quon entend le plus ds notre vie, meme avant notre naissance
Expliquez l’importance des harmoniques pour le timbre de la voix en prenant l’ex du «a».
1.F1 : plus grave, puis plus on augmente plus c aigu
2.Individuellement les formants sont loin d’un a, mais lorsquon les met ensemble ca ressemble à un a
-En combinant les diff formants forme le a
3.On décompose le son en diff formants (Formant = fréquence qui est dominante ds le son ds ce temps donné )
Est-il vrai qu’on peut détecter la maladie de Parkinson lorsqu’on enregistre la voix?
Oui
Expliquez la perception catégorielle de la parole.
1.La perception de la parole c’est d’abord et avant tout percevoir des categories.
-pour avoir raccourcis et donc pas avoir à analyser toutes les info senso
2.La multitude de signaux acoustiques auxquels nous sommes exposés ne conduit qu’à la perception d’un nombre limité de catégories.
-Cela a pour effet de simplifier (optimiser) ce que nous entendons.
Expliquez l’étude qui a permis de prouver la perception catégorielle de la parole.
1.Image gauche : ba, da et ga se ressemblent bcp, c diff à se discriminer sur un spectrogramme
2.Si on manipule la transition du b au d, keskon va entendre ici? Eskon va entendre un mélange de ba et da, ou on va percevoir un seul des 2?
-On a beau physiquement induire un continu en terme de transition de formant entre ba et da, notre perception ne sera pas continu, elle sera catégorielle, on entend soit ba ou da, c un raccourci que cerveau va faire pour simplifier le stimulus complexe de la parole
3.il y a des cluster, il y a des pop neuronales du ba, da ,ga qui appuient l’hypothèse catégorielle (au niveau neurophysio)