S9 - Analyse des scènes auditives Flashcards
Qu’est-ce que la synthèse auditive?
Aptitude à former le tout d’un stimulus sonore à partir de ses parties présentées séparément
(ex: phonèmes - mots; notes - musique)
Bregman (1990) a conceptualisé la façon dont les sons s’organisent en éléments perceptifs chargés de sens en se basant sur plusieurs principes énoncés par les psychologues _______
de la Gestalt
Le modèle de Bregman identifie pour l’organisation des événements acoustiques:
- une dimension ___________ (intégration séquentielle (temporelle)) - HG
- une dimension ___________ (intégration simultanée ou spectrale) - HD
- horizontale
- verticale
Dans le modèle de Bregman de l’organisation des événements acoustiques, la dimension horizontale (intégration séquentielle/temporelle) se passe dans quel hémisphère?
gauche
Dans le modèle de Bregman de l’organisation des événements acoustiques, la dimension verticale (intégration simultanée ou spectrale) se passe dans quel hémisphère?
droit
La notion de distance en vision se décline pour un objet auditif en
- distance ________
- distance ________
- distance dans le temps
- distance en fréquences (spectrale)
Quels sont les heuristiques de la Gestalt appliqués à la perception de l’objet auditif?
- continuité
- proximité temporelle
- proximité tonale
- familiarité
Explique l’effet de continuité et de restauration
La continuité illusoire des tons est l’illusion provoquée lorsqu’une tonalité est interrompue pendant une courte période, pendant laquelle une bande étroite de bruit est jouée.
- bruit blanc (contenant toutes les fréquences) = cerveau arrive à suivre
- silence = cerveau n’arrive pas à suivre
Explique l’effet de la proximité tonale
Des éléments distincts sont perçus de façon groupée si leur fréquence est similaire
- si les fréquences sont très différentes, on perçoit 2 flots sonores
- si les fréquences sont proches, on perçoit 1 seul flot sonore (ressemblant à un galop)
Explique l’exemple de la capture et relâchement de capture auditive
- Dans l’exemple, il s’agit de juger si les notes X et Y sont ascendantes ou descendantes.
- Le fait d’ajouter un distracteur (D) rend difficile la réalisation de la tâche
- Cependant, si l’on rajoute une série d’éléments similaires au distrateur (D), cela provoque la création d’un flux sonore ségrégué emprisonnant le distracteur. Ainsi, un “relâchement de la capture” se produit et il est alors de nouveau plus facile d’effectuer la tâche
Explique l’effet de la proximité temporelle
Des éléments distincts sont perçus de façon groupée s’ils sont rapprochés dans le temps, signalant le début ou la fin d’un objet auditif.
Explique le principe de la familiarité
Des éléments distincts sont perçus de façon groupée s’ils forment un objet familier (modulation descendante du traitement du stimulus auditif)
(apprentissage - devient familier après l’avoir entendu plusieurs fois)
- capable de faire une ségrégation perceptive (à clarifier ???)
Explique le principe de similarité
Dans un flux sonore comprenant plusieurs événements: les sons qui se ressemblent fortement et qui sont rapprochés dans le temps sont considérés comme provenant de la même source.
- exemple basé sur la similarité du timbre de la voix au fil du temps
- timbre: indépendamment des fréquences d’intensité ?
Quelles sont les trois parties du système de production du langage?
1) système sous-glottal (poumon, trachée)
2) le larynx, au niveau duquel se trouve la glotte et les cordes vocales
3) le tractus vocal supra-laryngual (cavité nasale, cavité orale et pharynx)
La fréquence d’ouverture et de fermeture de la glotte (cordes vocales) correspond à la _______________ et détermine la _______
fréquence fondamentale; tonie
Quelle est la fréquence fondamentale de la voix (approximativement) pour les hommes? les femmes? les enfants?
hommes: environ 120 Hz
femmes: environ 250 Hz
enfants: jusqu’à 400 Hz
La voix plus grave des hommes résulte de quoi?
cordes vocales plus épaisses et plus longues
La sonie (volume sonore) de la voix dépend de quoi?
la pression sous-glottale et de la période durant laquelle les cordes vocales sont ouvertes. Plus cette période est courte, plus la sonie est forte.
Qu’est-ce qu’un phonène?
unité de la parole
plus petit segment de la parole qui, s’il est changé, modifie la signification du mot.
La prononciation des voyelles résulte de…
la vibration des cordes vocales et d’une ouverture spécifique du tractus vocal
La prononciation des consonnes implique ________________ et dépend de:
- l’emplacement de l’articulation (labial (b), dental (d), labio-dental (v))
- la manière d’expulser l’aire (douce - fricative (f), abrupte - occlusives (b, t)
- le niveau de vibrations (voisement des cordes vocales (z = voisées, s = non voisée)
une obstruction du tractus vocal
La prononciation des consonnes implique une obstruction du tractus vocal et dépend de… (3)
- l’emplacement de l’articulation (labial (b), dental (d), labio-dental (v))
- la manière d’expulser l’aire (douce - fricative (f), abrupte - occlusives (b, t)
- le niveau de vibrations (voisement des cordes vocales (z = voisées, s = non voisée)
La _____ est un signal réel, continu, d’énergie finie et non stationnaire
parole
Le ___________ montre que la structure du langage est variable dans le temps
spectrogramme
Par quoi la parole est-elle caractérisée?
les formants (similaires aux harmoniques; = le max d’énergie spectrale de fréquences de résonance vocale distinctives)
- Les _______ sont la signature de la prononciation des voyelles
- Les _________________ sont la signature des conconnes
voyelles = formants
consonnes = transitions de formants
Vrai ou faux: la parole est un stimulus complexe
Vrai
Vrai ou faux: le langage a un impact sur la perception
Vrai
surtout pour les couleurs (ex: certaines cultures ont différents mots pour les teintes de blanc, mais pas nous)
La perception de la parole, c’est d’abord et avant tout percevoir des ___________
catégories (bcp plus efficace d’analyser en terme de catégories)
La multitude de signaux acoustiques auxquels nous sommes exposés ne conduit qu’à la perception d’un nombre limité de catégories. Cela a pour effet de…
simplifier (optimiser) ce que nous entendons
La perception de la parole: quels sont des problèmes posés par ce type de stimulus complexe?
- comment découper un signal sonore continu en mots? (ex acquisition d’une langue - on apprend à fragmenter les phonèmes)
- comment reconnaître la parole parmi toutes les variations naturelles (genre, timbre, interférences, etc.)?
Vrai ou faux: la perception du langage est influencée par des informations provenant d’autres modalités sensorielles comme la vision
Vrai (l’importance de la lecture labiale)
Vrai ou faux: L’observation visuelle ou même tactile du mouvement des lèvres peut par exemple aider à réduire l’ambiguïté des sons du langage.
Vrai
Quand lisons-nous surtout sur les lèvres?
a) quand le bruit ambiant n’est pas très fort
b) quand le bruit ambiant est intermédiaire
c) quand le bruit ambiant est très fort
b) Quand le bruit ambiant est intermédiaire
Pourquoi les adultes tirent-ils plus avantage de la lecture labiale que les enfants?
Car ils sont plus habitués de lire sur les visages
Perception de la parole: Qu’est-ce que l’effet McGurk?
Illusion multimodale mettant en évidence les interactions entre la vision et l’audition.
C’est un effet qui résiste à de nombreuses manipulations expérimentales:
- différentes langues
- avec des enfants (même très jeunes, ex. 6 mois)
- avec des composantes auditives et visuelles provenant d’une femme et d’un homme
- lorsque les observateurs touchent le visage plutôt que de le regarder
- effet sur la représentation auditive dans le cortex auditif (on a tendance à croire que c’est sophistiqué, mais se passe dans cortex auditif)
Quand on a les yeux fermés, on entend “ba”, mais quand on ouvre les yeux et on regarde la bouche de la personne qui parle, on entend “da”
L’effet McGurk démontre qu’il y a de l’info ______ et ______ qui est traitée dans le cortex auditif
sémantique et phonologique
Qu’est-ce que l’effet cocktail party?
- capacité de percevoir la parole dans un environnement bruyant
- exemple de ségrégation figure (voix de l’interlocuteur, signal cible) / fond (bruits ambiants, signaux compétiteurs)
- aide à résoudre une tâche de 2 façons:
1) augmente signal de l’objet d’intérêt - amplification
2) on ne porte pas attention aux autres stimuli / on limite les distracteurs
Quels sont les facteurs déterminants la capacité de ségrégation figure-fond de la parole?
- position spatiale des sources sonores (signal cible et signaux compétiteurs)
- accès à la lecture labiale
- timbre du signal cible
- accent du signal cible
- rythme du signal cible
- attention (auditive et visuelle) - facteur le plus déterminant!! (ex: contrôleurs aériens)
Quelles sont les compositions élémentaires de la musique?
- volume
- hauteur tonale
- contour
- durée (rythme)
- tempo
- timbre
- position spatiale
- réverbération
Le cerveau organise les composantes élémentaires de la musique/ces éléments perceptifs en représentations plus élaborée telles que…? (3)
- la mesure
- l’harmonie
- la mélodie
Perception de la musique: Qu’est-ce que la mesure?
manière dont les tons sont regroupés dans le temps
Perception de la musique: Qu’est-ce que la mélodie?
thème principal d’un morceau, partie sur laquelle on chante et qui frappe le plus l’esprit
Perception de la musique: Qu’est-ce que l’harmonie?
relation entre la hauteur de différents tons, ainsi que le contexte tonal qu’instaurent ces hauteurs susceptibles de générer une attente chez l’auditeur
Qu’est-ce que des notes isochrones?
notes espacées de façon égale dans le temps
L’architecture acoustique d’une salle de concert: Qu’est-ce que l’effet de préséance?
Une stratégie pour réduire la confusion de la direction d’un son (indirect) due à la réverbération
Quel est le délai optimal pour la réverbération?
80-100 ms. si délai plus grand, il y a échos (pire ennemi des salles de concert)
Qu’est-ce que l’amusie?
trouble de l’expression ou de la compréhension discriminante des signaux musicaux (diff à dire quand c’est + aigu ou + grave. diff à discriminer certaines hauteurs tonales)
L’amusie peut affecter les composantes _______ ou les composantes _________ de la musique
rythmiques; mélodiques (surtout!)
Vrai ou faux: certaines lésions cérébrales peuvent conduire à des cas d’amusie sans que la compréhension du langage n’en soit affectée
Vrai
Amusie: L’effet de la lésion semble dépendre du niveau de _____________ du sujet. Plus celle-ci est élevée, plus la perception musicale se fait de manière analytique, donc plus elle dépend d’une grande intégrité de l’hémisphère gauche
connaissance musicale
Qu’est-ce que démontre le modèle d’Isabelle Peretz par rapport à la perception de la musique?
Que dans le cerveau, il y a une dissociation entre la parole et la musique, et que pour la musique, il y a une dissociation entre l’organisation mélodique et l’organisation temporelle.
Quel hémisphère est davantage responsable de l’analyse de variations tonales de fréquences spectrales?
Droit
Quel hémisphère est davantage responsable de l’analyse temporelle/séquentielle/analytique?
Gauche
Qu’est-ce qu’un acouphène?
- sentiment de la présence d’un bruit en l’absence de toute stimulation auditive externe (hallucination)
- perception auditive en l’absence de signal acoustique dans l’environnement
Il y a deux catégories d’acouphènes. Quelles sont-elles?
1) Acouphènes objectifs
2) Acouphènes subjectifs (illusoires) (plus souvent ça)
Qu’est-ce qu’un acouphène objectif?
génération de bruit par l’organisme captée par la cochlée (il y a une cause physiologique)
Qu’est-ce qu’un acouphène subjectif?
perception d’un son en l’absence de toute stimulation sonore.
Environ ___% de la population québécoise a de l’acouphène à des degrés de variables de sévérité (__% avec acouphènes sévères)
10%; 1%
Vrai ou faux: le bruit perçu des acouphènes peut être continu ou intermittent, souvent plutôt aigu
Vrai
Qu’est-ce que l’hypoacousie?
Perte d’acuité auditive
Il y a plusieurs types d’hypoacousie. Quels sont-ils?
- hypoacousie de conduction: lésion de l’oreille externe ou moyenne
- de transduction (lésion des cellules ciliées cochléaires (endommagées par bruits de haute intensité)
- induite par le bruit
- causée par lésion du nerf auditif ou du tronc cérébral
Comment se nomme l’hypoacousie sélective aux hautes fréquences attribuables à l’âge? Par quoi est-elle causeé?
Presbyacousie
- changements morphologiques au niveau de la cochlée et du nerf auditif (altération des axones avec l’âge)
La perception auditive lors d’un épisode d’acouphène est associée à quoi?
une activation cérébrale similaire à celle observée lors de la perception d’un signal acoustique de l’environnement (mais c’est illusoire parce que l’activation n’est pas bilatérale)
L’intensité de l’acouphène est généralement inversement proportionnelles à deux choses. Quelles sont-elles?
1) niveau de bruit ambiant
2) niveau d’activité cognitive
Vrai ou faux: Ceci est possiblement une explication de l’acouphène:
La lésion des cellules ciliées sensibles aux hautes fréquences entraîne une déafférentation des cellules corticales qui, par leur activité spontanée, induisent une perception auditive. Les cellules ciliées inhibent normalement cette activité spontanée.
Vrai
Quelle est la différence entre le rythme et le tempo?
Rythme = organisation perceptive dans le temps
Tempo = vitesse à laquelle s’exécute une pièce dans le temps
Qu’est-ce qui permet de faire l’analyse, sur une courte période, mais de façon continue, de la contribution de différentes fréquences dans les sons du langage?
le spectrogramme
Comment peut-on reconnaitre les mots et comprendre le message qu’ils portent quand il n’y a parfois pas d’interruption dans les spectrogrammes qui correspondent à ces mots?
Ils semblerait que les sons du langage seraient distincts des autres sons par le fait que la perception qu’on en fait est catégorielle.
Le délai avant le début des vibrations est appelé _________
le temps d’attaque vocal
(ex: les vibrations surviennent tout de suite au moment où l’air est relâché lors de la prononciation du b, celles accompagnant la prononciation du p ne surviennent qu’après 50-60 ms)
Vrai ou faux: il y a une spécialisation hémisphérique du cerveau pour le langage
Vrai. À gauche.
Que cause une atteinte à l’aire de Wernicke, dans la partie supérieure du lobe temporal?
difficulté à comprendre le langage.
(Broca = difficulté à produire la parole)
Ainsi, on peut avoir un système auditif intact, c’est-à-dire ne présenter aucune difficulté à traiter des signaux auditifs non langagiers, mais présenter quand même des problèmes d’aphasie.
Quel effet montre l’influence exercée par des signaux visuels sur le traitement du langage?
McGurk
Comment s’appelle le phénomène selon lequel il est non seulement difficile de comprendre des mots, mais qui fait que l’on peut entendre qqch de différent?
Mondegreen
Qu’est-ce que la mutation d’interruption?
Attribuer, sur le plan perceptif, l’interruption au segment plus court qu’au long, comme c’est réellement le cas physiquement.
Dans quelle cas la différence temporelle interaurale est-elle plus efficace pour connaitre la direction d’où provient un son?
Cet indice est plus efficace pour localiser les sons de basses fréquences.
(si le son contient des basses fréquences, cet indice est + puissant que l’indice d’intensité)
L’indice de l’intensité, permettant de connaitre d’où proviennent les sons, est attribuable à quoi
au fait que la tête cause une ombre partielle. cette ombre, qui permet d’atténuer un peu l’intensité du son, est surtout efficace si celui-ci est de hautes fréquences.
Dans quels cas la différence d’intensité a-t-elle préséance sur la différence temporelle?
- si le son n’a pas de basses fréquences
- si le son se trouve à moins d’un mètre
Vrai ou faux: la différence d’intensité dans chaque oreille est beaucoup plus importante que la différence temporelle lorsque la source sonore est à proximité
Vrai
Dans des conditions expérimentales où la différence temporelle interaurale indique une provenance et que les indices basés sur la différence d’intensité ou le pavillon en indiquent une autre, ce sont les indices liés à la différence ____________ qui aura préséance.
différence temporelle interaurale.
à la condition que les sons comportent de basses fréquences. sans la présences de basses fréquences, cet indice n’a pas préséance.
La pression sonore diminue d’envirion ____ dB chaque fois que l’on double la distance enter soi et une source sonore
6 dB
Quel indice très important nous renseigne sur la distance qui nous sépare d’une source sonore?
le rapporte entre la quantité de sons qui arrivent à l’oreille directement à partir d’une source sonore et la quantité de sons qui arrivent à l’oreille après avoir frappé un obstacle.
ce rapport diminue avec l’augmentation de la distance entre la source et un observateur (prcq + on s’éloigne, + il y a de chances qu’il y ait des obstacles en chemin donc + de réverbération)
Les sons principalement composée de hautes fréquences semblent venir de _____ tandis que les sons composés surtout de basses fréquences semblent venir de plus ________
hauts = près
basses = loin
(les hautes fréquences sont plus facilement bloquées lorsque se trouvent des obstacles sur le chemin entre la source et l’oreille)
La voix humaine peut difficilement couvrir plus de ___ octaves
2
L’audition chez l’humain permet d’entendre des sons s’étendant sur ___ octaves
10 octaves (20 Hz à 20 kHz)
Vrai ou faux: l’appréciation musicale est intimement liée à l’émotion et au souvenir.
Vrai
Nous avons 6 voyelles écrites, mais ____ phonétiques
16
Les mots peuvent être divisés en fonctions des unités de sens qui les composent. Ces unités sont les _______
morphèmes
ex: accepter = 1 morphème
inacceptable = 3 morphèmes (in + accepter + able)
in et able = morphèmes liées
accepter = morphème libre