Analyse des scènes auditives Flashcards
Prob du jour: À partir des vibrations de l’air parvenant aux tympans, comment on fait pour savoir Ds une salle pleine de monde
- Combien de personnes parlent en même temps?
- Combien d’instruments sont en train de jouer?
- Lesquels jouent plus fort ou sont plus proches?
Def synthèse auditive
Aptitude à former le tout d’un stimulus sonore à partir de ses parties présentées séparément
(ex.: phonèmes -> vont faire des mots, notes -> vont faire de la musique)
- Le tt est plus grand que la somme de ses parties (gestalt)
-Éléments sont regroupés, intégrés, fusionnés, pour former un mm objet sonore
-Comment fait-on pour ségréger des objets sonores dont les signaux acoustiques émis sont fusionnés? Ségrégation de d’autres composantes de lenv sonore afin de les affecter à des objets différents
Il semble que le cerveau ne traite pas de la même manière les 3 grands types de son dans notre environnement: il y a des circuits qui traitent diff les sons de lenv, de la parole humaine et de la musique( aide à segreger des sons de nature diff)
Synthèse auditive
Bregman (1990)
À conceptualisé la façon dont les sons s’organisent en éléments perceptifs chargés de sens en se basant notamment sur plusieurs principes énoncés par les psychologues de la Gestalt.
- Montre que le lien entre ce qui est présenté et ce qui est entendu n’est pas tjrs direct cerv doit composer avec tt le contexte ds lequel arrivent les stimuli
Bregman (1990): Son modèle identifie pour l’organisation des
évènements acoustiques:
Organisation est bidimensionnel
• Une dimension horizontale (intégration séquentielle) et
• Une dimension verticale (intégration simultanée ou spectrale)
La notion de distance (ou séparation) en vision se décline alors pour un objet auditif en:
• Distance dans le temps
• Distance en fréquence (distance spectrale)
- spectrogramme: Variation des sons en fréquence en fct du temps
Stream (ligne auditive)
Stream (ligne auditive): est à l’expérience psychologique auditive ce que lobjet est à la vision
* permet de regrouper des qltés acoustiques qui sont reliées
Synthèse auditive (heuristiques)
Heuristiques de la Gestalt appliqués
à la perception de l’objet visuel :
Heuristiques de la Gestalt appliqués
à la perception de l’objet auditif :
• Continuité
• Proximité temporelle
• Proximité tonale
• Familiarité
Font en sorte qu’on associe des notes ensemble
Mutation d’interruption
sons courts sont continus et sons longs sont discontinus sur le plan physique.
Mais sur le plan perceptif ils semblent respectivement discontinus et continus. Se produit juste qd les 2 sons sont des voyelles identiques ou ont la mm structure spectrale
Continuité et effet de restauration
continuité illusoire des tons est l’illusion auditive provoquée lorsqu’une tonalité est interrompue pendant une courte période, pendant laquelle une bande étroite de bruit est jouée ex. En vision: on voit un triangle mm si caché par d’autres formes devant
- Son interrompu par un silence mais on perçoit une continuité qd ce silence est rempli par un bruit plus intense (c comme un rétablissement/restauration du son qd on met le bruit blanc, occlusion maximale)
-On continue à entendre la mélodie derrière mm avec l’occlusion (bruit blanc, ttes les freqs sont ds le son)
-on vient enlever un segment de l’info sensorielle (mais on a l’impression qu’on ajoute juste qqch par dessus) (occlusion auditive)
Ajouter du bruit améliore la compréhension!!!
Proximité tonale
Similarité entre la freq de 2 sons les fait paraître ensemble
(éléments distincts sont perçus de façon groupée si leur fréquence est similaire)
Ex: l’alternance entre deux fréquences conduit à la perception de:
• 2 flots sonores si les fréquences sont très différentes (Ségrégation de ces sons car trop éloignées une de l’autre)
• 1 seul flot sonore (ressemblant à un galop) si les fréquences sont proches
- C naturel, freq qui vont se ressembler sont à peu près ds le mm range (donc on entend 1 voix)
Si 2 voix (1 grave et 1 aigu) parlent en mm temps on entend 2 voix
Capture et relâchement de capture auditive
Dans cet exemple, il s’agit de juger si les notes X et Y sont ascendantes ou descendantes. (C assez difficile mais possible)
- Le fait d’ajouter un distracteur D rend difficile la réalisation de la tâche. (C la capture: on ajoute 1 note de plus basse fred avant et 1 après (et ds l’audition les notes de basses freq ont bcp + de pouvoir sur le cerv) donc L’attention sera + déployé pour les basses freqs et non pour les hautes (x et y)
Cependant, si l’on rajoute une série d’éléments similaires au distracteur D, cela provoque la création d’un flux sonore ségrégué emprisonnant le distracteur. Ainsi, un « relâchement de la capture » se produit et il est alors de
nouveau plus facile d’effectuer la tâche. Fait que cerv analyse 2 flow, et on sera capable de faire la tache (car analyser de façon indépendante)
Manipuler la capacité du cerv avec la proximité tonale de faciliter une ségrégation perceptive
Proximité temporelle
éléments distincts sont perçus de façon groupée s’ils sont rapprochés dans le temp signalant le début ou la fin d’un objet auditif
-Sons qui sont rapprochés ensemble on les voit comme ensemble
Sons séparées sont vu comme distincts
Familiarité
Des éléments distincts sont perçus de façon groupée s’ils forment un objet familier
(Modulation descendante du traitement du stimulus auditif)= effet des connaissances sur notre perception
-On groupe les notes d’une mélodie ensemble qd on la connaît
-Vu qu’on connaît la mélodie, mm si on les joint les 2 chansons ensemble on verra les 2 séparés mm si sont joués en mm temps
-Faut connaître les mélodies à ou b ou les 2 pour les discriminer qd sont mis ensemble
Principe de similarité
Dans un flux sonore comprenant plusieurs évènements: Les sons qui se ressemblent fortement (même timbre) et qui sont rapprochés dans le temps sont considérés comme provenant de la même source.
Perception de la parole
Régions qu’on pensent responsable de la parole (+ spécifiquement du langage), aires réservées à la production et à la compréhension du langage
- production son: + en avant
-interpréter et percevoir: + en arrière
-Chose unique au hum: le langage et bcp du cerv s’en occupe
Le langage c pas auditif mais c une composante principale
Broca= affecte capacité produire parole, partie inférieur du lobe frontal
Wernicke= diff de comprehension du langage, partie sup du lobe temporal
perception de la parole et formants
Parole humaine est probablement le stimulus le + complexe mais cerv réussit pareil à décoder la parole humaine
- stimulus complexe
-parole est un signal réel, continu, d’énergie finie et non stationnaire
• Le spectrogramme montre que sa structure est variable dans le temps
•Caractérisée par les formants (similaires aux harmoniques; = le max d’énergie spectrale de fréquences de résonance
vocale distinctives).
•Les formants sont la signature de la prononciation des voyelles (Cordes vocales)
•Les transitions de formants sont la signature des consonnes.
On voit souvent les 3 ou 4 ou 5 formants pour décrire un phonème
Perception de la parole et les harmoniques
Importance des harmoniques pour le timbre de la voix ex. A
-On a besoin de bcp d harmonique pour être bien perçu
Machines pour apprendre à parler
- linguistes s’intéresse bcp à tout ça car on peut se rapprocher de la création de machines qui nous aideraient à parler et apprendre une autre langue
Francophone qui apprend le japonais
- on sait exactement les formants d’un japonais qui dit sushis
- donc qd nos on l’apprend le logiciel regarde nos formants pour voir si on le dit bien
perception de la parole c d’abord…
et avant tout percevoir des categories. Ex de la catégorisation perceptive de stimuli sonores similaires
- Qd on përcoit il faut que le décodage de l’info sensorielle soit simplifié et amplifier (pour que le cerv sache ce qu’il est imp à decoder)
- multitude de signaux acoustiques auxquels nous sommes exposés ne conduit qu’à la perception d’un nombre limité de catégories. Cela a pour effet de simplifier (optimiser) ce que nous entendons.
Cerv fait choix basé sur des aprioris et catégorise l’info (donc on a pu besoin d’analyser les infos subtiles qui prennent du temps à traiter car sont ds une catégorie)