Cours 9: perception du langage oral Flashcards
Comment la parole est produite?
La parole est produite par l’air qui est expiré des poumons et qui est transformé en une onde sonore présentant des caractéristiques particulières qui sont déterminées par l’action (articulation) d’un ensemble de structures dans le tractus vocal.
La production de la parole repose sur trois composantes fondamentales : lesquelles?
Respiration
L’air expiré des poumons constitue la base nécessaire pour produire un son.
[système respiratoire impliqué (poumons, trachée, larynx)]
Phonation
Une fois l’air expulsé, il passe par les cordes vocales situées dans le larynx, ce qui produit une vibration sonore.
Cette vibration est essentielle pour générer des sons de base qui seront ensuite modulés.
[cordes vocales]
Articulation
L’articulation est assurée par un ensemble de structures dans le tractus vocal.
La langue, les lèvres, le palais et le pharynx modifient l’onde sonore pour créer des phonèmes distincts.
Ces ajustements permettent de former des mots intelligibles et facilitent la communication.
La parole étant une onde sonore, elle est perçue principalement via l’audition.
La modalité auditive est donc le canal principal de la perception du langage.
Toutefois, d’autres indices peuvent appuyer cette perception, notamment chez les personnes malentendantes. Nomme un de ces indices
(comme la lecture labiale)
Ainsi, la production et la perception du langage forment un continuum où l’air expiré est progressivement transformé en un message compréhensible.
La perception de la parole implique que l’onde sonore est captée par notre système auditif. Explique les deux caractéristiques importantes de l’onde sonore
l’amplitude et la fréquence.
Amplitude
Force des variations de la pression de l’air produite par le son.
Une onde sonore correspond à des variations rapides de la pression de l’air créées par un objet en vibration. Ces variations se déplacent dans l’air sous forme d’ondes jusqu’à atteindre l’oreille.
L’amplitude représente l’intensité de ces variations. Une onde avec une plus grande amplitude produira un son perçu comme plus fort.
Fréquence
Vitesse des variations de la pression de l’air. Celle-ci est mesurée en nombre de cycles par seconde (Hertz; Hz). 1Hz = 1 cycle/seconde.
Quel est le range de fréquences audibles?
Les fréquences audibles vont de 20 Hz à 20 000 Hz.
Explique la loi acoustique de Ohm
Loi acoustique de Ohm: L’oreille analyse les sons en les décomposant en composantes sinusoïdales, comme l’analyse de Fourier.
Cela signifie que lorsque nous entendons un son complexe (par ex. une voix ou un instrument), notre cerveau le décompose en fréquences élémentaires pour mieux l’analyser
L’image présente des ondes sinusoïdales pures, mais dans la réalité, les sons du quotidien sont composés de multiples fréquences superposées.
Comment percevons nous une basse vs haute fréquence?
Lien entre fréquence et perception de la hauteur sonore
Une fréquence plus basse (ex. 100 Hz) est perçue comme un son grave.
Une fréquence plus élevée (ex. 7000 Hz) est perçue comme un son aigu.
Avec l’âge et l’exposition au bruit (écouteurs, environnement bruyant), quelle capacité auditive change?
percevoir les hautes fréquences diminue.
Les jeunes adultes d’aujourd’hui ont souvent une audition plus dégradée qu’autrefois en raison du bruit ambiant moderne.
Que sont les acouphènes?
Les acouphènes sont des sons perçus sans stimulation externe, souvent décrits comme des sifflements aigus.
Cependant, les acouphènes ne sont pas toujours des sons aigus ; certaines personnes les perçoivent aussi sous forme de bourdonnements plus graves.
On ne peut pas entendre l’acouphène d’une autre personne, car il s’agit d’une perception subjective, mais on peut recréer un son similaire en ajustant une fréquence sonore.
Explique la segmentation de la parole
Une particularité de l’onde sonore qu’est la parole est qu’elle peut être segmentée en syllabes (e.g. per-cep-tion), qui elles-mêmes sont constituées de phonèmes (déf.: le plus petit segment de la parole qui, s’il est changé, altère le sens d’un mot).
Quelles sont les 3 catégories de phonèmes
Les catégories de phonèmes
Voyelles : Sons produits sans obstruction du flux d’air (ex. /a/, /e/, /i/).
Consonnes : Sons nécessitant une obstruction partielle ou complète du flux d’air (ex. /p/, /t/, /k/).
Semi-consonnes : Sons intermédiaires entre les voyelles et les consonnes, qui varient au cours de leur prononciation (ex. /j/ comme dans “yeux”, /w/ comme dans “oui”).
Quelle est la différence entre les langues?
Les langues ne possèdent pas toutes les mêmes phonèmes.Cette variation influence la perception auditive : un locuteur non natif peut avoir du mal à distinguer ou à produire des sons absents dans sa langue maternelle
Qu’est-ce qu’un phonème?
[comment ils diffèrent les uns des autres?]
[3 attributs]
Chaque phonème est constitué d’une combinaison unique d’attributs distinctifs caractérisant l’articulation impliquée pour produire ce son. Plus les attributs distinctifs de deux phonèmes sont similaires, plus ces deux phonèmes seront difficiles à discriminer.
Chaque phonème est défini par une combinaison unique d’attributs articulatoires qui déterminent la manière dont il est produit. Ces attributs incluent des paramètres comme :
Voisement (ex. /b/ vs. /p/)
Lieu d’articulation (ex. /t/ produit avec la langue contre les dents vs. /k/ produit à l’arrière du palais)
Mode d’articulation (ex. occlusives comme /p/ vs. fricatives comme /s/)
Qu’est-ce qu’une paire minimale?
Les paires minimales sont des mots qui se distinguent par un seul phonème (ex. “rat” vs. “chat”), ce qui les rend particulièrement sujets aux confusions.
Plus deux phonèmes partagent des attributs communs, plus ils seront difficiles à distinguer auditivement.
proximité articulatoire et les difficultés potentielles de perception.
une substitution d’un seul trait articulatoire peut modifier le sens d’un mot.
Comment les voyelles sont produites?
Les voyelles sont produites par une modification de la forme du tractus vocal qui en altère la fréquence de résonance, produisant ainsi des pics de fréquence sonore. Ces pics sont appelés les formants. Chaque voyelle est associée à une combinaison spécifique de formants.
La position de la langue et d’autres ajustements articulatoires modifient la répartition des formants.
Typiquement, trois formants principaux sont observables dans la parole, leur combinaison définissant la voyelle produite.
Les voyelles sont produites par une modification de la forme du tractus vocal, ce qui altère la fréquence de résonance et génère des pics de fréquence sonore appelés formants. Chaque voyelle possède une combinaison spécifique de formants, qui permet de la différencier des autres.
Quels sont les deux outils permettent d’analyser ces formants ?
Spectre de Fourier (image de gauche) :
Décompose un signal acoustique en ses différentes fréquences et leur amplitude.
Montre les formants comme des pics de fréquence, dont la position varie en fonction de la voyelle prononcée.
Exemple : la différence entre les voyelles /i/ et /u/ est visible par la variation de la position des formants.
Spectrogramme (image de droite) :
Représente l’évolution du spectre fréquentiel d’un son au fil du temps.
Permet d’observer comment les formants changent au cours de l’articulation d’un mot.
Exemple : pour le mot anglais “had”, les formants de la voyelle /æ/ sont visibles, ainsi que les transitions des consonnes environnantes (h et d).
Quelle est la relation entre la position de la langue et la fréquence des formants?
Les voyelles sont caractérisées par la fréquence de leurs formants, qui varient en fonction de la position de la langue dans la bouche. Deux formants principaux sont affectés par cette articulation :
F₁ (premier formant) :
Hauteur de la langue : Plus la langue est haute dans la bouche, plus F₁ est bas.
Ex. : La voyelle de boot (langue haute) a un
F₁ bas, tandis que bought (langue basse) a un F₁ élevé.
F₂ (deuxième formant) :
Position avant/arrière de la langue : Plus la langue est vers l’avant, plus F₂ est élevé.
Ex. : Beat (langue avancée) a un F₂ élevé, tandis que boot (langue reculée) a un F₂ bas.
La position de la langue influence directement les fréquences perçues par l’oreille.
Ces variations permettent de différencier les voyelles entre elles dans différentes langues.
D’autres facteurs articulatoires peuvent également jouer un rôle, notamment le rondissement des lèvres, qui modifie les formants.
Comment les consonnes sont prononcées?
Les consonnes, quant à elles, sont produites par une constriction ou une fermeture du tractus vocal. Au niveau de l’onde sonore de la parole, les consonnes sont associées aux transitions formantiques qui sont des variations des formants lors du passage entre un son consonantique et une voyelle.
Quelle est la différence entre des consonnes voisées vs non voisées?
Consonnes voisées : Les cordes vocales vibrent pendant toute la production de la consonne (ex. /b/, /d/, /g/). Les consonnes voisées (bah, dah, gah) montrent une continuité des vibrations des cordes vocales.
Consonnes non voisées : Les cordes vocales cessent de vibrer temporairement (ex. /p/, /t/, /k/). Les consonnes non voisées (pah, tah, kah) présentent un silence initial, marqué par une interruption des vibrations.
Qu’est-ce que le temps de voisement?
Temps de voisement (VOT - Voice Onset Time) : Délai entre la libération de la consonne et le début du voisement. Voisement = activation de la vibration des cordes vocales. Un VOT plus court correspond à une consonne voisée, tandis qu’un VOT plus long correspond à une consonne non voisée.
Quelle est l’importance des consonnes dans la perception du langage?
Les consonnes sont cruciales pour l’intelligibilité de la parole.
Certaines langues écrites omettent les voyelles et se basent uniquement sur les consonnes.
L’analyse des transitions formantiques permet de comprendre comment le cerveau distingue les différents sons du langage.
Le spectrogramme montre que l’onde sonore est…
un flux continu de variations de fréquence et d’intensité.
Explique la difficulté de la segmentation
Bien que nous puissions facilement segmenter la parole en phonèmes lorsque nous écoutons une langue familière, le stimulus sonore lui-même constitue un flot continu. Contrairement à l’écriture, la parole n’a pas de pauses claires entre les mots ou les phonèmes.Le spectrogramme montre que l’onde sonore est un flux continu de variations de fréquence et d’intensité.
Aucune marque explicite dans le signal acoustique n’indique où un phonème commence et où un autre se termine.
Certaines transitions formantiques peuvent couvrir plusieurs phonèmes, rendant leur distinction complexe.
Exemple : Dans la phrase “I owe you a yo-yo”, il n’y a pas de silence net entre les phonèmes, ce qui rend leur séparation difficile sur le plan acoustique.
Quel est le lien entre
segmentation et apprentissage des langues?
Pour une langue maternelle, le cerveau a appris à détecter les indices acoustiques permettant la segmentation automatique du flux de parole.
En revanche, une langue étrangère semble souvent indistincte et fluide, car nous ne possédons pas encore les repères nécessaires pour segmenter correctement les phonèmes. L’amélioration de la segmentation en langue étrangère nécessite une exposition prolongée et un entraînement perceptif.