Cours 4 Flashcards

1
Q

Quelles sont deux façons de faire une analyse spectrale à partir d’une représentation dans le domaine du temps?

A
  • En se servant de batterie de filtres électroniques (analogues) -> Technique révolue (pu utilisée).
  • Par des calculs automatisés.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Nomme les calculs automatisés les plus communs. (3)

A
  • Transformée rapide de Fourier (FFT, “Fast Fourier Transform”) -> Signal complexe peut être analysé en terme de tons purs.
  • Régression linéaire - autocorrélation ou covariance (LPC) -> On l’utilisera moins.
  • Analyse par Wavelets (transformée en ondelettes).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Vrai ou faux : L’analyse de Fourier et par ondelettes sont très différentes.

A

Faux. L’analyse de Fourier et par ondelettes opèrent de façon similaire (en calculant le “produit de convolution”).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

En parole, quel calcul automatisé (un des trois mentionné plus haut) est utilisé?

A

En parole, on utilise la Transformée rapide de Fourier (FFT).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Les calculs automatisés s’appliquent sur des signaux numérisés (pu exactement le signal qu’on avait à la base, c’est un signal analogue). Ils possèdent leurs caractéristiques propres, mais tous reposent sur… (2)

A
  • Les propriétés des procédés de numérisation.
  • L’étendue du signal (amplitude x temps) sur laquelle on applique les calculs.
    -> Les calculs impliquent un réglage de paramètres relatifs à ces deux points.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Def. signal analogue

A

Variations continues du voltage “analogues” aux variations de pressions.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Def. signal numérique (signal enregistré par une procédure informatique, ex. ordi)

A
  • Variations discontinues du voltage.
  • Quand on fait l’enregistrement, l’ordi ne peut pas enregistrer en continu. Il prend des mesures à différents moments dans le temps.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Comment est-ce qu’on appelle la conversion du signal analogue en signal numérique?

A

Numérisation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quels sont 2 facteurs qu’on doit prendre en compte dans la numérisation?

A
  • Échantillonnage
  • Quantification
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Def. échantillonnage

A
  • Nombre de points par seconde (combien de mesures par seconde) en Hz.
  • Typiquement (avec les cartes de son standards) : 11 025 Hz, 22 050 Hz et 44 100 Hz.
  • Avec les cartes opérant sous Windows 10, on a par défaut un taux de 48 kHz.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Comment est-ce qu’on fait pour rendre l’échantillonnage plus précis?

A

Plus on a enregistré de points de mesure, plus c’est précis et plus la numérisation sera bonne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Def. quantification

A
  • Nombre de niveaux disponibles (échelle de mesure) -> On peut comparer ça avec la graduation d’une règle qu’on prendrait pour mesurer (mm= plus précis, m = moins précis).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Comment est-ce qu’on fait pour rendre la quantification plus précise?

A

Plus on a de niveaux dans notre échelle, plus c’est précis et plus la numérisation sera bonne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

La quantification dépend de quoi?

A

Elle dépend du no. de bits (chiffres binaires) utilisés pour compter les niveaux de voltage.
-> Voir diapos 8-9 pour les exemples.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Voir diapo 10 pour des exemples de numérisation des signaux avec un certain échantillonnage et une certaine quantification.

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Comment est-ce que l’échantillonnage et la quantification peuvent rendre la numérisation meilleure, c-à-d représenter le signal analogue de façon plus précise?

A

Plus le taux d’échantillonnage et le nombre de bits (quantification) sont grands, plus on représente de façon précise le signal analogue. Plus la numérisation sera bonne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Quel est un autre facteur qui influence la précision de l’analyse (de la numérisation)?

A

La fenêtre de prélèvement ou d’analyse, c-à-d l’étendue du signal (amplitude-temps) sur laquelle on applique le calcul.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Tout calcul visant à analyser la fréquence à partir d’une représentation amplitude-temps implique le choix de quoi?

A

Ça implique le choix d’une étendue de temps, une “fenêtre” contenant des points.
-> Voir diapos 12-13 pour le voir visuellement.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Lorsque le calcul automatisé segmente l’onde pour en calculer la fréquence, il crée des distorsions (des ondes complexes, transitoires, ayant d’autres fréquences). Quel est l’impact de cela?

A

Ces autres fréquences vont influencer le résultat du calcul.

20
Q

Pour que le calcul de la fréquence soit précis, est-ce que la fenêtre servant au calcul doit être courte ou longue?

A

Elle doit être longue, car ça diminue le poids des transitoires en bordure de fenêtre dans le calcul, c-à-d que les transitoires ont moins d’impact sur notre signal au final.

21
Q

Voir diapos 14-17 pour des exemples avec différentes largeurs de fenêtres.

A
22
Q

Vrai ou faux : On peut entendre des transitoires lorsqu’on coupe un signal.

A

Vrai. Le [p] au début et à la fin des enregistrements sont des transitoires.

23
Q

Théoriquement, une analyse spectrale FFT avec une fenêtre très longue permettra de déterminer de façon précise la fréquence, mais quel est l’inconvénient si la fenêtre est trop longue?

A

Ça fait en sorte que si le signal ne dure pas toute la durée de la fenêtre, il y aura une partie où l’amplitude sera de 0. Lorsque l’amplitude sera calculée par l’analyse spectrale FFT, le signal à amplitude “0” sera inclus dans le calcul. L’amplitude sera donc beaucoup moins grande que supposée (faible intensité).
-> Voir diapo 19 pour un exemple.

24
Q

Quel est l’inconvénient au fait d’effectuer une analyse avec une fenêtre qui est très courte?

A

Ça pourrait révéler l’effet des transitoires (plusieurs fréquences avec une forte “densité”).
-> Voir diapo 20 pour un exemple.

25
Q

a) Plus la fenêtre d’analyse est longue ( 1._____ il y a de points), 2._____ les transitoires associées à la fenêtre d’analyse influencent le calcul et plus j’ai de précision sur l’axe 3._____. Aussi, fenêtre d’analyse longue = effet d’un filtre passe-bande 4._____.
b) Plus la fenêtre d’analyse est courte ( 1._____ il y a de points), 2._____ les transitoires associées à la fenêtre d’analyse influencent le calcul et plus j’ai de précision sur l’axe 3._____. Aussi, fenêtre d’analyse courte = effet d’un filtre passe-bande 4._____.
1. Moins ou plus.
2. Moins ou plus.
3. Des fréquences ou du temps.
4. Étroit ou large.

A

a) 1. Plus
2. Moins
3. Des fréquences
4. Étroit

b) 1. Moins
2. Plus
3. Du temps
4. Large

-> Voir diapo 21 pour les notes en mauve!

26
Q

Quel est un autre facteur qui influence l’analyse?

A

La forme de la fenêtre.

27
Q

Dans quel cas est-ce qu’on crée des transitoires (on les entend)?
a) En tranchant de façon carrée dans le signal.
b) En tranchant de façon moins abrupte dans le signal.

A

a) En tranchant de façon carrée dans le signal.
-> On en entend aussi lorsqu’on tranche de façon moins abrupte dans le signal, mais c’est moins pire (ça crée moins d’artéfacts).
-> Voir diapo 22 pour les schémas.

28
Q

De même que la forme de l’onde peut réduire l’amplitude des transitoires entendues, qu’est-ce qu’elle permet de réduire aussi?

A

La forme de l’onde peut réduire l’effet des distorsions associées à la fenêtre d’analyse en proposant différentes formes de fenêtres.

29
Q

Quelle forme comporte le plus d’artéfacts :
a) Une forme carrée.
b) Une forme gaussienne.

A

a) Une forme carrée.
-> Voir diapo 23.

30
Q

Quelle forme comporte le moins d’artéfacts et qu’on utilisera donc toujours en parole :
a) Triangulaire
b) Hamming
c) Blackman

A

c) Blackman
-> Voir diapo 24.

31
Q

Voir diapo 25 pour à quoi ça ressemble dans Multi-speech.

A
32
Q

En général, une fois le calcul choisi (FFT ou LPC), on doit régler les propriétés/paramètres de la numérisation et de la fenêtre. Quels sont les paramètres qu’on peut modifier? (5)

A
  • Le taux d’échantillonnage (et la durée).
  • Le niveau de la quantification (prédéterminé).
  • La longueur de la fenêtre (effets de filtres).
  • La forme de la fenêtre (il y a des choix standards, dont Blackman).
  • Pour le LPC, on spécifie la pente des filtres (ordre).
33
Q

Qu’est-ce que sont les effets d’aliasing?

A

Ce sont des effets parasites causés par l’utilisation d’un mauvais taux d’échantillonnage dans notre signal.

34
Q

Quelle est une technique permettant d’éliminer les effets d’aliasing?

A

La fréquence de Nyquist.

35
Q

Quelles sont les fréquences d’intérêt pour la parole?

A

Environ de 50 Hz à 5 kHz.

36
Q

Quelles sont les fréquences d’intérêt pour la voix?

A

De 50 Hz à 10 kHz ou plus.

37
Q

Quand on choisit le taux d’échantillonnage à utiliser lors d’un enregistrement, on doit s’assurer de quoi?

A

On doit s’assurer d’avoir suffisamment de points par période pour bien représenter l’onde.

38
Q

Quelle est la façon de faire en sorte que le signal enregistré soit plus représentatif de notre signal original?

A

En prenant le plus de mesures possible dans notre enregistrement.
-> Voir diapo 28 pour la représentation.

39
Q

Def. problème de l’aliasing

A
  • La fréquence d’échantillonnage est inférieure à la fréquence présente dans l’onde, donc le signal qu’on enregistre n’est pas représentatif de l’onde qu’on a réellement (la fréquence est plus basse que celle de notre signal original).
  • On sous-échantillonne.
    -> Voir diapo 29 pour la représentation.
40
Q

Def. fréquence de Nyquist

A
  • La plus haute fréquence à être numérisée “correctement”.
  • Pour pouvoir être numérisée “correctement”, cette fréquence doit être égale à la moitié de la fréquence d’échantillonnage (mais + safe avec un rapport encore + petit).
    -> Ex. si la fréquence d’échantillonnage = 1000 Hz, la plus haute fréquence qu’on peut enregistrer “correctement” = 500 Hz.
41
Q

Pour éviter le problème d’aliasing ou en réduire l’effet, le taux d’échantillonnage doit être à combien p/r à la fréquence la plus haute?

A

Le taux d’échantillonnage doit être au moins le double de la fréquence la plus haute d’intérêt, pour avoir au moins 2 points par période (en pratique, préférable d’avoir un taux de 3 à 5 fois la fréquence d’intérêt la plus haute).
-> Voir diapo 30 pour un exemple.

42
Q

Voir diapos 31-35 pour un exemple d’analyse spectrale dans le temps.

A
43
Q

Comment est-ce qu’on peut s’imaginer passer d’une “section spectrale” à un spectrogramme?

A

C’est comme si on regardait une série de sections spectrales “de haut”.

44
Q

Quels sont les 2 axes de…
a) Un oscillogramme
b) Une section spectrale (coupe spectrale)
c) Un spectrogramme
-> Les 3 principaux types de représentation des signaux.

A

a) Amplitude (y) en fonction du temps (x).
b) Amplitude (y) en fonction de la fréquence (x).
c) Fréquence (y) en fonction du temps (x)

45
Q

La section spectrale représente quoi?

A

L’amplitude des différentes fréquences à un moment précis dans le temps.
-> Voir diapo 37 pour une représentation.

46
Q

Le spectrogramme représente quoi?

A

C’est une séquence de coupes spectrales (on peut voir l’amplitude des différentes fréquences à travers le temps).
-> Voir diapo 38 pour une représentation.

47
Q

Voir diapos 39-40 pour mieux comprendre comment le spectrogramme fonctionne.

A