Mini test 1 Flashcards

1
Q

Données quantitative

A

une donnée à laquelle nous pouvons associer un chiffre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Donnée qualitative

A

n’a pas de chiffre associé

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Données quantitatives continues

A

sont celles où, si notre instrument de mesure était plus précis, nous aurions pu ajouter des décimales à notre nombre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Données quantitatives discrètes

A

des entiers

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Type de graphique : quantitative

A

histogramme

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Type de graphique : qualitative

A

diagramme à bandes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Type de graphique : quantitative + quantitative

A

nuage de points

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Type de graphique :

quantitative + qualitative

A

diagramme à moustaches

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Type de graphique : qualitative + qualitative

A

tableau de contingence OU diagramme à bande avec couleur de remplissage

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Médiane

A

point au milieu de nos données une fois triées par ordre de grandeur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Moyenne

A

somme de toutes les données, diviser par le nombre de données

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Mode

A

la valeur la plus commune d’une variable

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Étendue

A

la valeur la plus élevée moins la valeur la plus faible

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Variance

A

moyennes des distances à la moyenne au carré

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Écart-type

A

racine-carrée de la variance

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Coefficient d’asymétrie

A

un coefficient positif est associé à une longue queue à droite, et qu’un coefficient négatif est associé à une longue queue à gauche

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Coefficient d’aplatissement

A

combien une distribution est pointue ou aplatie

18
Q

Un coefficient d’aplatissement > 3 possède plus de données … (plus pointue) qu’une distribution normale

A

au centre

19
Q

Quelles sont les transformations associées à une longue queue à droite ?

A

Logarithmique : chacune des observations d’une variable soit remplacée par le logarithme de cette observation
Transformation racine carrée
Exposant fractionnaire

20
Q

Quelles sont les transformations associées à une longue queue à gauche ?

A

Exposant supérieur à 1

Si log trop fort, on peut essayer racine carrée

21
Q

Comment sont les variables dans une matrice de données ?

A

Quantitatives

Un seul type de données

22
Q

Que contient la diagonale d’une matrice de la somme des carrés et des produits croisés ?

A

la variabilité de chacune des variables par rapport à sa moyenne respective, que l’on nomme la somme des carrés

23
Q

Que retrouve-t-on autour de la diagonale d’une matrice de la somme des carrés et des produits croisés ?

A

une idée de comment deux variables varient ensemble ou non, que l’on nomme la somme des produits croisés

24
Q

Vrai ou faux, une matrice de la sonne des carrés et des produits croisés a toujours autant de lignes que de colonnes

A

Vrai

25
Q

Que retrouve-t-on sur la diagonale d’une matrice de variance-covariance ?

A

la variance de chacune des variables et dans les autres cellules nous retrouvons la covariance entre deux variables

26
Q

À quoi sert une matrice de corrélation ?

A

à remettre toutes les relations à une même échelle

27
Q

Que contient à chacune des intersections une matrice de corrélation ?

A

la corrélation entre chacune des variables

28
Q

À quoi sert le concept de distance multivariée ?

A

• Savoir si deux observations se ressemblent en mesurant si elles sont loin l’une de l’autre

29
Q

À quoi est équivalent une distance euclidienne ?

A

Équivalente à l’hypoténuse d’un triangle rectangle (en p dimensions)

30
Q

À quoi est sensible une distance euclidienne ?

A

aux différences d’échelles entre nos variables

31
Q

Quand utilise-t-on la distance de Bray-Curtis ?

A

Si la matrice de données contient des abondances d’espèces, en particulier si cette dernière contient beaucoup de zéros

32
Q

Quelles sont les 3 étapes principales de la distance de Bray-Curtis ?

A

3 étapes principales : On regarde d’abord pour chaque espèce le minimum entre les deux sites, que l’on multiplie par 2, puis on en fait la somme. On divise ensuite Ce total par l’abondance totale de toutes les espèces aux deux sites. Et finalement on fait 1 moins cette valeur

33
Q

Quelles sont les matrices pour mesurer l’association entre les variables dans un tableau de données ?

A

La matrice de variance-covariance, qui est affectée par l’échelle des données
La matrice de corrélation, qui permet de remettre toutes les variables à la même échelle et éviter ces problèmes

34
Q

Quels sont les 3 calculs pour mesurer la distance entre les observations ?

A

La distance euclidienne pour les données continues (attention aux différences d’échelle)
La distance de Bray-Curtis pour les décomptes
La distance de Jaccard pour les présences-absences

35
Q

Que cherche à faire une analyse en composantes principales (acp) ?

A

Cherche à résumer la variation dans une matrice de données

36
Q

Quel est le rôle des variables dérivées de l’acp ?

A

Les variables dérivées sont extraites de façon que la première explique le plus de variabilité possible dans tout le jeu de données
La deuxième choisie pour expliquer la variabilité résiduelle, tout en demeurant orthogonale à la première

37
Q

Comment fonctionne une acp ?

A

Transforme un jeu de données de p variables en k nouvelles variables (où k = p) orthogonales (non-corrélées), appelées composantes principales.
Si une certaine association linéaire existe entre les variables, la variance sera concentrée dans les premières composantes.
À chaque observation (ligne) et à chaque variable (colonne) correspond une nouvelle coordonnée dans ce nouveau système d’axes.

38
Q

Quand faut-il choisir la matrice de covariance comme matrice d’association de l’acp ?

A

Les unités sont comparables entre les variables

Les différences de variance sont interprétables

39
Q

Quand faut-il choisir la matrice de corrélation comme matrice d’association de l’acp ?

A

Les unités sont différentes entre les variables

Nous voulons ignorer les différences de variance

40
Q

Qu’est-ce qu’une eigenvalue ?

A

Valeur propre
Quantité de la variance originale expliquée par chacune des nouvelles variables dérivées
Leur somme sera donc identique à la somme de la variance de la matrice originale

41
Q

Qu’est-ce qu’un egenvector ?

A

• Liste des coefficients qui vont montrer la contribution de chaque variable originale dans la construction des variables dérivées