examen final etude Flashcards

1
Q

Font référence à des qualités,
s’expriment en modalités (catégories, attributs)

A

Variables qualitatives

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Variables dont les catégories n’ont pas d’ordre particulier, ps de hiérarchie (ex: genre, couleur, cheveux)

A

Qualitatives nominales

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Variables où les catégories sont ordonnées de manière à refléter un certain gradient, un progression (ex: niveau d’estime de soi)

A

Qualitatives ordinales

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Cardinal, font référence à des quantités, s’expriment en valeur

A

Variables quantitatives

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Variables qui peut être subdivisées infiniment (ex: distance)

A

Variables quantitatives continues

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Variables qui ne peut pas être subdivisées au delà d’une certaine limite (ex: revenu)

A

Variables quantitatives discrètes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Nombre d’observation associées à une valeur ou catégorie (niveau ou modalité)

A

Fréquence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Dans une présentation des valeurs ordonnées, le nombre d’observation associées à une valeur/catégorie X ou à une valeur/catégorie précédente

A

Fréquence cumulée

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Fréquence (f) divisée par le nombre total d’observations (N)

A

Proportion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Proportion rapportée à un groupe de 100 observations

A

Pourcentage

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Définition de Rapport (ratio)

A

Relation entre deux quantités qu’on veut comparer
ex: 6 h pour 7 f = 6/7

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’est ce qu’un Taux

A

Processus dynamique, on observe un changement dans le temps

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Propriété d’une population (pas d’un individu)

A

Distribution

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Ce qui est typique de la population; ce qui se passe «en moyenne»
Valeurs autour desquelles la distribution est centrée

A

~tendance centrale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est ce que la moyenne?

A

Somme des observations divisée par le nombre d’observations

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est ce qu’une moyenne pondérée ?

A

Lorsque toutes les observations n’ont pas le même poids (ex: comme les notes de plusieurs examens qui valent pas toute la mm chose)
Permet de modifier la contribution relative des observations

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Qu’est ce que la médiane?

A

Sépare la distribution en 2 groupes égaux (50/50)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Vrai ou faux
La moyenne est moins affectée que la médiane par les valeurs extrêmes

A

Faux, la médiane est celle qui est moins affectée par les valeurs externes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Catégorie ou valeur ayant la fréquence la plus élevée
Approprié pour les variables nominales et ordinales

A

Le mode
(celui qui a le plus, mettons dans un cours 66% des élèves parlent français, c’est celui qui est le plus ressorti)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Que sont les mesures de dispersion?

A

Étendue
Écart moyen
Variance
Écart-type
Coefficient de variation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Différence entre les valeurs minimale et maximale de la distribution

A

Étendue
(Max-Min)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Description de écart moyen?

A

Décrit comment chacune observation est éloignée de la moyenne
Sans valeurs absolues, la somme des écarts à la moyenne= 0
Pour des raisons mathématiques, les valeurs absolues ne sont pas idéales

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Écarts à la moyenne au carrés

A

Variance s2 ou o2
Produit des mesures difficiles à interpréter car très élevé

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Racine au carré de la variance

A

Écart type
(jsp pourquoi c’est décrit comme cette merde, genre littéralement la variance est au carrée pis la tu veux je fasse une racine pour enlever le carré)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Variabilité par rapport à la moyenne

A

Coefficient de variation
Plus le CV est petit, plus les valeurs de la distribution tendent à être proche de la moyenne

26
Q

On décrit l’écart d’une distribution selon 2 dimensions lesquelles?

A

L’asymétrie et l’aplatissement

27
Q

L’asymétrie décrit un décalage vers la gauche ou vers la droite de la courbe, qu’est ce que ça représente lorsqu’elle va vers la droite —>et vers la gauche <—

A

—>: Négative (moy < med)
<—: Positive (moy>med)

28
Q

Qu’est ce que l’aplatissement ?

A

Décrit la concentration des fréquence autour de la moyenne

29
Q

Qu’est ce qu’une mesure de position

A

Situer une valeur relativement à l’ensemble de la distribution

30
Q

100 groupes composés chacun de 1% des observations

A

Centiles

31
Q

4 Groupes composés chacun de 25%

A

Quartiles

32
Q

10 Groupes composés chacun de 10%

A

Déciles

33
Q

5 Groupes composés chacun de 20%

A

Quintiles

34
Q

3 Groupes composés chacun de 33,33%

A

Terciles

35
Q

Représentation graphique d’une distribution qui intègre différentes mesures

A

Boîtes à moustaches ( ou diagramme en boîte)

36
Q

Qu’est ce que le score Z

A
  • Exprime un écart à la moyenne qu’on met en relation avec la variabilité (dispersion) dans la population.
  • exprime l’écart à ma moyenne en unîtes d’écart-type
  • Permettent de relativiser les valeurs de distributions différentes
    Utilises par exemple pour comparer des étudiants dont la performance est mesurée dans des contextes différents
37
Q

Sous ensemble de la population composé d’individus qui ont été choisis au hasard

A

Échantillon

38
Q

Vrai ou faux
Avec des échantillons différents pour une meme population, on pourrait avoir des statistiques différentes

A

Vrai

39
Q

Vrai ou faux
Dans un échantillon probabiliste on s’appuie sur des lois de probabilité pour estimer la variabilité théorique des statistiques issues de notre échantillon.

A

Vrai

40
Q

Qu’est ce que l’erreur-type?

A

Ecart-type de la moyenne d’échantillonnage

41
Q

Vrai ou faux
Ma courbe normal décrit ma distribution des fréquences

A

Vrai

42
Q

La courbe normal permet de prévoir les ________ de plusieurs phénomènes aléatoires. Elle sert de base à _________ _________ dans un grand nombre de contextes et possède certaines caractéristiques importantes.

A

probabilités
l’inference statistique

43
Q

Qu’est ce qu’est l’intervalle de confiance?

A

Mesure de précision de l’estimation obtenue à partir d’un échantillon (estimation d’une moyenne ou d’une proportion).
Vise à identifier les bornes qui représentent les valeurs probables de la moyenne de la population autour de la moyenne estimée par échantillon.

44
Q

Vrai ou faux
Le score Z pour le calcul d’un IC dépend du niveau de certitude souhaité

A

Vrai

45
Q

Vrai ou faux
On ne peut pas faire de formule pour les proportions avec l’écart-type

A

Vrai

46
Q

Qu’est ce qu’un test d’hypothèse

A

Permet l’inférence en évaluant si une condition est vrai ou non

47
Q

Qu’est ce qu’une hypothèse nulle?

A

Suppose l’absence d’effet d’un facteur, elle est noté H0

48
Q

Qu’est ce qu’une hypothèse alternative?

A

Présume l’effet d’un facteur (différence/association), elle est notée H1

49
Q

Qu’est ce que le risque d’erreur

A

Probabilité de prendre une décision incorrecte lors d’un test statistique

50
Q

Qu’est ce que l’erreur de type I?

A

Probabilité de rejeter H0 alors qu’elle est vrai en réalité (notée weird a). Liée au hasard (variabilité inhérente à l’échantillonnage) et au seuil weird a que l’on compare à la valeur p du test

51
Q

Qu’est ce que l’erreur de type II?

A

Probabilité d’accepter H0 alors qu’elle est fausse en réalité (notée weird B), liées à la puissance statistique de l’étude

52
Q

Qu’est ce que le seuil de signification?

A

Valeur critique utilisée pour décider si une hypothèse statistique doit rejetée ou non

53
Q

Qu’est ce que le test Z?

A

Test d’hypothèse qui utilise la valeur Z pour associer une probabilité à une condition décrite par H0. Permet de comparer la moyenne observée à une moyenne connue/theorique (n doit être supérieur à 30)

54
Q

Qu’est ce que le test T?

A

Test d’hypothèse qui utilise la valeur t pour associer une probabilité à une condition décrite par H0. Il permet de
- comparer une moyenne observer à une moyenne connue/theorique (utilisée lorsque n<30)
-Comparer deux groupes indépendants (test t pour échantillon indépendants)
-Comparer un seul groupe à deux temps de mesure (test t pour échantillon appariés)

55
Q

Qu’est ce que l’ANOVA?

A

Test d’hypothèse qui utilise la valeur F pour associer une probabilité à une condition décrite par H0. Il permet de comparer plus de 2 groupes

56
Q

Qu’est ce que le test de corrélation (ou juste correlation)?

A

Test d’hypothèse qui permet de décrire l’association entre deux variables cardinales:
- le coefficient de corrélation de Pearson (notée r) permet d’évaluer la force et la direction de l’association
- le coefficient de détermination (notée r2) indique la proportion de la variance d’une variable qui est expliquée par l’autre variable

57
Q

Qu’est ce que le KHI-deux?

A

Test d’hypothèse qui utilise la valeur weird X2 et permet de décrire l’association entre deux variables categorielles (ordinales ou nominales)

58
Q

Qu’est ce que la régression?

A

Permet d’évaluer une association entre une VI et une VD en contrôlant l’effet d’autres VI-> contrôle, ajustement: permet d’éliminer l’effet d’une autre variable (confusion) sur l’association observée

59
Q

Qu’est ce que la régression logistique?

A

Forme particulière d’une régression qui permet l’utilisation d’une variable dépendante dichotomique. Produit directement des rapports de cotes.

60
Q

Qu’est ce qu’une variable factice ou muette?

A

Variable binaire (0 ou 1) qui indique la présence ou l’absence d’une caractéristique ou d’une catégorie spécifique. Si une variable à plus de 2 catégories, une variable factice peut être créee pour chaque catégorie, excluant une catégorie de référence