examen final etude Flashcards

1
Q

Font référence à des qualités,
s’expriment en modalités (catégories, attributs)

A

Variables qualitatives

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Variables dont les catégories n’ont pas d’ordre particulier, ps de hiérarchie (ex: genre, couleur, cheveux)

A

Qualitatives nominales

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Variables où les catégories sont ordonnées de manière à refléter un certain gradient, un progression (ex: niveau d’estime de soi)

A

Qualitatives ordinales

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Cardinal, font référence à des quantités, s’expriment en valeur

A

Variables quantitatives

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Variables qui peut être subdivisées infiniment (ex: distance)

A

Variables quantitatives continues

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Variables qui ne peut pas être subdivisées au delà d’une certaine limite (ex: revenu)

A

Variables quantitatives discrètes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Nombre d’observation associées à une valeur ou catégorie (niveau ou modalité)

A

Fréquence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Dans une présentation des valeurs ordonnées, le nombre d’observation associées à une valeur/catégorie X ou à une valeur/catégorie précédente

A

Fréquence cumulée

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Fréquence (f) divisée par le nombre total d’observations (N)

A

Proportion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Proportion rapportée à un groupe de 100 observations

A

Pourcentage

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Définition de Rapport (ratio)

A

Relation entre deux quantités qu’on veut comparer
ex: 6 h pour 7 f = 6/7

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’est ce qu’un Taux

A

Processus dynamique, on observe un changement dans le temps

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Propriété d’une population (pas d’un individu)

A

Distribution

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Ce qui est typique de la population; ce qui se passe «en moyenne»
Valeurs autour desquelles la distribution est centrée

A

~tendance centrale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est ce que la moyenne?

A

Somme des observations divisée par le nombre d’observations

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est ce qu’une moyenne pondérée ?

A

Lorsque toutes les observations n’ont pas le même poids (ex: comme les notes de plusieurs examens qui valent pas toute la mm chose)
Permet de modifier la contribution relative des observations

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Qu’est ce que la médiane?

A

Sépare la distribution en 2 groupes égaux (50/50)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Vrai ou faux
La moyenne est moins affectée que la médiane par les valeurs extrêmes

A

Faux, la médiane est celle qui est moins affectée par les valeurs externes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Catégorie ou valeur ayant la fréquence la plus élevée
Approprié pour les variables nominales et ordinales

A

Le mode
(celui qui a le plus, mettons dans un cours 66% des élèves parlent français, c’est celui qui est le plus ressorti)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Que sont les mesures de dispersion?

A

Étendue
Écart moyen
Variance
Écart-type
Coefficient de variation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Différence entre les valeurs minimale et maximale de la distribution

A

Étendue
(Max-Min)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Description de écart moyen?

A

Décrit comment chacune observation est éloignée de la moyenne
Sans valeurs absolues, la somme des écarts à la moyenne= 0
Pour des raisons mathématiques, les valeurs absolues ne sont pas idéales

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Écarts à la moyenne au carrés

A

Variance s2 ou o2
Produit des mesures difficiles à interpréter car très élevé

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Racine au carré de la variance

A

Écart type
(jsp pourquoi c’est décrit comme cette merde, genre littéralement la variance est au carrée pis la tu veux je fasse une racine pour enlever le carré)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Variabilité par rapport à la moyenne
Coefficient de variation Plus le CV est petit, plus les valeurs de la distribution tendent à être proche de la moyenne
26
On décrit l’écart d’une distribution selon 2 dimensions lesquelles?
L’asymétrie et l’aplatissement
27
L’asymétrie décrit un décalage vers la gauche ou vers la droite de la courbe, qu’est ce que ça représente lorsqu’elle va vers la droite **—>**et vers la gauche **<—**
—>: Négative (moy < med) <—: Positive (moy>med)
28
Qu’est ce que l’aplatissement ?
Décrit la concentration des fréquence autour de la moyenne
29
Qu’est ce qu’une mesure de position
Situer une valeur relativement à l’ensemble de la distribution
30
100 groupes composés chacun de 1% des observations
Centiles
31
4 Groupes composés chacun de 25%
Quartiles
32
10 Groupes composés chacun de 10%
Déciles
33
5 Groupes composés chacun de 20%
Quintiles
34
3 Groupes composés chacun de 33,33%
Terciles
35
Représentation graphique d’une distribution qui intègre différentes mesures
Boîtes à moustaches ( ou diagramme en boîte)
36
Qu’est ce que le score Z
- Exprime un écart à la moyenne qu’on met en relation avec la variabilité (dispersion) dans la population. - exprime l’écart à ma moyenne en unîtes d’écart-type - Permettent de relativiser les valeurs de distributions différentes Utilises par exemple pour comparer des étudiants dont la performance est mesurée dans des contextes différents
37
Sous ensemble de la population composé d’individus qui ont été choisis au hasard
Échantillon
38
Vrai ou faux Avec des échantillons différents pour une meme population, on pourrait avoir des statistiques différentes
Vrai
39
Vrai ou faux Dans un échantillon probabiliste on s’appuie sur des lois de probabilité pour estimer la variabilité théorique des statistiques issues de notre échantillon.
Vrai
40
Qu’est ce que l’erreur-type?
Ecart-type de la moyenne d’échantillonnage
41
Vrai ou faux Ma courbe normal décrit ma distribution des fréquences
Vrai
42
La courbe normal permet de prévoir les ________ de plusieurs phénomènes aléatoires. Elle sert de base à _________ _________ dans un grand nombre de contextes et possède certaines caractéristiques importantes.
probabilités l’inference statistique
43
Qu’est ce qu’est l’intervalle de confiance?
Mesure de précision de l’estimation obtenue à partir d’un échantillon (estimation d’une moyenne ou d’une proportion). Vise à identifier les bornes qui représentent les valeurs probables de la moyenne de la population autour de la moyenne estimée par échantillon.
44
Vrai ou faux Le score Z pour le calcul d’un IC dépend du niveau de certitude souhaité
Vrai
45
Vrai ou faux On ne peut pas faire de formule pour les proportions avec l’écart-type
Vrai
46
Qu’est ce qu’un test d’hypothèse
Permet l’inférence en évaluant si une condition est vrai ou non
47
Qu’est ce qu’une hypothèse nulle?
Suppose l’absence d’effet d’un facteur, elle est noté H0
48
Qu’est ce qu’une hypothèse alternative?
Présume l’effet d’un facteur (différence/association), elle est notée H1
49
Qu’est ce que le risque d’erreur
Probabilité de prendre une décision incorrecte lors d’un test statistique
50
Qu’est ce que l’erreur de type I?
Probabilité de rejeter H0 alors qu’elle est vrai en réalité (notée *weird* a). Liée au hasard (variabilité inhérente à l’échantillonnage) et au seuil *weird* a que l’on compare à la valeur p du test
51
Qu’est ce que l’erreur de type II?
Probabilité d’accepter H0 alors qu’elle est fausse en réalité (notée *weird* B), liées à la puissance statistique de l’étude
52
Qu’est ce que le seuil de signification?
Valeur critique utilisée pour décider si une hypothèse statistique doit rejetée ou non
53
Qu’est ce que le test Z?
Test d’hypothèse qui utilise la **valeur Z** pour associer une probabilité à une condition décrite par H0. Permet de comparer la moyenne observée à une moyenne connue/theorique (n doit être supérieur à 30)
54
Qu’est ce que le test T?
Test d’hypothèse qui utilise la **valeur t** pour associer une probabilité à une condition décrite par H0. Il permet de - comparer une moyenne observer à une moyenne connue/theorique (utilisée lorsque n<30) -Comparer deux groupes indépendants (test t pour échantillon indépendants) -Comparer un seul groupe à deux temps de mesure (test t pour échantillon appariés)
55
Qu’est ce que l’ANOVA?
Test d’hypothèse qui utilise la **valeur F** pour associer une probabilité à une condition décrite par H0. Il permet de **comparer plus de 2 groupes**
56
Qu’est ce que le test de corrélation (ou juste correlation)?
Test d’hypothèse qui permet de décrire l’association entre deux variables cardinales: - le coefficient de corrélation de Pearson (notée r) permet d’évaluer la **force** et la **direction** de l’association - le coefficient de détermination (notée r2) indique la proportion de la variance d’une variable qui est expliquée par l’autre variable
57
Qu’est ce que le KHI-deux?
Test d’hypothèse qui utilise la **valeur *weird* X2** et permet de décrire l’association entre deux variables **categorielles** (ordinales ou nominales)
58
Qu’est ce que la régression?
Permet d’évaluer une association entre une VI et une VD en contrôlant l’effet d’autres VI-> contrôle, ajustement: permet d’éliminer l’effet d’une autre variable (confusion) sur l’association observée
59
Qu’est ce que la régression logistique?
Forme particulière d’une régression qui permet l’utilisation d’une variable dépendante dichotomique. Produit directement des rapports de cotes.
60
Qu’est ce qu’une variable factice ou muette?
Variable binaire (0 ou 1) qui indique la présence ou l’absence d’une caractéristique ou d’une catégorie spécifique. Si une variable à plus de 2 catégories, une variable factice peut être créee pour chaque catégorie, excluant une catégorie de référence