stat Flashcards

1
Q

Qu’est-ce qu’une variable en statistiques ?

A

Une propriété qui varie selon les individus d’une étude.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quels sont les types de variables ?

A
  • Nominales : Catégories sans ordre (ex. couleur des yeux).
  • Ordinales : Catégories ordonnées (ex. échelle de satisfaction).
  • Quantitatives : Variables numériques (ex. âge, taille).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelle est la différence entre une variable nominale et ordinale ?

A

Une variable nominale n’a pas d’ordre (ex. nationalité), alors qu’une variable ordinale peut être classée (ex. échelle de satisfaction).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Pourquoi utilise-t-on des statistiques en psychologie ?

A

Pour analyser des données, modéliser des phénomènes et valider des hypothèses.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’est-ce que la moyenne ?

A

C’est la somme des valeurs divisée par leur nombre.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est-ce que la médiane ?

A

C’est la valeur qui partage un ensemble de données en deux moitiés égales.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quelle est la différence entre moyenne et médiane ?

A

La moyenne est influencée par les valeurs extrêmes, tandis que la médiane ne l’est pas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est-ce que le mode ?

A

C’est la valeur qui apparaît le plus souvent dans un ensemble de données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce que l’étendue ?

A

C’est la différence entre la valeur maximale et la valeur minimale d’un ensemble de données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Comment calcule-t-on l’étendue ?

A

Etendue=Max−Min

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est-ce que l’intervalle interquartile (IQR) ?

A

C’est la différence entre le 3ᵉ quartile (Q3) et le 1ᵉʳ quartile (Q1), représentant l’étalement des 50 % centraux des données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quelle est la formule de l’intervalle interquartile ?

A

𝐼𝑄𝑅=𝑄3−𝑄1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce que l’écart-type ?

A

C’est une mesure de dispersion qui indique à quel point les valeurs s’éloignent de la moyenne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Pourquoi faut-il faire attention aux statistiques ?

A

Parce qu’elles peuvent être mal interprétées, biaisées ou utilisées de manière trompeuse.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quelle est la principale erreur dans l’analyse des pourcentages ?

A

Ne pas préciser sur quelle population le pourcentage est calculé.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Pourquoi ne peut-on pas “prouver” quelque chose avec des statistiques ?

A

Parce qu’elles montrent des tendances, pas des certitudes absolues.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Quelle est la différence entre un tableau de protocole et un tableau d’effectifs ?

A

Le tableau de protocole contient toutes les données brutes, tandis que le tableau d’effectifs regroupe et synthétise les valeurs.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Pourquoi ne considère-t-on pas un identifiant comme une variable ?

A

Parce qu’il ne varie pas en fonction d’un phénomène étudié, il sert juste à identifier les individus.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Quel type de variable est une note sur 20 ?

A

C’est une variable quantitative discrète.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Pourquoi une question à choix multiple peut-elle poser un problème statistique ?

A

Parce qu’une personne peut sélectionner plusieurs réponses, ce qui complique l’analyse des fréquences.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Si 30 % des étudiants d’une promo sont en difficulté et qu’il y a 200 étudiants, combien sont en difficulté ?

A

200×0.30=60
Donc 60 étudiants sont en difficulté.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Quelle est la principale erreur dans l’interprétation d’un pourcentage ?

A

Confondre “X % de A sont B” et “X % de B sont A”.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Si 70 % des élèves ont réussi un examen et que 40 % des filles ont échoué, peut-on conclure que les garçons réussissent mieux ?

A

Non, car on ne connaît pas la proportion filles/garçons dans la classe.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Pourquoi faut-il toujours donner la population de référence dans un pourcentage ?

A

Car un même pourcentage peut être très différent selon la taille du groupe étudié.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Pourquoi l’écart-type est souvent préféré à la variance ?

A

Parce qu’il est exprimé dans la même unité que les données, ce qui facilite son interprétation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Que signifie un écart-type élevé ?

A

Que les données sont très dispersées autour de la moyenne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Si la médiane d’un ensemble de données est plus basse que la moyenne, que peut-on en conclure ?

A

Que la distribution est asymétrique vers la droite (présence de valeurs élevées qui tirent la moyenne vers le haut).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Quelle est l’utilité de l’intervalle interquartile ?

A

Il mesure la dispersion des 50 % centraux des données et est moins sensible aux valeurs extrêmes que l’écart-type.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Que signifie une étendue très grande mais un IQR faible ?

A

Qu’il y a quelques valeurs extrêmes, mais que la majorité des données est concentrée.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Quelle est la différence entre un pourcentage en ligne et un pourcentage en colonne ?

A

Le % ligne est calculé sur chaque ligne (comparaison au sein d’un même groupe), le % colonne sur chaque colonne (comparaison entre plusieurs groupes).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Pourquoi faut-il faire attention aux pourcentages dans un tableau croisé ?

A

Parce qu’un même % peut être trompeur selon s’il est calculé sur les lignes, les colonnes ou le total.

32
Q

Dans une enquête, 60 % des femmes et 40 % des hommes ont répondu “oui”. Peut-on dire que les femmes sont majoritaires à avoir dit “oui” ?

A

Non, car il faut aussi connaître la répartition femmes/hommes dans l’échantillon total.

33
Q

Que signifie “biais de confirmation” en statistiques ?

A

C’est la tendance à interpréter les données de manière à confirmer ses croyances préexistantes.

34
Q

Pourquoi ne peut-on pas dire “statistiquement prouvé” ?

A

Parce que les statistiques montrent des tendances, mais ne prouvent jamais une causalité absolue.

35
Q

Donner un exemple d’erreur d’interprétation d’une moyenne.

A

Dire que le salaire moyen est de 2500€ ne signifie pas que la majorité des gens gagnent 2500€ (la médiane pourrait être bien plus basse).

36
Q

Pourquoi faut-il être prudent avec les données récentes en statistiques ?

A

Parce qu’elles peuvent être incomplètes, biaisées ou non reproductibles.

37
Q

C’est quoi un pourcentage ?

A

indique une fraction, cad une partie d’un groupe
le nombre d’unités ciblées sur le nombre total d’unités
une valeur qui donne cette fraction
ex: 80% = 80/100 = 0,80
on parle de 80% mais en réalité la valeur est 0,80

38
Q

Bien s’exprimer

A

1- la population de référence (où, le contexte)
2- la part (la fraction, le pourcentage)
3- le sous-groupe décrit (qui, quoi)

39
Q

Quelle est la différence entre “25 % de femmes dans ce groupe” et “25 % des femmes sont dans ce groupe” ?

A

“25 % de femmes dans ce groupe” → Référentiel = le groupe → 25 % du groupe est composé de femmes.
“25 % des femmes sont dans ce groupe” → Référentiel = les femmes → 25 % de toutes les femmes appartiennent à ce groupe.
⚠ Toujours identifier le référentiel avant d’interpréter un pourcentage !

40
Q

C’est quoi une variable ?

A

une propriété commune à l’ensemble des individus d’une étude
La valeur de cette propriété varie selon les individus

41
Q

Variables ordinales

A

→ On peut classer les individus en « plus » et « moins »
→ Les distances entre les valeurs n’ont pas de sens
→ les valeurs sont souvent numériques dans les données

42
Q

Règles avec les variables ordinales en psychologie

A

1/ si 4 modalités ou moins : nominale
2/ si 5 modalités ou plus : quantitatives en mettant des notes « 1 », « 2 », …

43
Q

Pourquoi un pourcentage peut-il être une fréquence ?

A

Un pourcentage est une fraction d’un ensemble.

10 % = 10/100 = 0,10 (fréquence en valeur décimale).
💡 Astuce : Toujours convertir en fraction ou en décimal pour éviter les erreurs d’interprétation.

44
Q

Mode

A

la valeur de la variable ayant l’effectif le plus important
Indicateur intéressant pour une variable qualitative ou quantitative
Mais attention si on travaille sur un tableau de protocole

45
Q

Moyenne

A

la somme des valeurs divisée par l’effectif
Pas utilisable pour une variable qualitative/nominale
Indicateur le plus utilisé pour une variable quantitative
Mais attention, son sens peut-être trompeur

46
Q

Médiane

A

la valeur de la variable qui sépare en deux effectifs égaux la population
Valeur qui partage les données en deux moitiés égales, elle est moins influencée par les valeurs extrêmes.
Son sens est intuitif, et il complète bien la moyenne
Plus compliqué à calculer à la main
Si nous avons peu d’effectifs on choisira la médiane plutôt que la moyenne

47
Q

Indicateurs de positions

A

L’idée est de résumer les données par une valeur synthétique
En général on donne la « moyenne »
Mais parfois il vaut mieux prendre un autre indicateur !
(mode, moyenne ou médiane)

48
Q

Moyenne d’une médiane

A

Somme de toutes les valeurs divisée par leur nombre, elle représente une valeur “équilibrée”.

49
Q

Quelle est la différence entre une variable qualitative et quantitative ?

A

Qualitative : Catégories (ex : couleur des yeux).

Quantitative : Valeurs numériques (ex : âge, taille).

50
Q

Quelles sont les deux sous-catégories des variables quantitatives ?

A

Discrète : Valeurs entières (ex : nombre d’enfants).

Continue : Toute valeur dans un intervalle (ex : taille en cm).

51
Q

Que sont les mesures de tendance centrale ?

A

Moyenne, médiane et mode.

52
Q

Quelles sont les principales mesures de dispersion ?

A

Étendue, variance, écart-type et intervalle interquartile.

53
Q

Comment calcule-t-on l’écart-type ?

A

Racine carrée de la variance.

54
Q

Que représente l’étendue ?

A

Différence entre la plus grande et la plus petite valeur d’un ensemble de données.

55
Q

Quelle est la différence entre un échantillon et une population ?

A

Population : Ensemble complet des individus.

Échantillon : Sous-ensemble représentatif de la population.

56
Q

Qu’est-ce qu’une estimation ponctuelle ?

A

Une valeur unique utilisée pour estimer un paramètre inconnu de la population.

57
Q

Qu’est-ce qu’un intervalle de confiance ?

A

Une plage de valeurs qui a une forte probabilité de contenir le vrai paramètre de la population.

58
Q

Quelle est la différence entre une hypothèse nulle et une hypothèse alternative ?

A

Hypothèse nulle (H0) : Pas d’effet ou de différence.

Hypothèse alternative (H1) : Existence d’un effet ou d’une différence.

59
Q

Que représente le seuil de signification (alpha) ?

A

Probabilité maximale d’accepter à tort l’hypothèse alternative (souvent 5 % ou 0,05).

60
Q

Que signifie une valeur p inférieure à 0,05 ?

A

Il y a moins de 5 % de chances que l’effet observé soit dû au hasard, donc on rejette H0.

61
Q

Quels sont les principaux types d’échantillonnage ?

A

Aléatoire simple : Chaque individu a une probabilité égale d’être choisi.

Stratifié : On divise la population en groupes homogènes et on tire un échantillon dans chaque groupe.

Systématique : On sélectionne un individu à intervalle régulier (ex : 1 individu sur 10).

Par grappes (ou en grappe) : On divise la population en groupes et on sélectionne aléatoirement certains groupes entiers.

62
Q

Quelle est la différence entre un échantillonnage probabiliste et non probabiliste ?

A

Probabiliste : Chaque individu a une chance connue d’être sélectionné (ex : aléatoire simple).

Non probabiliste : La sélection repose sur des critères non aléatoires (ex : échantillon de convenance).

63
Q

Quels sont les principaux types de graphiques utilisés en statistiques ?

A

Histogramme : Pour représenter des données quantitatives continues.

Diagramme en barres : Pour des variables qualitatives ou quantitatives discrètes.

Boîte à moustaches : Pour visualiser la distribution et détecter les valeurs extrêmes.

Nuage de points : Pour observer la relation entre deux variables quantitatives.

Camembert (ou diagramme circulaire) : Pour représenter des proportions.

64
Q

Qu’exprime la loi des grands nombres ?

A

Plus un échantillon est grand, plus la moyenne observée se rapproche de la moyenne réelle de la population.

65
Q

Quel est le principe du théorème central limite ?

A

Peu importe la distribution de départ d’une variable, la distribution des moyennes d’échantillons suit une loi normale si l’échantillon est suffisamment grand (généralement n > 30).

66
Q

Quelle est la différence entre corrélation et causalité ?

A

Corrélation : Deux variables évoluent ensemble, mais sans relation de cause à effet prouvée.

Causalité : Une variable influence directement une autre.

67
Q

Qu’est-ce que le coefficient de corrélation de Pearson ?

A

Une mesure de la force et de la direction d’une relation linéaire entre deux variables (valeurs entre -1 et 1).

68
Q

Quelles sont les erreurs possibles dans un test statistique ?

A

Erreur de type I (faux positif) : On rejette H0 alors qu’elle est vraie.

Erreur de type II (faux négatif) : On ne rejette pas H0 alors qu’elle est fausse.

69
Q

Comment réduire l’erreur de type II ?

A

En augmentant la taille de l’échantillon ou la puissance statistique du test.

70
Q

Quelle est la différence entre un test paramétrique et un test non paramétrique ?

A

Paramétrique : Suppose que les données suivent une distribution normale (ex : test t de Student).

Non paramétrique : Pas d’hypothèse sur la distribution des données (ex : test de Wilcoxon).

71
Q

Quand utilise-t-on un test t de Student ?

A

Pour comparer les moyennes de deux échantillons (indépendants ou appariés).

72
Q

À quoi sert une ANOVA ?

A

À comparer les moyennes de plus de deux groupes pour voir s’il existe une différence significative.

73
Q

Quelle est la principale hypothèse d’une ANOVA ?

A

Les groupes comparés doivent avoir une variance homogène et suivre une distribution normale.

74
Q

À quoi sert une régression linéaire ?

A

À modéliser la relation entre une variable dépendante et une ou plusieurs variables indépendantes.

75
Q

Quelle est l’équation de la régression linéaire simple ?

A

Y=aX+b , où 𝑎 est la pente et 𝑏 l’ordonnée à l’origine.

76
Q

Que représente le coefficient de détermination
𝑅² ?

A

Il mesure la proportion de la variance de Y expliquée par X (valeur entre 0 et 1).