Module 5: notions relatives au statistiques Flashcards

1
Q

fait référence à des mesures qui permettent de localiser le centre d’une distribution de scores. Spécifiquement, son objectif est de résumer en un seul nombre la valeur typique ou la plus représentative d’un ensemble de scores.

A

mesures de tendance centrale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

-
-

A
  • moyenne
  • mode
  • médiane
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

qui quantifie le taux de variabilité des données autour de la valeur centrale.

A

une mesure de dispersion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Il existe trois mesures habituelles de dispersion:

A
  • étendue
  • variance
  • écart-type
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Valeur la plus fréquente dans une distribution

A

mode

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Observation du milieu d’une distribution de scores

A

Médiane

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Elle se calcule en additionnant les valeurs observées de chaque participant divisées par le nombre de participants observés.

A

La moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Le mode est rarement employé seul pour mesurer la tendance centrale, parce qu’avec un petit nombre d’observations, chaque valeur est unique. Dans ce cas, _________________.

A

Le mode est rarement employé seul pour mesurer la tendance centrale, parce qu’avec un petit nombre d’observations, chaque valeur est unique. Dans ce cas, il n’y a pas de mode.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

représente la mesure la plus courante de tendance centrale.

A

La moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

la valeur de part et d’autre de laquelle se situe la moitié des observations.

A

La médiane

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

La médiane : Pour la mesurer, on établit la liste des observations individuelles par ordre ____ ou ______

A

Pour la mesurer, on établit la liste des observations individuelles par ordre croissant ou décroissant.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

En général, on préfère utiliser la _____à la ______ parce que la ______ est calculée en utilisant un maximum d’informations de toutes les observations.

A

En général, on préfère utiliser la moyenne à la médiane parce que la moyenne est calculée en utilisant un maximum d’informations de toutes les observations.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

En effet, le calcul de la______ fait intervenir les valeurs de toutes les observations alors que la _____représente l’information d’une seule observation.

A

En effet, le calcul de la moyenne fait intervenir les valeurs de toutes les observations alors que la médiane représente l’information d’une seule observation.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

De plus, une partie importante des tests statistiques repose sur la _____. Toutefois, le désavantage de la moyenne est qu’elle est très sensible aux ________ alors que la médiane ne l’est pas du tout.

A

De plus, une partie importante des tests statistiques repose sur la moyenne. Toutefois, le désavantage de la moyenne est qu’elle est très sensible aux valeurs extrêmes alors que la médiane ne l’est pas du tout.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Indice de la variabilité des scores d’une distribution autour de la moyenne

A

Variance

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Différence entre la valeur la plus petite et la plus grande d’une distribution

A

Étendue

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Indice de la variabilité des scores d’une distribution autour de la moyenne.

A

écart-type

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Écart-type : il s’agit simplement de la ______

A

racine carrée de la variance

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

_____ et _____ (qui sont intimement reliées) représentent les mesures de variabilité les plus courantes et les plus instructives. Elles mesurent la dispersion (ou l’écart) de chaque observation autour de la moyenne.

A

La variance et l’écart-type

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

le signe utilisé pour représenter la variance _____ (σ2) diffère de celui utilisé pour ______ (s2).

A

le signe utilisé pour représenter la variance d’une population (σ2) diffère de celui utilisé pour un échantillon (s2).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Distribution de fréquence d’une variable symétriquement distribuée autour de la moyenne selon une courbe normale.

A

Concept de la distribution normale

22
Q

La distribution normale est une distribution théorique «en forme de _____» et est appelée normale parce qu’elle représente bien la distribution de plusieurs phénomènes observés dans la ______ (e.g. la taille, le poids, l’âge, la capacité intellectuelle, etc).

A

La distribution normale est une distribution théorique «en forme de cloche» et est appelée normale parce qu’elle représente bien la distribution de plusieurs phénomènes observés dans la nature (e.g. la taille, le poids, l’âge, la capacité intellectuelle, etc).

23
Q

Entre 1 écart-type en dessous (-1s) et au dessus (+1s) de la moyenne, on retrouve __% des scores (représenté par la zone verte foncée) donc __% des scores d’un côté et de l’autre de moyenne jusqu’à la valeur correspondant à un écart-type

A

Entre 1 écart-type en dessous (-1s) et au dessus (+1s) de la moyenne, on retrouve 68% des scores (représenté par la zone verte foncée) donc 34% des scores d’un côté et de l’autre de moyenne jusqu’à la valeur correspondant à un écart-type

24
Q

Entre 2 écart-types en dessous (-2s) et au dessus (+2s) de la moyenne, on retrouve ___% des scores.

A

Entre 2 écart-types en dessous (-2s) et au dessus (+2s) de la moyenne, on retrouve 96% des scores

25
Q

Entre 3 écart-types en dessous (-3s) et au dessus (+3s) de la moyenne, on retrouve __% des scores.

A

Entre 3 écart-types en dessous (-3s) et au dessus (+3s) de la moyenne, on retrouve 99% des scores.

26
Q

La comparaison de 2 distributions de scores nécessite l’utilisation d’une échelle unique à toutes les distributions. Pour ce faire, les scores de chaque distribution sont transformés en _____ à partir de la moyenne et de l’écart- type de leur distribution respective

A

score Z

27
Q

Le score Z d’un score x de la distribution correspond au nombre ________ en dessous ou au dessus de la ______ de la distribution.

A

Le score Z d’un score x de la distribution correspond au nombre d’écart-types en dessous ou au dessus de la moyenne de la distribution.

28
Q

A noter que la transformation d’une distribution en scores Z ne change pas la _____ de la distribution mais sa moyenne devient ___ et son écart- type (s) = __.

A

A noter que la transformation d’une distribution en scores Z ne change pas la forme de la distribution mais sa moyenne devient 0 et son écart- type (s) = 1.

29
Q

Lorsque nous faisons une analyse de différence entre 2 échantillons à partir de leur moyenne respective pour une variable donnée, nous assumons que ces échantillons sont représentatifs de la population d’où ils sont tirées mais, spécifiquement, que la moyenne de chaque ______ est représentative de la moyenne de chaque ______.

A

Lorsque nous faisons une analyse de différence entre 2 échantillons à partir de leur moyenne respective pour une variable donnée, nous assumons que ces échantillons sont représentatifs de la population d’où ils sont tirées mais, spécifiquement, que la moyenne de chaque échantillon est représentative de la moyenne de chaque population.

30
Q

Une façon de pouvoir obtenir un estimé plus précis de la moyenne de la population serait de tirer plusieurs échantillons (disons 10 échantillons) et de déterminer la moyenne (et l’écart-type) de ces 10 moyennes d’échantillons. Cette distribution de « 10 moyennes » est appelée « ________» et permet d‘estimer la vraie moyenne de la population.

A

« distribution des moyennes échantillonnales »

31
Q

L’écart-type d’une distribution de moyennes échantillonales

A

Erreur-type de la moyenne (SEM)

32
Q

est l’intervalle autour de la moyenne d’un échantillon à l’intérieur duquel on obtient une probabilité (en %) de trouver la vraie moyenne de la population.

A

intervalle de confiance de la moyenne d’un échantillon

33
Q

Concept de _________
La vérification que la différence entre les moyennes de 2 échantillons est statistiquement significative repose sur : la probabilité que les moyennes des 2 échantillons soient semblables à celle des population d’ou elles proviennent

A

Concept de différence significative

34
Q

-

A
  • une vrai différence

- une différence attribuable à une erreur d’échantillonnage

35
Q

Dans ce processus de comparaison de deux moyennes, trois facteurs vont influencer (ou favoriser) la probabilité d’observer des différences significatives entre deux groupes:

1) ________ (l’écart mathématique entre les deux moyennes)
2) ________ (l’écart-type de chaque groupe)
3) ___________

A

1) La variabilité inter-groupe (l’écart mathématique entre les deux moyennes)
2) La variabilité intra-groupe (l’écart-type de chaque groupe)
3) Le nombre de sujets par groupe

36
Q

Pas de différence significative entre les moyennes des 2 échantillons

A

hypothèse nulle H0

37
Q

Différence significative entre les moyennes des 2 échantillons

A

Hypothèse alternative H1

38
Q

Les test statistiques permettent de déterminer la probabilité que _______ soit vrai.

A

l’hypothèse nulle

39
Q

Le processus de différences entre deux moyennes nécessitent d’énoncer deux types d’hypothèses qui seront vérifiées par les tests statistiques. Initialement, toute comparaison de moyenne vérifie _______(H0) à l’effet qu’il n’y a pas de différence significative entre les moyennes de deux échantillons.

A

l’hypothèse nulle

40
Q

___ : μ1 = μ2.

A

H0

41
Q

___ : μ1 ≠ μ2.

A

H1

42
Q

Si les tests statistiques montrent qu’il _______ entre les deux moyennes, alors le chercheur accepte l’hypothèse nulle.
Si les tests statistiques montrent qu’il ________ entre les deux moyennes, alors le chercheur rejette l’hypothèse nulle.

A

Si les tests statistiques montrent qu’il n’y a pas de différence entre les deux moyennes, alors le chercheur accepte l’hypothèse nulle.
Si les tests statistiques montrent qu’il y a une différence entre les deux moyennes, alors le chercheur rejette l’hypothèse nulle.

43
Q

Si les tests statistiques montrent qu’il y a une différence entre les deux moyennes, alors le chercheur ________ l’hypothèse nulle.

A

rejette

44
Q

Si les tests statistiques montrent qu’il n’y a pas de différence entre les deux moyennes, alors le chercheur _______ l’hypothèse nulle.

A

accepte

45
Q

Probabilité de tirer une conclusion incorrecte en rejetant l’hypothèse nulle

A

Niveau α

46
Q

Niveau de signification observé lors de l’analyse des résultats

A

Valeur α

47
Q

Niveau α

Niveau habituel : α = ___ ou ____

A

5 % ou 0,05

48
Q

Cette probabilité d’erreur que l’on appelle la valeur α ou le niveau de signification peut différer d’une étude à l’autre mais elle se situe généralement à 5%. Cela signifie qu’il y a seulement 5% de chance qu’une différence entre les deux moyennes soit due à une _________ et ne soit pas une _______.

A

Cette probabilité d’erreur que l’on appelle la valeur α ou le niveau de signification peut différer d’une étude à l’autre mais elle se situe
généralement à 5%. Cela signifie qu’il y a seulement 5% de chance qu’une différence entre les deux moyennes soit due à une erreur d’échantillonnage et ne soit pas une vraie différence.

49
Q

la probabilité réelle d’énoncer une conclusion erronée à partir des résultats d’un test statistique s’appelle ____

A

valeur p (probabilité)

50
Q

la probabilité réelle d’énoncer une conclusion erronée à partir des résultats d’un test statistique s’appelle la valeur p (probabilité) et est donnée après chaque test statistique. Donc, dans vos articles, pour chaque test utilisé, il devrait y avoir une valeur de ___ .

A

la probabilité réelle d’énoncer une conclusion erronée à partir des résultats d’un test statistique s’appelle la valeur p (probabilité) et est donnée après chaque test statistique. Donc, dans vos articles, pour chaque test utilisé, il devrait y avoir une valeur de p.

51
Q

Si la valeur p du test statistique est plus _____ que la valeur (α) pré-établie, le chercheur ____ l’hypothèse nulle et conclue à des différences significatives entre les deux moyennes.

A

Si la valeur p du test statistique est plus petite (inférieure) que la valeur (α) pré-établie, le chercheur rejette l’hypothèse nulle et conclue à des différences significatives entre les deux moyennes.

52
Q

MPORTANT : Si la valeur __ du test statistique est plus petite (inférieure) que la valeur ___ pré-établie, le chercheur rejette l’hypothèse ____ et conclue à ___________ entre les deux moyennes.

A

MPORTANT : Si la valeur p du test statistique est plus petite (inférieure) que la valeur (α) pré-établie, le chercheur rejette l’hypothèse nulle et conclue à des différences significatives entre les deux moyennes.