Module 6-Statistiques Flashcards

1
Q

Quels sont les trois indicateurs de tendance centrale?

A
  1. Moyenne arithmétique
  2. Mode
  3. Médiane
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce que le mode?

A

Le mode d’une série d’observations est la valeur la plus fréquente d’un ensemble de données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce que la moyenne arithmétique?

A

La moyenne représente la mesure la plus courante de tendance centrale. Elle se calcule en additionnant les valeurs observées de chaque participant divisées par le nombre de participants observés.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce que la médiane?

A

La médiane correspond à l’observation du milieu d’une distribution de scores, c’est-à-dire à la valeur de part et d’autre de laquelle se situe la moitié des observations. Pour la mesurer, on établit la liste des observations individuelles par ordre croissant ou décroissant

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quel est le désavantage de la moyenne?

A

Le désavantage de la moyenne est qu’elle est très sensible aux valeurs extrêmes, alors que la médiane ne l’est pas du tout.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelles sont les trois mesures de dispersion?

A
  1. Étendue
  2. Variance
  3. Écart-type.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est-ce que l’étendue?

A

Différence entre la plus petite et la plus grande valeur d’une distribution.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est-ce que la variance et l’écart-type mesurent?

A

Elles mesurent la dispersion (ou l’écart) de chaque observation autour de la moyenne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Pourquoi le signe qui représente la variance d’une population diffère de celui utilisé pour un échantillon?

A

Cela est dû au fait que le calcul de la variance varie légèrement lorsqu’il s’agit d’un échantillon. Dans ce dernier cas, la somme des carrés des écarts est alors divisée par le nombre total d’observations moins une (n-1).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Comment la variance et l’écart-type sont-ils reliés mathématiquement?

A

L’écart-type est la racine carrée de la variance.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est-ce que la distribution normale?

A

La distribution normale est une distribution théorique « en forme de cloche » et est appelée normale parce qu’elle représente bien la distribution de plusieurs phénomènes observés dans la nature.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Décrivez le pourcentage des scores en fonction de l’écart-type sur une courbe normale.

A

1) Entre un écart-type en dessous (-1 s) et au-dessus (+1 s) de la moyenne, on retrouve 68 % des scores (représenté par la zone verte foncée), donc 34 % des scores d’un côté et de l’autre de la moyenne, jusqu’à la valeur correspondant à un écart-type.

2) Entre deux écarts-types en dessous (-2 s) et au-dessus (+2 s) de la moyenne, on retrouve 96 % des scores, représentés ici par la zone verte foncée et la suivante.

3) Entre trois écarts-types en dessous (-3 s) et au-dessus (+3 s) de la moyenne, on retrouve 99 % des scores, représentés ici par l’ensemble des zones vertes de la figure.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Dans quelle circonstance doit-on utiliser la distribution de scores standardisés (Z)?

A

La comparaison de deux distributions de scores nécessite l’utilisation d’une échelle unique à toutes les distributions. Pour ce faire, les scores de chaque distribution sont transformés en score Z à partir de la moyenne et de l’écart- type de leur distribution respective (équation ci-contre).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Vrai ou faux? Lorsque nous faisons une analyse de différences entre deux échantillons à partir de leur moyenne respective pour une variable donnée, nous assumons que ces échantillons sont représentatifs de la population d’où ils sont tirés, mais, spécifiquement, que la moyenne de chaque échantillon est représentative de la moyenne de chaque population.

A

Vrai.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce que le concept de distribution des moyennes échantillonnales nous amène-t-il à comprendre?

A

Le concept de « distribution des moyennes échantillonnales » (sampling distribution) nous amène à comprendre comment estimer la moyenne d’une population en tirant plusieurs échantillons.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est-ce que l’erreur-type de la moyenne (SEM)?

A

L’écart-type d’une distribution de moyennes échantillonnales.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Qu’est-ce que l’intervalle de confiance de la moyenne d’un échantillon?

A

Intervalle autour de la moyenne à l’intérieur duquel on obtient une probabilité déterminée de retrouver la vraie moyenne de la population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Quel est le calcul pour l’intervalle de confiance?

A

Le calcul de l’intervalle de confiance autour d’une moyenne et dans lequel il y a une probabilité connue de trouver la vraie moyenne de la population est relativement simple :

1) Calcul de la moyenne de l’échantillon pour la variable d’intérêt (ex. : l’amplitude articulaire);

2) Calcul de l’erreur-type de la moyenne (SEM) à partir de l’écart-type et du nombre de scores;

3) Identification du score Z qui correspond à la probabilité désirée (pourcentage de chance de trouver la vraie moyenne);

4) Cette identification doit se faire à partir d’une table de scores Z et, dans les exemples que nous utilisons (68, 90 et 95 %), ces scores z sont respectivement de 1.00 1.645 et 1.960 (voir dans les formules ci-dessus).

%I.C. = moyenne +/- Z * SEM

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Dans le processus de comparaison de deux moyennes, trois facteurs vont influencer ou favoriser la probabilité d’observer des différences significatives entre deux groupes. Quels sont-ils?

A

1) La variabilité intergroupes (l’écart mathématique entre les deux moyennes)
2) La variabilité intragroupe (l’écart-type de chaque groupe)
3) Le nombre de sujets par groupe

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Quel est l’effet sur la différence significative de la variabilité intergroupe?

A

Si on calculait un intervalle de confiance de 95 % autour des moyennes de ces deux cliniques, ces deux intervalles se chevaucheraient, ce qui limiterait la possibilité d’observer une différence significative entre ces deux moyennes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Quel est l’effet sur la différence significative de la variabilité intragroupe?

A

La probabilité d’observer une différence est plus faible lorsque la variabilité à l’intérieur des groupes est élevée.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Quel est l’effet sur la différence significative du nombre de sujet par groupe?

A

Un faible nombre de participants diminue la probabilité d’observer une différence significative alors qu’un plus grand nombre de participants augmente cette probabilité.

23
Q

Que signifie un rejet ou une acceptation de l’hypothèse nulle ?

A

Si les tests statistiques montrent qu’il n’y a pas de différence entre les deux moyennes, alors le chercheur accepte l’hypothèse nulle.

Si les tests statistiques montrent qu’il y a une différence entre les deux moyennes, alors le chercheur rejette l’hypothèse nulle.

24
Q

Qu’est-ce que l’hypothèse alternative?

A

Différence significative entre les moyennes des deux échantillons.

25
Q

Qu’est-ce que l’hypothèse nulle?

A

Pas de différence significative entre les moyennes des deux échantillons.

26
Q

Quel est le niveau de signification a et la valeur a?

A

Avant d’utiliser un test statistique pour vérifier l’hypothèse nulle (H0) ou alternative (H1), le chercheur doit donc établir le niveau de probabilité d’énoncer une conclusion erronée à partir des résultats d’un test statistique. Autrement dit, quelle probabilité d’erreur est-il prêt à accepter sur le rejet de l’hypothèse nulle qui constituerait à ce moment-là l’acceptation d’une différence significative entre les deux moyennes?

Cette probabilité d’erreur que l’on appelle la valeur a ou le niveau de signification peut différer d’une étude à l’autre, mais elle se situe généralement à 5 %. Cela signifie qu’il y a seulement 5 % de chances qu’une différence entre les deux moyennes soit due à une erreur d’échantillonnage et ne soit pas une vraie différence. Dans vos articles scientifiques, ce niveau de signification (a) se retrouve habituellement à la fin de la section « méthodologie »

27
Q

Quelle est la valeur p?

A

La probabilité réelle d’énoncer une conclusion erronée à partir des résultats d’un test statistique s’appelle la valeur p (probabilité) et est donnée après chaque test statistique.

28
Q

Quel lien peut-on faire entre la valeur p et la valeur a?

A

Si la valeur p du test statistique est plus petite (inférieure) que la valeur (a) préétablie, le chercheur rejette l’hypothèse nulle et conclut à des différences significatives entre les deux moyennes. Cette conclusion est souvent notifiée dans les articles par le signe suivant (p ≤ 0,05).

29
Q

La détermination des tests pour des comparaisons de moyennes s’effectue selon quels critères?

A

1) Le respect de prémisses de base (normalité des distributions, homogénéité des variances)

2)Les types d’échelles de mesure (nominale, ordinale, par intervalle, proportionnelle)

3) Les types d’échantillons (dépendants ou indépendants)

4) Le nombre d’échantillons (2 ou > 2)

30
Q

Quelles sont les deux grandes catégories de tests statistiques?

A

Les tests paramétriques et non paramétriques.

31
Q

Quelles sont les différences entre les tests paramétriques et non paramétriques?

A

Les tests paramétriques utilisent les paramètres des échantillons (moyenne, écart- type) pour déterminer la présence de différences entre les moyennes.
Les tests paramétriques respectent les 3 prémisses:
1) Distribuée selon une courbe normale.
2) Homogénéité des variances (la variabilité intragroupe pour la variable d’intérêt doit être similaire dans les échantillons)
3) Des échantillons de données sont indépendants lorsqu’ils proviennent de participants différents. Lorsque les données proviennent des mêmes participants mesurés à plusieurs reprises dans le temps (T1 et T2), on dit que les échantillons de données sont dépendants.

Les tests non paramétriques sont basés sur les rangs des valeurs dans les distributions ou sur des fréquences. La seule prémisse qui doit être respectée est l’indépendance ou la dépendance des échantillons de données, puisque les tests statistiques seront utilisés selon le type d’échantillon.

32
Q

De quel test s’agit-il? Nombre d’échantillon = 2, indépendant et paramétrique.

A

Test-t (données indépendantes)

33
Q

De quel test s’agit-il? Nombre d’échantillon > 2, indépendant et paramétrique.

A

Analyse de variance « ANOVA »

34
Q

De quels tests s’agit-il? Nombre d’échantillon = 2, indépendant et non-paramétrique.

A

Mann-Whitney et Test du Chi-carré

35
Q

De quels tests s’agit-il? Nombre d’échantillon > 2, indépendant et non-paramétrique.

A

Kruskal-Wallis H et Test du Chi-carré

36
Q

De quel test s’agit-il? Nombre d’échantillon = 2, dépendant et paramétrique.

A

Test-t (données pairées) - Objectif: déterminer s’il y a une différence au sein d’un même groupe à la suite de deux mesures répétées.

37
Q

De quel test s’agit-il? Nombre d’échantillon > 2, dépendant et paramétrique.

A

Analyse de variance à mesures répétées - Objectif: déterminer s’il y a une différence au sein d’un même groupe à la suite de plusieurs mesures répétées.

38
Q

De quel test s’agit-il? Nombre d’échantillon = 2, dépendant et non-paramétrique.

A

Wilcoxon Signed Rank - Objectif: déterminer s’il y a une différence au sein d’un même groupe à la suite de deux mesures répétées.

39
Q

De quel test s’agit-il? Nombre d’échantillon > 2, dépendant et non-paramétrique.

A

ANOVA de Friedman - Objectif: déterminer s’il y a une différence au sein d’un même groupe à la suite de plusieurs mesures répétées.

40
Q

Complétez la phrase. N’oubliez pas que des échantillons de données sont « ____________ » lorsqu’ils proviennent de participants différents et sont « ____________ » lorsque les données proviennent des mêmes participants mesurés à plusieurs reprises dans le temps.

A

indépendants, dépendants

41
Q

Quel est l’objectif du test Chi-Carré?

A

Déterminer s’il y a une différence entre des groupes.

42
Q

En quoi consiste les fréquences observées et attendues?

A

Fréquences observées: Celles que l’on observe dans la table de contingence. Celles qui sont obtenues lors de la collecte des données.

Fréquences attendues: Celles que l’on observerait s’il n’y avait aucune différence dans les proportions entre les différents groupes.

43
Q

Quels types de tests statistiques permettent de déterminer la relation qui existe entre deux ou plusieurs variables?

A

1) La corrélation simple
2) L’analyse de régression linéaire (simple et multiple)

44
Q

Complétez la phrase. Pour quantifier le degré d’association, on doit avoir recours à la ___________ ___________ (2 mots).

A

Corrélation simple

45
Q

L’utilisation des coefficients de Pearson et de Spearman nécessite la vérification de quelques prémisses de base. Qu’elle est la plus importante?

A

Que la relation entre les deux variables soit linéaire.

46
Q

Dans quelles situations utilise-t-on le coefficient de corrélation de Pearson?

A

Le coefficient de corrélation de Pearson (r) est utilisé pour calculer le degré d’association entre deux variables ayant des échelles par intervalles ou proportionnelles.

47
Q

Dans quelle situation utilise-t-on le coefficient de corrélation de Spearman?

A

Si une des deux échelles est de type ordinal, le coefficient de corrélation de Spearman doit être utilisé.

48
Q

Quelles sont les trois caractéristiques principales du coefficient de Pearson?

A

1) Sa valeur se situe toujours entre -1 et 1. Plus sa valeur approche zéro plus l’association est faible entre les deux variables. Plus sa valeur s’approche de -1 ou de 1, plus l’association est forte.

2) Si la valeur est positive (+), cela signifie que les deux variables évoluent dans le même sens (lorsque X augmente, Y augmente).

3) Si la valeur est négative (-), les deux variables évoluent dans le sens opposé (lorsque X augmente, Y diminue).

49
Q

Que signifie les différentes variables de l’équation d’une régression linéaire simple?

A

Y = bx + a
Y = variable inconnue (dépendante)
x = variable connue (indépendante)
b = pente de la droite de régression
a = ordonnée à l’origine (intercept)

50
Q

Que permet l’analyse de régression linéaire multiple?

A

L’analyse de régression linéaire multiple permet de prédire une variable dépendante (Y) à partir de plusieurs variables indépendantes pour déterminer les meilleurs prédicteurs de cette variable.

51
Q

Vrai ou faux? Une distribution de scores Z a toujours une moyenne de 0 et un écart-type de 1.

A

Vrai.

52
Q

Vrai ou faux? Le Wilcoxon Signed Rank Test est une version non-paramétrique du test-t pour données pairées.

A

Vrai.

53
Q

Vrai ou faux? Après avoir réalisé une ANOVA à 1 facteur, vous observez les statistiques suivantes (F(2, 29)=5,90; p=0.01).

Selon les résultats de l’analyse de variance à 1 facteur ci-dessus, il n’y a pas de différence significative (voir valeur de p) entre les groupes (si la valeur alpha est définie à 0,05).

A

Faux.
Rép: Après avoir réalisé une ANOVA à 1 facteur, vous observez les statistiques suivantes (F(2, 29)=5,90; p=0.01).

Selon les résultats de l’analyse de variance à 1 facteur ci-dessus, il y a une différence significative (voir valeur de p) entre les groupes (si la valeur alpha est définie à 0,05).