cours 9 Flashcards

1
Q

Qu’est ce que le paramètre de la population?

A

C’est lorsque nous avons les données d’une mesure dépendante particulière (ex: le score à une échelle) pour une population entière, nous pouvons calculer le paramètre (ex: le score moyen d’une certaine population)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est ce qu’une statistique?

A

C’est si nous collectons des données seulement à partir d’un sous-ensemble de la population (un échantillon) et que nous visons à inférer quelque chose à propos de cette population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quelle est le but de l’analyse statistique inférencielle?

A

C’est d’estimer ou de connaître (même si ça peut être imparfait) les caractéristiques des populations, en se basant sur les caractéristiques des échantillons de ces populations

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est ce que l’analyse descriptive?

A
  • Si un ensemble de données provienne d’un échantillon ou de la population entière, ça consiste à synthétiser les données dans des nombres qui décrivent les caractéristiques de l’échantillon ou de la population.
  • L’analyse descriptive s’intéresse à trois choses : la
    tendance centrale, la variabilité et la distribution
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Dans l’analyse descriptive, qu’est ce que la tendance centrale?

A

Cette mesure dit comment l’échantillon est caractérisé en tant qu’ensemble. Il y a plusieurs mesures de tendance centrale :
1. moyenne : quand il y a des valeurs extrêmes dans les données, ça influencent le calcul de la moyenne, ce qui peut parfois masquer des réalités

  1. médiane : score qui divise l’échantillon en deux (50% des scores sous la médiane, et 50% des scores au-dessus). Elle n’est pas influencée par les scores extrêmes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Dans l’analyse descriptive, qu’est ce que la variabilité?

A
  • C’est lorsque les scores des participants d’un ensemble de données ne sont pas tous pareils. C’est comme la dispersion des données autour de la moyenne. Les données peuvent être proches de la
    moyenne ou plus dispersées autour de la moyenne. il s’agit donc d’une distance.
  • Dans les analyses descriptive, c’est l’écart-type (l’erreur standard), ce qui est la moyenne de l’écart de
    chaque donnée individuelle par rapport à la moyenne.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Par quoi est représenté l’écart-type dans l’analyse descriptive?

A
  • C’est représenté comme SD (standard deviation) ou avec le signe de sigma (σ)
  • Un SD plus élevé reflète un plus haut niveau de variabilité dans les données (quand la distance entre les scores est en moyenne plus élevée)
  • Un SD plus faible reflète une plus faible variabilité dans les données (quand la distance entre les scores est en moyenne plus faible)
  • Le SD affectera aussi la forme de la distribution de l’ensemble des données
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est ce que l’étude de la distribution d’un ensemble, dans l’analyse descriptive?

A

Elle nous permet de caractériser les données, mais elle réfère aussi à la notion de modèle de probabilité. Ex : l’application de certains tests statistiques (test t)
nécessitent que la distribution des données respecte la loi normale, les données doivent être normalement distribuées.
- Une bonne façon d’avoir une vue d’ensemble sur la distribution est : construire une distribution de fréquence des données (histogramme)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Pour dessiner une distribution normale avec un intervalle de confiance de 95%, que faut-il connaître?

A

1) la moyenne des données, qui nous dit où le centre de la courbe se situe
2) L’écart-type, qui nous dit à quel point la courbe sera large (plus elle est large, plus elle est courte (grand ecart-type) et plus elle est étroite, plus elle est haute (petit écart-type)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’est ce que le théorème central limite?

A
  • Un théorème qui stipule que lorsque de nombreux échantillons d’une population sont tirés, leur distribution devient de plus en plus normale lorsque la taille globale de l’échantillon augmente, peu importe la forme de la distribution de la population
  • En gros, nous pouvons obtenir une estimation normalement distribuée de la moyenne et de la variance d’une population avec un échantillon suffisamment grand. pk?
  • car si nous prenions la moyenne de tous les échantillons de la distribution, elle serait égale à la moyenne de la population
  • Et si on calcule l’écart-type de tous les échantillons et on mesure leur moyenne, elle correspondrait à
    l’écart type de la population
    et ce, si la taille de l’échantillon globale assez grande
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est ce qu’une population et un échantillon?

A
  • Une population est l’ensemble du groupe d’intérêt (ex: toutes les personnes atteinte de l’Alzheimer)
  • Un échantillon est un sous-ensemble de la population cible
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’est ce que les statistiques inférencielles?

A
  • Les statistiques inférentielles utilisent un échantillon de la population pour caractériser quelque chose qui est vrai à propos de cette population et créent des énoncés sur la probabilité qu’un résultat basé sur un échantillon, soit également observé dans la population
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Pourquoi dans les statistiques inférentielles, la différence entre deux moyennes de 2 ne sera presque jamais zéro, pourquoi?

A

parce qu’il y a toujours une certaine quantité d’erreur d’échantillonnage dans nos observations
L’erreur d’échantillonnage : la différence entre la statistique de l’échantillon utilisée pour estimer un
paramètre de la population et la vraie valeur du paramètre, qui nous est inconnue = chance aléatoire

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

vrai ou faux, la moyenne de l’échantillon observée pourrait refléter la vraie mesure trouvée dans la
population, ou une erreur d’échantillonnage, ou une combinaison des deux. Les statistiques inférentielles sont donc utilisées pour calculer la probabilité qu’une
différence observée entre les moyennes dans une étude reflète l’erreur plutôt que la différence réelle

A

vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est ce que l’erreur-standard? (ES)

A

r la moyenne de l’échantillon et sa mesure de variance

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Vu qu’on assume que les échantillons sont distribués normalement, ont peut utiliser la moyenne de l’échantillon et sa mesure de variance, appelée l’erreur standard (ES), pour estimer les paramètres de la population

A

vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

plus 2 échantillons/distributions) se chevauchent, moins ils sont différents entre eux, moins la différence observé entre les moyennes est vraie. Puis, moins 2 distributions se chevauchent, plus ils sont différent, et plus il est probable que la différence entre les moyennes est vraie.

A

vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Comment fonctionne les statistiques inférentielles?

A

Ça commence par une hypothèse nulle et une
l’hypothèse alternative (ou de recherche) :
1. hypothèse nulle (H0) : les moyennes de la population sont égales et la différence observée est due à une erreur
2. hypothèse de recherche (H1) :les moyennes de population ne sont pas égales

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Vrai ou faux, quand l’hypothèse nulle (H0) est vraie,
il y a un chevauchement complet entre les distributions des deux populations, mais quand l’hypothèse de recherche (H1) est vraie, il y a peu de chevauchement entre les distributions des deux populations

A

vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Qu’est ce que le test t indépendant?

A
  • Ce test estime s’il existe une différence réelle entre les moyennes de deux groupes, en utilisant la différence des moyennes des groupes par rapport à l’erreur standard combinée des deux groupes.
  • Lorsque les échantillons sont évalués en utilisant un test t, une distribution t est utilisée
  • La distribution t est utilisée à la place de la distribution normale parce que les vraies
    moyenne et variance des populations sont inconnues, on utilise alors une estimation par échantillonnage
  • un échantillon est distribué normalement seulement si la taille d’échantillon est suffisante - la distribution t tient donc compte de la taille de l’échantillon
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Vrai ou faux, La forme de la distribution t est dépendante de la taille d’échantillon (pr qu’elle soit normal) qui est caractérisée par le nombre de degrés de liberté (df) : calculé en utilisant les tailles
d’échantillons des deux groupes : N1 + N2 – 2 (ou le nombre total de participants moins le nombre total de groupes)

A

vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Vrai ou faux, La distribution t est arrangée en assumant que l’hypothèse nulle (H0) est vrai. C’est pourquoi il y a une valeur t de 0 au centre
de la distribution t , qui reflète une absence de
différence entre les moyennes des populations

A

vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Vrai ou faux, La distribution t est arrangée en assumant que l’hypothèse nulle (H0) est vrai. C’est pourquoi il y a une valeur t de 0 au centre de la distribution t , qui reflète une absence de
différence entre les moyennes des populations. Les valeurs t augmentent donc de chaque côté de la distribution

A

vrai

24
Q

Quelle est la formule bref du test t?

A

t = Différence intergroupe / Variabilité d’échantillonnage
où :
diff. intergroupe = différence entre les 2 moyennes
variabilité d’échant. = quantité de variabilité combinée des scores qui entourent les moyennes, c’est une estimation de la quantité d’erreur d’échantillonnage dans les échantillons

La valeur de t augmente lorsque la différence entre les moyennes d’échantillon augment, seulement
quand la variabilité d’échantillonnage est assez faible

25
Q

Vrai ou faux, une valeur t plus élevée représente une plus grande différence entre les deux moyennes avec un niveau faible de variance combinée estimée
rappel : le test t est une estimation de si les
deux populations sont différentes ou non

A

vrai

26
Q

dans quelle cas acceptons-nous l’hypothèse de recherche (H1)? (rejet de H0)

A
  • si la valeur t est assez grande pour tomber en-dehors du 95% sous la courbe, la probabilité que
    l’hypothèse nulle soit vraie est mtn assez faible pour que nous puissions affirmer avec confiance que les deux populations sont différentes

** quand on accepte l’hypothèse de recherche, on dit
du résultat de l’étude qu’il est statistiquement significatif**

27
Q

dans quelle cas acceptons-nous l’hypothèse nulle (H0)?

A
  • si la valeur t calculée tombe sous la région de 95% de la courbe, elle est considérée comme une valeur probable observée si l’hypothèse nulle est vraie – la
    valeur t n’a donc pas été suffisamment grande pour
    convaincre que les deux populations sont différentes
28
Q

Vrai ou faux, pour qu’une valeur t indique que le résultat est statistiquement significatif, elle doit être assez grande pour tomber à l’extérieur de la région
de 95% sous la courbe. Dans ce cas, on dit qu’elle dépasse un seuil critique

A

vrai

29
Q

comment calcule-t-on le degré de liberté?

A
  • en utilisant les tailles d’échantillon des deux groupes : N1 + N2 - 2 (le nombre total de participants moins le nombre total de groupes) = 10 + 10 - 2 = 18
    **Alors que les degrés de liberté augmentent avec la taille d’échantillon, le seuil critique que la valeur t doit passer pour être considérée statistiquement significative diminue. pk? car lorsque que la taille
    d’échantillon augmente, la distribution t devient de plus en plus normale, et ses extrémités deviennent de plus en plus étroites alors que la variance diminue également
30
Q

Vrai ou faux, dans plusieurs tests statistiques, incluant le test t, la taille de l’échantillon est caractérisée par les degrés de liberté

A

vrai

31
Q

Vrai ou faux, dans les test t, plus la taille de l’échantillon augmente, plus le degré de liberté augmente

A

vrai

32
Q

Pourquoi quand la taille de l’échantillon augment dans les test t, plus la variance diminue?

A

Car l’estimation de la variance de la population autour de la moyenne diminue lorsque la taille de l’échantillon augmente, rendant la courbe plus étroite
et donc plus proche de la moyenne estimée de la
population, qui elle se trouve au centre

33
Q

Qu’est ce que le seuil critique?

A
  • Lorsqu’une valeur t tombe à l’extérieur de la région de 95% sous la courbe, et nous rejetons l’hypothèse nulle, nous disons que la valeur t dépasse un seuil critique. Ce 5% de la courbe est appelé le seuil alpha / niveau alpha qui est sélectionné par le chercheur, et est souvent de 5 % ou moins.
  • il est possible que, rarement, le calcul de la valeur t
    dépasse le seuil critique, même si l’hypothèse nulle est vraie, la probabilité de ça correspond au niveau alpha, ou 5% du temps dans ce cas-ci. Cela signifie que le niveau alpha sélectionné est lié à la probabilité d’erreur dans un test statistique que le chercheur est prêt à tolérer
34
Q

Qu’est ce qu’un test t unilatéral?

A

On parle de direction de l’hypothèse, Si notre hypothèse est directionnelle (ex:, Groupe 1 >
Groupe 2/ ou l’inverse), nous pourrions utiliser un test t unilatéral

35
Q

Qu’est ce qu’un test t bilatéral?

A
  • On parle de direction de l’hypothèse, Si notre hypothèse est que les deux groupes sont différents (ex:, Groupe ≠ Groupe ), on utilise un test t bilatéral.
  • AVEC CE TEST, on divise le seuil alpha en deux et le plaçons de chaque côté de la distribution t (0.05, donc 0.025 est placé de chaque côté de la courbe) PK?
  • car la différence entre les groupes pourrait aller dans les deux sens :
    (ex:, Groupe 1 > Groupe 2 OU Groupe 1 < Groupe 2) donc la valeur t pourrait être située à gauche ou à droite de la courbe, selon le groupe qui a la moyenne la plus élevée
36
Q

Vrai ou faux, un test unilatéral place simplement la probabilité totale d’erreur d’un côté de la courbe, tandis qu’un test bilatéral divise la probabilité et la place des deux côtés de la courbe

A

vrai

37
Q

L’utilisation d’un test unilatéral présente un avantage
majeur, lequel?

A

Car en plaçant l’ensemble du niveau alpha d’un côté de la courbe, le seuil pour obtenir une valeur t suffisamment grande pour rejeter l’hypothèse nulle est diminué vu qu’il y a une plus grande zone sous la courbe qui représente le niveau alpha.

38
Q

Vrai ou faux, un test t unilatéral ne peut être utilisé que s’il y a vraiment une direction spécifique présumée avant l’expérience
(ex: Groupe 1 > Groupe 2)

A

vrai

39
Q

comment on fait pour savoir si notre valeur t est assez grande pour dépasser le seuil critique? (5%/2)

A

il faut calculer une valeur qu’il faudrait que
notre valeur t atteigne pour être considérée comme assez grande, et qui prendrait en considération les degrés de liberté et le niveau alpha = le t critique trouvé dans le tableau à l’aide de 2 infos :
1. Les degrés de liberté (ex: 18)
2) L’alpha (ex:, test bilatéral; seuil = 0,05 / 2 = 0,025)

40
Q

on peut aussi utiliser la valeur P pour savoir si notre valeur t est significative. explique

A
  • La valeur P est la probabilité que l’hypothèse nulle soit vraie et se situe entre 0 et 1
  • ex : si la valeur P vaut 0.25, alors il y a 25% de probabilité qu’il n’y a aucune difference réelle entre les populations
  • Si la valeur P dépasse un seuil sélectionné,
    elle indique alors que le résultat est significatif
41
Q

Vrai ou faux, dans les test ANOVA, lorsque l’hypothèse nulle (H0) est vraie, il y a un chevauchement complet entre les trois (ou plus)
distributions des populations (3 courbes l’une sur l’autre)

A

vrai

41
Q

Vrai ou faux, dans les test ANOVA, lorsque l’hypothèse nulle (H0) est vraie, il y a un chevauchement complet entre les trois (ou plus)
distributions des populations (3 courbes l’une sur l’autre)

A

vrai

41
Q

Vrai ou faux, dans les test ANOVA, lorsque l’hypothèse nulle (H0) est vraie, il y a un chevauchement complet entre les trois (ou plus)
distributions des populations (3 courbes l’une sur l’autre)

A

vrai

42
Q

vrai ou faux, dans les test ANOVA, Lorsque l’hypothèse de recherche (H1) est vraie, il y a très peu de chevauchement entre les trois (ou plus) distributions des populations (3 courbes séparé)

A

vrai

43
Q

Les chercheurs doivent considérer le niveau de significativité (valeur P) et la taille de l’effet d’un résultat, afin de faire une interprétation adéquate

A

vrai

44
Q

Quelle calcul est utilisé pour calculer la taille de l’effet?

A

c’est le d de cohen = (moyenne gr 1 - moyenne gr 2) /
racine(SD1carré + SD2 carré)/2)

  • Un d de Cohen de 0,2 est considéré comme une taille d’effet « petite »,
  • Un d de Cohen de 0,5 représente une taille d’effet « moyenne »,
  • Un d de Cohen de 0,8 représente une « grande » taille d’effet
44
Q

Quelle calcul est utilisé pour calculer la taille de l’effet?

A

c’est le d de cohen = (moyenne gr 1 - moyenne gr 2) /
racine(SD1carré + SD2 carré)/2)

  • Un d de Cohen de 0,2 est considéré comme une taille d’effet « petite »,
  • Un d de Cohen de 0,5 représente une taille d’effet « moyenne »,
  • Un d de Cohen de 0,8 représente une « grande » taille d’effet
44
Q

Quelle calcul est utilisé pour calculer la taille de l’effet?

A

c’est le d de cohen = (moyenne gr 1 - moyenne gr 2) /
racine(SD1carré + SD2 carré)/2)

  • Un d de Cohen de 0,2 est considéré comme une taille d’effet « petite »,
  • Un d de Cohen de 0,5 représente une taille d’effet « moyenne »,
  • Un d de Cohen de 0,8 représente une « grande » taille d’effet
45
Q

vari ou faux, lorsque les échantillons à l’étude ont une immense taille (2M), c’est la taille d’effet qui est utilisée pour déterminer si un résultat représente une réelle différence entre les moyennes des échantillons

A

VRAI

46
Q

Qu’est ce qu’une erreur de type 1, et une erreur de type 2?

A

erreur de type 1 : Lorsqu’on rejette H0 alors que H0 est vraie (invente des choses)
erreur de type 2 : lorsqu’on accepte le H0 alors que le H0 est faux (il y a une relation finalement)

46
Q

Qu’est ce qu’une erreur de type 1, et une erreur de type 2?

A

erreur de type 1 : Lorsqu’on rejette H0 alors que H0 est vraie (invente des choses)
erreur de type 2 : lorsqu’on accepte le H0 alors que le H0 est faux (il y a une relation finalement)

47
Q

Vrai ou faux, la probabilité d’une erreur de type 1 est déterminée par le choix du seuil de signification
ou alpha (ex: 0,05) qui px être modifier en augmentant ou diminuant le seuil alpha.

A

vrai

48
Q

quelles sont les 3 facteurs qui détermine la probabilité de faire une erreur de type 2?

A

1 ) L’alpha choisi : si on fixe un alpha très faible (ex: 0,000005) pour éviter de faire une erreur de type 1, on augmente nos chances de faire une erreur de Type 2 !

2) La taille de l’échantillon : les différences réelles sont plus susceptibles d’être détectées lorsque la taille de l’échantillon est plus grande

3) La taille de l’effet : si la taille de l’effet est grande, une erreur de type 2 est peu probable, MAIS des tailles d’effet plus petites peuvent produire un résultat insignifiant même lorsque l’effet est réel

49
Q

Un chercheur pourrait obtenir un résultat non significatif pour de nombreuses raisons, nommes-en 3.

A
  1. Des instructions expérimentales incompréhensibles données au participant
  2. Une manipulation inadéquate de la variable indépendante
  3. L’utilisation d’une mesure dépendante peu fiable
50
Q

vrai ou faux, lorsque nous effectuons un test statistique dans une étude avec un alpha de 0.05, nous savons que nous allons faire une erreur de type 1, 5 fois sur 100

A

vrai

51
Q

Faire plusieurs test statistiques dans 1 même étude augmente nos chance de faire une erreur du type 1. Comment peut on diminuer ce risque?

A
  • il faut corriger notre seuil alpha pour les comparaisons multiples en utilisant une correction de Bonferroni :
    alpha corrigé = Seuil alpha original / nb de tests statistiques effectués
    ex : 0.05 / 3 = 0.017 (alpha corrigé)
  • Mtn, une valeur t doit dépasser le seuil au niveau de probabilité 0.017 (alpha corrigé) pour être considérée comme significative