Analyse et généralisation des résultats Flashcards

1
Q

Lorsqu’on a les données d’une Mesure Dépendante pour une population entière, nous pouvons calculer son … (ex : score moyen d’un test) Très rare…

A

Paramètre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Mais si nous avons les données d’un sous-ensemble de la population (échantillon), on infère qqch à propos de cette population, donc c’est …

A

une statistique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Le but de l’analyse inférentielle est

A

Estimer ou connaître les caractéristiques des populations

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Analyse descriptive …

A

Synthétiser les données dans des nombres qui décrivent les caractéristiques de l’échantillon ou de la population (autant pour une population entière OU échantillon)

Première étape de l’analyse quantitative

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

L’analyse descriptive s’intéresse particulièrement à trois caractéristiques :

A
  1. La tendance centrale,
  2. La variabilité;
  3. La distribution
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

La tendance centrale?

A

Elle nous dit comment l’échantillon est caractérisé en tant qu’ensemble.

  • La moyenne prend en considération toutes les valeurs dans l’ensemble de données, que ces valeurs soient extrêmes ou non. Elle représente le centre de gravité de l’ensemble des données.
  • Médiane : score qui divise l’échantillon en deux (50%). Elle n’est pas influencée par les scores extrêmes.

La moyenne arithmétique (M ou 𝑥ҧ): Calcule en additionnant tous les éléments de l’ensemble concerné, et en divisant cette somme par le nombre d’éléments additionnés.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

La variabilité?

A

C’est un ensemble de données décrite comme la dispersion des données autour de la moyenne. Les données peuvent être proche ou dispersées. C’est la distance.

Les scores des participants d’un ensemble de données ne sont pas tous pareils.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

La distance des données par rapport à la moyenne est appelé … (pour population), et … (pour un échantillon).

A
  1. écart-type
  2. erreur de standard (SD/σ)

La SD affectera aussi la forme de la DISTRIBUTION de l’ensemble des données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

La distribution?

A

Elle nous permet de caractériser les données, parce qu’elle réfère à la notion de modèle de probabilité

L’application de certains test statistiques (tests t) nécessitent que la distribution des données respecte la loi normale (les données doivent être normalement distribuées.). L’histogramme pourrait nous visuellement représenter la distribution en divisant les données individuelles en classes p.11

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

La distribution normale?

A

On peut superposer une courbe sur la distribution des fréquences des données. Courbe en cloche (ou distribution normale). Elle représente la fréquence ou la densité (probabilité) des données.

Dans la nature, la grandeur (dans le graphique) est un élément qui est naturellement distribué.
Axe Y : Probabilité relative d’observer qqqun qui a une grandeur spécifique. (Exemple : c’est très rare de voir quelqu’un qui est extrêmement petit/grand, alors la courbe en cloche est très base pour cette partie du graphiqu). Mais il est plus commun que qqun est proche de la grandeur moyenne, alors la courbe monte/plus haute. )

On peut donc utiliser la densité de la courbe pour comprendre la probabilité de mesurer une grandeur spécifique dans cette population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Les distributions sont toujours centrées sur la ….

La courbe des bébés est BEAUCOUP PLUS HAUTE que celle des adultes. PCQ il y a bcp plus de possibilités de grandeur chez les adultes. Plus il y a d’options de grandeur, moins il est probable de voir quelqu’un qui aura une grandeur spécifique. La densité de la courbe sera conc plus faible.

A

moyenne de la valeur.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

La forme de la distribution normale est influencée par … (largeur de la courbe).

A

l’écart-type des données

Lorsque les données sont distribuées, on peut utiliser la moyenne et l’écart-type pour les caractéristiques davantage.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Qu’est-ce qu’on veut dire pas “Intervalle de confiance à 95%” ?

A

L’estimation de la position de la taille de la personne en se basant sur la moyenne et l’écart-type. Elle est 95% dans ce cas-ci.

Il y a donc une très grande probabilité qu’un enfant de sexe masculin serait né avec une grandeur de plus ou moins 1.2 pouces de la moyenne de la population. Et il peut probable de mesurer un homme qui mesure plus ou moins 1.2 pouces de la moyenne de la population.

Les deux écart-type gauche et droite représente donc 95% des données (intervalle de confiance). Elle est comme une probabilité aussi.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Le théorème central limite ?

A

Est relié à l’échantillonnage à partir d’une population – il stipule que lorsque de nombreux échantillons d’une population sont tirés, la distribution de l’échantillonnage qui en résulte devient de plus en plus normale lorsque la taille globale de l’échantillon augmente — peu importe la forme de la distribution de la population

Cela se produit même si la distribution d’une population n’est pas normale.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q
  • Distribution uniforme :…
  • Distribution exponentielle :…
  • Asymétrique :…
A
  • Distribution uniforme : Probabilité égale. Pas de différence dans la probabilité de mesurer une valeur. Chaque valeur possible sous la courbe a une probabilité/chance égale d’être mesurée.
  • Distribution exponentielle : Très forte de probabilité dans l’extrémité, et chute de manière exponentielle, alors que la courbe progresse.
  • Asymétrique : Il y a une plus faible/forte sur le côté d’extrémité. On ne sait pas la forme de la distribution de cette population, il faudra mesure la population entière pour le savoir. Mais difficile de faire une inférence dans ce type de distribution sans augmenter la taille de la population (qui tient à se normaliser).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

on ne sait pas à quoi à l’air la distribution de la population. Le théorème de central limite dit : on s’en fiche ! La moyenne de la distribution sera normalement distribuée car … assez grande on peut obtenir une … et la ….

Nous pouvons nous fier à des échantillons pour inférer sur la population.

A
  1. avec une taille de l’échantillonnage
  2. estimation précise de la moyenne
  3. variance de la population
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Statistiques inférentielles?

A

Les statistiques inférentielles sont utilisées pour calculer la probabilité qu’une différence observée entre les moyennes dans une étude reflète l’erreur plutôt que la différence réelle

L’erreur d’échantillonnage (chance aléatoire) est la différence entre la statistique de l’échantillon utilisée pour estimer un paramètre de la population et la vraie valeur du paramètre, qui nous est inconnue
La moyenne de l’échantillon observée pourrait refléter la vraie mesure trouvée dans la population, ou une erreur d’échantillonnage, ou une combinaison des deux

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Voir p.34 !

A

Ok

19
Q
  • Plus les distributions se chevauchent, … la différence entre les moyennes est vraie;
  • Moins les distributions se chevauchent, … la différence entre les moyennes est vraie.
A
  1. Moins
  2. Plus

C’est comme cela que les statistiques inférentielles évaluent les différences entre les moyennes d’échantillon afin d’inférer si la différence existe réellement dans la population.

20
Q

La taille de l’échantillon joue un rôle important lorsqu’on veut déterminer si deux moyennes sont statistiquement différent.

(Plus l’échantillon est …, plus la distribution … de la moyenne, plus cette moyenne devient …).

A
  1. Grand
  2. se rapproche
  3. exacte
21
Q

Les statistiques inférentielles commencent par un énoncé de l’hypothèse …et de l’hypothèse alternative (ou de recherche)

A

Nulle !

22
Q

H0 (hypothèse nulle) : les moyennes de la population sont … et que la différence observée est due à …
H1 (hypothèse de recherche) est que les moyennes de population …

A
  1. égales
  2. une erreur
  3. ne sont en fait pas égales
23
Q

test t indépendant ?

A

estime s’il existe une différence réelle entre les moyennes de deux groupes, en utilisant la différence des moyennes des groupes par rapport à l’erreur standard (ES) combinée des deux groupes.

24
Q

Distribution t?

A

Échantillon évalué en utilisant le test t.

Elle est utilisée à la place de la distribution normale parce que les vraies moyenne et variance des populations sont inconnues, et on utilise donc une estimation par échantillonnage - mais un échantillon est distribué normalement seulement si la taille d’échantillon est suffisante - la distribution t tient donc compte de la taille de l’échantillon.

25
Q

Si la taille d’échantillon augmente -> distribution t se rapproche de la …

A

distribution normale.

  • La forme de la distribution t est donc dépendante de la taille d’échantillon
26
Q

Qu’est-ce qui caractérise la distribution t (dépendante de la taille d’échantillon)?

A

degrés de liberté (df)

calculé en utilisant les tailles d’échantillons des deux groupes : N1 + N2 – 2 (ou le nombre total de participants moins le nombre total de groupes)

Ex : groupe 1 = 20, groupe 2 = 25
(20 + 25) – 2 = Degré de liberté.

27
Q

Un test t nous permet d’utiliser la probabilité pour décider de … l’hypothèse nulle en utilisant quelque chose de similaire à une distribution d’échantillonnage

p.41

A

Rejeter

  • La distribution t est arrangée en assumant que l’hypothèse nulle (H0 ) est vrai (valeur de 0 en centre)
28
Q

La distribution t se rapproche de la distribution normale lorsque le degré de liberté (df) ….

p.42

A

Augmente

Remarque, les df plus faible démontre une distribution plus large (en hauteur) dans les extrémités.

29
Q

Formule pour un test t indépendant (comparant deux moyennes de groupe) :

A

t = Différence intergroupe /
Variabilité d’échantillonnage

La différence intergroupe est simplement la différence entre les deux moyennes
La variabilité échantillonnage = (ED G1 / Nb G1) + (ED G1 / Nb G1)

30
Q

Si une valeur t calculée tombe sous la région 95% de la courbe, elle est considérée comme une valeur probable observée si l’hypothèse nulle est vraie – Donc…

p.47-48

A

nous acceptons l’hypothèse nulle (il n’y a pas de différence réelle)

31
Q

Si la valeur t est assez grande pour tomber en-dehors du 95% (seuil
critique) de la courbe, la probabilité que l’hypothèse nulle soit vraie est maintenant assez faible. Donc…

p.49

A

nous rejetons l’hypothèse nulle et acceptons l’hypothèse de recherche (il y a une différence réelle)

Lorsque l’on accepte l’hypothèse de recherche, on dit du résultat de l’étude qu’il est statistiquement significatif

32
Q

Ce 5% de la courbe est appelé

A

seuil alpha

Le niveau alpha est sélectionné par le chercheur, et est généralement de 5 % ou moins

33
Q

Avant d’utiliser la distribution t, nous devons également
déterminer la direction de notre hypothèse. Il y a 2 type de test

A

Test t unilatéral = (ex : Groupe A aurait une moyenne plus élevée que Groupe B)
* Avantage majeure : Le seuil pour obtenir une valeur t suffisamment grande pour rejeter l’hypothèse nulle est diminué
* un test t unilatéral ne peut être utilisé que s’il y a vraiment une direction spécifique présumée avant l’expérience

Test t bilatéral = (ex : Groupe A et B sont différentes, l’un a une moyenne plus élevée que l’autre)
* On divise la distribution en deux, et l’alpha est dans chaque côté (2.5% est la division du 5% de chaque extrémité qui tombe dans la zone alpha)

34
Q

Mais comment devons-nous savoir si notre valeur t est assez grande pour dépasser le seuil critique?

A

Pour trouver le « t critique » dans cette exemple, vous avez besoin des informations suivantes :

1) Les degrés de liberté (ex: 18)
2) L’alpha (ex:, test bilatéral; seuil = 0,05 / 2
= 0,025) ou (unilatéral = 0,05)

Nous pouvons utiliser le tableau de t critiques pour trouver la valeur que nous devons dépasser

Essentiellement, la valeur du t critique prend en compte les degrés de liberté et le
niveau alpha choisi et ajuste la distribution t en conséquence - créer un seuil critique

35
Q

Comment interpréter la différence de moyenne?

A
  • Ampleur de l’effet faible = Faible taille d’effet (ex : GR = 55 vs GR2 = 59)
  • Ampleur de l’effet grande = Grande taille d’effet (ex : GR = 76 vs GR2 = 21)
36
Q

Qu’est-ce que la valeur-p?

A

le niveau de significativité (dans la différence d’ampleur)

  • Les chercheurs doivent donc considérer et le niveau de significativité (valeur-p) et le taille d’effet d’un résultat, afin de faire une interprétation adéquate
37
Q

Une méthode commune pour calculer une taille d’effet pour deux moyennes d’échantillons est d’utiliser le

A

d de Cohen

d =
(Moyenne G1 - Moyenne G2) /
V ((SD1 + SD2)/ 2)

38
Q
  • D de Cohen de 0,2 = taille d’effet « petite »
  • D de Cohen de 0,5 = taille d’effet « moyenne »
  • D de Cohen de 0,8 = taille d’effet « grande »
A

Ok

39
Q

La décision de rejeter l’hypothèse nulle repose sur des probabilités plutôt que sur des certitudes…

Mais il existe 2 type d’erreur sur cette décision

A

On rejette l’hypothèse nulle, mais en réalité, elle est vrai = Erreur de type 1
On accepte l’hypothèse nulle, mais en réalité, elle est fausse = Erreur de type 2

40
Q

Élabore sur les deux types d’erreur : Pk cela se produit?

A

Erreur 1 = lié au seuil de signification (alpha, ex : 0,05). En d’autres termes, on a 5% d’avoir fait une erreur. Et dans ce cas, elle tombe dans ce seuil.
Erreur 2 = Lié par 3 facteurs
* Alpha : alpha bcp trop faible pour éviter l’erreur 1, mais risque de forcer la valeur sous la courbe (il n’y a pas de différence) alors que l’hypothèse nulle est fausse (Il y a une différence)
* Taille de l’échantillon : trop petite, on ne peut détecter les différences
* Taille de l’effet : si les tailles sont trop petites, le résultat peut être insignifiant alors qu’il l’est.

41
Q

Quelles raisons pourrait expliquer l’erreur de type 2 ? (3)

A
  • Des instructions expérimentales incompréhensibles données au participant
  • Une manipulation inadéquate de la variable indépendante
  • L’utilisation d’une mesure dépendante peu fiable
42
Q

Si une expérience est répétée plusieurs fois utilisant des méthodes bien conçues et l’hypothèse nulle continue d’être soutenue, nous pouvons être plus confiants que c’est la bonne décision

A

Ok

43
Q

À quoi sert la correction Bonferroni?

A

Corriger notre niveau ou “seuil” alpha pour les comparaisons multiples

Car chaque fois qu’on fait un test statistique (ex: avec 3 groupes), la probabilité de faire une erreur de type 1 s’additionne dans une même étude.

44
Q

Quel est la formule de la correction Bonferroni?

A

Seul alpha original /
No de tests statistiques effectués

ex:
0.05 /
3 (groupes)
=égale
0.017

Maintenant, une valeur t doit dépasser le seuil au niveau de probabilité 0.017 (alpha corrigé) pour être considérée comme significative