Cours 4 - Tests d'hypothèses sur les moyennes et puissance statistique Flashcards

1
Q

Que se passe-t-il lorsqu’on pige plus d’échantillon dans une distribution d’échantillonnage (ex: n=30 vs n=2) ?

A

Plus il y a d’échantillons, plus l’écart-type rapetisse, et plus grande est la certitude que la moyenne d’échantillon soit proche de la vraie moyenne,

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Comment appelle-t-on l’écart-type d’une distribution d’échantillonnage ?

A

L’erreur standard

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Que peut-on dire de la moyenne d’échantillon si n=30 ?

A

La moyenne de l’échantillon est plus rarement loin de la moyenne de population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Que peut-on dire de la moyenne d’échantillon si n=2 ?

A

La moyenne de l’échantillon est plus souvent loin de la moyenne de population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Que se produit-il avec la variabilité de la distribution lorsque les échantillons sont plus grands ?

A

Elle diminue, c’est pourquoi l’erreur standard diminue aussi

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Signification de n=10

A

On a utilisé des échantillons de 10 unités chacun, pour calculer chacune des moyennes de la distribution d’échantillonnage

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Que dit le théorème central limite ?

A
  1. Plus n des échantillons qu’on utilise pour distribution d’échantillonnage est grand, plus l’erreur standard est petite
  2. On peut donc avoir confiance que n’importe quelle moyenne est en général plus près de la vraie moyenne de population
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quand fait-on un test Z à une seule moyenne ?
Exemple diapos 16 à 35

A
  • On a 1 seul score qu’on veut comparer à une population
  • Quali
  • On connaît écart-type de population
  • On connaît moyenne de population ou on en a une bonne idée
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Que permet de faire le théorème central limite pour faire un test d’hypothèse sur des moyennes ?

A

Il permet de calculer ce dont on a besoins pour effectuer le test d’hypothèses

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Que signifie x avec une barre au dessus ?

A

Moyenne échantillon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Que signifie mu ?

A

Moyenne population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Que signifie sigma ?

A

Écart type population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Que signifie s ?

A

Écart-type échantillon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Selon le théorème central limite, considérant une population avec moyenne mu et variance sigma au carré, la distribution d’échantillonnage de la moyenne aura:

A
  1. Une moyenne mu aussi
  2. Une variance de sigma carré / n
  3. Un écart-type de sigma / racine de n

La distribution s’approchera d’une distribution normal à mesure que n augmente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quelle est la formule du score z ?

A

z = x barre en haut - mu / sigma de l’échantillon (écart-type population /racine de n)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Lorsqu’on obtient le score z (ex: 1.5) , que trouve-t-on lorsqu’on observe la table des z ?

A

La probabilité p d’obtenir un score z de 1,5 si H0 est vraie.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Après avoir trouvé le p, que doit on faire dans le test z?

A

On doit observer quelles sont les probabilités d’obtenir une différence aussi grande que 1.34 dans une direction ou dans l’autre (extrémité droite et gauche du graph qui représentent la p)
On additionne donc p+pVoir

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Décision statistique du test Z

A

Voir diapo 34-35

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Quel test peut-on faire quand on ne connaît pas l’écart type de la population (sigma) ?

A

Test t de Student avec une seule moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Que faut-il avoir pour faire le test t de Student ?

A

Une seule moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Dans le test t sur un échantillon, comment peut-on estimer le paramètre sigma ?

A

On calcule s (l’écart-type pour un échantillon)
s = racine carrée de s2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Dans un test t sur un échantillon, comment peut-on estimer le paramètre sigma 2 ?

A

On calcule s2 (variance échantillon)
Voir diapo 42

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Formule du test t

A

t = x barre en haut - mu / s sur la racine carrée de n

La façon la plus facile d’obtenir s est de d’abord calculer s2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Par quoi remplace-t-on s/racine de n dans la formule du test t puisqu’On n’a pas le s ?

A

racine de s2 /n

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

De quoi dépend la forme de distribution du t de Student ?

A

Nb de degrés de liberté

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Comment calcule-t-on dl pour un test t avec un seul échantillon ?

A

dl = n-1

26
Q

Quelle condition faut-il pour que la statistique t soit raisonnablement comparée à la distribution t ?

A

Il faut que l’échantillon ait un n assez grand pour que la distribution d’échantillonnage de la moyenne soit normale (n plus grand que 25 ou 30)

27
Q

Condition d’application du test-t sur un échantillon ?

A

L’échantillon doit provenir d’une population distribuée normalement

28
Q

Que se passe-t-il lorsque la distribution t a un dl= infini ?

A

t devient équibalent à z

29
Q

Qu’est-ce que le t obtenu ?

A

Le t obtenu après utilisation de la formule du test t

30
Q

Qu’est-ce que le t critique ?

A

Le t obtenu dans la table de Student

31
Q

Que se passe-t-il quand le t obtenu est plus extrême que le t critique ?

A

On rejette H0
Si p est plus petit que alpha, on rejette H0 aussi

32
Q

Quelle est la formule du test t avec 2 moyennes pour échantillons indépendants:

A

t = (valeur 1 - valeur 2) / erreur standard

33
Q

Dans le test t avec 2 moyennes pour échantillons indépendants, comment conclue-t-on d’une différence significative ?

A

Quand la probabilité d’observer une valeur t est plus petite que celle fixée (seuil alpha)

34
Q

Principale différence entre les différentes version du test :

A

Manière de calculer l’erreur standard

35
Q

Lire et comprendre formule test t avec échantillons indépendants

A

60 à 71

36
Q

À quoi sert l’estimation combinée de la variance (s au carré p) ?

A

Si les échantillons ne sont pas de même taille, on ne peut pas leur donner la même influence sur le calcul de l’erreur standard, donc on pondère leurs s2 par leurs degrés de liberté (n-1)
voir formule diapo 72

37
Q

Pourquoi peut-on calculer une taille d’effet ?

A

La valeur p seule ne nous dit pas grand chose.

38
Q

Nomme une taille d’effet courante et explique ce qu’il indique

A

le d de Cohen
Nb d’écarts-types qui sépare les 2 moyennes
Il nous indique l’importance ou la magnitude de l’effet trouvé

39
Q

Quelle est la formule du d de cohen ?

A

d= (x1 barre en haut - x2 barre en haut) / racine carrée de estimation combinée de variance

40
Q

Comment est-il suggéré d’interpréter le d de Cohen ?

A

Petit: 0.2
Moyen: 0.5
Grand: 0.8

41
Q

Conditions d’applicaition du test t sur échantillons indépendants :

A

Données sur échelle d’intervalle ou ration
Normalité de distribution d’échantillonnahe (n>30)
Indépendance des observations
Homogénéité des variances
N égaux, sinon, estimation combinée de variance

42
Q

Quand peut-on qualifier de robuste un test-t ?

A

Quand il est peu affecté par des écarts modérés à ses conditions d’application, il fonctionne quand même même si on est un peu à côté des conditions

43
Q

Qu’est-ce qu’un estimateur robuste ?

A

Peu affecté par les valeurs extrêmes
Par exemple, la médiane est peu affectée par des données extrêmes ou aberrantes

44
Q

Qu’est-ce que la puissance statistique ?

A

Probabilité de trouver un effet qui est réellement là
En d’autres mots, probabilité de rejeter correctement l’hypothèse nulle quand l’hypothèse nulle est fausse

45
Q

Pourquoi veut-on maximiser la puissance ?

A

Une plus grande puissance statistique nous aide à supporter notre hypothèse de recherche (H1)

46
Q

Comment appelle-t-on: Ne pas rejeter H0 alors que H0 est vraie ?

A

1 - alpha (non rejet correct)

47
Q

Comment appelle-t-on: Rejeter H0 alors que H0 est vraie ?

A

Erreur de type 1 (erreur alpha)

48
Q

Comment appelle-t-on: Ne pas rejeter H0 alors que H0 est fausse ?

A

Erreur de type 2 (erreur beta)

49
Q

Comment appelle-t-on: Rejeter H0 alors que H0 est fausse ?

A

1- Beta (rejet correct)

50
Q

Puissance: Quand rejette-t-on l’hypothèse nulle ?

A

Si notre échantillon semble trop extrême par rapport à la distribution d’échantillonnage sous H0.
Pour ce faire, on fixe le seuil alpha. Si moyenne d’échantillon est +extrême que seuil alpha, on rejette H0.

51
Q

Observe la figure pour illustrer le concept de puissance statistique

A

Diapo 97

52
Q

De quoi dépend la puissance ? (3)

A
  1. Seuil alpha
  2. Hypothèse alternative (H1)
  3. Taille d’échantillon (n) et variance population
53
Q

En quoi la puissance dépend-elle du seuil alpha ?

A

Augmenter le seuil alpha permet d’augmenter la puissance
Cependant, cela augmente aussi le risque d’erreur de type 1
Faire un test unidirectionnel augmente aussi la puissance
Voir diapo 99

54
Q

En quoi la puissance dépend-elle de H1 ?

A

Plus la distribution d’échantillonnage de H1 est loin de celle de H0, plus la puissance est grande.

55
Q

En quoi la puissance dépend-elle de la taille d’échantillon et de la variance?

A

Plus n est grand, plus erreur standard est petite, ce qui augmente la puissance
Plus variance est petite, plus erreur standard est petite, ce qui augmente la puissance

56
Q

Quelle est l’option la plus facile pour augmenter la puissance ?

A

Modifier n

57
Q

Étapes pour calculer la taille d’échantillon requise pour une bonne puissance

A
  1. Estimer taille d’effet attendue
  2. Trouver delta
  3. Faire les calculs
58
Q

Comment peut-on estimer la taille d’effet attendue ?

A

Recherches antérieures
Évaluation personnelle de ce qui serait important
Utiliser les conventions spéciales (ex tableau proposé par Cohen 1998)

59
Q

Que permet delta ?

A

Il nous permet de combiner n et d en un seul indice
Pour le trouver, un utilise une table et on décide de la puissance qu’on veut avoir. Habituellement 0.8.

60
Q

Comment fait-on le calcul de la taille d’échantillon ?

A

connaître la bonne formule selon test stat utilisé
Exemple diapo 112 à 116

61
Q

Quelle est la formule de taille d’échantillon pour test-t sur un seul échantillon ?

A

n = (delta sur d de cohen) exposant 2
Arrondir la réponse à la hausse

62
Q

Points importants en lien avec les calculs liés à la puissance

A
  • Mieux vaut utiliser un logiciel comme G*Power que calculer la puissance à la main.
  • Déterminer la taille d’échantillon dont on aura besoin AVANT de commencer une étude