Cours 4 - Tests d'hypothèses sur les moyennes et puissance statistique Flashcards
Que se passe-t-il lorsqu’on pige plus d’échantillon dans une distribution d’échantillonnage (ex: n=30 vs n=2) ?
Plus il y a d’échantillons, plus l’écart-type rapetisse, et plus grande est la certitude que la moyenne d’échantillon soit proche de la vraie moyenne,
Comment appelle-t-on l’écart-type d’une distribution d’échantillonnage ?
L’erreur standard
Que peut-on dire de la moyenne d’échantillon si n=30 ?
La moyenne de l’échantillon est plus rarement loin de la moyenne de population
Que peut-on dire de la moyenne d’échantillon si n=2 ?
La moyenne de l’échantillon est plus souvent loin de la moyenne de population
Que se produit-il avec la variabilité de la distribution lorsque les échantillons sont plus grands ?
Elle diminue, c’est pourquoi l’erreur standard diminue aussi
Signification de n=10
On a utilisé des échantillons de 10 unités chacun, pour calculer chacune des moyennes de la distribution d’échantillonnage
Que dit le théorème central limite ?
- Plus n des échantillons qu’on utilise pour distribution d’échantillonnage est grand, plus l’erreur standard est petite
- On peut donc avoir confiance que n’importe quelle moyenne est en général plus près de la vraie moyenne de population
Quand fait-on un test Z à une seule moyenne ?
Exemple diapos 16 à 35
- On a 1 seul score qu’on veut comparer à une population
- Quali
- On connaît écart-type de population
- On connaît moyenne de population ou on en a une bonne idée
Que permet de faire le théorème central limite pour faire un test d’hypothèse sur des moyennes ?
Il permet de calculer ce dont on a besoins pour effectuer le test d’hypothèses
Que signifie x avec une barre au dessus ?
Moyenne échantillon
Que signifie mu ?
Moyenne population
Que signifie sigma ?
Écart type population
Que signifie s ?
Écart-type échantillon
Selon le théorème central limite, considérant une population avec moyenne mu et variance sigma au carré, la distribution d’échantillonnage de la moyenne aura:
- Une moyenne mu aussi
- Une variance de sigma carré / n
- Un écart-type de sigma / racine de n
La distribution s’approchera d’une distribution normal à mesure que n augmente
Quelle est la formule du score z ?
z = x barre en haut - mu / sigma de l’échantillon (écart-type population /racine de n)
Lorsqu’on obtient le score z (ex: 1.5) , que trouve-t-on lorsqu’on observe la table des z ?
La probabilité p d’obtenir un score z de 1,5 si H0 est vraie.
Après avoir trouvé le p, que doit on faire dans le test z?
On doit observer quelles sont les probabilités d’obtenir une différence aussi grande que 1.34 dans une direction ou dans l’autre (extrémité droite et gauche du graph qui représentent la p)
On additionne donc p+pVoir
Décision statistique du test Z
Voir diapo 34-35
Quel test peut-on faire quand on ne connaît pas l’écart type de la population (sigma) ?
Test t de Student avec une seule moyenne
Que faut-il avoir pour faire le test t de Student ?
Une seule moyenne
Dans le test t sur un échantillon, comment peut-on estimer le paramètre sigma ?
On calcule s (l’écart-type pour un échantillon)
s = racine carrée de s2
Dans un test t sur un échantillon, comment peut-on estimer le paramètre sigma 2 ?
On calcule s2 (variance échantillon)
Voir diapo 42
Formule du test t
t = x barre en haut - mu / s sur la racine carrée de n
La façon la plus facile d’obtenir s est de d’abord calculer s2
Par quoi remplace-t-on s/racine de n dans la formule du test t puisqu’On n’a pas le s ?
racine de s2 /n
De quoi dépend la forme de distribution du t de Student ?
Nb de degrés de liberté
Comment calcule-t-on dl pour un test t avec un seul échantillon ?
dl = n-1
Quelle condition faut-il pour que la statistique t soit raisonnablement comparée à la distribution t ?
Il faut que l’échantillon ait un n assez grand pour que la distribution d’échantillonnage de la moyenne soit normale (n plus grand que 25 ou 30)
Condition d’application du test-t sur un échantillon ?
L’échantillon doit provenir d’une population distribuée normalement
Que se passe-t-il lorsque la distribution t a un dl= infini ?
t devient équibalent à z
Qu’est-ce que le t obtenu ?
Le t obtenu après utilisation de la formule du test t
Qu’est-ce que le t critique ?
Le t obtenu dans la table de Student
Que se passe-t-il quand le t obtenu est plus extrême que le t critique ?
On rejette H0
Si p est plus petit que alpha, on rejette H0 aussi
Quelle est la formule du test t avec 2 moyennes pour échantillons indépendants:
t = (valeur 1 - valeur 2) / erreur standard
Dans le test t avec 2 moyennes pour échantillons indépendants, comment conclue-t-on d’une différence significative ?
Quand la probabilité d’observer une valeur t est plus petite que celle fixée (seuil alpha)
Principale différence entre les différentes version du test :
Manière de calculer l’erreur standard
Lire et comprendre formule test t avec échantillons indépendants
60 à 71
À quoi sert l’estimation combinée de la variance (s au carré p) ?
Si les échantillons ne sont pas de même taille, on ne peut pas leur donner la même influence sur le calcul de l’erreur standard, donc on pondère leurs s2 par leurs degrés de liberté (n-1)
voir formule diapo 72
Pourquoi peut-on calculer une taille d’effet ?
La valeur p seule ne nous dit pas grand chose.
Nomme une taille d’effet courante et explique ce qu’il indique
le d de Cohen
Nb d’écarts-types qui sépare les 2 moyennes
Il nous indique l’importance ou la magnitude de l’effet trouvé
Quelle est la formule du d de cohen ?
d= (x1 barre en haut - x2 barre en haut) / racine carrée de estimation combinée de variance
Comment est-il suggéré d’interpréter le d de Cohen ?
Petit: 0.2
Moyen: 0.5
Grand: 0.8
Conditions d’applicaition du test t sur échantillons indépendants :
Données sur échelle d’intervalle ou ration
Normalité de distribution d’échantillonnahe (n>30)
Indépendance des observations
Homogénéité des variances
N égaux, sinon, estimation combinée de variance
Quand peut-on qualifier de robuste un test-t ?
Quand il est peu affecté par des écarts modérés à ses conditions d’application, il fonctionne quand même même si on est un peu à côté des conditions
Qu’est-ce qu’un estimateur robuste ?
Peu affecté par les valeurs extrêmes
Par exemple, la médiane est peu affectée par des données extrêmes ou aberrantes
Qu’est-ce que la puissance statistique ?
Probabilité de trouver un effet qui est réellement là
En d’autres mots, probabilité de rejeter correctement l’hypothèse nulle quand l’hypothèse nulle est fausse
Pourquoi veut-on maximiser la puissance ?
Une plus grande puissance statistique nous aide à supporter notre hypothèse de recherche (H1)
Comment appelle-t-on: Ne pas rejeter H0 alors que H0 est vraie ?
1 - alpha (non rejet correct)
Comment appelle-t-on: Rejeter H0 alors que H0 est vraie ?
Erreur de type 1 (erreur alpha)
Comment appelle-t-on: Ne pas rejeter H0 alors que H0 est fausse ?
Erreur de type 2 (erreur beta)
Comment appelle-t-on: Rejeter H0 alors que H0 est fausse ?
1- Beta (rejet correct)
Puissance: Quand rejette-t-on l’hypothèse nulle ?
Si notre échantillon semble trop extrême par rapport à la distribution d’échantillonnage sous H0.
Pour ce faire, on fixe le seuil alpha. Si moyenne d’échantillon est +extrême que seuil alpha, on rejette H0.
Observe la figure pour illustrer le concept de puissance statistique
Diapo 97
De quoi dépend la puissance ? (3)
- Seuil alpha
- Hypothèse alternative (H1)
- Taille d’échantillon (n) et variance population
En quoi la puissance dépend-elle du seuil alpha ?
Augmenter le seuil alpha permet d’augmenter la puissance
Cependant, cela augmente aussi le risque d’erreur de type 1
Faire un test unidirectionnel augmente aussi la puissance
Voir diapo 99
En quoi la puissance dépend-elle de H1 ?
Plus la distribution d’échantillonnage de H1 est loin de celle de H0, plus la puissance est grande.
En quoi la puissance dépend-elle de la taille d’échantillon et de la variance?
Plus n est grand, plus erreur standard est petite, ce qui augmente la puissance
Plus variance est petite, plus erreur standard est petite, ce qui augmente la puissance
Quelle est l’option la plus facile pour augmenter la puissance ?
Modifier n
Étapes pour calculer la taille d’échantillon requise pour une bonne puissance
- Estimer taille d’effet attendue
- Trouver delta
- Faire les calculs
Comment peut-on estimer la taille d’effet attendue ?
Recherches antérieures
Évaluation personnelle de ce qui serait important
Utiliser les conventions spéciales (ex tableau proposé par Cohen 1998)
Que permet delta ?
Il nous permet de combiner n et d en un seul indice
Pour le trouver, un utilise une table et on décide de la puissance qu’on veut avoir. Habituellement 0.8.
Comment fait-on le calcul de la taille d’échantillon ?
connaître la bonne formule selon test stat utilisé
Exemple diapo 112 à 116
Quelle est la formule de taille d’échantillon pour test-t sur un seul échantillon ?
n = (delta sur d de cohen) exposant 2
Arrondir la réponse à la hausse
Points importants en lien avec les calculs liés à la puissance
- Mieux vaut utiliser un logiciel comme G*Power que calculer la puissance à la main.
- Déterminer la taille d’échantillon dont on aura besoin AVANT de commencer une étude